0% encontró este documento útil (0 votos)
65 vistas251 páginas

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

El documento 'Mecánica Cuántica II' de Aníbal Iucci aborda temas avanzados de la mecánica cuántica, incluyendo potenciales dependientes del tiempo, dispersión de partículas y partículas idénticas. Se exploran conceptos como la teoría de perturbaciones, la segunda cuantificación y la mecánica cuántica relativista. El índice detalla secciones específicas que cubren desde representaciones de interacción hasta la ecuación de Dirac.

Cargado por

f54166126
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
65 vistas251 páginas

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

El documento 'Mecánica Cuántica II' de Aníbal Iucci aborda temas avanzados de la mecánica cuántica, incluyendo potenciales dependientes del tiempo, dispersión de partículas y partículas idénticas. Se exploran conceptos como la teoría de perturbaciones, la segunda cuantificación y la mecánica cuántica relativista. El índice detalla secciones específicas que cubren desde representaciones de interacción hasta la ecuación de Dirac.

Cargado por

f54166126
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Mecánica Cuántica II

Anı́bal Iucci

25 de abril de 2025
Índice general

1. Potenciales dependientes del tiempo 5


1.1. Representación de Interacción . . . . . . . . . . . . . . . . . . . . . . 8
1.2. Problemas con dos estados . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Resonancia magnética . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4. Teorı́a de perturbaciones: Serie de Dyson . . . . . . . . . . . . . . . . 14
1.5. Probabilidad de Transición . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6. Primer orden perturbativo . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.1. Potencial constante . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.2. Perturbaciones armónicas . . . . . . . . . . . . . . . . . . . . 17
1.6.3. Análisis de la dependencia temporal . . . . . . . . . . . . . . . 18
1.6.4. Dependencia en energı́a . . . . . . . . . . . . . . . . . . . . . 19
1.6.5. Estados finales en el continuo . . . . . . . . . . . . . . . . . . 21
1.6.6. Conexión adiabática . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.7. Dispersión por un potencial . . . . . . . . . . . . . . . . . . . 25
1.7. Transiciones de segundo orden . . . . . . . . . . . . . . . . . . . . . . 28
1.8. Decaimiento del estado inicial . . . . . . . . . . . . . . . . . . . . . . 29
1.9. Interacción del campo electromagnético clásico con un sistema de
partı́culas cargadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.9.1. Absorción de la luz . . . . . . . . . . . . . . . . . . . . . . . . 34
1.10. Aproximación dipolar eléctrica . . . . . . . . . . . . . . . . . . . . . . 37
1.11. Reglas de selección . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.11.1. Transiciones prohibidas . . . . . . . . . . . . . . . . . . . . . . 41
1.12. Fórmula de Kubo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.13. Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a
de campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2. Dispersión de partı́culas 49
2.1. Condiciones de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2. Amplitud de dispersión y sección eficaz . . . . . . . . . . . . . . . . . 54
2.3. Funciones de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.1. Cálculo de la función de Green . . . . . . . . . . . . . . . . . 56

2
ÍNDICE GENERAL 3

2.4. Aproximación de Born . . . . . . . . . . . . . . . . . . . . . . . . . . 59


2.5. Ondas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.5.1. Determinación de corrimientos de fase . . . . . . . . . . . . . 67
2.5.2. Matriz de dispersión . . . . . . . . . . . . . . . . . . . . . . . 70
2.5.3. Extension analitica de la matriz de dispersion . . . . . . . . . 73
2.5.4. Propiedades de la matriz S . . . . . . . . . . . . . . . . . . . . 76
2.5.5. Resonancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.5.6. Dispersión a bajas energı́as . . . . . . . . . . . . . . . . . . . . 80

3. Partı́culas Idénticas 88
3.1. Permutaciones y simetrı́as . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Interacción de intercambio . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3. Partı́culas Independientes . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4. Átomos con dos electrones . . . . . . . . . . . . . . . . . . . . . . . . 101
3.5. El método del “campo autoconsistente” a vuelo de pájaro . . . . . . . 104
3.6. El método variacional de Hartree-Fock . . . . . . . . . . . . . . . . . 106
3.7. Cálculo perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4. Segunda cuantificación 114


4.1. Espacio de Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.2. Operadores de creación y destrucción . . . . . . . . . . . . . . . . . . 118
4.2.1. Operadores de un cuerpo . . . . . . . . . . . . . . . . . . . . . 125
4.2.2. Mecánica estadı́stica cuántica en el gran canónico . . . . . . . 131
4.2.3. Operadores de dos cuerpos . . . . . . . . . . . . . . . . . . . . 132
4.3. Resolviendo con segunda cuantificación . . . . . . . . . . . . . . . . . 137
4.3.1. Autovalores y autoestados . . . . . . . . . . . . . . . . . . . . 137
4.3.2. Valores de expectación térmicos . . . . . . . . . . . . . . . . . 138
4.3.3. Transformaciones canónicas . . . . . . . . . . . . . . . . . . . 140
4.3.4. Ejemplo: Modelo tight binding . . . . . . . . . . . . . . . . . . 143
4.3.5. Términos anómalos . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4. Gas de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
4.5. Teorı́a cuántica de la radiación . . . . . . . . . . . . . . . . . . . . . . 156
4.6. Emisión y absorción de fotones por un átomo . . . . . . . . . . . . . 159

5. Mecánica cuántica Relativista 165


5.1. La ecuación de Klein-Gordon . . . . . . . . . . . . . . . . . . . . . . 165
5.2. La ecuación de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.3. Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 178
5.4. La ecuación de continuidad . . . . . . . . . . . . . . . . . . . . . . . . 184
5.5. Los valores posibles de N . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.6. Teorema fundamental de Pauli . . . . . . . . . . . . . . . . . . . . . . 189
4 ÍNDICE GENERAL

5.7. Formas explı́citas de las matrices de Dirac . . . . . . . . . . . . . . . 190


5.8. Invarianza relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.9. Transformación de Lorentz de la corriente . . . . . . . . . . . . . . . 193
5.10. El grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
5.11. Generadores y álgebra del grupo L↑+ . . . . . . . . . . . . . . . . . . . 196
5.12. El carácter de ψ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
5.13. Espinores quirales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.14. La solución de partı́cula libre . . . . . . . . . . . . . . . . . . . . . . 206
5.15. Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
5.16. Helicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.17. Paridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
5.18. Ecuación de Weyl: partı́culas de masa cero . . . . . . . . . . . . . . . 216
5.19. Quiralidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.20. Una interpretación fı́sica de las matrices de Dirac . . . . . . . . . . . 218
5.21. La ecuación de Dirac en presencia de un campo electromagnético . . 220
5.22. El lı́mite no-relativista . . . . . . . . . . . . . . . . . . . . . . . . . . 222
5.23. Invarianza de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
5.24. Átomos hidrogenoides . . . . . . . . . . . . . . . . . . . . . . . . . . 231
5.25. Potenciales esféricamente simétricos . . . . . . . . . . . . . . . . . . . 236
5.26. Potencial coulombiano . . . . . . . . . . . . . . . . . . . . . . . . . . 237
5.27. Interpretaciones de las soluciones de energı́a negativa . . . . . . . . . 241
5.28. Conjugación de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
5.29. Fermiones de Majorana . . . . . . . . . . . . . . . . . . . . . . . . . . 247
5.30. Inversión Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5.31. Transformada de Fourier discreta . . . . . . . . . . . . . . . . . . . . 249
Capı́tulo 1

Potenciales dependientes del


tiempo

Consideremos un sistema fı́sico con Hamiltoniano H0 , cuyos autovalores y auto-


vectores han sido hallados, y satisfacen la ecuación

H0 |n⟩ = En |n⟩. (1.1)

Por simplicidad supongamos que el espectro de H0 es discreto y no degenerado,


aunque las fórmulas que se obtengan se pueden generalizar en forma directa a estos
casos. Suponemos que H0 no depende del tiempo explı́citamente, y por lo tanto sus
autoestados son estados estacionarios.
A t = t0 se conecta un potencial dependiente del tiempo V (t) y el Hamiltoniano
entonces resulta
H(t) = H0 + V (t) (1.2)
Supongamos ademas que a t = t0 se prepara al sistema fı́sico en el estado |ψ0 ⟩;
no necesariamente este tiene que ser autoestado de H0 (aunque en muchos casos lo
será).
Entre t0 y t el sistema evoluciona de acuerdo a la ecuación de Schrödinger:

d
iℏ |ψ(t)⟩ = [H0 + V (t)] |ψ(t)⟩. (1.3)
dt
La solución que buscamos de esta ecuación diferencial de primer orden corresponde
al estado inicial
|ψ(t = t0 )⟩ = |ψ0 ⟩ (1.4)
y es única.
El problema consiste entonces en encontrar la solución a la ecuación (1.3) que
corresponde a la condición inicial (1.4). Como método general, podemos representar

5
6

al estado inicial tomando su expansión en la base de autoestados de H0 :


X
|ψ0 ⟩ = cn |n⟩ (1.5)
n

donde cn = ⟨n|ψ0 ⟩. Si se tratara de un problema independiente del tiempo, la evo-


lución temporal del estado serı́a
|ψ(t)⟩ = e−i(t−t0 )H/ℏ |ψ0 ⟩ = cn e−iEn (t−t0 )/ℏ |n⟩
X
(1.6)
n

con cn constantes (independientes de t). Resulta entonces razonable, en el caso de


una interacción dependiente del tiempo, proponer que los cn = cn (t) y entonces para
t > t0 escribir
cn (t)e−iEn (t−t0 )/ℏ |n⟩
X
|ψ(t)⟩ = (1.7)
n
Nótese que debido a la forma en que hemos separado la dependencia temporal:
El factor e−iEn (t−t0 )/ℏ está presente aún cuando V = 0, y
La evolución temporal de los cn (t) se debe solamente a V (t).
En seguida veremos que, con esta separación, las amplitudes cn (t) satisfacen una
ecuación diferencial muy simple. Pero antes hagamos un repaso sistemático de los
diferentes esquemas en los que puede estudiarse la dependencia temporal.
La evolución temporal de un dado sistema fı́sico, que en un instante inicial t0 se
encuentra en un estado
|ψ(t0 )⟩ ≡ |ψ0 ⟩ (1.8)
puede entenderse en dos esquemas diferentes:

Representación de Schrödinger (S)


En este esquema evolucionan los vectores de estado de acuerdo a
|ψ(t)⟩S = U (t, t0 ) |ψ0 ⟩ (1.9)
donde U(t, t0 ) es el operador de evolución temporal, que satisface una ecuación de
Schrödinger

iℏ U(t, t0 ) = HU(t, t0 ) (1.10)
∂t
que induce a su vez una ecuación del mismo tipo para los kets de estado:

iℏ|ψ(t)⟩S = H|ψ(t)⟩S . (1.11)
∂t
En este esquema, los operadores no dependen del tiempo
AS (t) = A (t0 ) ≡ A, (1.12)
Potenciales dependientes del tiempo 7

Representación de Heisenberg (H)


En esta los estados no evolucionan,

|ψ(t)⟩H = |ψ0 ⟩ (1.13)

mientras que los obervables dependen del tiempo según1

AH (t) = U † (t0 , t) A (t0 ) U (t0 , t) , (1.16)

y que obedecen la ecuación de movimiento de Heisenberg:

dAH 1
= [AH , H] (1.17)
dt iℏ

El valor de expectación ⟨A⟩ es obviamente el mismo en ambas representaciones:


D E
S ⟨ψ(t) |AS | ψ(t)⟩S = ψ0 U † (t, t0 )AS U(t, t0 ) ψ0 (1.18)
= H ⟨ψ(t) |AH (t)| ψ(t)⟩H (1.19)
≡ ⟨A⟩(t) (1.20)

En el caso en que el Hamiltoniano no depende del tiempo, la solución de la


ecuación (1.10) se obtiene inmediatamente en la forma

U(t, t0 ) = e−iH(t−t0 )/ℏ . (1.21)

Lo cual permite obtener inmediatamente la dinámica de estados, observables y va-


lores de expectación.
En la naturaleza, sin embargo, hay muchos sistemas cuánticos que sı́ dependen
del tiempo (iluminar un átomo, aplicar voltaje a un metal, absorción y emisión de la
luz, etc) y la energı́a del sistema no se va a conservar. En ese caso, el Hamiltoniano
depende explı́citamente del tiempo, H = H(t), y se vuelve dificultoso hallar una
expresión para el operador de evolución temporal. Puede mostrarse que esa expresión
1
Los estados de la base |n⟩ no cambian en el esquema de Schrödinger. En el esquema de Hei-
senberg, la ecuación de autovalores
A|a⟩ = a|a⟩ (1.14)

se convierte en
AH (t)U † (t, t0 )|a⟩ = a U † (t, t0 )|a⟩ (1.15)

de modo que los kets de la base evolucionan con el “signo contrario” |a(t)⟩H = U † (t, t0 )|a⟩. Sólo
los autoestados de H no evolucionan.
8 1.1 Representación de Interacción

está dada por la serie de Dyson:


ˆ
i t ′
U (t, t0 ) = 1 − dt H (t′ )
ℏ t0
 ˆ ˆ ′
−i 2 t ′ t ′′

+ dt dt H (t′ ) H (t′′ )
ℏ t0 t0
.. (1.22)
.
 ˆ ˆ ′ ˆ t(n−1)
−i n t ′ t ′′

+ dt dt · · · dt(n) H (t′ ) H (t′′ ) · · · H(t(n) )
ℏ t0 t0 i0
+ ···

1.1. Representación de Interacción


Antes de discutir la ecuación diferencial para los cn (t) es conveniente introducir
la representación de interacción (I). Igual que antes: un sistema fı́sico que en t0
está en el estado |ψ0 ⟩, en un tiempo t posterior estará en el estado |ψ(t)⟩S . Definimos

|ψ(t)⟩I = e+iH0 (t−t0 )/ℏ |ψ(t)⟩S (1.23)

donde |⟩I representa la misma situación fı́sica que |⟩S pero en la RI. Análogamente,
en la RI, los operadores se definen como:

AI (t) = eiH0 (t−t0 )/ℏ AS (t)e−iH0 (t−t0 )/ℏ (1.24)

En particular (VS (t) ≡ V (t)) :

VI (t) = eiH0 t/ℏ V (t)e−iH0 t/ℏ (1.25)

Vamos a deducir ahora la ecuación que caracteriza la evolución temporal de


|ψ(t)⟩I . Tomando la derivada temporal de (1.23) y haciendo uso de la ecuación de
Schrödinger (1.11)

iℏ |ψ(t)⟩S = (H0 + V ) |ψ(t)⟩S (1.26)
∂t
resulta,

∂ ∂  iH0 (t−t0 )/ℏ 


iℏ |ψ(t)⟩I = iℏ e |ψ(t)⟩S
∂t ∂t
= −H0 eiH0 (t−t0 )/ℏ |ψ(t)⟩S + eiH0 (t−t0 )/ℏ (H0 + V ) |ψ(t)⟩S (1.27)

= eiH0 (t−t0 )/ℏ V e−iH0 (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |ψ(t)⟩S
Potenciales dependientes del tiempo 9

Es decir que:

iℏ |ψ(t)⟩I = VI (t) |ψ(t)⟩I (1.28)
∂t
También se puede demostrar que para un observable A (que no depende explı́cita-
mente del tiempo en la RS) vale:

dAI 1
= [AI , H0 ] , (1.29)
dt iℏ
que es una ecuación del tipo Heisenberg con H reemplazado por H0 . En resumen,
la RI en muchos aspectos es intermedia entre la RS y la RH.
Trabajemos la evolución temporal del estado, ahora en la representación de in-
teracción:

|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = cn (t)e−iEn (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |n⟩
X
(1.30)
n
X
= cn (t)|n⟩. (1.31)
n

donde usamos la expansión (1.7) de |ψ(t)⟩. Obserevamos que al trabajar en la repre-


sentación de interacción nos sacamos de encima de (1.7) las fases e−iEn (t−t0 )/ℏ por
completo. Al multiplicar eeste estado a izquierda por ⟨n|, los coeficientes se escriben

cn (t) = ⟨n|ψ(t)⟩I . (1.32)

Ya podemos escribir la ecuación diferencial para los cn (t). Tomemos la ecuación


de Schrödinger en RI, (1.28) y multipliquemos a izquierda ambos miembros por ⟨n|,
obtenemos:
∂ X
iℏ ⟨n|ψ(t)⟩I = ⟨n |VI (t)| m⟩ ⟨m|ψ(t)⟩I . (1.33)
∂t m

Aquı́ los elementos de matriz del potencial pueden deacomponerse en la forma:

⟨n|VI (t)|m⟩ = ⟨n|eiH0 (t−t0 )/ℏ V (t)e−iH0 (t−t0 )/ℏ |m⟩ = ⟨n|V (t)|m⟩ei(En −Em )(t−t0 )/ℏ .
(1.34)
Finalmente, insertando 1.32 y 1.34 en 1.33 se encuentra la ecuación buscada,


Vnm (t)eiωnm (t−t0 ) cm (t)
X
iℏ cn (t) = (1.35)
∂t m

donde
En − Em
Vnm (t) ≡ ⟨n|V (t)|m⟩; ωnm ≡ = −ωmn (1.36)

10 1.2 Problemas con dos estados

Explı́citamente

V12 eiω12 (t−t0 ) V13 eiω13 (t−t0 )


    
ċ1 V11 ... c1
iω (t−t0 )
ċ2 
 
V e 21

V22 V23 eiω23 (t−t0 ) . . . c2 
 
iℏ   =  21 iω31 (t−t0 ) (1.37)
ċ3  V32 eiω32 (t−t0 )  c3 
 
V31 e V33 . . .  
.. .. .. .. ..
  
..
. . . . . .

Este es el sistema de ecuaciones diferenciales acopladas que debemos resolver para


hallar las amplitudes cn (t) en función del tiempo. Al ser un sistema de ecuaciones
de primer orden en t debe complementarse con un conjunto de condiciones iniciales
cn (t0 ) que se obtienen indicando el estado inicial |ψ0 ⟩, que de (1.5) resultan

cn (t0 ) = ⟨n|ψ0 ⟩. (1.38)

Una vez hallado los coeficientes cn (t), escribimos la probabilidad de hallar al


sistema en el estado |n⟩ en el instante t como

Pn (t) = |⟨n|ψ(t)⟩|2 = |cn (t)|2 . (1.39)

Si bien estas expresiones son validas para un estado inicial arbitrario, una situa-
ción realista usual supone que un sistema se prepara inicialmente en algún autoes-
tado |ψ0 ⟩ → |i⟩ de H0 . En ese caso escribimos

Pi→n (t) = |⟨n|i(t)⟩|2 . (1.40)

Estas probabilidades se denominan probabilidades de transición.

1.2. Problemas con dos estados


Análogamente que en los casos de potenciales independientes del tiempo, las
soluciones analı́ticas exactas de las ecuaciones (1.35) son raras y en general sólo
se pueden obtener para espacios de Hilbert de baja dimensión. En el caso general
habrá que resolver la ec. (1.37) en forma numérica o por medio de un desarrollo
perturbativo.
Consideremos el caso de dos estados con un potencial que oscila armónicamente:

H0 = E1 |1⟩ ⟨1 |+E2 | 2⟩ ⟨2|; (E2 > E1 )


D E (1.41)
V (t) = γeiωt |1⟩ 2 +γe−iωt 2 ⟨1|

donde γ y ω son reales y positivos. Esto significa que los elementos de matriz de
(1.37) son:
V12 (t) = V21∗ (t) = γeiωt ; V11 (t) = V22 (t) = 0. (1.42)
Potenciales dependientes del tiempo 11

Este potencial da origen a las transiciones |1⟩ ⇐⇒ |2⟩ entre los dos estados. Si
inicialmente, en t = 0, está ocupado solamente el nivel más bajo, los coeficientes de
(1.5) serán:
c1 (0) = 1; c2 (0) = 0. (1.43)
Utilizando (1.42) y (1.43) es inmediato escribir la ecuación (1.35):
! ! !
d c1 (t) 0 γei(ω−ω21 )t c1 (t)
= −i(ω−ω21 )t , (1.44)
dt c2 (t) γe 0 c2 (t)

que constituye un sistema de dos ecuaciones lineales de primer orden acopladas que
pueden resolverse con los métodos usuales. La solución da lugar a la probabilidad
de ocupación de los dos estados en t > 0 y está dada por la fórmula de Rabi,
" #1/2 
γ 2 /ℏ2  γ2 (ω − ω21 )2 
|c2 (t)|2 = 2 2 sin 2
+ t , (1.45)
γ /ℏ + (ω − ω21 )2 /4  ℏ2 4 

c1 (t)|2 = 1 − |c2 (t)|2 , (1.46)


donde ω21 = (E2 − E1 ) /ℏ como se verá en los trabajos prácticos.
Vemos que la probabilidad de que el sistema esté excitado oscila en el tiempo
con una frecuencia angular
v
γ 2 (ω − ω21 )2
u !
u
Ω= t + (1.47)
ℏ2 4

y que es muy grande cuando

ω ≈ ω21 = (E2 − E1 ) /ℏ (1.48)

es decir cuando la frecuencia angular del potencial –usualmente generado por un


campo externo (eléctrico o magnético)– es aproximadamente igual a la frecuencia
angular del sistema de dos estados. En este caso hablamos de la condición reso-
nante.
Veamos que ocurre en el caso resonante, o sea cuando

ω = ω21 ; Ω = γ/ℏ (1.49)

En la Figura 1.1 están representadas las probabildades |c1 (t)|2 y |c2 (t)|2 en función
del tiempo. Entre t = 0 y t = πℏ/(2γ) el sistema absorbe energı́a del potencial V (t).
En t = πℏ/(2γ) solo el estado superior está poblado y entre t = πℏ/(2γ) y t = πℏ/γ
12 1.2 Problemas con dos estados

|c1 (t)|2 |c2 (t)|2

0 t
πℏ/2γ πℏ/γ 3πℏ/2γ 2πℏ/γ
| {z }| {z }| {z }
absorción emisión absorción

Figura 1.1: Representación gráfica de |c1 (t)|2 y |c2 (t)|2 para ω = ω21 .

|c2 (t)|2max

Ancho a media altura = 4γ/ℏ

0 ω
ω21

Figura 1.2: Representación gráfica de |c1 (t)|2máx en función de ω para γ ≪ ℏω21 ; ω =


ω21 corresponde a la frecuencia resonante.
Potenciales dependientes del tiempo 13

el sistema se libera del exceso de energı́a. Este ciclo de absorsión-emisión se repite


indefinidamente y V (t) actúa como una fuente o un sumidero de energı́a.
El ciclo de absorsión-emisión se produce aún cuando estamos fuera de la reso-
nancia. Sin embargo, las amplitudes de oscilación de |c1 (t)|2 y |c2 (t)|2 son ahora
menores y sus frecuencias mayores. La Figura 1.2 muestra |c2 (t)|2máx en función de
ω. La curva tiene un pico resonante en ω = ω21 cuyo ancho es 4γ/ℏ. Notemos que
cuanto más débil es el potencial (γ pequeño) tanto más agudo será el pico resonante.

1.3. Resonancia magnética


Consideremos un sistema de spin 1/2 (por ejemplo, un electrón ligado) sometido
a un campo magnético de la forma
B = B0 ẑ + B1 (x̂ cos ωt + ŷ sin ωt) (1.50)
donde B0 y B1 son constantes. Podemos describir el efecto del campo constante por
medio de H0 y el efecto del campo rotante por medio de V (t). Recordemos que
e
H = −µ · B; µ = S, e < 0, (1.51)
me c
donde µ y S son respectivamente, el momento magnético y el spin del electrón2 . Si
además representamos a los operadores de spin por medio de los autovectores |+⟩ y
|−⟩ de Sz en la forma

Sx = (|+⟩⟨−| + |−⟩⟨+|)
2

Sy = i (−|+⟩⟨−| + |−⟩⟨+|) (1.52)
2

Sz = (|+⟩⟨+| − |−⟩⟨−|)
2
3
resulta
eℏB0
H0 = − (|+⟩⟨+| − |−⟩⟨−|)
2me c
(1.53)
eℏB1  iωt −iωt

V (t) = − e |−⟩⟨+| + e |+⟩⟨−|
2me c
de done E± = ∓eℏB0 /2me c. Para e < 0, E+ > E− y por lo tanto podemos identificar:
|+⟩ →|2⟩ (nivel superior), (1.54)
|−⟩ →|1⟩ (nivel inferior), (1.55)
2
En general µ = gs µB S/ℏ donde gs ≈ 2 es el factor giromagnético y µB = eℏ/2me c es el
magnetón de Bohr en el sistema segesimal de unidades (CGS)
3
Mostrar que Sx , Sy y Sz dados por (1.32) satisfacen las reglas de conmutación: [Sx , Sy ] = iℏSz ,
etc.
14 1.4 Teorı́a de perturbaciones: Serie de Dyson

para estar de acuerdo con (1.41). De (1.42) vemos, además, que la frecuencia carac-
terı́stica del sistema es:
|e|B0
ω21 = (1.56)
me c
que es la frecuencia de precesión del spin en el campo B0 (cuando B1 = 0). Notemos
que, aún cuando los valores de expectación ⟨Sx ⟩ y ⟨Sy ⟩ varı́an debido a la precesión
del spin, las cantidades |c+ (t)|2 y |c− (t)|2 permanecen constantes mientras que el
campo rotante no actúa.
De la comparación de (1.41) con (1.53) vemos que:

eℏB1
− → γ; ω→ω (1.57)
2me c

y que al aparecer el campo rotante las probabilidades |c+ (t)|2 y |c− (t)|2 varı́an de la
manera indicada en la Figura 1.1 para ω = ω21 . Es decir que además de la precesión
del spin ocurren transiciones |+⟩ ⇐⇒ |−⟩. La condición de resonancia se satisface
cuando la frecuencia del campo magnético rotante coincide con la frecuencia de
precesión del spin determinada por la intensidad del campo magnético uniforme.

1.4. Teorı́a de perturbaciones: Serie de Dyson


En un tratamiento perturbativo las soluciones aproximadas de (1.37) serán de la
forma:
cn (t) = c(0) (1) (2)
n (t) + cn (t) + cn (t) + · · · , (1.58)
donde c(1) (2)
n (t), cn (t), ·· representan a las amplitudes de primer orden, de segundo
orden, etc. con respecto al parámetro de la intensidad del potencial dependiente
del tiempo. El método iterativo para resolver este problema es similar al que se
emplea en la teorı́a de perturbaciones independientes del tiempo. Esto significa que,
si inicialmente está poblado sólo el estado i, para obtener c(1)
n (t) aproximamos el
lado derecho de (1.37) por cn (t) = δni y lo relacionamos con c(1)
(0)
n (t), integrando la
ecuación deferencial. Luego para obtener c(2) n (t), aproximamos el lado derecho de
(1)
(1.37) por cn (t) y procedemos del mismo modo, etc..
En lugar de trabajar con los cn (t) vamos a analizar el operador de evolución
UI (t, t0 ) en la RI, definido por

|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = eiH0 (t−t0 )/ℏ U(t, t0 )|ψ0 ⟩ ≡ UI (t, t0 )|ψ0 ⟩, (1.59)

o
UI (t, t0 ) = eiH0 (t−t0 )/ℏ U(t, t0 ). (1.60)
Potenciales dependientes del tiempo 15

Si derivamos la ecuación anterior obtenemos la ecuación diferencial para UI (t, t0 )


analoga a (1.28):
d
iℏ UI (t, t0 ) = VI (t)UI (t, t0 ) (1.61)
dt
que tenemos que resolver con la condición inicial
UI (t0 , t0 ) = 1 (1.62)
Al integrar (1.61) obtenemos la ecuación integral equivalente:
ˆ
i t
UI (t, t0 ) = 1 − VI (t′ ) UI (t′ , t0 ) dt′ (1.63)
ℏ t0
La solución aproximada se obtiene por iteración,
ˆ
i t ′
UI (t, t0 ) = 1 − dt VI (t′ )
ℏ t0
 ˆ ˆ ′
−i 2 t ′ t ′′

+ dt dt VI (t′ ) VI (t′′ )
ℏ t0 t0
.. (1.64)
.
 ˆ ˆ ′ ˆ t(n−1)
−i n t ′ t ′′

+ dt dt · · · dt(n) VI (t′ ) VI (t′′ ) · · · VI (t(n) )
ℏ t0 t0 i0
+ ···
Esta serie se conoce como serie de Dyson para UI (t, t0 ). Notemos que aquı́ se
ve la potencia de la representación de interacción: al quedar escrito el operador UI
sólo en términos V (t) nos permite realizar el desarrollo perturbativo en potencias
del potencial. Si hubiéramos trabajado en el esquema de Schrödinger, el operador de
evolución U se escribe en una expresión análoga pero en términos del Hamiltoniano
completo, lo cual complica la expansión perturbativa.
La serie de Dyson puede escribirse de manera compacta como
ˆ
i t ′
!

UI (t, t0 ) = T exp − dt VI (t ) (1.65)
ℏ t0
donde hemos definido el operador de orden temporal de forma tal que
T [A(t1 )A(t2 ) · · · A(tn )] = A(ti1 )A(ti2 ) · · · A(tin ), ti1 > ti2 > · · · > tin , (1.66)
es decir, que ordena los operadores sobre los que actúa de manera que el artgumento
temporal de los operadores correspondientes decrece a medida que nos movemos
desde izquierda a derecha. Si dos tiempo coinciden no es un problema, ya que en ese
caso el operador conmuta con sigo mismo.
16 1.5 Probabilidad de Transición

1.5. Probabilidad de Transición


Volviendo a las probabilidades de transición (1.39) y (??), pueden ahora evaluarse
utilizando UI (t, t0 ) [ver (1.59)] en la representación de interacción. Primero tomamos
la evolución temporal del estado inicial:
X
|i(t)⟩I = UI (t, t0 )|i⟩ = |n⟩ ⟨n |UI (t, t0 )| i⟩ . (1.67)
n

De modo que aquı́ ⟨n |UI (t, 0)| i⟩ no es otra cosa que los coeficientes cn (t) en (1.30),
cn (t) = ⟨n |UI (t, t0 )| i⟩ , (1.68)
y esta es la expresión que utilizaremos para evaluar las amplitudes cn (t) dado que
contamos con un desarrollo perturbativo para UI (t, t0 ). Al insertar la expansión
(1.58) y las expresiones para los coeficientes que se obtienen de la serie de Dyson
(1.64) obtenemos:
c(0)
n (t) = δin
ˆ t ˆ
−i ′ ′ −i t ′ iωni i′
c(1)
n (t) = dt ⟨n |VI (t )| i⟩ = dt e Vni (t′ )
ℏ t0 ℏ t0 (1.69)
2 X ˆ t ˆ t′
−i

′ ′′
c(2)
n (t) = dt′ dt′′ eiωnm t Vnm (t′ ) eiωmi t Vmi (t′′ ) ,
ℏ m t0 t0

donde las frecuencias están definidas por (1.42)


ℏωni = En − Ei . (1.70)
y
Vni = ⟨n|V |i⟩ (1.71)
son los elementos de matriz de la perturbación ente los estados final e inicial. Las
probabilidades de transición se obtienen de tomar el módulo cuadrado,
Pi→n (t) = |c(0) (1) (2)
n (t) + cn (t) + cn (t) + · · · |
2
(1.72)

1.6. Primer orden perturbativo


Consideremos un estado final con n ̸= i de manera que c(0) n (t) no contribuye. La
probabilidad de transición en el orden más bajo está dada entonces por:
ˆ 2
(1) 2 −i t ′ iωni i′ ′
Pi→n (t) = cn (t) = dt e Vni (t ) . (1.73)
ℏ t0
Vamos a exporar las consecuencias es esta expresión.
Potenciales dependientes del tiempo 17

1.6.1. Potencial constante


Para calcular la probabilidad de transición tenemos que conocer el potencial
V (t′ ) para t0 < t′ < t. Consideremos primero una perturbación constante que
comienza a actuar en t0 = 04 :

0 para t < 0
V (t) = (1.74)
V (independiente de t) para t > 0

Insertando (1.74) en (1.73) encontramos:

Vni  iωni t
2 |Vni |2
Pi→n (t) = 1−e = (2 − 2 cos ωni t) (1.75)
ℏωni |ℏωni |2
!2
4 sin ωni t/2
= 2 |Vni |2 (1.76)
ℏ ωni
Esta probabilidad depende del elemento de la matriz de V entre los estados inicial y
final, que a su vez función de todas las propiedades del estado final |n⟩, por ejemplo,
su cantidad de movimiento, spin , etc. Además depende de la diferencia de energı́a
En − Ei = ℏωni entre ambos estados.

1.6.2. Perturbaciones armónicas


Otro caso de interés es el de una perturbación armónica de la forma
V (t) = V eiωt + V † e−iωt (1.77)
y supongamos que la perturbación comienza en t0 = 0. Este caso tiene aplicacio-
nes, por ejemplo, a la interacción de momentios magneticos o átomos con campos
electromagnéticos. De (1.69) obtenemos
ˆ
−i t ′ iωni t′  ′ ′

(1)
cn (t) = dt e Vni eiωt + Vni† e−iωt (1.78)
ℏ 0
donde Vni† ≡ (V † )ni = Vin∗ . O sea que
1 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t †
" #
c(1)
n (t) = Vni + Vni (1.79)
ℏ ωni + ω ωni − ω
Es facil convencerse de que este último resultado es muy similar al que obtuvimos
antes para el potencial constante. Para cualquier estado final dado n, ambos térmi-
nos están presentes y contribuyen a la amplitud de transición, y cuando elevamos
4
Generalmente el potencial V depende de operadores tales como r, p y S, pero esa dependencia
no nos interesa por el momento.
18 1.6 Primer orden perturbativo

al cuadrado la amplitud para obtener la probabilidad de transición, hay términos


cruzados (términos de interferencia) entre estas dos contribuciones a la amplitud.
A menudo, sin embargo, lo que más nos interesa son los estados finales a los que
va la mayor parte de la probabilidad, que son los estados para los que uno u otro de
los dos denominadores de la Ec. (1.79) es pequeño. El primer término es resonante
cuando
En − Ei = −ℏω < 0, (1.80)
es decir, que el estado final posee energı́a menor al inicial, y por lo tanto se trata
de un proceso de emisión. Se denomina emisión estimulada o inducida ya que el
decaimiento no serı́a posible sin la presencia del potencial externo. La probabilidad
de transición resulta entonces
" #2
t2 sin(ωni + ω)t/2
em ind
Pi→n = 2 |Vni |2 (1.81)
ℏ (ωni + ω)t/2

El segundo término de (1.79) es resonante, en cambio, cuando

En − Ei = +ℏω > 0, (1.82)

el estado final posee energı́a mayor a la del estado inicial, y se trata por lo tanto de
un proceso de absorción. La probabilidad de transición se escribe
" #2
t2 sin(ωni − ω)t/2 2
abs
Pi→n = 2 Vni† . (1.83)
ℏ (ωni − ω)t/2

Estas fórmulas se pueden comparar con la ecuación (1.76). En todos los casos,
Pi→n tiene una dependencia temporal similar, con ωni → ωni ± ω, lo que significa
que el análisis que realizamos anteriormente sigue siendo válido.

1.6.3. Análisis de la dependencia temporal


Fijemos el estado final |n⟩ y examinemos cómo se comporta la probabilidad
Pi→n (t) como una función del tiempo a primer orden en teorı́a de perturbaciones
dependiente del tiempo. Para ser especı́ficos, tomaremos el caso de una perturbación
constante y trabajaremos con la ecuación (1.76). Como dijimos, el anális también se
aplica a la absorción o emisión estimulada si reemplazamos ωni por ωni ± ω.
Obviamente Pi→n (0) = 0 (porque n ̸= i y toda la probabilidad está en el estado
|i⟩ en t = 0). Posteriormente vemos que Pi→n (t) oscila a la frecuencia ωni entre 0 y
un máximo proporcional a 1/ωni . La frecuencia ωni mide hasta qué punto el estado
final está “fuera de resonancia”, es decir, cuánto difiere la energı́a final de la energı́a
inicial. Si ωni es grande, la probabilidad Pi→n (t) oscila rápidamente entre cero y un
máximo pequeño. Pero a medida que acercamos el estado |n⟩ al estado inicial |i⟩ en
Potenciales dependientes del tiempo 19

energı́a, ωni se vuelve más pequeño, el perı́odo de oscilaciones se vuelve más largo y
la amplitud crece.
Si hay un estado final |n⟩ degenerado en energı́a con el estado inicial |i⟩ (no el
mismo estado ya que asumimos n ̸= i), entonces ωni = 0 y el factor dependiente del
tiempo en la ecuación (1.76) toma su valor lı́mite, que es:

t2
lı́m Pi→n (t) = 2
|Vni |2 . (1.84)
ωni →0 ℏ

En este caso, la teorı́a de perturbaciones de primer orden predice que la probabilidad


Pi→n (t) crece sin lı́mite con el tiempo, obviamente un absurdo ya que debemos tener
Pi→n ⩽ 1. Esto es una indicación del hecho de que para tiempos suficientemente
largos la teorı́a de perturbaciones a primer orden falla y debemos tener en cuenta
los términos de orden superior en la expansión perturbativa. De hecho, para obtener
resultados sensatos para tiempos tan largos, es necesario tener en cuenta un número
infinito de términos (es decir, hacer algún tipo de sum de la serie). Pero a tiempos
cortos es correcto que Pi→n para un estado en resonancia crezca como t2 .

1.6.4. Dependencia en energı́a


Ahora fijemos el tiempo t y examinemos cómo la expresión para Pi→n (t) de-
pende de la energı́a del estado final |n⟩ (trabajando por simplicidad con el caso de
una perturbación independiente del tiempo). Nos concentraremos en la dependencia
energética del factor dependiente del tiempo entre paréntesis, recordando que el ele-
mento de la matriz también depende de la energı́a (y otros parámetros) del estado
final. Para ello trazamos la función sin2 (ωt/2)/ω 2 como función de ω, como se mues-
tra en la Figura 1.3 para dos tiempos diferentes. En el gráfico, ω debe identificarse
con ωni = (En − Ei )/ℏ, de modo que ω especifica la energı́a del estado final y ω = 0
es la condición de resonancia (conservación de energı́a).
La curva consta en una serie de oscilaciones bajo la envolvente 1/ω 2 , con ceros en
ω = 2nπ/t. El lóbulo central tiene una altura t2 /4 y un ancho proporcional a 1/t, por
lo que su área es proporcional a t.5 A medida que t aumenta, éste crece en altura
y se vuelve más estrecho, de modo que para tiempos más largos, la probabilidad
de transición a estados más alejados en energı́a decrece. Para tiempos grandes, la
probabilidad Pi→n (t) es apreciable sólo cuando la frecuencia está dentro del pico
5
De hecho, el área total viene dada exactamente por una integral que puede evaluarse:
ˆ +∞
sin2 ωt/2 πt
dω = , (1.85)
−∞ ω2 2

mostrando que el área es efectivamente proporcional a t


n

Now let us fix the time t and examine how the expression for Pn (t) in first order perturbation
theory, Eq. (38), depends on the energy En of the final state |n" (working for simplicity with the
case of a time-independent perturbation). We shall concentrate on the energy dependence of the
time-dependent factor in the parentheses, remembering that the matrix element also depends on the
energy (and other parameters) of the final state. To do this we plot the function sin2 (ωt/2)/ω 2 as
a function of ω, as shown in Figs. 1 and 2 for two different times. In the plot, ω is to be identified
20 1.6ω specifies
with ωni = (En − Ei )/h̄, so that Primer theorden perturbativo
energy of the final state and ω = 0 is the resonance
(energy conserving) condition.
sin2 ωt/2
t2 ω2
4

1 1
ω2 ω2

sin2 ωt/2
ω2
t2
4

ω ω
− 4π
t
− 2π
t

t

t
− 6π
t − 4π
t
− 2π
t

t

t

t

Fig. 1. The function sin2 (ωt/2)/ω2 as a function of Fig. 2. Same but for a larger value of t. The area of
ω for 1.3:
Figura
fixed t. The dotted curve is the envelope 1/ω2 . the curve is dominated by the central lobe, and grows in
proportion to t.

central, es decir, para los estados finales que satisfacen



ω∼ , (1.86)
t
O bien, si identificamos a t con t → ∆t, llamando ∆t al intervalo de tiempo durante el
cual ha estado encendida la perturbación, la transición posee probabilidad apreciable
sólo cuando
∆t∆E ∼ ℏ, (1.87)
donde ∆E = ℏωni representa el cambio en energı́a involucrado en la transición. Si
∆t es pequeño tenemos un pico más ancho, y como resultado podemos tener una
cantidad importante de energı́a “no conservada”. Por otro lado, para tiempos largos
tenemos un pico angosto y la energı́a se conserva aproximadamente para que la
transición tenga probabilidad apreciable.6 Esto indica que un sistema que estuvo
en interacción con un potencial V (t) durante un intervalo de tiempo ∆t tiene una
energı́a que es incierta en una cantidad ∆E ≳ ℏ/∆t.
El comportamiento en frecuencia para tiempos largos nos recuerda a las funciones
que se aproximan a una función δ:
!2
1 sin ωt/2 π
lı́m = δ(ω) (1.88)
t→∞ t ω 2
Para ω ̸= 0 fijo, este lı́mite tiende a 0 cuando t → ∞, mientras que exactamente
en ω = 0 crece en proporción a t, con un área total constante. Si analizamos la
6
Notar que esta “relación de incerteza” es fundamentalmente diferente de la relación de incerteza
para x y p : en la mecánica cuántica no relativista tanto x como p son observables, mientras que t
es un parámetro y no un observable.
Potenciales dependientes del tiempo 21

probabilidad de transición (1.76), vemos que tenemos un factor t adicional, de modo


que para t muy grande P (t) crecerá lineal en el tiempo. Es usual definir entonces la
probabilidad de transición por unidad de tiempo de manera que

Pi→n (t) = Γi→n t, para t → ∞ (1.89)

con

Γi→n = |Vni |2 δ(ωni ). (1.90)
ℏ2
En el caso del potencial armónico, esta ecuación se escribe

Γi→n = |Vni |2 δ(ω − ωni ). (1.91)
ℏ2
Esta es la llamada regla de oro de Fermi y posee numerosas aplicaciones. Podrı́a
ser preocupante que apareciera una función δ, que es infinita en ω = ωni lo que
podrı́a invalidar la teorı́a de perturbaciones. En la práctica esta función tiene que
ser integrada por una razón u otra, y en general la validez de la fórmula a primer
orden de perturbaciones depende del área bajo la función δ.
La función δ en la ecuación (1.88) impone la conservación de energı́a en el lı́mite
t → ∞, es decir, en ese lı́mite solo se permiten transiciones a estados finales de la
misma energı́a que el estado inicial. En tiempos finitos se producen transiciones a
estados en un rango de energı́as alrededor de la energı́a inicial del orden de ∆E ∼ 1/t.
Dicho de manera simple: si perturbamos un sistema fı́sico con un potencial
armónico de frecuencia ω, para tiempos muy largos (infinitos) vamos a inducir tran-
siciones de estados iniciales |i⟩ a estados finales |n⟩ tales que ω = ±(En − Ei )ℏ,
es decir que se conserva la energı́a. Sin embargo, a tiempos más cortos, también es
probable inducir transiciones a estados |n⟩ que que no la conserven.

1.6.5. Estados finales en el continuo


Las consideraciones anteriores son importantes cuando el sistema tiene un es-
pectro discreto, por ejemplo, cuando un espı́n interactúa con un campo magnético
periódico o cuando observamos algunos estados discretos de un átomo en presencia
de luz láser. Por otro lado, si los estados finales son miembros de un continuo, en-
tonces hay un número infinito de estados finales arbitrariamente cercanos al estado
final en energı́a.
Dado un espectro de energı́a En , llamemos N (E) al número de estados con
energı́a menor o igual a E. Entonces, el número de estados que poseen energı́a
dentro de un intervalo dE es
dN (E)
dN = N (E + dE) − N (E) = dE ≡ ρ(E)dE. (1.92)
dE
22 1.6 Primer orden perturbativo

Figura 1.4: Dispersión elástica de una onda plana por un potencial de rango finito.
 E



 En

..


N (E) .




 E2

 E1
E0

Figura 1.5: Niveles de energı́a En . N (E) representa el número de niveles con energı́a
menor a E

donde ρ(E) = dN (E)/dE es la densidad de estados. Observemos que podemos


escribir X
N (E) = Θ(En − E) (1.93)
n

y entonces la densidad de estados resulta


X
ρ(E) = δ(En − E) (1.94)
n

Para obtener la probabilidad de transición entre un estado i y los posibles estados


finales n cercanos en energı́a, debemos sumar (integrar) sobre todos estos estados
finales próximos en energı́a. Dado que la probabilidad sólo es apreciable par estados
cercanos a n no nos equivocamos por mucho si sumamos sobre todos los estados
finales y consideramos: X
Pi (t) = Pi→n (t) (1.95)
n
Potenciales dependientes del tiempo 23

Para evaluar la suma, multiplicamos por


ˆ
1 = dE δ(E − En ) (1.96)

que nos permite reemplazar las energı́as En de las que depende el coeficiente cn por
la variable de integración E. Luego
ˆ
Pi→n (t) = dEn ρ(En )|cn (t)|2
X
Pi (t) = (1.97)
n

Si tomamos ahora el caso de la perturbación constante a tiempos largos, reempla-


zamos (1.89) entonces
ˆ
2πt
dEn δ(En − Ei )|Vni |2
X
lı́m Pi→n (t) = lı́m (1.98)
t→∞ t→∞ ℏ
n
2πt
= lı́m |Vni |2 ρ(Ei ) (1.99)
t→∞ ℏ
(1.100)
En este lı́mite ya vimos que hay transiciones si la energı́a del estado final es igual a
la del inicial. Finalmente escribimos
X
Pi→n (t) ≡ Γi t (1.101)
n

donde
2π h i
Γi = |Vni |2 ρ (En ) (1.102)
ℏ En =Ei
es la probabilidad de transición por unidad de tiempo.

1.6.6. Conexión adiabática


En (1.73) hemos supuesto que la interacción es “conectada” de repente en t0 = 0.
En muchas situaciones es más realista pensar que el potencial crece suavemente. Por
ejemplo, si hacemos incidir un haz de luz sobre un átomo, el frente de onda al llegar
no está perfectamente bien delineado y generalmente la amplitud demora un cierto
tiempo para alcanzar su valor estacionario final. Durante ese tiempo los electrones
del átomo pueden efectuar muchas rotaciones orbitales, de tal modo que la luz, con
respecto al átomo es “conectada” lentamente ó adiabáticamente. Una manera de
representar esa situación es escribir7
V (t) = V eηt (1.103)
7
Es interesante desarrollar el formalismo con V (t) = V e−η|t| , en lugar de (1.103). Nótese que
conexión adiabática representa una herramienta matemática que genera los autoestados exactos
del sistema a partir de los estados no perturbados.
24 1.6 Primer orden perturbativo

Figura 1.6: Variación de V (t) en el caso adiabático.

donde η es una cantidad pequeña y positiva. Supondremos, además, que la transición


tiene lugar en un tiempo tal que (ver la Figura 1.6

−η −1 ≲ t ≲ η −1 . (1.104)

Al final del cálculo hacemos η → 0 de tal modo que el potencial crezca muy lenta-
mente.
De (1.69) tenemos ˆ
(1) iVin t ′ iωni t′ ηt′
cn (t) = − dt e e (1.105)
ℏ t0
Para t ≲ −η −1 , eηt se hace muy pequeño y podemos reemplazar t0 por −∞, o sea
ˆ
iVni t ′ ′
(1)
cn (t) = − dt′ eiωni t ent (1.106)
ℏ −∞

Integrando esta última se tiene

eηt+iωni t
c(1)
n (t) = Vni (1.107)
ℏ (−ωni + iη)
y la probabilidad de transición es:
2 e2ηt
Pi→n (t) = c(1)
n (t) = 2 |Vni |2 . (1.108)
(En − Ei ) + (ηℏ)2

De la Figura 1.7 vemos que la forma de la probabilidad, en función de En , es muy


parecida a la que tenı́a (1.74). El rango de energı́as finales es ∆E ≤ ηℏ y η −1 mide
el tiempo durante el cual ha actuado el potencial.
Potenciales dependientes del tiempo 25

Figura 1.7: Probabilidad de transición en primer orden perturbativo para un poten-


cial que es “conectado” adiabáticamente.

Derivando (1.108) con respecto a t, obtenemos:



Γi→n (t) = e2ηt |Vni |2 . (1.109)
(En − Ei )2 + (ηℏ)2
Tomando ahora el lı́mite η → 0, será e2ηt → 1 y
2η 2π
lı́m Γi→n = lı́m 2 = δ (Ei − En ) (1.110)
η→0 η→0 (E − E ) + (ηℏ)2 ℏ
n i

que nos lleva al resultado (1.90) que habı́amos obtenido antes cuando el potencial
era “conectado” de repente. Vemos por lo tanto que la probabilidad de transición
Γ(i → n) no depende de los detalles de cómo actúa el potencial.

1.6.7. Dispersión por un potencial


Como ejemplo de la aplicación de regla de oro, consideramos el problema la
dispersión de una partı́cula por un potencial V (r) de rango finito que se ilustrada
en la Figura 1.4. El estado inicial es una onda plana que se propaga según el eje z.
Los estados finales también son ondas planas, que al ser la dispersión elástica poseen
la misma energı́a que la onda incidente, pero se propagan –en general– en direcciones
diferentes que la onda incidente. El Hamiltoniano no perturbado corresponde a una
partı́cula libre y el potencial es tratado como una perturbación:
p2
H = H0 + V (r); H0 = (1.111)
2m
H0 depende solo del impulso p y por lo tanto la onda plana
1
ψp (r) ≡ ⟨r|p⟩ = eip·r/ℏ (1.112)
(2πℏ)3/2
que describe a la partı́cula es autofunción simultánea del impulso y de la energı́a
con autovalores p y p2 /2m, respectivamente, y está normalizada como:
ˆ ∞ ˆ ∞
∗ 1 ′
dr ψp (r)ψp′ (r) = 3
dr ei(p−p )·r/ℏ = δ (p − p′ ) (1.113)
−∞ (2πℏ) −∞
Recordemos también que
ˆ
′ ′
⟨r|r ⟩ = δ (r − r ) ; dr |r⟩⟨r| = 1
ˆ (1.114)
′ ′
⟨p|p ⟩ = δ (p − p ) ; dp |p⟩⟨p| = 1
26 1.6 Primer orden perturbativo

Se suele introducir el impulso k (en unidades de ℏ ) y el correspondiente ket

p = ℏk; |k⟩ = (ℏ)3/2 |p⟩ (1.115)

con: ˆ
′ ′
⟨k|k ⟩ = δ (k − k ) ; dk |k⟩⟨k| = 1 (1.116)

La función de onda asociada es:


ˆ ∞
1
ψk (r) ≡ ⟨r|k⟩ = eik·r , dr ψk∗ (r)ψk′ (r) = δ (k − k′ ) (1.117)
(2π)3/2 −∞

Es posible evitar la introducción de las autofunciones continuas y forzar al problema


a tener un espectro discreto, lo que es conveniente para contar el número de estados.
Esto se consigue encerrando a la partı́cula dentro de una caja grande pero finita de
volumen ℓ3 e imponiendo condiciones de contorno periódicas8

ψ(0, y, z) = ψ(ℓ, y, z), etc. (1.118)

Las autofunciones para este problema de autovalores se obtiene facilmente por medio
de la separación de variables:
1
ψk (r) = eik·r (1.119)
ℓ3/2
donde las componentes de k están dadas por:
2π 2π 2π
kx = nx , ky = ny , kz = nx , (1.120)
ℓ ℓ ℓ
con nx , ny , nz = 0, ±1, ±2, . . .. Si
q 2π q 2 2π
k = |k| = kx2 + ky2 + kz2 = nx + n2y + n2z ≡ n, (1.121)
ℓ ℓ
los autovalores de energı́a de los estados (1.117) son:
2
ℏ2 k 2 ℏ2 2πn

E= = (1.122)
2me 2me ℓ
Cada triplete de números enteros (nx , ny , nz ) corresponde a una onda plana o a un
estado de la partı́cula en el espacio k ≡ (kx , ky , kz ). Notar que cuando ℓ → ∞, kx , ky
8
Dado que un sistema fı́sico real está siempre en algún sentido localizado, la introducción de un
contenedor con dimensiones suficientemente grandes, en comparación con con las que son relevantes
para el sistema considerado, no afectará al sistema en forma significativa. Es decir que podemos
tener dentro de una caja una “onda plana fı́sica”, si la caja es muy grande en comparación con la
longitud de onda de la partı́cula.
Potenciales dependientes del tiempo 27

y kz se transforman en variables continuas. Nos interesa saber el número de estados


dN en el intervalo dk y el problema de contarlos se reduce a contar el número de
sitios en una red tridimensinal en el espacio (nx , ny , nz ). Será9 :
!3 !3
2 ℓ 2 ℓ mk
dN = dnx dny dnz ≡ n dΩdn = k dkdΩ = dEdΩ (1.123)
2π 2π ℏ2
y
!3 ˆ !3 ˆ
X ℓ 2 ℓ mk
→ k dkdΩ = dEdΩ (1.124)
k 2π 2π ℏ2
ˆ
1 X 1
3
→ dk (1.125)
ℓ k (2π)3
Vamos a evaluar ahora la probabilidad de transición Γ dentro de un pequeño
ángulo sólido dΩ′ :

2π 2
|⟨k′ |V |k⟩| δ (Ek′ − Ek ) .
X
Γk = Γk→k′ ; Γk→k′ = (1.126)
k′ en dΩ′

De (1.117)
ˆ ′ ˆ
′ e−ik ·r eik·r 1 ′ Vk−k′
⟨k |V |k⟩ = dr 3/2 V (r) 3/2 = 3 dr V (r)ei(k−k )·r = (1.127)
ℓ ℓ ℓ ℓ3

donde Vk′ −k es la transformada de Fourier de V (r. Haciendo la sustitución


ˆ ∞
!3
X
′ ℓ mk
→ dΩ dE. (1.128)
k′ en dΩ′ 0 2π ℏ2

obtenemos de (1.126):
dΩ′ mk
Γk = |Vk′ −k |2 , (1.129)
ℓ3 4π 2 ℏ3
donde k′ es un vector en dΩ′ de longitud k. Dividiendo finalmente por el flujo de
partı́culas incidentes ℏk/mℓ3 se obtiene la sección eficaz10 :

dσ m2

= 2 4
|Vk′ −k |2 (1.130)
dΩ 4π ℏ
9
Esto equivale a tomar un estado por cubo drdp/(2πℏ)3 en el espacio de las fases.
La densidad de las de partı́culas incidentes es ℓ−3 (una partı́cula en el volumen ℓ3 ) y su
10

velocidad es ℏk/m.
28 1.7 Transiciones de segundo orden

1.7. Transiciones de segundo orden


Puede darse que, por alguna regla de selección, los elementos de matriz Vni (t)
se anulen para todo t. En tal situación no podemos tener transiciones de primer
orden entre los estados |i⟩ y |n⟩. Es posible, sin embargo, que la transicón ocurra
en un orden superior. Vamos a estudiar en detalles el segundo orden perturbativo,
suponiendo que el potencial es “conectado” lentamente. De (1.35) tenemos
2 X ˆ t ˆ t′
−i

′ ′ ′ ′′′ +ηt′′
c(2)
n (t) = dt dt′′ eiωnm t +ηt Vnm eiωmi t Vmi (1.131)
ℏ m t0 t0

Haciendo t0 → −∞ en las integrales sobre t′ y t′′ resulta [ver (1.107)]

e2ηt+iωni t Vnm Vmi


c(2)
X
n (t) = (1.132)
ℏ (−ωni + i2η) m ℏ (−ωmi + iη)

Para calcular la probabilidad de transición podemos directamente tomar el cuadrado


de esta expresión, ya que Vni = 0. Si aquı́ también suponemos que |n⟩ está en el
contı́nuo, luego de derivar, llegamos a la versión de la Regla de Oro en segundo
orden perturbativo
2
2π X Vnm Vmi
Γi→n = δ (Ei − En ) (1.133)
ℏ m Ei − Em + iℏη

donde el lı́mite η → 0 se da por sobreentendido.


Podemos interpretar este resultado diciendo que el sistema hace una transición
“prohibida” o virtual de |i⟩ a |n⟩ en dos pasos. Primero va de |i⟩ a un estado inter-
medio |m⟩ (que no necesita tener la misma energı́a que |i⟩) para pasar luego de |m⟩ a
|n⟩. La amplitud de esta transición doble es proporcional a Vnm Vmi / (Ei − Em + iℏη).
Para evaluar la probabilidad de transición tenemos que sumar sobre todos los esta-
dos intermedios antes de elevar al cuadrado, con lo que las diferentes contribuciones
frecuentemente interfieren entre sı́. A la amplitud
X Vnm Vmi
(1.134)
m Ei − Em + iℏη

se la llama elemento de matriz de segundo orden ya que juega, en la regla de oro, el


mismo papel que Vni . Cuando |m⟩ es parte del contı́nuo el término iℏη es muy im-
portante en la evaluación del elemento de matriz en la región Em ≈ Ei . Finalmente,
de (1.58), vemos de inmediato que, si Vni ̸= 0, la expresión para la probabilidad
de transición contiene el término de segundo orden sumado a Vni , todo elevado al
cuadrado y multiplicado por (2π/ℏ)δ (Ei − En ).
Potenciales dependientes del tiempo 29

1.8. Decaimiento del estado inicial


Hasta aquı́ nos hemos ocupado de la evolución temporal de las amplitudes cn (t)
con n ̸= i. La pregunta que surge naturalmente es: ¿qué ocurre con la amplitud
ci (t)? De (1.35) tenemos
Vin (t)eiωin t cn (t)
X
iℏċi (t) = Vii (t)ci (t) + (1.135)
n̸=i

que luego de dividir por ci (t) nos conduce a


d
Vin eiωin t cn (t)/ci (t)
X
iℏ ln ci (t) = Vii + (1.136)
dt n̸=i

Haciendo, del lado derecho, las aproximaciones: cn (t) ≈ c(1)


n (t); ci (t) ≈ 1, y usando
(1)
el potencial (1.103) y cn (t) dado por (1.107), se tiene
d X |Vin |2 e2ηt
iℏ ln ci (t) = Vii eηt + (1.137)
dt n̸=i ℏ (−ωni + iη)

que para η → 0 (o sea reemplazando eηt y e2ηt por 1) lleva a


d X |Vin |2
iℏ ln ci (t) = ∆i ; ∆i = Vii + (1.138)
dt n̸=i Ei − En + iηℏ

Luego
ci (t) = e−i∆i t/ℏ ; |i(t)⟩I = e−i∆i t/ℏ |i⟩ (1.139)
Cuando los estados |n⟩ son discretos, y el estado |i⟩ no está degenerado, el término
iηℏ no tiene ningún efecto en el lı́mite η → 0. En esta situación ∆i es precisamente la
expresión para el corrimiento de energı́a, en segundo orden perturbativo, producido
por una perturbación estacionaria V .
Comparando
|i(t)⟩S = e−i(Ei +∆i )t/ℏ |i⟩ (1.140)
con el ket no perturbado (para V (t) = 0), |i, t0 ; t⟩S = e−iEi t/ℏ |i⟩, podemos concluir
que, al conectar el potencial muy lentamente y cuando el espectro es discreto, los
autoestados de H0 se transforman adiabáticamente en autovalores de H0 + V (t). Es
decir que la teorı́a de perturbaciones estacionarias pueden ser consideradas como un
caso especial de la teorı́a de perturbaciones dependientes del tiempo.
Supongamos ahora que el estado |n⟩ es uno de los niveles del contı́nuo con En ≈
Ei . En tal caso
´ la sumatoria en (1.138) hay que interpretarla como una integral, o
sea: n̸=i → dEn ρ (En ), como se habı́a hecho antes. Recordando, además, que
P

1 1
lı́m = Pr − iπδ(x) (1.141)
δ→0 x + iδ x
30 1.8 Decaimiento del estado inicial

podemos reescribir (1.138) en la forma


ˆ
|Vin |2
Re (∆i ) = Vii + Pr dEn ρ (En ) , (1.142)
Ei − En
ℏΓi
Im (∆i ) = − (1.143)
2
con Γi dado por (??). En lugar de (1.140) tendremos
|i(t)⟩S = e−i[Ei +Re(∆i )]t/ℏ e−Γi t/2 |i⟩ (1.144)
Podemos interpretar este resultado diciendo que la perturbación produce:
1. Un desplazamiento del nivel original de Ei a Ei + Re (∆i ), como en el caso
discreto, y
2. Una transición de |i⟩ a |n⟩ con la probabilidad de transición por unidad de
tiempo igual a Γi .
También vemos que Γi caracteriza el decaimiento exponencial del estado inicial11 .
Es interesante verificar la conservación de la probabilidad a segundo orden en V
(para t pequeño). Como
ci (t) = e−i Re(∆i )t/ℏ e−Γi t/2 , (1.145)
será |ci (t)|2 = e−Γi t ≈ 1 − Γi t. Luego
|ci (t)|2 + |cn (t)|2 ≈ 1 − Γi t + Γi t = 1.
X
(1.146)
n̸=i

Es decir que la probabilidad de hallar el sistema en cualquiera de los estados, inclu-


yendo el inicial, es igual a 1. Nótese también que 1/Γi es la vida media del estado
|i⟩.
Vamos a mencionar finalmente la distribución en energı́a de los estados finales,
una vez que el estado inicial haya decaı́do; es decir para t ≫ 1/Γi 12 . Con tal fin
primero obtendremos una nueva aproximación para las amplitudes cn (t), haciendo
de nuevo uso de la ecuación de movimiento (1.35). Pero en lugar de poner del lado
izquierdo cn (t) ≡ c(0)
n (t) = ⟨n|i⟩ = δni , como se hizo para llegar al resultado (1.69),
usaremos cn (t) = c(0)n (t) = ⟨n|i⟩ = δni , con los ci (t) dado por (1.129). Para un
potencial constante resulta
ˆ t
−i ′
cn (t) = Vni dt′ eiωni t ci (t′ ) (1.147)
ℏ 0
11
Se puede decir que el estado |i, t0 ; t⟩S tiene una energı́a compleja igual a Ẽi = Ei + Re (∆i ) −
iℏΓi /2.
12
La descripción cuática de estados inestables que se presenta aquı́ fue desarrollada originalmente
por Wigner y Weisskopf en 1930.
Potenciales dependientes del tiempo 31

Figura 1.8: Forma de la distribución en energı́a de los estados finales una vez que
haya decaı́do el estado inicial.

1 − e−Γi t/2 ei[En −Ei −Re(∆i )]t/ℏ


= Vni (1.148)
En − Ei − Re (∆i ) + iΓi /2
que para t ≫ 1/Γi conduce a13 :

|Vni |2
Pi→n (t → ∞) = (1.149)
[En − Ei − Re (∆i )]2 + Γ2i /4
La distribución en energı́a de los estados finales, Pi→n (t → ∞), está representada en
la Figura 1.8. Vemos que el máximo está en En = Ei − Re (∆i ) y que tiene forma
Lorenziana con un ancho igual a Γi .

1.9. Interacción del campo electromagnético clási-


co con un sistema de partı́culas cargadas
Consideremos un sistema de partı́culas cargadas, por ejemplo electrones, con-
tenidos en cierta región del espacio en interacción con una onda electromagnética
clásica. Los campos ϕ y A se consideran externos y obedecen las ecuaciones clásicas
de Maxwell. En la aproximación semiclásica que utilizaremos las partı́culas en cues-
tión no son fuentes para esos campos, y dentro del volumen de nuestro sistema, a
efectos de las ecuaciones de Maxwell, podemos considerar que las fuentes son nulas.
Es conveniente además trabajar en el gauge transversal de Coulomb en el cual
∇ · A(r, t) = 0 (1.150)
y ϕ(r, t) = 0 en ausencia de cargas14 En este gauge, y en ausencia de cargas y
corrientes, las ecuaciones de Maxwell se reducen a la ecuaciones de onda,
!
2 1 ∂2 2
□ A(r, t) ≡ ∇ − 2 2 A(r, t) = o (1.152)
c ∂t
cuya solución es la onda plana
A(r, t) = aϵeik·r−iωt + a∗ ϵ∗ e−ik·r+iωk t (1.153)
(0)
Antes, con cn (t) = δni , habı́amos obtenido: cn (t) = Vni 1 − ei(En −Ei )t/ℏ / (En − Ei )
13

14
En el gauge transversal de Coulomb: ∇2 ϕ(r, t) = −4πρ(r, t), que tiene como solución el po-
tencial instantáneo de Coulomb ˆ
ρ (r ′ , t)
ϕ(r, t) = dr ′ . (1.151)
|r − r ′ |
1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
32 cargadas
con frecuencia
ω = ck, k = |k|, (1.154)
mientras que el vector de polarización λ, para satisfacer (1.150), tiene que ser tal
que:
ϵ · k = 0, (1.155)
es decir, la onda debe ser transversal. Siempre podemos elegir |ϵ|2 = 1.15 La amplitud
a es una constante y como el potencial vector tiene que ser real tenemos que agregar
al primer término en (1.153) su complejo conjugado.
Los campos eléctricos y magnéticos se obtienen a partir de A(r, t) en la forma:

1 ∂A(r, t)
E(r, t) = − , B(r, t) = ∇ × A(r, t). (1.157)
c ∂t
La densidad de la energı́a del campo electromagnético es

E 2 (r, t) + B 2 (r, t)
U (r, t) = (1.158)

que para la onda (1.153) resulta:

ω2 h 2 
2 2 2ik·r−2iωt
i
U= |a| − Re a ϵ e (1.159)
2πc2
El último término oscila con el tiempo y su promedio es nulo para un perı́odo. Luego

ω2
U= |a|2 (1.160)
2πc2

Lo mismo ocurre con el vector de Poynting (flujo de energı́a: energı́a transportada


por unidad de área y de tiempo):

c ω2 2
P = E(r, t) × B(r, t) = k̂cU = k̂ |a| , (1.161)
4π 2πc

que se propaga en la dirección k̂ con la velocidad c.


15
Para una polarización lineal ϵ es real y ϵ± = √12 (x̂±iŷ) corresponde a una polarización circular
derecha (+) o izquierda (−). Notemos también que si ϵ = ϵ+ , será ϵ∗ = ϵ− , como que:

ϵ± · ϵ∗± = 1; ϵ± · ϵ± = ϵ∗± · ϵ∗± = 0 (1.156)


Potenciales dependientes del tiempo 33

Consideremos el Hamiltoniano de un sistema de N partı́culas cargadas de masa m


y carga e16 en un campo electromagnético, representado por el potenciales (ϕ, A)17 :
N
" #2 N
X 1 eA (ri , t) X
H= pi − + eϕ (ri , t) . (1.162)
i=1 2m c i=1

Enfaticemos que si bien las partı́culas son objetos cuánticos ya que sus posiciones
y momentos están representadas por operadores ri y pi , el campo electromagnético
es clásico, es decir, obedece las ecuaciones clásicas de Maxwell. No obstante, las
cantidades A(ri , t) y ϕ(ri , t) en la expresión anterior son operadores por depender
de las posiciones y momentos de las partı́culas.
Vamos a utilizar además una aproximación en la que A es pequeño y quedarnos
con el término lineal en el potencial vector, de manera que si denotamos
N
X p2i
H0 = (1.163)
i 2m
entonces el Hamiltoniano de interacción se escribe
2
1 e

V (t) = pi − A(ri , t) − H0 (1.164)
2m c
X e
=− [pi · A(ri , t) + A(ri , t) · pi ] + O(A2 ) (1.165)
2mc
i
ˆ
e 1 X
=− dr [pi δ(r − ri ) + δ(r − ri )pi ] · A(r, t) + O(A2 ) (1.166)
c 2m i
ˆ
e
=− dr j(r) · A(r, t) (1.167)
c
donde hemos definido el operador corriente en la forma
N
1X pi pi
 
j(r) = δ (r − ri ) + δ (r − ri ) (1.168)
2 i=1 m m
Este operador es la suma de términos que representan la velocidad de las partı́culas
multiplicadas por los operadores densidad δ(r − ri ). Debido a la forma simétrica de
(1.168), j(r) es un operador hermı́tico. Observemos que p · A(ri , t) ̸= A(ri , t) · p, y
lo mismo vale para ambos términos en la corriente. Solo en el gauge transversal de
Coulomb, para el cual vale (1.150), tendremos que p · A(r, t) = A(r, t) · p. Nótese
además que en la ecuación (1.167) A(r, t) no es más un operador ya que todos los
operadores de posición ri están contenidos en j(r)
16
El electron posee carga e < 0.
17
Se podrı́a incluir también un potencial U que describiera a todos los demás potenciales que
que ven las partı́culas, por ejemplo, los que mantienen al sistema en un volumen finito, o si se
tratara de electrones en átomos, las interacción Coulombianas con el núcleo atómico, o incluso
entre electrones del mismo o de diferentes átomos.
1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
34 cargadas
1.9.1. Absorción de la luz
Para fuentes luminosas usuales los campos eléctricos generados por A son gene-
ralmente pequeños comparados con los campos atómicos (∼ e/a20 ). En esta situación
el efecto del término ρA2 , de segundo orden en A, es pequeño comparado con el
efecto de j · A y podemos despreciarlo en el cálculo de la absorción de la luz por un
sistema de partı́culas cargadas, tales como átomos. En tal caso:
ˆ
e
V (t) = − dr j(r) · A(r, t) (1.169)
c
Si representamos a A(r, t) por una ondas planas como en (1.153) el potencial resulta
e 
V (t) = − aj−k · ϵe−iωt + a∗ jk · ϵ∗ eiωt (1.170)
c
donde ˆ N
1X pi −ik·ri pi
 
−ik·r
jk ≡ dr e j(r) = e + e−ik·ri . (1.171)
2 i=1 m m
son los operadores. Vamos a calcular ahora la probabilidad de que un haz de luz,
representado por (1.153), sea absorbido por el sistema, que está en un estado |i⟩.
Vemos de inmediato que cada sumando de V (t) es de la forma (1.77) con
e
− a∗ j k · ϵ ∗ → V
c (1.172)
e
− aj−k · ϵ → V †
c
Luego, podemos utilizar los resultados (1.83) y (1.81), que para tiempos grandes
resultan en la probabilidad por unidad de tiempo
2π e2
Γabs
i→n (kϵ) = δ (En − Ei − ℏω) 2 |a|2 |⟨n |j−k · ϵ| i⟩|2 (1.173)
ℏ c
En general la radiación no es monocromática (con una única ω) sino una mezcla
incoherente de ondas con distintos ϵ, k y ω. Supongamos entonces una superposición
de ondas planas de la forma (1.153) donde cada modo posee su porpia amplitud.
Supondremos que el haz es incoherente de tal modo de que no exista ninguna co-
rrelación entre las diferentes componentes de Fourier del haz. Por ejemplo, la luz
emitida por un gas caliente, tal como el vapor de mercurio, resulta de las contribu-
ciones de todos los átomos del gas, entere cuyas componentes no hay ningún tipo
de correlación. (Se dice que la distribución de fases es al azar.) En esta situación
podemos calcular el efecto de cada una de las componentes de Fourier del haz in-
cidente por separado y luego sumar sobre todas las contribuciones. (No hay efectos
de interferencia en la interacción de la luz con el átomo.).
Potenciales dependientes del tiempo 35

Sumando ahora sobre todos los modos {kϵ} obtenemos:

1 e2 2π X
Γabs
i→n = |akϵ |2 |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.174)
V c2 ℏ kϵ

Transformando la suma sobre k en una integral, como se hizo en (1.124),


ˆ ˆ 2 ˆ 2
1 X 1 k dkdΩ ω dωdΩ
→ 3
dk = 3
= , (ω = ck) (1.175)
V k (2π) (2π) (2πc)3

realizando la integral en ω resulta:


ˆ
2πe2 ω 2
Γabs |⟨n |j−k · ϵ| i⟩|2 |akϵ |2
X
i→n = 2 2 dΩ (1.176)
ℏ c (2πc)3 ϵ

donde ahora ℏω = En − Ei .
Supongamos ahora que la luz incidente está polarizada según ϵ y que está com-
prendida dentro de un ángulo sólido dΩ. De (1.176) la correspondiente probabilidad
de transición (diferencial) será:

2πe2 ω 2
Γabs
i→n (ϵ) = 2 2 3
|⟨n |j−k · ϵ| i⟩|2 |akϵ |2 dΩ
ℏ c (2πc)
(1.177)
(2π)2 e2
= 2 2 |⟨n |j−k · ϵ| i⟩|2 I(ω)dΩ,
ℏω c
donde
ω4
I(ω) = 4
|akϵ |2 . (1.178)
(2πc)
Se verifica que I(ω) es la intensidad de la luz incidente dentro de un ángulo sólido
dω por unidad de frecuencia. En efecto, según (1.161), y pasando al continuo de
acuerdo a (1.175) el flujo de energı́a transportada es:
ˆ ˆ ˆ ˆ
c X ω2 2 ω4 2
|akϵ | = dΩ dω |akϵ | = dΩ dω I(ω) (1.179)
V k 2πc2 (2πc)4

De una forma análoga se obtiene que la probabilidad de emisión por unidad tiempo,
inducida por el haz incidente desde el estado inicial |i⟩ al estado final |n⟩ de menor
energı́a, es
(2π 2 )e2
Γ[Link]
i→n (ϵ) = |⟨n |jk · ϵ∗ | i⟩|2 I(ω)dΩ (1.180)
ℏ2 ω 2 c
siendo aquı́ ω = (Ei − En ) /ℏ. Notemos que, como

⟨i |j−k · ϵ| n⟩ = ⟨i| (jk · ϵ∗ )† |n⟩ = ⟨n |jk · ϵ∗ | i⟩∗ , (1.181)


1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
36 cargadas
será
Γabs [Link]
i→n = Γn→i (1.182)
o también
( )
1 e2 2π X absorción
Γi⇄n = |akϵ |2 |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω)
2
V c ℏ kϵ emisión estimulada
(1.183)
En un proceso de absorción el sistema absorbe un fotón de energı́a ℏω = En − Ei .
Lab energı́a ganada por el átomo es compensada por la correspondiente pérdida
de energı́a del campo electromagnético. Análogamente en un proceso de emisión la
energı́a del sistema disminuye en ℏω = En − Ei , debido a la emisión de un fotón,
y la energı́a del campo aumenta en la misma cantidad. Se dice que la emisión es
estimulada o inducida ya que la probabilidad de que esto ocurra es proporcional a
la intensidad de la radiación aplicada. Cada fotón en el haz incidente de frecuencia
ω tiene una energı́a ℏω. Luego la energı́a total del haz incidente es:
X
E= ℏωnkϵ (1.184)

donde nkϵ es el número de fotones en el modo {kϵ} del haz incidente. Comparando
esta última expresión con la energı́a del campo electromagnético

ω2
|akϵ |2
X
E= (1.185)
kϵ 2πc2

vemos que la amplitud akϵ está relacionada con el número de fotones por

2πℏc2
|akϵ |2 = nkϵ (1.186)
ω
Luego en lugar de (1.183) podemos escribir

4π 2 e2
nkϵ |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω)
X
Γi⇄n = (1.187)
kϵ ωV

Por medio de nkϵ podemos expresar solamente la magnitud de akϵ y no su fase.


Notemos también que suponer que el haz incidente es incoherente es equivalente a
no tener ninguna información sobre las fases relativas de las diferentes akϵ . Calcular
los efectos de cada una de las componentes de Fourier y luego sumar sobre las
diferentes componentes es equivalente a promediar sobre todas las posibles fases de
los akϵ . Es decir que para especificar un haz incoherente basta dar el número de
fotones en cada modo {kϵ}. En otras palabras, sı́ lo único que que sabemos sobre
Potenciales dependientes del tiempo 37

un haz son los números nkϵ , no tenemos ninguna información sobre las fases entre
las diferentes componentes de Fourier del haz18 .
La probabilidad de transición total por unidad de tiempo producida por un haz
de nkϵ fotones incidentes será, de (1.187)

4π 2 e2 cnkϵ X
Γabs
i (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.188)
ωc V n

Dado que nkϵ /V es la densidad de fotones, cnkϵ /V es el flujo de fotones incidentes.


El cociente entre Γabs
i (ω) y este flujo define la sección eficaz de absorción,

4π 2 e2 X
σiabs (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.189)
ωc n

que, además de depender de la frecuencia, depende de la dirección y polarización de


la radiación.

1.10. Aproximación dipolar eléctrica


Si bien en la sección anterior consideramos un sistema de electrones libres aco-
plado a un campo electromagnético, podemos extrapolar los resultados a problemas
más generales. La aproximación dipolar eléctrica se basa en el hecho de que la energı́a
del campo de radiación ℏω = ℏck tiene que ser comparable, en magnitud, con la
separación entre los niveles del sistema irradiado por el campo electromagnético. En
un sistema atómico tendrá que satisfacerse:

Ze2 Ze2
ℏω ∼ ≈ (1.190)
a0 /Z Rátomo

Esto conduce a:
ω Ze2 Z
k= ∼ = (1.191)
c ℏcRátomo 137Rátomo
o sea
kRátomo = Rátomo /λ ∼ Z/137, (1.192)
donde λ = 1/k es la longitud de onda del campo de radiación. Si ahora expandimos la
exponencial eik·r en la integral (1.171) con respecto a la posición del núcleo átomico
r0 = 0, i.e.,
eik·r = 1 + ik · r + · · · (1.193)
18
En una descripción cuántica completa de la radiación, los nkϵ y las fases de akϵ son cantidades
complementarias (como el impulso y la posición) y cuanto mejor especificamos a una de ellas tanto
menos información tenemos sobre la otra.
38 1.10 Aproximación dipolar eléctrica

por lo menos para átomos livianos (Z/137 ≪ 1) será

k · r ≲ kRátomo ≪ 1 (1.194)

Obtendremos por lo tanto resultados razonables si hacemos eik·r ≈ 1, que es la


aproximación dipolar. Resulta, entonces,
ˆ ˆ
ik·r
⟨n |j−k | i⟩ = dr e ⟨n|j(r)|i⟩ ≈ dr ⟨n|j(r)|i⟩ = ⟨n |j0 | i⟩ (1.195)

donde
P 1
=
j0 = [d, H0 ] . (1.196)
m −eiℏ
P
Aquı́, P = i pi es el operador de impulso total, H0 es el Hamiltoniano del átomo
en ausencia de la radiación [ver (1.163)] y d = −e i ri es el operador del momento
P

dipolar eléctrico.
Luego, como ℏω = En − Ei , en la aproximación dipolar será:

⟨n |j−k | i⟩ ≈ dni ; dni = ⟨n|d|i⟩ (1.197)
−e
donde dni es el elemento de matriz no-diagonal del momento dipolar eléctrico. La
sección eficaz es ahora
(2π)2 ω X
σiabs;dip (λ; ω) = |dni · ϵ|2 δ (En − Ei − ℏω) (1.198)
c n

y la sección eficaz total se obtiene integrando la anterior sobre todas las frecuencias:
ˆ ∞
(2π)2 X
abs;dip
σi (ϵ) = dω σiabs;dip (ϵ; ω) = 2 (En − Ei ) |dni · ϵ|2 , (1.199)
0 ℏc n

donde la suma se extiende sobre En > Ei . Si |i⟩ es el estado fundamental la suma


va sobre todos los estados. Es fácil demostrar que, si û es un versor real, se satisface
la relación
ℏ2 e2 N
(En − Ei ) |dni · û|2 =
X
, (1.200)
n 2m
conocida como la regla de suma dipolar, donde N es el número total de partı́culas.
Por lo tanto, cuando la luz incidente esta polarizada linealmente, la sección eficaz
total satisface la regla de suma19

2π 2 e2
σiabs;dip ( pol. lineal ) = N. (1.204)
mc
19
La ecuación (1.199) es una consecuencia de la relación de conmutación entre r y p. En efecto,
Potenciales dependientes del tiempo 39

1.11. Reglas de selección


Las transiciones estudiadas arriba, llamadas dipolares, solo tienen lugar si el
elemento de matriz ⟨n|d · ϵ|i⟩ es no nulo. Como el momento dipolar d = −e ri
P

cambia ante una transformación de paridad, los elementos de matriz serán no nulos
solo si la paridad P de los estados |i⟩ y |n⟩ es opuesta. Es decir, debe ser

∆P = Pn − Pi ̸= 0 (1.205)

Esta es la llamada regla de Laporte, descubierta en 1924. Consideremos como ejem-


plo el caso de un único electrón atómico (en un campo central). Las funciones de
onda serán

⟨r|i⟩ = Ri (r)Ylm (θ, φ) (1.206)


⟨r|n⟩ = Rn (r)Yl′ m′ (θ, φ) (1.207)

Si usamos las conocidas expresiones


s

z=r Y10 (θ, φ) (1.208)
3
s

x + iy = −r Y11 (θ, φ) (1.209)
3
s

x − iy = r Y1−1 (θ, φ) (1.210)
3
podemos escribir
s !
4π Ex + iEy Ex − iEy
r·ϵ=r Ez Y10 (θ, φ) + √ Y1−1 (θ, φ) − √ Y11 (θ, φ) (1.211)
3 2 2
tomando el valor medio del operador
" N N
#
X X X
[P · û, d · û] = −e pi · û, ri · û = iℏe δij = ieℏN, (1.201)
i=1 i=1 ij

con respecto al al estado |i⟩ (no necesariamente el estado fundamental), se tienen

⟨i|(P · ûd · û − d · ûP · û)|i⟩ = ieℏN, (1.202)

ó X X
⟨i|P · û|n⟩⟨n|d · û|i⟩ − ⟨i|d · û|n⟩⟨n|P · û|i⟩ = ieℏN. (1.203)
n n

Usando finalmente (1.196) y (1.197) se obtiene de inmediato (1.200).


40 1.11 Reglas de selección

Luego, podremos escribir a los elementos de matriz en la forma


s ˆ ˆ π ˆ 2π
4π ∞ 3
ϵ·r = r (r)Ri (r)Rn (r) sin θdθ dφ
3 0 0 0
!
∗ Ex + iEy Ex − iEy
× Yl′ m′ (θ, φ) Ez Y10 (θ, φ) + √ Y1−1 (θ, φ) − √ Y11 (θ, φ) Ylm (θ, φ)
2 2
(1.212)
La parte angular de (1.212) se reduce entonces a integrales de productos de 3
armónicos esféricos que se pueden hacer explı́citamente usando la ortogonalidad y
la relación
Y1m (θ, φ)Yl′ m′ (θ, φ) =
AYl′ +1,m+m′ (θ, φ) + BYl′ ,m+m′ (θ, φ) + CYl′ −1,m+m′ (θ, φ) (1.213)
A partir de estas integrales angulares llegamos a las siguientes reglas de selección
para transiciones permitidas:
∆l = l′ − l = ±1
∆m = m′ − m = 0, ±1
Para átomos como el de Hidrógeno, o los alcalinos (con un único electrón fuera
de capa cerrada), estas reglas de selección determinan totalmente el espectro. En
otros átomos, con muchos electrones disponibles para hacer transiciones, las reglas
se complican. He aquı́ la lista de reglas (incluyendo al spin):
La paridad de los estado implicados debe cambiar.
Cuando el sistema puede ser aproximado por orbitales, la configuración debe
cambiar de manera que ∆ li = ±1
P

∆J = 0, ±1
J = 0 → J = 0 está prohibida
∆mJ = 0, ±1
∆L = 0, ±1
∆ML = 0, ±1
∆S = 0
∆MS = 0
Notemos que está permitido que ∆L = 0. Pero este L nada tiene que ver con la
paridad del estado (No es el L que aparece en un armónico esférico determinando
su paridad a través de algún (−1)L .
Potenciales dependientes del tiempo 41

1.11.1. Transiciones prohibidas


Los resultados anteriores los obtuvimos reteniendo solo el primer término (i.e. el
1 ) en el desarrollo de exp(ikr). Debemos analizar cómo cambian los resultados si
incluimos el término siguiente. Este término ik · r da, al elemento de matriz ⟨n|jk |i⟩,
la contribución v s siguiente:

ie X
vs = − (ϵ · pi ) (k · ri ) (1.214)
mc i

Podemos escribir a v s de la siguiente manera

vs = vM + vQ (1.215)

con
ie X
vM = − ((ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ))
2mc i
(1.216)
ie X
vQ = − ((ϵ · pi ) (k · ri ) + (ϵ · ri ) (k · pi ))
2mc i
Es fácil ver que

(ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ) = (k × ϵ) · Li (1.217)

de manera que
ie
vM = −
X
(k × ϵ) · Li (1.218)
2mc i

o, recordando la relación entre momento angular orbital y momento magnético µ


e
µ= L (1.219)
2mc
v M = −i(k × ϵ) ·
X
µi = −i(k × ϵ) · M (1.220)
i

donde hemos llamado M al momento dipolar magnético total. Como M es un vector


axial, no cambia de signo ante transformaciones de paridad, ası́ que los elementos de
matriz de v M serán no nulos solo si ∆P = 0 Se puede proceder de manera análoga
con v Q , relacionado con el momento cuadrupolar eléctrico y se llega a que

ie
vQ = − Ei kj Qij (1.221)
mc
donde Qij es el momento cuadrupolar eléctrico.
42 1.12 Fórmula de Kubo

1.12. Fórmula de Kubo


Consideremos la siguiente configuración basica: para t < t0 el sistema se encuen-
tra en el estado fundamental de un cierto Hamiltoniano H0 , que llamamos |ψ0 ⟩, con
energı́a E0 . Si analizamos los valores de expectación de un conjunto de observables
Oi , estos toman los valores
⟨Oi ⟩0 = ⟨ψ0 |Oi |ψ0 ⟩. (1.222)
independientes del tiempo. En el instante t0 se enciende la perturbación
X
V (t) = gj (t)Oj (1.223)
j

donde el ı́ndice j etiqueta los distintos operadores en la teorı́a y, correspondiente-


mente, las diferentes fuentes que podemos encender. Por lo general, en cualquier
situación dada, sólo encendemos una fuente para un solo operador, pero nos puede
interesar cómo esta fuente afecta el valor esperado de cualquier otro operador Oj .
Luego de encender la perturbación, el estado fundamental evoluciona en el tiempo
(en el esquema de Schrödinger) de acuerdo a

|ψ0 (t)⟩S = U(t, t0 )|ψ0 ⟩S , (1.224)

y entonces los valores de expectación adquieren la dependencia temporal

⟨Oi ⟩(t) = ⟨ψ0 |U † (t, t0 )Oi U(t, t0 )|ψ0 ⟩ (1.225)

además de inducirse las transiciones a los estados excitados estudiadas antes. Resulta
mas conveniente trabajar en la representación de interacción, es decir, escribirlo en
términos del operador de evolución en la representación de interacción UI (1.61):

UI (t, t0 ) = eiH0 (t−t0 )t/ℏ U(t, t0 ), (1.226)

para el cual disponemos de una serie de Dyson (1.65):


ˆ
i t ′
!

UI (t, t0 ) = T exp − dt VI (t ) . (1.227)
ℏ t0

Entonces, introduciendo la relación inversa a (1.226),

⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )eiH0 (t−t0 )t/ℏ Oi e−iH0 (t−t0 )t/ℏ UI (t, t0 )|ψ0 ⟩ (1.228)

que reescribimos introduciendo la repersentación de interacción para el operador Oi

⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )Oi (t)UI (t, t0 )|ψ0 ⟩. (1.229)
Potenciales dependientes del tiempo 43

Obsérvese que omitimos el subı́ndice I para los operadores Oi (t) en representación


de interacción,
Oi (t) = eiH0 (t−t0 )/ℏ Oi e−iH0 (t−t0 )/ℏ .
Queda sobrentendido del hecho de que poseen una dependencia temporal. Consi-
deremos que el instante en el que se enciende la perturbación t0 → −∞, y si nos
restringimos a valores pequeños de las fuentes, podemos realizar el cálculo usando
la teorı́a de perturbaciones al orden mas bajo,
ˆ t
! ˆ t
!
i ′ ′ i ′ ′
⟨Oi ⟩(t) = ⟨ψ0 | 1 + dt VI (t ) + . . . Oi (t) 1 − dt VI (t ) + . . . |ψ0 ⟩
ℏ −∞ ℏ −∞
(1.230)
ˆ t ˆ t
i i
= ⟨Oi ⟩0 + dt′ ⟨ψ0 |VI (t′ )Oi (t)|ψ0 ⟩ − dt′ ⟨ψ0 |Oi (t)VI (t′ )|ψ0 ⟩
ℏ −∞ ℏ −∞
(1.231)
ˆ t
i
= ⟨Oi ⟩0 + dt′ ⟨ψ0 | [VI (t′ ), Oi (t)] |ψ0 ⟩ (1.232)
ℏ −∞

Finalmente insertamos la expresión explı́cita para el potencial que contiene a las


fuentes, (1.223) obtenemos el cambio en el valor de expectación,
ˆ t
iX
ε⟨Oi ⟩(t) = ⟨Oi ⟩(t) − ⟨Oi ⟩0 = dt′ gj (t′ )⟨ψ0 | [Oj, (t′ ), Oi (t)] |ψ0 ⟩ (1.233)
ℏ j −∞
ˆ +∞
iX
=− dt′ Θ(t − t′ )⟨ψ0 | [Oi (t), Oj (t′ )] |ψ0 ⟩gj (t′ )
ℏ j −∞
(1.234)

donde en la segunda lı́nea utilizamos la función escalón para extender el lı́mite


superior de integración hasta +∞ y [. . . , . . .] refiere al conmutador de los operadores.
Comparando este resultado con nuestra definición original (??), vemos que la función
respuesta en la teorı́a cuántica está dada por

i
χij (t, t′ ) = − Θ(t − t′ )⟨[Oi (t), Oj (t′ )]⟩ , (1.235)

que, debido a la función de Heaviside, naturalmente emerge como una función res-
puesta causal. Dado que en representación de interacción la evolución temporal de
los operadores (1.12) es con H0 y que |ψ0 ⟩ es autoestado de H0 , no es difı́cil conven-
cerse de que
χij (t, t′ ) = χij (t − t′ )
44
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

Con esta función, el valor de expectación del observable Oi a tiempo t se escribe, en


respuesta lineal, como
ˆ ∞
dt′ χij (t − t′ )gj (t′ ).
X
⟨Oi ⟩(t) = ⟨Oi ⟩0 + (1.236)
j −∞

Esta fórmula es importante y se conoce como fórmula de Kubo. Más allá de la


decoración (la función escalón, o el hecho de que debe tomarse un conmutador) la
función respuesta ası́ escrita consiste en un valor de expectación de un producto
de dos operadores (que pueden ser iguales o distintos) en tiempos diferentes. Esto
genéricamente se denomina función de correlación o función de Green, y ya vimos
que en este caso es una función retardada. Observemos que el obsevable i-ésimo para
el que estamos tomando su valor de expectación no necesariamente tiene que estar
perturbado, basta que la respuesta χij sea no nula con algún observable perturbado
para obtener un resultado no trivial.
Dada la expresión de la función respuesta en términos de un conmutador de
operadores hermı́ticos, es claro que la respuesta del operador i a una perturbación
externa que se acopla con j está simplemente relacionada con la respuesta de j a
una perturbación que se acopla con i, en otras palabras, donde los operadores tienen
roles invertidos. Estas son las relaciones de reciprocidad de Onsager.

1.13. Fórmula de Kubo para la conductividad eléctri-


ca: hacia una teorı́a de campos
Finalicemos este capı́tulo describiendo cómo esta teorı́a de la respuesta lineal
puede utilizarse para calcular propiedades de transporte en un sistema de muchas
partı́culas. Consideremos un sistema de partı́culas cargadas en presencia de un cam-
po electromagnético. Cómo hemos visto, el Hamiltoniano está dado por (1.162), que
bajo las suposiciones realizadas en la sección 1.9 se escribe H = H0 + V (t), donde
N
X p2i
H0 = , (1.237)
i=1 2m
ˆ
e
V (t) = − dr j(r) · A(r, t), (1.238)
c

y el vector corriente (1.168) se escribe


N
1X pi pi
 
j(r) = δ (r − ri ) + δ (r − ri ) . (1.239)
2 i=1 m m
Potenciales dependientes del tiempo 45

este operador, un observable, al ser una función de la posición, está describiendo una
teorı́a cuántica de campos, que es el lenguaje en el que los sistemas de partı́culas
se expresan naturalmente. Una extensión natural de la fórmula de Kubo (1.235)
al continuo, es decir, cuando los ı́ndices i se convierten en un continuo en tres
dimensiones, el valor medio del operador corriente está dado por
ˆ
dr ′ dt′ χαβ (r − r ′ , t − t′ ) Aβ (r ′ , t′ )
X
⟨jα (r, t)⟩ = ⟨jα (r)⟩0 + (1.240)
β

donde la función respuesta para la corriente es


i
χαβ (r, t) = − θ(t) ⟨[jα (r, t), jβ (0, 0)]⟩ , (1.241)

y ⟨. . .⟩0 es un valor de expectación calculado en el estado fundamental del Hamil-
toniano H0 (que no vamos a especificar por ahora, baste decir que si se trata de un
sistema de electrones, éste tendrá que ser un mar de Fermi). Usualmente el primer
término en la ecuación anterior se anula (no hay corriente inducida en ausencia de
campo). La invarianza frente a traslaciones se traduce en el hecho de que la función
respuesta depende sólo de la diferencia entre coordenadas. Sin embargo, si lo que
buscamos es obtener la conductividad, necesitamos recuperar una ley de Ohm. Para
ello quisiéramos encontrar una expresión análoga a (1.240) pero que involucre al
campo eléctrico en lugar del potencial vector
Detengámonos un momento en el operador corriente (1.239): es una suma de
términos de la forma velocidad de la partı́cula i-ésima multiplicada por la δ(r − ri ),
que es la justamente su densidad. Sin embargo, como se ha discutido, pi /m no puede
ser la velocidad de cada partı́cula en presencia de un campo electromagnético, porque
p es momento canónico. En su lugar, en presencia de un campo electromagnético,
la velocidad de una partı́cula está representada por por el momento cinemático (o
mecánico) Π:
Π 1 e
 
v= = p − A(r, t) . (1.242)
m m c
Esto significa que el verdadero operador corriente, o corriente fı́sica, es
N
1X
J (r, t) = [vi δ (r − ri ) + δ (r − ri ) vi ] (1.243)
2 i=1
N
1 X e e
   
= pi − A (ri , t) δ (r − ri ) + δ (r − ri ) pi − A (ri , t)
2m i=1 c c
(1.244)
N N
1 X e X
= [pi δ (r − ri ) + δ (r − ri ) pi ] − δ (r − ri ) A (ri , t) (1.245)
2m i=1 mc i=1
e
= j(r) − A(r, t)ρ(r) (1.246)
mc
46
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

donde hemos definido el operador


N
X
ρ(r) = δ(r − ri ). (1.247)
i=1

Este operador se interpreta como la densidad de partı́culas,20 ya que


ˆ
dr ρ(r) = N. (1.249)

El primer término en (1.246) se denomina paramagnético, mientras que el se-


gundo es el término diamagnético. Este es el observable que debe entrar en la ley
de Ohm.
Utilizando su definición (1.246), calculemos entonces el valor de expectación de
la corriente fı́sica
e
⟨J (r, t)⟩ = ⟨j(r, t)⟩ − A(r, t)⟨ρ(r, t)⟩ (1.250)
mc
Para el primer término podemos utilizar (??). Para el segundo, tendrı́amos que es-
cribir una nueva fórmula de Kubo. Sin embargo, puede mostrarse que el conmutador
de ρ con jα se anula en muchos casos, y si no se anulara, en todo caso la contribuión
adicional es de orden A2 y la despreciamos. Por lo tanto escribimos
N
⟨ρ(r)⟩ = ⟨ρ(r)⟩0 = =n (1.251)
V
donde V es el volumen del sistema, y n la densidad media de partı́culas.
El potencial vector y el campo eléctrico se relacionan mediante
1∂
E(r, t) = − A(r, t) − ∇ϕ(r, t) (1.252)
c ∂t
En el gauge de Coulomb y en ausencia de cargas y corrientes ϕ = 0.
Es conveniente trabajar en el espacio recı́proco, donde observables y fuentes
dependen de la frecuencia. En el caso del campo eléctrico tenemos,
ˆ
E(r, ω) = dt eiωt E(r, t), (1.253)

20
Un eventual término de potencial escalar en el Hamiltoniano se puede escribir como
N
X ˆ
eϕ(ri , t) = e drρ(r)ϕ(r, t) (1.248)
i=1

donde ahora ϕ es una función clásica.


Potenciales dependientes del tiempo 47

y una expresión análoga para el potencial vector. Por un lado, la relación entre
campo eléctrico y potencial vector (en el gauge de Coulomb, donde ϕ = 0) se escribe


E(r, ω) = A(r, ω), (1.254)
c
y por otro, para el valor de expectación de la corriente fı́sica tenemos
en
⟨Jα (r, ω)⟩ = ⟨jα (r, ω)⟩ − Aα (r, ω) (1.255)
ˆ mc
en
dr ′ χαβ (r − r ′ , ω)Aβ (r ′ , ω) −
X
= Aα (r, ω) (1.256)
β mc
ˆ
en c
 
′ ′ ′
Eα (r ′ , ω)
X
= dr χαβ (r − r , ω) − δ(r − r )δαβ (1.257)
β mc iω
(1.258)

Adicionalmente, podemos tomar la transformada de Fourier en el espacio y es-


cribir X
⟨Jα (q, ω)⟩ = σαβ (q, ω)Eβ (q, ω) (1.259)
β

donde
c en
 
σαβ (q, ω) = −i χαβ (q, ω) − δαβ (1.260)
ω + iη mc
Finalmente, hemos agregado una pequeña parte imaginaria ε a la frecuencia porque
la función respuesta causal debe ser analı́tica en el semiplano superior.
En un gas de electrones libres, el operador corriente conmuta con el Hamilto-
niano. En consecuencia,

j(0, t) = eiH0 t j(0, 0)e−iH0 t = j(0, 0) y [jα (0, t), jβ (0, 0)] = 0. (1.261)

De este modo,
" #
ne2 ne2 ne2
σαβ (0, ω) = iδαβ = δ αβ πδ(ω) + i . (1.262)
mω + m mω

La parte real corresponde al llamado “pico de Drude”. Notando que

τ −1
πδ(ω) = lı́m ,
τ →∞ (ωτ )2 + 1

vemos que obtenemos para ω = 0 el modelo de Drude para la conductividad,


2
Re σ = nem τ , donde τ es el tiempo de vida medio de las cuasipartı́culas entre dos
48
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

colisiones; para electrones libres, sin embargo, este tiempo de vida medio es infini-
to y lo mismo para la conductividad dc21 . Si incluyéramos interacciones entre los
electrones obtendrı́amos un tiempo de vida finito. La parte imaginaria de σαβ (0, ω)
describe la absorción óptica (aquı́ entra la disipación) que decrece como 1/ω.

21
En ingles se utiliza la sigla dc, o direct current para la corriente continua y ac o alternate
current para la acorriente alterna.
Capı́tulo 2

Dispersión de partı́culas

La dispersión, procesos en los cuales un haz de electrones, protones, fotones,


etc. incide sobre un blanco compuesto a la vez por átomos o núcleos, es un proceso
fundamental que es importante en una amplia gama de aplicaciones. Por ejemplo, la
mayor parte del trabajo experimental en fı́sica de partı́culas involucra la dispersión,
y una gran parte de lo que se sabe sobre las propiedades de las partı́culas se ha
obtenido a través de experimentos de dispersión. Para otro ejemplo, la dispersión
de especies nucleares en un plasma caliente es importante para determinar las tasas
de reacción termonuclear en estrellas o en el universo primitivo. Por otro lado, una
de las técnicas experimentales actuales para investigar los nanotubos de carbono es
la dispersión de fotones. Se podrı́a acumular una larga lista de ejemplos.
En capı́tulo ?? consideramos algunos problemas de dispersión como una aplica-
ción de la teorı́a de la perturbación dependiente del tiempo. En este capı́tulo consi-
deramos la dispersión por un potencial en tres dimensiones, adoptando un enfoque
independiente del tiempo y presentando algunos de los hechos básicos más impor-
tantes. Desde el punto de vista teórico, el aspecto más relevante de los procesos de
dispersión es que nos proveen información sobre el sector continuo del espectro. Nos
enfocamos entonces en las soluciones con energı́a positiva de la ecuación de Schrödin-
ger independiente del tiempo, que satisfacen ciertas condiciones de contorno. Estas
soluciones en general se extienden hasta el infinito y no son normalizables.

2.1. Condiciones de Contorno


En estas notas nos concentraremos en la dispersión por un potencial V (r) que
decae en el infinito,
V (r) −−−−→ 0 (2.1)
|r|→∞

y en general consideraremos potenciales que decaen más rápido que 1/|r|, a los
que llamamos de corto alcance. Hablaremos de la dispersión de una partı́cula por

49
50 2.1 Condiciones de Contorno

el potencial V (r), como si fuera un potencial fijo en el espacio, pero en realidad


la partı́cula del haz incidente interactúa con un blanco que muchas veces es otra
partı́cula móvil, y un tratamiento adecuado nos obliga a tener en cuenta la dinámica
de ambas partı́culas, por ejemplo utilizando las coordenadas del centro de masa.
Omitiremos aquı́ los detalles, y sólo supondremos en lo que sigue que que se utiliza
este sistema de referencia
Estamos interesados en resolver la ecuación de Schrödinger independiente del
tiempo,
ℏ2 2
Hψ = − ∇ ψ + V ψ = Eψ (2.2)
2m
para energı́as positivas E > 0. Como la energı́a es positiva, la función de onda se
extiende hasta el infinito y no hay cuantización, es decir, existe una solución para
cada valor de E > 0. De hecho, existen muchas soluciones linealmente independientes
para una dada energı́a y buscamos aquella que satisfaga las condiciones de contorno
correctas para representar la fı́sica del problema de dispersión.
Supongamos un haz de partı́culas que incide con momento p sobre un blanco,
como se muestra en la figura 2.1. Como el potencial es de corto alcance, muy lejos
del blanco las partı́culas del haz no lo perciben, y entonces supondremos que el
haz incidente está representado por una onda plana de momento definido p. Esto
implica cierta idealización ya que una onda plana real llena todo el espacio y, en
particular, se extiende hasta el infinito en la dirección transversal, mientras que los
haces reales son siempre de extensión finita en la dirección transversal. En la figura
2.2 se muestra una imagen de lo que sucede cuando la onda plana incidente golpea el
objetivo; la interacción produce la onda dispersada, que se irradia lejos del objetivo.
Si el potencial de dispersión es de corto alcance, podemos esperar intuitivamente que
parte de la onda incidente, aquella con un gran parámetro de impacto, no alcancen
el objetivo y continúen corriente abajo como una onda plana casi sin modificar.
Consideraremos dispersión elástica, en la que si las partı́culas incidentes ganan
algo de energı́a cinética al caer en el pozo de potencial creado por el blanco, la pierden
al escapar del pozo, y a grandes distancias las partı́culas dispersadas conservan su
energı́a. Sin embargo, en general van a cambiar su momento, y por lo tanto su
dirección.
Otra idealización recae en el uso de autofunciones ψ para describir el proceso
de dispersión, ya que una función propia es un estado estacionario, y los haces
reales se encienden en algún momento y se apagan en un momento posterior. Una
autofunción representa el estado estacionario idealizado que se obtendrı́a si una onda
plana pudiera dirigirse contra un objetivo para todos los tiempos desde t → ∞.
Otro problema es que las autofunciones de energı́a positiva no son normalizables,
por lo que no pueden representar el estado de una sola partı́cula. Tratamos con este
problema en estas notas interpretando la densidad ρ = |ψ|2 , no como una densidad
de probabilidad, sino como una densidad de partı́culas en el haz.
mayor que la del proyectil (mB " mA ), la masa reducida coincide
aproximadamente con la del proyectil (mA ≈ m) y los sistemas CM y
del laboratorio (sistema L) son, a los efectos prácticos, idénticos.
Consideremos ahora el caso cuántico. Dado un haz de partı́culas A
que incide según el eje z, como en la figura, pretendemos calcular la
probabilidad de que las partı́culas sean dispersadas dentro de un cono
con ángulos polares (θ, ϕ) y una abertura del cono de ángulo sólido dΩ:
Dispersión de partı́culas 51

detector

dA
dΩ
haz dispersado
r

θ
haz incidente
z

Figura 2.1: Un detector de partı́culas intercepta partı́culas que se dispersan dentro


de unHablamos
pequeño ángulo
de “hazsólido dΩ.
incidente” porque en una experiencia real en
que inciden muchas partı́culas idénticas debemos considerar un flujo de
Del mismo
partı́culas modo, interpretamos
incidentes la corriente,
que en un diferencial de tiempo dt atraviesa un
" ! #
∗ iℏ∇
J = Re ψ − ψ , (2.3)
m
como una corriente de partı́culas, no una corriente de probabilidad. La normalización
general de la función de onda ilimitada es arbitraria y representa simplemente la
intensidad del haz. Las cantidades de interés, como la sección eficaz diferencial, son
independientes de esta normalización.
La solución ψ debe tener las condiciones de contorno correctas a grandes dis-
tancias del centro dispersor de manera de representar tanto la onda plana incidente
como la onda dispersada. Definimos la onda incidente por
ψi = eik·r (2.4)
que se entiende que está presente en todo el espacio, incluso en zonas de |r| chico,
donde el potencial V está activo. La onda incidente está parametrizada por un vec-
tor de onda k o un momento equivalente p = ℏk. En general esta onda incidente no
satisface la ecuación de Schrödinger (5.4) en todo el espacio, pero, al suponer que
V (r) decae lo suficientemente rápido, lo podemos ignorar lejos del centro dispersor.
Esto se aplica también a grandes distancias, cerca del detector y luego de ser dis-
persado el haz. Entonces, a grandes distancias, en todo el espacio, la onda incidente
satisface la ecuación de Schrödinger (5.4) y, posee una energı́a
ℏ2 k2
E= (2.5)
2m
52 2.1 Condiciones de Contorno

Para un vector de onda incidente k dado, el efecto del potencial será dispersar esta
onda, de manera que en el detector, a grandes distancias del potencial, la función
de onda será
ψ|r|→∞ ∼ ψi + ψd = eik·r + ψd (2.6)
donde ψd representa el efecto del potencial dispersor. De acuerdo con la imagen de
la figura 2.2, requerimos que a grandes distancias la onda dispersada sea puramente
saliente, es decir, que sea una onda esférica que se propague en dirección radial,
pero que el efecto de la dispersión dependa de los ángulos (θ, φ) . Por esta razón
suponemos que la forma asintótica de la función de onda será

eikr
ψ|r|→∞ ∼ eik·r + fk (θ, φ) . (2.7)
r
Suponiendo que V (r) puede ignorarse a grandes distancias y observando que la
ecuación solo se aplica asintóticamente, requerimos que la onda dispersada satisfaga
la ecuación de Schrödinger para partı́culas libres a orden dominante en 1/r, lo cual
se verifica debido a que
eikr ikr
" # " #
2 e 1
 
2
∇ fk (θ, φ) = −k fk (θ, φ) + O 3 , (2.8)
r r r
donde el termino dominante proviene del término radial del Laplaciano en coorde-
nadas esféricas1
Las condiciones de contorno están completamente parametrizadas por el vector
de onda incidente k, que también determina el valor de la energı́a E a través de la
relación (2.5). Una misma energı́a incidente puede obtenerse con muchas números
de onda diferentes, variando su dirección. La familia está parametrizada por puntos
en una esfera (la dirección de k). (En la dispersión unidimensional, esta familia se
reduce a dos miembros, ondas de dispersión que inciden desde la derecha o desde
la izquierda). Por esta razón, de ahora en adelante denotaremos las soluciones de
dispersión de la ecuación de Schrödinger ψk , donde se entiende que k y el valor
propio de la energı́a E están conectados por la relación de partı́culas libres (2.5).
Es plausible que para cada k existe una única solución a la ecuación de Schrödin-
ger con energı́a (2.5) y que satisface las condiciones de contorno (2.7). Este es un
hecho que se puede probar con la teorı́a de las ecuaciones integrales de Fredholm.
Observamos que en la teorı́a de la dispersión las únicas cantidades que son intere-
santes fı́sicamente son aquellas definidas por las propiedades asintóticas (r grande)
1
El Laplaciano en coordenadas esféricas posee la forma
∂2ψ
   
2 1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1
∇ ψ= 2 r + 2 sin θ + 2 2 . (2.9)
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
Dispersión de partı́culas 53

282 Chapter 13 Scattering

t= 0

Figure 13.2. Scattering of a wave packet incident from the left with mean momentum hko.
In elastic scattering, the wave packet is scattered with equal energy but varying amplitudes
Figura 2.2: Dispersión de un paquete de ondas incidente desde la izquierda con
in different directions (indicated by the thickness of the arrows). In the forward direction,
impulso the
medio
scattered 0 . En
ℏkwave la dispersión
interferes elástica,
with the advancing el paquete
incident wave. de ondas se dispersa con
igual energı́a pero con amplitudes variables en diferentes direcciones (indicadas por
el grosorof-mass
de las frame
flechas). En la dirección de avance, la onda dispersada interfiere con
in which the total momentum of the system is zero, or with the use
la onda of
incidente que avanza.
relative coordinates appropriate to the interaction between two particles. The cross
section depends on the collision parameters (incident energy, polarization, etc.) and
the particular variables (scattering angle, energy loss, etc.) which quantify the out-
come X. If these variables are denoted by x in the theoretically preferred frame-of-
reference, a transformation to the corresponding variables, x', in the laboratory
frame must be carried out. Formally, the differential cross-sections in the two frames
are related by
dax = dax dx
(13.6)
dx' dx dx'
This relation cautions us that the two differential cross sections do not have the same
value. A numerical example at the end of this section illustrates this for the angular
distribution.
We now turn to the theoretical calculation of a scattering cross section. In an
idealized scattering process, a single fixed scattering center or target particle is bom-
barded by particles incident along the z axis. It is assumed that the effect of the
scattering center on the particles can be represented by a potential energy V(r) which
is appreciably different from zero only within a finite region. Although this as-
sumption excludes as common a long-range force as the Coulomb field, represented
by a potential proportional to 1/r and observable as Rutherford scattering, this lim-
itation is not severe. In actual fact, the Coulomb field is screened at large distances
by the presence of electrons in atoms and by other particles, and for large r the
potential falls off faster than 1/r.
54 2.2 Amplitud de dispersión y sección eficaz

de la función onda. Esto se aplica a la sección transversal diferencial, que es lo que


normalmente se mide en experimentos reales.

2.2. Amplitud de dispersión y sección eficaz


La función fk (θ, φ) se denomina amplitud de dispersión. Es en general una fun-
ción compleja de los ángulos. El objetivo de la teorı́a de la dispersión es su determi-
nación, ya que guarda una relación simple con la sección eficaz diferencial.
Imaginemos una situación experimental como la ilustrada en la figura 2.1. Un
detector, ubicado a cierta distancia del dispersor, intercepta todas las partı́culas
dispersadas dentro de un pequeño cono de ángulo sólido ∆Ω, centrado en alguna
dirección k̂ = (θ, φ).
El flujo incidente es

ℏ ℏk
Ji = (ψi∗ ∇ψi − ψi ∇ψi∗ ) = k̂ ≡ vi k̂ (2.10)
2mi m
con vi = ℏk/m nes la velocidad de las partı́culas incidentes. En cuanto al dispersado,
toma la forma, a grandes distancias2

2

ℏ ℏ
Jd = [ψd∗ ∇ψd − ψd ∇ψd∗ ) = 2
|fk (θ, φ)|2 iker
2mi 2mi r
∂fk∗ (θ, φ)
!
1 ∗ ∂f k (θ, φ)
+ 3 fk (θ, φ) − fk (θ, φ) eθ +
r ∂θ ∂θ

! #
1 ∂f k (θ, φ) ∂f (θ, φ)
f ∗ (θ, φ) − fk (θ, φ) k eφ (2.12)
r3 sin θ k ∂φ ∂φ

A grandes distancias es el término radial el que domina por lo que podemos


escribir
ℏk 1 1
Jd ∼ |fk (θ, φ)|2 2 er = vi |fk (θ, φ)|2 2 er (2.13)
m r r
A partir del flujo dispersado podemos calcular el número de partı́culas dispersadas
por unidad de tiempo que atraviesan el detector,

dN = Jd · dA = Jd · er r2 dΩ = vi |fk (θ, φ)|2 dΩ. (2.14)


2
En coordenadas esféricas el gradiente se escribe

∂ψ 1 ∂ψ 1 ∂ψ
∇ψ(r, θ, φ) = er + eθ + eφ . (2.11)
∂r r ∂θ r sin θ ∂φ
Dispersión de partı́culas 55

Al dividir esta cantidad por el flujo de partı́culas incidentes se obtiene el diferencial


de la sección eficaz de dispersión,
dN
dσ ≡ = |fk (θ, φ)|2 dΩ (2.15)
Ji
La sección eficaz diferencial, que mide el número de partı́culas dispersadas por uni-
dad de flujo incidente y por unidad de ángulo sólido, se obtiene dividiendo por el
elemento de ángulo sólido

= |fk (θ, φ)|2 (2.16)
dΩ
Si se mide la sección eficaz diferencial en un experimento, se puede determinar el
módulo de la amplitud de dispersión y, de él, tener idea de la función de onda de las
partı́culas dispersadas. Notemos que fk (θ, φ), además de depender de los ángulos
(θ, φ), en general depende de k, y por lo tanto, de la energı́a de las partı́culas
incidentes.
La sección eficaz total, σ, se obtiene integrando sobre todos los ángulos sólidos,
ˆ
σ = dΩ |fk (θ, φ)|2 . (2.17)

y refleja la probabilidad total de que una partı́cula sea dispersada, dividida por el
flujo de probabilidad incidente.

2.3. Funciones de Green


Para completar la discusión, deberı́amos mostrar que efectivamente existen au-
tofunciones de la forma (2.7). Esto puede hacerse construyendo explı́citamente so-
luciones ψk (r). Consideremos la ecuación de Schrödinger independiente del tiempo
para un problema como el que nos ocupa. Es decir,
ℏ2 2
− ∇ ψ(r) + V (r)ψ(r) = Eψ(r) (2.18)
2m
donde V (r) es el potencial dispersor. Escribiendo
ℏ2 k 2 2mV (r)
E= u(r) = (2.19)
2m ℏ2
tendremos  
∇2 + k 2 ψk (r) = u(r)ψk (r) (2.20)
En este punto, introducimos la función de Green asociada al problema libre, en
ausencia de potencial:
 
∇2 + k 2 Gk (r, r ′ ) = −4πδ (3) (r − r ′ ) (2.21)
56 2.3 Funciones de Green

Aquı́ hemos supuesto que la función de Green depende sólo de k y no de su dirección,


lo que mostraremos a la brevedad. Conocemos además la solución de la ecuación
homogénea correspondiente a una onda plana:
 
∇2 + k 2 ψk0 (r) = 0 =⇒ ψk0 = eik·r (2.22)

Con esto, podemos escribir la solución general de (2.20) en la forma


ˆ
1
ψk (r) = eik·r
− d3 r′ Gk (r, r ′ ) u (r ′ ) ψk (r ′ ) (2.23)

Hemos pasado de esta manera del problema de resolver una ecuación diferencial,
(2.18), al problema de resolver la ecuación integral. Veremos que la solución, que
será iterativa, nos permitirá en particular, calcular fk (θ, φ) y ası́ podremos calcular
la sección eficaz de dispersión.

2.3.1. Cálculo de la función de Green


Proponemos para Gk (r, r ′ ) = Gk (r − r ′ ) un desarrollo de Fourier de la forma
ˆ

Gk (r) ≡ d3 k ′ gk (k ′ )eik ·r (2.24)

de manera que, si además introducimos la representación de la delta de Dirac,


ˆ
1 ′
(3)
δ (r) = 3
d3 k ′ eik ·r (2.25)
(2π)

obtenemos
1 1
gk (r) = ′2
. (2.26)
2π k − k 2
2

Sólo nos resta realizar la transformada para obtener Gk (r),


ˆ
1 1 ′
Gk (r) = 2 d3 k ′ ′2 eik ·r (2.27)
2π k −k 2

Dado que todo el integrando es invariante frente a rotaciones, podemos elegir el


sistema de coordenadas de manera tal que r coincida con la dirección del eje ẑ (de
la variable de integración k′ ), la exponencial entonces se simplifica a
ˆ
1 1 ′ ′
Gk (r) = 2 k ′2 dk ′ sin θ′ dθ′ dφ′ ′2 eik r cos θ (2.28)
2π k −k 2
Figure 13.5). The poles of the integrand are at

k' = +VJ?-
- + i1'/ "'" +(k
- + 2k
i1'/)

for small 1'/. The path of integration leads along the real axis from - 00 to + 00.
Since r is necessarily positive, a closed contour may be used if we complete
the path by a semicircle of very large radius through the upper half k' -plane. It
encloses the pole in the right half plane. The result of the integration is not altered
Dispersión
by introducing detours avoiding the two de k' = +k and k' = -k, as indicated
partı́culas
points 57

Imk'

,,"
.". ... -- ---- ----- ......... ....
.... .
/"""" "
"
;
"....
,
;
;
;
..
,, , "",,
I
I ,
\

\
I

I
f \
I \

,,
I
,,
\

,
I I
I
----'------L-_:---I.----+---.,----+---r--_-...L.--Re k'
o
X.
-k- 17J
2k
Figure 13.5. Path of integration in the complex k' plane.
Figura 2.3: Camino de integración en el plano complejo k ′ .

donde θ′ es el ángulo que forma k con el eje z. Luego de integrar trivialmente sobre
φ′ y sobre θ′ , llegamos a
ˆ ∞
i 1 h ′
−ik′ r
i
Gk (r) = k ′ dk ′ ′2 e ik r
− e
πr 0 k − k2
ˆ ∞ ik′ r (2.29)
1 ′ ′ e
= k dk ′2
iπr −∞ k − k2
Esta es una integral que tiene singularidades en el camino de integración. Se trata
de un problema que tiene una solución muy simple en la teorı́a de una variable
compleja y que consiste en deformar ligeramente el camino de manera de esquivar
los polos. Alternativamente se pueden desplazar esos polos del eje real.
ˆ ∞ ′
± 1 ′ ′ eik r
Gk (r) = k dk ′2
iπr −∞ k − (k 2 ± iε)
ˆ ∞ ′ (2.30)
1 ′ ′ eik r
= k dk √   √ 
iπr −∞ k ′ − k 2 ± iε k ′ + k 2 ± iε

Si consideramos que k ′ es una variable compleja con parte imaginaria positiva, eik r
decrece exponencialmente cuando r → ∞. En tal caso, si consideramos un camino
de integración en el semiplano positivo como el de la figura 2.3, la integral sobre el
semicı́rculo se anula.
Los polos corresponden a los valores de k ′ tales que

√ 

  
k = ± k ± iε ≈ ±k 1 ± 2 + O ε2 .
2 (2.31)
2k
58 2.3 Funciones de Green

Para el caso en que se suma +ε a la parte imaginaria los polos están en k ′ = k + iε̄ y
en k ′ = −k − iε̄ por lo que, en el camino de la figura 2.3 solo contribuye el primero.
En este caso se obtiene fácilmente, utilizando el teorema de Cauchy,
eikr
G+
k (r) = (2.32)
r
Análogamente, para el caso en que se suma −ε solo contribuye el polo que co-
rresponde a k ′ = −k + iε y se obtiene
e−ikr
G−
k (r) = (2.33)
r
Lo mismo se hubiera obtenido de considerar un camino en el semiplano inferior.
Tenemos entonces para la solución (2.23),
ˆ ±ik|r−r ′ |
± 1 3 ′e
ψk (r) = eik·r
− dr u (r ′ ) ψk± (r ′ ) (2.34)
4π |r − r ′ |
Que existan dos soluciones se debe a que la ecuación a resolver es de segundo
orden. Debemos entonces elegir la solución que se adecue a la condición de contorno
que impusimos, i. e. a una onda esférica saliente a grandes distancias. Es fácil con-
vencerse que, para r → ∞, es la solución ψk+ la que tiene el buen comportamiento.
En efecto, desarrollando el argumento del exponencial se tiene

k|r − r ′ | = k r2 − 2rr′ cos α + r′2 (2.35)
!1/2
2r′ r′2
= kr 1 − cos α + 2 (2.36)
r r

!
r·r 1
 
≈ kr 1 − 2 +O 2 (2.37)
r r
de manera que
ˆ
1 e±ikr ′ ′
ψk± (r) ik·r
=e − d3 r′ e∓ik ·r u (r ′ ) ψk± (r ′ ) (2.38)
4π r
donde hemos llamado k′ = k r̂. Tenemos entonces como solución acorde con las
condiciones de contorno a aquella que se escribe
ˆ
1 eikr ′ ′
+
ψk (r) = eik·r
− d3 r′ e−ik ·r u (r ′ ) ψk+ (r ′ ) . (2.39)
4π r
De esta expresión podemos identificar a la amplitud de dispersión fk (θ, φ), ya que
la habı́amos definido ası́:
eikr
ψr→∞ ∼ eik·r + fk (θ, φ) . (2.40)
r
Dispersión de partı́culas 59

Tendremos entonces
ˆ
m ′ ′
fk (θ, φ) = − d3 r′ V (r ′ ) ψk+ (r ′ ) e−ik ·r . (2.41)
2πℏ2

2.4. Aproximación de Born


Evidentemente, como no hemos resuelto la ecuación, no conocemos ψk+ por lo que
no conocemos fk (θ). Podemos sin embargo hacer una primera aproximación (llamada
de Born) que consiste, sin más, en tomar a ψk+ como la onda plana incidente. En tal
caso tendremos
ˆ
(1) m ′ ′ m
fk (θ, φ) = − 2
d3 r′ V (r ′ ) ei(k−k )·r = − V (k − k′ ) (2.42)
2πℏ 2πℏ2

donde V (q) es la transformada de Fourier del potencial evaluada en el momento


transferido q = k − k′ . Insertando este resultado en la fórmula (2.16),


= |fk (θ, φ)|2 (2.43)
dΩ
obtendremos la sección eficaz diferencial en la aproximación de Born
ˆ 2
dσ (0) 2 m2 3 ′ ′ i(k−k′ )·r ′
= fk (θ, φ) = 2 4 d r V (r ) e (2.44)
dΩ 4π ℏ

Notemos que en la aproximación de Born es conveniente considerar a la sección


eficaz diferencial, no como una función de los ángulos θ, φ, sino como función del
momento transferido q = k − k′ , como se ilustra en la figura 2.4.
En particular, para un potencial esféricamente simétrico, de
ˆ

dΩ eiq·r = sin qr (2.45)
qr

obtenemos ˆ ∞

V (q) ≡ V (q) = dr V (r)r sin qr (2.46)
q 0

Por lo tanto, la amplitud de dispersión sólo depende q ≡ |q| (recordar que k ′ = k):
h i1/2 θ
q = |k − k′ | = 2k 2 (1 − cos θ) = 2k sin (2.47)
2
El ángulo θ está ilustrado en la figura 2.4.
solo depende de q = lql (recordar que k' = k):
q = lk- k'I . J 2k 2 (1 - cos 0)] 112 = 2k sin;, (2.54)

~El. ángulo-0.. está ilustrado [Link] figura 2.6. Notemos que-en la aproximación de Bornes .
n -- •-···-·
conveniente considerar a la sección eficaz diferencial, no como una función del ángulo 0,
60 sino como función del momento transferido ·q. de Born
2.4 Aproximación

Fig. 2.6. El impulso transferido es q = k - k'.


Como ejemplo analizamos al potencial de Yukawa,
−µr
Como ejemplo analizamos al potencial e Yukawa,
V (r) = Vde
0 , (2.48)
µr
(2.55)
donde: (i) V0 no depende de r y (ii) a la cantidad 1/µ se la puede considerar como el
alcance del potencial, ya que V (r) tiende rápidamente a cero para r ≫ 1/µ. Usando
ˆ ∞ ˆ ∞ !
−µr −µr+iqr 1 q
e sin qrdr = Im e dr 48
= Im = 2 (2.49)
0 0 −µ + iq µ + q2

obtenemos,
2mV0 1
f (1) (q) = − (2.50)
µℏ q + µ2
2 2

que insertando en (2,16) da lugar a la fórmula:


!2 !2
dσ 2mV0 1
= (2.51)
dΩ µℏ2 4k 2 sin2 2θ + µ2

Es interesante observar que si µ → 0, al mismo tiempo que V0 /µ → ZZ ′ e2 , el


potencial de Yukawa se se reduce al potencial Coulombiano, y
!2
dσ 1 ZZ ′ e2 1
= θ (2.52)
dΩ 16 Ecin sin4 2

donde Ecin = ℏ2 k 2 /2m. El último resultado es precisamente la sección eficaz para


la dispersión de Rutherford que se obtiene clásicamente. (Ha desaparecido ℏ !) Sin
embargo, la obtención del resultado correcto es accidental, ya que la ec. (2.51) no es
válida para el potencial Coulombiano cuyo alcance es infinito.
Remarquemos las siguientes propiedades de la amplitud f (1) cuando se trata de
un potencial central:

1. f (1) depende solamente de q.

2. f (1) es siempre real. Notemos que esto lleva, en principio, a una dificultad
con respecto al teorema óptico (2.83). Como éste esencialmente expresa la
Dispersión de partı́culas 61

conservación del número de partı́culas, se dice que la aproximación de Born


no es conservativa. Sin embargo, la aproximación de Born es consistente, por
lo siguiente: f (1) es de orden V , luego σ es de orden de V 2 , y por lo tanto
según (2.83) la parte imaginaria de fk (θ, φ) también tendrá que ser de orden
V 2.

3. dΩ
no depende del signo del potencial.
′ ′
4. Para k pequeños [de (2.42) con ei(k−k )·r ≃ 1]
ˆ
m
(1)
f = − 2 V (r)r2 dr (2.53)


y dΩ
es isotrópica.

5. f (1) es pequeña para valores grandes de q, debido a las oscilaciones rápidas


oscilaciones del integrando en (2.46).

Vamos a discutir ahora brevemente la validez de la aproximación de Born de


primer orden. De la deducción de la misma es obvio que será aplicable cuando
(+)
ψk (r) no sea muy diferente de ϕk (r) dentro del rango del potencial. En otras
palabras la modificación de la onda incidente tiene que ser pequena. De la ecuación
integarl, ec. (2.23) vemos que esta condición se satisface en el centro del potencial
dispersor (r = 0) cuando:
ˆ ikr′
m 1 ′e ′ ik·r ′
dr V (r ) e ≪ 1. (2.54)
ℏ2 2π r′

En particular, en el caso del potencial de Yukawa (2.48), y para bajas energı́as



(k ≪ µ) cuando es legı́timo reemplazar eik·r por 1 , resulta
Es interesante comparar este resultado con la condición para que el potencial de
Yukawa desarrolle un estado ligado, que es:
2m |V0 |
⩾ 2,7, (2.55)
ℏ2 µ2
con V0 = 0. En otras palabras, si el potencial es lo suficientemente atractivo como
para desarrollar un estado ligado, la aproximación de Born probablemente llevará a
un resultado incorrecto.
Se puede demostrar que, para el potencial de Yukawa, la condición para que el
segundo término de (2.23) sea pequeño, en el lı́mite de k grande implica
!
2m |V0 | k
2
ln ≪ 1. (2.56)
ℏ µk µ
62 2.5 Ondas parciales

2.5. Ondas parciales


El problema de la dispersión que estamos considerando no es más que la búsqueda
de soluciones de la ecuación de Schrödinger con energı́a positiva y que satisfacen las
condiciones de contorno (2.7). Concentrémonos en potenciales con simetrı́a esférica,
es decir, que depende sólo de |r| = r, V = V (r), para los cuales la ecuación de
Schrödinger es separable en coordenadas esféricas, y las soluciones pueden escribirse
en la forma
ψklm (r) = ψklm (r, θ, φ) = Rkl (r)Ylm (θ, φ), (2.57)
donde Ylm (θ, φ) son los armónicos esféricos, y

ukl (r)
Rkl (r) = , (2.58)
r
donde ukl es solución de la ecuación radial,
!
d2 2m l(l + 1)
− 2 + 2 V (r) + − k 2 ukl (r) = 0, (2.59)
dr ℏ r2

que satisface
ukl (0) = 0. (2.60)
Aquı́ hemos parametrizado a la energı́a positiva usando (2.5). En los problemas de
dispersión, tı́picamente V (r) es de rango finito b (es decir, que V (r) ≃ 0 para r > b
y por lo tanto puede despreciarse), y entonces para r grande las soluciones son de
la forma
Rkl (r) = Al jl (kr) + Bl nl (kr), r ⩾ b, (2.61)
donde jl y nl son las funciones de Bessel esféricas, relacionadas con las funciones de
Bessel de primera y segunda especie (o función de Neumann):

π
r
jl (x) = Jl+1/2 (x), (2.62)
2x
π
r
nl (x) = Nl+1/2 (x). (2.63)
2x
Al y Bl son dos constantes que deberı́an determinarse (para cada l) para que la
solución sea continua y bien comporatada en todo el espacio, para lo cual se necesi-
tarı́a resolver la ecuación para r < b, lo cual es muy engorroso. Para evitar este paso
concentrémonos en el comportamiento asintótico de la solución radial en r ⩾ b, que
es de la forma
sin(kr − lπ/2) cos(kr − lπ/2)
Rkl (r) = Al (k) − Bl (k) , r ⩾ b. (2.64)
kr kr
Dispersión de partı́culas 63

sin(kr − lπ/2) sin(kr − lπ/2 + δl )


for δl > 0

Figura 2.4: δl > 0 implica que la onda asintótica es empujada hacia adentro, mientras
que para δl < 0 es empujada hacia afuera.

Si el problema fuera el de una partı́cula libre, la solución (2.61) serı́a válida para
todo r y no sólo en forma asintótica. En este caso deberı́amos tomar Bl = 0 ya que
la función nl es divergente en el origen y buscamos soluciones regulares. La presencia
de un Bl no nulo viene determinada por el potencial, y cuanto más intenso sea éste,
mayor la dispersión que produce y más importante el Bl . Si escribimos en (2.61)

Bl = −Al tan δl (2.65)

obtenemos
sin(kr − lπ/2 + δl )
Rkl (r) ≃ Cl (2.66)
kr
donde Cl = Al / cos δl es otra constante. Observamos que el comportamiento asintóti-
co de la onda parcial l es el mismo que el de la partı́cula libre, pero con una fase
corrida en δl . Por ello δl se denomina corrimiento de fase producido por el potencial.
Estos corrimientos de fase (o phase shifts en inglés) dependen de la energı́a, o del
número de onda k en módulo. Veremos que la amplitud de dispersión y por lo tanto
las secciones eficaces ¡sólo dependen de los corrimientos de fase! y por lo tanto éstos
poseen toda la información que nos interesa. Entonces, en lugar de resolver la ecua-
ción diferencial completa para todos los valores de r, utilizaremos las expresiones
asintóticas (2.61), a las que le impondremos las condiciones de contorno.
Dado que en ausencia de potencial la función radial es
sin(kr − lπ/2)
Rkl (r) ∝ (2.67)
kr
Observamos que el efecto del potencial consiste en “empujar hacia dentro” a la
función de onda cuando δl > 0 o “empujarla para fuera” cuando δl < 0 (ver la figura
2.4).
La solución más general posible de energı́a definida (k fijo) es la superposición
X
ψk (r) = aklm Ylm (θ, φ)Rkl (r). (2.68)
lm
64 2.5 Ondas parciales

y resta encontrar los coeficientes aklm imponiendo las condiciones de contorno en


|r| → ∞, ecuación (2.7). El problema que se nos presenta es que la función de onda
incidente está expresada como una onda plana eik·r que es una solución de partı́cula
libre de la ecuación de Schrödinger que se obtiene separando la ecuación de onda en
coordenadas rectangulares, mientras que las soluciones (2.61) y (2.57) se obtienen
separándola en coordenadas esféricas. Para poder imponer condiciones de contorno,
necesitamos que todo esté expresado en el mismo lenguaje, y comparar bananas
con bananas. Esto es posible, ya que siendo ambas formas soluciones de la misma
ecuación, la onda plana incidente debe poder expresarse como una combinación lineal
de las soluciones (2.57) junto con (2.61). Vamos a omitir los detalles, y simplemente
escribir la expansión de la onda plana en armónicos esféricos. El lector interesado
puede consultar la Referencia [11] donde se muestra que

eik·r = 4π il Ylm
X
(k̂)jl (kr)Ylm (r̂). (2.69)
lm

Si además utilizamos el teorema de adición para los armónicos esféricos,


4π X ∗
Y (k̂)Ylm (r̂) = Pl (k̂ · r̂) = Pl (cos γ), (2.70)
2l + 1 m lm

donde γ es el ángulo entre r y k, y Pl son los polinomios de Legendre, obtenemos


para la onda plana la expansión

eik·r = il (2l + 1)jl (kr)Pl (cos γ).


X
(2.71)
l

Tomemos al vector incidente k en la dirección del eje polar, por ser el eje de
simetrı́a rotacional del sistema. En tal caso, k · r → kr cos θ = kz. En ese caso,
además, el ángulo γ se reduce al ángulo θ, y entonces

eikz = il (2l + 1)jl (kr)Pl (cos θ).


X
(2.72)
l

Escribimos ahora la condición de contorno (2.7) expresada como expansión en


ondas esféricas,

eikr
il (2l + 1)jl (kr)Pl (cos θ) + fk (θ)
X
ψ|r|→∞ ∼ , (2.73)
l r

que utilizando la forma asintótica para jl se escribe

sin(kr − lπ/2) eikr


il (2l + 1)
X
ψ|r|→∞ ∼ Pl (cos θ) + fk (θ) . (2.74)
l kr r
Dispersión de partı́culas 65

Por otro lado, la forma asintótica de la solución general (2.75), para k en la dirección
del eje z es
X sin(kr − lπ/2 + δl )
ψk (r, θ) = akl Pl (cos θ) , r grande. (2.75)
l kr

donde reemplazamos la parte radial por su forma asintótica.


Igualando los coeficientes de e−ikr Pl (cos θ) en los lados derechos de (16,37) y
(16.39) obtenemos
−(2l + 1)il = −e−iδl (k) alk , (2.76)
o
alk = (2l + 1)il eiδl (k) . (2.77)
Si ahora igualamos el coeficiente de eikr ,
∞ ∞
X 2l + 1 X 2l + 1 2iδl (k)
Pl (cos θ) + fk (cos θ) = e Pl (cos θ) (2.78)
l=0 2ik l=0 2ik

obtenemos una expresión explı́cita para fk (θ) en términos de los corrimientos de


fase: ∞
1X
fk (θ) = (2l + 1)eiδl (k) sin δl (k)Pl (cos θ) (2.79)
k l=0
de manera que la sección eficaz diferencial toma la forma

dσ 1 X
= |fk (θ)|2 = 2
(2l + 1) (2l′ + 1) eiδl (k) e−iδl′ (k)
dΩ k l,l′ =0 (2.80)
sin δl (k) sin δl′ (k)Pl (cos θ)Pl′ (cos θ)

La integral sobre Ω de esta sección eficaz diferencial da la sección eficaz total. Uti-
lizando la ortogonalidad de los polinomios de Legendre se obtiene finalmente:
ˆ ˆ 1 ∞
dσ dσ 4π X
σ = dΩ = 2π du = 2 (2l + 1) sin2 δl (k) (2.81)
dΩ −1 dΩ k l=0

Vemos que hemos obtenido una expresión muy simple para la sección eficaz de
dispersión en términos de los corrimientos de fase,

4π X
σ= (2l + 1) sin2 δl (k), (2.82)
k 2 l=0

Si comparamos esta expresión con la ec. (16.43) que da fk (θ), se tiene la importante
relación

σ= Im fk (θ = 0) (2.83)
k
66 2.5 Ondas parciales

Este resultado se conoce como el teorema óptico y refleja la conservación de la


probabilidad. Se llama ası́ por la analogı́a con lo que sucede con la luz cuando
atraviesa un medio. En efecto, cuando las ondas electromagnéticas inciden sobre un
centro dispersor, la sección eficaz del mismo es proporcional a la parte imaginaria de
la amplitud de dispersión de la onda. El cálculo que lleva a esta relación se hace a
partir de la potencia total absorbida por el centro dispersor, que a su vez se obtiene
de los vectores de Poynting de las ondas incidente y dispersada.
La sección eficaz total puede escribirse como

4π 4π 1
(2l + 1) sin2 δl (k) = 2 (2l + 1)
X
σ= σl , σl = . (2.84)
l=0 k 2 k 1 + cot2 δl (k)

La segunda forma será utilizada con asiduidad en estas notas. La cantidad σl es


la sección eficaz parcial para la dispersión de la partı́cula en el estado l de impulso
angular. Notemos que la sección eficaz total σ no hay interferencia entre las diferentes
ondas parciales; este efecto, en cambio, está presente en la sección eficaz parcial
dσ/dΩ.

4π(2l + 1)
σl ⩽ 2
= 4π(2l + 1)λ̄2 (2.85)
k
Para visualizar el significado fı́sico de las ondas parciales es conveniente pensar
por un momento en términos clásicos, dividiendo el haz de partı́culas incidentes en
zonas cilı́ndricas de radios: (l + 1)λ̄ = λ̄, 2λ̄, 3λ̄ · · · (λ̄ = 1/k), como se muestra en
la Fig. (2.5). Todas las partı́culas con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l3 y

σlclásica ⩽ π(2l + 1)λ̄2 (2.87)

ya que π(2l + 1)λ̄2 es la superficie del anillo l-ésimo.


Comparando este último resultado con (2.160) vemos que la sección eficaz clásica
es menor en un factor 4. Esto se debe a la inevitable presencia de efectos de difracción
para los cuales es responsable la naturaleza ondulotoria de la materia; más detalles
se darán al discutir la dispersión por una esfera rı́gida.
Si el alcance del potencial es b, clásicamente habrá dispersión en el anillo l cuando
lλ̄ ⩽ b. De ahı́ se puede inferir que en caso cuántico y para un potencial de corto
alcance:
3
Como la dimensión transversal de una onda plana es infinita, es de esperar que contenga todos
los posibles valores del parámetro de impacto

ℓ = lℏ/p = lλ̄ (2.86)


Dispersión de partı́culas 67

Figura 2.5: Las partı́culas con con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l. El alcance del potencial es b.

contribuirá solamente un número limitado de ondas parciales con lmáx = kb,


si para un dado l es λ̄l ≫ b, será σl ≃ 0,
si λ̄ ≫ b solo σl=0 será apreciable (energı́as bajas),
si λ̄ ≪ b contribuyen todas las ondas parciales (energı́as altas).

2.5.1. Determinación de corrimientos de fase


Veamos como se determinan los δl (k) a partir de un potencial V . Supondremos
que V se anula para r > b, siendo b el rango del potencial. Para para r > b) la
función de onda tiene una forma asintótica que es superposición de ondas esféricas:
1 X l
ψk (r) = i (2l + 1)Rkl (r)Pl (cos θ) (r > b) (2.88)
(2π)3/2 l
con
Rkl (r) = Cl [cos δl (k)jl (kr) − sin δl (k)nl (kr)] . (2.89)
En la zona interior tendremos que resolver la ecuación radial de Schrödinger de ma-
nera aproximada, analı́ticamente, numéricamente, etc. Supongamos haber obtenido
tal solución Rkl (r) para 0 < r < b. En r = b, la función Rkl (r) y su derivada deben
ser continuas. Introducimos, entonces, la derivada logarı́tmica interior
!
1 dRkl (r)
αl (k) ≡ (2.90)
Rkl (b) dr r=b

que podemos evaluar por medio de (2.89):


cos δl (k)jl′ (kb) − sin δl (k)n′l (kb)
αl (k) = k (2.91)
cos δl (k)jl (kb) − sin δl (k)nl (kb)
68 2.5 Ondas parciales

que si conocemos las derivadas logarı́tmicas en r = b, podemos invertir y el corri-


miento de fase δl (k)
αl (k)nl (kb) − kn′l (kb)
cot δl (k) = . (2.92)
αl (k)jl (kb) − kjl′ (kb)
Esto significa que los corrimientos de fase dependen del potencial solamente por
medio de las derivadas logaritmicas correspondientes. Es más, la elección del punto
b es arbitraria (siempre que corresponda a la región donde el potencial se anula). Solo
necesitamos entonces integrar la ecuación radial desde r = 0 hasta b para obtener
los αl

Esfera rı́gida
Es interesante mencionar la dispersión por una esfera rı́gida de radio b. El po-
tencial es 
∞ para r ⩽ b
V (r) = (2.93)
0 para r > b
En este problema ni siquiera necesitamos de los αl (que valen ∞). Solamente tenemos
que saber que en r = b la función de onda se anula ya que la esfera es impenetrable.
Será Rl (r)|r=b = 0 y de (2.89),

cos δl jl (kb) − sin δl nl (kb) = 0 (2.94)

Por lo tanto conocemos los corrimientos de fase para todo l,


nl (kb)
cot δ[Link]. = , (2.95)
jl (kb)
sin haber hecho ninguna aproximación. Las secciones eficaces parciales resultan, de
(2.160) y (2.95)
4π jl2 (kb)
σl = 2 (2l + 1) 2 (2.96)
k jl (kb) + n2l (kb)
En particular para l = 0 (veremos mas adelante que la onda s, o con l = 0 es de
particular importancia a bajas energias), usando que
sin x cos x
j0 (x) = , n0 (x) = − , (2.97)
x x
hallamos
− cos kb/kb
cot δ0 (k) = = − cot kb, (2.98)
sin kb/kb
o δ0 = −kb, y
sin2 kb
σ0 = 4π (2.99)
k2
Dispersión de partı́culas 69

Figura 2.6: La función rR0 (r). La curva punteada es para V = 0 y se comporta


como sin kr. La curva sólida, desplazada en b = −δ0 /k, corresponde a la dispersión
de la onda s por la esfera rı́gida.

La función de onda radial s es, a menos de una fase,


sin kr cos kr sin (kr + δ0 )
R0 (r) ∼ cos δ0 + sin δ0 = . (2.100)
kr kr kr
Luego, si representamos u0 (r) = rR0 (r) en función de r, obtenemos una onda
sinusoidal, que comparada con la onda libre sinusoidal está corrida en b = −δ0 /k;
ver figura 2.6.

Pozo esférico finito


Consideremos ahora el potencial representado por

−V para r ⩽ b
0
V (r) = (2.101)
0 para r > b

con V0 > 0 para el potencial atractivo. La solución externa para la función de onda
estará de nuevo dada por (2.89),
>
Rkl (r) = Cl [cos δl (k)jl (kr) − sin δl (k)nl (kr)] . (2.102)

Mientras que la solución interior sólo contiene a la jl pues la función de Neumann


es divergente en el origen,
<
Rkl (r) = Dl jl (k̄r), (2.103)
con
1q
k̄ = 2m (E + V0 ). (2.104)

70 2.5 Ondas parciales

Observemos de (2.104) que para un potencial atractivo, V0 > 0, la función de


onda en r < b tendrá una curvatura mayor que en r > b. Podemos convencernos
fácilmente que al crecer el potencial lentamente desde cero hasta su valor final,
la función de onda tenderá a oscilar cada vez más rápidamente en la región del
potencial, como se ilustra en la figura 2.7, y disminuir su longitud de onda allı́. Esto
es consistente con que la onda se vea “empujada hacia adentro”, lo que ocurre para
δl > 0.
La Fig. 2.7 sugiere que un potencial atractivo puede ser lo suficientemente fuerte
como para empujar a la onda parcial l = 0 en 180◦ . Lo interesante de este caso es que,
por ser sin2 δ0 = 0, resulta: σl=0 = 0. Y si, además, la energı́a de la partı́cula incidente
es lo suficientemente baja, para que se puedan despreciar las contribuciones de las
ondas parciales con l > 0, habrá una perfecta transmisión de la onda incidente
(σ = 0). Este fenómeno se conoce como el efecto de Ramsauer-Townsen y fue
observado experimentalmente. Por ejemplo, al bombardear los átomos de los gases
raros con electrones, la sección eficaz presenta un mı́nimo pronunciado para una
energı́a incidente de ≃ 0,7 eV.
Los corrimientos de fase se obtienen igualando derivadas logarı́tmicas dentro y
fuera del potencial, o calculando la derivada logarı́tmica interior (2.90),

jl′ (k̄b)
αl (k) = k̄ , (2.105)
jl (k̄b)

e insertándola en (2.92). Resulta

k̄nl (kb)jl′ (k̄b) − kn′l (kb)jl (k̄b)


cot δl (k) = . (2.106)
k̄jl (kb)jl′ (k̄b) − kjl′ (kb)jl (k̄b)

Por ejemplo, para la onda s tenemos

bα0 (k) = k̄b cot k̄b − 1 (2.107)

y por lo tanto
kb + k̄b cot k̄b cot kb
cot δ0 (k) = . (2.108)
kb cot kb − k̄b cot k̄b

2.5.2. Matriz de dispersión


Observemos que existe otro par de soluciones linealmente independientes de la
parte radial la ecuación de Schrödinger para partı́culas libres en coordenadas esféri-
cas. Estas son las funciones de Hankel esféricas, que se definen como

hl (x) = jl (x) + inl (x) (2.109)


Dispersión de partı́culas 71

Figura 2.7: Un potencial atractivo “empuja para dentro” a la función de onda dis-
persada. Para esto, disminuye la longitud de onda dentro del pozo.
72 2.5 Ondas parciales

la de primera especie, junto con


h̄l (x) = jl (x) − inl (x) (2.110)
la de segunda especie. Su expansión asintótica es
ei(kr−lπ/2) e−i(kr−lπ/2)
hl (kr) ∼ , h̄l (kr) ∼ ; (2.111)
kr kr
hl (kr) representa entonces una onda esférica saliente, mientras que h̄l representa la
onda entrante. En esta base, podemos escribir la solución de la ecuación radial con
energı́a positiva como
h i
Rkl (r) = Dl h̄l (kr) + Sl (k)hl (kr) (2.112)
Dl y Sl son funciones de k que deben determinarse y pueden expresarse en términos
de Cl y δl . En particular,
Sl (k) = e2iδl (k) (2.113)
y es llamada la matriz de dispersión o matriz S 4 .
Observemos que
|Sl (k)| = 1 (2.114)
lo que se conoce como relación de unitariedad para la onda parcial l, e indica que
sólo puede haber un cambio de fase en la onda saliente.
Dado que los corrimientos de fase sólo dependen del potencial a través de la
derivada logarı́tmica, veamos cómo se expresa Sl mediante ésta. Si reemplazamos en
(2.91),
cos δl (k)jl′ (kb) − sin δl (k)n′l (kb)
αl (k) = k , (2.115)
cos δl (k)jl (kb) − sin δl (k)nl (kb)
los senos y cosenos por e±iδl , e introducimos a notación en términos de las funciones
de Hankel, es inmediato despejar
h̄′ (kb)
h̄l (kb) αl (k) − k h̄l (kb)
l

Sl (k) = − × ′ . (2.116)
hl (kb) αl (k) − k hl (kb)
hl (kb)

Observemos que para el caso la esfera rı́gida la derivada logarı́tmica en r = b es


infinita, y la matriz S se reduce a
[Link]. h̄l (kb)
[Link]. (k) ≡ e2iδl (k)
=− . (2.117)
hl (kb)
4
Puede llamar la atención que se la llame “matriz”. Como el potencial es central, las ondas
parciales con los distintos l se dispersan de manera independiente unas de otras, y entonces la
matriz Sl es diagonal. Para un potencial más general, las ondas parciales estarı́an acopladas, y la
matriz S tendrı́a dos ı́ndices, Sll′
Dispersión de partı́culas 73

Se deja como ejercicio mostrar que este resultado coincide con (2.95). Usando es-
te resultado para reemplazar el primer factor del lado derecho de la ec. (2.116).
Entonces
h̄′ (kb)
αl (k) − k h̄l (kb)
Sl (k) = Sl (k)[Link]. × l
h′l (kb)
. (2.118)
αl (k) − k hl (kb)
Otra forma útil de escribir la matriz S en términos de los corrimientos de fase
es la siguiente: escribimos
eiδl cos δl + i sin δl cot δl + i
Sl = e2iδl = = = (2.119)
e−iδl cos δl − i sin δl cot δl − i
con esta podemos obtener una expresión para Sl a partir de cot δl . Por ejemplo, para
el pozo finito y l = 0, usando (2.108) obtenemos

kb − ik̄b cot k̄b


S0 (k) = [Link]. (k) × (2.120)
kb + ik̄b cot k̄b
con
cot kb − i
[Link]. (k) = − (2.121)
cot kb + i

2.5.3. Extension analitica de la matriz de dispersion


Consideremos ahora un potencial atractivo y de corto alcance, de modo que
V (r) = 0 para r ⩾ b, y consideremos las soluciones de la ecuación de Schrödinger
radial [véase (2.59) y (2.58)] de energı́a negativa en la región r ⩾ b. Estas son de la
forma
Rnl (r) = Cnl hl (iκn r) (2.122)
donde hl es la función de Hankel (2.109), que posee un comportamiento asintótico
exponencialmente decreciente hl (ix) ∼ e−x /ix.5 La energı́a de estas soluciones se
parametriza como
ℏ2 κ2n
En = − (2.123)
2m
donde κn es una cantidad real. Para determinarla, y con ello los valores de las
energı́as, debemos igualar las derivadas logarı́tmicas a derecha e izquierda de la
función de onda en r = b. Se obtiene la ecuación
h′l (iκb)
αl (iκ) = iκ (2.124)
hl (iκb)
5
La función de Hankel esférica de segunda especie h̄l (x) = jl (x) − inl (x) es linealmente inde-
pendiente de la de primera especie, pero para argumento imaginario, su comportamiento asintótico
es exponencialmente creciente, h̄(ix) ∼ e+x /ix, y entonces debe descartarse en este problema.
74 2.5 Ondas parciales

cuyas soluciones son κ = κn . Es interesante destacar que si pensamos a la variable


real k extendida a todo el plano complejo,

k → k = k + iκ, (2.125)

y extendemos la matriz S para el problema de energı́as positivas (2.118), como


función de k a Sl (k), observamos que ésta posee polos para

h′l (kb)
αl (k) = k . (2.126)
hl (kb)
Como la derivada logarı́tmica interior αl es la misma para ambos problemas, esto
significa que la matriz S, pensada como una función en todo el plano complejo Sl (k)
tiene polos en cada uno de los estados ligados k = iκn .
Existe entonces una ı́ntima relación entre los estados ligados y los estados de
dispersión, y la descripción teórica que engloba tanto a las soluciones de la ecua-
ción de Schrödinger con energı́as positivas como con energı́as negativas proviene de
considerar la extensión analı́tica de la matriz de dispersión (2.113).
De (2.119),
cot δl + i
Sl = (2.127)
cot δl − i
observamos que la condición sobre el corrimiento de fase para que Sl (k) tenga un
polo es
cot δl (k) = i, (2.128)
de manera que si disponemos de los corrimientos de fase, a partir de ellos podemos
buscar los estados ligados del potencial.
Para entender fı́sicamente por qué aparecen los estados ligados como polos de Sl
volvamos por un momento al comportamiento asintótico de la función de dispersada
en el lenguaje de las funciones de Hankel (2.109), que para l = 0 es proporcional a

e−ikr eikr
+ Sl=0 (k) . (2.129)
r r
Comparémosla con la función de onda para un estado ligado para r > b
e−κL r
(2.130)
r
La existencia de un estado ligado implica que existe una solución no trivial de la
ecuación de de Schrödinger con E < 0 para un valor particular (discreto) de κL .
Podemos argumentar que e−κL r /r es como e−ikr /r excepto que k es ahora imaginario
puro. Una diferencia importante entre (2.129) y (2.130), además de k → iκL , es que
en el caso del estado ligado no tenemos el análogo de la onda incidente e−ikr /r. Lo
Dispersión de partı́culas 75

que es de interés fı́sico es el cociente entre los coeficientes de eikr /r y e−ikr /r que
es Sl=0 (k). En el caso del estado ligado podemos sostener la onda saliente (con k
imaginario) sin que exista la onda incidente. Por lo tanto el cociente es ∞, lo que
significa que Sl=0 (k) tiene un polo en k = iκL . Es decir que el estado ligado implica
un polo (que se puede mostrar que es un polo simple) sobre el eje positivo imaginario
del plano complejo de k. La región para la dispersión fı́sica corresponde a k real y
positivo (k = k) y a δ0 (k) real.
La estructura de la matriz S, sin embargo, es incluso más rica y puede contener
polos fuera del eje imaginario. Consideremos la esfera rigida, cuya matriz S es (2.117)

[Link]. h̄l (kb)


[Link]. (k) ≡ e2iδl (k)
=− . (2.131)
hl (kb)

Usando expresiones explicitas para las funciones de Hankel esféricas, obtenemos para
la extension analı́tica de los distintos valores de l,

[Link]. (k) = e−2ikb , (2.132)


kb − z1 −2ikb
[Link]. (k) = − e , z1 = i, (2.133)
kb − z1∗
(kb + z2 )(kb − z2∗ ) −2ikb √
[Link]. (k) = e , z2 = −3i − 3, (2.134)
(kb − z2 )(kb + z2∗ )
... (2.135)

Por un lado sabemos que la esfera rı́gida no pose estados ligados, y observamos que
los polos de Sl no están en el eje imaginario positivo (es facil verlo para l = 0, 1, 2
pero se puede mostrar para todo valor de l). Por otro lado, vemos que su S1 posee
polos para k = −i/b, es decir, para κ = −1/b que resulta ser negativo. S2 también
tiene polos con parte imaginaria negativa. Si los estados ligados correspondı́an a
polos en el eje k imaginario positivo, y sus funciones de onda resultaban soluciones
normalizables de energı́a negativa de la ecuación de Schrödinger, los estados con
κ < 0 corresponden a polos de la matriz S en el semiplano inferior de k. En este
caso, las soluciones de la ecuación de Schrödinger no son normalizables (divergen
exponencialmente), y por lo tanto, no son fı́sicas. En general se denominan virtuales
o antiligadas. Sin embargo, veremos que hay un tipo particular de solución del
semiplano inferior que sı́ resulta ser fı́sica y que corresponde a estados metaestables
o cuasiestacionarios, llamados resonancias. Antes de estudiarlas analicemos algunas
propiedades de la matriz S.
76 2.5 Ondas parciales

2.5.4. Propiedades de la matriz S


Discutiremos ahora algunas propiedades generales de la matriz S. Demostremos
primero que la generalización de la condición de unitariedad (2.114) es

Sl (k)Sl∗ (k∗ ) = 1 (2.136)

Para simplificar los cálculos vamos a hacer la demostración para l = 0, usando la


ecuación radial (2.59) que ahora escribimos como
2m
u′′ (k, r) − 2
V (r)u(k, r) + k2 u(k, r) = 0, u(k, 0) = 0 (2.137)

Las soluciones de de esta ecuación continen dos constantes arbitrarias, que tomare-
mos como u(k, 0) y una constante multiplicando toda la amplitud. Luego, ignorando
la segunda,

u(k, r) ∝ e−ikr − S(k)eikr (2.138)


1 −ikr
∝− e + eikr . (2.139)
S(k)

donde en la segunda lı́nea sacamos −S(k) como factor común (que ignoramos, ya
que se lo asignamos a la constante de proporcionalidad).
Consideremos el reemplazo k → −k. La ec. (2.137), incluyendo las condiciones
de contorno en r = 0, es invariante con respecto a este cambio, mientras que para
u(−k, r) obtenemos
u(−k, r) ∝ −S(−k)e−ikr + eikr . (2.140)
Vemos que (2.139) y esta son la misma solución de la misma ecuación y por lo tanto,
al igualarlas, obtenemos
Sl (k)Sl (−k) = 1 (2.141)
Del mismo modo escribimos (2.137) para k∗
2m
u′′ (k∗ , r) − V (r)u (k∗ , r) + k∗2 u (k∗ , r) = 0 (2.142)
ℏ2
y tomamos el complejo conjugado, resulta
2m
u′′∗ (k∗ , r) − V (r)u∗ (k∗ , r) + k2 u∗ (k∗ , r) = 0 (2.143)
ℏ2
donde, una vez más, u∗ (k∗ , r) es una función de k y no de k∗ . De nuevo la última
ecuación es la misma que (2.137) y (2.138) toma la forma

u∗ (k∗ , r) ∼ eikr − S ∗ (k∗ ) e−ikr , (2.144)


Dispersión de partı́culas 77

que al comparar con (2.139) nos lleva a (2.136). De (2.136) y (2.141) es fácil ver que
también se satisface la relación

Sl (−k∗ ) = Sl∗ (k∗ ) , (2.145)

Como consecuencia de estas relaciones, se verifica que:

Si Sl (k) tiene un cero para un valor complejo k1 , entonces

Sl (k) ∝ (k − k1 ). (2.146)

Luego,
Sl∗ (k∗ ) ∝ (k − k1∗ ). (2.147)
Y por lo tanto, de (2.136)

1 1
Sl (k) = ∝ . (2.148)
S ∗ (k∗ ) k − k1∗

tendrá que tener necesariamente un polo en k1∗ .

De (2.145), si Sl (k) tiene un polo para un valor complejo k1 , tendrá que tener
necesariamente otro polo en −k1∗ .

Se puede verificar inmediatamente que las expresiones (2.132)-(2.135) para la


esfera rı́gida satisfacen estas propiedades.

2.5.5. Resonancias
Para un potencial atractivo V (r), el potencial efectivo que ve la partı́cula inci-
dente es:
ℏ2 l(l + 1)
Vefec (r) = V (r) + (2.149)
2mr2
donde el último término es la barrera centrı́fuga (ver la figura 2.8). Los estados
con energı́a corresponden a los estados ligados. Sin embargo, podrı́an existir esta-
dos cuasi ligados, con energı́a positiva, dentro de la barrera, estos corresponden a
los estados resonantes. ¿Por qué cuasi ligados? En general, salvo que posean una
energı́a mayor que la barrera, las partı́culas incidentes son detenidas por la barrera
centrı́fuga. Eventualmente, sin embargo, puede atravesar la barrera por el efecto
túnel y permanecer un cierto tiempo dentro del pozo. Cuando la partı́cula incidente
llega con una energı́a próxima a la energı́a resonante tiene una mayor probabilidad
de ser atrapada en un estado cuasi-ligado. Esta mayor probabilidad, a su vez, se
verá refleja en el aumento de la sección eficaz, como veremos más adelante.
78 2.5 Ondas parciales

E ℏ2 l(l+1)
2mr 2

Vefec (r)
n
Estados resonantes r
n
Estados ligados

V (r)

ℏ2 l(l+1)
Figura 2.8: Potencial efectivo resulta de sumar el término centrı́fugo 2mr2
al po-
tencial V (r).

Al extender k al plano complejo, la energı́a tambien se vuelve compleja6 ,


iΓ ℏ2 k2 ℏ2  2 
E→E=E− = = k − κ2 + 2ikκ , (2.150)
2 2m 2m
de donde
ℏ2 ℏ2
E = (k 2 − κ2 )
, Γ = −2kκ . (2.151)
2m 2m
Para comprender el significado de cada tipo de polo en el plano k estudiamos el
comportamiento completo de la función de onda (2.112), incluyendo su dependencia
temporal. Como estamos interesados en los polos de la matriz S, donde es infinita,
sólo tenemos en cuenta el término hl que corresponde a la onda saliente ∼ e+ikr . La
función de onda resulta

u (k, r; t) ∼ eikr e−iEt/ℏ = eikr e−iEt/ℏ e−κr e−Γt/2ℏ . (2.152)

Aunque un estado con κ > 0 crece exponencialmente con la r, observamos que para
k > 0, Γ resulta positivo, y entonces la función de onda se atenúa exponencialmente
en el tiempo y resulta ser fı́sicamente aceptable; se trata de un estado en decaimiento
(véase la figura 2.9). Como además debe tener energı́a positiva, de (2.151) tenemos
que |k| > |κ|. Entonces estos estados resonantes en decaimiento corresponden a polos
de S(k) en el sector entre el eje k real positivo y la bisección del cuarto cuadrante.
6
Valores complejos de energı́a son usados en la fı́sica para describir los estados no-estacionarios
de un sistema. Como ya vimos en la sección 1.8, la cantidad Γ determina la probabilidad de
decaimiento y se llama constante de decaimento; Γ será positiva si la función de onda decrece con
el tiempo (que es el caso de un decaimieto radioactivo) o negativa si la norma de la función de
onda aumenta con el tiempo, que corresponde a los procesos de captura (por ejemplo, cuando el
núcleo átomico captura a un nucleón).
Dispersión de partı́culas 79

r = vT

r=b

Figura 2.9: Representación esquemática de la onda emergente en una realización


fı́sica (aproximada) del decaimiento de un estado resonante en t = T . Para r > b
la onda es saliente (kR > 0) y aumenta con la distancia (κR < 0). Este incremento
refleja precisamente el hecho de que las partı́culas que están en r = vT fueron
emitidas en un tiempo t = −T cuando la intensidad de la fuente fue mayor.

Por otra parte, la relación (2.145) nos dice que tiene que existir también un
polo en el tercer cuadrante. Este necesariamente debe corresponder al proceso de
captura de la partı́cula, o a la formación de la resonancia. Sin embargo, para este polo
la función de onda resulta, además de exponencialmente creciente con r, creciente
con t. Esto debemos entenderlo de la siguiente forma: Con nuestro requerimiento
S = ∞, las ondas entrantes están siempre excluidas, pero durante el perı́odo de
formación del estado, estas últimas tienen que estar presentes también. Por lo tanto,
no estamos describiendo una situación fı́sicamente realizable. Pero, podemos obtener
una realización fı́sica aproximada del decaimiento del estado resonante, suponiendo
que el sistema fue formado en un tiempo muy anterior al momento de la medición.
Finalmente para relacionar los polos de S(E) con los de S(k) tenemos que hacer
la transformación de k en E. El plano k se trasformará en una superficie de Riemann
de dos hojas en el plano E. Si estas hojas se juntan a lo largo del semi eje 0 < E < ∞,
donde se encuentran los estados fı́sicos de dispersión, la primera hoja corresponde
al semi-plano superior de k:
S(k) = S(E); (κ ⩾ 0). (2.153)
Los valores de S(E), en la primera y segunda hoja de Riemann, para la lı́nea de
ramificación 0 < E < ∞, están relacionados por
S(E + iϵ) = S ∗ (E − iϵ); (E > 0) (2.154)
ya que en lı́mite ϵ → 0, E ± iϵ corresponde, respectivamente, a ±k.
En resumen, los polos de la matriz S están distribuidos de la siguiente manera:
80 2.5 Ondas parciales

estados ligados (k = 0, κ > 0; E < 0, Γ = 0): sobre el semi-eje κ > 0 en el


plano k (sobre el semi-eje E < 0 de la primera superficie de Riemann en el
plano E).
estados resonantes en formación (k < 0, κ < 0; E > 0, Γ < 0): en el tercer
cuadrante del plano k (en el primer cuadrante de la segunda superficie de
Riemann del plano E).
estados resonantes en decaimiento (k > 0, κ < 0; E > 0, Γ > 0): en el cuar-
to cuadrante del plano k (en el cuarto cuadrante de la segunda superficie de
Riemann del plano E).
estados virtuales (k = 0, κ < 0; E < 0, Γ = 0): sobre el semi-eje κ < 0 en el
plano k (sobre el semi-eje E < 0 de la segunda superficie de Riemann en el
plano E).
La región para la dispersión fı́sica corresponde a k real y positivo (k > 0, κ = 0)
y al semi-eje E > 0 de la primera superficie de Riemann en el plano E. Los polos en
otras regiones del plano k también se denominan virtuales. Los estados virtuales de
una partı́cula son similares a las resonancias. En estos estados, la barrera centrı́fuga
de confinamiento está ausente, pero el potencial presenta un gran salto en su región
lı́mite (r = b, por ejemplo, en la esfera rı́gida), lo que, a su vez, provoca un salto en
la longitud de onda de la partı́cula, y una atenuación exponencial de la función de
onda hacia el interior del pozo. Las resonancias y los estados virtuales son fenómenos
especı́ficamente cuánticos que no tienen contraparte en la fı́sica clásica.

2.5.6. Dispersión a bajas energı́as


Como ya vimos, cuando λ̄ = 1/k es comparable a o mayor que el rango b, las on-
das parciales con l grandes no son en general importantes. Examinemos brevemente
el comportamiento de δl para valores pequeños de k. Usando que para x pequeño7 ,
xl (2l − 1)!!
jl (x) ∼ , nl (x) ∼ − , (2.156)
(2l + 1)!! xl+1
donde (2l + 1)!! ≡ (2l + 1)(2l − 1) · · · 5 · 3 · 1, para kb ≪ 1 tenemos que (2.92),
αl (k)nl (kb) − kn′l (kb)
cot δl (k) = . (2.157)
αl (k)jl (kb) − kjl′ (kb)
7
Observemos que para l = 0, tenemos
cos x 1
n0 (x) = − ≈− , x ≪ 1, (2.155)
x x
consistente con identificar (−1)! = 1
Dispersión de partı́culas 81

se aproxima como
(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)
cot δl (k) ≃ . (2.158)
(kb)2l+1 l − bαl (k)
Cuando kb → 0, αl (k) → αl (0) que resulta ser finito en la mayorı́a de los casos
de interés8 . Como cot x ∼ 1/x para x chico, tenemos que

(kb)2l+1 l − bαl (0)


δl (k) ∼ (2.159)
(2l − 1)!!(2l + 1)!! l + 1 + bαl (0)
Observamos que, para momentos bajos, los corrimientos de fase disminuyen a medida
que l aumenta, y lo mismo ocurre con las secciones eficaces,

σl = 2
(2l + 1) sin2 δl (k) ∼ k 4l . (2.160)
k
Esto es previsible: la barrera centrı́fuga l(l + 1)/r2 es más alta para l mayor. Clási-
camente, esto impedirı́a que los modos de baja energı́a la penetren y alcancen la
esfera. En mecánica cuántica, solo las colas exponenciales de estos modos alcanzan
r = b, por lo que su dispersión se ve suprimida. Vemos entonces que para energias
incidentes suficientemente bajas, las contribuciones a la sección eficaz de todas las
ondas parciales con l ⩾ 1, pueden despreciarse, y entonces la sección eficaz total
resulta σ ≈ σ0
Esto también implica que a bajas energias la dispersión es isotrópica, dado que
la amplitud de dispersión eq. (2.79) solo conserva el primer término que, por ser
P0 (cos θ) = 1 es independiente de los ángulos.

Longitud de dispersión
Si tenemos en cuenta con cuidado las constantes α0 (0) el resultado para el corri-
miento de fase de la onda s es

δ0 (k) = −ak + O(k 2 ) (2.161)

donde definimos
b2 α0 (0)
a= (2.162)
1 + bα0 (0)
como la longitud de dispersión. La sección eficaz a bajas energı́as se escribe en
términos de esta en la forma
 
σ ≈ σ0 = 4πa2 1 + O(k 4 ) (2.163)
8
Puede verificarse que αl (0) es finita en el pozo cuadrado, ecuación (2.105) y lo es en general
para cualquier potencial.
82 2.5 Ondas parciales

En el caso de la esfera rı́gida, αl = ∞, y la ec. (2.95) se reduce a:

(2l − 1)!!(2l + 1)!!


cot δ[Link]. (k) ≃ − , (2.164)
(kb)2l+1

de donde también vemos que es correcto ignorar todos los δl con l ̸= 0 y que además,
en especial
δ[Link]. (k) = −kb, (2.165)
y
σ[Link]. = 4πb2 , para kb ≪ 1. (2.166)
Comparando los resultados generales (2.161) y (2.163) con los de la esfera rı́gida
(2.165) y (2.166) Podemos concluir que a muy bajas energı́as el potencial actúa,
cualquiera sea su forma, como una esfera rı́gida de radio igual a la longitud de
dispersión. Puesto que las longitudes de onda son muy grandes, las partı́culas no
logran ver los detalles del potencial.
Es interesante comparar este resultado con el que se obtiene a altas energı́as
kb ≫ 1. Para ello, necesitamos propiedades adicionales de las funciones esféricas
de Bessel. Aquı́ simplemente enunciamos los resultados. Los corrimientos de fase δl
varı́an entre 0 y 2π para l ≲ kb. Sin embargo, cuando l < kb, los corrimientos de
fase caen rápidamente a cero. La intuición detrás de esto se desprende del análisis
semiclásico, que indica que para l ≫ kb, el parámetro de impacto es ℓ ≫ b. Por
lo tanto, no sorprende que no se produzca dispersión en este régimen. Resulta que,
cuando kb → ∞, la sección eficaz total se convierte en σ → 2πb.
Para profundizar el significado fı́sico de a partimos de la solución externa para
la onda s (2.100) para el problema de dispersión por un potencial de corto alcance
en el lı́mite kr ≪ 1:
sin(kr + δ0 ) C0
u0 (r) = C0 → (kr cos δ0 + sin δ0 ) (2.167)
k k
Recordando que ul (0) = 0, podemos dibujar tres diferentes casos, como muestra la
figura 2.10. Si nos preguntamos para que otro valor de r se anula la función de onda,
encontramos de (2.167) que eso ocurre en r = −k −1 tan δ0 , que es exactamente la
relación (??) que define a la longitud de dispersión. Tenemos entonces una interpre-
tación geométrica para a y una manera de visualizar a la relación (2.163). Mientras
que para la esfera rı́gida u0 (r) se anula en r = b y la sección eficaz está dada por
(2.166), en el caso general u0 (r) se anula en r = a y σ está dada por (2.163). La
única deferencia es que a puede ser negativa.
Para ver el significado del signo de a, analicemos de la ecuación radial
2m
u′′0 (r) − V (r)u0 (r) + k 2 u0 (r) = 0; u0 (0) = 0 (2.168)
ℏ2
Dispersión de partı́culas 83

Figura 2.10: Función de onda u0 (r) para (a) potencial repulsivo, (b) para potencial
atractivo, y (c) para una atracción major. La intersección de lı́mkb→0 u0 (r) con el eje
r se muestra en cada uno de los tres casos.

para k = 0. En la región donde V (r) es atractivo (negativo) u′′ (r) es negativa (si u(r)
es positiva) y por lo tanto tiene que ser cóncava hacia abajo. Cuanto más negativo es
V (r) tanto major es la concavidad. La cuestión es si la concavidad es suficiente para
curvar a u(r) y orientarla hacia abajo mientras que actúa el potencial, Esto, a su vez,
está ı́ntimamente relacionado con la existencia del estado ligado, ya que para que
haya un estado ligado es necesario que, para r > b, u(r) se junte con una función de
la forma e−κL r , cuya pendiente es negativa. (Notemos que  para valores pequeños de
−κL r −1
κL , e es también esencialmente una recta y a = κL . En resumen, si el potencial
es suficientemente atractivo producirá un estado ligado y a será positiva. En el caso
contrario a es negativa y la función de onda crece exponencialmente para distancias
grandes. En ese caso estamos en presencia de un estado virtual.
84 2.5 Ondas parciales

Estados ligados a bajas energias


Consideremos un estado débilmente ligado, es decir que satisface κL b ≪ 1. Po-
demos usar entonces la expresión para argumento pequeño de hl (x),

(2l − 1)!!
hl (x) ∼ −i , x ≪ 1, (2.169)
xl+1
y obtener de (2.124):
l+1
αl (iκL ) = − (2.170)
b
o equivalentemente

l + 1 + bαl (iκL ) = 0; para κL b ≪ 1 (2.171)

Esta es la condición, a orden κL b, para que exista un estado ligado con EL ≃ 0. Más
precisamente, (2,171) es la condición para tener un estado ligado con

ℏ2 κ2L ℏ2
|EL | = ≪ . (2.172)
2m 2mb2
Luego, en el caso de existir un tal estado, por la continuidad de αl (k), la cantidad
(l + 1 + bαl (k = 0)) será pequeña. La expresión (2.158) para cot δl (k),

(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)


cot δl (k) ≃ (2.173)
(kb)2l+1 l − bαl (k)

nos indica que cot δl (k) será pequeño, y por lo tanto la sección eficaz parcial
4π 4π 1
σl (k) = sin2 δl (k) = 2 . (2.174)
k 2 k 1 + cot2 δl (k)

esto implica que el valor relativo de sin δl (y por lo tanto de σl ) será incrementado
con respecto al valor que tendrı́a de no existir el estado ligado9 .

Dispersión resonante a bajas energı́as


Sabemos que a energı́as muy bajas la dispersión ocurre dominantemente en el
canal s. Examinaremos ahora los procesos de dispersión a energı́as un poco más altas
para que las ondas con l ⩾ 1 también entren en juego. Supondremos, sin embargo,
9
Cuidado, los términos de orden κb hacen la diferencia entre cot δl = 0, que se obtendrı́a al
llevar (2.171) a (2.173) y el resultado (2.128), cot δl = i, que es la condición correcta para un estado
ligado. Por ejemplo, para l = 0 la función de onda del estado ligado es h0 (iκL r) ∼ −e−κL r /κL r
y de (2.124), en lugar de (2.171), se obtiene 1 + bα0 (iκL ) + κL b = 0, que al ser usada en (2.173)
conduce a cot δ0 ≃ (1 + bα0 (iκL )) / (−bα0 (iκL )) / (iκL b) = (−κL b) / (1 + κL b) / (iκL b) ≃ i
Dispersión de partı́culas 85

σl

Ancho a media altura = ΓR

0 E
ER

Figura 2.11: Pico resonante en la energı́a ER , con un ancho igual a ΓR . Cuando


E = ER ± Γ2R , σl (E) cae a la mitad de su valor máximo que alcanza para E = ER ,
y por lo tanto ΓR es el ancho de la resonancia.

que kb continúa siendo lo suficientemente pequeño para que la aproximación de


cot δl (k) a bajas energı́as, ec. (2.158),

(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)


cot δl (k) ≃ . (2.175)
(kb)2l+1 l − bαl (k)

siga siendo válida. De esta vemos que si estamos cerca de la energı́a ER = kR2 ℏ2 /2m,
para la cual l + 1 + bαl (k) pasa por cero, i. e. si

l + 1 + bαl (kR ) = 0, para kR b ≪ 1. (2.176)

cot δl (E) también pasará por cero. [Nótese la similitud con (2.171)]. En esta situación
σl será proporcional a k −2 y por lo tanto relativamente grande. Este tipo de salto
en la sección eficaz se denomina resonancia (o dispersión resonante); véaser la figura
2.11.
Expandiendo αl (E) en torno a ER , obtenemos:
!
∂αl (E)
αl (E) = αl (ER ) + (E − ER ) + ··· , (2.177)
∂E E=ER

y de (2.176) resulta:
!
∂αl (E)
l + 1 + bαl (E) ≃ (E − ER ) b . (2.178)
∂E E=ER
86 2.5 Ondas parciales

δl

π
2

0 E
ER

Figura 2.12: Comportamiento de δl (E) cerca de una resonancia.

Luego la ec. (2.158) se puede ahora expresar en la forma (l − bαl (E) ≃ 2l + 1):
2 (E − ER )
cot δl (E) ≃ − , (2.179)
ΓR
donde
2k 2l+1 b2l
ΓR = −  
∂αl (E)
(2.180)
[(2l − 1)!!]2 ∂E E=ER
 
∂αl (E)
(Se puede demostrar que para el decaimiento de un estado resonante ∂E
<
E=ER
0 y por lo tanto ΓR > 0.) Es decir que cerca de una resonancia
4π Γ2R
σl (E) = (2l + 1) (2.181)
k2 4 (E − ER )2 + Γ2R
que es la formula de Breit-Wigner representada en la figura 2.11 De la ecuación
(2.180) vemos que, cuanto más rápidamente varı́a αl (E) con respecto a E tanto más
angosta será la resonancia. También se ve que cuanto menor sea el valor de kb y
mayor el valor de l para el cual ocurre la resonancia, tanto mayor será el ancho ΓR .
Para l ⩾ 1 la resonancia se produce cada vez que cot δl (E) se anula, o cuando:
1
 
δl (ER ) = +n π (2.182)
2
donde n es un entero. Además de (2.178) vemos que cerca de la resonancia δl (E) se
comporta como: !
π E − ER
δl (E) = + arctan . (2.183)
2 ΓR /2
Dispersión de partı́culas 87

Es decir que al pasar E por ER , el corrimiento de fase varı́a bruscamente desde un


valor próximo a cero (más nπ ) a un valor próximo a π (más nπ ); el salto se produce
en un pequeño intervalo de enrgı́a de orden de ΓR , como se ilustra en la figura 2.12.
La condición (2.176) para una resonancia es muy similar a la condición (2.171) para
un estado ligado.
Capı́tulo 3

Partı́culas Idénticas

La indistinguibilidad de las partı́culas constituyentes de un sistema fı́sico, o sea


la no existencia de propiedades fı́sicas que permitan identificarlas individualmente,
tiene consecuencias mucho más radicales en el contexto de la Mecánica Cuántica
que en la Mecánica Clásica. Veamos esto con más detalles.
Cuando en la mecánica clásica enfrentamos el estudio de un sistema con dos o
más partı́culas idénticas (es decir, partı́culas indistinguibles por tener masa, carga,
momento angular y cualquier otra propiedad fı́sica idéntica) nada cambia en la
manera en que aplicamos las leyes de la cinemática y la dinámica respecto del caso
de una única partı́cula o de varias partı́culas diferentes.
Si se trata de partı́culas idénticas, podemos, eventualmente “numerarlas” (por
ejemplo, para dos partı́culas escribiendo las coordenadas con un subı́ndice r1 , r2 , etc.
para distinguir a las dos partı́culas) y entonces, conocida la posición y velocidad de
cada partı́cula del sistema en un instante inicial podemos, en el caso de la mecánica
clásica, seguir sus trayectorias aplicando las leyes de Newton, y reconocer en el
estado final cuál partı́cula ha seguido cada una de las trayectorias.
Es evidente que lo anterior no es posible en el caso de la mecánica cuántica.
Básicamente, esta imposibilidad se debe a que, eliminada la noción de trayectoria
(por el principio de incerteza), aunque sepamos con precisión absoluta la posición
inicial de cada partı́cula idéntica del sistema, al no poder seguir o calcular trayecto-
rias individuales pues el momento pi estarı́a indeterminado, no podremos saber en
el estado final cuál partı́cula es la que ocupa una dada posición. En otras palabras,
las situaciones a) y b) de la figura no pueden diferenciarse. Al intentar medir algún
observable, a lo sumo podremos medir la densidad de probabilidad de encontrar a
las partı́culas, y ambas situaciones darán lugar a la misma distribución de probabili-
dad. Esto se conoce como principio de indistinguibilidad cuántico: Si un sistema está
constituido por dos partı́culas idénticas 1 y 2 , la densidad de probabilidad asociada
al sistema no permite determinar cuál de ellas es la partı́cula “1” y cuál la “2”. Esto

88
Partı́culas Idénticas 89

implica que debe verificarse la identidad

|Ψ(1, 2)|2 = |Ψ(2, 1)|2 (3.1)

lo cual nos dice que la función de onda debe satisfacer

Ψ(1, 2) = exp(iα)Ψ(2, 1) (3.2)

Esto resultado es interesante dado que si bien el observable fı́sico permanece inva-
riante frente a la permutación de partı́culas, ¡la función de onda no tiene por que
hacerlo! Sin embargo, esta condición es demasiado débil. La indistinguibilidad im-
pone que el Hamiltoniano sea invariante frente a la permutación de partı́culas, y
esto a su vez impone valores precisos que puede tomar el valor de α.

3.1. Permutaciones y simetrı́as


Consideremos primero el caso de dos partı́culas idénticas, con la función de onda
Ψ(1, 2); el ı́ndice 1 especifica las coordenadas espaciales r1 y de spin s1 y análoga-
mente el ı́ndice 2. A la partı́cula descripta por el primer argumento de la función
de onda la llamaremos primera partı́cula y a la descripta por el segundo argunn-
to segunda partı́cula. Es decir que Ψ(1, 2) es la amplitud de observar la primera
partı́cula en el punto r1 con el valor de spin s1 y la segunda partı́cula en el punto r2
con el valor de spin s2 . Nótese que al proponer estos nombres no estamos agregando
ninguna información adicional y tanto la matemática como los aparatos de medición
tendrán que tratar a las dos partı́culas de forma totalmente equivalente.
Decir que dos partı́culas son idénticas significa que no existe ninguna interac-
ción que pueda diferenciarlas. En otras palabras, todo operador que corresponde a
un observable fı́sico tiene que ser simétrico con respecto a las coordenadas de las
partı́culas. Por ejemplo, un Hamiltoniano de lla forma

p21 p2
H= + 2 + Vpar (|r1 − r2 |) + Vext (r1 ) + Vext (r2 ) (3.1)
2m 2m
es simétrico con respecto al intercambio de los indices 1 y 2. Aquı́ Vpar es la in-
teracción entre las dos partı́culas, y Vext representa el acoplamiento con un campo
externo.
Es conveniente introducir en este punto un operator P12 , cuya acción consiste
en intercambiar o permutar a la partı́cula 1 y la partı́cula 2, i.e. un operador de
permutación de partı́culas:

P12 Ψ(1, 2) = Ψ(2, 1). (3.3)


90 3.1 Permutaciones y simetrı́as

Debe cumplirse que


2
P12 Ψ(1, 2) = P12 Ψ(2, 1) = Ψ(2, 1), (3.4)
para cualquier función Ψ(1, 2), y por lo tanto
2
P12 = 1. (3.5)

Ahora, dado que el Hamiltoniano es simétrico respecto del intercambio de partı́cu-


las, conmuta con este operador,

[P12 , H] = 0 (3.6)

Esta simetrı́a, llamada simetrı́a de intercambio, implica que el Hamiltoniano po-


see una degeneración, la degeneración de intercambio1 : si considero a Ψ(1, 2) una
autofunción de H con energı́a E,

HΨ(1, 2) = EΨ(1, 2) (3.9)

entonces, la autofunción Ψ(2, 1) = P12 Ψ(1, 2) también es autofunción de H con la


misma energı́a:

HΨ(2, 1) = HP12 Ψ(1, 2) = P12 HΨ(1, 2) = EP12 Ψ(1, 2) = EΨ(2, 1). (3.10)

Para clasificarlas, buscamos los autovalores y autofunciones de P12

P12 Ψp (1, 2) = λp Ψp (1, 2) (3.11)

Por (3.5) tenemos


Ψp (1, 2) = λ2p Ψ(1, 2), (3.12)
o,
λ2p = 1, (3.13)
es decir que
λp = ±1, (3.14)
1
Supongamos que tenemos un operador O que conmuta con H, y tomemos un autoestado de
H con energı́a E:
H|ψ⟩ = E|ψ⟩ (3.7)
Entonces, la función |ϕ⟩ = O|ψ⟩ también es autofunción de H con la misma energı́a. En efecto,

H|ϕ⟩ = HO|ψ⟩ = OH|ψ⟩ = EO|ψ⟩ = E|ϕ⟩ (3.8)

Salvo que correspondan a la misma autoestado(cosa que podrı́a ocurrir) forman un espacio dege-
nerado
Partı́culas Idénticas 91

debido a que el operador de permutación es hermı́tico. Podemos clasificar entonces


a las funciones de onda en simétricas y antisimétricas respecto al intercambio de
partı́culas:

P12 ΨS (1, 2) = +ΨS (1, 2) (3.15)


P12 ΨA (1, 2) = −ΨA (1, 2) (3.16)

que podemos construit a partir de Ψ(1, 2) como:

1
ΨS (1, 2) = √ [Ψ(1, 2) + Ψ(2, 1)] , (3.17)
2
1
ΨA (1, 2) = √ [Ψ(1, 2) − Ψ(2, 1)] , (3.18)
2

donde hemos introducido el factor 1/ 2 por razones de normalización. Obviamente
si Ψ(1, 2) es una autofunción de H, las funciones de onda ΨS (1, 2) y ΨA (1, 2) lo son
de H y de P12 .
Podemos también definir los operadores de simetrización y de antisimetrización
como:
1
S12 ≡ √ (1 + P12 ) , (3.19)
2
1
A12 ≡ √ (1 − P12 ) , (3.20)
2

Al aplicar S12 o A12 a una combinación lineal arbitraria de Ψ(1, 2) y Ψ(2, 1) la función
de onda resultante es necesariamente simétrica o antisimétrica respectivamente; en
efecto:
( )
S12 1 1
[aΨ(1, 2) + bΨ(2, 1)] = √ [aΨ(1, 2) + bΨ(2, 1)] ± √ [aΨ(2, 1) + bΨ(1, 2)]
A12 2 2
(3.21)
a±b
= √ [Ψ(1, 2) ± Ψ(2, 1)]. (3.22)
2

Las consideraciones anteriores se pueden extender a sistemas que tienen más de


dos partı́culas idénticas. Definimos:

Pij Ψ(1, 2, . . . , i, . . . , j, . . . N ) = Ψ(1, 2, . . . , j, . . . , i, . . . N ) (3.23)

Obviamente, igual que antes:


Pij2 = 1 (3.24)
92 3.1 Permutaciones y simetrı́as

y los autovalores permitidos de Pij son +1 y −1. Es importante notar que en general
[Pij , Pki ] ̸= 0 (3.25)
aunque sı́ conmutan en el caso en que i, j ̸= k, l. Un Hamiltoniano H(1, 2, . . . , N )
totalmente simétrico debe verificar
[H, Pki ] = 0 (3.26)
Decimos que una función de onda Ψ (1, 2, . . . N ) es totalmente simétrica o totalmente
antisimétrica si:
Pij ΨS (1, 2, . . . , i, . . . , j . . . N ) = +ψS (1, 2, . . . , i, . . . , j, . . . N ) , (3.27)
Pij ΨA (1, 2, . . . , i, . . . , j, . . . N ) = −ψA (1, 2, . . . , i, . . . , j, . . . N ) (3.28)
para todo Pij . Para construirlas, extendemos las definiciones de los proyectores de
simetrización y antisimetrización en la forma
N! N!
1 X 1 X
S=√ Pν , A= √ (−1)sν Pν (3.29)
N ! ν=1 N ! ν=1
donde la suma se extiende sobre todas las N ! permutaciones Pν de las N partı́culas y
sν es la firma o signatura de la permutación Pν (es decir, el número de transposiciones
en Pν ), de manera que (−1)sν es igual +1 si la permutación es par o a −1 para una
permutación impar. Las funciones simetrizadas resultan entonces,
N!
1 X
ΨS (1, 2, . . . , N ) = √ Pν Ψ(1, 2, . . . , N ) (3.30)
N ! ν=1
N!
1 X
ΨA (1, 2, . . . , N ) = √ (−1)sν Pν Ψ(1, 2, . . . , N ). (3.31)
N ! ν=1
Por ejemplo, para tres partı́culas,
1
S = √ (1 + P12 + P12 P13 + P13 + P23 P13 + P23 ) , (3.32)
3!
1
A = √ (1 − P12 + P12 P13 − P13 + P23 P13 − P23 ) . (3.33)
3!
Y entonces las funciones simétricas y antisimétricas resultan
1
ΨS (1, 2, 3) = √ [Ψ(1, 2, 3) + Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.34)
6
+ Ψ(3, 2, 1) + Ψ(3, 1, 2) + Ψ(1, 3, 2)] (3.35)
1
ΨA (1, 2, 3) = √ [Ψ(1, 2, 3) − Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.36)
6
− Ψ(3, 2, 1) + Ψ(3, 1, 2) − Ψ(1, 3, 2)]. (3.37)
Partı́culas Idénticas 93

En total hay 3! = 6 funciones de onda diferentes. Las restantes cuatro:

1
ΨI (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(2, 3, 1) − Ψ(3, 2, 1)] (3.38)
2
1
ΨII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(3, 1, 2) − Ψ(1, 3, 2)] (3.39)
2
1
ΨIII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(2, 1, 3) − Ψ(3, 1, 2)] (3.40)
2
1
ΨIV (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(1, 3, 2) − Ψ(2, 3, 1)] (3.41)
2
no son totalmente simétricas ni totalmente antisimétricas.
Experimentalmente se verifica que la función de onda que describe a un sistema
de N partı́culas idénticas es o bien totalmente simétrica, o totalmente antisimétrica.
En el primer caso se dice que las partı́culas obedecen la estadı́stica de Bose-Einstein
(BE) y se conocen como bosones, y en el segundo caso decimos que satisfacen la
estadı́stica de Fermi-Dirac (FD) y hablamos de fermiones. Resumiendo,

Pij Ψ(N bosones idénticos ) = +Ψ(N bosones idénticos ), (3.42)


Pij Ψ(N fermiones idénticos ) = −Ψ(N fermiones idénticos ). (3.43)

Es notable que la simetrı́a mixta no ocurre en la naturaleza. Pero es más no-


table todavı́a la correspondencia entre el spin de las partı́culas y la estadı́stica que
obedecen:

partı́culas con spin entero (S = 0, 1, 2, . . .) son bosones

partı́culas con spin semi-enter (S = 12 , 32 , . . .) son fermiones.

En la mecánica cuántica no-relativista esta correspondencia tiene que ser aceptada


como un postulado empı́rico y para entenderla habrı́a que utilizar el formalismo
relativista.
Supongamos ahora que estamos estudiando las propiedades de un átomo de
hidrógeno localizado en La Plata, y nos hacemos la siguientes preguntas: ¿Por qué
las funciones de onda de un solo electrón describen correctamente las propiedades
del átomo de hidrógeno? ¿No tendrı́amos que tomar en cuenta a todos los demás
electrones que existen en el universo, y construir una función de onda totalmente
antisimétrica para todos estos electrones, incluyendo el nuestro? La respuesta es
que no tenemos que antisimetrizar ya que no existe ninguna superposición entre la
función de onda de nuestro electrón y las funciones de onda de los demás electro-
nes. Para ver esto más claramente supongamos que la función de onda de nuestro
electrón es ϕL (r) y que tenemos otro electrón en Paris que describimos por medio
94 3.1 Permutaciones y simetrı́as

de la función de onda ϕP (r). También suponemos que las funciones de onda no se


superponen,es decir que:

ϕL (r)ϕP (r) = 0 para todo r (3.44)

La función de onda antisimetrizada y normalizada es:


1
Ψ (r1 , r2 ) = √ [ϕL (r1 ) ϕP (r2 ) − ϕH (r1 ) ϕL (r2 )] , (3.45)
2
y la probabilidad de encontrar un electrón en el punto r es
ˆ ˆ
P (r) = dr2 |Ψ (r, r2 )| + dr1 |Ψ (r1 , r)|2 ,
2
(3.46)

es decir, igual a la probabilidad de que el electrón 1 esté en el punto r y el electrón


2 en cualquier otro punto más la probabilidad de que el electrón 2 esté en el punto
r y el electrón 1 en cualquier otro punto del espacio. Luego:
ˆ ˆ
2 ′ ′ 2 2 2
P (r) = |ϕL (r)| dr |ϕP (r )| + |ϕP (r)| dr ′ |ϕL (r ′ )| (3.47)
ˆ !
∗ ′ ∗ ′ ′
− 2 Re ϕL (r)ϕP (r) dr ϕL (r ) ϕP (r ) (3.48)

y por ser ϕL (r)ϕ∗P (r) = 0, se cumple que

P (r) = |ϕL (r)|2 + |ϕP (r)|2 (3.49)

Si el punto r está en La Plata, será P (r) = |ϕL (r)|2 , ya que un electrón que está en
Parı́s tiene probabilidad nula de encontrarse en La Plata. De tal modo obtenemos
el mismo resultado como si de entrada nos hubiésemos olvidado de todos los demás
electrones. La regla es: tenemos que antisimetrizar o simetrizar la función de onda de
un conjunto de fermiones o bosones solamente para las partı́culas que son relevantes.
Otra pregunta: ¿Cómo son las funciones de onda de sistemas formados por
partı́culas idénticas compuestas, tales como átomos? Consideremos, por ejemplo,
la función de onda Ψ(re1 , rp1 , re2 , rp2 ), que describe a dos átomos de hidrógeno; re1
es la posición del electrón del primer átomo, rp1 es la posición del protón del primer
átomo, etc. Ψ(re1 , rp1 , re2 , rp2 ) cambiará de signo si intercambiamos las coordenadas
de los electrones o de los protones. En cambio, no habrá ningún cambio de signo si
intercambiamos las coordenadas de un electrón con las coordenadas de un protón,
por ser partı́culas diferentes. Por otro lado, si intercambiamos los dos átomos entre
sı́, será

Ψ(re1 , rp1 , re2 , rp2 ) = −Ψ(re2 , rp1 , re1 , rp2 ) = Ψ(re2 , rp2 , re1 , rp1 ) (3.50)
Partı́culas Idénticas 95

y por lo tanto los átomos de hidrógeno se comportan como bosones. Es fácil con-
vencerse que la regla general es: las partı́culas compuestas que contienen un número
par de fermiones y cualquier número de bosones se comportan como bosones, mien-
tras que áquellas con un número impar de fermiones y cualquier número de bosones
se comportan como fermiones. Por ejemplo, los átomos de 4 He se comportan como
bosones y los de 3 He como fermiones.
En este punto conviene detenerse un poco para preguntarse: ¿Que significa la
palabra partı́cula, o más bien que es una partı́cula elemental? Supongamos que es-
tamos haciendo un experimento con el helio lı́quido, que está formado por átomos de
4
He. A muy bajas temperaturas las colisiones en el fluido no son lo suficientemente
energéticas como para excitar al átomo desde su estado fundamental y el átomo
de 4 He puede ser tratado como una partı́cula elemental de spin cero. En cambio,
cuando irradiamos el lı́quido con luz ultravioleta aparecen en el espectro de absor-
ción los estados excitados del átomo y el 4 He ya no podrá ser tratado como una
partı́cula elemental. Los datos experimentales en este caso los podemos interpretar
satisfactoriamente utilizando un modelo de tres partı́culas: un núcleo atómico con
spin igual a cero (partı́cula α) y dos electrones de spin 21 . Al cambiar la sonda que
usamos para estudiar el sistema, por otra de energı́a ⩾ 25 MeV (por ejemplo rayos γ)
descubrimos que la descripción anterior ya no es más válida: la partı́cula α se puede
romper y entramos al dominio de la fı́sica nuclear, donde las partı́culas elementales
son los nucleones. Para energı́as ⩾ 140 MeV hay producción de piones, que tam-
bién tienen que ser considerados. Aumentando más todavı́a la energı́a de la sonda
hallamos que el nucleón tiene varios estados excitados. Por lo tanto no podrá seguir
siendo tratado como una partı́cula elemental; se recurre al modelo de los quarks en
el cual el nucleón está formado por tres quarks. Podemos concluir entonces que: el
concepto de partı́cula elemental y el tamaño espacio de Hilbert necesario para una
descripción adecuada del sistema depende del dominio de energı́a en el cual stamos
trabajando.
La antisimetrı́a de la función de onda para fermiones idénticos implica que la pro-
babilidad de hallar dos fermiones idénticos en el mismo punto es nula. Más precisa-
mente: dos fermiones idénticos no pueden ocupar el mismo punto espacial si sus spi-
nes están orientados en la misma dirección. Este es el principio de exclusión de Pauli,
que se demuestra muy fácilmente. En efecto, como ΨA (2, 1, 3, . . .) = −ΨA (1, 2, 3, . . .)
vemos que si 1 = 2, resulta ΨA (1, 1, 3, . . .) ≡ 0.

3.2. Interacción de intercambio


Consideremos el caso de partı́culas idénticas, cargadas, en presencia de un campo
eléctrico constante. Hemos aprendido en el curso de mecánica cuántica I que en este
caso, el Hamiltoniano H no incluye términos con operador de spin S, es decir que H
96 3.2 Interacción de intercambio

es diagonal en lo que respecta al spin) y la función de onda se factoriza trivialmente


en una parte que depende solo de las coordenadas ri , i = 1, 2, . . . , N y otra que
depende solo de las variables de spin, si ,

Ψ (r1 , r2 , . . . , rN ; s1 , s2 , . . . , sN ) = Φ (r1 , r2 , . . . , rN ) Υ (s1 , s2 , . . . , sN ) (3.51)

Nótese que el hecho de que H no contenga al operador de spin no implica que la


partı́cula cuya dinámica es gobernada por H no tenga spin.
En principio, el factor Υ de la función de onda es arbitrario ya que como el Ha-
miltoniano no contiene al spin, H solo determina la dependencia de las coordenadas.
O sea que parecerı́a que podemos olvidar el spin para resolver tal problema. Pero si
se trata de un sistema de partı́culas idénticas, veremos que la necesidad de simetrı́a
o antisimetrı́a de la función de onda completa (i.e., los dos factores incluı́dos) hace
que el spin juegue un rol aún en este caso.
Para comprender esto, volvamos al caso más simple, de dos partı́culas idénticas
que obedecen la ecuación de Schrödinger,

HΨ(r1 , r2 ; s1 , s2 ) = EΨ(r1 , r2 ; s1 , s2 ) (3.52)

con un Hamiltoniano en el que el operador de spin está ausente (no hay interacción
spin-órbita, no hay campo magnético, etc). Es decir un Hamiltoniano que podemos
escribir ası́:
H = Hc ⊗ Is (3.53)
donde los subı́ndices c y s indican los factores de coordenadas y de spin del producto
tensorial con el que debe escribirse el Hamiltoniano. En el caso presente el factor de
spin actúa trivialmente como la identidad en el espacio de las funciones de onda del
sistema.
Si escribimos a la función de onda como un producto,

Ψ (r1 , r2 ; s1 , s2 ) = Φ (r1 , r2 ) Υ(σ1 , σ2 ) (3.54)

entonces, para determinar los niveles de energı́a del sistema se estudia el problema
estacionario para el factor dependiente de las coordenadas.

Hψα (r1 , r2 ) = Eα Φα (r1 , r2 ) . (3.55)

En principio, a partir de las autofunciones de onda espaciales Φα podremos construir


autofunciones simétricas y antisimétricas.
Consideremos el caso en que se trata de bosones de spin cero. En tal caso, la
parte de spin que hemos llamado Υ en la ec. (3.51) estará ausente de la ec.(3.52).
Por tratarse de bosones, en general la función de onda Ψ debe ser simétrica por lo
que en este caso, sin spin, la función de onda de la parte espacial, que llamamos Φ,
es la única presente por ello debe ser simétrica.
Partı́culas Idénticas 97

Se trata entonces de un problema de dos bosones idénticos con un potencial


adecuado, por ejemplo coulombiano en que, intercambiarlos, equivale a una inversión
espacial, un cambio de paridad. En efecto, dado el vector r12 = r1 − r2 , el cambio
1 ↔ 2 equivale al cambio r12 → r21 = −r12 . En un desarrollo en armónicos esféricos,
las autofunciones con l impar cambiarán ante paridad por lo que quedan descartadas
en la construcción de estados simétricos.
Con este ejemplo hemos aprendido entonces que aunque el spin esté ausente
del Hamiltoniano, el hecho de que las partı́culas sean bosones idénticos a los que
se aplica el principio de indistinguibilidad que enunciamos, afecta la forma de la
función de onda. Hablamos por ello de una interacción de intercambio que produce
el efecto de prohibir los estados con l impar.
Si se tratara de fermiones de spin 1/2, la función de onda tendrı́a una parte
de spin Υ no trivial y, a pesar de estar el spin ausente del Hamiltoniano, debemos
encargarnos de construir las autofunciones que lo contienen. Como aclaramos al
iniciar este tema, consideramos el caso de la mecánica cuántica no relativista pero
en la que los espinores tienen dos componentes (espinores de Pauli). Tratándose
de dos partı́culas de spin 1/2, el spin total puede ser S = 0, 1, y podemos tener
cuatro estados posibles: un estado singlete con S = M = 0 y un triplete de estados
con S = 1, M = −1, 0, +1. Explı́citamente si denotamos estos estados por ΥSM
tendremos:
1
Υ00 (s1 , s2 ) = √ [Υ↑ (s1 ) Υ↓ (s2 ) − Υ↓ (s1 ) Υ↑ (s2 )] (3.56)
2
Υ11 (s1 , s2 ) = Υ↑ (s1 ) Υ↑ (s2 ) (3.57)
1
Υ10 (s1 , s2 ) = √ [Υ↑ (s1 ) Υ↓ (s2 ) + Υ↓ (s1 ) Υ↑ (s2 )] (3.58)
2
Υ1,−1 (s1 , s2 ) = Υ↓ (s1 ) Υ↓ (s2 ) (3.59)
donde Υσ (s), con σ =↑, ↓ son espinores con spin up y spin down respectivamente,
Υσ (s) = ⟨s|σ⟩ (3.60)
(Υ↑ (s =↑) = 1 y Υ↑ (s =↓) = 0, etc). Para que la función de onda total,
Ψ(1, 2) ≡ Φ (r1 , r2 ) ΥSM (s1 , s2 ) (3.61)
sea antisimétrica con respecto a la transformación: r1 ↔ r2 ; s1 ↔ s2 , la función de
onda radial Φ (r1 , r2 ) tendrá que ser simétrica con respecto al intercambio de r1 por
r2 cuando S = 0 y antisimétrica cuando S = 1.

3.3. Partı́culas Independientes


Es instructivo discutir la función de onda para N partı́culas idénticas que no
interactúan entre sı́ y que están con un pozo de potencial V (r), como el que se
98 3.3 Partı́culas Independientes

α=d

α=3
α=2
α=1

Figura 3.1: Niveles de energı́a de partı́culas independientes para un pozo de potencial


V (r).

muestra en la figura 3.1. El Hamiltoniano de una sola partı́cula es:


p21
H(1) = + V (r1 ) (3.62)
2m
y las autofunciones son φα (1) con energı́as εα :

H(1)φα (1) = εα φα (1) (3.63)

En el caso de N partı́culas independientes el Hamiltoniano será:

H = H(1) + H(2) + · · · + H(N ) (3.64)

y una de sus posibles soluciones es

Ψ(1, 2, . . . , N ) = φα1 (1)φα2 (2) · · · φαN (N ) (3.65)

donde la partı́cula 1 está en el nivel de energı́a εα1 , la partı́cula 2 está en el nivel de


energı́a εα2 , . . . la partı́cula N está en el nivel de energı́a εαN . La energı́a total es:

E = εα 1 + εα 2 + · · · εα N (3.66)

En general, la función de onda (3.65) no es una solución admisible para N partı́cu-


las idénticas, ya que no está simetrizada (o antisimetrizada) con respecto a ninguna
de las partı́culas. Notemos también que cualquier permutación de los ı́ndices en
1, 2, . . . N en (3.65) conduce a la misma energı́a, lo que se denomina degeneración
de intercambio. Por ejemplo, el vector

Ψ(2, 1, . . . N ) = φα1 (2)φα2 (1) · · · φαN (N ) (3.67)


Partı́culas Idénticas 99

tiene la misma energı́a que el vector Ψ(1, 2, . . . N ).


Para construir autofunciones admisibles para N partı́culas idénticas tenemos que
tomar combinaciones lineales de (3.65) y sus permutaciones, que sean totalmente
simétricas para bosones o totalmente antisimétricas para fermiones. Esto se consigue
con la aplicación de los operadores (3.29) sobre (3.65),
N!
1 X
ΨS (1, 2, . . . , N ) = √ Pν φα1 (1)φα2 (2) · · · φαN (N ), (3.68)
N ! ν=1
N!
1 X
ΨA (1, 2, . . . , N ) = √ (−1)sν Pν φα1 (1)φα2 (2) · · · φαN (N ). (3.69)
N ! ν=1
En particular, por ejemplo, para tres partı́culas idénticas las funciones de onda
normalizados son:
( )
ΨS (1, 2, 3) 1
= √ [φα1 (1)φα2 (2)φα3 (3) ± φα1 (2)φα2 (1)φα3 (3)
ΨA (1, 2, 3) 6
+ φα1 (2)φα2 (3)φα3 (1) ± φα1 (3)φα2 (2)φα3 (1)

+φα1 (3)φα2 (1)φα3 (2) ± φα1 (1)φα2 (3)φα3 (2)] (3.70)

que también podemos poner en la forma:


( ) φα1 (1) φα1 (2) φα1 (3)
ΨS (1, 2, 3) 1
=√ φα2 (1) φα2 (2) φα2 (3) (3.71)
ΨA (1, 2, 3) 3! φ (1) φ (2) φ (3)
α3 α3 α3 ±

donde el signo − corresponde al determinante y el signo + al “permanente”.


Al escribir (3.70) hemos supuesto implı́citamente que tenı́amos solo una partı́cula
por estado (o sea que α1 , α2 y α3 eran diferentes entre sı́). Vemos de inmediato que
no podemos tener más de un fermión por estado, ya que en ese caso se anula el
determinante. Esta es otra manera de expresar el principio de exclusión de Pauli.
En cambio, cualquier número de bosones puede ocupar el mismo estado. Notemos,
sin embargo, que en el último caso la función de onda no está normalizada a uno.
En particular, si α1 = α2 , la función de onda normalizada para tres bosones es:
1
√ [φα1 (1)φα1 (2)φα2 (3) + φα1 (1)φα2 (2)φα1 (3) + φα2 (1)φα1 (2)φα1 (3)}
3
φα1 (1) φα1 (2) φα1 (3)
1
=√ φα1 (1) φα1 (2) φα1 (3)
3!2! φ (1) φ (2) φ (3)
α2 α2 α2 +
(3.72)
100 3.3 Partı́culas Independientes

Podemos entonces generalizar los resultados anteriores para N partı́culas, resultan-


do:
φα1 (1) φα1 (2) · · · φα1 (N )
1 φα2 (1) φα2 (2) · · · φα2 (N )
ΨA (1, 2, . . . , N ) = √ .. .. .. (3.28)
N! . . .
φαN (1) φαN (2) · · · φαN (N ) −

para fermiones (determinante de Slater), y

φα1 (1) φα1 (2) · · · φα1 (N )


1 φα2 (1) φα2 (2) · · · φα2 (N )
ΨS (1, 2, . . . , N ) = q .. .. .. (3.28)
N !nα1 !nα2 ! · · · nαN ! . . .
φαN (1) φαN (2) · · · φαN (N ) +

para bosones, donde de las N partı́culas, nα1 están en el nivel α1 , nα2 están en el
nivel α2 , etc., y por supuesto que se verifica que nα1 + nα2 + · · · + nαN = N .
Como ejemplo, consideremos solamente dos bosones de spin cero y dos fermiones
de spin 21 que pueden ocupar solo dos niveles. Usaremos la notación: φ(1) ≡ φ(r, s) =
ϕ(r)Υ(s). Si los bosones fueran partı́culas distinguibles tendrı́amos 4 estados distin-
tos:

ϕα1 (r1 ) ϕα1 (r2 ) (3.73)


ϕα2 (r1 ) ϕα2 (r2 ) (3.74)
ϕα1 (r1 ) ϕα2 (r2 ) (3.75)
ϕα2 (r2 ) ϕα2 (r1 ) (3.76)

con energı́as 2εα1 , εα2 y εα1 + cα2 ; el último nivel de energı́a es dos veces degenerado.
Sin embargo, los dos últimos estados son fisicamente indistinguibles y el único estado
permitido de 2 bosones idénticos [uno en ϕα1 (r) y el otro en ϕα2 (r)] es:

1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] (3.77)
2

o sea que no existe la degeneración del nivel εα1 + εα2 . En el caso de fermiones,
a cada estado (3.76) le corresponderı́an 4 estados debido al spin. Sin embargo, el
Partı́culas Idénticas 101

principio de exclusión nos dice que los únicos estados permitidos son:
ϕα1 (r1 ) ϕα1 (r2 ) Υ00 (s1 , s2 ) (3.78)
ϕα2 (r1 ) ϕα2 (r2 ) Υ00 (s1 , s2 ) (3.79)
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] Υ00 (s1 , s2 ) (3.80)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ11 (s1 , s2 ) (3.31)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,0 (s1 , s2 ) (3.81)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,−1 (s1 , s2 ) (3.82)
2
con energı́as 2εα1 (singlete), 2εα2 (singlete) y εα1 + εα2 (un singlete y 3 tripletes).

3.4. Átomos con dos electrones


Los átomos más simples, después del átomo de hidrógeno, son aquellos que tienen
solamente dos electrones, tales como He, H− , Li+ y Be++ . La interacción spin-órbita
es una perturbación pequeña en átomos livianos y se puede despreciar en una primera
aproximación. Luego el Hamiltoniano es de la forma
H(1, 2) = H0 (1, 2) + V12 (3.83)
donde
p21 p2 Ze2 Ze2
H0 (1, 2) = + 2 − − (3.84)
2m 2m r1 r2
e2
V12 = (3.85)
|r1 − r2 |
En la aproximación de orden cero cada electrón está en el potencial Coulombiano
−Ze2 /r y el estado de energı́a más baja es aquel en el cual los dos electrones están
en el estado 1s de ese potencial, que resulta ser un singlete:
Ψ0 (1, 2) = ϕ1s (r1 ) ϕ1s (r2 ) Υ00 (s1 , s2 ) (3.86)
donde 3/2
1 Z

ϕ1s (r) = √ e−Zr/a0 (3.87)
π a0
y a0 es el radio de Bohr,
ℏ2
a0 = (3.88)
me2
102 3.4 Átomos con dos electrones

Dentro de la misma aproximación, la energı́a del estado fundamental es2

(0) Z 2 e2
E0 = 2ε1s = − = −2Z 2 Ry. (3.89)
a0
La corrección de primer orden se obtiene del valor medio de V12 para el estado (3.86):
ˆ
e2
∆E0 = d1d2 Ψ†0 (1, 2) Ψ0 (1, 2), (3.90)
|r1 − r2 |
donde ˆ ˆ
X
d1 ≡ dr1 . (3.91)
s1

Como
Υ†SM (s1 , s2 ) ΥSM (s1 , s2 ) = 1
X
(3.39)
s1 s2

obtenemos: 6 ˆ
e2 Z e−2Z(r1 +r2 )/a0

∆E0 = 2 dr1 dr2 (3.40)
π a0 |r1 − r2 |
Para hacer la integral usamos la relación:
ˆ
1 dk eik·(r1 −r2 )
= (3.92)
|r1 − r2 | 2π 2 k2
y entonces
6 ˆ ˆ 2
Z dk

∆E0 = e 2
dre−2Zr/a0 +ik·r . (3.93)
a0 2π 4 k 2
Como además, ˆ
16πZ/a0
dre−2Zr/a0 +ik·r = (3.94)
[k 2 + (2Z/a0 )]2
resulta: ˆ ∞
4Ze2 dx 5 Ze2
∆E0 = = (3.44)
πa0 0 (x2 + 1)4 8 a0
Es decir que la energı́a del estado fundamental en primer orden perturbativo es:

Ze2 5
 
(1) (0)
E0 = E0 + ∆E0 = − Z− (3.95)
a0 8
(1)
Para el átomo de helio Z = 2 y E0 = −5,5 Ry = −74, 8 eV, mientras que el valor
experimental es E0exp = −78,8 eV.
2
El Ry es una unidad de energı́a que corresponde a 1 Ry = e2 /2a0 = 13,6056923 eV.
Partı́culas Idénticas 103

Consideremos ahora el estado excitado que resulta de promover un electrón del


estado 1s al sstado 2s. De acuerdo a (3.82) las correspondientes funciones de onda
son:

ΨS=0,M =0 (1, 2) = ΦS (r1 , r2 ) Υ0,0 (s1 , s2 ) (3.96)


ΨS=1,M (1, 2) = ΦA (r1 , r2 ) ΥS=1,M (s1 , s2 ) (3.97)

donde ( )
ΦS (r1 , r2 ) 1
= √ [ϕ1s (r1 ) ϕ2s (r2 ) ± ϕ1s (r2 ) ϕ2s (r1 )]
ΦA (r1 , r2 ) 2
y
3/2 
1 Z Zr − 2a
 Zr
ϕ2s (r) = √ 2− e 0 (3.98)
4 2π a0 a0
(1) (0)
La energı́a perturbada es: E1 (S) = E1 + ∆E1 (S) donde3

(0) 3 Z 2 e2
E1 = ε1s + ε2s = −
4 a0
y * +
e2
∆E1 (S) = = D ± I,
|r1 − r2 |
con
ˆ
e2
D= dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r1 ) ϕ2s (r2 ) (3.99)
|r1 − r2 |
ˆ
e2
I = dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r2 ) ϕ2s (r1 ) (3.50)
|r1 − r2 |

El signo + corresponde a los estados de S = 0 y el − a S = 1.


Los elementos de matriz D e I se denominan, respectivamente, directo y de
intercambio. D es necesariamente positivo y los cálculos muestran que I tambı́een
(1) (1)
es positivo. Vemos por lo tanto que E1 (S = 0) > E1 (S = 1), o sea que la energı́a
del estado singlete es mayor, como se muestra en la figura ??. Para el átomo de helio
los valores experimentales son:

−4, 182
Ry = −56, 87 eV singlete - parahelio
E1exp =  (3.100)
−4, 350 Ry = −599, 16 eV triplete - ortohelio

de donde se obtiene que D ∼


= 23, 58 eV y I ∼
= 1,14 eV.
3
La perturbación es diagonal porque no conecta estados con distinto spin.
104 3.5 El método del “campo autoconsistente” a vuelo de pájaro

La interpretación fı́sica es la siguiente. En el caso del singlete la función de onda


espacial es simétrica y los dos electrones tienden de estar juntos. Luego el efecto de
la interacción Coulombiana es mayor, lo que hace que el estado singlete este menos
ligado. Es importante notar que, aunque el Hamiltoniano (3.83) no depende de spin,
la energı́a sı́ depende del spin total de los dos electrones; esta dependencia proviene
de la estadı́stica de Fermi-Dirac.

3.5. El método del “campo autoconsistente” a vue-


lo de pájaro
Cuanto más complejos se hacen los átomos, más complicado resulta un trata-
miento similar al utilizado en el caso del helio para determinar los niveles de energı́a.
Debe entonces apelarse a otras aproximaciones, entre las cuales se cuenta la del cam-
po autoconsistente, que resulta muy útil en este contexto. El método hace varias
suposiciones:
- Cada electrón en un sistema de muchos electrones es descripto por su propia
función de onda.
Esta suposición, hecha por Hartree [15], implica que cada electrón está sujeto
a un potencial único, resultante de su interacción con todos los demás electrones
y con el núcleo. Evidentemente, para conocer exactamente (si existiera) tal poten-
cial, deberı́amos conocer exactamente todas las funciones de onda de las restantes
partı́culas, de manera de poder calcular las densidades de carga y de ellas el po-
tencial. Al no poder hacerlo, se propone un potencial “realista” que aproxime la
situación, se calcula con él la función de onda aproximada, con ella se puede calcu-
lar una densidad de carga, con ella mejorar el potencial propuesto y ası́ siguiendo.
De allı́ el término de autoconsistente: en cada una de estas secuencias, se va logran-
do una auto consistencia entre la función de onda resultante y el potencial que la
produce.
- Se postula el siguiente potencial que actúa sobre el electrón iésimo, producido
por el núcleo y los demás electrones
ˆ
1 Z
|ψk,κ (ρ)|2 −
X
Vi (ri ) = dρ →
− (3.101)
k̸=i | ri − ρ| ri

Aquı́ κ representa el conjunto de números cuánticos del electrón k. Cada término


de la suma representa la densidad de carga (recordemos que en nuestras convenciones
e = 1 ) producida por cada uno de los k ̸= i electrones. Convolucionada con la
función de Green del laplaciano esta fórmula reproduce la energı́a potencial del
electrón en el campo coulombiano de los otros electrones. En cuanto al segundo
término en (10.29) representa la contribución del núcleo a la energı́a potencial. Si hay
Partı́culas Idénticas 105

N electrones, cada uno obedecerá entonces una ecuación de Schrödinger estacionaria


de la forma
1
 
− ∇2 + Vi (r) ψi,ι (r) = ϵi ψi,ι (r) (3.102)
2
En este punto se hace una tercera aproximación:
- Se impone manu militari simetrı́a esférica al problema. Para ello, en lugar de
usar en (10.30) el potencial (10.29), se utiliza uno que resulta de integrar Vi (r) sobre
los ángulos:
ˆ
1
Vi (r) ≡ sin θdθdφVi (r) (3.103)

de manera que la ecuación de Schrödingar independiente del tiempo pasa a ser
separable en coordenadas esféricas:
1
 
− ∇2 + Vi (r) ψi,ι (r) = ϵi ψi,ι (r) (3.104)
2
Se escribe entonces
1 i
ψi,ι (r, θ, φ) = Rn,l (r)Ylm (θ, φ) (3.105)
r
i
con Rn,l la parte radial que satisface
i
!
1 d2 Rnl l(l + 1) i
+ ϵn,l − Vi (r) − Rnl = 0 i = 1, 2, . . . , N (3.106)
2 dr2 2r2
Aquı́ n queda definido tomándolo tal que la función de onda Rnl tenga n − l − 1
nodos (recordar el átomo de hidrógeno; no se incluye ni el cero del origen ni el del
infinito).
Aún con todas estas simplificaciones, es evidente que dado que Vi (r) es una
función en principio complicada de r y se trata de un sistema de N ecuaciones,
(10.34) es de difı́cil solución. La idea de Hartree es comenzar por hacer una “elección
inteligente” de funciones de onda de todos los electrones, sin atenerse al sistema
de ecuaciones que éstas deben obedecer. Con ellas se calcula el potencial Vi (r) y
recién entonces se resuelve con este potencial el sistema (10.34). Se obtiene entonces
funciones de onda que son un poco mejores que las propuestas inicialmente, con ellas
se vuelve a calcular el potencial y ası́ siguiendo hasta que el cambio entre una etapa
y la siguiente sea menor que el error que se pretende para la determinación de los
niveles de energı́a.
En este tratamiento no entra, en ninguna etapa la condición de que la función de
onda del sistema de N electrones debe ser antisimétrica por tratarse de partı́culas
idénticas de spin 1/2. En realidad, se está tomando la función de onda del sistema
106 3.6 El método variacional de Hartree-Fock

como el simple producto de funciones de onda con lo que la interacción de intercam-


bio es despreciada. Se puede sin embargo tener en cuenta al menos el principio de
exclusión de Pauli eligiendo los números cuánticos de cada función de onda adecua-
damente, de manera que no haya dos electrones en el mismo estado.
Estos problemas serán resueltos generalizando el método a lo que se conoce como
aproximación de Hartree-Fock. En lugar de tomar a la función de onda del sistema
como el mero producto, se construye el determinante de Slater, asegurando ası́ la
antisimetreı́a de la función de onda. En cuanto a las interacciones de intercambio,
se tratan de manera perturbativa, como se hizo en el caso del helio.

3.6. El método variacional de Hartree-Fock


Para incluir los efectos de la antisimetrı́a de la función de onda de un sistema de
N fermiones idénticos en el método de Hartree estudiaremos un método variacional
que parte de elegir como función de onda de prueba para describir al sistema a una
que, como determinante de Slater se expresa ası́:

ψ1 (2) · · · ψ1 (N )
ψ1 (1)
1 ψ2 (2) · · · ψ2 (N )
ψ2 (1)
Ψ= √ ..
.. .. .. (3.107)
N! .. . .
ψN (1) ψN (2) · · · ψN (N )
Cada función de onda de una partı́cula (se las llama orbitales para el caso de
electrones en un átomo) es el producto de una parte espacial u y una de spin χ :

ψi (p) = ui (rp ) χi (σp ) (3.108)


Aquı́ χ tiene la forma
! !
σ1 1
χ1 = =
2 σ2 0
! ! (3.109)
σ1 0
χ− 1 = =
2 σ2 1
Las funciones de onda de partı́cula independiente serán ortogonales,
ˆ
d3 xp ψi (p)ψj (p) = δij (3.110)

lo que se reduce, en vista de (6.43) a


ˆ
d3 xp ui (rp ) uj (rp ) = δij (3.111)
Partı́culas Idénticas 107

El valor de expectación de cierto operador F̂ calculado con funciones de onda


como la definida por (11.1)toma la forma

ˆ N N
D E 1 ∗
ψiA (Qi ) F̂ ψPBj (j)d3 xj
XX Y Y
ΨA |F̂ |ΨB = εP εQ (3.112)
N! P Q i=1 j=1

donde hemos usado en el segundo factor que, bajo el producto, vale que ψjB (Pj ) =

Es decir, para ψiA permutamos los electrones y para ψPBj los estados.
ψPBj (j).
Vamos ahora a escribir al producto doble como un único producto. Para ello
notemos que podemos escribir j = Qi, ya que de ambas maneras se recorren los N
valores posibles de las funciones de onda de cada electrón. Se tendrá entonces

ˆ N
D E 1 ∗
ψiA (Qi)F̂ ψPBQi (Qi)d3 xQi
XX Y
ΨA |F̂ |ΨB = εP εQ (3.113)
N! P Q i=1

Notemos que εP εQ = εP Q ası́ que podemos escribir


ˆ N
1 ∗
d3 xi ψiA (i)F̂ ψPBQi (i)
X Y
⟨F ⟩ = εP Q (3.114)
N! Q,P Q i=1

donde hemos redefinido a la variable x haciendo xQi → xi . Tomamos como


ı́ndices de suma Q y P Q, por lo que no habrá signo para las permutaciones de Q.
Como además la integral no depende de Q, al sumar sobre Q se tendrá N ! términos
idénticos, de manera que
ˆ N

d3 xi ψiA (i)F̂ ψPBQi (i)
X Y
⟨F ⟩ = εP Q (3.115)
PQ i=1

o, haciendo P Q → P
ˆ N

d3 xi ψiA (i)F̂ ψPBi (i)
X Y
⟨F ⟩ = εP (3.116)
P i=1

Consideremos los tres casos siguientes: 1. F̂ = 1 : La ortogonalidad de las funcio-


nes de onda hace que los términos de la suma sean cero salvo aquella permutación
P para la que ψiA (i) = ψPBi (i) para todo i. Si asignamos a esa permutación el signo
+ tendremos

⟨1⟩ = 1 (3.117)
2. F̂ = fˆj : donde fˆj es un operador de un electrón. Al insertar este F̂ en cada
P

término de la suma, sólo se entera de la presencia del operador la función de onda


108 3.6 El método variacional de Hartree-Fock

j-ésima por lo que el resto debe, por ortogonalidad, acomodarse de manera que los
ı́ndices coincidan. Simplificando la notación podemos escribir
XD E
⟨F̂ ⟩ = i fˆi i (3.118)
i

Muchas veces sucede que f1 = f2 = . . . y en ese caso se tiene

⟨i|fˆ|i⟩
X
⟨F̂ ⟩ = (3.119)
i
P
3. F̂ = ij ĝij : es decir, ĝ es un “operador de dos electrones”. Con argumentos
similares a los anteriores se tendrá
X
⟨F ⟩ = (⟨ij |gij | ij⟩ − ⟨ij |gij | ji⟩) (3.120)
i<j

Estamos ahora en condiciones de atacar el problema de un átomo de muchos


electrones. El hamiltoniano a estudiar es

X 1 2 Z X 1
Ĥ = ∇ − + (3.121)
i 2 i ri i<j rij
| {z
P } |P{z }
fi gij

Podemos escribir

ˆ
d3 ru∗i (r)f ui (r) +
X X
⟨Ĥ⟩ = (⟨ij|g|ij⟩ − ⟨ij|g|ji⟩) = h1 + h2
i i<j
(3.122)
1 Z
f = − ∇2 −
2 r

1
g= (3.123)
r
Además de las funciones de onda espaciales u(r), deberemos tener en cuenta las
funciones de onda de spin χ(σ) ya que sobre la parte que contiene g no se factorearán
trivialmente. Las tomaremos ortogonales según

χ∗i (σ)χj (σ) = δmsi msj


X
(3.124)
σ

Para la segunda suma h2 tendremos entonces


Partı́culas Idénticas 109

ˆ
1
d3 r1 d3 r2 u∗i (r1 ) u∗j (r2 ) ui (r1 ) uj (r2 ) |χi (σ1 )|2 |χj (σ2 )|2 −
X X
h2 =
i<j σ1 σ2 r12
ˆ 3
1
r1 d3 r2 ui (r2 ) uj (r1 ) χ∗i (σ1 ) χj (σ1 ) χ∗j (σ2 ) χi (σ2 )
u∗i (r1 ) u∗j (r2 )
X X

i<j σ1 σ2 r12
(3.125)
Después de un poco de álgebra tendremos
ˆ
1 
d3 r1 d3 r2 |ui (r1 )|2 |uj (r2 )|2 −
X
h2 =
i<j r12 (3.126)

∗ ∗
δmsi msj ui (r1 ) uj (r2 ) ui (r2 ) uj (r1 )
A esta altura, utilizaremos un método variacional, exigiendo

δ⟨Ĥ⟩ = δh1 + δh2 = 0 (3.127)


donde δ = (δ/δui ) δui , con el vı́nculo
ˆ
d3 xu∗i uj = δij (3.128)

que puede ser incluido en la variación vı́a multiplicadores de Lagrange λij :


ˆ !
3 ∗
X
hλ = h1 + h2 + λij d xui uj − δij δmsi δmsj (3.129)
i<j

de manera que se tiene


X
hλ =h1 + h2 + δmsi msj ×
ij
ˆ ˆ ˆ ! (3.130)
2
λii 3
d x |ui | + λij d 3
xu∗i uj + λji d3
xu∗j ui

En cuanto a la parte de coordenadas, el problema estacionario toma la forma

!!
ℏ2 2 ℏ2 2 e2 e2 Z e2 Z
− ∇1 − ∇2 + − − −E ψ (r1 , r2 ) = 0 (3.131)
2me 2me r12 r1 r2
Hemos utilizado aquı́ unidades atómicas (“ua”) en que me = 1, e = 1, ℏ = 1, que
fue utilizado por Douglas Hartree4 para resolver el problema. Al final del cálculo se
4
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Central Field. Part I.
Theory and Methods, Mathematical Proceedings of the Cambridge Philosophical Society 24 (1928)
89 Cambridge Univ. Press.
110 3.6 El método variacional de Hartree-Fock

pueden restituir ambos parámetros fácilmente. Como las masas de los electrones son
iguales a 1 en estas unidades, podemos reacomodar la ecuación ası́

Z Z 1
  
∇21 + ∇22 +2 E+ + − ψ (r1 , r2 ) = 0 (3.132)
r1 r2 r12
Vemos que el cambio r1 ↔ r2 deja invariante al hamiltoniano por lo que las
autofunciones pueden ser escritas como autofunciones de energı́a y paridad definida,
con autovalor +1 (simétrica) o -1 (antisimétrica),

ψp (r1 , r2 ) = +ψp (r2 , r1 ) , parahelio


(3.133)
ψo (r1 , r2 ) = −ψo (r2 , r1 ) , ortohelio
Como la función de onda total (9.18) debe ser antisimétrica, necesariamente la
parte de spin tendrá que tener la simetrı́a opuesta a la de la parte de coordenadas,

χp (σ1 , σ2 ) = −χp (σ2 , σ1 ) , parahelio


(3.134)
χo (σ1 , σ2 ) = +χo (σ2 , σ1 ) , ortohelio
Ya vimos que la función de onda de spin dos fermiones idénticos con s = 1/2
que se acoplan para dar un spin total S = 0 es antisimétrica por lo que en este caso
el factor espacial debe ser simétrico (parahelio).
El factor de spin tiene entonces la forma

! ! ! ! !
1 1 0 0 1
χp = √ − parahelio, singulete s = 0 (3.135)
2 0 1
1 2
1 1
0 2

24
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Cen-
tral Field. Part I. Theory and MethodsMathematical Proceedings of the Cambridge
Philosophical Society 24 (1928) 89 Cambridge Univ. Press. Aplicando el operador
ŝ2 escrito en la forma (9.12) a la autofunción (9.23) se ve fácilmente que s = 0.
También es fácil ver que cuando los spines se acoplan para dar s = 1, las funciones
de onda de spin son simétricas y el factor espacial entonces debe ser antisimétrico,
(ortohelio):

! !
0 0
χ−1
o = ortohelio, triplete sz = −1
1 1
1 2
! ! ! ! !
1 1 0 0 1
χ0o =√ + ortohelio, triplete sz = 0 (3.136)
2 0 1
1 2
1 1
0 2
! !
1 1
χ1o = ortohelio, triplete sz = +1
0 1
0 2
Partı́culas Idénticas 111

3.7. Cálculo perturbativo


Para estudiar las funciones de onda de coordenadas, se debe apelar a un método
perturbativo. Se comienza por escribir al hamiltoniano en la forma

Ĥ = Ĥ0 + λĤp (3.137)


Escribiremos a Ĥ0 y Ĥp en la forma
1 2 
Ĥ0 = − ∇1 + ∇22 + V1 (r1 ) + V2 (r2 )
2
Z Z 1 (3.138)
Ĥp = − − V1 (r1 ) − − V2 (r2 ) +
r1 r2 r12
donde se suma dos potenciales V1 (r1 ) y V2 (r2 ) en principio arbitrarios en la
primera lı́nea y se los resta en la segunda (de manera que, en conjunto nada se ha
cambiado). Pero su rol es el siguiente: una elección adecuada hará que
1. Ĥ0 ψ = E0 ψ sea un problema resoluble.
2. De manera de poder considerarlo que λĤp sea una pequeña perturbación a
tratar en el marco de la teorı́a de perturbaciones
Aquı́ λ es, como aprendimos al estudiar la teorı́a de perturbaciones, un parámetro
introducido para controlar el orden de las perturbaciones) Como Ĥ0 se separó en
una parte que solo depende de las coordenadas r1 y otra que solo depende de r2 , a
orden cero de perturbaciones la función de onda será un producto, adecuadamente
simetrizado (parahelio) o antisimetrizado (ortohelio), de funciones de onda de una
partı́cula. Habrá entonces para el hamiltoniano Ĥ0 tres tipos de soluciones a orden
cero:
- Cada partı́cula está en el estado fundamental, lo que corresponde al estado
fundamental del Helio
- una solución está en el estado fundamental y la otra en un estado excitado.
- ambas partı́culas estan en estados excitados
Para el caso del Helio, solo los estados con al menos un electrón en el fundamental
son importantes ya que cuando ambos están en estados excitados se encuentra que
tienen más energı́a que la suma del ion He+ + un electrón libre y por lo tanto por lo
que ese estado se desintegrará en un ion y un electrón libre.
Comencemos entonces por el caso en que ambos electrones están en el estado
fundamental. Si bien en general podrı́amos tomar V1 ̸= V2 , la elección más simple y
obvia será
Z
V1 (r) = V2 (r) = − (3.139)
r
que corresponde a resolver para H0 un caso que estudiamos ya para átomos
hidrogenoides ya que no hay interacción entre ellos.
112 3.7 Cálculo perturbativo

Con esto, la única perturbación a tratar es 1/r12 y la funciones de onda sin per-
turbar para el estado fundamental corresponderá al productos de dos funciones de
onda ψ (0) del estado fundamental de átomos hidrogenoides. Como se trata de un pro-
ducto de funciones idénticas ya que ambos electrones están en el estado fundamental,
el resultado solo puede ser simétrico (parahelio). Debe ir acompañado entonces por
una función de onda de spin que es antisimétrica y está dada por (9.23).
Tendremos entonces, para el nivel fundamental, como función de onda de coor-
denadas, sin perturbar, el producto de las soluciones obtenidas para átomos hidro-
genoides

Z3
ψp(0) (r1 , r2 ) = ψ (0) (r1 ) ψ (0) (r2 ) = exp (−Z (r1 + r2 )) (3.140)
π
En cuanto a la energı́a E, escribiendo

E = E (0) + λE (1) + . . . (3.141)


tendremos
ˆ
(1) Z6 1 5
λE = 2 d3 r1 d3 r2 exp (−2Z (r1 + r2 )) = Z ua (3.142)
π r12 8
Nótese que los términos de potenciales individuales en Ĥp se cancelan con la
elección que hicimos para V1 y V2 y la integral se calcula fácilmente expandiendo
1/r12 en armónicos esféricos.
En el caso del Helio se tiene Z = 2 con lo que, siendo que

(Z = 2)2
E (0) = −2 = −4 ua (3.143)
2(n = 1)2
se tendrá, como corrección al primer orden
5
E = −4 += −2,75 ua (3.144)
4
un valor en buen acuerdo con la medida experimental que es un 5 % menor,
exp
E = −2,904 ua. El cálculo perturbativo se puede mejorar teniendo en cuenta que
cada electrón apantalla la carga del núcleo.
En cuanto a los estados excitados del helio, que como dijimos corresponde a un
electrón en el estado fundamental y el otro en uno excitado, discutiremos en lo que
sigue un aspecto importante del cálculo perturbativo. Para comenzar, si r1 = r2
la función de onda espacial antisimétrica (ortohelio) se anula. Esto no sucede para
la simétrica (parahelio) por lo que la probabilidad de que los dos electrones estén
muy cerca es más pequeña para los estados orto que en los estados para. Luego,
en el estado “para” los electrones pueden llegar a estar muy cerca y por lo tanto la
Partı́culas Idénticas 113

energı́a de tales estados tiene que ser más alta. En resumen, el esquema de niveles
del átomo de helio o iones con dos electrones tiene un estado de energı́a mı́nima que
corresponde al parahelio. En cuanto a los estados excitados, (que corresponderán a
uno de los electrones en el estado fundamental y el otro en uno excitado), es mayor
la energı́a de los estados para que de los estados orto.
Capı́tulo 4

Segunda cuantificación

Queremos considerar ahora el caso de muchas partı́culas cuánticas. Normalmente


este es un problema que sabemos muy bien cómo tratar en mecánica cuántica: si
conocemos el espacio de Hilbert H1 de una sola partı́cula y una base completa |α⟩
ortogonal,
⟨α|α′ ⟩ = δαα′ ,
X
|α⟩⟨α| = 1, (4.1)
α

sabemos que para N partı́culas tenemos un espacio de Hilbert que se construye como
el producto directo (tensorial) de los espacios individuales:
N
O
HN = H1 ⊗ H2 ⊗ · · · ⊗ HN = Hi , (4.2)
i=1

y que una base completa de tal espacio es simplemente

|α1 , α2 , . . . , αN ) ≡ |α1 ⟩ ⊗ |α2 ⟩ · · · |αN ⟩, (4.3)

el estado factorizado de N partı́culas independientes. Aquı́ utilizamos a notación


| · · · ) para indicar que el estado no posee ninguna simetrı́a frente al intercambio de
partı́culas.
Debemos resolver entonces una ecuación de Schrödinger con una función de onda
que depende de las N variables ri correspondientes a las N partı́culas,

Ψ(r1 , r2 , . . . , rN ) = (r1 , r2 , . . . , rN |α1 , α2 , . . . , αN ). (4.4)

Aunque este es un programa perfectamente aceptable cuando el número de partı́culas


es pequeño, es particularmente inadecuado para abordar el caso de muchos fermiones
o bosones cuánticos interactuantes, por varias razones.
La primera razón tiene que ver con la indistinguibilidad de las partı́culas. Inclu-
so si son libres entre ellas, no todos los estados son aceptables para las funciones

114
Segunda cuantificación 115

de onda de N partı́culas indistinguibles, para las que sólo se permiten las funcio-
nes de onda totalmente simétricas (para bosones) o antisimétricas (para fermiones).
Esto significa que incluso para partı́culas que no interactúan no podemos usar di-
rectamente estados producto de la forma (4.3) y debemos lidiar con sus versiones
simetrizadas o antisimetrizadas,
1 X
|α1 . . . αN ⟩S = q Pν |α1 . . . αN ), (4.5)
N !nα1 ! . . . nαN ! ν
1 X
|α1 . . . αN ⟩A = √ (−1)sν Pν |α1 . . . αN ), (4.6)
N! ν
que se obtienen del estado factorizado (4.3) aplicando los operadores de simetrización
o antisimetrización (3.29), al igual que las funciones de onda (3.28) y (3.28). En
cierto modo, el hecho de que tengamos que tratar con partı́culas indistinguibles
ya introduce correlaciones en la función de onda incluso cuando las interacciones
no están presentes. La función de onda se vuelve bastante complicada ya que deben
estar correctamente (anti-)simetrizadas y normalizadas, lo que las hace muy difı́ciles
de manejar. que se escriban en la forma de un determinante ayuda un poco para los
cálculos prácticos, pero no mucho. En resumen, incluso para los electrones que no
interactúan, ¡habrı́a que tratar con funciones de onda que contienen 1023 ! términos,
lo cual es realmente desagradable.
El segundo problema está relacionado con la forma en que representamos a los
operadores en la mecánica cuántica estándar. Si consideramos, por ejemplo, un ope-
rador que mide el momento total de un sistema de partı́culas, este tiene que escribirse
como una suma de operadores que actúan sobre cada partı́cula individualmente:
N
X
Ptot = Pi (4.7)
i=1

donde Pi es el operador que actúa sobre la partı́cula i-ésima. Téngase en cuenta que
esto es un abuso de notación ya que Ptot es un operador de HN , que rigurosamente
se debe escribir como
Pi = 1 ⊗ 1 ⊗ . . . ⊗ P ⊗ . . . ⊗ 1, (4.8)
donde 1 es la identidad y P se inserta en la posición i-ésima. El operador y las fun-
ciones de onda dependen ası́ explı́citamente del número de partı́culas. Por lo tanto,
uno deberı́a cambiar completamente todo el cálculo dependiendo de si miramos 2
o 20000 partı́culas, lo que nuevamente es particularmente molesto. También impide
tomar de manera directa el lı́mite termodinámico N → ∞ cuando el volumen de los
sistemas también tiende a infinito. Dada la gran cantidad de partı́culas, está claro
que tomar este lı́mite es lo deseable ya que simplificarı́a mucho los cálculos1 .
1
Trabajar en el lı́mite termodinámico es deseable, además, porque es allı́ donde ocurren verda-
deramente las transiciones de fase.
116 4.1 Espacio de Fock

Una tercera razón, quizás más profunda y más fı́sica, y que definitivamente liqui-
da la posibilidad de utilizar la mecánica cuántica usual, es que ¡en muchos sitemas el
número de partı́culas no se conserva! Esto puede ocurrir por varias razones, por ejem-
plo, en sistemas de altas energı́as, porque buscamos describir sistemas de partı́culas
que pueden aniquilarse y convertirse en otras, tales como electrones y positrones. O
para un ejemplo más ligado a los materiales, mencionemos el modelo BCS para un
superconductor, que discutiremos en el capı́tulo siguiente. Veremos que las cuasi-
partı́culas fermiónicas que son responsables de la superconductividad se forman por
una superposición de electrones y huecos y no se conservan en número.
Por estas razones, debemos buscar una reformulación de la representación estándar
de la mecánica cuántica (también conocida como primera cuantificación) para siste-
mas de varias partı́culas indistinguibles. Idealmente deberı́amos hallar un formalismo
que se ocupe automáticamente de lo siguiente:

1. Que la simetrización o antisimetrización se realizara de manera automática sin


tener que tratar explı́citamente con N ! términos.

2. Que la forma de describir el sistema no dependa explı́citamente del número de


partı́culas presentes en él. Esto deberı́a permitir tomar el lı́mite termodinámico
fácilmente y también abordar situaciones más generales en las que el número
de partı́culas puede cambiar.

Esto lo proporciona el llamado método de “segunda cuantificación”2 que describire-


mos en este capı́tulo.

4.1. Espacio de Fock


La idea básica es convertir el hecho de que las partı́culas sean indistinguibles en
una ventaja. De hecho, si este es el caso, significa que no es necesario conocer el
estado cuántico de cada partı́cula individual, sino simplemente cuántas partı́culas
hay en un estado cuántico dado. Supongamos que uno tiene una base completa |α⟩
de estados para una sola partı́cula. En general, esta base es infinita, pero tomemos
por conveniencia un espacio de dimensión finita d y un número finito de estados.
Siempre podemos tomar d → ∞3 .Ası́, denotamos todos los estados en esta base
como
|α1 ⟩, |α2 ⟩, . . . , |αd ⟩, (4.9)
2
La terminologı́a usual de “primera” y “segunda” cuantificación es bastante desafortunada. Da
a entender que hay otro objeto que ahora se está cuantificando, más especı́ficamente la función de
onda, pero esto es incorrecto, como veremos más adelante.
3
Por supuesto que siempre existen sistemas donde d es finita. Por ejemplo, un spin 12 .
Segunda cuantificación 117

Téngase en cuenta que el tamaño de la base no está relacionado con la cantidad


de partı́culas que están presentes en el sistema. Para los bosones, por ejemplo, uno
podrı́a tener una base completa de los estados de una partı́cula que contienen solo dos
estados y tener 10000 bosones presentes en el sistema (ya que varios de ellos pueden
ir en el mismo estado cuántico). Para los fermiones, por supuesto, el número total
de partı́culas siempre es menor que el número total de estados disponibles debido
al principio de Pauli. Podemos describir completamente el sistema y reconstruir su
función de onda si conocemos el número de partı́culas ni en cada estado |αi ⟩ de
la base completa de estados de partı́culas individuales, y por lo tanto, podemos
caracterizar completamente la función de onda del sistema mediante el conjunto de
números n1 , n2 , . . . , nd . El número total de partı́culas en el sistema es, por supuesto,
N = n1 + n2 + · · · + nd , y puede variar si uno varı́a uno de los ni .
Definamos entonces un espacio en el que puedan existir un número arbitrario de
partı́culas. Si llamamos HN al espacio de Hilbert con N partı́culas, como en la ec.
(4.2), podemos definir

+∞
M
F = H0 ⊕ H1 ⊕ H2 . . . = Hj (4.10)
j=0

que es la suma directa de todos los espacios de Hilbert con 0, 1, 2, etc. partı́culas.
Tal espacio se llama espacio de Fock. En este espacio definamos ahora el estado

|n1 , n2 , n3 , . . . , nd ⟩ (4.11)

como los estados simetrizados o antisimetrizados (4.5) y (4.6). Es. decir, en lugar de
rotular a esos estados mediante el conjunto αi de estados estados de partı́cula inde-
pendiente en el que está cada. partı́cula, los rotulamos por el número de partı́culas
que contiene cada uno de ellos. Dos estados de la forma (4.11) que tienen un número
diferente de partı́culas N pertenecen a dos espacios de Hilbert diferentes y, por lo
tanto, son obviamente ortogonales en el espacio de Fock. Para sistemas con el mismo
número total de partı́culas, se puede verificar usando (4.5) y (4.6) que los estados
(4.11) para una base ortogonal y normalizada satisfacen

⟨n1 , n2 , . . . , nd |n′1 , n′2 , . . . , n′d ⟩ = δn1 ,n′1 δn2 ,n′2 · · · δnd ,n′d (4.12)

Por lo tanto, podemos usar la base (4.11) para caracterizar cada operador y elemento
de matriz en el espacio de Fock. Como se mencionó antes, esta base es extremada-
mente conveniente ya que se basa en la cantidad mı́nima de información necesaria
para describir un sistema de partı́culas indistinguibles. En particular, el número de
“contadores” ni necesarios no crece con el número total de partı́culas.
118 4.2 Operadores de creación y destrucción

4.2. Operadores de creación y destrucción


Introduciremos a continuación un conjunto de operadores que nos permitirá ge-
nerar todos los elementos de la base (4.11). Para cada estado αi de la base completa
de una sola partı́cula, definimos un operador de creación y destrucción, que aumen-
tará o disminuirá en uno el número de partı́culas en este estado particular. De este
modo, podremos usar estos operadores para modificar el contador ni dando el núme-
ro de partı́culas en un estado cuántico dado, y ası́ abarcar todo el espacio de Fock.
La definición práctica de estos operadores es diferente dependiendo de la estadı́stica
de las partı́culas.

Bosones
Introducimos los operadores de creación a†i y destrucción ai por su acción sobre
todos los estados de una base completa en el espacio de Fock, en la forma

a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩,
√ (4.13)
ai |n1 , . . . , ni , . . . , nd ⟩ = ni |n1 , . . . , ni − 1, . . . , nd ⟩.

Estas definiciones determinan por completo a los operadores por sus elementos de
matriz en la base de números de ocupación (4.11). Comprobemos que los operadores
a†i y ai son efectivamente hermı́ticos conjugados uno del otro. Dado que (4.11) es
una base ortogonal, el único elemento de matriz distinto de cero para a†i es

⟨n1 , . . . , ni + 1, . . . , nd |a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1. (4.14)

Tomando el complejo conjugado de esta expresión se obtiene



⟨n1 , . . . , ni , . . . , nd |ai |n1 , . . . , ni + 1, . . . , nd ⟩ = ni + 1, (4.15)

que de hecho es exactamente la definición del operador ai en (4.13) (con el reemplazo


de ni por ni + 1). Otra propiedad importante de los operadores es que solo abarcan
el espacio de Fock. De hecho, aunque parece formalmente de (4.13) que el operador
ai podrı́a operar en un estado que tiene ni = 0 partı́culas en el estado αi el prefactor
en la definición asegura que el elemento de matriz correspondiente es cero:

ai |n1 , . . . , ni = 0, . . . , nd ⟩ = 0, (4.16)

y ası́, si uno intenta aplicar el operador de destrucción en un estado que no tiene


ninguna partı́cula en el estado cuántico correspondiente, obtiene un resultado trivial,
lo que significa que no se pueden generar estados no fı́sicos con números de ocupación
negativos.
Segunda cuantificación 119

Si definimos el estado que no contiene partı́culas en ninguno de los estados cuánti-


cos (a veces denominado vacı́o) en la forma

|0⟩ = |n1 = 0, n2 = 0, . . . , nd = 0⟩, (4.17)

se verifica que a partir de este vacı́o |0⟩ y los operadores a†i podemos construir todos
los vectores de la base completa del espacio de Fock, ya que

(a†1 )n1 . . . (a†d )nd


|n1 , . . . , ni , . . . , nd ⟩ = √ √ |0⟩. (4.18)
n1 ! . . . nd !

Por lo tanto, uno puede generar completamente el espacio de Fock desde el estado
único |0⟩ mediante los operadores de creación (y destrucción ya que son conjugados
hermı́ticos). El vacı́o verifica la propiedad de que para cualquier i

ai |0⟩ = 0 (4.19)

Debemos tener cuidado de no mezclar el vacı́o |0⟩, que es un vector del espacio de
Fock, y uno sobre el que los operadores pueden actuar para dar otros estados del
espacio de Fock, con el cero 0.
Los operadores de creación y destrucción constituyen ası́ una manera muy conve-
niente de describir el espacio de Fock. En lugar de definirlos a partir de sus elementos
de matriz en una base dada, tal como (4.11), es más conveniente definirlos a par-
tir de sus propiedades intrı́nsecas. Mostremos que la definición (4.13) implica que
los operadores a†i y ai poseen ciertas relaciones de conmutación especı́ficas. Y a la
inversa, si se obedecen estas relaciones de conmutación, entonces los operadores, y
el vacı́o correspondiente definido por (4.17), servirán para construir un espacio de
Fock a partir de (4.18) en el que tendrán los elementos de matriz (4.14) y (4.15).
Calculemos primero la acción de un producto de dos operadores de creación a†i

y aj en estados distintos (i ̸= j) sobre un estado arbitrario de la base:
q
a†i a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj + 1|n1 , . . . , ni , . . . , nj + 1, . . . , nd ⟩
√ q (4.20)
= ni + 1 nj + 1|n1 , . . . , ni + 1, . . . , nj + 1, . . . , nd ⟩.

y es fácil comprobar que la acción de a†j a†i producirá exactamente el mismo resultado.
Ası́, para cualquier elemento de la base se tiene
h i
a†i , a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = 0, (4.21)

lo que significa que h i


a†i , a†j = 0. (4.22)
120 4.2 Operadores de creación y destrucción

Dado que un operador conmuta consigo mismo, esto también es cierto cuando i = j.
Tomando el hermı́tico conjugado del conmutador anterior obtenemos
[ai , aj ] = 0. (4.23)
Veamos ahora qué ocurre si calculamos la acción del producto de un operador
de destrucción con uno de creación, siempre con (i ̸= j):

a†i aj |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj |n1 , . . . , ni , . . . , nj − 1, . . . , nd ⟩
√ √ (4.24)
= ni + 1 nj |n1 , . . . , ni + 1, . . . , nj − 1, . . . , nd ⟩

y deh manera i similar la acción de aj ai (con i ̸= j ) darı́a el mismo resultado. Se tiene
ası́ a†i , aj = 0 cuando i ̸= j. El caso i = j es especial. Por un lado tenemos que

a†i ai |n1 , . . . , ni , . . . , nd ⟩ = a†i ni |n1 , . . . , ni − 1, . . . , nd ⟩
q √
= (ni − 1) + 1 ni |n1 , . . . , ni , . . . , nd ⟩ (4.25)

= ni |n1 , . . . , ni , . . . , nd ⟩,
y por otra parte

ai a†i |n1 , . . . , ni , . . . , nd ⟩ = ai ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩
√ √
= ni + 1 ni + 1|n1 , . . . , ni , . . . , nd ⟩ (4.26)

= (ni + 1)|n1 , . . . , ni , . . . , nd ⟩.
Concluimos entonces que
h i
ai , a†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩. (4.27)
Juntando los dos resultados, encontramos finalmente que el conmutador es
h i
ai , a†j = δi,j . (4.28)
Se puede entonces resumir las propiedades de los operadores de creación y des-
trucción mediante el conjunto de relaciones fundamentales
h i
ai , a†j = δi,j ,
h i
a†i , a†j = 0, (4.29)

[ai , aj ] = 0.
llamado también álgebra de los operadores. Junto con la acción de los operadores de
destrucción sobre el vacı́o (4.19), son equivalentes a las definición de los elementos
de matriz (4.15) y (4.14). Esto implica que si disponemos de
Segunda cuantificación 121

1. Una base completa |αi ⟩ de estados de partı́culas individuales (y las funciones


de onda correspondientes ⟨r|αi ⟩)

2. Operadores de creación y destrucción, a†i y ai , para cada uno de estos estados,


que obedecen relaciones conmutación canónicas (4.29).

3. Un vacı́o |0⟩ que es destruido por los operadores de destrucción ai |0⟩ = 0,

podemos construir completamente un espacio de Fock para bosones. La idea es


entonces explotar directamente las propiedades anteriores y utilizar las relaciones de
conmutación canónicas entre los operadores bosónicos para calcular las propiedades
fı́sicas, en lugar de las funciones de onda. Esta descripción se conoce como segunda
cuantificación.
Tomemos por ejemplo el siguiente estado de dos partı́culas:

|ψ⟩ = a†1 a†2 |0⟩ = |n1 = 1, n2 = 1⟩. (4.30)

y reconstruyamos la expresión para la función de onda usando. Se obtiene


1
Ψ(r1 , r2 ) = (r1 r2 |ψ⟩ = √ [φα1 (r1 )φα2 (r2 ) + φα1 (r2 )φα2 (r1 )] , (4.31)
2
que es la función correctamente simetrizada que describe dos bosones. Sin embargo,
el interés de la segunda cuantificación es apegarse a los operadores y sus relaciones
de conmutación y evitar volver a las funciones de onda, que en general son bastante
intratables. Por ejemplo, los operadores de creación conmuntan entre sı́, y por lo
tanto a†1 a†2 = a†2 a†1 . Entonces
a†1 a†2 |0⟩ = a†2 a†1 |0⟩, (4.32)
y ası́ la función de onda |ψ⟩ resulta ser simétrica por permutación de las partı́culas.
Los operadores de creación y destrucción están ası́ directamente diseñados para tener
en cuenta adecuadamente la simetrización de las funciones de onda y la indistingui-
bilidad de las partı́culas. De hecho, las relaciones de conmutación permiten obtener
directamente la información sin pasar por ningún proceso de simetrización. En par-
ticular, los promedios se pueden calcular directamente. Ilustrémoslo calculando la
normalización de la función |ψ⟩. Queremos calcular

⟨ψ|ψ⟩ = ⟨0|a2 a1 a†1 a†2 |0⟩. (4.33)

Aunque este es un ejemplo especı́fico, veremos que generalmente todos los observa-
bles fı́sicos se reducen al promedio en el vacı́o de un determinado producto de los
operadores de creación y destrucción, por lo que el método que describimos se puede
aplicar de manera general. Para calcular el promedio, lo único que necesitamos usar
es el hecho de que el vacı́o es destruido por tods los ai . Por tanto, utilizando las
122 4.2 Operadores de creación y destrucción

relaciones de conmutación, deberı́amos llevar los operadores ai a la dereha, de modo


de hacerlos actuar sobre el vacı́o. para actuar sobre el vacı́o. Primero escribimos
a1 a†1 = 1 + a†1 a1 de la relación de conmutación. Tenemos entonces

⟨ψ|ψ⟩ = ⟨0|a2 (1 + a†1 a1 )a†2 |0⟩,


(4.34)
= ⟨0|a2 a†2 |0⟩ + ⟨0|a2 a†1 a1 a†2 |0⟩.

En el segundo término podemos usar ahora la relación de conmutación a1 a†2 = a†2 a1


para reescribirlo como ⟨0|a2 a†1 a†2 a1 |0⟩ que inmediatamente da cero. Para el primero
usamoe de nuevo las relaciones de conmutación, y obtenemos

⟨ψ|ψ⟩ = ⟨0|a2 a†2 |0⟩ = ⟨0|(1 + a†2 a2 )|0⟩,


= ⟨0|1|0⟩, (4.35)
= 1.

Aunque los cálculos pueden volverse tediosos cuando crece el número de operadores,
la mecánica siempre es la misma, y con un poco de práctica se pueden acelerar.

Fermiones
Pasemos ahora a los operadores de creación y destrucción de fermiones. De ma-
nera similar que para los bosones, definimos

c†i |n1 , . . . , ni , . . . , nd ⟩ = (1 − ni )(−1)ϵi |n1 , . . . , ni + 1, . . . , nd ⟩,


(4.36)
ci |n1 , . . . , ni , . . . , nd ⟩ = ni (−1)ϵi |n1 , . . . , ni − 1, . . . , nd ⟩,

donde ϵi = i−1
P
j=1 nj y ϵ1 = 0. El orden de los elementos en la base debe fijarse una
vez, y utilizar siempre la misma convención, pero, por supuesto, es arbitraria.
En estas definiciones, algunos términos son bastante transparentes: dado que
para los fermiones el principio de Pauli impide que dos fermiones estén en el miso
estado, los números de ocupación ni están restringido a toar los valores 0 o 1 . Por
lo tanto, es importante que el operador de creación no pueda crear dos partı́culas en
un estado, lo cual queda asegurado por el factor 1 − ni que garantiza que si c†i actúa
sobre un estado con ni = 1 entonces la acción del operador dará cero. De manera
similar, el factor ni asegura que el operador de destrucción no puede destruir una
partı́cula en el estado para el cual ni = 0. La fı́sica del factor extraño (−1)ϵi no es
obvia por el momento, y uno podrı́a tener la tentación de definir los operadores sin
tal factor de fase. Veremos su utilidad un poco más adelante.
Procedemos ahora exactamente como con los bosones: comprobemos primero
que los operadores c†i y ci son efectivamente hermı́ticos conjugados uno del otro. De
Segunda cuantificación 123

hecho, los cálculos con fermiones son más simples en cierto sentido, ya que para cada
estado αi solo hay dos posibilidades ni = 0 o ni = 1 para el estado correspondiente.
El único elemento de matriz distinto de cero para el operador c†i es

⟨n1 , . . . , ni = 1, . . . , nd |c†i |n1 , . . . , ni = 0, . . . , nd ⟩ = (−1)ϵi . (4.37)

mientras que para ci el único elemento de matriz distinto de cero es

⟨n1 , . . . , ni = 0, . . . , nd |ci |n1 , . . . , ni = 1, . . . , nd ⟩ = (−1)ϵi . (4.38)

que obviamente es el complejo conjugado del otro.


Para continuar con las relaciones de conmutación y comprender el papel de los
coeficientes (−1)ϵi , veamos primero la acción de ci c†i . Como esto solo afecta al estado
αi , podemos simplemente considerar su acción sobre los dos estados con ni = 0 y
ni = 1:
ci c†i |n1 , . . . , ni = 0, . . . , nd ⟩ = (−1)ϵi ci |n1 , . . . , ni = 1, . . . , nd ⟩
= (−1)2ϵi |n1 , . . . , ni = 0, . . . , nd ⟩ (4.39)
= |n1 , . . . , ni = 0, . . . , nd ⟩
Por otro lado,
c†i ci |n1 , . . . , ni = 0, . . . , nd ⟩ = 0. (4.40)
Nótese que en este resultado los factores (−1)ϵi no juegan ningún papel, y podrı́amos
haber definido los operadores sin incluirlos. En forma similar,

ci c†i |n1 , . . . , ni = 1, . . . , nd ⟩ = 0
(4.41)
c†i ci |n1 , . . . , ni = 1, . . . , nd ⟩ = |n1 , . . . , ni = 1, . . . , nd ⟩.
h i
Se observa entonces que ci , c†i no tiene ninguna expresión simple. En cambio, el
anticonmutador n o
ci , c†i = ci c†i + c†i ci (4.42)
conduce a n o
ci , c†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩, (4.43)
y por lo tanto n o
ci , c†i = 1 (4.44)
Por lo tanto, se puede adivinar que en lugar del conmutador, es el anticonmutador el
que jugará un papel importante. El rol del factor (−1)ϵi será, por lo tanto, asegurar
que para las otras combinaciones también se obtengan relaciones simples para el
124 4.2 Operadores de creación y destrucción

anticonmutador. Ilustrémoslo con la acción de ci c†j con i ̸= j. Suponiendo que i < j,


tenemos que

ci c†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = (1 − nj )(−1)ϵj ci |n1 , . . . , ni , . . . , nj + 1, . . . , nd ⟩


= (1 − nj )(−1)ϵj ni (−1)ϵi |n1 , . . . , ni − 1, . . . , nj + 1, . . . , nd ⟩.
(4.45)
Por otro lado,

c†j ci |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = ni (−1)ϵi c†j |n1 , . . . , ni − 1, . . . , nj , . . . , nd ⟩


(4.46)
ϵ′j ϵi
= (1 − nj )(−1) ni (−1) |n1 , . . . , ni − 1, . . . , nj + 1, . . . , nd ⟩.

El término ϵ′j corresponde al factor de fase en un estado con ni − 1 en lugar de ni .


Ası́, ϵ′j = ϵj − 1. En ausencia de dichos términos de fase, las dos expresiones (4.45) y
(4.45) serı́an idénticas y tendrı́amos que [ci , c†j ] = 0. Gracias a los factores de fase ϵj
ahora tenemos un signo menos entre los dos términos y la relación se convierte en
n o
ci , c†j = 0, (4.47)

lo que permitirá definir los operadores ci sólo en términos de sus anticonmutadores.


Es fácil comprobar las restantes relaciones, y ası́ se tiene, de forma similar que para
los bosones, n o
ci , c†j = δi,j ,
n o
c†i , c†j = 0, (4.48)

{ci , cj } = 0.
Por otro lado, de la misma forma que para los bosones, se puede construir todos los
estados del espacio de Fock a partir de un vacı́o |0⟩ que es destruido por todos los
ci (ci |0⟩ = 0) usando la relación (4.18)
Las funciones de onda y los promedios se pueden calcular también con las mismas
técnicas que antes„ veamos como ejemplo la función de onda de dos fermiones en
los estados α1 y α2 :
|ψ⟩ = c†1 c†2 |0⟩. (4.49)
y entonces, de (??) la función de onda resulta
1
⟨r1 r2 |ψ⟩ = √ [α1 (r1 )α2 (r2 ) − α1 (r2 )α2 (r1 )] , (4.50)
2
que es, por supuesto, la función de onda correctamente antisimetrizada para fermio-
nes. Sin ir a la función de onda, se puede ver directamente la antisimetrización a
Segunda cuantificación 125

nivel de estados y operaores: usando la relación de anticonmutación {c1 , c2 } = 0 se


encuentra que
c†1 c†2 |0⟩ = −c†2 c†1 |0⟩, (4.51)
y ası́ la función de onda |ψ⟩ es obviamente antisimétrica por permutación de las
partı́culas.
El hecho de que el operador ci se ocupe automáticamente de la antisimetrización
hace que sea muy conveniente escribir incluso funciones complicadas. Por ejemplo, el
mar de Fermi, que corresponde al estado de N fermiones de menor energı́a posible,
se escribe
N

Y
|F ⟩ = cj |0⟩ (4.52)
j=1

Los promedios en el vacı́o se pueden calcular exactamente con la misma técnica


descripta para los bosones. Por ejemplo, si tomamos |ψ⟩ = c†1 |0⟩, entonces (usando
las relaciones de anticonmutación),
⟨ψ|ψ⟩ = ⟨0|ci c†i |0⟩

= ⟨0|1 − c†i ci |0⟩ (4.53)

= ⟨0|1|0⟩ = 1.
Generalizando el cálculo anterior puede mostrarse el mar de Fermi está crrectamente
normalizado, ⟨F|F⟩ = 1.

4.2.1. Operadores de un cuerpo


Ahora que tenemos definidos a los operadores que permiten construir todo el
espacio de Fock, lo que queda por resolver es expresar los observables fı́sicos que
queremos calcular en términos de estos operadores. Para hacerlo, debemos tener en
cuenta que los observables deben actuar sobre partı́culas indistinguibles, lo que esta-
blece algunas restricciones sobre su forma. Antes de dar sus expresiones en segunda
cuantificación, es conveniente clasificarlos de acuerdo al número de partı́culas sobre
las que actúan. Hay observables fı́sicos que miden solo los números cuánticos de una
partı́cula a la vez (tales como el momento, la densidad, etc.) y otros que necesitan
tratar con los números cuánticos de dos de las partı́culas para determinar sus ele-
mentos de matriz. Este es caso, por ejemplo, del operador que mide las interacciones
entre las partı́culas. El primer tipo se llama operadores de un cuerpo, mientras que
el segundo es de dos cuerpos. En principio, se pueden tener operadores que invo-
lucren más de dos partı́culas (tales como colisiones de tres cuerpos y más), pero
son de poca utilidad práctica en la fı́sica del estado sólido, por lo que discutiremos
principalmente aquı́ los de uno y dos cuerpos. Las fórmulas dadas aquı́ se pueden
generalizar fácilmente si es necesario.
126 4.2 Operadores de creación y destrucción

Definición
Comencemos primero con los operadores de un cuerpo. De manera bastante
general, llamemos O a un operador que representa alguna propiedad de una partı́cula
a la vez. Por supuesto, si O actúa en el espacio de Hilbert con N partı́culas, debe
actuar sobre cada partı́cula del sistema. Llamemos O(1) al operador que actúa en
el espacio de Hilbert de una sola partı́cula; el operador O correspondiente a las N
partı́culas debe ser
(1) (1) (1)
O = O1 ⊗ 12 ⊗ . . . ⊗ 1N + 11 ⊗ O2 ⊗ . . . ⊗ 1N + . . . + 11 ⊗ . . . ⊗ ON (4.54)
(1)
donde Oi es el operador que actúa sobre la partı́cula i-ésima. El hecho de que
en la suma anterior, todos los coeficientes sean idénticos, es la consecuencia directa
del hecho de que las partı́culas son indistinguibles, y no podemos distinguir en una
medida si un cierto conjunto de números cuánticos corresponeden a una u otra
partı́cula del sistema. La forma (4.54) es por lo tanto la forma más general posible
de un operador de un solo cuerpo para partı́culas indistinguibles.
Para expresar (4.54) en segunda cuantficación, debemos comenzar por analizar
qué sucede si tenemos un sistema con una sola partı́cula (si no hay ninguna partı́cula,
un operador de un cuerpo es trivialmente nulo). En ese caso O = O(1) y usando la
base completa α podemos escribir

|α⟩⟨α|O(1) |β⟩⟨β|,
X
O= (4.55)
α,β

y luego utilizamos que |α⟩ = c†α |0⟩ para obtener

⟨α|O(1) |β⟩c†α |0⟩⟨0|cβ .


X
O= (4.56)
α,β

La interpretación fı́sica de esta fórmula es bastante simple: el operador cβ destruye


una partı́cula en un estado β; como solo tenemos una partı́cula en el sistema, nos
vemos obligados a ir al vacı́o, luego, desde el vacı́o, el operador c†α recrea la partı́cula
en el estado α. El resultado neto es que todavı́a tenemos una partı́cula en el sistema
pero ha cambiado su estado cuántico al pasar del estado β al estado α. La amplitud
de dicha transición está dada por los elementos de matriz del operador O(1) entre
los estados β y α.
Si en lugar de una partı́cula tuviéramos ahora un número arbitrario de partı́culas
en el sistema, tendrı́amos que hacer exactamente lo mismo para cada una de ellas,
dejando invariantes los números cuánticos de las demás, como sugiere (4.54), y hacer
la suma. Un operador que logra esto está dado por la expresión

⟨α|O(1) |β⟩c†α cβ
X
O= (4.57)
α,β
Segunda cuantificación 127

que es idéntica a (4.56) excepto que no estamos obligados a ir al vacı́o después de


la destrucción de la partı́cula en el estado β. De hecho, si hay varias partı́culas, el
operador c†α cβ cambiará el número cuántico de una partı́cula del estado β al estado α
y dejará intactos los números cuánticos de todas las demás partı́culas del sistema. Sin
embargo, el operador cβ operará en todas las partı́culas del sistema y, por lo tanto,
hará esa transición para la primera, segunda, etc. realizando automáticamente la
suma en (4.54). La interpretación de (4.57) se muestra en la figura ??.
La expresión (4.57) permite ası́ representar cualquier operador de un solo cuerpo
en segunda cuantificación, conociendo sólo la acción del operador O(1) en el espacio
de una sola partı́cula. Nótese que las funciones de onda provenientes de la elección
de la base completa α sólo intervienen en el cálculo de los elementos de matriz
⟨α|O(1) |β⟩. Una vez que se calculan estos elementos de matriz, todo el operador se
reduce a una combinación lineal de operadores de creación y destrucción y, por lo
tanto, todos los promedios fı́sicos se pueden calcular mediante las técnicas descriptas
en la sección anterior, sin tener que volver a las funciones de onda. Por supuesto,
todos los aspectos de su simetrización o la antisimetrización son tenidos en cuenta
automáticamente por la naturaleza de los operadores de creación o destrucción.

Ejemplos
Comencemos con el operador que mide la densidad de partı́culas en un punto
r0 , que para una partı́cula se escribe

ρ(1) (r0 ) = |r0 ⟩⟨r0 |, (4.58)

debido a que ⟨ψ|ρ(1) (r0 )|ψ⟩ = |ψ(r0 )|2 . En segunda cuantificación la forma del ope-
rador dependerá de la elección de la base completa α que tomemos. Empecemos
tomando la base de autoestados de posición |r⟩, en cuyo caso, el operador c†r es el
operador que crea una partı́cula en el punto r. Usando esta base y la relación (4.57)
se obtiene ˆ
ρ(r0 ) = drdr ′ ⟨r|r0 ⟩⟨r0 |r ′ ⟩c†r cr′ ,
ˆ
= drdr ′ δ(r − r0 )δ(r0 − r ′ )c†r cr′ , (4.59)

= c†r0 cr0 .
La expresión c†r0 cr0 es particularmente simple de interpretar. El operador c†r0 cr0
destruye y recrea una partı́cula en el mismo estado cuántico. Por lo tanto, no ha
cambiado nada en el sistema. Sin embargo, la acción del operador cr0 dará cero si
no hay ninguna partı́cula a destruir en el estado cuántico correspondiente (aquı́ una
partı́cula en el punto r0 ). El operador c†r0 cr0 da cero si no hay ninguna partı́cula en el
128 4.2 Operadores de creación y destrucción

estado cuántico correspondiente y uno si hay una partı́cula. Por tanto, simplemente
cuenta el número de partı́culas en el punto r0 . Generalmente, el operador

n̂α = c†α cα , (4.60)

cuenta el número de partı́culas en el estado α na lpha. El operador que cuenta el


número total de partı́culas en el sistema está dado entonces por

ˆ
N̂ = dr c†r cr . (4.61)

La generalización al caso de partı́culas con spin es inmediata. Para ello la base


completa será α = (r, σ) y el operador densidad solo actúa en la parte espacial, por
lo tanto

ρ(1) (r0 ) = |r0 ⟩⟨r0 | ⊗ 1spin , (4.62)

y ası́ (4.57) da lugar a

ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 |r ′ σ ′ ⟩c†rσ cr′ σ′ ,
X
ρ(r0 ) =
σ,σ ′
ˆ
=
X
drdr ′ δ(r − r0 )δ(r0 − r ′ )δσσ′ c†rσ cr′ ,σ′ , (4.63)
σ,σ ′

= c†r0 ↑ cr0 ↑ + c†r0 ↓ cr0 ↓ .

También podrı́amos calcular la densidad de spin a lo largo del eje z en el punto r0 .


En ese caso el operador de una partı́cula es

Sz(1) (r0 ) = |r0 ⟩⟨r0 | ⊗ Sz , (4.64)


Segunda cuantificación 129

y usando (4.57) se obtiene4


ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sz |r ′ σ ′ ⟩c†rσ cr′ σ′ ,
X
Sz (r0 ) =
σ,σ ′

⟨σ|Sz |σ ′ ⟩c†r0 σ cr0 σ′ ,


X
= (4.65)
σσ ′

1
= (c†r0 ↑ cr0 ↑ − c†r0 ↓ cr0 ↓ ).
2
De manera similar, la densidad de spin a lo largo de la dirección x es
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sx |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sx (r0 ) =
σ,σ ′

⟨σ|Sx |σ ′ ⟩c†r0 σ cr0 σ′ ,


X
= (4.66)
σσ ′

1
= (c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
y para la dirección y,
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sy |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sy (r0 ) =
σ,σ ′

⟨σ|Sy |σ ′ ⟩c†r0 σ cr0 σ′ ,


X
= (4.67)
σσ ′

i
= (−c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
Alternativamente, podrı́amos haber usado la base de los autoestados del operador
momento, |k⟩, cuyas funciones de onda son
1
⟨r|k⟩ = √ eikr . (4.68)

4
Recordemos que las expresiones de los operadores de spin en la base |±⟩ son
1
Sx = [|+⟩⟨−| + |−⟩⟨+|] ,
2
i
Sy = [−|+⟩⟨−| + |−⟩⟨+|],
2
1
Sz = [|+⟩⟨+| − |−⟩⟨+|].
2
130 4.2 Operadores de creación y destrucción

Dado que el spin y la parte orbital son independientes, solo daremos las expresiones
para el caso sin espı́n. Incorporar el spin se realiza exactamente de la misma forma
que en la base de coordenadas. El operador ck ahora destruye una partı́cula momento
k (es decir, en un estado de onda plana con momento k). La ecuación (4.57) da lugar
a
⟨k1 |r0 ⟩⟨r0 |k2 ⟩c†k1 ck2 ,
X
ρ(r0 ) =
k1 k2
(4.69)
1 X −ik1 r0 ik2 r0 †
= e e ck 1 ck 2 .
Ω k1 k2

La expresión (4.69) no es tan simple como (4.59) ya que el operador densidad no es


diagonal en la base de momentos. Sin embargo, tanto (4.69) como (4.59) represen-
tan el mismo operador. Esto nos da una conexión directa entre los operadores que
crean una partı́cula en el punto r y los que crean una partı́cula con momento k.
Comparando las ecuaciones (4.69) y (4.59) se obtiene

1 X ikr
cr = √ e ck . (4.70)
Ω k

Esta expresión constituye un ejemplo de una transformación, en este caso lineal


y dada por una transformada de tipo Fourier, entre operadores de creación. Esta
transformación preserva los conmutadores, como puede verificase en forma simple,
y por lo tanto constituye un ejemplo de transformación canónica. Discutiremos más
sobre este tema más adelante.
Usando la expresión (4.69) también podemos calcular el número total de partı́cu-
las en el sistema:
ˆ
1 X −ik1 r ik2 r †
N = dr e e ck 1 ck 2 ,
Ω k1 k2

δk1 k2 c†k1 ck2 ,


X
= (4.71)
k1 k2
X †
= ck ck ,
k

y si tenemos en cuenta que c†k ck cuenta el número de partı́culas en el estado cuántico


k, se obtiene nuevamente que el número total de partı́culas es la suma de todos los
números de partı́culas en todos los estados cuánticos posibles. Finalmente se puede
usar (4.69) para obtener una expresión simple de la transformada de Fourier de la
Segunda cuantificación 131

densidad: ˆ
ρ(q) = dr e−iqr ρ(r),
ˆ
1 X −ik1 r ik2 r †
= dr e−iqr e e ck 1 ck 2 ,
Ω k1 k2
(4.72)
δk2 ,k1 +q c†k1 ck2 ,
X
=
k1 k2
X †
= ck−q ck .
k

Otro operador importante es, por supuesto, la energı́a cinética de las partı́culas.
p2
Para una partı́cula se tiene H (1) = 2m , y de manera más general, podrı́amos tener
(1)
cualquier función del momento H = ϵ(p). Por lo tanto, es muy conveniente utilizar
la base de momentos. La energı́a cinética se expresa ası́ como

⟨k1 |ε(p)|k2 ⟩c†k1 ck2 ,


X
H=
k1 k2

δk1 k2 ε(ℏk2 )c†k1 ck2 ,


X
= (4.73)
k1 k2

εk c†k ck ,
X
=
k

con εk = ε(ℏk) = ℏ2 k 2 /2m que tiene la interpretación simple de que la energı́a


cinética total del sistema es la suma de el número de partı́culas en cada estado k
(dado por c†k ck ) multiplicado por la energı́a cinética ϵk de tal estado. La generali-
zación para sistemas con spin es inmediata y, en general se obtiene

ε(k)c†kσ ckσ ,
X
H= (4.74)

asumiendo que la energı́a cinética no depende del espı́n (en ausencia de acoplamiento
espı́n-órbita).

4.2.2. Mecánica estadı́stica cuántica en el gran canónico


En mecánica estadı́stica usualmente estamos interesados en calcular la función
de partición de un sistema cuántico de N partı́culas

QN (Ω, T ) = tr e−βH (4.75)

donde T es la temperatura medida en grados Kelvin, y β = 1/kB T con kB la


constante de Boltzman. Aquı́ H es el Hamiltoniano de N partı́culas.
132 4.2 Operadores de creación y destrucción

Debemos tener en cuenta que dado que el número total de partı́culas es N =



k ck ck , agregar un potencial quı́mico −µN no cambia la forma del Hamiltoniano:
P

ξ(k)c†kσ ckσ ,
X
H= (4.76)

y simplemente reemplaza ε(k) por ξ(k) = ε(k) − µ. A temperatura cero la energı́a


ξ(k) es cero en el nivel de Fermi, negativa por debajo, y positiva por encima.

4.2.3. Operadores de dos cuerpos


Veamos ahora los operadores que involucran dos partı́culas y como definir sus
elementos de matriz. Es en particular el caso del potencial de interacción entre dos
partı́culas X
V = V (ri , rj ). (4.77)
i̸=j

Definición
Con un espı́ritu similar al de los operadores de un solo cuerpo, llamemos O(2) al
operador correspondiente que actua en el espacio de Hilbert de sólo dos partı́culas.
El operador de dos cuerpos que actua en HN debe tener la forma
X (2) O 1 X (2) O
O= Oi,j 1k = O 1k , (4.78)
i<j k̸=i,j 2 i̸=j i,j k̸=i,j

para que el operador O(2) pueda operar sobre cada par de partı́culas en el sistema.
De manera similar que para los operadores de un solo cuerpo, los coeficientes en la
suma anterior deben ser todos iguales, de lo contrario significarı́a que las partı́culas
podrı́an distinguirse.
Para entender cómo escribir O en segunda cuantificación, veamos el caso en el
que hay exactamente dos partı́culas en el sistema. Debemos definir el operador O
por sus elementos de matiz en el espacio fı́sico de las funciones (anti)simetrizadas
|α, β⟩, lo que significa que debemos conocer todos los elementos

⟨α, β|O(2) |γ, δ⟩. (4.79)

Tomemos primero la expresión (??) y escribamos |α, β⟩ en términos de los kets


ordenados (??)
(α, β|O(2) |γ, δ) = (β, α|O(2) |δ, γ), (4.80)
aquı́ la igualdad se debe a que simplemente estamos intercambiando partı́culas, y
por lo tanto obtenemos

⟨α, β|O(2) |γ, δ⟩ = (α, β|O(2) |γ, δ) ± (α, β|O(2) |δ, γ). (4.81)
Segunda cuantificación 133

Ahora deberı́amos encontrar en segunda cuantificación un operador que reproduzca


estos elementos de matriz y, por supuesto, funcione para N partı́culas en lugar de
dos. Se verifica que
1 X
O= (α, β|O(2) |γ, δ)c†α c†β cδ cγ , (4.82)
2 α,β,γ,δ
funciona tanto para fermiones como para bosones. No demostraremos esta relación
en general, lo cual puede hacerse calculando los elementos de matriz a ambos la-
dos, sino que simplemente comprobaremos que funciona para N = 2 partı́culas.
Calculemos, a partir de (4.82), los elementos de matriz
1 X
⟨α0 , β0 |O|γ0 , δ0 ⟩ = (α, β|O(2) |γ, δ)⟨α0 , β0 |c†α c†β cδ cγ |γ0 , δ0 ⟩. (4.83)
2 α,β,γ,δ

Como |α0 , β0 ⟩ = c†α0 c†β0 |0⟩ tenemos que calcular promedios de la forma

⟨0|cβ0 cα0 c†α c†β cδ cγ c†γ0 c†δ0 |0⟩ (4.84)

lo cual puede realizarse mediante la técnica que discutimos antes, consistente en


llevar hacia la derecha a los operadores de destrucción para que actúen sobre el
vacı́o. Esto da

⟨0|cβ0 cα0 c†α c†β cδ cγ c†γ0 c†δ0 |0⟩ = [δα0 ,α δβ0 ,β ± δα0 ,β δβ0 ,α ] [δγ0 ,γ δδ0 ,δ ± δγ0 ,δ δδ0 ,γ ] . (4.85)

El signo + es el habitual para los bosones y el − para los fermiones. Fı́sicamente


significa que cuando los operadores de destrucción actúan en la forma

cδ cγ |γ0 , δ0 ⟩, (4.86)

tienen que destruir las dos partı́culas en los dos estados cuánticos posibles y ası́ δ
tiene que ser uno de los estados y γ el otro con el signo adecuado dependiendo de la
(anti)simetrı́a de la función de onda. Usando (4.85) en (4.83) de hecho recuperamos
los mismos elementos de matriz que (4.81).
Fı́sicamente, la fórmula (4.82) tiene una interpretación similar a la de los opera-
dores de un solo cuerpo. El término c†α c†β cδ cγ destruye dos partı́culas con los números
cuánticos γ y δ, para esto es necesario que el sistema contenga dos partı́culas (que
es lo que debe ocurrir para que un operador de dos cuerpos pueda actuar). Lue-
go recrea las dos partı́culas con dos nuevos números cuánticos α y β. La amplitud
para este proceso está dada por los elementos de matriz del operador O(2) en una
transición donde la primera partı́cula va del estado γ al estado α y la segunda del
estado δ al estado β. El elemento de matriz se escribir para kets ordenados (son kets
producto y por lo tanto más simples); los operadores de creación y destrucción se
encargan de todas las permutaciones y de realizar esta transición para cualquier par
de partı́culas en el sistema.
134 4.2 Operadores de creación y destrucción

Ejemplos
La interacción más común entre los electrones es aquella que depende de la
distancia entre las dos partı́culas. Los dos operadores de tal interacción son, por lo
tanto,
O(2) = V (r̂1 − r̂2 ), (4.87)
donde r̂1 y r̂2 son los operadores que miden la posición de la primera y la segunda
partı́cula respectivamente. Exepcionalmente utilizaremos aquı́ la notaión con el som-
brero para indicar que son operadores. Por ejemplo, para la interacción de Coulomb
es
e2
V (r) = , (4.88)
4πϵ0 r
pero otros tipos de interacciones como una interacción local V (r) = U δ(r) también
son opciones posibles. Mantendremos V como función general en lo que sigue.
Para expresar el operador en segunda cuantificación, tenemos nuevamente que
realizar la elección de la base. Debido a que el operador V (r̂1 − r̂2 ) es diagonal en
la base de posición, comencemos con ésta. Usando (4.82) y el hecho de que α es la
base de posiciones, obtenemos
ˆ
1
V = dr1 dr2 dr3 dr4 (r3 r4 |V (r̂1 − r̂2 )|r1 r2 )c†r3 c†r4 cr2 cr1 ,
2
ˆ
1
= dr1 dr2 d r3 dr4 V (r1 − r2 )δ(r3 − r1 )δ(r4 − r2 )c†r3 c†r4 cr2 cr1 , (4.89)
2
ˆ
1
= dr1 dr2 V (r1 − r2 )c†r1 c†r2 cr2 cr1 .
2

Si se incluye el espı́n, la base completa se convierte en α = (r, σ) y como el operador


V (r̂1 − r̂2 ) es la identidad en el sector de espı́n, se obtiene
ˆ
1 X
V = dr1 dr2 V (r1 − r2 )c†r1 σ1 c†r2 σ2 cr2 σ2 cr1 σ1 . (4.90)
2 σ1 σ2

La expresión (4.90) puede escribirse en una forma más familiar utilizando las
relaciones de (anti)conmutación para fermiones

c†r1 σ1 c†r2 σ2 cr2 σ2 cr1 σ1 = −c†r1 σ1 c†r2 σ2 cr1 σ1 cr2 σ2 ,

= −c†r1 σ1 (δr1 ,σ1;r2 σ2 − cr1 σ1 c†r2 σ2 )cr2 σ2 ,


(4.91)
= −δr1 ,σ1;r2 σ2 c†r1 σ1 cr2 σ2 + c†r1 σ1 cr1 σ1 c†r2 σ2 cr2 σ2 ,
= −δr1 ,σ1;r2 σ2 ρσ1 (r1 ) + ρσ1 (r1 )ρσ2 (r2 ),
Segunda cuantificación 135

(para bosones se obtiene una expresión similar, con signo +). El segundo término
da lugar a la expresión
ˆ
1 X
V = dr1 dr2 V (r1 − r2 )ρσ1 (r1 )ρσ2 (r2 ), (4.92)
2 σ1 σ2
que es la forma familiar de la interacción entre dos densidades de partı́culas (o
cargas) en dos puntos diferentes. La diferencia es que ahora los ρ son operadores que
miden la densidad en lugar de variables clásicas. El primer término se reduce a
ˆ
X
drV (r = 0)ρσ1 (r1 ) = V (r = 0)N, (4.93)
σ
que es simplemente un término de potencial quı́mico. Téngase en cuenta que puede
ser infinito para algunas interacciones, como la interacción de Coulomb. Este primer
término está ahı́ para corregir el hecho de que la expresión (4.92) contrariamente a
(4.90) no contiene solo la interacción entre dos partı́culas diferentes. Efectivamente,
(4.90) tiene dos operadores de destrucción a la derecha, lo que significa que los ope-
radores solo pueden actuar en estados que contienen dos partı́culas. Por el contrario,
(4.92) es de la forma
c†r1 σ1 cr1 σ1 c†r2 σ2 cr2 σ2 , (4.94)
y por lo tanto puede actuar incluso si solo hay una partı́cula en el sistema. Por lo
tanto, contiene una falsa “autointeracción” de la partı́cula consigo misma. Es esta
interacción la que conduce al potencial quı́mico (4.93) que debe incluirse adecuada-
mente junto con (4.92). No obstante, si se fija el número de partı́culas del sistema,
entonces esta modificación es irrelevante ya que simplemente se absorbe en una
redefinición del potencial quı́mico y se puede usar (4.90) o (4.92) indistintamente.
Reescribamos ahora la interacción en la base del impulsos. Usando (4.82) y una
base α = (k, σ) se tiene
1 X
V = (k3 σ3 , k4 σ4 |V (r̂1 − r̂2 )|k1 σ1 , k2 σ2 )c†k3 σ3 c†k4 σ4 ck2 σ2 ck1 σ1 . (4.95)
2 k1 σ1 ,k2 σ2 ,
k3 σ3 ,k4 σ4

Lo que sigue es calcular un elemento de matriz que involucra operadores de posición


en una base de estados de momentos. Esto se realiza, como es habitual en mecánica
cuántica, insertando resoluciones de la identidad en el espacio de coordenadas
ˆ
1 = dr |r⟩⟨r|, (4.96)

y utilizando la función de onda plana (4.68). Se obtiene


ˆ
1
dr1 dr2 e−i(k3 r1 +k4 r2 ) V (r1 − r2 )ei(k1 r1 +k2 r2 )
X
V = 2
2d σ1 σ2
k1 k2 k3 k4

× c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 , (4.97)


136 4.2 Operadores de creación y destrucción

Figura 4.1: Visualización pictórica del término (3.97). Cada operador de destrucción
está representado por una flecha entrante, cada creación por una saliente. Uno ve que
la interacción puede verse como la dispersión de una partı́cula que va del estado k1 σ1
al k1 +q, σ1 por otra que va del estado k2 σ2 al estado k2 −q, σ2 . La amplitud de estos
elementos de matriz es la transformada de Fourier del potencial de interacción V (q).
Dado que el potencial es invariable por traslación en el espacio, el impulso se conserva
a lo largo de la interacción. Dado que el potencial no depende de los grados de
libertad del espı́n, la interacción conserva individualmente el espı́n de cada partı́cula.
Esta representación se conoce como diagramas de Feynman. Es extremadamente útil
cuando se construye la teorı́a de la perturbación.

A continuación aprovechamos que el potencial depende de la diferencia de coorde-


nadas de las dos partı́culas y cambiamos a las variables de centro de masa R =
(r1 + r2 )/2 y coordenada relativa r = r1 − r2 para obtener
ˆ ˆ
1 i(k1 +k2 −k3 −k4 )R
dr V (r)ei(k1 −k3 −k2 +k4 )r/2
X
V = 2 dR e
2d σ1 σ2
k1 k2 k3 k4

× c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 (4.98)

Finalmente, integramos en r y R,

1
δk1 +k2 ,k3 +k4 V (q = k3 − k1 )c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 ,
X
V = (4.99)
2d σ1 σ2
k1 k2 k3 k4

Comentemos brevemente esta expresión. La integración sobre R da lugar al factor


δk1 +k2 ,k3 +k4 que expresa la conservación de los momentos de las dos partı́culas antes
y después de la interacción. Esto es consecuencia directa del hecho de que hemos
elegido un potencial de interacción que es invariante frente a traslaciones V (r1 − r2 )
y, por lo tanto, el momento total (k1 + k2 ) y k3 + k4 ) debe conservarse. La integral
sobre la coordenada relativa conduce directamente a la transformada de Fourier
del potencial de interacción con un vector de onda que corresponde al momento
transferido de una a otra de las partı́culas durante la interacción. Finalmente, se
puede reescribir el operador V teniendo en cuenta la restricción δk1 +k2 ,k3 +k4 como

1 X
V = V (q)c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 (4.100)
2d k1 k2 q
σ1 σ2

que se representa gráficamente como se muestra en la figura 4.1


Segunda cuantificación 137

4.3. Resolviendo con segunda cuantificación

Ahora que tenemos las herramientas para expresar todos los operadores que ne-
cesitamos en segunda cuantificación, ya sea para el Hamiltoniano u otros observables
fı́sicos, y que sabemos calcular promedios de un número arbitrario de tales opera-
dores de creación y destrucción en el vacı́o, podemos preguntarnos cómo resolver
en la práctica un problema cuando conocemos el Hamiltoniano. En el equema usual
de la mecánica cuántica, escribimos la ecuación de Schrödinger y, a partir de ella,
encontramos tanto los autovalores como las autofunciones, pero la esencia misma de
la segunda cuantificación es evitar tener que lidiar con la función de onda, por lo
que queremos seguir otra ruta para obtener tales cantidades. Cómo hacer esto es lo
que examinaremos ahora.

4.3.1. Autovalores y autoestados

Veamos primero si podemos encontrar los valores propios o vectores propios de


algún Hamiltoniano simple. Comencemos con un Hamiltoniano cuadrático general

d
Aα c†α cα
X
H= (4.101)
α

donde α es una base completa y los coeficientes Aα son números arbitrarios. Varios
Hamiltonianos de sistemas fı́sicos tienen tales formas, por ejemplo, la energı́a cinéti-
ca de un sistema de partı́culas (4.74) y (4.76). Para Hamiltonianos cuadráticos y
diagonales de la forma (4.101) el problema está resuelto. De hecho cada vector de p
partı́culas de la forma

c†α1 c†α2 c†α3 . . . c†αp |0⟩ (4.102)

es un vector propio de H con autovalor

p
X
E= Ai (4.103)
i=1
138 4.3 Resolviendo con segunda cuantificación

Para mostrar esto, ilustremos el cálculo en un estado de dos fermiones |ψ⟩ = c†α1 c†α2 |0⟩
(se puede realizar un cálculo análogo para bosones):

!
Hc†α1 c†α2 |0⟩ Aα c†α cα c†α1 c†α2 |0⟩,
X
=
α

Aα c†α (δα,α1 − c†α1 cα )c†α2 |0⟩,


X
=
α

Aα c†α c†α1 cα c†α2 |0⟩,


X
= Aα1 |ψ⟩ −
α
(4.104)
Aα c†α c†α1 (δα,α2 c†α2 cα )|0⟩,
X
= Aα1 |ψ⟩ − −
α

= Aα1 |ψ⟩ − Aα2 c†α2 c†α1 |0⟩,

= Aα1 |ψ⟩ + Aα2 |ψ⟩.

La fı́sica de este resultado es simple de entender. El operador nα = c†α cα no es otra


cosa que el número de ocpación, y cuenta las partı́culas en el estado α. Ası́, si en |ψ⟩
hay una partı́cula en tal estado devolverá 1 y la energı́a correspondiente se contará
en H.
Ası́ vemos que si tenemos un Hamiltoniano que está en una forma cuadrática
diagonal como (4.101) entonces podemos obtener todos los valores propios y vectores
propios del sistema. A temperatura cero el estado fundamental consistirá simplemen-
te (para los fermiones) en ocupar todos los estados con la mı́nima energı́a posible
según el número de partı́culas en el sistema.

N
c†αi |0⟩,
Y
|F⟩ = (4.105)
i=1

si E1 ⩽ E2 ⩽ . . . ⩽ Ed . Nótese que el mar de Fermi (??) es un caso particular de


(4.105).

4.3.2. Valores de expectación térmicos


A temperatura finita también podemos calcular los promedios de muchos ope-
radores. Un caso importante es el operador que da el número de partı́culas en el
estado αp
Segunda cuantificación 139

h i
Tr e−βH c†αp cαp
⟨c†αp cαp ⟩ = ,
Tr [e−βH ]
(4.106)
Aα c†α cα †
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e cαp cαp |n1 , . . . , nd ⟩
P
α
= .
Aα c†α cα
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e |n1 , . . . , nd ⟩
P
α

n i
Usando el hecho de que (tanto para fermiones como para bosones) c†α cα , cγ = 0 si
α ̸= γ y una relación similar para c†γ , vemos que el término e−βH se factoriza en la
forma
d
−βH −βAαj c†αj cαj
Y
e = e . (4.107)
j=1

Como en la traza cada término ni es independiente, la media tabién se factoriza, y


el numerador se convierte en
   
−βAαp c†αp cαp −βAαj c†αj cαj
c†αp cαp |nαp ⟩
X Y X
 ⟨nαp |e  ⟨nα
j
|e |nαj ⟩ . (4.108)
nαp j̸=p nαj

Todos los términos con j ̸= p son idénticos en el numerador y el denominador y se


cancelan entre sı́. La traza se reduce entonces a
−βAαp c†αp cαp †
nαp ⟨nαp |e cαp cαp |nαp ⟩
P
⟨c†αp cαp ⟩ = † , (4.109)
−βAαp cαp cαp
nαp ⟨nαp |e |nαp ⟩
P

lo cual es bastante obvio fı́sicamente. De hecho, dado que el Hamiltoniano es diagonal


en α, sólo el estado αp puede contribuir al promedio de un operador que solo involucra
al estado αp . Como c†αp cαp |np ⟩ = np |np ⟩ simplemente obtenemos

e−βAαp np np
P
nαp
⟨c†αp cαp ⟩ = P . (4.110)
nαp e−βAαp np

Hasta ahora todo lo que hicimos es independiente de tener bosones o fermiones.


Sin embargo, el resultado final dependerá de cuáles sean los valores permitidos de
np . Para fermiones solo np = 0 y np = 1 están en la suma, y de este modo

e−βAαp 1
⟨c†αp cαp ⟩ = −βAαp = , (4.111)
1+e 1 + eβAαp
y se recupera el factor de Fermi. Vemos que este es un resultado totalmente general
(no limitado a autoestados del impulso) para Hamiltonianos bilineales y se está en
equilibrio térmico.
140 4.3 Resolviendo con segunda cuantificación

Para bosones np = 0, . . . , +∞, y ası́ la suma se convierte en


 
+∞

⟨c†αp cαp ⟩ = − e−βnp Aαp  ,
X
log 
∂β np =0

∂ 1
 
=− log ,
∂β 1 − e−βAαp (4.112)
−βAαp
e
= ,
1 − e−βAαp
1
= βAαp ,
e −1
y se recupera el factor de Bose.

4.3.3. Transformaciones canónicas


Con Hamiltonianos cuadráticos diagonales podemos calcular entonces esencial-
mente cualquier valor de expectación o cantidad fı́sica que se necesite. Por supuesto,
en general, el Hamiltoniano del sistema no será ni cuadrático ni diagonal. Entonces,
resolver en segunda cuantificación significa esencialmente que tenemos que encon-
trar una transformación de los operadores c y c† que lleven al Hamiltoniano en una
forma diagonal cuadrática. Aunque en principio cualquier transformación es posi-
ble, no todas las son buenas. Queremos que los nuevos operadores d y d† que son
los resultados de la transformación sigan generando el espacio Fock. Significa que
sólo podemos considerar transformaciones que conserven las relaciones canónicas
de conmutación. Por supuesto, encontrar tales transformaciones es, en general, una
tarea formidable. Sin embargo, hay una clase muy importante de transformaciones
cuando el Hamiltoniano sigue siendo una forma cuadrática, pero no diagonal, que
examinaremos en la siguiente sección.
Antes de hacerlo, comentemos finalmente que incluso sin resolver el Hamilto-
niano se puede explotar la libertad de elegir diferentes operadores de creación y
destrucción para usar una representación más conveniente. Como ya se mencionó,
se permite toda transformación que conserve las relaciones canónicas de conmuta-
ción. Pongamos un ejemplo sencillo, se verán más ejemplos en la siguiente sección.
La transformación más simple es la transformación partı́cula-agujero.

c†α = dα ,
(4.113)
cα = d†α .

Para los fermiones es fácil comprobar, por sustitución de los operadores d verifican
Segunda cuantificación 141

las relaciones canónicas de anticonmutación. Por ejemplo

[dα , d†β ]+ = [c†α , cβ ]+ = δα,β . (4.114)

Si los operadores cα y c†α respectivamente destruyen y crean un electrón en el estado


α, el operador dα y d†α también son operadores de destrucción y creación de “algo
más”, que también tiene una estadı́stica fermiónica y por lo tanto, se puede utilizar
para construir un espacio de Fock. En ese caso particular, el operador dα destruye
un hueco en el estado estado α (que es idéntico a crear un electrón) y el operador
d†α crea un hueco (que es lo mismo que destruir un electrón).
Un punto importante al hacer la transformación es no olvidar modificar también
el vacı́o. De hecho, el vacı́o de las partı́culas d no es el mismo que el vacı́o de las
partı́culas c. Se tiene ası́ |0c ⟩ y |0d ⟩. El vacı́o de las partı́culas d se define como
siempre por
dα |0d ⟩ = 0,
para todos los estados α. Es fácil comprobar usando la relación (4.113) que

c†α |0c ⟩.
Y
|0d ⟩ =
α

Destruir una partı́cula d sobre este vacı́o es equivalente a crear una de tipo c. Pero
esto no es posible, porque todos los estados están ocupados.
Más generalmente, consideremos un Hamiltoniano cuadrático, no diagonal, arbi-
trario:
Ns

X
H= ci Aij cj (4.115)
i,j=1

donde Aij son los elementos de una matriz hermı́tica A, y Ns es un número del
orden del volúmen del sistema, d, que especifica la cantidad de estados accesibles
de partı́cula independiente. Para simplificar la notación conviene escribir en forma
matricial:
H = c† Ac (4.116)
donde  
c1
 c2
   
c† = c†1 c†2 · · · c†Ns

c=
 ..
, (4.117)
 .


cNs
es un vector de Ns elementos, donde cada elemento es un operador de creación, y su
transpuesto conjugado. Obsérvese que hemos introducido la notación con una barra
sobre c para indicar la operación de transposición sobre el vector en conjunto con
el dagado de sus elementos. La utilidad de esta notación quedará más clara en la
142 4.3 Resolviendo con segunda cuantificación

próxima sección. La matriz A, al ser hermı́tica, puede ser diagonalizada por una
matriz unitaria U ,
U † AU = Ã (4.118)
donde à es la matriz diagonal que contiene a los autovalores de A, A1 , . . . , ANs
y U se construye ordenando los autovectores de A en columnas. Una vez hallada
la matriz U , podemos utilizarla para definir un nuevo conjunto de operadores dα
mediante la transformación
Ns
† ∗
X
d = U c, (en componentes, dα = Uiα ci ) (4.119)
k=1

de manera tal que el Hamiltoniano, expresado en términos de los d resulta


H = d† U † AU d = d† Ãd = Aα d†α dα .
X
(4.120)
α

Es decir, resulta ser de la forma diagonal (4.101).


Una condición importante para que esto funcione es que la transformación (4.119)
conserve los anticonmutadores entre d, que es el caso debido a su unitariedad, ya
que
h i n o

d†α , dβ c†i , cj = †
= (U † U )βα = δαβ .
X X
= Uiα Uβj Ujα Uβj (4.121)
+
ij j

Una vez hallada la forma diagonal (4.120), el estado fundamental de N partı́culas


está dado por (4.105)
N
d†α |0d ⟩
Y
|F⟩ = (4.122)
α=1
donde |0d ⟩ es el estado de vacı́o de los operadores d, que satisface
dα |0d ⟩ = 0 ∀α. (4.123)
Para este tipo de transformación, el vacı́o resulta invariante, es decir |0c ⟩ = |0d ⟩. En
efecto, debido a que los d están linealmente relacionados a los c, si aplicamos algún
dα sobre |0c ⟩, encontramos

X
dα |0c ⟩ = Uαj cj |0c ⟩ = 0, (4.124)
j

y viceversa, si aplicamos cj sobre |0d ⟩ también se anula, utilizando la transformación


inversa.
Por supuesto, en general, la matriz Aαβ es de tamaño Ns ×Ns y la diagonalización
será muy difı́cil de realizar analı́ticamente. Sin embargo, hay casos simples donde
puede hacerse. En especial, obsérvese que la transformada de Fourier (4.70), utilizada
para relacionar la base de coordenadas, donde la energı́a cinética de los electrones
en una caja es no diagonal, con la base de momentos, donde sı́ lo es, es un ejemplo
de tal transformación unitaria.
Segunda cuantificación 143

4.3.4. Ejemplo: Modelo tight binding


Veamos otro modelo que puede resolverse mediante este tipo de transformacio-
nes: el Hamiltoniano de ligadura fuerte o tight-binding que vimos en la sección ??.
Adicionalmente, esto nos permitirá escribir este Hamiltoniano en segunda cuantifi-
cación. Los estados en cada sitio |i⟩ proporcionan una base completa y, por lo tanto,
podemos definir los operadores de creación y destrucción asociados con él, es decir,
c†i es el operador que crea una partı́cula en el sitio i. Estos son los análogos a los c†r
utilizados al estudiar operadores de un cuerpo, sólo que en un espacio discreto. La
expresión en segunda cuantificación de H se escribe

(i|H (1) |j)c†i cj ,


X
H=
i,j

donde H (1) es el Hamiltoniano (??). Obtenemos ası́


X † X †
H=ϵ ci ci − t ci cj . (4.125)
i ⟨i,j⟩

El segundo término describe un proceso en el que una partı́cula en el sitio i reaparece


en el sitio vecino j y viceversa. Si bien es posible hacer todo este análisis en dimensión
arbitraria, para simplificar la diagonalización partición supondremos que los sitios
electrónicos se acomodan en un anillo, e identificamos el sitio en la posición Ns + 1
con el sitio 1, es decir, introducimos un operador de destrucción fermiónico adicional

cNs +1 ≡ c1 , (4.126)

y su complejo conjugado. Este Hamiltoniano es obviamente cuadrático pero no dia-


gonal. En el lenguaje de (4.115) corresponde a una matriz tridiagonal. Para dia-
gonalizarla, primero pensamos en la fı́sica del problema: dado que el Hamiltoniano
es invariante frente a traslaciones, el momento debe ser un buen número cuánti-
co, y vamos utilizar entonces una combinación lineal de operadores de creación y
destrucción ci que corresponden a su transformada de Fourier. Este es exactamen-
te el mismo razonamiento que el que conduce a (4.70), sólo que ahora utilizaremos
una transformada de Fourier discreta [véase el apéndice 5.31]. Tratados simplemente
como una combinación lineal de operadores, podemos definir
s −1
1 NX
d†k = √ eikrj c†j , (4.127)
Ns j=0

donde hemos usado un nombre diferente d para enfatizar que se trata de nuevos
operadores, e introducido las posiciones rj = aj donde a es la constante de red, y
2πnk
k= , nk ∈ Z.
Ns a
144 4.3 Resolviendo con segunda cuantificación

Se puede comprobar inmediatamente que los operadores dk cumplen las reglas


canónicas de conmutación. Verifiquemos uno de los anticonmutadores y dejemos
las otras relaciones como ejercicio:
n o 1 X −ikri iqrj n o
dk , d†q = e e ci , c†j ,
Ns ij
1 X −ikri iqrj
= e e δij ,
Ns ij
(4.128)
1 X i(k−q)rj
= e ,
Ns j

= δkq .

Los operadores dk son, por lo tanto, buenos operadores de Fermiones. Hay exacta-
mente Ns operadores diferentes (el tamaño del espacio de Hilbert no puede cambiar)
y k está confinado dentro de la primera zona de Brillouin k ∈ [−π/a, π/a] como se
discutió para la solución en primera cuantificación. Además, como resulta obvio de
la definición (4.127), |0d ⟩ = |0c ⟩. La transformación (4.127) se invierte fácilmente

1 X −ikrj †
c†j = √ e dk , (4.129)
Ns k

y ası́, reemplazando los cj en (4.125) y haciendo un poco de álgebra, se encuentra


X †
2t cos(ka)d†k dk .
X
H=ϵ dk dk − (4.130)
k k

Ahora que el Hamiltoniano es diagonal, podemos usar los operadores dk para obtener
el estado fundamental y los diversos promedios. A nivel fı́sico, hemos utilizado que,
dado que la cantidad de movimiento se conserva, se pueden diagonalizar simultánea-
mente los operadores de impulso y el Hamiltoniano. Por lo tanto, el Hamiltoniano es
una matriz diagonal por bloques en la base a los autovectores del operador impulso.
Como esta base es de tamaño Ns (Ns diferentes k valores en la primera zona de
Brillouin) nos queda para cada valor de k una matriz de 1 × 1 a diagonalizar, con
lo cual el problema está completamente resuelto.

4.3.5. Términos anómalos


Estudiemos ahora un Hamiltoniano más general, que incluya términos de la forma
ci cj . Este tipo de términos se denominan anómalos, y hacen que en el Hamiltoniano
no conmute con el operador N y por lo tanto no conserve el número de partı́culas,
Segunda cuantificación 145

y por lo tanto no tiene una expresión simple en primera cuantificación. Tı́picamen-


te aparecen cuando uno considera teorı́as para superconductividad, tales como el
llamado Hamiltoniano de Bardeen-Cooper-Schrieffer (BCS) que estudiaremos más
adelante. Consideremos el Hamiltoniano
Ns Ns
X † 1 X
H= ci Aij cj + ci Bij cj + h.c. (4.131)
ij=1 2 ij=1

siendo i, j = 1, . . . , Ns , A una matriz hermı́tica (A† = A), y B una matriz anti-


simétrica (B t = −B), ambas condiciones impuestas por la necesidad de que H sea
un operador hermı́tico en conjunto con la estadı́stica fermiónica. Para escribirlo en
forma matricial, debemos considerar ahora que existen estos dos tipos de términos.
Si buscamos utilizar una sola matriz, no será posible que su dimensión sea Ns . La
forma usual de hacerlo consiste en introducir la notación de Nambu, en la cual se
define un vector o spinor de Nambu de dimensión 2Ns cuyos elementos son tanto
los operadores de creación como de destrucción:
 
Ψ† = c†1 · · · c†Ns c1 · · · cNs (4.132)
en conjunto con la matriz !
A −B ∗
H= , (4.133)
B −A∗
que se conoce como Hamiltoniano de Bogoliubov-de Gennes. Con estas definiciones
el Hamiltoniano se escribe
1
H = Ψ† HΨ + E0 (4.134)
2
dónde
1
E0 = − tr A, (4.135)
2
Obsérvese que a matriz H continúa siendo hermı́tica (para mostrarlo es impor-
tante la antisimetrı́a de B) y por lo tanto diagonalizable mediante una transforma-
ción unitaria M de 2Ns × 2NS , de manera similar a como lo realizamos en la sección
anterior, de manera tal que
M † HM = H̃ = diag(Λ1 , . . . , ΛNs , Λ̄1 , . . . , Λ̄Ns ), (4.136)
donde Λα y Λ̄α son los autovalores de H. El spinor transformado Φ se relaciona con
el sin transformar a través de M :
Φ = M Ψ, (4.137)
Y entonces el Hamiltoniano, en términos de los nuevos operadores, resulta
1 1
H = Φ† M † HM Φ = Φ† H̃Φ (4.138)
2 2
146 4.3 Resolviendo con segunda cuantificación

Si escribimos al vector Φ en términos de un nuevo conjunto de operadores ηα , ξα en


la forma  
Φ† = η1† · · · ηN†
s
ξ1

· · · ξ †
Ns . (4.139)
el Hamiltoniano se escribe
Ns Ns
1X † 1X
H= Λα ηα ηα + Λ̄α ξα† ξα (4.140)
2 α=1 2 α=1

Al ser unitaria, la transformación M preserva los conmutadores y es por lo tanto


canónica, pero observemos que ahora la transformación mezcla a los operadores de
creación y destrucción.
La forma (4.140) del Hamiltoniano posee dos términos y a simple vista darı́a la
impresión de que como consecuencia de la existencia de términos anómalos debimos
duplicar el número de grados de libertad. Veamos que esto es sólo ası́ en apariencia.
Observemos que H satisface la relación

H = −σx H ∗ σx , (4.141)

donde la matriz de Pauli σx actua sobre la estructura de Nambu (4.133), de 2 × 2.


Esta transformación constituye una simetrı́a de H, y resulta ser antiunitaria5 . La
transformación (4.141) no es más que la simetrı́a partı́cula-hueco. Esto implica que
si ψ es un autoestado de H con autovalor λ,

Hψ = λψ,

entonces ψ ∗ es autoestado de H ∗ con el mismo autovalor (que es real, dado que H


es hermı́tico):
H ∗ ψ ∗ = λψ ∗
y entonces el vector ψ ′ = σx ψ ∗ también es vector de H con autovalor −λ:

Hψ ′ = Hσx ψ ∗ = −σx H ∗ σx σx ψ ∗ = −σx H ∗ ψ ∗ = −λσx ψ ∗ = −λψ ′ .


5
Una transformación antiunitaria K entre vectores |x⟩, |y⟩ de un espacio de Hilbert (|y⟩ = K|x⟩)
es un operador antilineal (es decir, tal que K(a|x⟩ + b|y⟩) = a∗ K|x⟩ + b∗ K|y⟩ con a, b ∈ C) tal que
transforma el producto escalar en el producto escalar conjugado:

⟨x|K † K|y⟩ = ⟨x|y⟩∗ . (4.142)

Este tipo de operadores, al igual que los operadores unitarios, no cambia el resultado de una
medida, es decir que
|⟨x|K † K|y⟩|2 = |⟨x|y⟩|2 . (4.143)
Segunda cuantificación 147

Dado que son vectores distintos, de otro modo tendrı́an distinto autovalor (a menos
que λ = 0), si escribimos al autovector en la forma
!
u
ψ=
v

donde u y v son vectores columna de Ns elementos, entonces


!
v∗

ψ = ∗
u

La matriz M , que posee los autovectores en columnas, posee entonces la forma


!
u v∗
M= , (4.144)
v u∗

donde u y v son matrices de Ns × Ns .En otras palabras, la forma (4.144) es conse-


cuencia de la simetrı́a partı́cula-hueco de H, ec. (4.141). Los autovalores Λ̄α puede
tomarse como Λ̄α = −Λα y la forma diagonal de la matriz de autovalores se escribe
entonces
H̃ = diag(Λ1 , . . . , ΛNs , −Λ1 , . . . , −ΛNs ), (4.145)
donde Λα son todos positivos. Observemos además la transformación (4.137) se
escribe explı́citamente

ηi = uij cj + vij∗ c†j , (4.146)


ξi = vij cj + u∗ij c†j , (4.147)

pero entonces ξi no es más que el adjunto de ηi , ξi = ηi† , y el Hamiltoniano se escribe


Ns
Λj ηj† ηj + Const.
X
H= (4.148)
j=1

De modo que sólo tenemos Ns grados de libertad, como se esperaba fı́sicamente.


Para diagonalizar el Hamiltoniano debimos duplicar el número de grados de libertad
introduciendo huecos, pero vimos que esta duplicación es espuria. Sin embargo, en
determinadas circunstancias puede ser útil mantener la duplicación, pero en ese caso
debe recordarse que el par de niveles con energı́a ±Λj no corresponde a dos estados
cuánticos distintos, sino a uno solo, que es una superposición coherente de electrones
y huecos —una cuasipartı́cula de Bogoliubov, el bogoliubon: tiene una energı́a de
excitación Λj , y es creada por el operador ηj† = uij cj +vij c∗j . Llenar el estado asociado
en energı́a −Λj es equivalente a vaciar el estado de energı́a positiva.
148 4.4 Gas de Fermi

El Hamiltoniano (4.131) no conserva el número de partı́culas, ya que no conmuta


con N = j c†j cj , aunque conserva el número de cuasi partı́culas, M = j ηj† ηj .
P P

Como consecuencia de que la transformación M mezcla operadores cj y c†j el vacı́o


no es invariante, tenemos un vacı́o |0c ⟩ que satisface cj |0c ⟩ = 0, y un vacı́o |0η ⟩
que verifica ηj |0η ⟩ = 0. Encontrar la relación entre ambos puede ser complicado y
depende de la forma de A y B. Lo haremos en el caso especı́fico del modelo BCS más
adelante. Una vez determinado |0η ⟩, el estado fundamental de M cuasipartı́culas se
escribe como un mar de Fermi de bogoliubones:
M

Y
|F ⟩ = ηj |0η ⟩. (4.149)
j

cuya energı́a resulta


M
X
E= Λj (4.150)
j

El estdo de mı́nima energı́a para un cierto potencial quı́mico es entonces aquel con
M = 0 cuasipartı́culas, es decir, el vacı́o mismo de los Bogoliubones.
Si bien el número de partı́culas no es una cantidad conservada, el operador de
paridad global,
P = (−1)N = eiπN (4.151)
conmuta con H, y por lo tanto los autoestados de energı́a poseen paridad fermiónica
definida ±1.

4.4. Gas de Fermi


Desarrollaremos las propiedades básicas de un gas de N fermiones no interac-
tuantes de masa m, utilizando las técnicas de segunda cuantización. Esto lo haremos
no sólo por tratarse de un buen ejercicio, sino también por la enorme utilidad que
tienen los resultados que obtendremos, como una aproximación de orden cero, en el
tratamiento de sistemas de muchos fermiones. Podemos imaginarnos que estos fer-
miones están en una caja cúbica de volumen V , que eventualmente puede ser muy
grande, y que se imponen condiciones de contorno periódicas. La base de partı́cula
independiente se refiere, por lo tanto, a los autoestados de de impulso hk y proyec-
ción de spin σ = ± 21 :

1
φκ (rs) = √ eik·r χσ (s); κ = {k, σ} (4.152)

con energı́a εk = ℏ2 k 2 /2m y degencrados en spin σ = ± 21 .


Segunda cuantificación 149

Para construir el estado fundamental del gas de Fermi ocupamos a cada uno
de los estados disponibles de partı́cula independiente más bajos con un fermión, de
acuerdo con el principio de exclusión de Pauli. Esta ocupación es de a pares ya que
las energı́as de partı́cula independiente no depende de spin y por cada εk tenemos
un fermión con σ = + 21 y uno con σ = − 12 . Los niveles llenos conforman el mar de
h2 k2
Fermi y el último nivel lleno, con impulso kF y energı́a εF = 2mF , se llama nivel de
Fermi o superficie de Fermi (en el espacio de los impulsos). La estructura del estado
fundamental es:
c†kσ |0⟩.
Y
|F ⟩ = (4.153)
k⩽kF ,σ

La energı́a del nivel de Fermi se halla de la condición que el número total de


partı́culas N sea,
( )
1 ; k ⩽ kF
⟨F |c†kσ ckσ |F ⟩
X X X
N= nkσ = =2
kσ kσ k
0 ; k > kF
X X (4.154)
=2 1=2 θ(kF − k).
k⩽kF k

Convirtiendo la suma en la integral, i. e.,


ˆ ˆ kF 2 2
1X θ(kF − k)k 2 dk k dk
θ(kF − k) → 3
dΩ = (4.155)
Ω k (2π) 0 2π 2

se obtiene, ˆ kF
Ω kF3
N= 2 k 2 dk = Ω (4.156)
π 0 3π 2
o sea,
N k3
= F2
ρ0 = (4.157)
Ω 3π
donde ρ0 es la densidad media de partı́culas.
Calculemos ahora la densidad de partı́culas en el estado fundamental, que es

⟨F |c†rσ crσ |F ),
X X
ρ(r) = ⟨F |ρ̂(rσ)|F ⟩ = (4.158)
σ s

o
1 X X ir·(k′ −k)
ρ(r) = e ⟨F |c†kσ ck′ σ |F ⟩. (4.159)
Ω σ kk′
El último valor medio será nulo a menos que k = k′ , ya que si removemos del estado
fundamental una partı́cula con impulso ℏk′ , podremos volver de nuevo a ese estado
sólo creando una partı́cula con el mismo impulso. Por lo tanto,

⟨F |c†kσ ck′ σ |F ⟩ = δkk′ nkσ (4.160)


150 4.4 Gas de Fermi

y
1X
ρ(r) = nkσ = ρ0 . (4.161)
Ω kσ
Como era de esperar, la densidad del gas es uniforme. Una cantidad muy útil, como
veremos más adelante, es la matriz densidad de una partı́cula definida como

Gσ (r − r ′ ) = ⟨F |c†rσ cr′ σ |F ⟩, (4.162)

es deicr, la amplitud de remover del estado fundamental una partı́cula que está en el
punto r ′ con spin σ para luego ponerla de nuevo al estado fundamental, pero ahora
en la posición r. Utilizando (4.70),
1 X ik·r
crσ = √ e ckσ , (4.163)
Ω kσ

y (4.152) el cálculo es:


1 X −ik·r+k′ ·r′
Gσ (r − r ′ ) = e ⟨F |c†kσ ck′ σ |F ⟩
Ω kk′
(4.164)
1 X −ik·r+k′ ·r′
= e δk′ k nkσ ,
Ω kk′
o ˆ kF
1 X −ik·(r−r′ )
′ dk −ik·(r−r′ )
Gσ (r − r ) = e → e . (4.165)
Ω k⩽kF 0 (2π)3
Evaluando la integral se tiene6

ρ0 3 3j1 (u)
Gσ (r − r ′ ) = C(kF |r − r ′ |); C(u) = 3
(sin u − u cos u) = . (4.169)
2 u u
A la cantidad C(kF |r − r ′ |) se la denomina función de correlación y tiene las
propiedades de tener un máximo para r = r ′ , con C(0) = 1, y de decaer rápidamente
para kF |r − r ′ | > 1 (ver Fig. 4.4).
6

ˆ kF ˆ kF ˆ 1
dk −ik·(r−r′ ) 1 ′ ′
Gσ (r − r ′ ) = 3
e = 2
k 2
dk e−ik|r −r |u du (4.166)
0 (2π) 4π 0 −1
ˆ kF
1 1
= kdk sin k|r − r ′ | (4.167)
2π 2 |r − r ′ | 0
1 1
= (sin kF |r − r ′ | − kF |r − r ′ | cos kF |r − r ′ |). (4.168)
2π |r − r ′ |3
2
Segunda cuantificación 151

0,8

0,6

0,4

0,2

−0,2
0 2 4 6 8 10

Vamos a calcular ahora la probabilidad de hallar una partı́cula del sistema en


el punto r ′ (con spin σ ′ ), sabiendo que lay otra partı́cula en el punto r (con spin
σ). Esto significa que primero removemos del sistema una partı́cula que está en rσ,
dejando las N − 1 partı́culas en el estado |rσ⟩ = c†rσ |F ⟩. Posteriormente, calculamos
el valor medio de la densidad ρ(r ′ , σ ′ ) en ese nuevo estado. Es decir, evaluamos

2
ρ0

gσσ′ (r − r ′ ) ≡ ⟨F |c†rσ c†r′ σ′ cr′ σ′ crσ |F ⟩. (4.170)
2

Utilizando la representacion en el espacio k, (4.70), tenemos

2
ρ0 1

′ ′
gσσ′ (r − r ′ ) = e−ik1 ·r e−ik2 ·r eik3 ·r eik4 ·r ⟨F |c†k1 σ c†k2 σ′ ck3 σ′ ck4 σ |F ⟩.
X
2 Ω2 k1 k2 k3 k4
(4.171)
Dado que ckσ |F ⟩ = 0, si k > kF (i. e., no podemos destruir partı́culas que no
están), vemos de inmediato que la sumatoria está restringida a los estados con
|k3 |, |k4 | ⩽ kF . Además, el valor de expectación se anula a menos que las partı́culas
que repongamos tengan los mismos impulsos y spines que las partı́culas removidas.
La forma de hacerlo es emplear los anticonmutadores, y escribir

⟨F |c†κ c†λ cµ cν |F ⟩ = ⟨F |c†κ (δλ,µ − cµ c†λ )cν |F ⟩ = δλµ ⟨F |c†κ cν |F ⟩ − ⟨F |c†κ cµ c†λ cν |F ⟩
= δλ,µ δκ,ν − δκ,µ δλ,ν (4.172)
152 4.4 Gas de Fermi

con κ, λ, µ, ν ⩽ kF , y por lo tanto7


2 kF
ρ0 1

′ ′ ′
e−ik1 ·r e−ik2 ·r eik3 ·r eik4 ·r (δk2 k3 δk1 k4 − δσσ′ δk1 k3 δk2 k4 ) ,
X
gσσ′ (r − r ) = 2
2 Ω k1 k2 k3 k4
(4.173)
kF h
1 X −ik1 ·(r−r ′ ) −ik2 ·(r ′ −r)
i
= 1 − δσσ ′ e e , (4.174)
Ω2 k1 k2
!2

= − δσσ′ G2σ (r − r ′ ) (4.175)
2N
donde hemos utilizado (4.165). Finalmente de (4.169) se tiene
gσσ′ (r − r ′ ) = 1 − δσσ′ C 2 (kF |r − r ′ |). (4.176)
La cantidad gσσ′ (r − r ′ ) se denomina densidad de correlación para dos partı́culas y
en la Fig. 4.4 se ilustra su comportamiento.
Veamos el significado fı́sico de esta densidad de correlación. Si los spines son
diferentes, la probabilidad relativa de encontrar las partı́culas en r y r ′ no depende
de la distancia |r − r ′ |. Esto es lo mismo que se obtendrı́a clásicamente para un gas
de partı́culas que no interactúan entre sı́. En cambio, si los dos electrones tienen
el mismo spin habrá una reducción muy grande en la probabilidad de hallarlos a
distancias menores que kF−1 . Es decir que el principio de Pauli produce correlacio-
nes muy importantes sobre el movimiento de partı́culas con el mismo spin. Ocurre
como si los fermiones con la misma orientación de spin se rechazaran entre sı́. Esta
“repulsión” efectiva proviene de la simetrı́a de intercambio de la función de onda y
no de una fuerza real entre las partı́culas. Para separaciones grandes gσσ′ (r − r ′ ) se
aproxima a uno, o sea al mismo valor que tienen dos partı́culas con spines diferentes.
Calculemos ahora la energı́a del estado fundamental del gas de Fermi. En par-
ticular, vamos a considerar que se trata de un gas de electrones de densidad media
ρ0 , que interactúan entre sı́ por medio de la interacción Coulombiana. Partiremos
del Hamiltoniano,
Ĥ = T̂ + V̂ (4.177)
donde
X ℏ2 ∇2r
T̂ = t̂(ri ); t̂(r) = − (4.178)
i 2m
es el operador para la energı́a cinética, y
1X e2
V̂ = v̂(ri , rj ); v̂(r1 , r2 ) = (4.179)
2 ij |r1 − r2 |
7
Notemos que, como las sumas se extienden solo sobre estados ocupados, no se pueden usar
relaciones de completitud.
Segunda cuantificación 153

es el operador para la energı́a potencial. Dado que

εk c†kσ ckσ ,
X
T̂ = (4.180)

la energı́a cinética será8


3
E (0) = ⟨F |T̂ |F ⟩ = εF N. (4.182)
5
Para la energı́a potencial, podemos utilizar la ecuación (4.90)

E (1) = ⟨F |V̂ |F ⟩ (4.183)


ˆ
1
drdr ′ v̂(r, r ′ ) ⟨F |c†rσ c†r′ σ′ cr′ σ′ crσ |F ⟩
X
= (4.184)
2 σσ ′
 2 ˆ
1 ρ0
drdr ′ v̂(r, r ′ ) gσσ′ (r − r ′ )
X
= (4.185)
2 2 ′
 2 ˆ
σσ
ρ0 h i
= drdr ′ v̂(r, r ′ ) 2 − C 2 (kF |r − r ′ |) , (4.186)
2

donde hemos usado (4.176). Escribimos ahora,


(1) (1)
E (1) = ED + EI (4.187)

con ˆ
(1) 1 e2 ρ20

ED = drdr , (4.188)
2 |r − r ′ |
y ˆ
(1) e2 ρ2 C 2 (kF |r − r ′ |)
EI =− 0 drdr ′ . (4.189)
4 |r − r ′ |
(1)
ED representa la interacción media de las partı́culas entre sı́ y se denomina energı́a
(1)
directa ó energı́a de Hartree, mientras que EI es la energı́a de intercambio y se
debe al principio de exclusion de Pauli. Haciendo el cambio de variables: r → r ′ y
r − r ′ → r, también resulta,
ˆ
(1) N ρ0 e2 dr
ED = v0 ; v0 = , (4.190)
2 r
8

ˆ kF
X X dk ℏ2 k2 ℏ2 kF5 3
⟨F |T̂ |F ⟩ = εk nkσ = εk θ(k − kF ) → 2Ω 3
=Ω 2
= εF N (4.181)
0 (2π) 2m 2m 5π 5
k,σ kσ
154 4.4 Gas de Fermi

y ˆ
(1) N ρ0 e2 C 2 (kF r)
=−
EI dr . (4.191)
4 r
Los electrones de conducción en un metal corresponden al gas de electrones que
estamos considerando. Notemos que en cualquier situación fı́sica nunca se tiene un
gas aislado, sino que hay siempre un número suficiente de cargas positivas, que hacen
que el sistema, como un todo, sea neutro. En una primera aproximación, todos los
iones positivos dentro del metal o dentro de un plasma, se pueden reemplazar por
un fondo (o “background”) de densidad de cargas positivas ρ0 e. La autoenergı́a de
ese fondo es: ˆ
1 e2 ρ20
drdr ′ (4.192)
2 |r − r ′ |
que junto con la energı́a electrostática media entre el fondo positivo y los electrones,
ˆ
e2 ρ20
− drdr ′ (4.193)
|r − r ′ |
cancela exactamente la energı́a de Hartree de los electrones. Por lo tanto, en primer
orden de aproximación, la interacción neta en un gas de electrones es precisamente
la energı́a de intercambio (4.191), que integrando resulta:
(1) 3 2
EI = − e kF . (4.194)

Definiendo ahora la distancia media entre las partı́culas, d, por medio de
4πd3
Ω=N , (4.195)
3
resulta,
3π 2 N 9π 1/3 1 ∼
 
kF = = = 1,92d−1 , (4.196)
Ω 4 d
es decir que kF−1 ∼
= d/2. Otra longitud caracterı́stica es el radio de Bohr, a0 = ℏ2 /me2 .
Introducimos entonces un parámetro sin dimensiones,
d
rs = (4.197)
a0
por medio del cual escribimos
3 ℏ2 kF2 N 3 9π 2/3 c2 2,12 e2
 
(0)
E = N= 2 =N 2 (4.198)
5 2m rs 5 4 2a0 rs 2a0
1/3 2
N 3 9π e 0,916 e2

(1)
EI =− = −N (4.199)
rs 2π 4 2a0 rs 2a0
Segunda cuantificación 155

E/N
0,1

HF
0 rs

−0,1

RPA
−0,2
2 4 6 8 10 12

Figura 4.2: Energı́a por partı́cula, en unidades de Ry (e2 /2a0 ), para el estado fun-
damental del gas de Fermi.

La energı́a total ⟨F |Ĥ|F ⟩, evaluada con una función de onda antisimetrizada, se


denomina energı́a de Hartree-Fock (HF)
!
2,21 0,916 e2
EHF = N − + ··· . (4.200)
rs2 rs 2a0

De la Fig. 4.2 vemos que para rs ≳ 2 resulta EHF < 0, lo que indica que el
sistema se torna ligado. El principio de exclusión juega un papael importante en
esto, evitando que los electrones con los mismos spines se acerquen y de este modo
hace disminuir su energı́a electrostática. Notemos que la aproximación de HF es solo
válida para gases densos (rs ≪ 1) y no para los metales con 1, 8 ⩽ rs ⩽ 5, 5.
La energı́a se puede bajar más todavı́a por el hecho de que también los electrones
con spines opuestos tienden a separarse, debido a la interacción Coulombiana. Esta
aproximación se denomina de fases al azar o “random phase approximation” (RPA)
y lleva al resultado9
!
2,21 0,916 e2
ERP A = N − + 0,062 ln rs − 0,142 + · · · (4.201)
rs2 rs 2a0

que tambićn se muestra en la Fig. 4.2.


9
Véase D. Pines, Elementary Excitations in Solids p. 118 y M. Gell-Mann and K. Brueckner,
Phys. Rev. 106, 364 (1957).
156 4.5 Teorı́a cuántica de la radiación

4.5. Teorı́a cuántica de la radiación


Como ya señalamos previamente y en el curso en que aprendimos la mecánica
cuántica de Schrödinger y Heisenberg, para el tratamiento cuántico de sistemas de
partı́culas cargadas en interacción con un campo electromagnético habı́amos consi-
derado a este último como un “fondo” (“background”) clásico. En efecto, se tomó
para el campo electromagnético una solución clásica de las ecuaciones de Maxwell
(por ejemplo la de un campo coulombiano) y se la “sumergió”, como potencial ex-
terno, en la ecuación cuántica para una o varias partı́culas cuánticas cargadas. Ası́
se analizó el átomo de Hidrógeno: se estudió la ecuación de Schrödinger un electrón
cuántico sometido al campo eléctrico coulombiano clásico producido por el núcleo.
En el caso del átomo de helio, también el potencial de repulsión entre los electrones
fue tomado como un potencial coulombiano clásico mientras que los electrones eran
considerados como partı́culas cuánticas.
También estudiamos lo que llamamos la teorı́a semiclásica de la radiación. Pe-
ro ahora aprendimos el método de segunda cuantificación y podremos considerar
al electromagnetismo también de manera cuántica (recordemos que los campos de
gauge son bosones de spin 1) y ası́ tener una descripción más precisa de la radiación
electromagnética en términos de cuantos (fotones).
Repasemos las ideas básicas de la sección 1.9. En el gauge transversal de Cou-
lomb, y en ausencia de cargas y corrientes, las ecuaciones de Maxwell se reducen a
la ecuación de onda para el potencial vector,
!
2 1 ∂22
□ A(r, t) ≡ ∇ − 2 2 A(r, t) = o (4.202)
c ∂t

cuya solución más general se puede expresar como una superposición de ondas planas
con número de onda k y polarización ϵ,
1 X 
A(r, t) = bkα ϵα eik·r−iωk t + b∗kα ϵ∗α e−ik·r+iωk t (4.203)
Ω k,α

donde α = 1, 2 y ϵ real para el caso de polarización lineal, y

ωk = ck. (4.204)

El vector de polarización tiene que ser perpendicular a k,

ϵα · k = 0, (4.205)

es decir, la onda debe ser transversal. La combinación de los coeficientes y sus


conjugados ha sido elegida para que A sea real.
Segunda cuantificación 157

De la densidad de energı́a para el campo electromagnético (1.158), obtenemos el


Hamiltoniano clásico asociado a las ecuaciones de Maxwell en ausencia de fuentes,
ˆ
1  
H= dr E 2 + B 2
2
A partir de las expresiones de los campos eléctricos y magnético en términos del
potencial vector, E = −(1/c)∂A/∂t y B = ∇ × A, e insertando el desarrollo
(4.203) en esta expresión, el Hamiltoniano del sistema puede escribirse en la forma
X  ωk 2
H=2 b∗kα bkα (4.206)
kα c
Podemos interpretar a estos coeficientes bkα y b∗kα como “coordenadas” con las que
se determina al campo A. Dando un determinado conjunto (infinito) de valores de
bkα y b∗kα queda determinado un potencial vector A. Dando otro conjunto, se tiene
otro A. Esto se manifiesta más claramente si se escribe
1
Qkα = (bkα + b∗kα ) (4.207)
c
iωk
Pkα = − (bkα − b∗kα ) (4.208)
c
de manera que el Hamiltoniano puede escribirse
1 X 2 
H= Pkα + ωk2 Q2kα
2 kα
lo que corresponde claramente a una superposición de infinitos osciladores.
Las ecuaciones de Maxwell para A pasan a ser las ecuaciones de Hamilton:
∂H
= −Ṗkα (4.209)
∂Qkα
∂H
= Q̇kα (4.210)
∂Pkα
Con estos P y Q se puede definir a los corchetes de Poisson del problema clásico
{Pkα , Qk′ α′ } = δk,k′ δα,α′
{Pkα , Pk′ α′ } = 0, {Qkα , Qk′ α′ } = 0
En este punto, podemos atacar el problema de la cuantificación del campo electro-
magnético, siguiendo los pasos de la cuantificación canónica. Es decir, imponemos
las relaciones de conmutación inferidas de las relaciones clásicas (4.5)
h i
P̂kα , Q̂k′ α′ = −iℏδk,k′ δα,α′
h i h i
P̂kα , P̂k′ α′ = 0, Q̂kα , Q̂k′ α′ = 0
158 4.5 Teorı́a cuántica de la radiación

De estas reglas es facil deducir las reglas de conmutación las que obedecen b̂ y b̂† .
Conviene antes adimensionalizar estos operadores definiendo
s
2ωk
âkα = b̂kα (4.211)
c2 ℏ
s
2ωk †
â†kα = b̂ (4.212)
c2 ℏ kα

Usando el análogo a (4.207) y (4.208)


1
Qkα = (bkα + b∗kα ) (4.213)
c
iωk
Pkα =− (bkα − b∗kα ) (4.214)
c
para el caso de operadores, se tiene, invirtiendo esta ecuación
1  
âkα = √ ωk Q̂kα + iP̂kα (4.215)
2ℏω
1  
â†kα =√ ωk Q̂kα − iP̂kα (4.216)
2ℏω

con lo que las reglas de conmutación para â y ↠resultan


h i
âkα , â†k′ α′ = δkk′ δαα′
h i
â†kα , â†k′ α′ = 0, [âkα , âk′ α′ ] = 0

Vemos entonces que con este procedimiento, el campo A pasa a ser un objeto que
tiene un desarrollo en términos de operadores â y ↠que obedecen un álgebra de
operadores de aniquilación y creación bosónica,
s
1 X ℏ  ik·r−iωk t 
Â(r, t) = √ c ϵα e âkα + ϵα e−ik·r+iωk t â†kα (4.217)
Ω kα 2ωk

Las ondas planas de la teorı́a clásica que representan el campo de radiación jue-
gan aquı́ el rol de las funciones de onda cuando tomábamos un sistema cuántico de
partı́culas, bosones o fermiones, que obedecı́an la ecuación de Schrödinger y pro-
cedı́amos a la segunda cuantificación del mismo.
Es importante notar que aquı́ el campo de radiación no obedece una ecuación
cuántica (como era el caso de las funciones φn (r) que obedecı́an la ecuación de
Schrödinger), como vimos para el caso que ya discutimos para los bosones de spin
cero y los fermiones. En este caso son directamente soluciones de las ecuaciones
Segunda cuantificación 159

clásicas de Maxwell. Pero, como en los casos anteriores, los coeficientes del desarrollo
son operadores de segunda cuantificación, en este caso en el esquema de Heisenberg
puesto que el campo Â(r, t) ha pasado a ser un operador dependiente del tiempo.
El Hamiltoniano (4.206) se vueve ahora un operador cuántico:
1
X  
Ĥ = ℏωk n̂kα +
kα 2
donde, como antes, hemos definido el operador número de partı́cula como
n̂kα = â†kα âkα
El hamiltoniano cuántico (4.5) corresponde a un sistema de infinitos osciladores de
frecuencia ωk = ck.

4.6. Emisión y absorción de fotones por un átomo


Estamos ahora en condiciones de tratar el problema de absorción y emisión de
radiación por un átomo de manera verdaderamente cuántica. Es decir, tomando
también al campo de radiación en el contexto de la segunda cuantificación.
Vamos a trabajar en la representación de Schrödinger en la que que los operadores
son independientes del tiempo. Es decir que µ = µ (r). A diferencia de lo que
hicimos en el caso libre, en que habı́amos podido complementar la condición de
Lorentz con la elección de A0 = 0 trabajando entonces en el gauge de Coulomb todo
se complica por una de las ecuaciones de Maxwell
□Aµ = jµ
que tiene un lado derecho no trivial por la existencia de la corriente jµ que repre-
senta la interacción de la materia (los electrones en el caso que discutiremos) con
la readiación con una componente j0 en principio no nula. Y en particular, como
j0 ̸= 0 no podemos elegir A0 = 0 como habı́amos hecho anteriormente. Para encarar
esta situación procederemos de la siguiente manera: - Todo vector puede descom-
ponerse en una componente longitudinal V∥ (para el caso del campo de las ondas
que tratamos, por ejemplo, esta componente fue tomada como la componente en
la dirección k ) y una perpendicular V⊥ (que para las ondas de radiación es la del
plano perpendicular a k). El vector resultante puede escribirse como la suma del
rotor de un vector V⊥ = ∇ × v y el gradiente de un escalar V∥ = ∇ϕ,
V⊥ = ∇ × v, V∥ = ∇ϕ
Vemos que dada esta definición, se tiene
∇ · V⊥ = 0, ∇ × V∥ = 0
160 4.6 Emisión y absorción de fotones por un átomo

Luego, si descomponenos al potencial vector A en sus partes transversa V⊥ de di-


vergencia nula por ser un rotor y longitudinal A∥ de rotor nulo por ser un gradiente,
tendremos
A = A⊥ + A∥
con
∇A⊥ = 0, ∇ × A∥ = 0
En tal caso el campo magnético solo dependera de A⊥ ,

B = ∇ × A = ∇ × A⊥ + 0 ⇒ B = B (A⊥ )

O sea, que el campo magnético “no se entera” de la existencia de A∥ . En cuanto al


campo eléctrico, tenemos que en la ecuación de Maxwell ∇E = ρ solo aparecerá la
su componente paralela

∇ · E = 0 + ∇E∥ = 4πρ ⇒ ∇ · E = 4πρ

Las ecuaciones de Maxwell que ligan a E y B y con j = j⊥ + j∥ toman la forma

∂E⊥
∇ × B (A⊥ ) + = 4πj⊥ (4.218)
∂t
∂E∥
= 4πj∥ (4.219)
∂t
De aquı́ concluimos que el campo E∥ es creado por las cargas y corrientes mientras
que el campo magnético solo depende de A⊥ y E∥ . Es decir que para B en ningun
momento necesitamos hacer referencia a A∥ para determinar cantidades fı́sicas. Es
por ello que, si se elige desde un principio el gauge de Coulomb,

∇·A=0

resulta que A∥ tiene rotor y divergencia nulos. Es decir, es idénticamente nulo (o


una constante irrelevante). Lo tomaremos entonces como nulo. O sea que este caso
A∥ = 0 reemplaza a la condición A0 = 0 cuando discutimos la ecuación de ondas
homogénea.
El hamiltoniano clásico de nuestro sistema completo (átomo y radiación) es

e2 X Ze2 1
2
1 e 1
X  X
H= pj − A⊥ (rj ) + − + Hrad
j 2m c i>j 4π |xi − xj | i 4π ri

con ˆ  !2 
1 1 ∂A⊥
Hrad = dr (∇ × A⊥ )2 + 2 
2 c ∂t
Segunda cuantificación 161

Proceder a la segunda cuantificación de este hamiltoniano implica promover pj , rj y


A⊥ a la categorı́a de operadores, dejando solamente a los potenciales coulombianos
de repulsión entre los electrones y de atracción del núcleo (segundo y tercer términos
en (22.30) como objetos clásicos. Podemos entonces reescribir (22.30) en la forma
cuántica
Ĥ = Ĥ0 + Ĥrad + Ĥint
con
1 X e2 1 X Ze2 1
(p̂j )2 +
X
Ĥ0 = − (4.220)
j 2m i>j 4π |xi − xj | i 4π ri
ˆ  !2 
1 
 ∇ × Â⊥
2 1 ∂ Â⊥
Ĥrad = dr + 2  (4.221)
2 c ∂t
 
X e2 2 e X 
Ĥint =  Â ⊥ − p̂ j · Â ⊥j + Â ⊥j · p̂ j
 (4.222)
j 2mc2 2mc j

Si Ĥint fuera nulo, las autofunciones del hamiltoniano podrı́an escribirse como |
Atomo ⟩ | radiación ⟩ Aquı́ es natural identificar —radiación ⟩ con un ket en el
espacio de los números de ocupación de fotones,
| radiación ⟩ = |n1 n2 . . . ni . . .⟩
Podemos ahora pensar que Ĥint produce, como perturbación, transiciones entre los
niveles no perturbados descriptos por (22.34). Como trabajaremos en la represen-
tación de Schrödinger en la que los operadores no dependen del tiempo, se trata
de una perturbación constante pero como ya lo discutimos, puede ser tratada en
el marco de la teorı́a de perturbaciones dependientes del tiempo. Dado que la per-
turbación corresponde a una constante de acoplamiento suficientemente pequeña,
e2 /(ℏc) ≈ 1/137, calcular la primera corrección al problema libre es una buena
aproximación por lo que trabajaremos al primer orden.
En términos de operadores de creación y aniquilación ↠y â tendremos entonces
una perturbación lineal en la que se crearán o destruirán fotones. Para obtener la
probabilidad de transición entre un estado inicial i y uno final f utilizaremos la
fórmula dada por la regla de oro que obtuvimos oportunamente,
2π D E2
f Ĥint i δ (ϵf − ϵi )
Wi→f =

Supongamos estudiar un proceso de absorción de un fotón de impulso ℏk y polari-
zación α. En tal caso
|i⟩ =| Atomo A + nkα fotones ⟩ (4.223)
|f ⟩ =| Atomo B + (nkα − 1) fotones ⟩ (4.224)
162 4.6 Emisión y absorción de fotones por un átomo

donde A indican el estado incial del átomo y B el estado final luego de absorber un
fotón. Es fácil entonces calcular
E
⟨B; nkα − 1 Ĥint A; nkα = (4.225)
s
N
* +
e ℏ
akα exp (ik · rj ) pj · ϵ(α) A; nkα
X
− B; nkα − 1 c (4.226)
mc j=1 2ωV

No aparece en esta fórmula el término del desarrollo que contiene el operador de


creación â†kα ya que su acción implicarı́a crear un estado con nkα +1 fotones mientras
que el bra que aparecerı́a a la izquierda corresponde a nkα − 1 fotones. En contraste,
el ak,α que sı́ debe ser incluido, actúa sobre el bra como uno de creación por lo
que que el producto en el espacio de numero de fotones resulta ser 1 quedando por
calcular solamente el elemento de matriz atómico
s
D E e ℏnkα X D E
B; nkα − 1 Ĥint A; nkα =− B exp (ik · rj ) pj · ϵ(α) A
m 2ωV j

El factor que multiplica el elemento de matriz atómico corresponde a la contribución


de la radiación. El factor que aparecı́a multiplicando a la delta de Dirac en (22.36)
2π D E2
Wi→f = f Ĥint i δ (ϵf − ϵi )

Coincide con el que habı́amos calculado de manera semiclásica en el que cuando
elevábamos al cuadrado el elemento de matriz era en el caso semiclásico
4π 2 c
I
ℏω 2
con
ω2 →− 2
I= A0
2πc


Basta identificar a la amplitud clásica de la onda A 0
s

− e ℏnkα
A0 → ϵ̌
m 2ωV
para que la fórmula que habı́amos obtenido (14.30)

4π 2 c 2
WfAi = 2
I vf† i δ (Ei + ℏω − Ef ) Absorción
ℏω
coincida con la actual, en que la intensidad de la radiación es ahora proporcional al
número nk de fotones.
Segunda cuantificación 163

El cálculo para el caso de emisión de fotones se trata de manera análoga. Podemos


representar el proceso para un átomo en el estado A de la siguiente manera

A + nkα −→ B + (nkα + 1)

En este caso, es el operador â†kα el que contribuye en la expansión pues actuando


sobre el ket |A; nkα ⟩ lo transformarı́a en |A; nkα + 1⟩. Se obtiene entonces
s
D E e ℏ (nkα + 1) X D E
B; nkα + 1 Ĥint A; nkα =− B exp (−ik · rj ) pj · ϵ(α) A
m 2ωV j

Notemos que en este caso, aún si nkα = 0 (es decir, cuando no hay fotones en el
estado inicial) el átomo puede puede emitir un fotón. Se trata en tal caso de una
emisión espontánea que es observable experimentalmente y que no puede obtenerse
cuande se trata a la radiación de manera clásica. Cuando nkα ̸= 0 habrá emisión
inducida por los fotones de la radiación incidente.
La contribución de emisión espontánea corresponde a un fenómeno puramente
cuántico que se obtiene limpiamente al tratar a la radiación de manera cuántica.
Finalmente, también existe la llamada emisión estimulada. Para comprenderla,
comencemos por recordar que cuando un electrón se encuentra en un estado excita-
do, tiende a decaer a un nivel más bajo emitiendo un fotón portador de una energı́a
que es la diferencia entre la de los dos niveles. Para lograr tener muchos electrones
en un dado nivel excitado de los átomos debe existir una fuente de energı́a exterior
de manera de que los estados excitados estén más poblados que los del más bajo.
Se habla de “bombeo de población” y de “inversión de población” que puede ser un
generador eléctrico o la accion de otro laser (bombeo óptico). En respuesta al cam-
po electromagnético externo que corresponde a la misma energı́a, la probabilidad
de transición al estado más bajo es grandemente aumentada, más allá de la emi-
sión espontánea. Esos átomos pueden desexcitarse emitiendo fotones de frecuencias
extremadamente próximas. en un proceso que se conoce como emisión estimulada.
Los cáculos relativos a la emisión y absorción de fotones en los átomos fueron
hechos en 1916 por Einstein 40 . Estos resultados, que 40 Einstein, A., 18 (1916) 318
“Strahlungs-emission und -absorption nach der Quantentheorie”. Verhandlungen der
Deutschen Physikalischen Gesellschaft. Einstein, A., Physikalische Zeitschrift. 18
(1917) 121. “Zur Quantentheorie der Strahlung”
Einstein obtuvo en su incansable búsqueda de contradicciones de la mecánica
cuántica tuvieron una confirmación trascendental a principios la década de 1950
cuando Charles Townes pudo generar experimentalmente luz amplificada por emisión
de radiacin estimulada con un aparato precursor de lo que hoy llamamos Laser.
No pudo hacer este experimento en los laboratoriosde llamados por entonces “Bell
Laboratories” donde trabajaba porque los directivos no vieron una posible utilidad
164 4.6 Emisión y absorción de fotones por un átomo

en su [Link]́ construir el aparato cuando pasó a trabajar en la academia


(la Universidad de Columbia en New York) y por ello compartió el premio Nobel con
los por entonces soviéticos Nikolay Basov and Alexander Prokhorov, que también
trabajaban en instituciones académicas.
Capı́tulo 5

Mecánica cuántica Relativista

5.1. La ecuación de Klein-Gordon


A partir de las reglas de cuantificación canónica se puede obtener la ecuación
cuántica (no relativista) que describe la dinámica de una partı́cula libre de masa
m. En efecto, de la relación de la mecánica clásica no relativista entre energı́a E y
momento p,
p2
+ V = E, (5.1)
2m
y de las reglas de cuantificación canónica1

p → (−iℏ)∇, (5.2)

E → iℏ , (5.3)
∂t
se obtiene la ecuación de Schrödinger para la función de onda ψ(r, t) que contiene
toda la información posible sobre el estado de una partı́cula libre de masa m,
ℏ2 2 ∂
− ∇ ψ(r, t) = iℏ ψ(r, t). (5.4)
2m ∂t
Esta ecuación es obviamente no covariante relativista (i.e. frente a trasnformaciones
de Lorentz): el tiempo y las coordenadas espaciales no son tratados en un pie de
igualdad; incluye una derivada primera en el tiempo y derivadas segundas espaciales.
Conviene aquı́ precisar lo que entendemos por una ecuación covariante relativista.
Dada una función f (r, t) y un operador diferencial Dr,t diremos que la ecuación

Dr,t fs (r, t) = 0, (5.5)


1
Estas reglas pueden ser enunciada de varias maneras, la elegida es la más simple para los
presentes fines.

165
166 5.1 La ecuación de Klein-Gordon

es covariante relativista si, dada una solución fs (x, t) en cierto sistema de coorde-
nadas de espacio-tiempo, cuando por ejemplo hacemos una rotación espacial o un
boost (i.e., transformación del grupo deLorentz propio) para pasar a otro sistema
de coordenadas, la función transformada satisface la misma ecuación, expresada en
términos de las nuevas coordenadas r ′ , t′

Dr′ ,t′ fs (r ′ , t′ ) = 0. (5.6)

Si a una solución ψs (r, t) de la ecuación de Schrödinger (5.4) le asignamos el carácter


de escalar (complejo) frente a transformaciones de Lorentz, un cálculo sencillo con-
firma que ψs (r ′ , t′ ) no es solución de la correspondiente ecuación transformada.
El cuarto trabajo de la serie de artı́culos que Schrödinger publicó en 1926 [1] pre-
senta una versión covariante relativista de la ecuación que rige la dinámica cuántica
de una partı́cula masiva, ecuación que fue obtenida independientemente por Os-
kar Klein, Vladimir Fock y Walter Gordon en el mismo año, [2]-[4]. En su trabajo
Schrödinger consideró el caso de un electrón de masa m sometido a la acción de un
campo eléctrico coulombiano pero su idea puede presentarse de manera muy simple
para el caso de una partı́cula libre. La propuesta de Schrödinger es muy natural: para
llegar a una ecuación relativista que describa la dinámica cuántica de una partı́cula
libre, en lugar de partir de la fórmula de la mecánica clásica newtoniana (5.1), debe
hacérselo a partir de la relación de energı́a-impulso de la mecánica clásica relativista,

c2 p2 + m2 c4 = E 2 . (5.7)

La aplicación de las reglas de cuantificación canónica (5.2) y (5.3) lleva a una ecua-
ción cuántica relativista, la ecuación de Klein-Gordon [2]-[4] para una partı́cula libre
(i.e. sin potencial) de masa m,
ℏ2 ∂ 2 ψ(r, t)
ℏ2 ∇2 ψ(r, t) − m2 c2 ψ(r, t) = . (5.8)
c2 ∂t2
No es inesperado que, habiendo partido de la ecuación relativista (5.7), se llegue
a una ecuación en la que el orden de las derivadas espaciales y temporal sea el mismo.
Si introducimos el operador d’Alembertiano2 □
1 ∂2
□≡ − ∇2 (5.9)
c2 ∂t2
entonces la ecuación(5.8) se puede escribir de manera compacta como
m 2 c2
□ψ(r, t) + ψ(r, t) = 0. (5.10)
ℏ2
2
Este operador diferencial lleva el nombre de Jean Le Rond d’Alambert quien lo introdujo en
1747 en un trabajo sobre cuerdas vibrantes.
Mecánica cuántica Relativista 167

Es evidente ahora que si el carácter de ψ ante transformaciones de Lorentz es el de


un escalar, esta ecuación no solo es covariante sino también invariante relativista ya
que tanto la función ψ como el operador □ lo son.
Es fácil encontrar una solución de la ecuación de Klein Gordon para la partı́cula
libre. Basta hacer un “ansatz”3 como el que se hace en el caso no-relativista, de la
forma
ψ(r, t) = Aei(p·r−Ep t)/ℏ , (5.11)
y ajustar las constantes p y Ep (asociadas con el impulso y la energı́a de la partı́cula
respectivamente) de manera que se satisfaga (5.8). En efecto, si se inserta el ansatz
(5.11) en la ecuación (5.8), para que se satisfaga la ecuación debe satisfacerse la
condición: q
Ep = ±c p2 + m2 c2 , (5.12)
que coincide con la relación clásica relativista entre el impulso y la energı́a.
Recordemos que en la mecánica relativista clásica, al escribir (5.12) solo se retiene
el signo positivo. Si bien ambos signos son aceptables, de incluir a ambos se tendrı́a
un espectro de energı́a que no serı́a continuo: habrı́a un “salto” entre el valor mı́nimo
positivo E0+ = mc2 y el valor máximo negativo E0− = −mc2 . Como en mecánica
clásica no hay ninguna razón para aceptar discontinuidades en la energı́a, debe
elegirse un signo y resulta natural, por tratarse del caso de una partı́cula libre, el
seleccionar la rama positiva (Recordemos que en el caso no-relativista los niveles con
energa negativa corresponden a estados ligados y aquı́ se trata de partı́culas libres).
Con lo anterior, el desarrollo para valores pequeños (en comparación con mc )
del impulso conduce, si no se tiene en cuenta la energı́a en reposo, a la conocida
expresión clásica del Hamiltoniano no-relativista de una partı́cula de masa m,

p2
Ep ≃ . (5.13)
2m
En contraste con las argumentación de la fı́sica clásica y de la cuántica no relativista
para desechar el signo negativo de la energı́a de una partı́cula libre, notemos que
las discontinuidades en los valores posibles de la energı́a son precisamente una de
las caracterı́sticas fundamentales de la mecánica cuántica, por lo que en este caso
relativista no hay razón alguna para descartar una de las dos ramas, aún para el
caso de una partı́cula libre.
Pero se plantea en este caso un problema serio: de no descartarse la solución
con signo negativo la energı́a de la partı́cula libre no estarı́a acotada por abajo y se
podrı́a entonces extraer una cantidad arbitrariamente grande de energı́a tomando
simplemente una partı́cula en reposo con energı́a +mc2 y perturbándola de manera
3
Ansätze: del alemán, propuesta.
168 5.1 La ecuación de Klein-Gordon

de que saltara el “gap”4 de 2mc2 y cayera en un estado con más y más energı́a
negativa. Volveremos a este asunto más adelante.
Ahora bien, utilizando la ecuación relativista propuesta por Schrödinger (y que
hoy se conoce ecuación de Klein Gordon), se obtienen resultados razonables para
las series de Balmer y Lyman del átomo de hidrógeno pero los resultados eran
inaceptables para la constante de estructura fina α determinada ya en esa época
con bastante precisión por F. Paschen y E. Back en el estudio de la acción de
un campo magnético intenso sobre los niveles de energı́a del átomo de hidrógeno
(α = e2 / (4πϵ0 ℏc).
Es importante aquı́ recordar que Schrödinger no ignoraba la existencia del spin
del electrón, sugerido por G. Uhlenbeck y S. Goudsmit en 1925 para dar cuenta del
desdoblamiento de niveles atómicos en un campo magnético externo (efecto Zee-
man). Comprendı́a correctamente que las discrepancias que encontraba provenı́an
de que su ecuación no tenı́a en cuenta el spin del electrón. De tenerlo, la función
de onda asociada al electrón no debı́a tomarse como un escalar frente, en particu-
lar, a rotaciones, y la ecuación que rija su dinámica cuántica tendrı́a que incluir
interacciones que tengan en cuenta a este momento angular intrı́nseco.
Existı́a además un problema conceptual más básico que mostraba la invalidez de
la ecuación de Klein-Gordon para describir la dinámica del electrón en el contexto
de la fı́sica cuántica en la que |ψ|2 se interpreta como una densidad de probabilidad.
Fue este problema, que tiene que ver con la imposibilidad de definir una densidad de
probabilidad consistente a partir de la ecuación de Klein-Gordon, el que llevó a Paul
Dirac a cambiar radicalmente el frente de ataque y proponer la ecuación que lleva
su nombre y que sı́ daba cuenta de todos los resultados experimentales conocidos al
momento (1928) sobre el átomo de hidrógeno.
Para comprender la contradicción entre la ecuación de Klein-Gordon y una den-
sidad de probabilidad consistente, recordemos que en el caso no relativista descripto
por la ecuación (5.4), a partir de la función de onda ψ(r, t) se puede construir la
densidad de probabilidad ρ y la corriente de probabilidad J . La densidad ρ(r, t) re-
sulta ser una función real, semidefinida positiva y de carácter escalar que satisface,
junto a J (r, t), que tiene carácter vectorial, una ecuación de continuidad:

∂ρ
∇·J + = 0, (5.14)
∂t
donde

ρ = |ψ(r, t)|2 (5.15)



J= [ψ ∗ (r, t)∇ψ(r, t) − ψ(r, t)∇ψ ∗ (r, t)] (5.16)
2mi
4
gap: del inglés, hueco, brecha.
Mecánica cuántica Relativista 169

Esta ecuación confirma la interpretación de |ψ(r, t)|2 dr como la probabilidad de


encontrar, en el instante t, a la partı́cula en el diferencial de volumen dr centrado
en el punto r. Como siempre, de tal ecuación de continuidad se prueba fácilmente
la conservación de una “carga”, en este caso probabilidad, siempre que el flujo de J
se anule adecuadamente en el infinito. Se obtiene
ˆ
d
ρ(r, t)dr = 0, (5.17)
dt
o, ˆ
dQ
= 0, Q≡ ρ(r, t)dr . (5.18)
dt
En el párrafo anterior el entrecomillado de la palabra “carga” se debe a lo siguiente.
La definición de Q dada por (5.18) corresponde a la probabilidad de encontrar al
sistema descripto por ψ en el volumen de integración. Pero vista a la luz del teorema
de Noether, Q puede interpretarse como la carga conservada asociada a la invarianza
de la ecuación de Schrödinger frente a un cambio de fase constante α de la forma

ψ(x, t) → exp(iα)ψ(x, t). (5.19)

Es decir, existe en la mecánica cuántica una invarianza global U(1) (el grupo unitario
U(N ) representado por matrices es el grupo de las matrices U unitarias de N ×N –i.e.
U † U = U U † = I. El caso N = 1 puede identificarse con el de los números complejos
de módulo 1. que es el caso de la transformación (5.19). Cuando se trata de una
partı́cula cargada eléctricamente en interacción con el campo electromagnético, esta
invarianza pasa a ser una invarianza local (es decir, α = α(r, t) ) donde un cambio
con fase α(x) en la función de onda va acompañado de un cambio de gauge en el
campo electromagnético.
Planteada la ecuación de conservación (5.18), la interpretación de ρ, definida
positiva, como densidad de probabilidad se vuelve natural. A ello se agrega que la
probabilidad de encontrar a la partı́cula en algún lugar de todo el espacio resulta
constante en el tiempo –conservada– (e igual a 1 con una adecuada normalización
de la función de onda).
Para obtener tal ecuación de continuidad se multiplica la ecuación de Schrödinger
por ψ ∗ (r, t) y se resta el resultado de multiplicar la ecuación conjugada por ψ(r, t). Si
procedemos de la misma manera con la ecuación de Klein-Gordon (5.8), obtenemos

∂ρR
∇ · JR + =0 (5.20)
∂t
donde JR (con R indicamos que se trata del caso relativista) tiene la misma forma
que en el caso no relativista mientras que la densidad de carga ρR cambia radical-
170 5.2 La ecuación de Dirac

mente:
∂ψ ∗ (r, t)
" #
iℏ ∗ ∂ψ(r, t)
ρR = ψ (r, t) − ψ(r, t) , (5.21)
2mc2 ∂t ∂t

JR = [ψ ∗ (r, t)∇ψ(r, t) − ψ(r, t)∇ψ ∗ (r, t)] . (5.22)
2mi
Haber forzado la covarianza implica que ρR tenga una forma funcional análoga a las
componentes de JR con t jugando un rol idéntico al de las coordenadas.
Es evidente que ρR es una función escalar real pero, a diferencia de ρ = |ψ(r, t)|2 ,
puede ser negativa y por ello se pierde la posibilidad de asociarla con una densidad
de probabilidad. Esto es consecuencia de que siendo la ecuación de Klein-Gordon de
segundo orden en el tiempo, es en principio necesario dar dos condiciones iniciales
(para ψ(r, t)y para ∂ψ(r, t)/∂t) para determinarla y no queda excluı́da la posibilidad
de elegir la función y su derivada de manera que ρR < 0. De hecho, dada una
elección de ψ(r, t) y ∂ψ(r, t)/∂t en el instante inicial que haga a ρR positiva, la
elección igualmente aceptable de ψ(r, t) y −∂ψ(r, t)/∂t como condición inicial hará
que ρR < 0.
Otra manera de ver el problema señalado arriba es la siguiente: si se considera
un estado estacionario, puede reemplazarse en (5.21) iℏ ∂ψ(r, t)/∂t por Eψ(r, t),
obteniéndose
E
ρR = |ψ(r, t)|2 (5.23)
mc2
y las soluciones con energı́a negativa (rama negativa de la raı́z (5.12)) correspon-
derán, evidentemente a ρR < 0. De esta última fórmula vemos que, en el lı́mite no
relativista, cuando E → mc2 , ρR deviene la densidad de probabilidad no relativista
habitual,
ρR → |ψ(r, t)|2 = ρ. (5.24)

5.2. La ecuación de Dirac


P.A.M. Dirac (1902-1984) logró resolver en 1928 el problema de cómo compati-
bilizar la necesaria covarianza relativista de una ecuación de ondas, con la necesidad
de tener una densidad de probabilidad definida positiva asociada con la función de
onda cuántica que describe el estado de un electrón5 .
5
Según G. Gamow, Dirac entrevió la solución una noche del invierno de 1928 , mientras meditaba
sentado frente al fuego en el St. John College de Cambridge. Cuenta Dirac que en esa noche jugaba
con matrices de 2 × 2 con propiedades muy notables que habı́a inventado y que no son otra cosa
que las que llamamos matrices de Pauli. En ese relato comenta que él ignoraba que Pauli habia
encontrado esas matrices y que suponı́a que Pauli igualmente ignoraba que él también las habia
inventado.
Mecánica cuántica Relativista 171

Dirac hizo hincapié que el hecho de que la densidad de probabilidad no tuviera


signo definido provenı́a de que la derivada temporal en la ecuación de Klein-Gordon
era de segundo orden (y no de primero como en la ecuación no relativista). Cambió
entonces radicalmente el punto de partida de Schrödinger para la obtención de una
ecuación de ondas relativista que describiera correctamente la dinámica cuántica de
partı́culas de spin 1/2 como el electrón. Publicó un trabajo con su propuesta [6] y
desde entonces la ecuación básica de la mecánica cuántica relativista para el electrón
ha tomado su nombre.
Quedó claro en el análisis previo que la ecuación de Klein-Gordon conduce a una
densidad de probabilidad negativa por tratarse de una ecuación de segundo orden en
el tiempo. Esto último, a su turno, es obligado por requerimientos de la covarianza
relativista: las derivadas espaciales que resultan de la cuantificación canónica de la
energı́a cinética
son de segundo orden.
Dando un corte drástico a la contradicción, Dirac propuso una ecuación de primer
orden tanto en las variables espaciales como en las temporales. En cierto modo, en
lugar de aplicar las reglas de cuantificación canónica a la relación entre el cuadrado
de la energı́a y el impulso,

E 2 = p 2 c2 + m 2 c4 (5.25)
Dirac lo hizo con la idea de que relativı́sticamente la energı́a se elaciona con la
masa y el impulso a través de una raı́z cuadrada,
q
E = ± p2 c2 + m2 c4 (5.26)
Pero como no era razonable abandonar la linealidad de la ecuación de ondas
escribiendo para la ecuación de ondas una en que ψ apareciera dentro de raı́ces cua-
dradas, lo que vioları́a el principio de superposición), Dirac no planteó una ecuación
con raı́ces cuadradas sino que propuso una que, “elevada al cuadrado”, reproduje-
ra (5.25) de manera que en el lı́mite c → ∞ se recupera el resultado no relativista
E = p2 /(2m) (El sentido de de escribir “elevar al cuadrado” una ecuación diferencial
quedará aclarado más adelante).
En este punto recordemos que cuando en la mecánica cuántica no relativista
se pretende describir al electrón incluido su spin, debe considerarse una función de
onda que no es un escalar sino que tiene 2 componentes (más precisamente se trata
de un espinor de dos componentes χ que suele llamarse espinor de Pauli),
!
χ1 (r, t)
χ(r, t) = . (5.27)
χ2 (r, t)

Por ejemplo, consideremos el caso de un electrón en presencia de un campo


172 5.2 La ecuación de Dirac

eléctrico
r dϕ
E = −e (5.28)
r dr
con ϕ el potencial escalar. Vimos en el primer curso de mecánica cuántica que el
hamiltoniano del electrón, tratado como un espinor de 2 componentes toma en este
caso la forma
!
p2 /2m + eϕ(r) 0
H= 2 + w(r)σ · L (5.29)
0 p /2m + eϕ(r)
con
e2 ℏ dϕ
w(r) = − (5.30)
4m2 c2 rdr
donde σ = (σ 1 , σ 2 , σ 3 ) son las matrices de Pauli, de 2 × 2.
! ! !
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (5.31)
1 0 i 0 0 −1
Para mayor generalidad que la de los espinores de Pauli, Dirac consideró a la
función de onda como un objeto no de 2 sino de N componentes, esperando que
ciertas propiedades básicas a exigir a la teorı́a fijaran N y el carácter espinorial de
ψ. Escribió entonces
 1 
ψ (r, t)
 2
 ψ (r, t) 

·
 
= (ψ α ) ,
 
ψ(r, t) =   α = 1, 2, . . . , N (5.32)

 · 

·
 
 
ψ N (r, t)
La ecuación diferencial lineal de primer orden con coeficientes constantes6 más
general que puede escribirse para el caso de un electrón libre en un espacio-tiempo
de 3 + 1 dimensiones es entonces:
1 ∂ψ ∂ψ ∂ψ ∂ψ imc
+ α1 1 + α2 2 + α3 3 + βψ = 0. (5.33)
c ∂t ∂x ∂x ∂x ℏ
Las constantes c (velocidad de la luz), m (masa de la partı́cula) y ℏ (constante de
Planck) aparecen por conveniencia posterior. La arbitrariedad de los coeficientes
i
está dada por constantes αρσ y βρσ que, dado que ψ es un vector columna de N
elementos, pueden considerarse 4 matrices de N × N a determinar por razones
fı́sicas. La ecuación (5.33) puede reescribirse de manera más compacta en la forma
1 ∂ψ imc
+ α · ∇ψ + βψ = 0 (5.34)
c ∂t ℏ
6
Es la homogeneidad del espacio-tiempo la que implica que sean constantes.
Mecánica cuántica Relativista 173

Nótese que las componentes αi de α = (α1 , α2 , α3 ) son cada una una matriz de
N × N . En este caso poner los ı́ndices arriba o abajo es solamente una cuestión de
estética pues se trata de ı́ndices “espinoriales”.
En camino de obtener una ecuación de continuidad, analicemos el resultado de
conjugar la ecuación (5.34) (Utilizaremos la notación f ∗ para indicar el conjugado
de una función f ). Para el caso de espinores, introducmos la notación
 
ψ † ≡ ψ ∗T = ψ 1∗ , ψ 2∗ , . . . , ψ N ∗ , (5.35)

que implica conjugar y trasponer al espinor definido en la ec. (5.32). La ecuación


que resulta de conjugar y trasponer (5.34) puede entonces ser escrita ası́:

1 ∂ψ †   imc † †
+ ∇ψ † · α† − ψ β = 0. (5.36)
c ∂t ℏ

Aquı́ αi es la traspuesta conjugada de la matriz αi .
Multiplicando (5.34) a izquierda por ψ † , (5.36) a derecha por ψ y luego sumando
ambos resultados se obtiene
1 ∂|ψ|2  †    imc †  
+ ψ α · ∇ψ + ∇ψ † · α† ψ + ψ β − β † ψ = 0, (5.37)
c ∂t ℏ
donde hemos introducido a la función real |ψ|2 , semidefinida positiva, de la manera
siguiente:
|ψ|2 = ψ † (r, t)ψ(r, t). (5.38)
Basta pedir que las matrices αi y β sean hermı́ticas para que la ecuación (5.37) se
simplifique considerablemente y tenga las caracterı́sticas de una tı́pica ecuación de
continuidad. En efecto, si
αi = αi† , β = β † , (5.39)
la ecuación (5.37) toma la forma simple
1 ∂|ψ|2  
+ ∇ ψ † αψ = 0. (5.40)
c ∂t
Entonces, si se define
ρ(r, t) = |ψ(r, t)|2 , (5.41)
y
J (r, t) = ψ † (r, t)cαψ(r, t), (5.42)
y se puede escribir a (5.40) como una ecuación de continuidad e interpretar a ρ como
una densidad de probabilidad semidefinida positiva,
∂ρ
+ ∇ · J = 0. (5.43)
∂t
174 5.2 La ecuación de Dirac

¡El problema de la ecuación de Klein-Gordon no existe entonces para la ecua-


ción de Dirac! Nótese que la definición de ρ es análoga a la que resulta en el caso
no-relativista para espinores de dos componentes. En contraste, la de J es comple-
tamente nueva (volveremos a ella más adelante cuando estemos en condiciones de
ligarla con la “velocidad” de la partı́cula cuya función de onda es el espinor ψ).
Hay una manera sugestiva de reescribir la ecuación de Dirac (5.34)

∂ψ h i
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ, (5.44)
∂t
que nos permite identificar al operador p con −iℏ∇, la misma expresión que la de
la cuantificación canónica no relativista. En cuanto al operador H,

H = cα · (−iℏ)∇ + βmc2 , (5.45)

podemos identificarlo como el generador de traslaciones temporales infinitesima-


les, es decir con el Hamiltoniano del sistema que pretendemos describir (el de una
partı́cula libre de masa m). Es importante notar que la hermiticidad de las 4 matrices
α y β garantiza que H = H † .
Para verificar que la ecuación de Dirac es consistente con la relación entre energı́a
e impulso que debe satisfacer un sistema relativista, apliquemos el operador
1∂ imc
−α·∇− β (5.46)
c ∂t ℏ
a la ecuación (5.34). Nótese el cambio de signo en los dos últimos términos respecto
del operador que aparece en (5.36). La idea está inspirada en la acción de multiplicar
por (a−b) a la cantidad (a+b) para obtener una diferencia de cuadrados. Obtenemos
! !
1∂ imc 1 ∂ψ imc
−α·∇− β + α · ∇ψ + βψ = (5.47)
c ∂t ℏ c ∂t ℏ
1 ∂ 2ψ k l ∂2 m2 c2 2 imc  k k ∂ψ

− α α ψ+ β ψ − α β + βα = 0. (5.48)
c2 ∂t2 ∂xk ∂xl ℏ2 ℏ ∂xk
Dada la simetrı́a de las derivadas del segundo término de la segunda lı́nea se puede
escribir
∂2 1 k l  ∂2
αk αl k l = α α + αl αk . (5.49)
∂x ∂x 2 ∂xk ∂xl
Basta entonces pedir que
1 k l 
α α + αl αk = δ kl , (5.50)
2
para que el término de derivadas espaciales de la segunda lı́nea de (5.47) corres-
ponda al Laplaciano que aparece en la ecuación de Klein-Gordon como parte del
Mecánica cuántica Relativista 175

d’alambertiano. Si adoptamos esta condición y además imponemos

αk β + βαk = 0, (5.51)
β 2 = I, (5.52)

la segunda lı́nea de (5.47) deviene la ecuación de Klein-Gordon (5.8) y por ello se


verifica que toda solución de la ecuación de Dirac satisface también la ecuación de
Klein-Gordon,

ℏ2 ∂ 2 ψ(r, t)
2 2
− ℏ2 ∇2 ψ(r, t) + m2 c2 ψ(r, t) = 0 (5.53)
c ∂t
y por lo tanto es consistente con la relación energı́a impulso relativista que vimos
era verificada por esta última.
La derivación anterior aclara el sentido que tenı́a la frase que se referı́a a “elevar
al cuadrado” una ecuación.
Las condiciones que ya hemos impuesto a las matrices α y β implican varias
propiedades. En particular, si reescribimos la ecuación (5.51) en la forma

βαk = −αk β, (5.54)

calculamos el determinante,
   
det βαk = det −αk β = (−1)N det αk β , (5.55)

y usamos la propiedad cı́clica det AB = det BA llegamos a que

(−1)N = 1 ⇒ N ≡ par. (5.56)

Si se multiplica a derecha (5.54) por β y luego se usa (5.52), se obtiene

βαk β = −αk , (5.57)

Si ahora calculamos la traza de ambos miembros,

tr βαk β = − tr αk (5.58)
k 2 k k k
tr βα β = tr β α = tr α = − tr α . (5.59)

La propiedad cı́clica de la traza implica que el lado izquierdo de la igualdad de (5,57)


es +αk mientras quee el lado derecho tiene el signo opuesto por lo que o

tr αk = 0. (5.60)

Analogamente se obtiene que


tr β = 0. (5.61)
176 5.2 La ecuación de Dirac

Podemos ahora escribir la ecuación de Dirac (5.34) de una manera explı́citamente


covariante. Para ello introduzcamos la notación

γ 0 = β, (5.62)
γ i = βαi , (5.63)

que en forma compacta escribimos


 
γ µ = β, γ i . (5.64)

Puede verse fácilmente que

γ µ γ ν + γ ν γ µ = 2g µν IN , (5.65)

con la métrica g µν definida a partir de la identidad g µν gνρ = δρµ con gνρ dada matri-
cialmente por la ec. (5.72).
Si multiplicamos la ecuación de Dirac (5.34) por iℏβ y usamos la nueva notación
tendremos
∂ψ(r, t)
iℏγ µ − mcψ(r, t) = 0. (5.66)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente covariante, la
ecuación matricial que describe la dinámica relativista de una partı́cula libre de
masa m. Se puoede lograr una forma más compacta utilizando la notación (), lo
cual arroja
iℏγ µ ∂µ ψ − mcψ = 0. (5.67)

Finalmente, introducimos la notacion de Feynmann, en la que se define

∂/ = γ µ ∂µ , / = γ µ Aµ
A (5.68)

y la ecuación de Dirac resulta

(iℏ∂/ − mc)ψ = 0. (5.69)

Resta confirmar la covarianza y determinar explı́citamente las cuatro matrices γ µ


(llamadas matrices de Dirac). En particular, su orden (por ahora N ×N es arbitrario)
o, lo que es lo mismo, cuál es el número N de componentes de ψ(r, t). Luego,
deberemos analizar las propiedades de ψ(r, t) ante transformaciones de Lorentz,
determinar el spin de la partı́cula que describe y buscar las soluciones.
18

o
γ µ = (β, γ i ) (1.74)
Puede verse fácilmente que
µ ν ν µ µν
γ γ cuántica
Mecánica + γ γ = Relativista
2g IN ×N (1.75) 177
µν µν
con la métrica g definida a partir de la identidad g gνα = δαµ
con gνα
dada por la fórmula (1.29).
Si multiplicamos la ecuación de Dirac (1.45) por ih̄β y usamos la
nueva notación tendremos
∂ψ(&x, t)
ih̄γ µ − mcψ(&x, t) = 0 (1.76)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente co-
variante, la ecuación matricial que describe la dinámica relativista de
una partı́cula libre de masa m.
Resta confirmar la covarianza y determinar explı́citamente las cu-
atro matrices γ µ (llamadas matrices de Dirac). En particular, su or-
den (por ahora N × N es arbitrario) o, lo que es lo mismo, cuál es el
número N de componentes de ψ(&x, t). Luego, deberemos analizar las
propiedades de ψ(&x, t) ante transformaciones de Lorentz, determinar el
spin de la partı́cula que describe y buscar las soluciones.

Fotografı́a de la placa de pizarra verde colocada en la abadı́a de Westminster, a


pocos metros de la la tumba de Isaac Newton, en la que fue grabada la ecuación de
la mecánica cuántica relativista de una partı́cula libre de masa m para el caso en
que las unidades son aquellas en las que resulta c=1.

Figura 5.1: Fotografı́a de la placa de pizarra verde colocada en la abadı́a de West-


minster, a pocos metros de la la tumba de Isaac Newton, en la que fue grabada la
ecuación de la mecánica cuántica relativista de una partı́cula libre de masa m para
el caso en que las unidades son aquellas en las que resulta c = 1.
178 5.3 Transformaciones de Lorentz

5.3. Transformaciones de Lorentz


Antes de embarcarnos en la descripción de la ecuación de onda relativista es
conveniente mencionar brevemente las transformaciones de Lorentz (TL) que se usan
en la cinemática clásica relativista [2], para luego discutir sus análogos cuánticos
y finalmente encontrar la generalización relativista para los grados de de libertad
intrı́nsecos.
Consideremos dos eventos en el espacio-tiempo, (x, y, z, t) y (x + dx, y + dy, z +
dz, t+dt). Podemos generalizar el concepto de distancia entre dos puntos en el espacio
introduciendo el “intervalo” ds entre dos puntos en el espacio-tiempo. Para que sea
el mismo para todos los observadores (inerciales), ds tendrá que ser invariante con
respecto a las rotaciones y a las TL y por lo tanto debe estar dado por:
 
ds2 = c2 dt2 − dx2 + dy 2 + dz 2 (5.70)

El grupo de todas las transformaciones que dejan invariante ds2 se denomina el grupo
homogéneo de Lorentz7 . Restringiremos nuestra discusión a este tipo de transforma-
ciones y en lo que sigue omitiremos la palabra homogéneo al referirnos al grupo de
Lorentz (GL).
En un espacio 3-dimensional (x, y, z) son componentes de un 3-vector, y dr2 =
dx + dy 2 + dz 2 se puede escribir en la forma
2

dr2 = (dxi )2 , x1 = x, x2 = y, x3 = z
X
(5.71)
i=1,2,3

que resulta ser una forma bilineal definida positiva por ser suma de cuadrados,
e invariante respecto de las rotaciones en el espacio usual. Para generalizar a 4
dimensiones esta manera de escribir el intervalo ds2 tenemos el problema de que ya
no resulta positivo definido, y necesitamos introducir algún objeto que contenga la
información del signo de cada coordenada. La forma usual de hacerlo es introducir
la “métrica” del espacio, gµν , como los elementos de la matriz diagonal

1 0 0 0
 
0 −1 0 0
g= 
(5.72)
0 0 −1 0 
 

0 0 0 −1

donde las filas y las columnas corresponden a las componentes 0 ,1, 2 y 3. De esta
forma el intervalo puede escribirse

ds2 = dxµ gµν dxν


X
(5.73)
µ=0,1,2,3

7
El grupo homogéneo excluye las traslaciones
Mecánica cuántica Relativista 179

donde agregamos además la coordenada x0 = ct e introducimos el tetravector (lla-


mado contravariante, con el ı́ndice en la posición suprior)8

xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z). (5.74)

Es conveniente, para no escribir sistemáticamente la métrica en todos lados, definir


un tetravector covariante, con el ı́ndice en posición inferior, en la forma

gµν xν = gµ0 x0 + gµ1 x1 + gµ2 x2 + gµ3 x3 .


X
xµ = (5.75)
ν

Mirando (5.75), vemos que x0 = x0 , x1 = −x1 , etc, de manera que el intervalo se


escribe
ds2 = dxµ dxµ
X
(5.76)
µ

Finalmente, para simplificar la notación, adoptaremos la convención de suma de


Einstein: un ı́ndice que aparece una vez en la posición superior y una vez en la
posición inferior se suma automaticamente de 0 a 3 :
3
V µ Vµ → V µ Vµ
X
(5.77)
µ=0

ası́, el intervalo se escribe


ds2 = dxµ dxµ . (5.78)
Ası́ escrito, posee la forma de producto interno entre un vector contravariante con
otro covariante la cual arroja como resultado un escalar (o invariante).
Dado que el determinante de gµν es no nulo, existe su inversa, que es g −1 = g. A
los elementos de matriz de g −1 los llamamos g µν Al ser inversas, satisfacen

gµρ g ρν = δµν . (5.79)

Volviendo a las transformaciones homogéneas de Lorentz, ahora que hemos in-


troducido los tetravectores, podemos escribirlas en la forma

x′µ = Λµν xν , Λµν ∈ R. (5.80)

que inducen una transformación análoga en los dxµ (atención que el orden en que
aparecen los ı́ndices µ y ν es importante). Dado que tienen que mantener invariante
el intervalo ds2 , se debe satisfacer que

gµν Λµρ Λν σ = gρσ . (5.81)


8
Lo pronunciamos tetravector o cuadrivector según la literatura.
180 5.3 Transformaciones de Lorentz

Observemos que si pensamos a Λµν como los elementos de una matriz Λ, entonces
podemos escribir (5.81) como un producto matricial9 ,
ΛT gΛ = g. (5.82)
Esto significa que el grupo de transformaciones que dejan invariante al intervalo
ds2 , lo que se conoce como grupo de Lorentz, es lo que se denomina grupo pseudo-
ortogonal O(1,3), usualmente denotado L para los fı́sicos.
Para hallar la regla de transformación del tetravector covariante, primero subimos
su ı́ndice, luego lo transformamos de acuerdo a la regla que para tetravectroes con-
travariantes (5.80), y luego bajamos su ı́ndice:
x′µ = gµν x′ν = gµν Λν ρ g ρσ xσ , (5.83)
Para simplificar esta expresión, multiplicamos (5.81) por g σλ , y usamos (5.79):
 
gµν Λν σ g σλ Λµρ = δρλ (5.84)
y entonces observamos que
gµν Λν σ g σλ = (Λ−1 )λµ (5.85)
es decir, las componentes µ, ν de la transformación de Lorentz inversa. Solo por
cuestiones de notación, definimos
Λν µ = (Λ−1 )µν (5.86)
Y entonces resulta10

x′µ = Λµσ xσ . (5.89)


Más generalmente, un tetravector contravariante V µ es un objeto que frente a
una transformación de coordenadas (5.80) se tranasforma de la misma manera:
V µ = Λµν V ν . (5.90)
9
Observemos que
(ΛT )µν = Λν µ .

10
Notemos la siguiente sutileza: La suma implı́cita en el lado derecho de
x′µ = Λµν xν = (Λ−1 )ν µ xν (5.87)
corre sobre un ı́ndice de fila de la matriz Λ−1 . Luego, en términos de matrices, esta transformación
debe pensarse como la inversa transpuesta de Λ actuando sobre el vector columna xµ . Es decir, en
notación matricial,
x′ = (Λ−1 )T x. (5.88)
Mecánica cuántica Relativista 181

y lo mismo para un tetravector covariante.


En especial, definimos los operadores diferenciales
! !
∂ 1∂ ∂ ∂ ∂ 1∂
∂µ = = (∂0 , ∂1 , ∂2 , ∂3 ) = , , , = ,∇ (5.91)
∂xµ c ∂t ∂x ∂y ∂z c ∂t

y su version contravariante
!
µ µν 1∂
∂ = g ∂ν = , −∇ (5.92)
c ∂t

que dan origen al operador d’Alambertiano:


!
µ 1 ∂2 ∂2 ∂2 ∂2 1 ∂2
□ = ∂ ∂µ = 2 2 − + + = − ∇2 . (5.93)
c ∂t ∂x2 ∂y 2 ∂z 2 c2 ∂t2

que resulta invariante de Lorentz.


Observemos que ∂µ efectivamente se transforma como un tetravector covariante,
dado que por la regla de la cadena

∂ ∂ ∂xν
∂µ′ = = (5.94)
∂x′µ ∂xν ∂x′µ
y de (5.80),
xµ = (Λ−1 )µν x′ν = Λν µ x′ν . (5.95)
y entonces
∂µ′ = Λµν ∂ν . (5.96)
El tetravector energı́a-impulso de una partı́cula es:

E E
   
µ
p = ,p , pµ = , −p (5.97)
c c
dando lugar al invariante

E2
p2 = p µ pµ = − p · p = m2 c2 (5.98)
c2
o, cuando c = 1
p2 = E 2 − p 2 = m 2 . (5.99)
Usaremos la notación p · x para el producto escalar de los tetravectores pµ y xν :

p · x = pµ xν = Et − p · r (5.100)
182 5.3 Transformaciones de Lorentz

También haremos uso de los 4-tensores antisimétricos que son de la forma:

0 V1 V2 V3
 
−V 1 0 −A 3
A2 
T µν =  ≡ {V , A};

Tµν = {−V , A} (5.101)
−V 2 A3 0 −A1 

−V 3 −A2 A1 0

Las componentes espaciales T 32 , T 13 , T 21 constituyen, con respecto a las trans-


formaciones espaciales, un un vector axial, A, en tres dimensiones. En cambio, las
componentes T 01 , T 02 y T 03 forman con relación a las mismas transformaciones, un
vector tridimensional polar V [3]. Como ejemplos podemos citar al tensor para el
campo electomagnético:

F µν = ∂ µ Aν − ∂ ν Aµ = {−E, B} (5.102)

donde Aµ ≡ (ϕ, A) es el campo electomagnético y

Lµν = xµ pν − xν pµ = {K, −L} (5.103)

donde
L=r×p (5.104)
es el impulso angular orbital y

K = ctp − Er/c = x0 p − p0 r (5.105)

El producto escalar de dos 4-tensores antisimétricos, T µν y T ′µν

T · T ′ ≡ Tµν T ′µν = 2 (A · A′ − V · V ′ ) (5.106)

es invariante con respecto a las TL. Por ejemplo, para el campo electromagnético:
 
F · F = 2 B 2 − E 2 = inv. (5.107)

Ejemplos de Transformaciones de Lorentz


Entre las distintas transformaciones del grupo de Lorentz, encontramos las in-
versiones espaciales, o transformaciones de paridad (r → −r, t → t),

1 0 0 0
 
0 −1 0 0
ΛP =  , (5.108)
 
0 0 −1 0 
0 0 0 −1
Mecánica cuántica Relativista 183

inversiones temporales (r → r, t → −t),


−1 0 0 0
 
 0 1 0 0
ΛT =  ,

(5.109)
 0 0 1 0

0 0 0 1
rotaciones, por ejemplo de un ángulo θ alrededor del eje z:
1 0 0 0
 
0 cos θ − sin θ 0
ΛR (θ) =  , (5.110)
 
0 sin θ cos θ 0
0 0 0 1
y tranformaciones propias de Lorentz o “boosts” temporales, que afectan a una de
las coordenadas y al tiempo, por ejemplo para el caso en que la velocidad relativa
entre los dos sistemas es v en la dirección del eje x, se escriben
cosh ω sinh ω 0 0
 
 sinh ω cosh ω 0 0
ΛB (ω) =  (5.111)

 0 0 1 0
 

0 0 0 1
−1/2 −1/2
donde tanh ω = v/c y por lo tanto cosh ω = (1 − v 2 /c2 ) y sinh ω = v/c (1 − v 2 /c2 ) .
Los boosts y las rotaciones pueden formarse mediante transformaciones infinitesi-
males consecutivas a partir de la identidad ΛI (están “continuamente conectadas” a
ΛI ), mientras que ΛT y ΛP no pueden (están “desconectadas” de ΛI , o se dice que
son transformaciones “discretas”). Cualquier producto de boosts, rotaciónes, ΛT y
ΛP pertenece al grupo de Lorentz, y resulta que saturan el grupo de Lorentz.
Adoptaremos la convención seguida hasta ahora, que corresponde a las rotaciones
activas. Esto significa que la rotación afecta al sistema fı́sico, mientras que los ejes
de coordenadas quedan fijos. Lo mismo hacemos con los boosts de Lorentz, y para
una TL en la dirección x con velocidad relativa v.
Consideremos un sistema invariante relativista que obedece la ecuación covarian-
te de Klein-Gordon. Si pretendemos que el módulo cuadrado de la función de onda,
ligado a una cantidad medible, no cambie frente a este grupo de transformaciones,
la función de onda deberá permanecer invariante a menos de una posible fase:
Λ
ψ(r, t) → ψ ′ (r ′ , t′ ) = exp(iα)ψ(r, t) (5.112)
Supongamos que α representa una inversión espacial. Entonces, si se consideran dos
inversiones espaciales, se tendrá que exp(2iα) = 1 y por lo tanto α = 0, π. Luego,
ante una inversión espacial
ψ ′ (−r, t) = ±ψ(r, t) (5.113)
184 5.4 La ecuación de continuidad

Es decir que ψ(r, t ) puede ser un escalar (signo +) o pseudoescalar (signo −).
En cuanto a rotaciones, que son continuas, debemos incluir, por continuidad, a la
identidad. Al hacer una rotación de 2π si α no se mantuviera constante tendrı́amos
una inconsistencia (lo mismo sucede para boosts, que pueden considerarse como
rotaciones hiperbólicas).
Luego ψ(r, t) es un escalar o pseudoescalar frente a reflexiones espaciales y un
escalar frente a transformaciones propias de Lorentz y rotaciones. Tal función de
onda sólo puede describir partı́culas que no tengan otros grados de libertad que
los asociados con el espacio-tiempo. Es decir, la ecuación de Klein-Gordon describe
partı́culas de spin 0. Fueron Pauli y Weisskopf [5] quienes justamente propusieron
utilizar la ecuación de Klein-Gordon para describir la dinámica cuántica de bosones.

5.4. La ecuación de continuidad


La ecuación de Dirac para una partı́cula relativista de masa m se escribe de
manera explı́citamente covariante [ec. (5.34)] como

iℏγ µ ∂µ ψ − mcψ = 0 (5.114)

donde las matrices γ µ son cuatro matrices de N × N que, de acuerdo a su definición


en términos de las matrices α y β [ecs.(5.123) y (5.63)] y de las propiedades de estas
últimas que fue necesario imponer satisfacen

γ µ γ ν + γ ν γ µ = 2g µν IN , (5.115)
tr γ µ = 0. (5.116)

En términos de estas matrices (llamadas matrices de Dirac), la ecuación de con-


tinuidad (5.43) que obtuvimos a partir de la ecuación (5.114) puede escribirse de
manera explı́citamente covariante frente a transformaciones de Lorentz. En efecto,
definiendo

J 0 (r, t) = cρ(r, t) = cψ(r, t)† ψ(r, t) = cψ(r, t)† γ 0 γ 0 ψ(r, t), (5.117)
J = cψ(r, t)† αψ(r, t) = cψ(r, t)† γ 0 γψ(r, t), (5.118)

podemos escribir
J µ = cψ(r, t)† γ 0 γ µ ψ(r, t), (5.119)
donde hemos usado la ecuación (5.115) para escribir las igualdades (5.118).
Si en este punto se introduce la importante definición

ψ̄(r, t) ≡ ψ(r, t)† γ 0 , (5.120)


Mecánica cuántica Relativista 185

la corriente puede ser escrita de manera compacta como

J µ = cψ̄(r, t)γ µ ψ(r, t), (5.121)

y la ecuación de continuidad deviene

∂J µ
= ∂µ J µ = 0. (5.122)
∂xµ

Veremos que ψ̄(r, t) jugará un papel más importante que ψ(r, t)† en el análisis
de la mecánica cuántica relativista. Más aun, en el marco de la cuantificación de las
teorı́as de campos vı́a el método de la integral funcional11 reaparecerá en un pie de
igualdad con ψ como una función independiente de ψ.
Conviene por lo anterior determinar qué ecuación satisface ψ̄(r, t). Para ello
conjugamos y trasponemos la ecuación (5.114). Luego la multiplicamos por γ 0 a
derecha y usamos que12
γ 0 γ µ† γ 0 = γ µ , (5.127)
para obtener
iℏ ∂µ ψ̄γ µ + mcψ̄ = 0. (5.128)
Recordemos que la ecuación de Dirac para ψ, ec. (5.114) tiene la forma

iℏγ µ ∂µ ψ − mcψ = 0 (5.129)

Notemos que estas ecuaciones difieren solo en el signo relativo. De hecho, toman-
do a ψ y ψ̄ como variables independientes, las ecuaciones pueden ser obtenidas a
partir de la acción ˆ
S= d4 x L (5.130)

11
El método de la integración funcional, desarrollado por R. Feynmann a partir de una idea de
Dirac provee una manera alternativa a la cuantificación de las teorı́as de campos.
12
A partir de las definiciones

γ 0 = β, (5.123)
i i
γ = βα , (5.124)

con β = β † y αi = αi† , y β 2 = 1, obtenemos

γ i† = αi β (5.125)

y entonces
γ 0 γ i† γ 0 = βαi β 2 = γ i . (5.126)
γ 0 es hermı́tica, entonces γ 0† = γ 0 = γ 0 γ 0 γ 0 .
186 5.5 Los valores posibles de N

con el Lagrangiano de Dirac dado por

L = ψ̄ (iℏγ µ ∂µ − mc) ψ (5.131)

Nótese que el diferencial en la integral que define a la acción (5.130)) implica la


integración sobre el tiempo. Recordando la definición del Lagrangiano en la formu-
lación de la mecánica clásica deberı́amos llamar a LDirac densidad Lagrangiana.
La ecuación para ψ resulta de las ecuaciones de Euler-Lagrange que resultan de
variar respecto a ψ̄
 
∂L ∂L
∂µ    = , (5.132)
∂ ∂µ ψ̄ ∂ ψ̄
∂L
0= = (iℏγ µ ∂µ − mc)ψ, (5.133)
∂ ψ̄

(la derivada respecto de ∂µ ψ̄ del lado izquierdo de esta ecuación se anula porque en
el Lagrangiano no aparecen derivadas de ψ̄). Para obtener la ecuación que obedece ψ̄
conviene integrar por partes la acción (5.130)) y luego se procede de manera análoga
al caso de ψ. Finalmente, hay otra manera de escribir el Lagrangiano de Dirac, por
ejemplo, poniendo un factor 1/2 a la suma de dos términos, uno en el que es ψ quien
aparece derivada, el otro en el que es ψ̄ quien aparece derivada.

5.5. Los valores posibles de N


Dirac introdujo cuatro matrices de N ×N, γ µ , independiente. Estudiando más en
detalle sus propiedades es posible determinar los valores de N y la forma explı́cita
de cada una de las cuatro matrices. También se puede formar 6 productos tomando
de a 2 matrices diferentes

γ 0γ 1 γ 0γ 2 γ 0γ 3 iγ 1 γ 2 iγ 1 γ 3 iγ 2 γ 3 (5.134)

En cuanto a los 4 productos posibles de tres, se tiene

iγ 0 γ 1 γ 2 iγ 0 γ 1 γ 3 iγ 0 γ 2 γ 3 γ 1γ 2γ 3 (5.135)

Finalmente, existe un único producto de a cuatro que juega un rol muy importantes
en la mecánica cuántica relativista por lo que se le asigna un sı́mbolo especı́fico, γ5

iγ 0 γ 1 γ 2 γ 3 ≡ γ5 (5.136)

asociado a una simetrı́a muy importante que discutiremos más en detalle luego y
que se denomina “quiralidad” (del griego χϵιρ, (kheir), mano).
Mecánica cuántica Relativista 187

No hay más productos distintos a los ya listados: si se tratara de armar un


producto de 5 matrices habrı́a que repetir alguna en ese producto. usando la anti-
conmutación de de las matrices de Dirac distintas entre sı́ se puede ubicar de manera
contiguas a las dos que son iguales usando esta propiedad. Y siendo que el producto
de dos iguales es proporcional a la identidad el producto de 5 se reduce a uno de 3
ya incluı́do en la lista de las ecs. (5.134)-(5.136).
Las 11 matrices (5.134)-(5.136) junto con las 4 matrices γ µ y la identidad I
forman un conjunto de 16 matrices que llamaremos Γl , con l = 1, 2, . . . , 16. A las 4
primeras las escribiremos temporariamente como
Γ1 = γ 0 , Γ2 = iγ 1 , Γ3 = iγ 2 , Γ4 = iγ 3 (5.137)
de manera que su cuadrada sea igual a la identidad. Las 12 siguientes son las que
hemos listado en las ecuaciones (5.134)-(5.136) y también cumplen con esta propie-
dad.
Se puede verificar fácilmente que las matrices Γl ası́ definidas satisfacen las si-
guientes propiedades
1. Γl Γn = aln Γm , aln = ±1, ±i
2. Γl Γn = I ⇐⇒ l = n
3. Γl Γn = ±Γn Γl
4. Si Γn ̸= I siempre existe Γl tal que Γl Γn Γl = −Γn
5. tr Γl = 0, Γl ̸= I
P16
6. k=1 bk Γk = 0 ⇐⇒ bk = 0∀k
Como ejemplo, probaremos las dos últimas propiedades, comenzamos por la 5.
Por la propiedad 4, si Γn ̸= I, siempre existe Γl tal que Γl Γn Γl = −Γn . Tomando
traza, se tiene
tr Γn = − tr Γl Γn Γl , (5.138)
o, usando la propiedad cı́clica de la traza
tr Γn = − tr Γl Γl Γn . (5.139)
Pero por la propiedad 2, Γl Γl = 1, se tiene que
tr Γn = − tr Γn =⇒ tr Γn = 0 (5.140)
La propiedad 6 establece que
16
X
bk Γk = 0 ⇐⇒ bk = 0∀k. (5.141)
k=1
188 5.5 Los valores posibles de N

Separemos uno cualquiera de los términos de la suma del resto:


X
bm Γm + bk Γk = 0 (5.142)
k̸=m

Multipliquemos a derecha por Γm y usemos el hecho de que el cuadrado de las Γ’s


es la identidad, X
bm I + bk Γk Γm = 0. (5.143)
k̸=m
Ahora por la propiedad 1, siempre existe un l tal que
Γk Γm = akm Γl , con akm = ±1, ±i. (5.144)
Se tiene X
bm I + bk akm Γl = 0 (5.145)
k̸=m

para algún l (nótese que por la propiedad 2, Γl ̸= I para m ̸= k.) Ahora tomamos
la traza de esta igualdad
 
X
tr bm I + bk akm Γl  = 0 (5.146)
k̸=m

y usamos la propiedad 5, tr Γl = 0, con Γl ̸= I con lo que mostramos que


bm N = 0 =⇒ bm = 0 ∀m. (5.147)
Este último resultado es muy importante. Por construcción, las 16 matrices Γl
son independientes y por ello propiedad 6 muestra que de son linealmente inde-
pendientes. El número mı́nimo de filas y de columnas que deben tener 16 matrices
cuadradas para ser linealmente independientes es 4. Luego, se puede tomar a las
matrices Γl y, a fortiori, a las matrices γ µ como matrices de 4 × 4. Esta es una repre-
sentación irreducible. Por supuesto, se podrı́a tomar un orden mayor. En tal caso,
puede demostrarse que esta última es una representación reducible a una matriz
diagonal por bloques de la forma
 µ
γ 0

 · 
Γµ =  
(5.148)
·
 
 
0 γµ
donde las γ µ son las matrices en la representación mı́nima de 4 × 4.
Debe señalarse que el hecho de que las dimensiones del espaciotiempo son 4
determina que las matrices de Dirac sean 4 pero esto no está ligado unı́vocamente
con que sean elegidas como matrices de 4×4. En un espacio-tiempo de 3 dimensiones,
por ejemplo, la dimensión mı́nima possible para las 3 matrices γ µ existentes es 2 pero
también es posible representarlas como 3 matrices de 4 × 4 con 2 bloques de 2 × 2
en la diagonal.
Mecánica cuántica Relativista 189

5.6. Teorema fundamental de Pauli


Dados dos conjuntos de matrices de Dirac, {γ µ } y {γ̃ µ }, existe siempre una
matriz no-singular S que los conecta por una relación de similitud:

γ̃ µ = S −1 γ µ S (5.149)

La transformación es única a menos de una constante multiplicativa. No daremos


la prueba, que es simple pero trabajosa. Está basada en escribir a S en términos de
las 16 Γi y Γ̃i a su vez construidas a partir de las γ µ y γ̃ µ , en la forma

16
X
S= Γ̃i F Γi (5.150)
i=1

y determinar la matriz F que lleva a que valga (5.149).


Este teorema implica que no existe un único conjunto de 4 matrices de Dirac
que satisfagan las condiciones necesarias que hemos ido determinando sino que, una
vez encontrado explı́citamente un conjunto podremos obtener vı́a una transforma-
ción de similitud S adecuada, conjuntos equivalentes que podrán ser más o menos
convenientes según el problema a tratar.
Para que la condición de unitariedad13 (5.127) de las matrices gama,

γ 0 γ µ† γ 0 = γ µ , (5.151)

la satisfagan también las matrices transformadas,

γ̃ 0 γ̃ µ† γ̃ 0 = γ̃ µ , (5.152)

escribimos
S −1 γ 0 S(S −1 γ µ S)† S −1 γ 0 S = S −1 γ µ S (5.153)

o,
γ 0 SS † γ µ† (S † )−1 S −1 γ 0 = γ µ (5.154)

vemos que necesitamos que S sea unitaria.14


13
Si las matrices gama satisfacen (5.151) entonces son unitarias. Se demuestra utilizando sólo su
anticonmutador, {γ µ , γ ν } = 2g µν
14
La condición de unitariedad de las matrices gama (5.151) no es estrictamente necesaria en la
teorı́a, y no se desprende de su anticonmutador, aunque las representaciones más usuales de las
matrices gama la satisfacen.
190 5.7 Formas explı́citas de las matrices de Dirac

5.7. Formas explı́citas de las matrices de Dirac


Muchas veces es útil que γ 0 , ligada a la coordenada temporal y que aparece en
el término de masa del Hamiltoniano (5.45) (recordemos que β = γ 0 )
∂ψ  
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ (5.155)
∂t
2
sea diagonal. Como además se debe tener (γ 0 ) = I y tr γ 0 = 0, es natural proponer
la forma más simple:

1 0 0 0
 
!
0 1 0 0 I2 0
γ0 =  = (5.156)
 
0 0 −1 0  0 −I2
0 0 0 −1

En cuanto a las γ i , es facil ver que una elección consistente con (5.156) y con todos
los requerimientos de las matrices de Dirac es
!
i 0 σi
γ = (5.157)
−σ i 0

donde σ i son las matrices de 2 × 2 de Pauli


! ! !
1 0 1 2 0 −i 3 1 0
σ = , σ = , σ = . (5.158)
1 0 i 0 0 −1

A la representación de las γ µ dada por (5,156) − (5,157) se la conoce como repre-


sentación de Dirac de las matrices γ µ pues es la que Dirac utilizó originalmente15 .
Otra representación útil es la llamada quiral. En esta representación se tiene:
!
0 I2
0
γ = (5.159)
I2 0

mientras que las γ i coinciden con (5,157),


!
i 0 σi
γ = (5.160)
−σ i 0
15
Recordemos que según G. Gamow, Dirac entrevió la solución una noche del invierno de 1928,
mientras meditaba sentado frente al fuego en el St. John College de Cambridge. Cuenta Dirac que
en esa noche jugaba con matrices de 2 × 2 con propiedades muy notables que habı́a inventado y que
no son otra cosa que las que llamamos matrices de Pauli. En ese relato comenta que él ignoraba que
Pauli habı́a encontrado esas matrices y que suponı́a que Pauli igualmente ignoraba que él también
las habı́a inventado.
Mecánica cuántica Relativista 191

Puede comprobarse que la matriz S que pasa de una representación a la otra es


!
1 I2 −I2 µ µ
S=√ , γDirac = S −1 γquiral S (5.161)
2 I2 I2

Daremos finalmente una representación que permite escribir a la ecuación de


Dirac como una ecuación real, llamada representación de Majorana en referencia al
fı́sico italiano Ettore Majorana16 que las utilizó en su trabajo relacionado con los
neutrinos,
! ! ! !
0 0 σ2 1 iσ 3 0 2 0 −σ 2 3 −iσ 1 0
γ = , γ = , γ = , γ = (5.162)
σ2 0 0 iσ 3 σ2 0 0 iσ 1

En esta representación las soluciones de la ecuación de Dirac son combinaciones


lineales de soluciones reales. La matriz S correspondiente resulta
!
1 I2 σ 2 µ µ
S = S† = √ 2 , γMajorana = SγDirac S −1 (5.163)
2 σ −I2

Esta representación es la mas adecuada para estudiar ecuaciones relativistas para


los neutrinos, que son fermiones de caga eléctrica nula y que no solo tienen un rol
muy importante en la fı́sica de partı́cula sino muy recientemente en problemas de la
materia condensada como los de los “aisladores y superconductores topológicos”.

5.8. Invarianza relativista


Frente a una transformación de Lorentz

x′µ = Λµν xν (5.164)

las derivadas cambian según


∂µ = Λν µ ∂ν′ (5.165)
Si tomamos la ecuación de Dirac (5.114),

iℏγ µ ∂µ ψ − mcψ = 0 (5.166)

y utilizamos (5.165), podemos escribir

iℏγ µ Λν µ ∂ν′ ψ − mcψ = 0. (5.167)


16
Ettore Majorana (1906-1938(?)), “Teoria simmetrica dellelettrone e del positrone”, Il Nuovo
Cimento, 14 (1937) 171.
192 5.8 Invarianza relativista

Buscamos que la ecuación de Dirac sea covariante, es decir, que tome la misma forma
en las variables primadas x′µ que en las originales xµ . Para ello definiremos un nuevo
conjunto de matrices
γ̃ ν = Λν µ γ µ (5.168)
Es fácil ver que, dadas las condiciones que cumple Λµν , las γ̃ µ satisfacen todas las
condiciones de las matrices de Dirac, de manera que podemos tomarlas como un
nuevo conjunto de matrices de Dirac y escribir
iℏγ̃ µ ∂µ′ ψ − mcψ = 0. (5.169)
Ahora bien, por el teorema fundamental de Pauli sabemos que si {γ µ } y {γ̃ µ }
son dos conjuntos aceptables de matrices de Dirac, debe existir S tal que
γ̃ µ = S −1 γ µ S (5.170)
Notemos que de las ecs. (5.170) y (5.170) resulta
S −1 γ µ S = Λµν γ ν , (5.171)
lo que constituye una ecuación para S dada una transformación de Lorentz Λ. Po-
demos reescribir (5.169) en la forma
iℏS −1 γ µ S∂µ′ ψ − mcψ = 0 (5.172)
o
iℏγ µ ∂µ′ Sψ − mcSψ = 0 (5.173)
Basta que identifiquemos Sψ con la función de onda transformada ψ ′ para que
podamos escribir
iℏγ µ ∂µ′ ψ ′ − mcψ ′ = 0 (5.174)
O sea que hemos mostrado que la ecuación de Dirac es covariante frente a las trans-
formaciones de Lorentz (5.346) si la función de onda cambia según
ψ ′ (x′ ) = Sψ(x) (5.175)
Es importante notar que las γ µ que aparecen en la ecuación de Dirac son las
mismas en ambos sistemas inerciales. De hecho, por más que el ı́ndice µ puede
inducir a pensar que γ µ es un tetravector cuyas componentes son matrices de 4 × 4,
hacerlo serı́a incorrecto. En efecto, si lo fuera, deberı́a transformarse como tal al
pasar de un sistema de referencia al otro, pero este no es el caso. Veremos luego,
al considerar cómo transforma la corriente jµ frente a transformaciones de Lorentz
cuál es la ley de transformación general de tetravectores.
En resumen, en la ec. (5.174) solo aparecen transformadas de Lorentz las coor-
denadas del espacio-tiempo y la función de ondas. Las matrices de Dirac son un
conjunto de matrices que permanecen inalteradas.
Mecánica cuántica Relativista 193

5.9. Transformación de Lorentz de la corriente


Tenemos ahora que comprobar que esta interpretación, según la cual la función
de onda en el sistema primado esta dada por (5.175), es consistente. En particular,
tenemos que comprobar que |ψ ′ |2 tiene una interpretación de densidad de proba-
bilidad, en el sistema primado, análoga a la de ρ = |ψ|2 en el sistema sin primar.
Para ello, debemos comprobar que la corriente j µ realmente se transforma como un
tetravector y por lo tanto la ecuación de continuidad resulta invariante de Lorentz.
Antes debemos derivar nuevas propiedades de S.
Recordemos que escribimos [ec. (5.172)]
γ̃ µ = S −1 γ µ S (5.176)
Como las matrices de Dirac se relacionan con sus adjuntas según
γ µ = γ 0 γ µ† γ 0 (5.177)
se tiene
 †  †
γ̃ λ = Λλµ γ µ = Λλµ γ 0 γ µ† γ 0 = γ 0 Λλµ γ µ γ 0 = γ 0 S −1 γ λ S γ0 (5.178)
 †
= γ 0 S † γ λ† S −1 γ0 (5.179)

Reemplazando de nuevo γ λ† a partir de la relación (5.177),


 †
Λλµ γ µ = γ 0 S † γ 0 γ λ γ 0 S −1 γ0 (5.180)

Pero el lado izquierdo es de hecho S −1 γ λ S mientras que el derecho puede ordenarse


de manera que la ecuación (5.180) se escriba:
   −1
S −1 γ λ S = γ 0 S † γ 0 γ λ γ 0 S † γ 0 (5.181)

(porque γ 0 = (γ 0 )−1 ). Multiplicando ambos miembros a izquierda por S obtenemos


   −1
γ λS = S γ 0S †γ 0 γ λ γ 0S †γ 0 (5.182)
 
y a derecha por γ 0 S † γ 0 se tiene entonces
   
γ λ Sγ 0 S † γ 0 = Sγ 0 S † γ 0 γ λ (5.183)

Pero para que el producto entre paréntesis conmute con todas las matrices γ λ , debe
ser un múltiplo de la identidad17
Sγ 0 S † γ 0 = bI (5.184)
17
Podemos demostrar esta afirmación de la siguiente manera:
194 5.9 Transformación de Lorentz de la corriente

o
Sγ 0 S † = bγ 0 (5.185)
Tomando el adjunto en esta ecuación,
Sγ 0 S † = b∗ γ 0 (5.186)
de donde resulta que b = b∗ . Calculamos ahora el determinante en la igualdad
(5.185),
(det S)2 = b4 (5.187)
de manera que si elegimos que det S = 118 , se tendra b4 = 1 por lo que b = ±1.
Ahora, escribamos la serie de igualdades
3
S † S = γ 0 γ 0 S † γ 0 γ 0 S = bγ 0 S −1 γ 0 S = bγ 0 Λ0ν γ ν = bΛ00 I − bΛ0k γ 0 γ k .
X
(5.188)
k=1

Si tomamos traza en ambos miembros de esta igualdad y usamos que tr γ 0 γ k = 0


llegamos a que
tr S † S = 4bΛ00 (5.189)
Como el lado izquierdo es definido positivo, tenemos finalmente
4bΛ00 > 0. (5.190)
Luego b = +1 corresponde a Λ00 > 0, una transformación de Lorentz ortócrona19
mientras que b = −1 corresponde a Λ00 < 0, una inversión temporal.
En cuanto a las propiedades de transformación de ψ ′ , tenemos

ψ ′ = Sψ =⇒ (ψ ′ ) = ψ † S † (5.191)
Multiplicando a derecha por γ 0 y recordando la definición ψ̄ = ψ † γ 0 se tiene
ψ̄ ′ = ψ † S † γ 0 = ψ̄γ 0 S † γ 0 = bψ̄S −1 (5.192)
Dado el tetravector corriente
J µ = cψ̄γ µ ψ (5.193)
su transformado de Lorentz se escribirá
J ′µ = cψ̄ ′ γ µ ψ ′ = cbψ̄S −1 γ µ Sψ = cbψ̄Λµν γ ν ψ = bΛµν J ν (5.194)
Luego, para transformaciones ortócronas, b = +1 y J µ transforma como un tetra-
vector ante transformaciones de Lorentz, lo que da la transformación adecuada para
ρ = |ψ|2 que puede entonces ser interpretada como densidad de probabilidad.
18
Esto lo podemos hacer porque S está definida a menos de una constante multiplicativa, aunque
no sea unitaria.
19
ortócrona: que preserva el sentido del tiempo.
Mecánica cuántica Relativista 195

5.10. El grupo de Lorentz


Cada matriz Λ es real y de 4 × 4, de manera que se corresponde con un punto de
16
R . Sin embargo no todas sus componentes son independientes; éstas yacen sobre
una hipersuperficie determinada por las 10 ecuaciones algebraicas que se obtienen de
(5.82), de manera que quedan sólo seis parámetros reales libres. Esta hipersuperficie
es la variedad del grupo20 . En este caso, además, esta variedad resulta diferenciable
por lo que el grupo es un grupo de Lie. Un grupo se dice conexo si para cualquiera
de sus elementos, existe una curva sobre la variedad del grupo que lo conecta con
continuidad con la identidad ΛI . Mostremos que el grupo de Lorentz es no conexo
y está formado por cuatro hojas no conectadas.
De (5.82), ΛT gΛ = g se obtiene que

det Λ = ±1. (5.195)

Si det Λ = +1 (−1) la transformación Λ se dice propia (impropia). Además, de


(5.82) surge que
gρν Λµ0 Λν 0 = g00 (5.196)

y por lo tanto
(Λ00 )2 − Λi0 Λi0 = 1, (5.197)

y en consecuencia, (Λ00 )2 ⩾ 1, y las transformaciones son llamadas ortócronas si


Λ00 ⩾ 1, o bien no ortócronas para Λ00 ⩽ 1. Tampoco aquı́ es posible pasar de unas
a otras mediante la variación de un parámetro continuo. Dado que la identidad está
sólo en la hoja con det Λ = +1 y Λ00 ⩾ 0 sólo ésta es un subgrupo, llamado subgrupo
propio ortócrono, y denotado L↑+ (o SO+ (1,3) para los matemáticos). Este subgrupo,
sin embargo, no es simplemente conexo, ya que por ejemplo, contiene las rotaciones
que forman al grupo SO(3) que no lo es. Su grupo de cubrimiento universal21 , el gru-
po de espı́n indefinido Spin(1,3), es isomorfo tanto al grupo lineal especial SL(2, C)
(matrices complejas de 2 × 2 de determinante 1) como al grupo simpléctico Sp(2, C).
Estos isomorfismos permiten que el grupo de Lorentz actúe sobre un gran número
de estructuras matemáticas distintas, en particular los espinores.
20
En general, todo grupo continuo de n parámetros (reales) tiene sus elementos identificados de
manera biunı́voca con los puntos de una variedad n-dimensional, inmersa en Rm (con m ⩾ n) y
determinada por un conjunto de m − n ecuaciones algebraicas.
21
Una misma álgebra de Lie puede generar grupos con diferentes variedades, y que a su vez
posean topologı́as distintas. Cuando un álgebra de Lie genera varios grupos, aquel cuya variedad es
simplemente conexa se denomina grupo de cubrimiento universal: SU(2) es el grupo de cubrimiento
universal de SO(3). El grupo de cubrimiento universal es en general más grande, y es homeomorfo
al grupo (varios elementos a uno)
196 5.11 Generadores y álgebra del grupo L↑+

5.11. Generadores y álgebra del grupo L↑+


Centrémonos en el grupo de Lorentz propio ortócrono. Otros elementos del grupo
de Lorentz se pueden obtener multiplicando a los de aquel por ΛT , ΛP y ΛT ΛP .
Mostremos que todo elemento del grupo Λ continuamente conectado a la identidad
puede escribirse como

Λ = eiωi Ki +iθi Li , (i = 1, 2, 3) (5.198)

donde ωi y θi son parámetros reales y Ki y Li son matrices de 4 × 4. En general


todos los grupos de Lie pueden parametrizarse de esa forma, y los operadores Ki y
Li se denominan generadores del grupo. Para esto consideremos una transformación
de Lorentz infinitesimal, es decir, cercanas a la identidad.

Λ = ΛI + εΩ + O(ϵ2 ), (5.199)

donde Ω es una matriz con elementos reales y ε es pequeño. Si insertamos esta


expresión en la condición de definición (5.82), obtenemos

g + εΩT g + εgΩ + O(ε2 ) = g, (5.200)

o bien
(gΩ)T = −gΩ (5.201)
Es decir, gΩ resulta una matriz antisimétrica. Sólo debemos entonces elegir una base
de matrices antisimétricas de 4 × 4 para descomponer gΩ, y multiplicar por g −1 la
base para obtener la descomposición de Ω. Una elección conveniente y simple es el
conjunto

0 0 0 0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 i 0 0 −i 0
L1 =  , L2 =  , L3 =  ,
     
0 0 0 −i 0 0 0 0 0 i 0 0
0 0 i 0 0 −i 0 0 0 0 0 0
(5.202)
0 i 0 0 0 0 i 0 0 0 0 i
     
i 0 0 0 0 0 0 0 0 0 0 0
K1 =  , K2 =  , K3 =  .
     
0 0 0 0 i 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 i 0 0 0

que al multiplicarlas por g resultan antisimétricas. Luego, la matriz Ω puede escri-


birse como X
Ω=i (ωi Ki + θi Li ), (5.203)
i=1,2,3
Mecánica cuántica Relativista 197

con ωi y θi parámetros reales y ε pequeño. Las transformaciones finitas pueden


obtenerse tomando el lı́mite n → ∞ de un producto de n transformaciones infinite-
simales, con ϵ ∼ 1/n:
!n

Λ = lı́m I+ = eiωi Ki +iθi Li . (5.204)
n→∞ n
Por ejemplo, la rotación (5.110) puede expresarse como

ΛR (θ) = eiθL3 (5.205)

mientras que el boost resulta


ΛB (ω) = eiωK1 . (5.206)
Las seis matrices (5.202) satisfacen las relaciones de conmutación:

[Li , Lj ] = iϵijk Lk
[Li , Kj ] = iϵijk Kk (5.207)
[Ki , Kj ] = −iϵijk Lk
lo que se denomina el álgebra de Lie del grupo, Li y Ki son los generadores del
grupo, y las constantes ϵijk las constantes de estructura. Conocer estas constantes
(que obtuvimos analizando transformaciones próximas a la identidad) implica que
conocemos la ley de composición de todo el grupo, ya que dados dos elementos del
grupo g1 = eA y g2 = eB , su producto se obtiene aplicando la fórmula de Hausdorff,
1
eA eB = eA+B+ 2 [A,B]+... . (5.208)

El álgebra y las constantes de estructura garantizan que el lado derecho se puede


escribir como eC con C una combinación lineal de elementos del álgebra.
Dado que la transformación queda caracterizada por 6 parámetros, y que tenemos
6 generadores, resulta conveniente escribirla en la forma siguiente:
i αβ
Λ = e 2 ωαβ M (5.209)

donde
ω0i = ωi , ωij = ϵijk θk , ωαβ = −ωβα (5.210)
contiene a los 6 parámetros, y

M0i = Ki , Mij = ϵijk Lk , M αβ = −M βα (5.211)

a los generadores. Nótese que cada una de las M αβ es una matriz de 4 × 4. En


términos de éstas el álgebra (5.207) se escribe

[M αβ , M µν ] = −ig βµ M αν + ig αµ M βν + ig βν M αµ − ig αν M βµ . (5.212)
198 5.11 Generadores y álgebra del grupo L↑+

Por definición, los generadores en cualquier otra representación deben satisfacer


estas mismas relaciones. Por ejemplo, otra representación del álgebra del grupo de
Lorentz viene dada por los operadores diferenciales

Lµν = i(xµ ∂ν − xν ∂µ ), (5.213)

que es una representación de dimensión infinita. Cada generador actúa sobre fun-
ciones en vez de sobre un espacio vectorial de dimensión finita. Estos son los gene-
radores clásicos del momento angular generalizados para incluir el tiempo. Se puede
comprabar que Lµν satisface las relaciones de conmutación del álgebra, ec. (5.212).
Para encontrar las representaciones matriciales irreducibles de L↑+ (en realidad
de su grupo de cubrimiento universal) es conveniente considerar las combinaciones
lineales complejas de los generadores
1
Jk± = (Lk ± iKk ), (5.214)
2
cuyos conmutadores se reducen a

[Ji± , Jj± ] = iϵijk Jk± , [Ji+ , Jj− ] = 0. (5.215)

Esto corresponde a dos subálgebras de SU(2) que conmutan entre sı́, caracterizadas
cada una de ellas por un entero o semientero j ± , y enntonces las representaciones
matriciales irreducibles de L↑+ están caracterizadas por un par de enteros o semien-
teros (j+ , j− ), siendo su dimensión (2j+ + 1)(2j− + 1). Las transformaciones están
entonces representadas por matrices D(j+ ,j− ) . Una cantidad que transforma según
1
D(0,0) se llama escalar de Lorentz. Una que transforma según D( 2 ,0) corresponde a un
espinor de dos componentes (que se conoce como espinor de Weyl) de polarización
1
izquierda χL y uno que transforma según D(0, 2 ) corresponde a un espinor de Weyl
de polarización derecha χR ). Estos espinores de dos componentes son los que usamos
en la teorı́a de Pauli de dos componentes para representar a la función de onda en
el caso no relativista cuando se incluyó el spin. Los objetos de 4 componentes que
aparecen en la ecuación de Dirac son, por construcción, objetos que corresponden a
la suma directa ( 21 , 0) ⊕ (0, 12 , ). El espinor resultante es un espinor de 4 componentes
o espinor de Dirac, !
ψL
χ= . (5.216)
ψR
La representación ( 12 , 21 ) es una representación vectorial. Un objeto que transfor-
ma según ella es entonces lo que conocemos como tetravector.
Es importante notar que los boosts del grupo de Lorentz en una dimension
espacial y la temporal están parametrizados por tanh ω = v/c y por lo tanto la
transformación es homeomorfa a un espacio topológico en un intervalo abierto de R
Mecánica cuántica Relativista 199

que es no-compacto en la topologı́a generada por la métrica (esto contrasta con las
rotaciones en el plano como ejemplo de un grupo compacto: están parametrizadas
por un ángulo 0 ⩽ θ ⩽ 2π en el que el 0 es identificado con 2π).

5.12. El carácter de ψ
Hemos escrito a la ecuación de Dirac para una partı́cula libre de masa m de
manera explı́citamente covariente en la forma

(iℏγ µ ∂µ − mc)ψ = 0, (5.217)

donde las matrices γ µ son cuatro matrices de 4 × 4 que satisfacen lo que los ma-
temáticos llaman un álgebra de Clifford22

γ µ γ ν + γ ν γ µ = 2g µν IN . (5.218)

Vimos que la representación más pequeña posible para que la ecuación de Dirac para
una partı́cula libre de masa m cumpla la relación relativista entre energı́a e impulso
es la que corresponde a matrices γ µ de 4 × 4. Si la adoptamos, ψ será necesariamente
un objeto de cuatro componentes, un espinor de 4 componentes23
 1
ψ
ψ 2 
ψ= = [ψ α (x)] . (5.219)
 
 3
ψ 
ψ4
¿Qué tiene que ver el álgebra de Clifford con el grupo de Lorentz? Veamos.
Dada una transformación de Lorentz para las coordenadas del espacio tiempo que
anotamos como
x′µ = Λµν xν , (5.220)
ya hemos mostramos que la ley de transformación de de la función de onda ψ (el
espinor ψ ) debı́a estar dada por

ψ ′α (x′ ) = S αβ ψ β (x), (5.221)

o, de manera compacta
ψ ′ (x′ ) = S(Λ)ψ(x). (5.222)
22
El matemático y filósofo inglés William K. Clifford fue quien introdujo este álgebra cuadrática
multilineal en la década de 1870.
23
Formalmente, un espinor es un elemento de un espacio de representación para el “grupo espi-
norial”. En en el contexto de la mecánica cuántica relativista, los espinores son elementos de un
espacio vectorial complejo asociado al espacio de Minkowski. Los espinores fueron introducidos en
la matemática por Elie Cartan en 1913 y originalmente utilizados en la fı́sica por Pauli, en 1920.
200 5.12 El carácter de ψ

Aquı́ S αβ representa una matriz de 4 × 4 que queda determinada a través de la


relación que resulta de combinar las ecs. (5.170) y (5.170),
     
Λλµ (γ µ )αβ = S −1 γλ S , (5.223)
αρ ρσ σβ

o, nuevamente en forma compacta


Λλµ γ µ = S −1 γ λ S (5.224)
Dada una transformación de Lorentz Λ, la relación (5.224) define a la matriz S, de
allı́ que la hemos escrito como S(Λ).
Pretendemos ahora responder a la pregunta: ¿Cuál es el carácter de ψ? O, en
otras palabras, ¿cómo se define de manera precisa al objeto que llamamos espinor? La
ley de transformación frente al grupo de Lorentz, ψ ′ (x′ ) = Sψ(x), nos muestra que
no es un escalar puesto que de serlo no se transformarı́a frente a transformaciones de
Lorentz. Tampoco es un tetravector como xµ o la corriente de probabilidad J µ que
se transforman según la relación V ′µ = Λµν V ν .24 En lo que sigue determinaremos S
explı́citamente para poder responder a la pregunta del párrafo anterior.
Consideremos una transformación de Lorentz infinitesimal tal que Λ00 > 0 de
manera que se preserve el sentido del tiempo
x′µ = xµ + ϵω µν xν = (δνµ + ϵω µν ) xν , (5.225)
donde ϵ es un parámetro infinitesimal asociado a la transformación. En cuanto a
ω µν , quedará determinada según el tipo de transformación que represente Λµν (in-
versiones, rotaciones, boosts).
Para comenzar, las condiciones que debe satisfacer Λµν , (5,81),
gµν Λµρ Λν σ = gρσ , (5.226)
imponen la siguiente relación a orden ϵ, cuando se escribe Λµν = δνµ + ϵω µν

Λµν = δνµ + ϵω µν ⇒ ω µν = −ω νµ (5.227)


Para la matriz S que transforma a ψ cuando xµ se transforma como en (5.225)
escribimos también a orden ϵ,

S = I + ϵT (5.228)
Se trata ahora de determinar T para luego escribir, como hacemos siempre en el
caso finito, S = exp(ϵT ). Utilizando la relación (5.224),
Λλµ γ µ = S −1 γ λ S, (5.229)
24
Como ya indicamos, el ı́ndice α, con α = 1, . . . , 4, de (ψ α ) nada tiene que ver con los ı́ndices
de Lorentz de espacio-tiempo).
Mecánica cuántica Relativista 201

se tiene
(δνµ + ϵω µν ) γ ν = (I − ϵT )γ µ (I + ϵT ), (5.230)
y al orden ϵ en que trabajamos resulta entonces

ω µν γ ν = γ µ T − T γ µ . (5.231)

Esta relación determina T a menos de un múltiplo de la identidad (pues I es la


única matriz que conmuta con todas las γ µ ). Podemos entonces imponer que tr
T = 0 pues, si su traza diera otro valor, bastarı́a restar un múltiplo adecuado de la
identidad para anularla.
Puede verse entonces que, trabajando a orden ϵ, esto es equivalente a que det S =
1, (recordar el desarrollo de un determinante en terminos de la identidad, la traza,
etc.25 )

det S = det(1 + ϵT ) = 1 + ϵ tr T + O(ϵ2 ) = 1 + O(ϵ2 ) (5.232)


Usando reiteradamente el álgebra de las γ µ puede verse que la solución de (5.231)
es
1 i
T = ωµν (γ µ γ ν − γ ν γ µ ) = − ωµν Σµν . (5.233)
8 2
De este modo, la matriz S se escribe
i µν
S(Λ) = e− 2 ωµν Σ , (5.234)

con
i µ ν
Σµν ≡
[γ , γ ] . (5.235)
4
De manera más general, Σµν satisface el álgebra del grupo de Lorentz cuando se
construye a partir de cualquier conjunto de matrices γ que satisfaga el álgebra de
Clifford. Es decir, se puede derivar de {γµ , γν } = 2gµν que

[Σµν , Σρσ ] = i(g νρ Σµσ − g µρ Σνσ − g νσ Σµρ + g µσ Σνρ ). (5.236)

Es importante apreciar que las matrices Σµν son diferentes de las matrices M µν
correspondientes a los generadores en la representación vectorial. En especial, Σµν
son complejos. Ası́ que hemos encontrado dos representaciones de dimensión 4 no
equivalentes. En cada caso, el elemento del grupo está determinado por seis ángulos
reales ωµν (tres rotaciones y tres boosts). La representación vectorial, o ( 21 , 12 ) es
irreducible y los elementos del grupo que se obtienen por exponenciación son (5.209)
i αβ
Λ = e 2 ωαβ M , (5.237)
det(1 + ϵA) = 1 + ϵ tr(A) + ϵ2 21 tr2 A − tr A2 + . . .
25
 
202 5.12 El carácter de ψ

mientras que la representación de Dirac, o ( 12 , 0) ⊕ (0, 12 ) es reducible y los elementos


del grupo se escriben como en (5.234)
Ahora bien, para interpretar el significado de estas cantidades Σµν , represen-
tación espinorial de los generadores del grupo, notemos que se trata de un objeto
antisimétrico. En especial, sus componentes Σ0i pueden escribirse como
i i i i
Σ0i = [γ 0 , γ i ] = γ 0 γ i = βαi β = − αi (5.238)
4 2 2 2
(recuérdese que las matrices αi anticonmutan con β) lo cual nos indica que las
matrices αi son los generadores de boosts en la representación espinorial. De modo
que para un boost genérico tenemos
1
S(ΛB ) = e− 2 ω·α (5.239)

donde ωi = ω0i . Observemos que en la representación quiral,


! ! !
i 0 I
0 i 0 σi −σ i 0
α =γ γ = = (5.240)
I 0 −σ i 0 0 σi

y entonces
1 !
e 2 ω·σ 0
S(ΛB ) = − 12 ω·σ
. (5.241)
0 e
Por otro lado, definimos
i i
Σi ≡ ϵijk Σjk = ϵijk [γ j , γ k ] = ϵijk γ j γ k (5.242)
4 2
i ijk i
= ϵ [βαj , βαk ] = − ϵijk [αj , αk ] (5.243)
4 4
i ijk j k
=− ϵ α α , (5.244)
2
o26 ,
i
Σ=− α×α (5.245)
2
Para una rotación en el espacio tenemos [ec. (5.210)] ωij = ϵijk θk y
i
S(ΛR ) = e− 2 θ·Σ (5.246)

Quedan ası́ identificados los Σµν como los generadores de las transformaciones de
Lorentz mientras que los ωµν son los parámetros de las diferentes transformaciones
26
Nótese que este producto vectorial, al ser entre matrices, no se anula
Mecánica cuántica Relativista 203

En la representación quiral,
!
σ 0
Σ= . (5.247)
0 σ

Se trata de una matriz diagonal por bloques de 2 × 2 y que cada uno de esos bloques
coincide con el generador de rotaciones de los espinores de Pauli de 2 componentes
que estudiamos en el caso de la mecánica cuántica no relativista. La matriz S(Λ) se
escribe en la forma sugestiva
i !
e− 2 θ·σ 0
S(ΛR ) = − 2i θ·σ
. (5.248)
0 e

Estas dos expresiones valen también en la representación de Dirac, dado que, de


(5.242) Σ sólo depende de las γ i , que son iguales en ambas representaciones.
Téngase en cuenta que para las rotaciones (5.248), S(Λ) es unitaria, mientras
que para los boosts (5.241), no lo es. De hecho, al ser un grupo no compacto, no
existen representaciones unitarias de dimensión finita del grupo de Lorentz. Hemos
demostrado esto explı́citamente en la representación quiral del álgebra de Clifford.
Podemos tener una idea de por qué esto es cierto para una representación arbitraria.
De la expresión (5.234)
i µν
S(Λ) = e− 2 ωµν Σ , (5.249)
la transformación es unitaria son Σµν son hermı́ticas, pero, de (5.235)
i h µ † ν †i
(Σµν )† = (γ ) , (γ ) (5.250)
4
que es igual a Σµν si las γ µ son todas hermı́ticas o todas antihermı́ticas. Pero esto no
puede cumplirse, porque γ02 = 1 y entonces los autovalores de γ 0 son ±1, reales, por
lo tanto no puede ser antihermı́tica, mientras que γi2 = −1 y los autovalores de γ i ,
son ±i imaginarios puros, y por lo tanto γ i no puede ser hermı́tica. Podrı́amos elegir
γ 0 hermı́tica, pero γ i sólo puede elegirse antihermı́tica. En general, no hay forma
de elegir las γ µ de manera que Σµν resulten todas hermı́ticas. Esto explica por qué
necesitamos trabajar con ψ̄ = ψ † γ 0 : en la ec. (5.131) introdujimos el Lagrangiano
de Dirac, que posee un término de la forma ψ̄ψ, y que resulta un escalar, dado que
frente a una transformación de Lorentz ortócrona (b = +1, Λ00 > 0),

ψ → ψ ′ = Sψ (5.251)
′ −1
ψ̄ → ψ̄ = ψ̄S (5.252)

y por lo tanto
ψ̄ψ → ψ̄ ′ ψ ′ = ψ̄ψ (5.253)
204 5.12 El carácter de ψ

Por otro lado, ψ † ψ → ψ † S † Sψ. Como vimos, la representación no es unitaria y para


algunas transformaciones de Lorentz S † S ̸= 1, y entonces ψ † ψ no nos sirve para
construir una acción invariante
¿Cómo podemos estar seguros de que la representación espinorial es nueva, y no
es equivalente a la representación usual de los Λµν ? Para convencernos de que son
realmente distintas veamos ejemplos de algunas transformaciones especı́ficas.
Consideremos una rotación en un ángulo θ alrededor del eje z:

1 0 0 0
 
0 cos θ sin θ 0
ΛR =  (5.254)
 
0 − sin θ cos θ 0

0 0 0 1

Mientras que, por ejemplo, en la representación quiral, tenemos


 −iθ/2
e 0 0 0

− 2i θσ 3
!
e 0  0 e+iθ/2 0 0 
S(ΛR ) = = , (5.255)
 
− 2i θσ 3  0 0 e−iθ/2
0

0 e 
0 0 0 eiθ/2

que claramente es una matriz diferente a Λ. En especial, si tomamos una rotación de


θ = 2π, ¡obtenemos Λ = I, mientras que S(Λ) = −I! Y entonces, bajo una rotación
en 2π,
ψ(x) → −ψ(x) (5.256)

que definitivamente no es lo que le ocurre a un vector. Entonces S(Λ) es una repre-


sentación diferente de la representación vectorial Λµν
En el caso de un boost en la dirección del eje x con parámetro tanh ω = v/c ,
tenemos
cosh ω sinh ω 0 0
 
 sinh ω cosh ω 0 0
ΛB =  (5.257)
 
 0 0 1 0

0 0 0 1

mientras que

1 eω/2 0 0
 
1 1 !
e 2 ωσ 0 eω/2 1 0 0 
S(ΛB ) = = (5.258)
 
− 21 ωσ 1  0 0 1 e−ω/2 
0 e 
−ω/2
0 0 e 1
Mecánica cuántica Relativista 205

5.13. Espinores quirales


En la sección anterior, al necesitar una forma explı́cita de las matrices γ µ utili-
zamos la representación quiral o de Weyl,
! !
0 0 I2 i0 σi
γ = , γ = (5.259)
I2 0 −σ i 0

En esta representación, las rotaciones sobre los espinores S(ΛR ) y los boosts S(ΛB )
que obtuvimos en (5.248) y (5.241) son diagonales por bloques,
i ! 1 !
e− 2 θ·σ 0 e 2 ω·σ 0
S(ΛR ) = − 2i θ·σ
, S(ΛB ) = − 12 ω·σ
. (5.260)
0 e 0 e

Esto significa que la representación de espinores de Dirac es reducible. Se descom-


pone en dos representaciones irreducibles, y cada una actúa sobre espinores de dos
componentes χ+ y χ− , definidos de manera que
!
χ+
ψ= (5.261)
χ−

Los objetos de dos componentes χ± se llaman espinores de Weyl o espinores quirales.


Se transforman del mismo modo frente a rotaciones,
i
χ± → e− 2 θ·σ χ± , (5.262)

pero de manera opuesta frente a boosts,


1
χ± → e± 2 ω·σ χ± , (5.263)

Es decir que χ+ y χ− transforman bajo rotaciones y boosts como los espinores de dos
componentes que introdujimos en la mecánica cuántica no-relativista del electrón.
En el lenguaje de la teorı́a de grupos, χ+ está en la representación ( 21 , 0) del grupo
de Lorentz, mientras que χ− está en la representación (0, 12 ). El espinor de Dirac se
encuentra ası́ en la representación ( 12 , 0) ⊕ (0, 12 )27 .
Es sólo cuando se incluyen reflexiones espaciales (cambio de paridad) que la
representación deviene irreducible. El requerir que una teorı́a sea invariante bajo
reflexiones espaciales implica la necesidad de usar espinores de 4 componentes. En
efecto, una inversión lleva un espinor de dos componentes que pertenece a la re-
presentación ( 12 , 0) a uno que pertenece a la representación (0, 21 ). Esto puede verse
27
Estrictamente del grupo de cubrimiento SL(2, C)
206 5.14 La solución de partı́cula libre

fácilmente recordando que para el caso de una inversion espacial se tiene que (Λλµ )
son los elementos de una matriz diagonal,
1 0 0 0
 
0 −1 0 0
ΛP =  . (5.264)
 
0 0 −1 0 
0 0 0 −1
Luego, usando la relación (5.224)
Λλµ γ µ = S −1 γ λ S, (5.265)
para λ = i, se tiene
Λiµ γ µ = Λii γ i = −γ i = S −1 γ i S. (5.266)
Y entonces Sγ i + γ i S = 0. Mientras que para el caso de λ = 0 resulta que debe
conmutar. Esto implica que se puede tomar a S proporcional a γ 0 . En la represen-
tación quiral (que es la que permite caracterizas a las dos primeras componentes
frente a las 2 últimas) γ 0 es una matriz con dos bloques en la antidiagonal (cada
uno proporcional a la identidad, ver ec. (5,159), y entonces para una transformación
de paridad en la representación quiral,
!
0 I2
0
S=γ = (5.267)
I2 0
y por eso se cambian las componentes de arriba respecto de las de abajo e inversa-
mente.
Para el resto de las transformaciones del grupo de Lorentz, χ+ y χ− transforman
separadamente.
Entonces, necesitamos 4 componentes y no solamente dos porque los espinores
de dos componentes y su transformado por inversiones espaciales no se transforman
de la misma manera bajo transformaciones de Lorentz.

5.14. La solución de partı́cula libre


Buscaremos ahora las soluciones de la ecuación de Dirac para una partı́cula libre
de masa m,
∂ψ
iℏγ µ µ − mcψ = 0 (5.268)
∂x
Es fácil comprobar que esta ecuación tiene soluciones del tipo onda plana, que
describen una partı́cula cuántica relativista de masa m en ausencia de interacción.
Estas soluciones, como es esperable, tienen la forma
i
 
ψ(r, t) = u exp − pµ xµ (5.269)

Mecánica cuántica Relativista 207

donde u es un espinor con las 4 componentes constantes y pµ un tetravector cons-


tante, asociado al operador pµ .
pµ = iℏ ∂µ . (5.270)
El autovalor pµ debe ajustarse para que (5.269) sea solución de (5.268), o sea que
satisfaga la relación relativista E 2 = p2 c2 + m2 c4 . Insertando la solución (5.269)
propuesta en la ecuación de Dirac se obtiene la ecuación matricial algebraica

(γ µ pµ − mcI4 ) u = 0. (5.271)

De ahora en más obviaremos en notación la matriz identidad de 4 × 4 I4 .


La fórmula (5.271) representa a 4 ecuaciones homogéneas (una para cada com-
ponente de u ) que tendrán solución no-trivial si se cumple

det (γ µ pµ − mc) = 0 (5.272)

Que se cumpla esta condición implica que la inversa “formal”

(γ µ pµ − mc)−1 (5.273)

no puede existir. Para encontrar los puntos singulares reescribamos esta inversa en
la forma

(γ µ pµ − mc)−1 = (γ µ pµ − mc)−1 (γ µ pµ + mc)−1 (γ µ pµ + mc) . (5.274)

El producto de denominadores puede reacomodarse de una manera simple:

(γ µ pµ − mc) (γ ν pν + mc) = γ µ γ ν pµ pν − m2 c2 = pµ pµ − m2 c2 . (5.275)

Luego, la inversa puede escribirse como

(γ ν pν + mc)
(γ µ pµ − mc)−1 = . (5.276)
pµ pµ − m2 c2

Establecimos que esta inversa no debe existir o, lo que es equivalente, el determi-


nante (5.272) debe anularse y la ecuación (5.271) tendrá soluciones no triviales si el
denominador de (5.276) se anula,

p µ p µ − m 2 c2 = 0 (5.277)

Si escribimos (pµ ) = (E/c, p), de manera que

E2
pµ pµ = − p2 , (5.278)
c2
208 5.14 La solución de partı́cula libre

Con esta notación es claro que podemos identificar a las componentes del tetravector
pµ con con la energı́a E y las 3 componentes del impulso p de manera que la condición
(5.278) deviene la relación entre energı́a E e impulso p de una partı́cula libre de masa
m, según la forma clásica de la relatividad restringida,

E 2 = c2 p 2 + m 2 c4 (5.279)

Entonces, dado p, la energı́a E de la partı́cula puede tomar los valores


q
E± = ±Ep = ± c2 p2 + m2 c4 (5.280)

Vemos entonces que la ecuación de Dirac libre tiene soluciones de partı́cula libre
con energı́a positiva y ¡negativa!. Volvamos a mencionar que en la ecuación de Dirac
la masa puede tener cualquier signo puesto que en la fórmula (5.280) aparece al
cuadrado.
Resta determinar las soluciones u del sistema homogéneo (5.271). Aquı́ resulta
útil dividir al espinor de cuatro componentes en dos espinores de dos componentes,
φ y χ,
u1
 
!
u  φ
 2
u= = (5.281)
u3  χ
u4
con ! !
u1 u3
φ= y χ= (5.282)
u2 u4
y utilizando nuevamente la representación de Dirac de las matrices γ µ , la ecuación
(5.271) se escribe en forma de dos ecuaciones para ϕ y χ:

(E − mc2 )φ − c σ · p χ = 0, (5.283)
(E + mc2 )χ − c σ · p φ = 0. (5.284)

Dado que el determinante de este sistema es cero, sabemos que las cuatro ecua-
ciones no pueden ser linealmente independientes. Una de ellas tiene que ser una
combinación de las tres restantes. Mostraremos más tarde que estrictamente sólo
dos ecuaciones son linealmente independientes, debido a que existe otra cantidad
que conmuta con el Hamiltoniano dando lugar a una degeneración. De manera que
podemos tomar sólo la ecuación de arriba o sólo la de abajo. Es usual tomar la de
arriba para las soluciones de energı́a positiva y la de abajo para las negativas. De
este modo, si tomamos a φ como arbitrario (y complejo), con la normalización

φ† φ = u∗1 u1 + u∗2 u2 = 1, (5.285)


Mecánica cuántica Relativista 209

y E = +Ep , χ resulta
cσ · p
χ= φ. (5.286)
E + mc2
y entonces la solución es de la forma
!
φ
u+ = N+ c σ·p (5.287)
Ep +mc2
φ

Para E = −Ep , la solución que resulta ortogonal a esta es


−c σ·p
!
Ep +mc2
φ
u− = N− . (5.288)
φ
La normalización se ajusta de manera que
4
|uα |2 = 1,
X
(5.289)
α=1

y resulta !−1
c2 p 2
|N± |2 = 1 + ≡ |N |2 . (5.290)
(Ep + mc2 )2
la misma para las dos ernergı́as y φ arbitrario, y normalizado.
El lı́mite no relativista (v/c → 0) corresponde a |E± | → mc2 , y N ∼ 1. En este
caso las soluciones toman la forma
! !
φ O(v/c) × φ
u+ = , u− = . (5.291)
O(v/c) × φ φ
Suponiendo que las componentes de φ y χ sean de orden 1 (ambos están normali-
zados a 1), se distingue ası́ a las “grandes componente”, que son las que sobreviven
al lı́mite v/c → 0, de las “pequeñas componentes” que se anulan en este lı́mite. Se
observa entonces que en el lı́mite no relativista, la parte no trivial de los espinores
de 4 componentes se reduce a espinores de 2 componentes (espinores de Pauli, φ y
χ), que corresponden, para el caso de energı́a positiva, a la solución de la ecuación
no relativista de Schrödinger para una partı́cula libre con spin 1/2:

u = ei(p·r−Et)/ℏ × φ. (5.292)

5.15. Spin
Recordemos que a partir de la ecuación de Dirac,
∂ψ(r, t)  
iℏγ µ − mcψ(r, t) = 0, γ µ = γ 0, γ1, γ2, γ3 (5.293)
∂xµ
210 5.15 Spin

pudimos identificar el hamiltoniano relativista de una partı́cula libre de masa m. En


efecto, escribiendo la ec. (5.293) en términos de las matrices αi , β en lugar de las
matrices γ µ según las relaciones

γ0 = β (5.294)
γ i = βαi , (5.295)

se tiene
∂ψ  
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ. (5.296)
∂t
Escrita de esta manera señalamos anteriormente una evidente analogı́a de esta ecua-
ción con la ecuación de Schrödinger no-relativista si identificamos al hamiltoniano
en la forma H,
H = cα · (−iℏ)∇ + βmc2 (5.297)
Esta identificación es consistente con el hecho de que el lado izquierdo de la ec.
(5.296) puede ser asociado a una traslación temporal infinitesimal de la función de
onda con lo que el operador H del lado derecho cumple el rol de generador de dicha
traslación.
Es fácil ver que H según la definición (5.297) no conmuta con el operador L =
r×p, asociado al momento angular orbital según las reglas de cuantificación canónica
que aceptamos en la mecánica cuántica no-relativista y que hasta aquı́ consideramos
que son consistentes en el caso relativista. En efecto, si reescribimos (5.297) usando
que (−iℏ)∇ = p se tiene
H = cα · p + βmc2 (5.298)
y se encuentra
dL i
= − [L, H] = cα × p. (5.299)
dt ℏ
Es decir que L no se conserva, no está asociado a una constante de movimiento: ¡De
aquı́ se podrı́a inferir la ausencia de invarianza bajo rotaciones, y esto aún en el caso
de la partı́cula libre!28
Por otro lado, en el caso de la partı́cula libre encontramos 4 soluciones lineal-
mente independientes, dos de energı́a positiva y dos de energı́a negativa y que, en
lo que respecta a rotaciones, ambos estaban relacionados con los espinores de Pauli
que representan a las funciones de onda para partı́culas de spin 1/2, con las dos
componentes distinguiendo a las soluciones con igual energı́a según el el signo de la
proyección a lo largo del eje z.
28
Nótese que la cantidad cα jugaba el rol de “velocidad” en la interpretación clásica de la
corriente de probabilidad de Dirac. Si la fórmula (5.299) fuera clásica, como los vectores velocidad
e impulso son paralelos resultarı́a que dL/dt = 0.
Mecánica cuántica Relativista 211

Lo anterior sugiere que debe existir algún otro operador, ligado al spin, tal que
sus autovalores distingan a estas soluciones con la misma energı́a. Ese operador
sumado al del momento orbital L deberı́a conmutar con el hamiltoniano. Es decir
que con la experiencia adquirida con la teorı́a de Pauli para el electrón no relativista
es natural adelantar tal operador debe estar asociado con un operador momento
angular total total J , al que deben contribuir el momento angular orbital y el spin.
En analogı́a con el caso no relativista, en que se tiene J = L + ℏ2 σ, es natural definir
en el caso relativista

J =L+ Σ (5.300)
2
dado que Σ, como fue definida en la ec. (5.247) tiene la forma
!
σ 0
Σ= (5.301)
0 σ

tanto en la representación quiral como en la de Dirac, y es el operador asociado al


subgrupo de rotaciones del grupo de Lorentz que, para el caso de ángulos finitos
θ = (θ1 , θ2 , θ3 ), vimos que actúa sobre los espinores de 4 componentes en la forma
i
ψ → ψ ′ = e− 2 θ·Σ . (5.302)

Hemos propuesto entonces a Σ, que implementa las rotaciones espaciales sobre los
espinores, como el operador asociado al spin de la partı́cula de masa m. No es casual
que cada bloque de Σ corresponda al operador de spin de la teorı́a de Pauli.
Usando la ec. (5.244),
i
Σi = − ϵijk αj αk , (5.303)
2
calculemos el siguiente conmutador:
ℏ ℏ i
[ Σi , H] = [− ϵijk αj αk , cα · p + βmc2 ] (5.304)
2 2 2
i cℏ
= − ϵijk pl [αj αk , αl ] (5.305)
2 2
Luego de un poco de álgebra, se obtiene
" #

Σ, H = −iℏcα × p (5.306)
2

que cancela exactamente la contribución del lado derecho de (5.299), y resulta


" #

[J , H] = L + Σ, H = 0 (5.307)
2
212 5.16 Helicidad

Vemos entonces del resultado de la ec. (5.307), para el caso del Hamiltoniano de una
partı́cula libre, que J está asociado con una constante de movimiento del sistema y
es por ello natural relacionarlo con un operador de momento angular total. Contiene
al momento angular orbital L y, en cuanto a Σ, basta asociarlo al spin de la partı́cula
libre de masa m que aparece en la ecuación de Dirac para que todo sea consistente.
Los autovalores de Σ son ±1/2 (como lo son los de σ por lo que podemos
interpretar a las soluciones de la ecuación de Dirac como soluciones con spin 1/2.
Nótese que el hecho de que la ecuación de Dirac describa partı́culas de spin 1/2 es
una consecuencia de la estructura de la ecuación relativista y no una imposición
como la que hizo Pauli en el caso de la teorı́a no-relativista.
Vimos que en el lı́mite no relativista las soluciones con energı́a positiva coincidı́an
con las de la teorı́a de Pauli para proyección del spin ±1/2. Lo mismo sucede con las
de energı́a negativa. En el caso lı́mite de una partı́cula en reposo en que las cuatro
autofunciones lo son también de Σz , podemos afirmar que estas cuatro soluciones
linealmente independientes corresponden a energı́a positiva y spin ±1/2 y energı́a
negativa y spin ±1/2. (ver más adelante la discusión sobre helicidad).

5.16. Helicidad
Vimos que el spin de las partı́culas relativistas no se conserva separadamente del
momento angular orbital, en particular Σz no lo hace aún en el caso más simple de
una partı́cula libre. Por ello, la proyección del spin sobre un eje dado (al que lla-
maremos z por analogı́a con la direccion que suele elegirse en la mecánica cuántica
no-relativista) no servirá para caracterizar un estado dado. Sin embargo la proyec-
ción del spin en la dirección del movimiento sı́ se conserva, como veremos ahora.
Indicaremos a tal dirección a la direccion del movimiento como el vector unitario n,
p
n= (5.308)
|p|
donde p es el operador vectorial momento y el denominador indica que cuando se
aplique a una función de onda, el resultado (pψ) debe normalizarse con el autovalor
de manera de que n sea un versor. Partiendo de la proyección de Σ en la dirección
de n se tiene
!
ℏ ℏ p ℏ p
Σ·n= Σ· = Σ+r×p · = J · n. (5.309)
2 2 |p| 2 |p|
Luego, la cantidad

h= Σ·n (5.310)
2
llamada helicidad es un operador que, a diferencia de Σz , sı́ conmuta con el hamil-
toniano ya que cada componente de J lo hace y, por lo tanto, se conserva.
Mecánica cuántica Relativista 213

Los estados de una partı́cula con valores de helicidad determinados se llaman


estados de helicidad. Fı́sicamente, la helicidad corresponde al spin de la partı́cula
proyectado sobre la dirección del movimiento.
Ahora bien, es facil probar que (Σ · n)2 = 1. En efecto, este producto escalar
puede escribirse como Σi Σj ni nj . Siendo que ni nj es simétrico, al producto solo
contribuirá la parte simétrica de Σi Σj . Recordando que para las matrices de Pauli
vale que
σi σj = δij I + iεijk σk , (5.311)
y que eso es lo que resulta en los bloques del producto Σi Σj el resultado es una
matriz cuya diagonal coincide con la de la identidad, diag (Σi Σj ) = δij . Luego los
autovalores de(Σ · n)2 = (δij ni nj )2 = 1 y por lo tanto los autovalores de Σ · n son
±1 y los de h son ±ℏ/2.
Como la helicidad conmuta con el hamiltoniano, pueden buscarse autofunciones
comunes a ambos operadores. Ya mostramos que las soluciones de partı́cula libre
(5.287),
−c σ·p
! !
φ Ep +mc2
φ
u+ = N c σ·p , u− = N , (5.312)
Ep +mc2
φ φ
por ejemplo, pueden ser clasificadas según su energı́a (positiva o negativa). Mostre-
mos que estas autofunciones lo son también de la helicidad, y que eso determina
a φ y su helicidad (positiva o negativa). Si aplicamos el operador helicidad a u+
obtenemos
σ · nφ
!

hu+ = N c (σ·p) (5.313)
2 Ep +mc2 σ · n φ
de manera que si tomamos al espinor de dos componentes
!
u
φ= 1 (5.314)
u2

como autoestado de σ · n,
σ · n φ = ϵφ (5.315)
entonces automáticamente las soluciones de partı́cula libre son autoestados de heli-
cidad, con autovalor ϵℏ/2. Para hallarlas, conviene expresar al versor n en término
de variables angulares (φ, θ), con 0 ⩽ φ < 2π, 0 ⩽ θ ⩽ π,

n = (cos φ sin θ, sin φ sin θ, cos θ) (5.316)

con lo que la ec. (5,315) toma la forma


! ! !
cos θ exp(−iφ) sin θ u1 u
=ϵ 1 . (5.317)
exp(iφ) sin θ − cos θ u2 u2
214 5.17 Paridad

Los autovalores de esta ecuación se obtienen de la ecuación


!
cos θ − ϵ exp(−iφ) sin θ
det = 0, (5.318)
exp(iφ) sin θ − cos θ − ϵ
o,
ϵ2 − (cos2 θ + sin2 θ) = 0, (5.319)
por lo que se tiene
ϵ = ±1 (5.320)
En cuanto a los autovectores asociados, se encuentra
   
exp −i φ2 cos 2θ
φ+ =    
exp i φ2 sin 2θ
    (5.321)
− exp −i φ2 sin 2θ
φ− =    .
exp i φ2 cos 2θ

De este modo hemos clasificado a las cuatro soluciones de partı́cula libre de la


ecuación de Dirac, de acuerdo a su energı́a (positiva o negativa) y su helicidad,
±ℏ/2.

5.17. Paridad
Un cambio de paridad se define a partir de la transformación de coordenadas
r → −r, (5.322)
t → t. (5.323)
Es decir, la transformación de paridad corresponde a una reflexión espacial. Vimos
que esta transformación de las coordenadas espacio-temporales puede representarse
como uno de los elementos del grupo de Lorentz cuando actúa sobre el tetravector
posición
1 0 0 0
 
0 −1 0 0
ΛP =  ,

x′µ = Λµν xν . (5.324)
0 0 −1 0 

0 0 0 −1
No se trata de una transformación de las catalogadas como “propias” del grupo de
Lorentz pues det ΛP = −1.
Dada Λµν según (5,324), trataremos de asociarla con la matriz S, que ahora
llamamos P , según la cual transforman los espinores utilizando la fórmula (5.224)
Λµν γ ν = P −1 γ µ P (5.325)
Mecánica cuántica Relativista 215

de manera que se tiene, reemplazando en el lado izquierdo el valor explı́cito de Λµν


dado por la ec. (5.324), las siguientes ecuaciones

γ 0 = P −1 γ 0 P (5.326)
i −1 i
γ = −P γP (5.327)

P γ 0 = γ 0P (5.328)
i i
P γ = −γ P. (5.329)

Es decir que la matriz que representa una transformación de paridad para los espi-
nores debe conmutar con γ 0 y anticonmutar con las γ i . Basta entonces una relación
de proporcionalidad entre P y γ 0 para que esto se cumpla, segun vimos al estudiar
las propiedades de las matrices de Dirac

P = ηγ 0 (5.330)

con η por ahora una constante arbitraria.


Con esto, resulta que bajo paridad los espinores transforman según

ψ ′ (x′ ) = P ψ(x) = ηγ 0 ψ(x). (5.331)

Dos transformaciones de paridad (5.322) vuelven las coordenadas a su forma


original. Sin embargo, para que los espinores vuelvan a su forma original se necesita
aplicar cuatro veces el operador de paridad29
 2
ψ ′′ (x′′ ) = P ψ ′ (x′ ) = P 2 ψ(x) = η 2 γ 0 ψ(x) = η 2 ψ(x) (5.332)

Esto debe dejar invariante a la función de onda a menos de un número complejo de


módulo 1. Por lo que se puede elegir

η = ±1, ±i. (5.333)

En caso de elegirse ±i ello corresponderı́a a una fase exp(−iπ) indetectable


cuando se trata de transformaciones de cantidades medibles, por lo que que el valor
de η sea imaginario o real no tiene interés fı́sico.
29
Esto es razonable, dado que frente a una rotación en 2π alrededor de un eje el espinor cambia
en un signo −1 y es necesario hacer dos rotaciones en 2π para que el espinor vuelva a su forma
original.
216 5.18 Ecuación de Weyl: partı́culas de masa cero

5.18. Ecuación de Weyl: partı́culas de masa cero


Originariamente la ecuación de Dirac para una partı́cula de masa m y spin 1/2 se
aplicó al estudio de la dinámica cuántica del electrón. Pero también puede aplicarse
al estudio de partı́culas de masa cero y spin 1/2. Hasta fines de la década de 1990
se pensaba que el neutrino, propuesto por Fermi para mantener la conservación de
energı́a-impulso en la desintegración beta, era una partı́cula de masa cero y spin
1/2. De hecho, en el modelo éstandar de las 3 interacciones fundamentales (fuerte,
electromagnéticas y débiles) se lo introducı́a via un lagrangiano de Dirac con masa
cero.
Hoy sabemos que el neutrino tiene una masa muy pequeña, pero no nula, del
orden de < 0,120eV/c2 = 2,1410−37 kg ) (Como comparación, la masa del electrón
es 511keV/c2 = 9, 1093829110−31 kg). En realidad el valor consignado para la masa
de los neutrinos corresponde a un promedio: los estados de los neutrinos están ca-
racterizados por un número cuántico adicional, llamado de “sabor” (flavor). Resulta
entonces que hay 3 estados de neutrinos, el asociado al electrón, al muón y al τ . Al
propagarse, los neutrinos oscilan cambiando entre estados de diferentes sabores. Lo
que se puede medir son diferencias de cuadrados de sus respectivas masas.
La ecuación de Dirac para partı́culas de masa cero que, hasta 1990, era utilizada
para estudiar al neutrino, es
∂ψ(r, t)
iℏγ µ =0 (5.334)
∂xµ
En la representación quiral,
! !
0 I2 0 σi
γ0 = , γi = (5.335)
I2 0 −σ i 0

y escribiendo !
χ+
ψ= (5.336)
χ−
la ecuaciones devienen

!

iℏ 0 + iℏσ · ∇ χ− = 0, (5.337)
∂x
!

iℏ 0 − iℏσ · ∇ χ+ = 0, (5.338)
∂x

que son las ecuaciones de Weyl. Observemos que en este caso de masa cero, son
ecuaciones desacopladas para las componentes χ±
Mecánica cuántica Relativista 217

5.19. Quiralidad
Las matrices S[Λ] en (5.260) resultaron ser diagonal por bloques porque elegimos
una representación especı́fica de las matrices γ (5.259). De hecho esta representa-
ción se llama quiral porque descompone explı́citamente al espinor de Dirac en la
forma (5.336). Podrı́amos preguntarnos qué ocurre si elegimos otra representación
del álgebra de Clifford, donde en general S[Λ] no va a ser diagonal por bloques.
¿Existe alguna forma invariante de definir espinores quirales? Después de todo, el
hecho de que si consideramos sólo boosts y rotaciones la representación de 4 compo-
nentes sea reducible no puede depender de la representación de las matrices γ que
elijamos.
Podemos hacer esto introduciendo la “quinta” matriz γ,

γ 5 = iγ 0 γ 1 γ 2 γ 3 , (5.339)

que satisface
{γ 5 , γ µ } = 0, y (γ 5 )2 = +1. (5.340)
Además, se verifica que
[Σµν , γ 5 ] = 0 (5.341)
lo que implica que ψ̄γ 5 ψ es un escalar frente a rotaciones y boosts. No es invarian-
te frente a transformaciones de paridad, por ello se dice que es un pseudoescalar.
Definimos entonces los operadores
1
P± = (1 ± γ 5 ) (5.342)
2
que satisfacen P+2 = P+ , P−2 = P− y P+ P− = 0, es decir, son proyectores. En la
representación quiral la matriz γ 5 es
!
5 −I 0
γ = , (5.343)
0 I

de donde hallamos que P± proyecta el espinor ψ en sus dos componentes de Weyl χ± .


Pero entonces para una representación arbitraria del álgebra de Clifford, podemos
usar γ 5 para definir los espinores quirales

ψ± = P± ψ (5.344)

que se transforman frente a rotaciones y boosts con una representación irreducible del
grupo de Lorentz. Estos dos espinores se intercambian mediante una transformación
de paridad (5.324), ψ → P ψ, donde P = γ 0 ,

ψ± → ψ∓ (5.345)
218 5.20 Una interpretación fı́sica de las matrices de Dirac

Observemos que si ψ(x, t) satisface la ecuación de Dirac, entonces el espinor trans-


formado por paridad, γ 0 ψ(−x, t) también la satisface. El signo menos extra que
aparece al conmutar γ 0 con γ i se compensa con el cambio de signo de la derivada,
que actúa sobre −x en lugar de x.

5.20. Una interpretación fı́sica de las matrices de


Dirac
Vimos que las componentes espaciales de la corriente de probabilidad que resulta
de la ecuación de Dirac tienen la forma
1
J = ψ̄γψ = ψ † γ 0 γψ = ψ † αψ (5.346)
c
o sea que
J (r, t) = ψ(r, t)† cαψ(r, t) (5.347)
y recordando que ψ(r, t)† ψ(r, t) era la densidad de probabilidad de encontrar a la
partı́cula en el punto r en el instante t
En cuanto a la corriente, la ecuación (5.347) suggerirı́a que cα juega el papel de
la velocidad clásica con que se mueve la partı́cula. Esta interpretación se ve reforzada
por el siguiente argumento: en el esquema de Heisenberg, la evolución temporal de
un operador A está regida por la ecuación
dA i
= [H, A] (5.348)
dt ℏ
con H el Hamiltoniano del sistema. Vimos que el hamiltoniano asociado con la
ecuación de Dirac esta dado por:

H = c(−iℏ)α · ∇ + γ 0 mc2 (5.349)

con lo que si tomamos A = r tendremos


dr
= c[α · ∇, r] = cα. (5.350)
dt
Por supuesto, esto debe interpretarse en el sentido de valores medios,
ˆ ˆ
d
dr ψ (r, t)rψ(r, t) = c dr ψ † (r, t)αψ(r, t)

(5.351)
dt
y confirma la relación entre las matrices α y la velocidad de la partı́cula.
Mecánica cuántica Relativista 219

2
Ahora bien, como (αi ) = 1, los autovalores de αi son ±1 y los autovalores de
cada componente de la “velocidad”, según la fórmula (5.350) serı́an ±c, en clara
contradicción con el hecho de que en la mecánica relativista una partı́cula masiva no
puede viajar a la velocidad de la luz. Además, dado que [αi , αj ] ̸= 0, de hacerse una
interpretación ingenua de la ecuación (5,350), se tendrı́a que no es posible medir las
tres componentes de la velocidad simultáneamente.
Volvamos a utilizar la ecuación de Heisenberg (5.348) pero ahora tomando A =
α1 = αx . Se tiene
dαx i 2 2i
= [H, αx ] = (cpx − αx H) = (Hαx − cpx ) . (5.352)
dt ℏ iℏ ℏ
Para escribir esta fórmula hemos utilizado que
Hαx = cp · ααx + βαx mc2 (5.353)
= cpx + cpy αy αx + cpz αz αx x + βαx mc2 (5.354)
 
= 2cpx − cαx px αx + py αy + pz αz − βmc2 (5.355)
de donde
Hαx = 2cpx − αx H (5.356)
y
[H, αx ] = 2 (cpx − αx H) (5.357)
Tanto H como px son independientes del tiempo por lo que, derivando otra vez
se tiene
d2 αx 2 dαx 2 dαx
2
= H=− H . (5.358)
dt iℏ dt iℏ dt
Aquı́ hemos usado la fórmula (5.356) y que d ⟨px ⟩ /dt = 0. Imponiendo una condición
inicial,
dαx
= αx0 (5.359)
dt t=0
se puede integrar (5.358) y se obtiene
dαx 2iHt 2iHt
   
= αx0 exp − = exp αx0 . (5.360)
dt ℏ ℏ
Luego, usando (5.352),
iℏ 0 2iHt
 
αx H = αx exp − + cpx . (5.361)
2 ℏ
Si multiplicamos por cH −1 = H/E 2 a derecha se tiene
dx iℏc 0 2iHt H H
 
= αx exp − 2
+ c2 p x 2 (5.362)
dt 2 ℏ E E
220 5.21 La ecuación de Dirac en presencia de un campo electromagnético

Vemos que la velocidad corresponde a un movimiento oscilatorio con frecuencia ω =


2E/ℏ, que como mı́nimo corresponde a ω = 2mc2 /ℏ. Este movimiento, bautizado
por Schrödinger [8] como Zitterbewegung (del alemán, zitter, tembloroso, trémulo
y bewegung, movimiento), no puede ser observado en la práctica. Hay una manera
alternativa de tratar al operador posición que evita este problema [9].

5.21. La ecuación de Dirac en presencia de un


campo electromagnético
Hasta aquı́ hemos considerado la ecuación de Dirac para una partı́cula de spin
1/2 libre, que cuando se incluye un término de masa describe adecuadamente la
dinámica de un electrón libre. Nos interesa por supuesto estudiar el caso en que
electrón cuántico interactúa con un campo electromagnético clásico (E, B).
Sabemos que los campos electromagnéticos pueden ligarse a los llamados “cam-
pos de gauge” ϕ, A según las relaciones
B =∇×A (5.363)
1 ∂A
E = −∇ϕ − (5.364)
c ∂t
Ya en el caso de la mecánica cuántica no relativista las reglas de cuantificación
canónica se expresaban en términos de los “campos de gauge” que incluyen al po-
tencial vector A y al escalar ϕ.
A estos cuatro campos se lo puede escribir en términos de un tetravector Aµ =
(ϕ, Ai ) , µ = 0, 1, 2, 3, i = 1, 2, 3, de manera que los campos eléctrico Ei y magnético
Bi pueden expresarse de forma compacta en términos del “tensor de campo” Fµν ,
∂Aν ∂Aµ
Fµν = µ
− = ∂µ Aν − ∂ν Aµ (5.365)
∂x ∂xν
tal que
1
B i = εijk Fjk , E i = F 0i (5.366)
2
Las reglas de cuantificación canónica que para una partı́cula libre no relativista
tomaban la forma
e
p→p− A
c (5.367)
E → E − eϕ
con e la carga eléctrica.
Las reglas de cuantificación (5.367) en presencia de campos electromagnéticos se
vuelven más compactas escritas en términos del tetravector Aµ :
∂ e
pµ = iℏ → pµ − Aµ . (5.368)
∂xµ c
Mecánica cuántica Relativista 221

Notemos que al definir el tetravector contravariante pµ , sus componentes espa-


ciales aparecen con el factor iℏ y no con el habitual ℏ/i con el que se escribe en el
caso no relativista la regla de cuantificación canónica. El cambio de signo implı́cito
se debe a que hemos adoptado una métrica negativa para las componentes espacio-
espacio de gµν por lo que hay un cambio de signo entre componentes contravariantes
y covariantes del (tri)vector impulso.
Partiendo entonces de la ecuación de Dirac para el caso de un electrón de masa
m, libre,
∂ψ
iℏγ µ µ − mcψ = (γµ pµ − mc) ψ = 0 (5.369)
∂x
y aplicando las reglas (5.368) la ecuación de Dirac en presencia de un campo elec-
tromagnético toma la forma
e
   
γµ p − Aµ − mc ψ = 0
µ
(5.370)
c
Para ver cómo se relaciona esta ecuación con la de Klein-Gordon para una
partı́cula
 cargada
 de masa m aplicamos a la ecuación anterior el operador diferencial
ν e ν
γν p − c A + mc y obtenemos

e e µ
    
γν γµ p − Aν pµ −
ν
A − m2 c2 ψ = 0 (5.371)
c  c 
e e µ
  
γν γµ pν − Aν pµ − 2 2
A − m c ψ = 0. (5.372)
c c
Podemos descomponer al producto γ ν γ µ en sus partes simétrica y antisimétrica,

γν γµ = gνµ − iσνµ (5.373)

donde hemos usado


1
gνµ = (γν γµ + γµ γν ) (5.374)
2
y definido
i
(γν γµ − γµ γν ) ≡ 2Σµν
σνµ = (5.375)
2
Aquı́ Σµν son los generadores de las transformaciones de Lorentz en el espacio espi-
norial. Con esto, y usando que para cualquier función f

pµ Aν f (x) = (−iℏ)∂µ Aν f (x) + Aν pµ f (x) (5.376)

se obtiene
e e eℏ
  
p − Aµ
µ
pµ − Aµ ψ − σ µν Fµν ψ − m2 c2 ψ = 0 (5.377)
c c 2c
222 5.22 El lı́mite no-relativista

El primero y tercer término de esta ecuación coinciden con la ecuación de Klein-


Gordon para una partı́cula de masa m y carga e, solo que, en lugar de corresponder
a una partı́cula escalar (compleja, como resulta natural para el caso de campos
escalares cargados30 ), el operador de Klein-Gordon actúa en este caso sobre un
espinor de 4 componentes. El segundo término, que es un efecto puramente cuántico
(pues se anula cuando ℏ → 0 ) es propio de la formulación de Dirac y veremos que
da cuenta de la interacción de los campos electromagnéticos con, en particular, el
spin. Su aparición se relaciona con el hecho de que la función de onda de Dirac es
un espinor de 4 componentes.
Para estudiar los estados estacionarios de la ecuación (5.377), proponemos fac-
torizar la dependencia temporal como habitualmente hacemos,
 1
ψ (r)

 2
i ψ (r) i
   
ψ(r, t) = exp − Et  3  ≡ exp − Et ψ(r). (5.378)
ℏ ψ (r) ℏ
ψ 4 (r)
Reemplazado este ansatz en (5.377) obtenemos
h i
(E − eϕ)2 − (cp − eA)2 + eℏc(Σ · B − iα · E) ψ(r) = m2 c4 ψ(r) (5.379)

con Σ la matriz de spin (ec. (5.301))

5.22. El lı́mite no-relativista


Para estudiar el lı́mite no-relativista de la ecuación de Dirac en un campo elec-
tromagnético nos quedaremos con el primer orden en v 2 /c2 en la ecuación (5.379)
Separaremos ahora la energı́a en reposo mc2 de la energı́a total E escribiendo
E = E ′ + mc2 (5.380)
con E ′ ≪ mc2 . También supondremos un campo ϕ débil, eϕ ≪ mc2 Con esto, el
primer término en (5.376), desarrollando el cuadrado y despreciando el término E ′2 ,
toma la forma
(E − eϕ)2 ≈ 2mc2 (E ′ − eϕ) + m2 c4 (5.381)
con lo que la ecuación (5.376) puede escribirse en este lı́mite,
2 !
1 e eℏ eℏ

p− A + eϕ − Σ·B+i α · E ψ = E ′ψ (5.382)
2m c 2mc 2mc
30
Solo si el campo escalar es complejo puede extenderse la invarianza de gauge del electromag-
netismo, Aµ → Aµ + ∂µ Λ de manera de incluir a los escalares, definiendo su ley de transformación
como ϕ → exp[(ie)/(ℏc)Λ]ϕ. Queda claro que la carga del campo escalar es e, la constante que
aparece en los términos de interacción Aµ ϕ y Aµ Aµ ϕ entre los campos Aµ y ϕ.
Mecánica cuántica Relativista 223

Al orden en que trabajamos, se puede despreciar el término proporcional al


campo eléctrico E. En efecto, vimos que |α|c ≈ |v| o sea que α ≈ v/c. Pero además
tenemos

eϕ ≈ |eE|a ≈ e|E| (5.383)
p
donde hemos llamado a a una distancia cuántica tı́pica, ligada a p por la relación
de incerteza, a ∼ ℏ/p. O sea que se tiene,

eℏ α · E ℏ vEp v2
≈ = 2 (5.384)
2mc eϕ 2mc c E ℏ 2c
Entonces, en la aproximación no relativista tendremos
2 !
1 e eℏ

p− A + eϕ − Σ · B ψ = E ′ψ (5.385)
2m c 2mc

que no es otra cosa que la ecuación de Pauli para el electrón norelativista31 sólo que
el término que habı́a tenido que ajustarse de manera ad hoc en el caso no relativista,
por provenir de un análisis semiclásico, aquı́ aparece automáticamente. Si µs es el
momento magnético del electrón y µB = eℏ/(2mc) el magnetón de Bohr, se tiene la
relación
eℏ
µs = σ = µB σ (5.386)
2mc
Si aceptamos por el momento que, como en el caso de la ecuación para la partı́cula
libre las componentes se separan en grandes y pequeñas, tendremos para las grandes
exactamente la ecuación de Pauli, con una relación entre momento magnético y spin
dada por
µs e µB
= =2 (5.387)
s mc ℏ
que es el doble que la que resulta en el análisis clásico de la relación entre momento
angular orbital y momento magnético,
µl e µB
= = (5.388)
l 2mc ℏ
Pero justamente el factor 2 en (5.387) habı́a debido incluirse manu militari en la
formulación de Pauli del electrón no relativista para reproducir los resultados ex-
perimentales de la época. En otras palabras, debı́a postularse un factor llamado
giromagnético, que se denota como g, que multiplica la fórmula clásica (5.388),
µs µB
=g . (5.389)
s ℏ
31
Recordemos que en las soluciones de la ecuación de Dirac para una partı́cula libre las compo-
nentes de energı́a negativa eran del orden O(v 2 /c2 )
224 5.22 El lı́mite no-relativista

Se establecı́a entonces, para lograr acuerdo con la experiencia, que g = 2. La formu-


lación de Dirac, en cambio, no necesita postular g = 2 sino que tal valor resulta una
predicción. Esto fue considerado un triunfo importante de la formulación de Dirac.
Sin embargo, si buscamos hoy en una tabla de valores experimentales, obtenidos
con mucha mejor precisión que en los años 30, veremos que se consigna para el factor
giromagnético del electrón:

gexp = 2 × (1,001159652193 ± 0,000000000004). (5.390)

¿Quiere decir esto que la teorı́a de Dirac del electrón es incorrecta? La respuesta es
que en realidad, la teorı́a de Dirac es incompleta, en el sentido de que describe la
dinámica cuántica del electrón en el campo electromagnético clásico del núcleo (en
el caso de la descripción de un átomo).
Es recién cuando se hace un tratamiento completamente cuántico, tanto para el
electrón como para el campo electromagnético asociado al campo de gauge Aµ en
el que se mueve, que el valor predicho por la ecuación de Dirac recibe correcciones
(llamadas radiativas). En lo que se considera uno de los grandes triunfos de la elec-
trodinámica cuántica (la teorı́a cuántica de los campos electromagneticos asociados
al núcleo y el electrón) el valor teórico que se calcula en teorı́a de perturbaciones
resulta
gteor = 2 × (1,001159652459 ± 0,000000000123). (5.391)
Dejemos ahora a la ecuación de Klein-Gordon que es obedecida por las soluciones
de la ecuación de Dirac y analicemos directamente a esta última ab initio
e
   
γµ p − Aµ − mc ψ = 0
µ
(5.392)
c
Para estudiar la manera en que las componentes “grandes” (ψA ) y “pequeñas”
(ψB ) se separan, vamos a considerar una representación explı́cita para las matrices
γ µ . Conviene elegir la representación de Dirac que lleva a la ecuación (multiplicando
por γ 0 = β y recordando que γ = βα )

" ! ! # ! !
0 I I 0 ψA ψA
σ · (cp − eA) + mc2 = (E − eϕ) (5.393)
I 0 0 −I ψB ψB

Este sistema es equivalente al sistema acoplado para los espinores de dos com-
ponentes ψ A y ψ B

σ · (cp − eA)ψ B + mc2 ψ A = (E − eϕ)ψ A


(5.394)
σ · (cp − eA)ψ A − mc2 ψ B = (E − eϕ)ψ B
Despejamos de la segunda ecuación ψ B ,
Mecánica cuántica Relativista 225

 −1
ψ B = E − eϕ + mc2 σ · (cp − eA)ψ A (5.395)
o, escribiendo nuevamente E = E ′ + mc2 ,
 −1
ψ B = E ′ − eϕ + 2mc2 σ · (cp − eA)ψ A . (5.396)
Para simplificar los cálculos nos restringiremos al caso puramente eléctrico, A = 0,
y denotaremos eϕ = V ). El lı́mite no relativista corresponde a que

E ′ ≪ mc2 V ≪ mc2 p ≈ mv (5.397)

y por lo tanto,
cσ · p A v
 
B
ψ ≈ 2
ψ ∼O ψA. (5.398)
2mc c
Es decir que la solución de 4 componentes tiene dos grandes componentes ψ A y dos
pequeñas componentes ψ B como sucedı́a para la partı́cula libre. Notemos además
que, si bien ψ está normalizada, esto no implica que cada una de las componentes
ψA y ψB lo esté. En efecto, de la condición de normalización,

ψA† ψA + ψB† ψB = 1, (5.399)

insertando (5.398) se desprende, a orden (v/c)2 , que


!
p2
1+ ψA† ψA = 1, (5.400)
4m2 c2

con lo cual podemos introducir una componente grande con la normalización ade-
cuada, Ψ (spinor de dos componentes), en la forma
!
p2
ψA = 1 − Ψ. (5.401)
8m2 c2

Además, si reemplazamos la expresión exacta para ψ B dada por (5.396) en la


primera de las ecuaciones (5.394), tendremos, luego de un poco de arreglo,
 !−1 
1 E′ − V
 σ·p 1+ σ · p + V  ψA = E ′ψA (5.402)
2m 2mc2

Haremos a continuación una expansión en el lı́mite no relativista. Si guardamos sólo


el primer término en la expansión en potencias de (E ′ − V ) /2mc2 tendremos
!−1
E′ − V E′ − V
1+ ≈1− . (5.403)
2mc2 2mc2
226 5.22 El lı́mite no-relativista

Si insertamos (5.401), y utilizamos el resultado32

(σ · p)(σ · p) = p2 , (5.406)

obtenemos una ecuación para la componente grande:

E′ − V
" ! # !
p2 1 ′ p2
− σ·p σ·p+V −E 1− Ψ = 0. (5.407)
2m 2m 2mc2 8m2 c2

Para simplificar esta ecuación es conveniente multiplicarla a la izquierda por el


operador (1 − p2 /8m2 c2 ), y conservar términos a orden (v/c)2
" #
p2 p4 1 V p2 p2
 
+V − + σ · p σ · p − V − V Ψ = E ′Ψ
2m 8m3 c2 2m 2mc2 8m2 c2 8m2 c2
(5.408)
Para simplificarla aún más, recordemos el conmutador

[pi , V (x)] = −iℏ ∂i V, (5.409)

que permite calcular

p2 V = pi pi V = pi V pi + pi (−iℏ)∂i V = V p2 − 2iℏ ∇V · p − ℏ2 ∇2 V

(σ · p)V (σ · p) = σi σj pi V pj = δij pi V pj + iεijk σk pi V pj


= V pi pi − iℏ ∂i V pi + iεijk σk V pi pj + +iεijk σk (−iℏ)∂i V pj
= V p2 − iℏ ∂i V pi + ℏεijk σk ∂i V pj
= V p2 − iℏ∇V · p + ℏσ · (∇V × p)

Observamos que el término V p2 se cancela, al igual que el término −iℏ∇V · p. Si


además consideramos un potencial central, V (r) = V (r), entonces,

dV (r) dV (r) r
∇V = ∇r = (5.410)
dr dr r
32
De la relación entre matrices de Pauli

σi σj = δij + iεijk σk , (5.404)

obtenemos
(σ · p)(σ · p) = σi σj pi pj = δij pi pj + iεijk σk pi pj = p2 . (5.405)
El segundo término se anula por ser contracción de un tensor simétrico y uno antisimétrico.
Mecánica cuántica Relativista 227

y para el tercer término obtenemos


1 dV (r)
ℏσ · (∇V × p) = 2 S·L
r dr
donde S = (ℏ/2)σ. La ecuación finalmente resulta
" #
p2 p4 1 1 dV (r) ℏ2
+V − 3 2
+ 2 2
S · L + 2 2
∇2 V Ψ = E ′ Ψ (5.411)
2m 8m c 2m c r dr 8m c

Por ejemplo, para el potencial Coulombiano,

Ze2
V (r) = −
4πr
tenemos que (V = eϕ, E = −∇ϕ)

∇2 V = −e∇ · E = −eρn = Ze2 δ (3) (r).

donde ρn es la densidad de carga del nucleo, ρn −Ze. Esta “ecuación de Schrödinger”,


derivada de la ecuación de Dirac, concuerda bien con la que usamos para compren-
der la estructura fina del átomo de hidrógeno. Los primeros dos términos son los
términos de energı́a cinética y potencial del hamiltoniano usual. El tercer término
es la corrección relativista de la energı́a cinética. El cuarto término es la interacción
espı́n-órbita correcta, incluido el efecto de precesión de Thomas con el adecuado fac-
tor 1/2. El quinto término es el llamado término de Darwin, que da una corrección
adicional para los estados s que experimentalmente resulta ser correcta33 .
Si bien no trataremos de resolver esta ecuación, conviene señalar la manera per-
turbativa de hacerlo: se resuleve la ecuación no relativista en presencia del potencial,
sin incluir al término en p4 ni a los términos que contienen derivadas de V. Obtenidas
las dos componentes de ψ A para este problema, se forman combinaciones lineales
que sean autofunción de J 2 , Jz , L2 , s2 y luego se considera a los tres términos no
incluidos como perturbaciones.

5.23. Invarianza de gauge


La ecuación de Dirac (5.369) para un electrón en un campo electromagnético
asociado a un campo de gauge Aµ = (ϕ, A),
e
   
µ
γ iℏ∂µ − Aµ − mc ψ = 0 (5.412)
c
33
Nótese que este término sólo impacta en las funciones de onda que que son finitas en el origen,
tı́picamente las que tienen l = 0.
228 5.23 Invarianza de gauge

tiene una invarianza muy importante, llamada de gauge, asociada con las transfor-
maciones de gauge que dejan invariante al tensor de campo electromagnético. En
efecto, recordemos que
Fµν = ∂µ Aν − ∂ν Aµ (5.413)
permanece invariante ante el cambio del campo de gauge Aµ

Aµ (x) → Aµ (x)′ = Aµ (x) + ∂µ Λ(x) (5.414)

con Λ(x) una función real arbitraria. Que Fµν permanezca invariante frente a las
transformaciones de gauge (5.414) quiere decir que ni la medida experimental del
campo eléctrico ni la del magnético, que son las cantidades fı́sicas justamente medi-
bles detectan si trabajamos con Aµ o con A′µ : Recordemos que
1
B i [A] = εijk Fjk [A] (5.415)
2
i
E [ϕ, A] = F 0i [ϕ, A] (5.416)

La invarianza de estos campos frente a transformaciones de gauge como la (5.414)


significa entonces que

B [A′ ] = B[A], E [ϕ′ ; A′ ] = E[ϕ; A] (5.417)

donde
B =∇×A
1 ∂A (5.418)
E = −∇ϕ − .
c ∂t
Esta invarianza implica que los campos Aµ y sus transformados de gauge son
todos admisibles para describir a los campos eléctrico y magnético. Por ello, según
el problema que enfrentemos podemos trabajar usando “un dado gauge” u otro. Por
ejemplo podemos elegir una función Λ tal que anule la componente A0 simplemente
utilizando un Λ tal que ∂0 Λ cancele ese A0 . Ese gauge se conoce como “gauge de
Coulomb”. En otras circunstancias puede convenir elegir Λ tal que ∂ µ Λµ = 0 (gauge
de Lorenz34 ).
Ahora bien, podrı́a suceder que al interactuar estos campos con un electrón
descripto por una función de onda que obedece la ecuación de Dirac, la función de
onda detectara de una manera medible el cambio. Veremos que en general este no
es el caso35 .
Para analizar lo anterior, comencemos por notar que al cambiar Aµ por A′µ en
la ecuación de Dirac, se agrega un término, el gradiente de ψ. Si la transformación
34
Este Lorenz no es el Lorentz de las transformaciones relativistas sino Ludvig Lorenz, un fı́sico
y matemático danés.
35
Véase el experimento de Aharanov-Bohm para una descripción más precisa de este asunto
Mecánica cuántica Relativista 229

(5.414) va acompañada de un cambio adecuado en la fase de la función de onda ψ,


la ecuación retoma su forma inicial.
Consideremos entonces el conjunto de transformaciones de gauge

Aµ (x) → Aµ (x)′ = Aµ (x) + ∂µ Λ(x),


e
 

ψ(x) → ψ (x) = exp −i Λ(x) ψ(x), (5.419)
ℏc
e


ψ̄(x) → ψ̄ (x) = ψ̄(x) exp i Λ(x) .
ℏc
Ante este cambio, la ecuación (5.412) tiene la misma forma cuando es escrita en
términos de los campos transformados según (5.419) que cuando lo es en términos
de los campos sin transformar. Es decir, la ecuación de Dirac es invariante frente a
las transformaciones de gauge completas (5.419) que incluyen al campo de gauge y
a la función de onda ψ̄ que describe a la materia.
e e
       
γ µ iℏ∂µ − Aµ + mc ψ = 0 → γ µ iℏ∂µ − A′µ + mc ψ ′ = 0 (5.420)
c c

Notemos que en la ec. (5.419) hemos incluido la ley de transformación de ψ̄ que


por un lado no aparece en la ecuación de Dirac y, por el otro, podrı́a “deducirse” a
partir de la fórmula que relaciona ψ̄ con ψ, ψ̄ = ψ † γ 0 . Sucede que cuando se trata a ψ
como un campo cuántico en pie de igualdad con Aµ (es decir, se entra en el dominio de
una de las llamadas “teorı́as de campos cuánticos”, en este caso la electrodinámica
cuántica) resulta que ψ̄ debe tomarse como un campo “independiente” de ψ. De
hecho, esto puede verse ya a nivel de mecánica cuántica, si pretendemos escribir
una acción de la cual derive la ecuación de Dirac como ecuación de Euler Lagrange.
De manera parecida a lo que sucede con el mismo problema para la ecuación de
Schrödinger, es natural tomar como acción (junto con su Lagrangiano)
ˆ ˆ
e
   
4 4 µ
S = d xL = d xψ̄(x) γ iℏ∂µ − Aµ (x) + mc ψ(x) (5.421)
c

Tomando a ψ̄ y ψ como variables independientes, se tiene como ecuación de Euler-


Lagrange para ψ :
!
∂L ∂L e
   
∂µ ) − =⇒ γ µ iℏ∂µ − Aµ (x) + mc ψ(x) = 0. (5.422)
∂(∂µ ψ̄ δ ψ̄ c

Puede verse que no solo la acción (5.421) sino el Lagrangiano, su integrando, es inva-
riante frente a las transformaciones de gauge (5.419). Es válido entonces recurrir al
teorema de Noether que establece que, como pasa con toda invarianza de un Lagran-
giano, existe una carga conservada asociada a esa invarianza. Para encontrarla, en
230 5.23 Invarianza de gauge

el caso de la invarianza de gauge comenzamos por construir la corriente conservada


(en el sentido de que su tetradivergencia es nula) asociada a esta invarianza. Para
ello, según el método de Noether, consideramos un cambio infinitesimal del campo
de materia ψ
ie
δψ = ψϵ(x). (5.423)
ℏc
Aquı́ ϵ(x) es un parámetro infinitesimal. La corriente de materia asociada a la inva-
rianza viene dada, de acuerdo al teorema de Noether por

δL e
jµ (x)ϵ(x) = δψ = − ψ̄γ µ ψϵ(x) (5.424)
δ∂µ ψ c

¡Es decir que la corriente conservada de Noether asociada con la invarianza de gauge
coincide, a menos de un factor constante, con la corriente de probabilidad cuya
componente temporal da la densidad de probabilidad! Para ello basta reescribir a la
corriente jµ como
e
jµ (x) = − Jµ (x) (5.425)
c
con
Jµ (x) = ψ̄(x)γ µ ψ(x), ∂µ J µ (x) = 0. (5.426)
´
Luego, la carga conservada, la integral de J0 sobre todo el espacio, Q = dr ψ ∗ ψ,
no es otra cosa que la expresión de que la probabilidad de encontrar a la partı́cula
descripta por la ecuación de Schrödinger es 1.
Volviendo a la transformación de gauge (5,414) con parámetro real arbitrario
Λ(x),
Aµ (x) → A′µ = Aµ (x) + ∂µ Λ(x) (5.427)
podrı́amos escribirla en una forma en apariencia más complicada,
1
Aµ (x) → A′µ = Aµ (x) + g −1 (x)∂µ g(x) (5.428)
i
con
g(x) = exp(iΛ(x)) (5.429)
En esta forma, g(x) puede ser identificado como uno de los elementos del grupo
unitario U(1) formado por los complejos de módulo 1. Esto podrı́a pensarse que es un
detalle irrelevante para las transformaciones de gauge del electromagnetismo. Pero
no es ası́: La teorı́a de las interacciones electrodébiles, que unifican a los fenómenos
electromagnéticos con los débiles está basado en la extensión de las invarianzas de
la teorı́a agregando otro grupo unitario con determinante 1 , el identificado como
SU(2) cuya representación fundamental es el de matrices de 2×2 (por ejemplo, dada
por las 3 matrices de Pauli). Y para describir las interacciones fuertes, también se
Mecánica cuántica Relativista 231

utiliza un grupo unitario, el grupo SU(3) cuya representación fundamental es de 8


matrices de 3 × 3 conocidas como matrices de Gell-Mann.
Para el caso general del grupo de Lie SU(N ), la transformación de los campos
de gauge (5.430) se complica:
1
A′µ = g −1 Aµ (x)g + g −1 (x)∂µ g(x) (5.430)
i
Hay que notar que en el primer término a la derecha solo se puede simplificar el g −1
con el g para el caso U (1), un grupo abeliano en el que el que Λ es una función real
de x y lo mismo sucede con las componentes de Aµ . En el caso en que N ̸= 1 el
grupo es no abeliano en el sentido de que Λ y Aµ toma valores en el algebra de Lie
del grupo, que se suele anotar como su(N ) y es un álgebra no conmutativa.
El Lagrangiano del Modelo Estándar es el de una teorı́a de gauge con grupo
g ∈ SU(3)SU(2) × U(1).

5.24. Átomos hidrogenoides


Uno de los problemas en los que se puede poner a prueba a la ecuación de
Dirac es en el de la estructura fina de los espectros atómicos. En este asunto, la
mecánica cuántica no-relativista habı́a tenido sus primeros y más resonantes éxitos.
Ya en ese caso habı́a sido notable el haber podido encontrar una solución exacta
de la ecuación de ondas para el electrón en un campo coulombiano. Veremos que lo
mismo sucede en el caso de la ecuación relativista de Dirac para el electrón en un
potencial de Coulomb. Y que los resultados dan una descripción excelente, superior
al de la mecánica cuántica no relativista, de los datos experimentales para átomos
hidrogenoides.
Comencemos por hacer, a vuelo de pájaro, una enumeración de los resultados de
la mecánica cuántica no relativista para átomos hidrogenoides. Para ello recordemos
que la ecuación de Schrödinger para los estados estacionarios de un electrón de masa
me y carga e en el campo eléctrico Coulombiano producido por un núcleo de número
atómico Z toma la forma
!
ℏ2 2 Ze2
∇ + + ϵn ψn,l,m = 0 (5.431)
2µ 4πr

con el Laplaciano escrito como

∂2 2 ∂ 1
∇2 = 2
+ − 2 2 L2 (5.432)
∂r r ∂r ℏ r
L2 ψn,l,m = ℏ2 l(l + 1)ψn,l,m . (5.433)
232 5.24 Átomos hidrogenoides

En (5.431) m es la masa reducida,


1 1 1 1
= + ≈ (5.434)
µ me mN me
con mN la masa del núcleo. La constante fundamental que aparece en la teorı́a es
la constante de estructura fina α
e2 1
α= = (5.435)
4πℏc 137,037
en la que debe notarse que en la ecuación de Schrödinger en un potencial coulom-
biano las dos constantes fundamentales ℏ y c solo aparecen combinadas en α.
Los niveles de energı́a corresponden a la fórmula de Balmer

m(Zα)2
ϵn = − (5.436)
2n2
con
mα2
= 13,6eV (5.437)
2
y
n ⩾ 1, l = 0, 1, 2, . . . n − 1, −l ⩽ m ⩽ l. (5.438)
La degeneración d(n) del estado n es
n−1
(2l + 1) = n2
X
d(n) = (5.439)
l=0

Veremos que, con el tratamiento relativista, esta degeneración decrece y aparece una
estructura fina en el espectro, no prevista por el tratamiento no-relativista.
Pasemos ahora al estudio detallado del mismo problema pero utilizando la ecua-
ción relativista de Dirac. Como se trata del potencial Coulombiano en átomos hi-
drogenoides (con un número de protones Z ) tendremos
Ze
A0 = − (5.440)
4πr
y, como no hay campo magnético, pondremos nuevamente A = 0.
En lo que sigue conviene utilizar la representación de Weyl (quiral) de las matrices
de Dirac, ! !
0 0 I 0 σ
γ =− γ= (5.441)
I 0 −σ 0
En lugar de estudiar directamente la ecuación de Dirac, escribiremos la que
resulta de aplicar a esa ecuación el operador de Dirac (con el signo relativo entre
Mecánica cuántica Relativista 233

derivada y masa opuesto al de la ecuación original) a la misma. Vimos que de esta


manera se obtiene una ecuación de segundo orden que en el caso libre coincidı́a con
la de Klein-Gordon actuando sobre una función espinorial de 4 componentes.
Las soluciones de la ecuación resultante con derivadas de segundo orden son por
supuesto soluciones de la de Dirac de primer orden. La idea del camino que estamos
siguiendo es que, trabajando con una ecuación de segundo orden, nos será más fácil
utilizar como guı́a lo aprendido al estudiar al átomo de Hidrógeno con la ecuación
de Schrödinger.
Consideraremos la aproximación en que la masa reducida del sistema se toma
igual a la del electrón. Por simplicidad trabajaremos con unidades tales que ℏ = c = 1
y al final de los cálculos recuperaremos estas constantes usando el hecho de que la
constante de estructura fina cuando ℏ y c aparecen en su valor del sistema métrico
con su verdadero valor que es α = e2 /(4πℏc), ec. (5.435). La ecuación de segundo
orden que resulta de lo descripto más arriba es:
 2  h i
µ 0
iγ ∂µ − eγ A0 2
−m ψ = (i∂µ − eA0 δµ0 )2 − eσ 0i F0i − m2 ψ = 0 (5.442)

con
!
σi 0
σ 0i = i . (5.443)
0 −σ i

Con esto, el término ligado al spin que aparece en la ecuación (5.442) puede escribirse
según sea el signo con que aparecen las matrices de Pauli de 2 × 2 σ i en la matriz
σ 0i de 4 × 4,
e σ·r
− σ 0i F0i = ±iZα 3 (5.444)
2 r
(téngase en cuenta que para escribir el vector contravariante r a partir de la deri-
vada covariante ∂i hay que incluir un signo − debido a la signatura elegida para la
métrica.)
En la ec. (5.444) debe tomarse el signo + cuando se trate de la componente χ+ y
el signo − cuando se trate de la componente χ− en que descomponemos al espinor
de 4 componentes. Las componentes χ± son cada una un espinor de Weyl de 2
componentes,
!
χ+
ψ= (5.445)
χ−

Tenemos entonces un par de ecuaciones que son el análogo de la ecuación de


Schrödinger para el átomo de Hidrógeno, para estados estacionarios, pero para el
caso relativista,
234 5.24 Átomos hidrogenoides

Ecuación de segundo orden que deriva de la de Dirac


(para estados estacionarios)
" #
∂2 2 ∂ L2 Z 2 α 2 Zα 2Zαϵ  2 
− 2− + 2 − 2 ± i 2 σ · r̂ − − E − m2 χ± = 0 (5.446)
∂r r ∂r r r r r
donde E = mc2 − ϵ (aquı́ ϵ corresponde a la energı́a del electrón en los estados
ligados).
Los tres primeros términos del lado izquierdo corresponden al Laplaciano en
coordenadas esféricas. En cuanto al potencial coulombiano, cuya traza podemos
seguir a través de Z, aparece en los tres términos siguientes, en particular aquel
multiplicado por la energı́a ϵ. Finalmente, hay un término con el cuadrado de la
energı́a y el m2 que corresponde a la energı́a en reposo (recordar que transitoriamente
hemos puesto c = 1).
Si no fuera por el término que contiene al operador de spin (i.e., a las matrices
de Pauli), esta ecuación es exactamente la que resultarı́a de plantear la ecuación de
Klein-Gordon para una partı́cula cargada en un campo Coulombiano:

Ecuación de Klein-Gordon (sin spin)


!
∂2 2 ∂ L2 Z 2 α2 2Zαϵ  2 
− 2− + 2 − 2 − − ϵ − m2 ϕ = 0 (5.447)
∂r r ∂r r r r
que puede compararse con la que resulta en el caso no-relativista (ecuación de
Schrödinger (5.431))

Ecuación de Schrödinger
!
∂2 2 ∂ L2 2mZα
− 2− + 2 − − 2mϵ ψ = 0 (5.448)
∂r r ∂r r r
Ahora bien, si comparamos las ecuaciones de Klein-Gordon y la de Schrödinger,
vemos que formalmente son idénticas si se hacen las siguientes sustituciones en la
de Schrödinger:
en el término que contiene L2
L2 → L′2 = L2 − Z 2 α2 (5.449)

en el que contiene a α
ϵ
α → α′ = α (5.450)
m
-
Mecánica cuántica Relativista 235

en el que contiene a la energı́a ϵ


ϵ2 − m2

ϵ→ϵ = (5.451)
2m
Si “traducimos” las relaciones anteriores al caso de los autovalores del momento
angular orbital tendremos
l(l + 1) → l(l + 1) − Z 2 α2 ≡ l′ (l′ + 1)
ϵ
α → α = α′
m . (5.452)
2 2
ϵ −m
ϵ→ = ϵ′
2m
Con esto vemos que al pasar de la ecuación de Schrödinger a la de Klein-Gordon, los
autovalores del momento angular orbital se corren en una cantidad que llamaremos δl
y que se puede calcular a partir de las soluciones de la ecuación cuadrática asociada
a la primera lı́nea de la ecuación (5.452) que era
l(l + 1) → l(l + 1) − Z 2 α2 ≡ l′ (l′ + 1) (5.453)
l → l ′ = l − δl (5.454)
s
2
1 1

δl = l + − l+ − Z 2 α2 (5.455)
2 2
Por los mismos motivos, el número cuántico principal n se corre en la misma
cantidad. En efecto, recordemos que en el caso de la ecuación de Schrödinger, para
que la función de onda tuviera el comportamiento adecuado en el infinito su parte
radial debı́a ser un polinomio ( y no una serie de infinitos términos). De aquı́ resulta
que cierto parámetro n′ ligado a l debı́a ser un entero, n′ = n − (l + 1). Luego, al
cambiar l → l′ tiene que cambiarse n → n′
Usando las relaciones (5.453) vemos entonces que podemos leer la fórmula para
los niveles de energı́a de Klein-Gordon para una partı́cula de masa m y carga e en un
campo coulombiano, a partir de la fórmula de Balmer en término de los parámetros
primados:
2
Enl − m2 m (Zα′ )2
=− (5.456)
2m 2n′2
2 2
Enl − m mZ 2 α2 Enl
2
1
=− (5.457)
2m 2 m (n − δl )2
2

de donde, finalmente, se tiene


m
Enl = r  . (5.458)
2
1+ Z 2 α2 / (n − δl )
236 5.25 Potenciales esféricamente simétricos

Esta expresión se puede desarrollar en potencias de α2 , obteniéndose (recuperando


las constantes ℏ y c )
mZ 2 α2 mZ 4 α4 3 mZ 4 α4
Enl = mc2 − 2
− 3
+ 4
+ O(α6 ) (5.459)
2n n (2l + 1) 8 n
El primer término corresponde a la energı́a en reposo, el segundo término corres-
ponde a la energı́a de ligadura no relativista; el tercero, al depender de l, rompe la
degeneración O(4) presente en el caso no-relativista.
No discutiremos las patologı́as que esconde la fórmula para la energı́a que resulta
de la ecuación de Klein-Gordon. Por ejemplo, la catástrofe que ocurre para Z >
137/2, cuando δl , y por ello la energı́a, se vuelven complejas. O la singularidad en el
origen que genera en la función de onda el potencial atractivo − (Z 2 α2 /r2 ). Tampoco
nos extenderemos sobre el pobre acuerdo con los resultados experimentales que tiene
la fórmula (5.459). Simplemente concluiremos que los efectos del spin, que no son
tenidos en cuenta por la ecuación de Klein-Gordon, tienen que ser importantes por lo
que los cálculos en base a la ecuación de Dirac no deberı́an presentar estos problemas.
En lo que sigue veremos como hacer contacto entre estos resultados de la ecuación
de Klein-Gordon para espinores de 4 componentes con los de la ecuación de Dirac.

5.25. Potenciales esféricamente simétricos


Consideremos la ecuación relativista para partı́culas de spin 1/2 en un potencial
central, de la forma V (r) = V (|r|). Tendremos
eA0 = V (r), A = 0, (5.460)
Es conveniente escribir la ecuación de Dirac en el lenguaje de las matrices α y β, y
si buscamos soluciones estacionarias, de la forma, Ψ(r, t) = ψ(r)e−iEt/ℏ , tenemos la
ecuaciónen la forma HΨ = EΨ, donde el Hamiltoniano de Dirac es
H = cα · p − βmc2 + V (r). (5.461)
Este Hamiltoniano es invariante frente a rotaciones y reflexión espacial,
[H, J ] = [H, P ] = 0, (5.462)
de manera que buscaremos autofunciones de momento angular y paridad bien defi-
nidos.
Para separar la parte radial de la angular el término de momento α · p, conviente
introducir el momento radial
!
1 ∂ ∂ 1
pr = −iℏ r = −iℏ + . (5.463)
r ∂r ∂r r
Mecánica cuántica Relativista 237

Para escribir al Hamiltoniano de Dirac en términos de pr , hagamos lo siguiente:


dado que las matrices α satisfacen el álgebra de SU(2), al igual que las σ,

[αi , αj ] = 2iϵijk αk (5.464)

y el álgebra de Clifford,
{αi , αj } = 2δij , (5.465)
verifican la relación
αi αj = δij + 2iϵijk αk . (5.466)
De aquı́ se sigue que para dos vectores arbitrarios a y b se cumple que

(α · a)(α · b) = a · b + iα · (a × b) (5.467)

y por lo tanto, vale para r y p:


(α · r)(α · p) = r · p = iα · (r × p)
(5.468)
= r · p + iα · L.

Si multiplicamos a izquierda por (α · r) entonces obtenemos


1
α·p= (α · r)[r · p + iα · L] (5.469)
r2
1 i
= 2
(α · r)(r · p) + 2 (α · r)(α · L) (5.470)
r r
1 i
= 2
(α · r)(r · p) + 2 [r · L + iα(r × L)] (5.471)
r r
1 i
= 2
(α · r)(r · p) + 2 [iα · (r × L)] (5.472)
r r
1 2S · L
= 2
(α · r)pr + i(ℏ + ) (5.473)
r ℏ
donde usamos que r · ∇ = r∂/∂r. Además

(r × L)i = [r × (r × p)]i = rj ri pj − r2 pi . (5.474)

5.26. Potencial coulombiano


Pudimos conectar los niveles de energı́a de átomos hidrogenoides según resultan
de la ecuación de Schrödinger con los que se obtienen para la ecuación de Klein-
Gordon en el mismo potencial coulombiano. Podemos hacer lo mismo en el caso de
la ecuación de Dirac. Para comenzar, notemos que el momento angular total J ,

J = L + S, (5.475)
238 5.26 Potencial coulombiano

donde el operador de spin está representado por



S= Σ, (5.476)
2
conmuta con el hamiltoniano,
[H, J ] = 0. (5.477)
Conviene entonces trabajar en los subespacios con de estados |jml⟩,

J 2 |jml⟩ = j(j + 1) |jml⟩ , j = 1/2, 3/2, . . . , (5.478)


L2 |jml⟩ = l(l + 1) |jml⟩ , l = j ± 1/2 = l± , (5.479)
3
S 2 |jml⟩ = ℏ |jml⟩ , (5.480)
4
Jz |jml⟩ = m |jml⟩ , −j ⩽ m ⩽ j, (5.481)

Es decir, calcular ⟨jml|H|jml⟩. Ahora bien, dado que estos autoestados tienen una
paridad definida, ligada a l36 , tendremos que los elementos de matriz del operador
hermı́tico σ · r̂ (de paridad impar) se anulan entre estados con el mismo l,

⟨jml± |σ · r̂|jml± ⟩ = 0 (5.482)

Además, se tiene que (σ · r̂)2 = 1. Usaremos la clausura de la base de estados


elegidos X
|jml± ⟩ ⟨jml± | = 1 (5.483)
±

para insertarla en

1 = (σ · r̂)2 =
X
σ · r̂ |jml± ⟩ ⟨jml± | σ · r̂. (5.484)
±

Ahora bien, partiendo de la normalización 1 = ⟨l− | l− ⟩y usando lo anterior se tiene


D E
1 = ⟨l− | l− ⟩ = l− (σ · r̂)2 l− = ⟨l− |σ · r̂|l+ ⟩ ⟨l+ |σ · r̂|l− ⟩ = ⟨l+ |σ · r̂|l− ⟩2
(5.485)
donde hemos usado la ec. (5.482),

⟨jml± |σ · r̂|jml± ⟩ = 0 (5.486)

para cancelar los brackets entre estados + + y − −y, además, que las matrices de
Pauli son, por supuesto, hermı́ticas.
36
La parte angular de los kets, proyectados en la representación de coordenadas son armónicos
esféricos que, ante un cambio de paridad r → −r, que corresponde en coordenadas esféricas a
(r, θ, φ) → (r, π − θ, φ + π), satisfacen que Ylm (θ, φ) = (−1)l Ylm (π − θ, φ + π).
Mecánica cuántica Relativista 239

De la ecuación (5.485) se tiene finalmente

⟨l+ |σ · r̂|l− ⟩ = 1 (5.487)

Dada la ecuación (5.446), para los estados estacionarios de la ecuación de segundo


orden que deriva de la de Dirac usando el “truco” (a + b)(a − b)
!
∂2 2 ∂ L2 Z 2 α 2 Zα 2Zαϵ  2 
− 2− + 2 − 2 ± i 2 σ · r̂ − − E − m2 ψ ± = 0. (5.488)
∂r r ∂r r r r r

Los brackets del tercero, cuarto y quinto término puede escribirse ası́:
D   E
jml± | L2 − Z 2 α2 ∓ iZασ · r̂ |jml± =
   
1 3
j+ 2
j+ 2
− Z 2 α2 ∓iZα
 
1

1
 . (5.489)
∓iZα j− 2
j+ 2
− Z 2 α2

Calculemos los autovalores Λ de esta matriz. Si escribimos a Λ en la forma habitual


de los autovalores de momento angular, Λ = λ(λ + 1), se obtiene
1
 
λ= j± − δj (5.490)
2
con δj dado por
s
2
1 1 Z 2 α2
  
δj = j + − j+ − Z 2 α2 ≈ + O Z 4 α4 (5.491)
2 2 2j + 1
Como en el caso de Klein-Gordon, el rol de l en el caso no relativista es aquı́
jugado por λ, que está corrido en δj . Para que el parámetro n′ que hacı́a, al tomar
valores enteros, que se cortara la serie infinita de la parte radial de la función de
onda en el caso no-relativista siga siendo un entero, (n′ = n + (l + 1)), como l está
corrido en δj , ası́ deberá estarlo n :

n′ = (n − δj ) − λ − 1 (5.492)

Como n′ ⩾ 0, se tendrá que


3
j ⩽n− 2
si λ = j + 12 − δj
1 (5.493)
j ⩽n− 2
si λ = j − 21 − δj

Podemos ahora seguir exactamente el camino que en el caso de Klein-Gordon, nos


llevó a la fórmula para la energı́a de los niveles de los átomos hidrogenoides. Es decir,
el mismo corrimiento (5.452) que nos permitı́a pasar de la ecuación de Schrödinger
240 5.26 Potencial coulombiano

a la de Klein-Gordon sirve ahora para pasar a la de Dirac siempre que utilicemos la


fórmula (5.491) para δj , pues en ella está tenido en cuenta el término de spin adicional
en Dirac. Entonces, tomando la fórmula de Balmer y haciendo los reemplazos
n → n − δj (5.494)
ϵ
α→α (5.495)
m
ϵ − m2
2
ϵ→ (5.496)
2m
que permitieron escribir la fórmula para los niveles de energı́a a partir de la modifi-
cación de la fórmula de Balmer, tendremos ahora
mc2
En,j = r   (5.497)
2
1+ Z 2 α2 / (n − δj )

que formalmente coincide con la fórmula (5.458) para el caso de Klein-Gordon, pero
con δj dado en este caso por (5.491)
s
2
1 1

δj = j + − j+ − Z 2 α2 . (5.498)
2 2
Vemos que la energı́a no depende de l de manera que en principio habrá una
degeneración de los niveles. Para cada valor de j hay dos valores posibles de l, l =
j ± 1/2 excepto en el caso en que j = n − 1/2 en que l = n − 1 (la otra posibilidad
llevarı́a a n = l siendo que l ⩽ n − 1. Salvo para este caso habrá entonces una
degeneración doble de los niveles.
Desarrollando en potencias de α2 tendremos
mc2 Z 2 α2 mc2 Z 4 α4 3 mc2 Z 4 α4
En,j ≈ mc2 − − + + ... (5.499)
2n2 n3 (2j + 1) 8 n4
con n = 1, 2 . . . y j = 1/2, 3/2, . . . , n − 1/2.
Vemos entonces que, para un dado n, diferentes valores de j implican diferentes
valores de la energı́a de los niveles. Esto produce la llamada estructura fina (por ello
a la constante α se la llame constante de estructura fina).
Queda, como vemos, una degeneración de estados que se distinguen por su mo-
mento angular orbital l, que puede ser j ±1/2 excepto para el caso en que j = n−1/2
en el que l = n − 1.
Para tener una idea de la magnitud del desdoblamiento en niveles con el mismo
n y j diferente, consideremos el caso en que Z = 1; n = 2; j = 1/2, 3/2; l = 1
(correspondiendo este valor a la letra P en la notación espectroscópica). Se tiene
    mα4
ϵ 2P3/2 − ϵ 2P1/2 ≈ = 4,53 × 10−5 eV → 10,9GHz (5.500)
32
Mecánica cuántica Relativista 91241

2P3/2

2S1/2 estructura fina


10.9 GHz
2P1/2

triplete

1S1/2 estructura hiperfina


1420 MHz
singulete

En la figura se representan los niveles de energı́a más bajos, utilizando la notación


espectroscópica nlj .

5.27. Interpretaciones de las soluciones de energı́a


negativa
En el final de esta clase abandonaremos la ideologı́a del avestruz y enfrentaremos
el problema de explicar cómo pueden existir soluciones de la ecuación de Dirac con
energı́a negativa aún para el caso de partı́culas libres.
Para ello, nos basaremos en la explicación intuitiva propuesta por Dirac en los
años 30, basada en la siguiente suposición: Todos los niveles de energı́a negativa
están ocupados en el estado fundamental, que llamaremos estado de vacı́o. Si ahora
consideramos un electrón libre, no podrá estar en ninguno de los estados de energı́a
negativa porque todos ellos están ocupados y el principio de exclusión de Pauli debe
ser respetado también para estos infinitos niveles de energı́a negativa. Es por ello
libre deberá necesariamente estar en un estado de energı́a po
siendo que está libre de toda interacción, será un estado estab
precisamente, escribe Dirac que:

all the states of negative energy are occupied except perhaps a


242 5.27 Interpretaciones de las soluciones de energı́a negativa
small velocity
que el electrón libre deberá necesariamente estar en un estado de energı́a positiva y,
Por interacción,
siendo que está libre de toda supuesto,será
esta propuesta
un estado [Link]́ inmediatamente gra
Más precisamente,
escribe Dirac que: ficultades: un problema obvio es cómo explicar la infinita dens

...all the states carga implicada


of negative energy arepor los omnipresentes
occupied electrones
except perhaps a few of small de energı́a n
velocity. Como respuesta Dirac propuso reinterpretar la densidad que
en las ecuaciones de Maxwell como el apartamiento del estado
Por supuesto, esta propuesta enfrentó inmediatamente grandes dificultades: un
trificación del universo.
problema obvio es cómo explicar la infinita densidad de carga implicada por los
omnipresentes electronesEn la interpretación
de energı́a negativa. Comode Dirac,Dirac
respuesta los propuso
electronesrein- que “tapan” t
terpretar la densidadestados
que aparecedeenenergı́a
las ecuaciones de Maxwell
negativa, como el apartamiento
pueden ser eyectados de ellos s
del estado de electrificación del universo.
excita. La energı́a de excitación debe ser suficiente como para
En la interpretación de Dirac, los electrones que “tapan” todos los estados de
2
brecha
energı́a negativa, pueden (el “gap”)
ser eyectados de si2mc
de ellos se los. excita.
Para Laque ello desuceda
energı́a exci- se los puede
2
por ejemplo
tación debe ser suficiente como parahaciendo que(elabsorban
saltar la brecha la energı́a
“gap”) de 2mc . Para quede un fotón que
ello suceda se los puede excitar por ejemplo haciendo que absorban la energı́a de un
con uno de ellos. Tal proceso se representa en la figura siguient
fotón que choque con uno de ellos. Tal proceso se representa en la figura siguiente:

mc2

-mc2

fotón

electrón de energía
negativa que es
excitado y salta a
un estado de
energía positiva

Al eyectarse un electrón de ese mar de electrones de energı́a negativa (“mar de


Dirac”), queda en éste un agujero (ausencia de una partı́cula con carga negativa)
que puede interpretarse como una partı́cula de carga positiva. Un proceso tal se
puede graficar ası́:
Se puede interpretar entonces al agujero como una verdadera partı́cula con carga
positiva.
(“mar de Dirac”), queda en éste un agujero (ausencia de
con carga negativa) que puede interpretarse como una
carga positiva. Un proceso tal se puede graficar ası́:
Mecánica cuántica Relativista 243

e-

e+

Señala Pais [10], fı́sico y biógrafo de Dirac que este, inicialmente, no vio clara-
Se puede interpretar entonces al agujero como una ver
mente lo que sucedı́a: a principios de 1928 propuso simplemente descartar la solución
con energı́a negativa. En junio de ese año admitió en una conferencia que no se la
cula con carga positiva.
podı́a ignorar y calificó por ello a su ecuación como aproximada. Hacia principios
Señala Pais [10], fı́sico y biógrafo de Dirac que este, ini
de 1929 , junto con Weyl, comienzó a especular que la solución de energı́a negativa,
como podı́a verse como una partı́cula con carga positiva, corresponderı́a a un protón
vio claramente lo que sucedı́a: a principios de 1928 propuso
y pensó que la masa de su ecuación debı́a ser un promedio de las masas del electrón
y del protón (!!). De hecho, el tı́tulo de su trabajo en 1930 era A theory of electrons
descartar la solución con energı́a negativa. En junio de es
and protons [11]. Recién en mayo de 1931 descartó esto y escribió , en lo que él llamó
en una conferencia que no se la podı́a ignorar y calificó
a small step forward (!!!) [12]:

A hole,ecuación como
if there were one, wouldaproximada. Haciaunknown
be a new kind of particle, principios
to experi- de 1929, jun
mental physics, having the same mass and opposite charge of the electron.
comienzó a especular que la solución de energı́a negativa
Antes verse
de fin decomo una
año (y de que partı́cula
Dirac cumplieracon carga
29 años) Carlpositiva,
Anderson, quecorresponderı́
aparentemente ignoraba la teorı́a de Dirac, anunció evidencia experimental para el
y pensó
anti-electrón o positrón que lapor
sugerido masa
Dirac. de su ecuación
Se trataba debı́a
de la observación de la ser
traza un promedio
dejada pordel rayoselectrón y del aprotón
cósmicos sometidos un campo(!!). De hecho,
magnético, el tı́tulo
en una cámara de de su tra
Wilson. La dirección en que se curvaba la traza correspondı́a a una partı́cula con
eray masa
carga positiva A theory
mucho menorof que
electrons
un protón. and protons [11]. Recién en m
Una vez creado el agujero, un electrón con energı́a positiva (el mismo que fuera
eyectado, udescartó esto alyestado
otro), puede “caer” escribió , en
con energı́a lo que
negativa eél llamó
correspondiente, que “ a small s
(!!!)
se encontraba [12]: Se aniquilan ası́ el electrón que cae y el positrón asociado
desocupado.
con el agujero; la energı́a disponible al desaparecer el par electrón-positrón se ma-
nifiesta como emisionón de un fotón. Usando nuevamente un diagrama, tendrı́amos,
para el proceso completo, en el cual un fotón “crea” originalmente un par electrón-
A hole, if there were one, would be a new kind of part
positrón, que luego se aniquila dando un fotón:
to experimental physics, having the same mass and oppo
De hecho, un proceso como el de la figura anterior puede suceder aún si el
fotón tiene energı́a menor que la mı́nima necesaria (Emin = 2mc2 ) para crear un
the electron.
par electrón-positrón. Esto sucede cuando un campo electromagnético produce un
reacomodamiento de carga dando origen a una “polarización del vacı́o”. Esto, que

Antes de fin de año (y de que Dirac cumpliera 29 años


son, que aparentemente ignoraba la teorı́a de Dirac, anun
experimental para el anti-electrón o positrón sugerido p
trataba de la observación de la traza dejada por rayos cós
mismo que fuera eyectado, u otro), puede “caer” al estado con energı́a
negativa correspondiente, que se encontraba desocupado. Se aniquilan
ası́ el electrón que cae y el positrón asociado con el agujero; la energı́a
disponible al desaparecer el par electrón-positrón se manifiesta como
emisionón de un fotón. Usando nuevamente un diagrama, tendrı́amos,
para el proceso completo, en el cual un fotón “crea” originalmente un
244 parInterpretaciones
5.27 electrón-positrón,
de las que luego de
soluciones se energı́a
aniquila dando un fotón:
negativa

e-

e+

inicialmente fue una predicción teórica, se confirmó experimentalmente a través de


De hecho, un proceso como el de la figura anterior puede suceder aún
la existencia del corrimiento de niveles al que nos referimos más arriba (de Lamb),
que puede ser si el fotóncontiene
descripto energı́a
precisión, menor
en el marcoquede lalateorı́a
mı́nima necesaria
cuántica (Emin = 2mc2 )
de campos
cuando diagramasparacomocrearelunanterior
par electrón-positrón.
son tenidos en cuenta Esto alsucede cuando
estudiar un campo elec-
los niveles
de energı́a de tromagnético produce
un electrón (cuántico) en un reacomodamiento
el campo electromagnético de(cuántico)
carga dandodel origen a
núcleo. una “polarización del vacı́o”. Esto, que inicialmente fue una predicción
Una vez que se acepta
teórica, que partı́culas
se confirmó masivas como el electrón
experimentalmente a travésy el
depositrón
la existencia del
se pueden aniquilar,
corrimiento de niveles al que nos referimos más arriba (dedeLamb), que
la descripción de las partı́culas en términos de funciones
onda pierde consistencia. En efecto, ¿qué se hace por ejemplo con la probabilidad
puede ser descripto con precisión, en el marco de la teorı́a cuántica de
de encontrar a una partı́cula en algún lugar del espacio en un instante t2 , expresada
en términos decampos cuando
la función diagramas
de onda, como fue
si la partı́cula el anterior
aniquiladason en tenidos
un instanteen cuenta al
t1 < t2 ? Sucedeestudiar los términos
que en los niveles planteados
de energı́apor deDirac
un electrón (cuántico)
al postular la existenciaen el campo
de un mar de electromagnético
infinitas partı́culas con(cuántico) del núcleo.
energı́a negativa, debe plantearse una teorı́a
de muchas partı́culas y no de una única en presencia de un potencial. Notemos que
con el abandono del concepto de función de onda de una partı́cula como medio para
Una vez que se acepta que partı́culas masivas como el electrón
describir electrones relativistas, la razón por la que se descartaba a la ecuación de
y el positrón se pueden aniquilar, la descripción de las partı́culas en
Klein-Gordon deja de existir. De hecho, como dijimos, la ecuacion de Klein-Gordon
términosendeotro
descibe correctamente, funciones
contexto,de onda pierde
partı́culas consistencia.
relativistas En efecto,
de spin cero. Pero ¿qué se
hace
la interpretación de por
Diracejemplo
sobre loscon la probabilidad
estados de encontrar
de energı́a negativa a una
deja de ser partı́cula en
válida
pues los bosonesalgún lugar delel espacio
no obedecen principioen deun instante
exclusión de tPauli
2 , expresada
y no habrı́aenrazón
términos de la
entonces para función
que el mar de Dirac de bosones estuviera “lleno”.
de onda, si la partı́cula fue aniquilada en un instante t1 < t2 ?
Será necesario entonces
Sucede que en construir una verdadera
los términos teorı́a por
planteados de muchas
Dirac alpartı́culas
postular la exis-
para acomodartencia
a partı́culas
de un mar de infinitas partı́culas con energı́a logra
y antipartı́culas de manera consistente. Esto se negativa, debe
luego de la llamada “segunda cuantificación”, que lleva a la introducción de campos
cuantificados capaces de crear o aniquilar partı́culas. La formulación de la teorı́a de
campos hace completamente innecesaria la interpretación de las antipartı́culas como
el positrón como agujeros en un mar. Julian Schwinger, uno de los que desarrolló
justamente la electrodinámica cuántica, escribió [13]:
La imagen de un mar infinito de electrones de energı́a negativa es hoy considerada
una curiosidad histórica, y olvidada.
Concluimos esta sección representando el espectro de energı́as que obtuvimos al
estudiar la ecuación de Dirac para electrón en el caso de un potencial coulombiano
atractivo (sin tener en cuenta las correcciones de la electrodinámica cuántica). En
la parte de la izquierda se representan, con rectas inclinadas, los posibles estados
de un electrón (la parte inferior corresponde a los electrones de energı́a negativa del
99

Mecánica cuántica Relativista 245

La figura
“marmuestra
de Dirac”eloespectro de de
un electrón energı́a
Dirac de
libreuncon
electrón
energı́a de Dirac:Ena la
positiva. la parte
izquierda
de en el
la derecha,
caso libre, en el cuando
derechoactúa
en elel caso
potencial el potencialCoulombiano
del potencial de Coulomb sobre un electron,
atractivo. Nótese que
vemos que el espectro comprende una franja continua de energı́a positiva que se
mc2 =extiende
511 kev mientras que el nivel ms bajo del atomo de hidrógeno
desde mc hasta +∞, una serie discreta de energı́a positiva inferior a mc2
2 corresponde
a una (el
energı́a deobservado
espectro 13.6 eV en el átomo de hidrógeno) y una franja continua de energı́a
negativa desde −mc2 hasta −∞.
La figura muestra el espectro de energı́a de un electrón de Dirac: a la izquierda en
Conjugación de carga
el caso libre, en el derecho en el caso del potencial Coulombiano atractivo. Nótese que
mc2 = 511 KeV mientras que el nivel más bajo del átomo de hidrógeno corresponde
a una energı́a de 13,6 eV
La teorı́a de agujeros para explicar el rol de los estados de energı́a ne-
gativa de la teorı́a relativista de Dirac para el electrón, implica la exis-
tencia5.28. Conjugación
de partı́culas con la misma de carga masa, el mismo spin y carga opuesta,
los electrones
La teorı́a yde positrones. La ecuación
agujeros para explicar el rol de losde Dirac
estados debenegativa
de energı́a entonces
de la admi-
teorı́a relativista de Dirac para el electrón, implica la existencia de partı́culas con la
tir una nueva simetrı́a que corresponda al intercambio entre partı́cula
misma masa, el mismo spin y carga opuesta, los electrones y positrones. La ecuación
(electrón)
de Diracydebe
antipartı́cula
entonces admitir(positrón).
una nueva simetrı́a que corresponda al intercambio
entre partı́culaentonces
Busquemos (electrón) y una
antipartı́cula (positrón).
transformación que pase de un espinor ψ,
Busquemos entonces una transformación que pase de un espinor ψ, que describa C
que describa
una partı́culaunaconpartı́cula con auna
una dada carga, dada carga,
otro espinor a otrouno
ψ c que describe espinor
con cargaψ que
describe uno
opuesta. con
Estos cargadeben
espinores opuesta. Estos
obedecer las espinores
siguientes ecuacionesdeben obedecer
(tomamos unida- las
des naturales, c = 1 y ℏ = 1)
siguientes ecuaciones
(iγ µ ∂µ − eγ µ Aµ − m) ψ = 0 para el electrón (5.501)
(iγ µ ∂µ −(iγ
eγµ∂µµA+µeγ− µ
Am) ψ ψc ==0 0para el positrón
µ − m) para el electrón
(5.502) (7.32)
µ µ
(iγ una
Buscamos ∂µ + eγ Aµ −
transformación m) ψ C = 0 para el positrón (7.33)
c
ψ→ψ (5.503)
Buscamos
que sea una
local ytransformación
que, hecha dos veces sucesivamente deje a ψ sin cambiar, a menos

ψ → ψC (7.34)

que sea local y que, hecha dos veces sucesivamente deje a ψ sin cam-
biar, a menos de una fase inobservable. Para obtenerla, tomemos (7.32),
246 5.28 Conjugación de carga

de una fase inobservable. Conjuguemos la ecuación de Dirac (5.501),

[γ µ∗ (i∂µ + eΛµ ) + m] ψ ∗ = 0. (5.504)

Supongamos que logramos encontrar una matriz C no singular tal que

γ µ∗ = −C −1 γ µ C. (5.505)

Al reemplazar en (5,504) tenemos


h i
−C −1 γ µ Q (i∂µ + eAµ ) + m ψ ∗ = 0 (5.506)

Luego, multiplicando a izquierda por −C llegamos a

[γ µ (i∂µ + eΛµ ) − m] Cψ ∗ = 0 (5.507)

que es la ecuación buscada siempre que identifiquemos al espinor conjugado de carga


con
ψ c = Cψ ∗ . (5.508)
Curiosamente, la forma de la matriz C no es independiente de la representación.
Tanto en las representaciones de Dirac como quiral, la única matriz γ imaginaria
es la γ 2 . En esas representaciones podemos tomar entonces C = −iγ 2 , a menos de
una fase arbitraria. Siempre podemos cambiar de representación usando el teorema
fundamental de Pauli.
Es importante analizar la acción de C sobre una solución con energı́a negativa,
spin hacia abajo y que, por simplicidad, corresponda a una partı́cula en reposo: en
la representación de Dirac tenemos (a menos de la normalización)

0
 
0
ψ= exp(imt)   (5.509)
 
0
1

El conjugado de carga será, de acuerdo a lo anterior

1
 
0
ψ c = −iγ 2 ψ ∗ = exp(−imt) 
 . (5.510)

0
0

Luego, el conjugado de carga de un electrón de energı́a negativa y spin hacia abajo


es un electrón de energı́a positiva y spin hacia arriba.
Mecánica cuántica Relativista 247

5.29. Fermiones de Majorana


El espinor ψ es una cantidad compleja. Debe serlo porque la representación S[Λ]
tı́picamente lo es, de manera que si ψ fuera real en algún sistema de referencia, al
hacer una transformación de Lorentz dejarı́a de serlo. Sin embargo, hay una forma
de hacer que el espinor permanezca real en todos los sistemas de referencia. Lo más
simple es utilizar la representación de Majorana (5.162),
! ! ! !
0 σ2 iσ 3 0 0 −σ 2 −iσ 1 0
γ0 = , γ 1
= , γ 2
= , γ 3
= (5.511)
σ2 0 0 iσ 3 σ2 0 0 iσ 1

en la que las matrices γ son reales, (γ µ )∗ = γ µ . Esto significa que los generadores
(5.235) Σµν = 4i [γ µ , γ ν ] son imaginarios puros, y la transformación (5.234) S[Λ] =
i µν
e− 2 ωµν Σ es real. Entonces en esta base del álgebra de Clifford podemos trabajar
con un espinor real, imponiendo la condición

ψ = ψ∗ (5.512)

que se preserva bajo transformaciones de Lorentz. Estos espinores se llaman espinores


de Majorana.
¿Qué ocurre entonces si usamos una representación arbitraria para las matrices
γ? ¿Qué aspecto tendrı́a la condición de Majorana? Anteriormente definimos el
espinor conjugado de carga del espinor de Dirac como

ψ c = Cψ ∗ (5.513)

y mostramos que si ψ satisface la ecuación de Dirac entonces ψ c también la satisface


(en presencia de un campo Aµ hay que invertir la carga). Es decir, que ψ c se trans-
forma como corresponde frente a una transformación de Lorentz. Si ψ → S(Λ)ψ
entonces ψ c → S(Λ)ψ c . En consecuencia, podemos imponer la condición

ψc = ψ (5.514)

que define al espinor de Majorana, y que se mantiene en todos los sistemas de


referencia. En la representación de Majorana las matrices de Dirac son imaginarias
puras, y entonces CMajorana = 1, y la condición de Majorana ψ = ψ c se convierte en
ψ = ψ∗.
El espinor de Majorana da lugar, en su versión cuántica, a un fermión que es su
propia antipartı́cula, lo mismo que para un campo escalar.
248 5.30 Inversión Temporal

5.30. Inversión Temporal


La inversión temporal es la operación según la cual las coordenadas espacio-
temporales cambian de la siguiente manera:
r→r (5.515)
t → −t, (5.516)
que puede escribirse
−1 0 0 0
 
 0 1 0 0
x′ν = Λν µ xµ , con ΛT =  . (5.517)
 
 0 0 1 0
0 0 0 1
con det ΛT = −1. Si escribimos ψ ′ (x′ ) ≡ ψ ′ (−t, r), a la solución transformada de la
ecuación de Dirac intentemos construirla en la forma
ψ ′ (x′ ) = T ψ ∗ (x) ⇒ ψ ∗ (x) = T −1 ψ ′ (x′ ) (5.518)
donde ψ ∗ satisface la ecuación de Dirac conjugada
(−iγ µ∗ ∂µ − mc)ψ(x)∗ = 0 (5.519)
y entonces, al escribir ∂µ = Λν µ ∂ν′ e introducir (5.518), tenemos
(−iγ µ∗ Λν µ ∂ν′ − mc)T −1 ψ ′ (x′ ) = 0. (5.520)
Multiplicamos a izquierda por T ,
(−iT γ µ∗ T −1 Λν µ ∂ν′ − mc)ψ ′ (x′ ) = 0, (5.521)
y entonces ψ(x′ ) será una solución de la ecuación de Dirac,
(iγ µ ∂µ′ − m)ψ ′ (x′ ) = 0, (5.522)
Si hallamos una matriz T que satisfaga
T γ µ∗ T −1 Λν µ = −γ ν . (5.523)
En la representación de Dirac y en la quiral, la única matriz imaginaria es γ 2 , y
entonces esa condición se escribe
T γ µ = γ µ T, µ = 0, 2 (5.524)
T γ µ = −γ µ T, µ = 1, 3. (5.525)
La matriz
T = iγ 1 γ 2 (5.526)
satisface las condiciones buscadas, y la transformación es antiunitaria. Observemos
que si introducimos un campo de gauge Aµ (x), bajo inversión temporal se relaciona
con A′µ (x′ ) en la forma A′0 (x′ ) = A0 (x) y A′i (x′ ) = −Ai (x), debido a que la corriente
cambia de signo bajo inversión temporal.
Mecánica cuántica Relativista 249

5.31. Transformada de Fourier discreta


Aunque ya la hemos usado informalmete, dedicaremos aquı́ unas lineas a definir la
transformada de Fourier discreta. Esta transformación nos resultará de gran utilidad
a lo largo del libro.
Consideremos una función f : R → R, definida sólo en un número finito n de
puntos xj , j = 0, . . . , n − 1, tal que fj = f (xj ). En tal caso es posible definir una
transformada discreta de Fourier f˜k de la siguiente forma:

1 n−1
f˜k = √ fj e−2πijk/n ,
X
k = 0, . . . , n − 1.
n j=0

Conocidos los n valores f˜k , los n valores fj pueden recuperarse exactamente mediante
la transformación inversa, dada por

1 n−1
f˜k e2πijk/n ,
X
fj = √ j = 0, . . . , n − 1
n k=0

Esto puede demostrarse fácilmente, reemplazando f˜k por su definición:


 
1 n−1 1 n=1 n−1
1 n−1
" #
′ ′
fj′ e−2πij k/n  e2πijk/n = e2πik(j−j ) = fj
X X X X
√ √ fj ′
n k=1 n j ′ =1 j ′ =0
n k=0

donde hemos utilizado el resultado



1 n−1 ′
1 j = j ′
e2πik(j−j )/n = δjj ′ = 
X
n k=0 ̸ j′
0 j=

válido para j, j ′ enteros. En efecto, si j = j ′ , e2πik(j−j )/n = 1 y
n−1

e2πik(j−j )/n = n,
X

k=0

mientras que si j ̸= j ′ (y |j − j ′ | < n)


n−1 ′
X
2πik(j−j ′ )/n 1 − e2πi(j−j )
e = =0
k=0 1 − e2πi(j−j ′ )/n

para j − j ′ entero.
Bibliografı́a

[1] Gordon Baym. Lectures on Quantum Mechanics. CRC Press, 1969.


[2] James Binney y David Skinner. The Physics of Quantum Mechanics. Oxford,
2014.
[3] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 1. Wiley, 2020.
[4] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 2. Wiley, 2020.
[5] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 3. Wiley, 2020.
[6] W. Greiner. Relativistic Quantum Mechanics. 3.a ed. Springer, 2000.
[7] David J. Griffiths. Introduction to Quantum Mechanics. 2.a ed. Pearson Pren-
tice Hall, 2005.
[8] L. D. Landau y E. M. Lifshitz. Quantum Mechanics. Non-relativistic Theory.
3.a ed. Vol. 3. Course of Theoretical Physics. Pergamon Press, 1977.
[9] Robert Littlejohn. Quantum Mechanics. 2019. url: http : / / bohr . physics .
[Link]/classes/221/1112/[Link].
[10] Alastair I. M. Rae. Quantum Mechanics. 4.a ed. IOP Publishing, 2002.
[11] J. J. Sakurai. Modern Quantum Mechanics. Addison-Wesley, 1994.
[12] Fidel Schaposnik. Mecánica Cuántica I. 2001.
[13] Ramamurti Shankar. Principles of Quantum Mechanics. 2.a ed. Springer, 1994.
[14] Ben Simons. Advanced Quantum Physics. 2009. url: [Link]
[Link]/∼bds10/[Link].
[15] David Tong. Kinetic Theory. 2012. url: [Link]
tong/[Link].
[16] David Tong. Topics in Quantum Mechanics. 2017. url: [Link]
[Link]/user/tong/[Link].

250
BIBLIOGRAFÍA 251

[17] Steven Weinberg. Lectures on Quantum Mechanics. Cambridge University


Press, 2013.

También podría gustarte