0% encontró este documento útil (0 votos)

65 vistas251 páginas

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

El documento 'Mecánica Cuántica II' de Aníbal Iucci aborda temas avanzados de la mecánica cuántica, incluyendo potenciales dependientes del tiempo, dispersión de partículas y partículas idénticas. Se exploran conceptos como la teoría de perturbaciones, la segunda cuantificación y la mecánica cuántica relativista. El índice detalla secciones específicas que cubren desde representaciones de interacción hasta la ecuación de Dirac.

Cargado por

f54166126

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

65 vistas251 páginas

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

Cargado por

f54166126

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Mecánica Cuántica II

Anı́bal Iucci

25 de abril de 2025
Índice general

1. Potenciales dependientes del tiempo 5

1.1. Representación de Interacción . . . . . . . . . . . . . . . . . . . . . . 8
1.2. Problemas con dos estados . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Resonancia magnética . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4. Teorı́a de perturbaciones: Serie de Dyson . . . . . . . . . . . . . . . . 14
1.5. Probabilidad de Transición . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6. Primer orden perturbativo . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.1. Potencial constante . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6.2. Perturbaciones armónicas . . . . . . . . . . . . . . . . . . . . 17
1.6.3. Análisis de la dependencia temporal . . . . . . . . . . . . . . . 18
1.6.4. Dependencia en energı́a . . . . . . . . . . . . . . . . . . . . . 19
1.6.5. Estados finales en el continuo . . . . . . . . . . . . . . . . . . 21
1.6.6. Conexión adiabática . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.7. Dispersión por un potencial . . . . . . . . . . . . . . . . . . . 25
1.7. Transiciones de segundo orden . . . . . . . . . . . . . . . . . . . . . . 28
1.8. Decaimiento del estado inicial . . . . . . . . . . . . . . . . . . . . . . 29
1.9. Interacción del campo electromagnético clásico con un sistema de
partı́culas cargadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.9.1. Absorción de la luz . . . . . . . . . . . . . . . . . . . . . . . . 34
1.10. Aproximación dipolar eléctrica . . . . . . . . . . . . . . . . . . . . . . 37
1.11. Reglas de selección . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.11.1. Transiciones prohibidas . . . . . . . . . . . . . . . . . . . . . . 41
1.12. Fórmula de Kubo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.13. Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a
de campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2. Dispersión de partı́culas 49
2.1. Condiciones de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2. Amplitud de dispersión y sección eficaz . . . . . . . . . . . . . . . . . 54
2.3. Funciones de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.1. Cálculo de la función de Green . . . . . . . . . . . . . . . . . 56

2
ÍNDICE GENERAL 3

2.4. Aproximación de Born . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.5. Ondas parciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.5.1. Determinación de corrimientos de fase . . . . . . . . . . . . . 67
2.5.2. Matriz de dispersión . . . . . . . . . . . . . . . . . . . . . . . 70
2.5.3. Extension analitica de la matriz de dispersion . . . . . . . . . 73
2.5.4. Propiedades de la matriz S . . . . . . . . . . . . . . . . . . . . 76
2.5.5. Resonancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.5.6. Dispersión a bajas energı́as . . . . . . . . . . . . . . . . . . . . 80

3. Partı́culas Idénticas 88
3.1. Permutaciones y simetrı́as . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Interacción de intercambio . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3. Partı́culas Independientes . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4. Átomos con dos electrones . . . . . . . . . . . . . . . . . . . . . . . . 101
3.5. El método del “campo autoconsistente” a vuelo de pájaro . . . . . . . 104
3.6. El método variacional de Hartree-Fock . . . . . . . . . . . . . . . . . 106
3.7. Cálculo perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

4. Segunda cuantificación 114

4.1. Espacio de Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.2. Operadores de creación y destrucción . . . . . . . . . . . . . . . . . . 118
4.2.1. Operadores de un cuerpo . . . . . . . . . . . . . . . . . . . . . 125
4.2.2. Mecánica estadı́stica cuántica en el gran canónico . . . . . . . 131
4.2.3. Operadores de dos cuerpos . . . . . . . . . . . . . . . . . . . . 132
4.3. Resolviendo con segunda cuantificación . . . . . . . . . . . . . . . . . 137
4.3.1. Autovalores y autoestados . . . . . . . . . . . . . . . . . . . . 137
4.3.2. Valores de expectación térmicos . . . . . . . . . . . . . . . . . 138
4.3.3. Transformaciones canónicas . . . . . . . . . . . . . . . . . . . 140
4.3.4. Ejemplo: Modelo tight binding . . . . . . . . . . . . . . . . . . 143
4.3.5. Términos anómalos . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4. Gas de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
4.5. Teorı́a cuántica de la radiación . . . . . . . . . . . . . . . . . . . . . . 156
4.6. Emisión y absorción de fotones por un átomo . . . . . . . . . . . . . 159

5. Mecánica cuántica Relativista 165

5.1. La ecuación de Klein-Gordon . . . . . . . . . . . . . . . . . . . . . . 165
5.2. La ecuación de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.3. Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 178
5.4. La ecuación de continuidad . . . . . . . . . . . . . . . . . . . . . . . . 184
5.5. Los valores posibles de N . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.6. Teorema fundamental de Pauli . . . . . . . . . . . . . . . . . . . . . . 189
4 ÍNDICE GENERAL

5.7. Formas explı́citas de las matrices de Dirac . . . . . . . . . . . . . . . 190

5.8. Invarianza relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.9. Transformación de Lorentz de la corriente . . . . . . . . . . . . . . . 193
5.10. El grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
5.11. Generadores y álgebra del grupo L↑+ . . . . . . . . . . . . . . . . . . . 196
5.12. El carácter de ψ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
5.13. Espinores quirales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.14. La solución de partı́cula libre . . . . . . . . . . . . . . . . . . . . . . 206
5.15. Spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
5.16. Helicidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.17. Paridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
5.18. Ecuación de Weyl: partı́culas de masa cero . . . . . . . . . . . . . . . 216
5.19. Quiralidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.20. Una interpretación fı́sica de las matrices de Dirac . . . . . . . . . . . 218
5.21. La ecuación de Dirac en presencia de un campo electromagnético . . 220
5.22. El lı́mite no-relativista . . . . . . . . . . . . . . . . . . . . . . . . . . 222
5.23. Invarianza de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
5.24. Átomos hidrogenoides . . . . . . . . . . . . . . . . . . . . . . . . . . 231
5.25. Potenciales esféricamente simétricos . . . . . . . . . . . . . . . . . . . 236
5.26. Potencial coulombiano . . . . . . . . . . . . . . . . . . . . . . . . . . 237
5.27. Interpretaciones de las soluciones de energı́a negativa . . . . . . . . . 241
5.28. Conjugación de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
5.29. Fermiones de Majorana . . . . . . . . . . . . . . . . . . . . . . . . . . 247
5.30. Inversión Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5.31. Transformada de Fourier discreta . . . . . . . . . . . . . . . . . . . . 249
Capı́tulo 1

Potenciales dependientes del

tiempo

Consideremos un sistema fı́sico con Hamiltoniano H0 , cuyos autovalores y auto-

vectores han sido hallados, y satisfacen la ecuación

H0 |n⟩ = En |n⟩. (1.1)

Por simplicidad supongamos que el espectro de H0 es discreto y no degenerado,

aunque las fórmulas que se obtengan se pueden generalizar en forma directa a estos
casos. Suponemos que H0 no depende del tiempo explı́citamente, y por lo tanto sus
autoestados son estados estacionarios.
A t = t0 se conecta un potencial dependiente del tiempo V (t) y el Hamiltoniano
entonces resulta
H(t) = H0 + V (t) (1.2)
Supongamos ademas que a t = t0 se prepara al sistema fı́sico en el estado |ψ0 ⟩;
no necesariamente este tiene que ser autoestado de H0 (aunque en muchos casos lo
será).
Entre t0 y t el sistema evoluciona de acuerdo a la ecuación de Schrödinger:

d
iℏ |ψ(t)⟩ = [H0 + V (t)] |ψ(t)⟩. (1.3)
dt
La solución que buscamos de esta ecuación diferencial de primer orden corresponde
al estado inicial
|ψ(t = t0 )⟩ = |ψ0 ⟩ (1.4)
y es única.
El problema consiste entonces en encontrar la solución a la ecuación (1.3) que
corresponde a la condición inicial (1.4). Como método general, podemos representar

5
6

al estado inicial tomando su expansión en la base de autoestados de H0 :

X
|ψ0 ⟩ = cn |n⟩ (1.5)
n

donde cn = ⟨n|ψ0 ⟩. Si se tratara de un problema independiente del tiempo, la evo-

lución temporal del estado serı́a
|ψ(t)⟩ = e−i(t−t0 )H/ℏ |ψ0 ⟩ = cn e−iEn (t−t0 )/ℏ |n⟩
X
(1.6)
n

con cn constantes (independientes de t). Resulta entonces razonable, en el caso de

una interacción dependiente del tiempo, proponer que los cn = cn (t) y entonces para
t > t0 escribir
cn (t)e−iEn (t−t0 )/ℏ |n⟩
X
|ψ(t)⟩ = (1.7)
n
Nótese que debido a la forma en que hemos separado la dependencia temporal:
El factor e−iEn (t−t0 )/ℏ está presente aún cuando V = 0, y
La evolución temporal de los cn (t) se debe solamente a V (t).
En seguida veremos que, con esta separación, las amplitudes cn (t) satisfacen una
ecuación diferencial muy simple. Pero antes hagamos un repaso sistemático de los
diferentes esquemas en los que puede estudiarse la dependencia temporal.
La evolución temporal de un dado sistema fı́sico, que en un instante inicial t0 se
encuentra en un estado
|ψ(t0 )⟩ ≡ |ψ0 ⟩ (1.8)
puede entenderse en dos esquemas diferentes:

Representación de Schrödinger (S)

En este esquema evolucionan los vectores de estado de acuerdo a
|ψ(t)⟩S = U (t, t0 ) |ψ0 ⟩ (1.9)
donde U(t, t0 ) es el operador de evolución temporal, que satisface una ecuación de
Schrödinger
∂
iℏ U(t, t0 ) = HU(t, t0 ) (1.10)
∂t
que induce a su vez una ecuación del mismo tipo para los kets de estado:
∂
iℏ|ψ(t)⟩S = H|ψ(t)⟩S . (1.11)
∂t
En este esquema, los operadores no dependen del tiempo
AS (t) = A (t0 ) ≡ A, (1.12)
Potenciales dependientes del tiempo 7

Representación de Heisenberg (H)

En esta los estados no evolucionan,

|ψ(t)⟩H = |ψ0 ⟩ (1.13)

mientras que los obervables dependen del tiempo según1

AH (t) = U † (t0 , t) A (t0 ) U (t0 , t) , (1.16)

y que obedecen la ecuación de movimiento de Heisenberg:

dAH 1
= [AH , H] (1.17)
dt iℏ

El valor de expectación ⟨A⟩ es obviamente el mismo en ambas representaciones:

D E
S ⟨ψ(t) |AS | ψ(t)⟩S = ψ0 U † (t, t0 )AS U(t, t0 ) ψ0 (1.18)
= H ⟨ψ(t) |AH (t)| ψ(t)⟩H (1.19)
≡ ⟨A⟩(t) (1.20)

En el caso en que el Hamiltoniano no depende del tiempo, la solución de la

ecuación (1.10) se obtiene inmediatamente en la forma

U(t, t0 ) = e−iH(t−t0 )/ℏ . (1.21)

Lo cual permite obtener inmediatamente la dinámica de estados, observables y va-

lores de expectación.
En la naturaleza, sin embargo, hay muchos sistemas cuánticos que sı́ dependen
del tiempo (iluminar un átomo, aplicar voltaje a un metal, absorción y emisión de la
luz, etc) y la energı́a del sistema no se va a conservar. En ese caso, el Hamiltoniano
depende explı́citamente del tiempo, H = H(t), y se vuelve dificultoso hallar una
expresión para el operador de evolución temporal. Puede mostrarse que esa expresión
1
Los estados de la base |n⟩ no cambian en el esquema de Schrödinger. En el esquema de Hei-
senberg, la ecuación de autovalores
A|a⟩ = a|a⟩ (1.14)

se convierte en
AH (t)U † (t, t0 )|a⟩ = a U † (t, t0 )|a⟩ (1.15)

de modo que los kets de la base evolucionan con el “signo contrario” |a(t)⟩H = U † (t, t0 )|a⟩. Sólo
los autoestados de H no evolucionan.
8 1.1 Representación de Interacción

está dada por la serie de Dyson:

ˆ
i t ′
U (t, t0 ) = 1 − dt H (t′ )
ℏ t0
ˆ ˆ ′
−i 2 t ′ t ′′

+ dt dt H (t′ ) H (t′′ )
ℏ t0 t0
.. (1.22)
.
ˆ ˆ ′ ˆ t(n−1)
−i n t ′ t ′′

+ dt dt · · · dt(n) H (t′ ) H (t′′ ) · · · H(t(n) )
ℏ t0 t0 i0
+ ···

1.1. Representación de Interacción

Antes de discutir la ecuación diferencial para los cn (t) es conveniente introducir
la representación de interacción (I). Igual que antes: un sistema fı́sico que en t0
está en el estado |ψ0 ⟩, en un tiempo t posterior estará en el estado |ψ(t)⟩S . Definimos

|ψ(t)⟩I = e+iH0 (t−t0 )/ℏ |ψ(t)⟩S (1.23)

donde |⟩I representa la misma situación fı́sica que |⟩S pero en la RI. Análogamente,
en la RI, los operadores se definen como:

AI (t) = eiH0 (t−t0 )/ℏ AS (t)e−iH0 (t−t0 )/ℏ (1.24)

En particular (VS (t) ≡ V (t)) :

VI (t) = eiH0 t/ℏ V (t)e−iH0 t/ℏ (1.25)

Vamos a deducir ahora la ecuación que caracteriza la evolución temporal de

|ψ(t)⟩I . Tomando la derivada temporal de (1.23) y haciendo uso de la ecuación de
Schrödinger (1.11)
∂
iℏ |ψ(t)⟩S = (H0 + V ) |ψ(t)⟩S (1.26)
∂t
resulta,

∂ ∂ iH0 (t−t0 )/ℏ

iℏ |ψ(t)⟩I = iℏ e |ψ(t)⟩S
∂t ∂t
= −H0 eiH0 (t−t0 )/ℏ |ψ(t)⟩S + eiH0 (t−t0 )/ℏ (H0 + V ) |ψ(t)⟩S (1.27)

= eiH0 (t−t0 )/ℏ V e−iH0 (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |ψ(t)⟩S
Potenciales dependientes del tiempo 9

Es decir que:
∂
iℏ |ψ(t)⟩I = VI (t) |ψ(t)⟩I (1.28)
∂t
También se puede demostrar que para un observable A (que no depende explı́cita-
mente del tiempo en la RS) vale:

dAI 1
= [AI , H0 ] , (1.29)
dt iℏ
que es una ecuación del tipo Heisenberg con H reemplazado por H0 . En resumen,
la RI en muchos aspectos es intermedia entre la RS y la RH.
Trabajemos la evolución temporal del estado, ahora en la representación de in-
teracción:

|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = cn (t)e−iEn (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |n⟩
X
(1.30)
n
X
= cn (t)|n⟩. (1.31)
n

donde usamos la expansión (1.7) de |ψ(t)⟩. Obserevamos que al trabajar en la repre-

sentación de interacción nos sacamos de encima de (1.7) las fases e−iEn (t−t0 )/ℏ por
completo. Al multiplicar eeste estado a izquierda por ⟨n|, los coeficientes se escriben

cn (t) = ⟨n|ψ(t)⟩I . (1.32)

Ya podemos escribir la ecuación diferencial para los cn (t). Tomemos la ecuación

de Schrödinger en RI, (1.28) y multipliquemos a izquierda ambos miembros por ⟨n|,
obtenemos:
∂ X
iℏ ⟨n|ψ(t)⟩I = ⟨n |VI (t)| m⟩ ⟨m|ψ(t)⟩I . (1.33)
∂t m

Aquı́ los elementos de matriz del potencial pueden deacomponerse en la forma:

⟨n|VI (t)|m⟩ = ⟨n|eiH0 (t−t0 )/ℏ V (t)e−iH0 (t−t0 )/ℏ |m⟩ = ⟨n|V (t)|m⟩ei(En −Em )(t−t0 )/ℏ .
(1.34)
Finalmente, insertando 1.32 y 1.34 en 1.33 se encuentra la ecuación buscada,

∂
Vnm (t)eiωnm (t−t0 ) cm (t)
X
iℏ cn (t) = (1.35)
∂t m

donde
En − Em
Vnm (t) ≡ ⟨n|V (t)|m⟩; ωnm ≡ = −ωmn (1.36)
ℏ
10 1.2 Problemas con dos estados

Explı́citamente

V12 eiω12 (t−t0 ) V13 eiω13 (t−t0 )

    
ċ1 V11 ... c1
iω (t−t0 )
ċ2 
 
V e 21

V22 V23 eiω23 (t−t0 ) . . . c2 
 
iℏ   =  21 iω31 (t−t0 ) (1.37)
ċ3  V32 eiω32 (t−t0 )  c3 
 
V31 e V33 . . .  
.. .. .. .. ..
  
..
. . . . . .

Este es el sistema de ecuaciones diferenciales acopladas que debemos resolver para

hallar las amplitudes cn (t) en función del tiempo. Al ser un sistema de ecuaciones
de primer orden en t debe complementarse con un conjunto de condiciones iniciales
cn (t0 ) que se obtienen indicando el estado inicial |ψ0 ⟩, que de (1.5) resultan

cn (t0 ) = ⟨n|ψ0 ⟩. (1.38)

Una vez hallado los coeficientes cn (t), escribimos la probabilidad de hallar al

sistema en el estado |n⟩ en el instante t como

Pn (t) = |⟨n|ψ(t)⟩|2 = |cn (t)|2 . (1.39)

Si bien estas expresiones son validas para un estado inicial arbitrario, una situa-
ción realista usual supone que un sistema se prepara inicialmente en algún autoes-
tado |ψ0 ⟩ → |i⟩ de H0 . En ese caso escribimos

Pi→n (t) = |⟨n|i(t)⟩|2 . (1.40)

Estas probabilidades se denominan probabilidades de transición.

1.2. Problemas con dos estados

Análogamente que en los casos de potenciales independientes del tiempo, las
soluciones analı́ticas exactas de las ecuaciones (1.35) son raras y en general sólo
se pueden obtener para espacios de Hilbert de baja dimensión. En el caso general
habrá que resolver la ec. (1.37) en forma numérica o por medio de un desarrollo
perturbativo.
Consideremos el caso de dos estados con un potencial que oscila armónicamente:

H0 = E1 |1⟩ ⟨1 |+E2 | 2⟩ ⟨2|; (E2 > E1 )

D E (1.41)
V (t) = γeiωt |1⟩ 2 +γe−iωt 2 ⟨1|

donde γ y ω son reales y positivos. Esto significa que los elementos de matriz de
(1.37) son:
V12 (t) = V21∗ (t) = γeiωt ; V11 (t) = V22 (t) = 0. (1.42)
Potenciales dependientes del tiempo 11

Este potencial da origen a las transiciones |1⟩ ⇐⇒ |2⟩ entre los dos estados. Si
inicialmente, en t = 0, está ocupado solamente el nivel más bajo, los coeficientes de
(1.5) serán:
c1 (0) = 1; c2 (0) = 0. (1.43)
Utilizando (1.42) y (1.43) es inmediato escribir la ecuación (1.35):
! ! !
d c1 (t) 0 γei(ω−ω21 )t c1 (t)
= −i(ω−ω21 )t , (1.44)
dt c2 (t) γe 0 c2 (t)

que constituye un sistema de dos ecuaciones lineales de primer orden acopladas que
pueden resolverse con los métodos usuales. La solución da lugar a la probabilidad
de ocupación de los dos estados en t > 0 y está dada por la fórmula de Rabi,
" #1/2 
γ 2 /ℏ2  γ2 (ω − ω21 )2 
|c2 (t)|2 = 2 2 sin 2
+ t , (1.45)
γ /ℏ + (ω − ω21 )2 /4  ℏ2 4 

c1 (t)|2 = 1 − |c2 (t)|2 , (1.46)

donde ω21 = (E2 − E1 ) /ℏ como se verá en los trabajos prácticos.
Vemos que la probabilidad de que el sistema esté excitado oscila en el tiempo
con una frecuencia angular
v
γ 2 (ω − ω21 )2
u !
u
Ω= t + (1.47)
ℏ2 4

y que es muy grande cuando

ω ≈ ω21 = (E2 − E1 ) /ℏ (1.48)

es decir cuando la frecuencia angular del potencial –usualmente generado por un

campo externo (eléctrico o magnético)– es aproximadamente igual a la frecuencia
angular del sistema de dos estados. En este caso hablamos de la condición reso-
nante.
Veamos que ocurre en el caso resonante, o sea cuando

ω = ω21 ; Ω = γ/ℏ (1.49)

En la Figura 1.1 están representadas las probabildades |c1 (t)|2 y |c2 (t)|2 en función
del tiempo. Entre t = 0 y t = πℏ/(2γ) el sistema absorbe energı́a del potencial V (t).
En t = πℏ/(2γ) solo el estado superior está poblado y entre t = πℏ/(2γ) y t = πℏ/γ
12 1.2 Problemas con dos estados

|c1 (t)|2 |c2 (t)|2

0 t
πℏ/2γ πℏ/γ 3πℏ/2γ 2πℏ/γ
| {z }| {z }| {z }
absorción emisión absorción

Figura 1.1: Representación gráfica de |c1 (t)|2 y |c2 (t)|2 para ω = ω21 .

|c2 (t)|2max

Ancho a media altura = 4γ/ℏ

0 ω
ω21

Figura 1.2: Representación gráfica de |c1 (t)|2máx en función de ω para γ ≪ ℏω21 ; ω =

ω21 corresponde a la frecuencia resonante.
Potenciales dependientes del tiempo 13

el sistema se libera del exceso de energı́a. Este ciclo de absorsión-emisión se repite

indefinidamente y V (t) actúa como una fuente o un sumidero de energı́a.
El ciclo de absorsión-emisión se produce aún cuando estamos fuera de la reso-
nancia. Sin embargo, las amplitudes de oscilación de |c1 (t)|2 y |c2 (t)|2 son ahora
menores y sus frecuencias mayores. La Figura 1.2 muestra |c2 (t)|2máx en función de
ω. La curva tiene un pico resonante en ω = ω21 cuyo ancho es 4γ/ℏ. Notemos que
cuanto más débil es el potencial (γ pequeño) tanto más agudo será el pico resonante.

1.3. Resonancia magnética

Consideremos un sistema de spin 1/2 (por ejemplo, un electrón ligado) sometido
a un campo magnético de la forma
B = B0 ẑ + B1 (x̂ cos ωt + ŷ sin ωt) (1.50)
donde B0 y B1 son constantes. Podemos describir el efecto del campo constante por
medio de H0 y el efecto del campo rotante por medio de V (t). Recordemos que
e
H = −µ · B; µ = S, e < 0, (1.51)
me c
donde µ y S son respectivamente, el momento magnético y el spin del electrón2 . Si
además representamos a los operadores de spin por medio de los autovectores |+⟩ y
|−⟩ de Sz en la forma
ℏ
Sx = (|+⟩⟨−| + |−⟩⟨+|)
2
ℏ
Sy = i (−|+⟩⟨−| + |−⟩⟨+|) (1.52)
2
ℏ
Sz = (|+⟩⟨+| − |−⟩⟨−|)
2
3
resulta
eℏB0
H0 = − (|+⟩⟨+| − |−⟩⟨−|)
2me c
(1.53)
eℏB1 iωt −iωt

V (t) = − e |−⟩⟨+| + e |+⟩⟨−|
2me c
de done E± = ∓eℏB0 /2me c. Para e < 0, E+ > E− y por lo tanto podemos identificar:
|+⟩ →|2⟩ (nivel superior), (1.54)
|−⟩ →|1⟩ (nivel inferior), (1.55)
2
En general µ = gs µB S/ℏ donde gs ≈ 2 es el factor giromagnético y µB = eℏ/2me c es el
magnetón de Bohr en el sistema segesimal de unidades (CGS)
3
Mostrar que Sx , Sy y Sz dados por (1.32) satisfacen las reglas de conmutación: [Sx , Sy ] = iℏSz ,
etc.
14 1.4 Teorı́a de perturbaciones: Serie de Dyson

para estar de acuerdo con (1.41). De (1.42) vemos, además, que la frecuencia carac-
terı́stica del sistema es:
|e|B0
ω21 = (1.56)
me c
que es la frecuencia de precesión del spin en el campo B0 (cuando B1 = 0). Notemos
que, aún cuando los valores de expectación ⟨Sx ⟩ y ⟨Sy ⟩ varı́an debido a la precesión
del spin, las cantidades |c+ (t)|2 y |c− (t)|2 permanecen constantes mientras que el
campo rotante no actúa.
De la comparación de (1.41) con (1.53) vemos que:

eℏB1
− → γ; ω→ω (1.57)
2me c

y que al aparecer el campo rotante las probabilidades |c+ (t)|2 y |c− (t)|2 varı́an de la
manera indicada en la Figura 1.1 para ω = ω21 . Es decir que además de la precesión
del spin ocurren transiciones |+⟩ ⇐⇒ |−⟩. La condición de resonancia se satisface
cuando la frecuencia del campo magnético rotante coincide con la frecuencia de
precesión del spin determinada por la intensidad del campo magnético uniforme.

1.4. Teorı́a de perturbaciones: Serie de Dyson

En un tratamiento perturbativo las soluciones aproximadas de (1.37) serán de la
forma:
cn (t) = c(0) (1) (2)
n (t) + cn (t) + cn (t) + · · · , (1.58)
donde c(1) (2)
n (t), cn (t), ·· representan a las amplitudes de primer orden, de segundo
orden, etc. con respecto al parámetro de la intensidad del potencial dependiente
del tiempo. El método iterativo para resolver este problema es similar al que se
emplea en la teorı́a de perturbaciones independientes del tiempo. Esto significa que,
si inicialmente está poblado sólo el estado i, para obtener c(1)
n (t) aproximamos el
lado derecho de (1.37) por cn (t) = δni y lo relacionamos con c(1)
(0)
n (t), integrando la
ecuación deferencial. Luego para obtener c(2) n (t), aproximamos el lado derecho de
(1)
(1.37) por cn (t) y procedemos del mismo modo, etc..
En lugar de trabajar con los cn (t) vamos a analizar el operador de evolución
UI (t, t0 ) en la RI, definido por

|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = eiH0 (t−t0 )/ℏ U(t, t0 )|ψ0 ⟩ ≡ UI (t, t0 )|ψ0 ⟩, (1.59)

o
UI (t, t0 ) = eiH0 (t−t0 )/ℏ U(t, t0 ). (1.60)
Potenciales dependientes del tiempo 15

Si derivamos la ecuación anterior obtenemos la ecuación diferencial para UI (t, t0 )

analoga a (1.28):
d
iℏ UI (t, t0 ) = VI (t)UI (t, t0 ) (1.61)
dt
que tenemos que resolver con la condición inicial
UI (t0 , t0 ) = 1 (1.62)
Al integrar (1.61) obtenemos la ecuación integral equivalente:
ˆ
i t
UI (t, t0 ) = 1 − VI (t′ ) UI (t′ , t0 ) dt′ (1.63)
ℏ t0
La solución aproximada se obtiene por iteración,
ˆ
i t ′
UI (t, t0 ) = 1 − dt VI (t′ )
ℏ t0
ˆ ˆ ′
−i 2 t ′ t ′′

+ dt dt VI (t′ ) VI (t′′ )
ℏ t0 t0
.. (1.64)
.
ˆ ˆ ′ ˆ t(n−1)
−i n t ′ t ′′

+ dt dt · · · dt(n) VI (t′ ) VI (t′′ ) · · · VI (t(n) )
ℏ t0 t0 i0
+ ···
Esta serie se conoce como serie de Dyson para UI (t, t0 ). Notemos que aquı́ se
ve la potencia de la representación de interacción: al quedar escrito el operador UI
sólo en términos V (t) nos permite realizar el desarrollo perturbativo en potencias
del potencial. Si hubiéramos trabajado en el esquema de Schrödinger, el operador de
evolución U se escribe en una expresión análoga pero en términos del Hamiltoniano
completo, lo cual complica la expansión perturbativa.
La serie de Dyson puede escribirse de manera compacta como
ˆ
i t ′
!
′
UI (t, t0 ) = T exp − dt VI (t ) (1.65)
ℏ t0
donde hemos definido el operador de orden temporal de forma tal que
T [A(t1 )A(t2 ) · · · A(tn )] = A(ti1 )A(ti2 ) · · · A(tin ), ti1 > ti2 > · · · > tin , (1.66)
es decir, que ordena los operadores sobre los que actúa de manera que el artgumento
temporal de los operadores correspondientes decrece a medida que nos movemos
desde izquierda a derecha. Si dos tiempo coinciden no es un problema, ya que en ese
caso el operador conmuta con sigo mismo.
16 1.5 Probabilidad de Transición

1.5. Probabilidad de Transición

Volviendo a las probabilidades de transición (1.39) y (??), pueden ahora evaluarse
utilizando UI (t, t0 ) [ver (1.59)] en la representación de interacción. Primero tomamos
la evolución temporal del estado inicial:
X
|i(t)⟩I = UI (t, t0 )|i⟩ = |n⟩ ⟨n |UI (t, t0 )| i⟩ . (1.67)
n

De modo que aquı́ ⟨n |UI (t, 0)| i⟩ no es otra cosa que los coeficientes cn (t) en (1.30),
cn (t) = ⟨n |UI (t, t0 )| i⟩ , (1.68)
y esta es la expresión que utilizaremos para evaluar las amplitudes cn (t) dado que
contamos con un desarrollo perturbativo para UI (t, t0 ). Al insertar la expansión
(1.58) y las expresiones para los coeficientes que se obtienen de la serie de Dyson
(1.64) obtenemos:
c(0)
n (t) = δin
ˆ t ˆ
−i ′ ′ −i t ′ iωni i′
c(1)
n (t) = dt ⟨n |VI (t )| i⟩ = dt e Vni (t′ )
ℏ t0 ℏ t0 (1.69)
2 X ˆ t ˆ t′
−i

′ ′′
c(2)
n (t) = dt′ dt′′ eiωnm t Vnm (t′ ) eiωmi t Vmi (t′′ ) ,
ℏ m t0 t0

donde las frecuencias están definidas por (1.42)

ℏωni = En − Ei . (1.70)
y
Vni = ⟨n|V |i⟩ (1.71)
son los elementos de matriz de la perturbación ente los estados final e inicial. Las
probabilidades de transición se obtienen de tomar el módulo cuadrado,
Pi→n (t) = |c(0) (1) (2)
n (t) + cn (t) + cn (t) + · · · |
2
(1.72)

1.6. Primer orden perturbativo

Consideremos un estado final con n ̸= i de manera que c(0) n (t) no contribuye. La
probabilidad de transición en el orden más bajo está dada entonces por:
ˆ 2
(1) 2 −i t ′ iωni i′ ′
Pi→n (t) = cn (t) = dt e Vni (t ) . (1.73)
ℏ t0
Vamos a exporar las consecuencias es esta expresión.
Potenciales dependientes del tiempo 17

1.6.1. Potencial constante

Para calcular la probabilidad de transición tenemos que conocer el potencial
V (t′ ) para t0 < t′ < t. Consideremos primero una perturbación constante que
comienza a actuar en t0 = 04 :

0 para t < 0
V (t) = (1.74)
V (independiente de t) para t > 0

Insertando (1.74) en (1.73) encontramos:

Vni iωni t
2 |Vni |2
Pi→n (t) = 1−e = (2 − 2 cos ωni t) (1.75)
ℏωni |ℏωni |2
!2
4 sin ωni t/2
= 2 |Vni |2 (1.76)
ℏ ωni
Esta probabilidad depende del elemento de la matriz de V entre los estados inicial y
final, que a su vez función de todas las propiedades del estado final |n⟩, por ejemplo,
su cantidad de movimiento, spin , etc. Además depende de la diferencia de energı́a
En − Ei = ℏωni entre ambos estados.

1.6.2. Perturbaciones armónicas

Otro caso de interés es el de una perturbación armónica de la forma
V (t) = V eiωt + V † e−iωt (1.77)
y supongamos que la perturbación comienza en t0 = 0. Este caso tiene aplicacio-
nes, por ejemplo, a la interacción de momentios magneticos o átomos con campos
electromagnéticos. De (1.69) obtenemos
ˆ
−i t ′ iωni t′ ′ ′

(1)
cn (t) = dt e Vni eiωt + Vni† e−iωt (1.78)
ℏ 0
donde Vni† ≡ (V † )ni = Vin∗ . O sea que
1 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t †
" #
c(1)
n (t) = Vni + Vni (1.79)
ℏ ωni + ω ωni − ω
Es facil convencerse de que este último resultado es muy similar al que obtuvimos
antes para el potencial constante. Para cualquier estado final dado n, ambos térmi-
nos están presentes y contribuyen a la amplitud de transición, y cuando elevamos
4
Generalmente el potencial V depende de operadores tales como r, p y S, pero esa dependencia
no nos interesa por el momento.
18 1.6 Primer orden perturbativo

al cuadrado la amplitud para obtener la probabilidad de transición, hay términos

cruzados (términos de interferencia) entre estas dos contribuciones a la amplitud.
A menudo, sin embargo, lo que más nos interesa son los estados finales a los que
va la mayor parte de la probabilidad, que son los estados para los que uno u otro de
los dos denominadores de la Ec. (1.79) es pequeño. El primer término es resonante
cuando
En − Ei = −ℏω < 0, (1.80)
es decir, que el estado final posee energı́a menor al inicial, y por lo tanto se trata
de un proceso de emisión. Se denomina emisión estimulada o inducida ya que el
decaimiento no serı́a posible sin la presencia del potencial externo. La probabilidad
de transición resulta entonces
" #2
t2 sin(ωni + ω)t/2
em ind
Pi→n = 2 |Vni |2 (1.81)
ℏ (ωni + ω)t/2

El segundo término de (1.79) es resonante, en cambio, cuando

En − Ei = +ℏω > 0, (1.82)

el estado final posee energı́a mayor a la del estado inicial, y se trata por lo tanto de
un proceso de absorción. La probabilidad de transición se escribe
" #2
t2 sin(ωni − ω)t/2 2
abs
Pi→n = 2 Vni† . (1.83)
ℏ (ωni − ω)t/2

Estas fórmulas se pueden comparar con la ecuación (1.76). En todos los casos,
Pi→n tiene una dependencia temporal similar, con ωni → ωni ± ω, lo que significa
que el análisis que realizamos anteriormente sigue siendo válido.

1.6.3. Análisis de la dependencia temporal

Fijemos el estado final |n⟩ y examinemos cómo se comporta la probabilidad
Pi→n (t) como una función del tiempo a primer orden en teorı́a de perturbaciones
dependiente del tiempo. Para ser especı́ficos, tomaremos el caso de una perturbación
constante y trabajaremos con la ecuación (1.76). Como dijimos, el anális también se
aplica a la absorción o emisión estimulada si reemplazamos ωni por ωni ± ω.
Obviamente Pi→n (0) = 0 (porque n ̸= i y toda la probabilidad está en el estado
|i⟩ en t = 0). Posteriormente vemos que Pi→n (t) oscila a la frecuencia ωni entre 0 y
un máximo proporcional a 1/ωni . La frecuencia ωni mide hasta qué punto el estado
final está “fuera de resonancia”, es decir, cuánto difiere la energı́a final de la energı́a
inicial. Si ωni es grande, la probabilidad Pi→n (t) oscila rápidamente entre cero y un
máximo pequeño. Pero a medida que acercamos el estado |n⟩ al estado inicial |i⟩ en
Potenciales dependientes del tiempo 19

energı́a, ωni se vuelve más pequeño, el perı́odo de oscilaciones se vuelve más largo y
la amplitud crece.
Si hay un estado final |n⟩ degenerado en energı́a con el estado inicial |i⟩ (no el
mismo estado ya que asumimos n ̸= i), entonces ωni = 0 y el factor dependiente del
tiempo en la ecuación (1.76) toma su valor lı́mite, que es:

t2
lı́m Pi→n (t) = 2
|Vni |2 . (1.84)
ωni →0 ℏ

En este caso, la teorı́a de perturbaciones de primer orden predice que la probabilidad

Pi→n (t) crece sin lı́mite con el tiempo, obviamente un absurdo ya que debemos tener
Pi→n ⩽ 1. Esto es una indicación del hecho de que para tiempos suficientemente
largos la teorı́a de perturbaciones a primer orden falla y debemos tener en cuenta
los términos de orden superior en la expansión perturbativa. De hecho, para obtener
resultados sensatos para tiempos tan largos, es necesario tener en cuenta un número
infinito de términos (es decir, hacer algún tipo de sum de la serie). Pero a tiempos
cortos es correcto que Pi→n para un estado en resonancia crezca como t2 .

1.6.4. Dependencia en energı́a

Ahora fijemos el tiempo t y examinemos cómo la expresión para Pi→n (t) de-
pende de la energı́a del estado final |n⟩ (trabajando por simplicidad con el caso de
una perturbación independiente del tiempo). Nos concentraremos en la dependencia
energética del factor dependiente del tiempo entre paréntesis, recordando que el ele-
mento de la matriz también depende de la energı́a (y otros parámetros) del estado
final. Para ello trazamos la función sin2 (ωt/2)/ω 2 como función de ω, como se mues-
tra en la Figura 1.3 para dos tiempos diferentes. En el gráfico, ω debe identificarse
con ωni = (En − Ei )/ℏ, de modo que ω especifica la energı́a del estado final y ω = 0
es la condición de resonancia (conservación de energı́a).
La curva consta en una serie de oscilaciones bajo la envolvente 1/ω 2 , con ceros en
ω = 2nπ/t. El lóbulo central tiene una altura t2 /4 y un ancho proporcional a 1/t, por
lo que su área es proporcional a t.5 A medida que t aumenta, éste crece en altura
y se vuelve más estrecho, de modo que para tiempos más largos, la probabilidad
de transición a estados más alejados en energı́a decrece. Para tiempos grandes, la
probabilidad Pi→n (t) es apreciable sólo cuando la frecuencia está dentro del pico
5
De hecho, el área total viene dada exactamente por una integral que puede evaluarse:
ˆ +∞
sin2 ωt/2 πt
dω = , (1.85)
−∞ ω2 2

mostrando que el área es efectivamente proporcional a t

Now let us fix the time t and examine how the expression for Pn (t) in first order perturbation
theory, Eq. (38), depends on the energy En of the final state |n" (working for simplicity with the
case of a time-independent perturbation). We shall concentrate on the energy dependence of the
time-dependent factor in the parentheses, remembering that the matrix element also depends on the
energy (and other parameters) of the final state. To do this we plot the function sin2 (ωt/2)/ω 2 as
a function of ω, as shown in Figs. 1 and 2 for two different times. In the plot, ω is to be identified
20 1.6ω specifies
with ωni = (En − Ei )/h̄, so that Primer theorden perturbativo
energy of the final state and ω = 0 is the resonance
(energy conserving) condition.
sin2 ωt/2
t2 ω2
4

1 1
ω2 ω2

sin2 ωt/2
ω2
t2
4

ω ω
− 4π
t
− 2π
t
2π
t
4π
t
− 6π
t − 4π
t
− 2π
t
2π
t
4π
t
6π
t

Fig. 1. The function sin2 (ωt/2)/ω2 as a function of Fig. 2. Same but for a larger value of t. The area of
ω for 1.3:
Figura
fixed t. The dotted curve is the envelope 1/ω2 . the curve is dominated by the central lobe, and grows in
proportion to t.

central, es decir, para los estados finales que satisfacen

2π
ω∼ , (1.86)
t
O bien, si identificamos a t con t → ∆t, llamando ∆t al intervalo de tiempo durante el
cual ha estado encendida la perturbación, la transición posee probabilidad apreciable
sólo cuando
∆t∆E ∼ ℏ, (1.87)
donde ∆E = ℏωni representa el cambio en energı́a involucrado en la transición. Si
∆t es pequeño tenemos un pico más ancho, y como resultado podemos tener una
cantidad importante de energı́a “no conservada”. Por otro lado, para tiempos largos
tenemos un pico angosto y la energı́a se conserva aproximadamente para que la
transición tenga probabilidad apreciable.6 Esto indica que un sistema que estuvo
en interacción con un potencial V (t) durante un intervalo de tiempo ∆t tiene una
energı́a que es incierta en una cantidad ∆E ≳ ℏ/∆t.
El comportamiento en frecuencia para tiempos largos nos recuerda a las funciones
que se aproximan a una función δ:
!2
1 sin ωt/2 π
lı́m = δ(ω) (1.88)
t→∞ t ω 2
Para ω ̸= 0 fijo, este lı́mite tiende a 0 cuando t → ∞, mientras que exactamente
en ω = 0 crece en proporción a t, con un área total constante. Si analizamos la
6
Notar que esta “relación de incerteza” es fundamentalmente diferente de la relación de incerteza
para x y p : en la mecánica cuántica no relativista tanto x como p son observables, mientras que t
es un parámetro y no un observable.
Potenciales dependientes del tiempo 21

probabilidad de transición (1.76), vemos que tenemos un factor t adicional, de modo

que para t muy grande P (t) crecerá lineal en el tiempo. Es usual definir entonces la
probabilidad de transición por unidad de tiempo de manera que

Pi→n (t) = Γi→n t, para t → ∞ (1.89)

con
2π
Γi→n = |Vni |2 δ(ωni ). (1.90)
ℏ2
En el caso del potencial armónico, esta ecuación se escribe
2π
Γi→n = |Vni |2 δ(ω − ωni ). (1.91)
ℏ2
Esta es la llamada regla de oro de Fermi y posee numerosas aplicaciones. Podrı́a
ser preocupante que apareciera una función δ, que es infinita en ω = ωni lo que
podrı́a invalidar la teorı́a de perturbaciones. En la práctica esta función tiene que
ser integrada por una razón u otra, y en general la validez de la fórmula a primer
orden de perturbaciones depende del área bajo la función δ.
La función δ en la ecuación (1.88) impone la conservación de energı́a en el lı́mite
t → ∞, es decir, en ese lı́mite solo se permiten transiciones a estados finales de la
misma energı́a que el estado inicial. En tiempos finitos se producen transiciones a
estados en un rango de energı́as alrededor de la energı́a inicial del orden de ∆E ∼ 1/t.
Dicho de manera simple: si perturbamos un sistema fı́sico con un potencial
armónico de frecuencia ω, para tiempos muy largos (infinitos) vamos a inducir tran-
siciones de estados iniciales |i⟩ a estados finales |n⟩ tales que ω = ±(En − Ei )ℏ,
es decir que se conserva la energı́a. Sin embargo, a tiempos más cortos, también es
probable inducir transiciones a estados |n⟩ que que no la conserven.

1.6.5. Estados finales en el continuo

Las consideraciones anteriores son importantes cuando el sistema tiene un es-
pectro discreto, por ejemplo, cuando un espı́n interactúa con un campo magnético
periódico o cuando observamos algunos estados discretos de un átomo en presencia
de luz láser. Por otro lado, si los estados finales son miembros de un continuo, en-
tonces hay un número infinito de estados finales arbitrariamente cercanos al estado
final en energı́a.
Dado un espectro de energı́a En , llamemos N (E) al número de estados con
energı́a menor o igual a E. Entonces, el número de estados que poseen energı́a
dentro de un intervalo dE es
dN (E)
dN = N (E + dE) − N (E) = dE ≡ ρ(E)dE. (1.92)
dE
22 1.6 Primer orden perturbativo

Figura 1.4: Dispersión elástica de una onda plana por un potencial de rango finito.
 E



 En

..


N (E) .




 E2

 E1
E0

Figura 1.5: Niveles de energı́a En . N (E) representa el número de niveles con energı́a
menor a E

donde ρ(E) = dN (E)/dE es la densidad de estados. Observemos que podemos

escribir X
N (E) = Θ(En − E) (1.93)
n

y entonces la densidad de estados resulta

X
ρ(E) = δ(En − E) (1.94)
n

Para obtener la probabilidad de transición entre un estado i y los posibles estados

finales n cercanos en energı́a, debemos sumar (integrar) sobre todos estos estados
finales próximos en energı́a. Dado que la probabilidad sólo es apreciable par estados
cercanos a n no nos equivocamos por mucho si sumamos sobre todos los estados
finales y consideramos: X
Pi (t) = Pi→n (t) (1.95)
n
Potenciales dependientes del tiempo 23

Para evaluar la suma, multiplicamos por

ˆ
1 = dE δ(E − En ) (1.96)

que nos permite reemplazar las energı́as En de las que depende el coeficiente cn por
la variable de integración E. Luego
ˆ
Pi→n (t) = dEn ρ(En )|cn (t)|2
X
Pi (t) = (1.97)
n

Si tomamos ahora el caso de la perturbación constante a tiempos largos, reempla-

zamos (1.89) entonces
ˆ
2πt
dEn δ(En − Ei )|Vni |2
X
lı́m Pi→n (t) = lı́m (1.98)
t→∞ t→∞ ℏ
n
2πt
= lı́m |Vni |2 ρ(Ei ) (1.99)
t→∞ ℏ
(1.100)
En este lı́mite ya vimos que hay transiciones si la energı́a del estado final es igual a
la del inicial. Finalmente escribimos
X
Pi→n (t) ≡ Γi t (1.101)
n

donde
2π h i
Γi = |Vni |2 ρ (En ) (1.102)
ℏ En =Ei
es la probabilidad de transición por unidad de tiempo.

1.6.6. Conexión adiabática

En (1.73) hemos supuesto que la interacción es “conectada” de repente en t0 = 0.
En muchas situaciones es más realista pensar que el potencial crece suavemente. Por
ejemplo, si hacemos incidir un haz de luz sobre un átomo, el frente de onda al llegar
no está perfectamente bien delineado y generalmente la amplitud demora un cierto
tiempo para alcanzar su valor estacionario final. Durante ese tiempo los electrones
del átomo pueden efectuar muchas rotaciones orbitales, de tal modo que la luz, con
respecto al átomo es “conectada” lentamente ó adiabáticamente. Una manera de
representar esa situación es escribir7
V (t) = V eηt (1.103)
7
Es interesante desarrollar el formalismo con V (t) = V e−η|t| , en lugar de (1.103). Nótese que
conexión adiabática representa una herramienta matemática que genera los autoestados exactos
del sistema a partir de los estados no perturbados.
24 1.6 Primer orden perturbativo

Figura 1.6: Variación de V (t) en el caso adiabático.

donde η es una cantidad pequeña y positiva. Supondremos, además, que la transición

tiene lugar en un tiempo tal que (ver la Figura 1.6

−η −1 ≲ t ≲ η −1 . (1.104)

Al final del cálculo hacemos η → 0 de tal modo que el potencial crezca muy lenta-
mente.
De (1.69) tenemos ˆ
(1) iVin t ′ iωni t′ ηt′
cn (t) = − dt e e (1.105)
ℏ t0
Para t ≲ −η −1 , eηt se hace muy pequeño y podemos reemplazar t0 por −∞, o sea
ˆ
iVni t ′ ′
(1)
cn (t) = − dt′ eiωni t ent (1.106)
ℏ −∞

Integrando esta última se tiene

eηt+iωni t
c(1)
n (t) = Vni (1.107)
ℏ (−ωni + iη)
y la probabilidad de transición es:
2 e2ηt
Pi→n (t) = c(1)
n (t) = 2 |Vni |2 . (1.108)
(En − Ei ) + (ηℏ)2

De la Figura 1.7 vemos que la forma de la probabilidad, en función de En , es muy

parecida a la que tenı́a (1.74). El rango de energı́as finales es ∆E ≤ ηℏ y η −1 mide
el tiempo durante el cual ha actuado el potencial.
Potenciales dependientes del tiempo 25

Figura 1.7: Probabilidad de transición en primer orden perturbativo para un poten-

cial que es “conectado” adiabáticamente.

Derivando (1.108) con respecto a t, obtenemos:

2η
Γi→n (t) = e2ηt |Vni |2 . (1.109)
(En − Ei )2 + (ηℏ)2
Tomando ahora el lı́mite η → 0, será e2ηt → 1 y
2η 2π
lı́m Γi→n = lı́m 2 = δ (Ei − En ) (1.110)
η→0 η→0 (E − E ) + (ηℏ)2 ℏ
n i

que nos lleva al resultado (1.90) que habı́amos obtenido antes cuando el potencial
era “conectado” de repente. Vemos por lo tanto que la probabilidad de transición
Γ(i → n) no depende de los detalles de cómo actúa el potencial.

1.6.7. Dispersión por un potencial

Como ejemplo de la aplicación de regla de oro, consideramos el problema la
dispersión de una partı́cula por un potencial V (r) de rango finito que se ilustrada
en la Figura 1.4. El estado inicial es una onda plana que se propaga según el eje z.
Los estados finales también son ondas planas, que al ser la dispersión elástica poseen
la misma energı́a que la onda incidente, pero se propagan –en general– en direcciones
diferentes que la onda incidente. El Hamiltoniano no perturbado corresponde a una
partı́cula libre y el potencial es tratado como una perturbación:
p2
H = H0 + V (r); H0 = (1.111)
2m
H0 depende solo del impulso p y por lo tanto la onda plana
1
ψp (r) ≡ ⟨r|p⟩ = eip·r/ℏ (1.112)
(2πℏ)3/2
que describe a la partı́cula es autofunción simultánea del impulso y de la energı́a
con autovalores p y p2 /2m, respectivamente, y está normalizada como:
ˆ ∞ ˆ ∞
∗ 1 ′
dr ψp (r)ψp′ (r) = 3
dr ei(p−p )·r/ℏ = δ (p − p′ ) (1.113)
−∞ (2πℏ) −∞
Recordemos también que
ˆ
′ ′
⟨r|r ⟩ = δ (r − r ) ; dr |r⟩⟨r| = 1
ˆ (1.114)
′ ′
⟨p|p ⟩ = δ (p − p ) ; dp |p⟩⟨p| = 1
26 1.6 Primer orden perturbativo

Se suele introducir el impulso k (en unidades de ℏ ) y el correspondiente ket

p = ℏk; |k⟩ = (ℏ)3/2 |p⟩ (1.115)

con: ˆ
′ ′
⟨k|k ⟩ = δ (k − k ) ; dk |k⟩⟨k| = 1 (1.116)

La función de onda asociada es:

ˆ ∞
1
ψk (r) ≡ ⟨r|k⟩ = eik·r , dr ψk∗ (r)ψk′ (r) = δ (k − k′ ) (1.117)
(2π)3/2 −∞

Es posible evitar la introducción de las autofunciones continuas y forzar al problema

a tener un espectro discreto, lo que es conveniente para contar el número de estados.
Esto se consigue encerrando a la partı́cula dentro de una caja grande pero finita de
volumen ℓ3 e imponiendo condiciones de contorno periódicas8

ψ(0, y, z) = ψ(ℓ, y, z), etc. (1.118)

Las autofunciones para este problema de autovalores se obtiene facilmente por medio
de la separación de variables:
1
ψk (r) = eik·r (1.119)
ℓ3/2
donde las componentes de k están dadas por:
2π 2π 2π
kx = nx , ky = ny , kz = nx , (1.120)
ℓ ℓ ℓ
con nx , ny , nz = 0, ±1, ±2, . . .. Si
q 2π q 2 2π
k = |k| = kx2 + ky2 + kz2 = nx + n2y + n2z ≡ n, (1.121)
ℓ ℓ
los autovalores de energı́a de los estados (1.117) son:
2
ℏ2 k 2 ℏ2 2πn

E= = (1.122)
2me 2me ℓ
Cada triplete de números enteros (nx , ny , nz ) corresponde a una onda plana o a un
estado de la partı́cula en el espacio k ≡ (kx , ky , kz ). Notar que cuando ℓ → ∞, kx , ky
8
Dado que un sistema fı́sico real está siempre en algún sentido localizado, la introducción de un
contenedor con dimensiones suficientemente grandes, en comparación con con las que son relevantes
para el sistema considerado, no afectará al sistema en forma significativa. Es decir que podemos
tener dentro de una caja una “onda plana fı́sica”, si la caja es muy grande en comparación con la
longitud de onda de la partı́cula.
Potenciales dependientes del tiempo 27

y kz se transforman en variables continuas. Nos interesa saber el número de estados

dN en el intervalo dk y el problema de contarlos se reduce a contar el número de
sitios en una red tridimensinal en el espacio (nx , ny , nz ). Será9 :
!3 !3
2 ℓ 2 ℓ mk
dN = dnx dny dnz ≡ n dΩdn = k dkdΩ = dEdΩ (1.123)
2π 2π ℏ2
y
!3 ˆ !3 ˆ
X ℓ 2 ℓ mk
→ k dkdΩ = dEdΩ (1.124)
k 2π 2π ℏ2
ˆ
1 X 1
3
→ dk (1.125)
ℓ k (2π)3
Vamos a evaluar ahora la probabilidad de transición Γ dentro de un pequeño
ángulo sólido dΩ′ :

2π 2
|⟨k′ |V |k⟩| δ (Ek′ − Ek ) .
X
Γk = Γk→k′ ; Γk→k′ = (1.126)
k′ en dΩ′
ℏ

De (1.117)
ˆ ′ ˆ
′ e−ik ·r eik·r 1 ′ Vk−k′
⟨k |V |k⟩ = dr 3/2 V (r) 3/2 = 3 dr V (r)ei(k−k )·r = (1.127)
ℓ ℓ ℓ ℓ3

donde Vk′ −k es la transformada de Fourier de V (r. Haciendo la sustitución

ˆ ∞
!3
X
′ ℓ mk
→ dΩ dE. (1.128)
k′ en dΩ′ 0 2π ℏ2

obtenemos de (1.126):
dΩ′ mk
Γk = |Vk′ −k |2 , (1.129)
ℓ3 4π 2 ℏ3
donde k′ es un vector en dΩ′ de longitud k. Dividiendo finalmente por el flujo de
partı́culas incidentes ℏk/mℓ3 se obtiene la sección eficaz10 :

dσ m2
′
= 2 4
|Vk′ −k |2 (1.130)
dΩ 4π ℏ
9
Esto equivale a tomar un estado por cubo drdp/(2πℏ)3 en el espacio de las fases.
La densidad de las de partı́culas incidentes es ℓ−3 (una partı́cula en el volumen ℓ3 ) y su
10

velocidad es ℏk/m.
28 1.7 Transiciones de segundo orden

1.7. Transiciones de segundo orden

Puede darse que, por alguna regla de selección, los elementos de matriz Vni (t)
se anulen para todo t. En tal situación no podemos tener transiciones de primer
orden entre los estados |i⟩ y |n⟩. Es posible, sin embargo, que la transicón ocurra
en un orden superior. Vamos a estudiar en detalles el segundo orden perturbativo,
suponiendo que el potencial es “conectado” lentamente. De (1.35) tenemos
2 X ˆ t ˆ t′
−i

′ ′ ′ ′′′ +ηt′′
c(2)
n (t) = dt dt′′ eiωnm t +ηt Vnm eiωmi t Vmi (1.131)
ℏ m t0 t0

Haciendo t0 → −∞ en las integrales sobre t′ y t′′ resulta [ver (1.107)]

e2ηt+iωni t Vnm Vmi

c(2)
X
n (t) = (1.132)
ℏ (−ωni + i2η) m ℏ (−ωmi + iη)

Para calcular la probabilidad de transición podemos directamente tomar el cuadrado

de esta expresión, ya que Vni = 0. Si aquı́ también suponemos que |n⟩ está en el
contı́nuo, luego de derivar, llegamos a la versión de la Regla de Oro en segundo
orden perturbativo
2
2π X Vnm Vmi
Γi→n = δ (Ei − En ) (1.133)
ℏ m Ei − Em + iℏη

donde el lı́mite η → 0 se da por sobreentendido.

Podemos interpretar este resultado diciendo que el sistema hace una transición
“prohibida” o virtual de |i⟩ a |n⟩ en dos pasos. Primero va de |i⟩ a un estado inter-
medio |m⟩ (que no necesita tener la misma energı́a que |i⟩) para pasar luego de |m⟩ a
|n⟩. La amplitud de esta transición doble es proporcional a Vnm Vmi / (Ei − Em + iℏη).
Para evaluar la probabilidad de transición tenemos que sumar sobre todos los esta-
dos intermedios antes de elevar al cuadrado, con lo que las diferentes contribuciones
frecuentemente interfieren entre sı́. A la amplitud
X Vnm Vmi
(1.134)
m Ei − Em + iℏη

se la llama elemento de matriz de segundo orden ya que juega, en la regla de oro, el

mismo papel que Vni . Cuando |m⟩ es parte del contı́nuo el término iℏη es muy im-
portante en la evaluación del elemento de matriz en la región Em ≈ Ei . Finalmente,
de (1.58), vemos de inmediato que, si Vni ̸= 0, la expresión para la probabilidad
de transición contiene el término de segundo orden sumado a Vni , todo elevado al
cuadrado y multiplicado por (2π/ℏ)δ (Ei − En ).
Potenciales dependientes del tiempo 29

1.8. Decaimiento del estado inicial

Hasta aquı́ nos hemos ocupado de la evolución temporal de las amplitudes cn (t)
con n ̸= i. La pregunta que surge naturalmente es: ¿qué ocurre con la amplitud
ci (t)? De (1.35) tenemos
Vin (t)eiωin t cn (t)
X
iℏċi (t) = Vii (t)ci (t) + (1.135)
n̸=i

que luego de dividir por ci (t) nos conduce a

d
Vin eiωin t cn (t)/ci (t)
X
iℏ ln ci (t) = Vii + (1.136)
dt n̸=i

Haciendo, del lado derecho, las aproximaciones: cn (t) ≈ c(1)

n (t); ci (t) ≈ 1, y usando
(1)
el potencial (1.103) y cn (t) dado por (1.107), se tiene
d X |Vin |2 e2ηt
iℏ ln ci (t) = Vii eηt + (1.137)
dt n̸=i ℏ (−ωni + iη)

que para η → 0 (o sea reemplazando eηt y e2ηt por 1) lleva a

d X |Vin |2
iℏ ln ci (t) = ∆i ; ∆i = Vii + (1.138)
dt n̸=i Ei − En + iηℏ

Luego
ci (t) = e−i∆i t/ℏ ; |i(t)⟩I = e−i∆i t/ℏ |i⟩ (1.139)
Cuando los estados |n⟩ son discretos, y el estado |i⟩ no está degenerado, el término
iηℏ no tiene ningún efecto en el lı́mite η → 0. En esta situación ∆i es precisamente la
expresión para el corrimiento de energı́a, en segundo orden perturbativo, producido
por una perturbación estacionaria V .
Comparando
|i(t)⟩S = e−i(Ei +∆i )t/ℏ |i⟩ (1.140)
con el ket no perturbado (para V (t) = 0), |i, t0 ; t⟩S = e−iEi t/ℏ |i⟩, podemos concluir
que, al conectar el potencial muy lentamente y cuando el espectro es discreto, los
autoestados de H0 se transforman adiabáticamente en autovalores de H0 + V (t). Es
decir que la teorı́a de perturbaciones estacionarias pueden ser consideradas como un
caso especial de la teorı́a de perturbaciones dependientes del tiempo.
Supongamos ahora que el estado |n⟩ es uno de los niveles del contı́nuo con En ≈
Ei . En tal caso
´ la sumatoria en (1.138) hay que interpretarla como una integral, o
sea: n̸=i → dEn ρ (En ), como se habı́a hecho antes. Recordando, además, que
P

1 1
lı́m = Pr − iπδ(x) (1.141)
δ→0 x + iδ x
30 1.8 Decaimiento del estado inicial

podemos reescribir (1.138) en la forma

ˆ
|Vin |2
Re (∆i ) = Vii + Pr dEn ρ (En ) , (1.142)
Ei − En
ℏΓi
Im (∆i ) = − (1.143)
2
con Γi dado por (??). En lugar de (1.140) tendremos
|i(t)⟩S = e−i[Ei +Re(∆i )]t/ℏ e−Γi t/2 |i⟩ (1.144)
Podemos interpretar este resultado diciendo que la perturbación produce:
1. Un desplazamiento del nivel original de Ei a Ei + Re (∆i ), como en el caso
discreto, y
2. Una transición de |i⟩ a |n⟩ con la probabilidad de transición por unidad de
tiempo igual a Γi .
También vemos que Γi caracteriza el decaimiento exponencial del estado inicial11 .
Es interesante verificar la conservación de la probabilidad a segundo orden en V
(para t pequeño). Como
ci (t) = e−i Re(∆i )t/ℏ e−Γi t/2 , (1.145)
será |ci (t)|2 = e−Γi t ≈ 1 − Γi t. Luego
|ci (t)|2 + |cn (t)|2 ≈ 1 − Γi t + Γi t = 1.
X
(1.146)
n̸=i

Es decir que la probabilidad de hallar el sistema en cualquiera de los estados, inclu-

yendo el inicial, es igual a 1. Nótese también que 1/Γi es la vida media del estado
|i⟩.
Vamos a mencionar finalmente la distribución en energı́a de los estados finales,
una vez que el estado inicial haya decaı́do; es decir para t ≫ 1/Γi 12 . Con tal fin
primero obtendremos una nueva aproximación para las amplitudes cn (t), haciendo
de nuevo uso de la ecuación de movimiento (1.35). Pero en lugar de poner del lado
izquierdo cn (t) ≡ c(0)
n (t) = ⟨n|i⟩ = δni , como se hizo para llegar al resultado (1.69),
usaremos cn (t) = c(0)n (t) = ⟨n|i⟩ = δni , con los ci (t) dado por (1.129). Para un
potencial constante resulta
ˆ t
−i ′
cn (t) = Vni dt′ eiωni t ci (t′ ) (1.147)
ℏ 0
11
Se puede decir que el estado |i, t0 ; t⟩S tiene una energı́a compleja igual a Ẽi = Ei + Re (∆i ) −
iℏΓi /2.
12
La descripción cuática de estados inestables que se presenta aquı́ fue desarrollada originalmente
por Wigner y Weisskopf en 1930.
Potenciales dependientes del tiempo 31

Figura 1.8: Forma de la distribución en energı́a de los estados finales una vez que
haya decaı́do el estado inicial.

1 − e−Γi t/2 ei[En −Ei −Re(∆i )]t/ℏ

= Vni (1.148)
En − Ei − Re (∆i ) + iΓi /2
que para t ≫ 1/Γi conduce a13 :

|Vni |2
Pi→n (t → ∞) = (1.149)
[En − Ei − Re (∆i )]2 + Γ2i /4
La distribución en energı́a de los estados finales, Pi→n (t → ∞), está representada en
la Figura 1.8. Vemos que el máximo está en En = Ei − Re (∆i ) y que tiene forma
Lorenziana con un ancho igual a Γi .

1.9. Interacción del campo electromagnético clási-

co con un sistema de partı́culas cargadas
Consideremos un sistema de partı́culas cargadas, por ejemplo electrones, con-
tenidos en cierta región del espacio en interacción con una onda electromagnética
clásica. Los campos ϕ y A se consideran externos y obedecen las ecuaciones clásicas
de Maxwell. En la aproximación semiclásica que utilizaremos las partı́culas en cues-
tión no son fuentes para esos campos, y dentro del volumen de nuestro sistema, a
efectos de las ecuaciones de Maxwell, podemos considerar que las fuentes son nulas.
Es conveniente además trabajar en el gauge transversal de Coulomb en el cual
∇ · A(r, t) = 0 (1.150)
y ϕ(r, t) = 0 en ausencia de cargas14 En este gauge, y en ausencia de cargas y
corrientes, las ecuaciones de Maxwell se reducen a la ecuaciones de onda,
!
2 1 ∂2 2
□ A(r, t) ≡ ∇ − 2 2 A(r, t) = o (1.152)
c ∂t
cuya solución es la onda plana
A(r, t) = aϵeik·r−iωt + a∗ ϵ∗ e−ik·r+iωk t (1.153)
(0)
Antes, con cn (t) = δni , habı́amos obtenido: cn (t) = Vni 1 − ei(En −Ei )t/ℏ / (En − Ei )
13

14
En el gauge transversal de Coulomb: ∇2 ϕ(r, t) = −4πρ(r, t), que tiene como solución el po-
tencial instantáneo de Coulomb ˆ
ρ (r ′ , t)
ϕ(r, t) = dr ′ . (1.151)
|r − r ′ |
1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
32 cargadas
con frecuencia
ω = ck, k = |k|, (1.154)
mientras que el vector de polarización λ, para satisfacer (1.150), tiene que ser tal
que:
ϵ · k = 0, (1.155)
es decir, la onda debe ser transversal. Siempre podemos elegir |ϵ|2 = 1.15 La amplitud
a es una constante y como el potencial vector tiene que ser real tenemos que agregar
al primer término en (1.153) su complejo conjugado.
Los campos eléctricos y magnéticos se obtienen a partir de A(r, t) en la forma:

1 ∂A(r, t)
E(r, t) = − , B(r, t) = ∇ × A(r, t). (1.157)
c ∂t
La densidad de la energı́a del campo electromagnético es

E 2 (r, t) + B 2 (r, t)
U (r, t) = (1.158)
8π

que para la onda (1.153) resulta:

ω2 h 2
2 2 2ik·r−2iωt
i
U= |a| − Re a ϵ e (1.159)
2πc2
El último término oscila con el tiempo y su promedio es nulo para un perı́odo. Luego

ω2
U= |a|2 (1.160)
2πc2

Lo mismo ocurre con el vector de Poynting (flujo de energı́a: energı́a transportada

por unidad de área y de tiempo):

c ω2 2
P = E(r, t) × B(r, t) = k̂cU = k̂ |a| , (1.161)
4π 2πc

que se propaga en la dirección k̂ con la velocidad c.

15
Para una polarización lineal ϵ es real y ϵ± = √12 (x̂±iŷ) corresponde a una polarización circular
derecha (+) o izquierda (−). Notemos también que si ϵ = ϵ+ , será ϵ∗ = ϵ− , como que:

ϵ± · ϵ∗± = 1; ϵ± · ϵ± = ϵ∗± · ϵ∗± = 0 (1.156)

Potenciales dependientes del tiempo 33

Consideremos el Hamiltoniano de un sistema de N partı́culas cargadas de masa m

y carga e16 en un campo electromagnético, representado por el potenciales (ϕ, A)17 :
N
" #2 N
X 1 eA (ri , t) X
H= pi − + eϕ (ri , t) . (1.162)
i=1 2m c i=1

Enfaticemos que si bien las partı́culas son objetos cuánticos ya que sus posiciones
y momentos están representadas por operadores ri y pi , el campo electromagnético
es clásico, es decir, obedece las ecuaciones clásicas de Maxwell. No obstante, las
cantidades A(ri , t) y ϕ(ri , t) en la expresión anterior son operadores por depender
de las posiciones y momentos de las partı́culas.
Vamos a utilizar además una aproximación en la que A es pequeño y quedarnos
con el término lineal en el potencial vector, de manera que si denotamos
N
X p2i
H0 = (1.163)
i 2m
entonces el Hamiltoniano de interacción se escribe
2
1 e

V (t) = pi − A(ri , t) − H0 (1.164)
2m c
X e
=− [pi · A(ri , t) + A(ri , t) · pi ] + O(A2 ) (1.165)
2mc
i
ˆ
e 1 X
=− dr [pi δ(r − ri ) + δ(r − ri )pi ] · A(r, t) + O(A2 ) (1.166)
c 2m i
ˆ
e
=− dr j(r) · A(r, t) (1.167)
c
donde hemos definido el operador corriente en la forma
N
1X pi pi

j(r) = δ (r − ri ) + δ (r − ri ) (1.168)
2 i=1 m m
Este operador es la suma de términos que representan la velocidad de las partı́culas
multiplicadas por los operadores densidad δ(r − ri ). Debido a la forma simétrica de
(1.168), j(r) es un operador hermı́tico. Observemos que p · A(ri , t) ̸= A(ri , t) · p, y
lo mismo vale para ambos términos en la corriente. Solo en el gauge transversal de
Coulomb, para el cual vale (1.150), tendremos que p · A(r, t) = A(r, t) · p. Nótese
además que en la ecuación (1.167) A(r, t) no es más un operador ya que todos los
operadores de posición ri están contenidos en j(r)
16
El electron posee carga e < 0.
17
Se podrı́a incluir también un potencial U que describiera a todos los demás potenciales que
que ven las partı́culas, por ejemplo, los que mantienen al sistema en un volumen finito, o si se
tratara de electrones en átomos, las interacción Coulombianas con el núcleo atómico, o incluso
entre electrones del mismo o de diferentes átomos.
1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
34 cargadas
1.9.1. Absorción de la luz
Para fuentes luminosas usuales los campos eléctricos generados por A son gene-
ralmente pequeños comparados con los campos atómicos (∼ e/a20 ). En esta situación
el efecto del término ρA2 , de segundo orden en A, es pequeño comparado con el
efecto de j · A y podemos despreciarlo en el cálculo de la absorción de la luz por un
sistema de partı́culas cargadas, tales como átomos. En tal caso:
ˆ
e
V (t) = − dr j(r) · A(r, t) (1.169)
c
Si representamos a A(r, t) por una ondas planas como en (1.153) el potencial resulta
e
V (t) = − aj−k · ϵe−iωt + a∗ jk · ϵ∗ eiωt (1.170)
c
donde ˆ N
1X pi −ik·ri pi

−ik·r
jk ≡ dr e j(r) = e + e−ik·ri . (1.171)
2 i=1 m m
son los operadores. Vamos a calcular ahora la probabilidad de que un haz de luz,
representado por (1.153), sea absorbido por el sistema, que está en un estado |i⟩.
Vemos de inmediato que cada sumando de V (t) es de la forma (1.77) con
e
− a∗ j k · ϵ ∗ → V
c (1.172)
e
− aj−k · ϵ → V †
c
Luego, podemos utilizar los resultados (1.83) y (1.81), que para tiempos grandes
resultan en la probabilidad por unidad de tiempo
2π e2
Γabs
i→n (kϵ) = δ (En − Ei − ℏω) 2 |a|2 |⟨n |j−k · ϵ| i⟩|2 (1.173)
ℏ c
En general la radiación no es monocromática (con una única ω) sino una mezcla
incoherente de ondas con distintos ϵ, k y ω. Supongamos entonces una superposición
de ondas planas de la forma (1.153) donde cada modo posee su porpia amplitud.
Supondremos que el haz es incoherente de tal modo de que no exista ninguna co-
rrelación entre las diferentes componentes de Fourier del haz. Por ejemplo, la luz
emitida por un gas caliente, tal como el vapor de mercurio, resulta de las contribu-
ciones de todos los átomos del gas, entere cuyas componentes no hay ningún tipo
de correlación. (Se dice que la distribución de fases es al azar.) En esta situación
podemos calcular el efecto de cada una de las componentes de Fourier del haz in-
cidente por separado y luego sumar sobre todas las contribuciones. (No hay efectos
de interferencia en la interacción de la luz con el átomo.).
Potenciales dependientes del tiempo 35

Sumando ahora sobre todos los modos {kϵ} obtenemos:

1 e2 2π X
Γabs
i→n = |akϵ |2 |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.174)
V c2 ℏ kϵ

Transformando la suma sobre k en una integral, como se hizo en (1.124),

ˆ ˆ 2 ˆ 2
1 X 1 k dkdΩ ω dωdΩ
→ 3
dk = 3
= , (ω = ck) (1.175)
V k (2π) (2π) (2πc)3

realizando la integral en ω resulta:

ˆ
2πe2 ω 2
Γabs |⟨n |j−k · ϵ| i⟩|2 |akϵ |2
X
i→n = 2 2 dΩ (1.176)
ℏ c (2πc)3 ϵ

donde ahora ℏω = En − Ei .
Supongamos ahora que la luz incidente está polarizada según ϵ y que está com-
prendida dentro de un ángulo sólido dΩ. De (1.176) la correspondiente probabilidad
de transición (diferencial) será:

2πe2 ω 2
Γabs
i→n (ϵ) = 2 2 3
|⟨n |j−k · ϵ| i⟩|2 |akϵ |2 dΩ
ℏ c (2πc)
(1.177)
(2π)2 e2
= 2 2 |⟨n |j−k · ϵ| i⟩|2 I(ω)dΩ,
ℏω c
donde
ω4
I(ω) = 4
|akϵ |2 . (1.178)
(2πc)
Se verifica que I(ω) es la intensidad de la luz incidente dentro de un ángulo sólido
dω por unidad de frecuencia. En efecto, según (1.161), y pasando al continuo de
acuerdo a (1.175) el flujo de energı́a transportada es:
ˆ ˆ ˆ ˆ
c X ω2 2 ω4 2
|akϵ | = dΩ dω |akϵ | = dΩ dω I(ω) (1.179)
V k 2πc2 (2πc)4

De una forma análoga se obtiene que la probabilidad de emisión por unidad tiempo,
inducida por el haz incidente desde el estado inicial |i⟩ al estado final |n⟩ de menor
energı́a, es
(2π 2 )e2
Γ[Link]
i→n (ϵ) = |⟨n |jk · ϵ∗ | i⟩|2 I(ω)dΩ (1.180)
ℏ2 ω 2 c
siendo aquı́ ω = (Ei − En ) /ℏ. Notemos que, como

⟨i |j−k · ϵ| n⟩ = ⟨i| (jk · ϵ∗ )† |n⟩ = ⟨n |jk · ϵ∗ | i⟩∗ , (1.181)

1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
36 cargadas
será
Γabs [Link]
i→n = Γn→i (1.182)
o también
( )
1 e2 2π X absorción
Γi⇄n = |akϵ |2 |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω)
2
V c ℏ kϵ emisión estimulada
(1.183)
En un proceso de absorción el sistema absorbe un fotón de energı́a ℏω = En − Ei .
Lab energı́a ganada por el átomo es compensada por la correspondiente pérdida
de energı́a del campo electromagnético. Análogamente en un proceso de emisión la
energı́a del sistema disminuye en ℏω = En − Ei , debido a la emisión de un fotón,
y la energı́a del campo aumenta en la misma cantidad. Se dice que la emisión es
estimulada o inducida ya que la probabilidad de que esto ocurra es proporcional a
la intensidad de la radiación aplicada. Cada fotón en el haz incidente de frecuencia
ω tiene una energı́a ℏω. Luego la energı́a total del haz incidente es:
X
E= ℏωnkϵ (1.184)
kϵ

donde nkϵ es el número de fotones en el modo {kϵ} del haz incidente. Comparando
esta última expresión con la energı́a del campo electromagnético

ω2
|akϵ |2
X
E= (1.185)
kϵ 2πc2

vemos que la amplitud akϵ está relacionada con el número de fotones por

2πℏc2
|akϵ |2 = nkϵ (1.186)
ω
Luego en lugar de (1.183) podemos escribir

4π 2 e2
nkϵ |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω)
X
Γi⇄n = (1.187)
kϵ ωV

Por medio de nkϵ podemos expresar solamente la magnitud de akϵ y no su fase.

Notemos también que suponer que el haz incidente es incoherente es equivalente a
no tener ninguna información sobre las fases relativas de las diferentes akϵ . Calcular
los efectos de cada una de las componentes de Fourier y luego sumar sobre las
diferentes componentes es equivalente a promediar sobre todas las posibles fases de
los akϵ . Es decir que para especificar un haz incoherente basta dar el número de
fotones en cada modo {kϵ}. En otras palabras, sı́ lo único que que sabemos sobre
Potenciales dependientes del tiempo 37

un haz son los números nkϵ , no tenemos ninguna información sobre las fases entre
las diferentes componentes de Fourier del haz18 .
La probabilidad de transición total por unidad de tiempo producida por un haz
de nkϵ fotones incidentes será, de (1.187)

4π 2 e2 cnkϵ X
Γabs
i (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.188)
ωc V n

Dado que nkϵ /V es la densidad de fotones, cnkϵ /V es el flujo de fotones incidentes.

El cociente entre Γabs
i (ω) y este flujo define la sección eficaz de absorción,

4π 2 e2 X
σiabs (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.189)
ωc n

que, además de depender de la frecuencia, depende de la dirección y polarización de

la radiación.

1.10. Aproximación dipolar eléctrica

Si bien en la sección anterior consideramos un sistema de electrones libres aco-
plado a un campo electromagnético, podemos extrapolar los resultados a problemas
más generales. La aproximación dipolar eléctrica se basa en el hecho de que la energı́a
del campo de radiación ℏω = ℏck tiene que ser comparable, en magnitud, con la
separación entre los niveles del sistema irradiado por el campo electromagnético. En
un sistema atómico tendrá que satisfacerse:

Ze2 Ze2
ℏω ∼ ≈ (1.190)
a0 /Z Rátomo

Esto conduce a:
ω Ze2 Z
k= ∼ = (1.191)
c ℏcRátomo 137Rátomo
o sea
kRátomo = Rátomo /λ ∼ Z/137, (1.192)
donde λ = 1/k es la longitud de onda del campo de radiación. Si ahora expandimos la
exponencial eik·r en la integral (1.171) con respecto a la posición del núcleo átomico
r0 = 0, i.e.,
eik·r = 1 + ik · r + · · · (1.193)
18
En una descripción cuántica completa de la radiación, los nkϵ y las fases de akϵ son cantidades
complementarias (como el impulso y la posición) y cuanto mejor especificamos a una de ellas tanto
menos información tenemos sobre la otra.
38 1.10 Aproximación dipolar eléctrica

por lo menos para átomos livianos (Z/137 ≪ 1) será

k · r ≲ kRátomo ≪ 1 (1.194)

Obtendremos por lo tanto resultados razonables si hacemos eik·r ≈ 1, que es la

aproximación dipolar. Resulta, entonces,
ˆ ˆ
ik·r
⟨n |j−k | i⟩ = dr e ⟨n|j(r)|i⟩ ≈ dr ⟨n|j(r)|i⟩ = ⟨n |j0 | i⟩ (1.195)

donde
P 1
=
j0 = [d, H0 ] . (1.196)
m −eiℏ
P
Aquı́, P = i pi es el operador de impulso total, H0 es el Hamiltoniano del átomo
en ausencia de la radiación [ver (1.163)] y d = −e i ri es el operador del momento
P

dipolar eléctrico.
Luego, como ℏω = En − Ei , en la aproximación dipolar será:
iω
⟨n |j−k | i⟩ ≈ dni ; dni = ⟨n|d|i⟩ (1.197)
−e
donde dni es el elemento de matriz no-diagonal del momento dipolar eléctrico. La
sección eficaz es ahora
(2π)2 ω X
σiabs;dip (λ; ω) = |dni · ϵ|2 δ (En − Ei − ℏω) (1.198)
c n

y la sección eficaz total se obtiene integrando la anterior sobre todas las frecuencias:
ˆ ∞
(2π)2 X
abs;dip
σi (ϵ) = dω σiabs;dip (ϵ; ω) = 2 (En − Ei ) |dni · ϵ|2 , (1.199)
0 ℏc n

donde la suma se extiende sobre En > Ei . Si |i⟩ es el estado fundamental la suma

va sobre todos los estados. Es fácil demostrar que, si û es un versor real, se satisface
la relación
ℏ2 e2 N
(En − Ei ) |dni · û|2 =
X
, (1.200)
n 2m
conocida como la regla de suma dipolar, donde N es el número total de partı́culas.
Por lo tanto, cuando la luz incidente esta polarizada linealmente, la sección eficaz
total satisface la regla de suma19

2π 2 e2
σiabs;dip ( pol. lineal ) = N. (1.204)
mc
19
La ecuación (1.199) es una consecuencia de la relación de conmutación entre r y p. En efecto,
Potenciales dependientes del tiempo 39

1.11. Reglas de selección

Las transiciones estudiadas arriba, llamadas dipolares, solo tienen lugar si el
elemento de matriz ⟨n|d · ϵ|i⟩ es no nulo. Como el momento dipolar d = −e ri
P

cambia ante una transformación de paridad, los elementos de matriz serán no nulos
solo si la paridad P de los estados |i⟩ y |n⟩ es opuesta. Es decir, debe ser

∆P = Pn − Pi ̸= 0 (1.205)

Esta es la llamada regla de Laporte, descubierta en 1924. Consideremos como ejem-

plo el caso de un único electrón atómico (en un campo central). Las funciones de
onda serán

⟨r|i⟩ = Ri (r)Ylm (θ, φ) (1.206)

⟨r|n⟩ = Rn (r)Yl′ m′ (θ, φ) (1.207)

Si usamos las conocidas expresiones

s
4π
z=r Y10 (θ, φ) (1.208)
3
s
8π
x + iy = −r Y11 (θ, φ) (1.209)
3
s
8π
x − iy = r Y1−1 (θ, φ) (1.210)
3
podemos escribir
s !
4π Ex + iEy Ex − iEy
r·ϵ=r Ez Y10 (θ, φ) + √ Y1−1 (θ, φ) − √ Y11 (θ, φ) (1.211)
3 2 2
tomando el valor medio del operador
" N N
#
X X X
[P · û, d · û] = −e pi · û, ri · û = iℏe δij = ieℏN, (1.201)
i=1 i=1 ij

con respecto al al estado |i⟩ (no necesariamente el estado fundamental), se tienen

⟨i|(P · ûd · û − d · ûP · û)|i⟩ = ieℏN, (1.202)

ó X X
⟨i|P · û|n⟩⟨n|d · û|i⟩ − ⟨i|d · û|n⟩⟨n|P · û|i⟩ = ieℏN. (1.203)
n n

Usando finalmente (1.196) y (1.197) se obtiene de inmediato (1.200).

40 1.11 Reglas de selección

Luego, podremos escribir a los elementos de matriz en la forma

s ˆ ˆ π ˆ 2π
4π ∞ 3
ϵ·r = r (r)Ri (r)Rn (r) sin θdθ dφ
3 0 0 0
!
∗ Ex + iEy Ex − iEy
× Yl′ m′ (θ, φ) Ez Y10 (θ, φ) + √ Y1−1 (θ, φ) − √ Y11 (θ, φ) Ylm (θ, φ)
2 2
(1.212)
La parte angular de (1.212) se reduce entonces a integrales de productos de 3
armónicos esféricos que se pueden hacer explı́citamente usando la ortogonalidad y
la relación
Y1m (θ, φ)Yl′ m′ (θ, φ) =
AYl′ +1,m+m′ (θ, φ) + BYl′ ,m+m′ (θ, φ) + CYl′ −1,m+m′ (θ, φ) (1.213)
A partir de estas integrales angulares llegamos a las siguientes reglas de selección
para transiciones permitidas:
∆l = l′ − l = ±1
∆m = m′ − m = 0, ±1
Para átomos como el de Hidrógeno, o los alcalinos (con un único electrón fuera
de capa cerrada), estas reglas de selección determinan totalmente el espectro. En
otros átomos, con muchos electrones disponibles para hacer transiciones, las reglas
se complican. He aquı́ la lista de reglas (incluyendo al spin):
La paridad de los estado implicados debe cambiar.
Cuando el sistema puede ser aproximado por orbitales, la configuración debe
cambiar de manera que ∆ li = ±1
P

∆J = 0, ±1
J = 0 → J = 0 está prohibida
∆mJ = 0, ±1
∆L = 0, ±1
∆ML = 0, ±1
∆S = 0
∆MS = 0
Notemos que está permitido que ∆L = 0. Pero este L nada tiene que ver con la
paridad del estado (No es el L que aparece en un armónico esférico determinando
su paridad a través de algún (−1)L .
Potenciales dependientes del tiempo 41

1.11.1. Transiciones prohibidas

Los resultados anteriores los obtuvimos reteniendo solo el primer término (i.e. el
1 ) en el desarrollo de exp(ikr). Debemos analizar cómo cambian los resultados si
incluimos el término siguiente. Este término ik · r da, al elemento de matriz ⟨n|jk |i⟩,
la contribución v s siguiente:

ie X
vs = − (ϵ · pi ) (k · ri ) (1.214)
mc i

Podemos escribir a v s de la siguiente manera

vs = vM + vQ (1.215)

con
ie X
vM = − ((ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ))
2mc i
(1.216)
ie X
vQ = − ((ϵ · pi ) (k · ri ) + (ϵ · ri ) (k · pi ))
2mc i
Es fácil ver que

(ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ) = (k × ϵ) · Li (1.217)

de manera que
ie
vM = −
X
(k × ϵ) · Li (1.218)
2mc i

o, recordando la relación entre momento angular orbital y momento magnético µ

e
µ= L (1.219)
2mc
v M = −i(k × ϵ) ·
X
µi = −i(k × ϵ) · M (1.220)
i

donde hemos llamado M al momento dipolar magnético total. Como M es un vector

axial, no cambia de signo ante transformaciones de paridad, ası́ que los elementos de
matriz de v M serán no nulos solo si ∆P = 0 Se puede proceder de manera análoga
con v Q , relacionado con el momento cuadrupolar eléctrico y se llega a que

ie
vQ = − Ei kj Qij (1.221)
mc
donde Qij es el momento cuadrupolar eléctrico.
42 1.12 Fórmula de Kubo

1.12. Fórmula de Kubo

Consideremos la siguiente configuración basica: para t < t0 el sistema se encuen-
tra en el estado fundamental de un cierto Hamiltoniano H0 , que llamamos |ψ0 ⟩, con
energı́a E0 . Si analizamos los valores de expectación de un conjunto de observables
Oi , estos toman los valores
⟨Oi ⟩0 = ⟨ψ0 |Oi |ψ0 ⟩. (1.222)
independientes del tiempo. En el instante t0 se enciende la perturbación
X
V (t) = gj (t)Oj (1.223)
j

donde el ı́ndice j etiqueta los distintos operadores en la teorı́a y, correspondiente-

mente, las diferentes fuentes que podemos encender. Por lo general, en cualquier
situación dada, sólo encendemos una fuente para un solo operador, pero nos puede
interesar cómo esta fuente afecta el valor esperado de cualquier otro operador Oj .
Luego de encender la perturbación, el estado fundamental evoluciona en el tiempo
(en el esquema de Schrödinger) de acuerdo a

|ψ0 (t)⟩S = U(t, t0 )|ψ0 ⟩S , (1.224)

y entonces los valores de expectación adquieren la dependencia temporal

⟨Oi ⟩(t) = ⟨ψ0 |U † (t, t0 )Oi U(t, t0 )|ψ0 ⟩ (1.225)

además de inducirse las transiciones a los estados excitados estudiadas antes. Resulta
mas conveniente trabajar en la representación de interacción, es decir, escribirlo en
términos del operador de evolución en la representación de interacción UI (1.61):

UI (t, t0 ) = eiH0 (t−t0 )t/ℏ U(t, t0 ), (1.226)

para el cual disponemos de una serie de Dyson (1.65):

ˆ
i t ′
!
′
UI (t, t0 ) = T exp − dt VI (t ) . (1.227)
ℏ t0

Entonces, introduciendo la relación inversa a (1.226),

⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )eiH0 (t−t0 )t/ℏ Oi e−iH0 (t−t0 )t/ℏ UI (t, t0 )|ψ0 ⟩ (1.228)

que reescribimos introduciendo la repersentación de interacción para el operador Oi

⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )Oi (t)UI (t, t0 )|ψ0 ⟩. (1.229)
Potenciales dependientes del tiempo 43

Obsérvese que omitimos el subı́ndice I para los operadores Oi (t) en representación

de interacción,
Oi (t) = eiH0 (t−t0 )/ℏ Oi e−iH0 (t−t0 )/ℏ .
Queda sobrentendido del hecho de que poseen una dependencia temporal. Consi-
deremos que el instante en el que se enciende la perturbación t0 → −∞, y si nos
restringimos a valores pequeños de las fuentes, podemos realizar el cálculo usando
la teorı́a de perturbaciones al orden mas bajo,
ˆ t
! ˆ t
!
i ′ ′ i ′ ′
⟨Oi ⟩(t) = ⟨ψ0 | 1 + dt VI (t ) + . . . Oi (t) 1 − dt VI (t ) + . . . |ψ0 ⟩
ℏ −∞ ℏ −∞
(1.230)
ˆ t ˆ t
i i
= ⟨Oi ⟩0 + dt′ ⟨ψ0 |VI (t′ )Oi (t)|ψ0 ⟩ − dt′ ⟨ψ0 |Oi (t)VI (t′ )|ψ0 ⟩
ℏ −∞ ℏ −∞
(1.231)
ˆ t
i
= ⟨Oi ⟩0 + dt′ ⟨ψ0 | [VI (t′ ), Oi (t)] |ψ0 ⟩ (1.232)
ℏ −∞

Finalmente insertamos la expresión explı́cita para el potencial que contiene a las

fuentes, (1.223) obtenemos el cambio en el valor de expectación,
ˆ t
iX
ε⟨Oi ⟩(t) = ⟨Oi ⟩(t) − ⟨Oi ⟩0 = dt′ gj (t′ )⟨ψ0 | [Oj, (t′ ), Oi (t)] |ψ0 ⟩ (1.233)
ℏ j −∞
ˆ +∞
iX
=− dt′ Θ(t − t′ )⟨ψ0 | [Oi (t), Oj (t′ )] |ψ0 ⟩gj (t′ )
ℏ j −∞
(1.234)

donde en la segunda lı́nea utilizamos la función escalón para extender el lı́mite

superior de integración hasta +∞ y [. . . , . . .] refiere al conmutador de los operadores.
Comparando este resultado con nuestra definición original (??), vemos que la función
respuesta en la teorı́a cuántica está dada por

i
χij (t, t′ ) = − Θ(t − t′ )⟨[Oi (t), Oj (t′ )]⟩ , (1.235)
ℏ

que, debido a la función de Heaviside, naturalmente emerge como una función res-
puesta causal. Dado que en representación de interacción la evolución temporal de
los operadores (1.12) es con H0 y que |ψ0 ⟩ es autoestado de H0 , no es difı́cil conven-
cerse de que
χij (t, t′ ) = χij (t − t′ )
44
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

Con esta función, el valor de expectación del observable Oi a tiempo t se escribe, en

respuesta lineal, como
ˆ ∞
dt′ χij (t − t′ )gj (t′ ).
X
⟨Oi ⟩(t) = ⟨Oi ⟩0 + (1.236)
j −∞

Esta fórmula es importante y se conoce como fórmula de Kubo. Más allá de la

decoración (la función escalón, o el hecho de que debe tomarse un conmutador) la
función respuesta ası́ escrita consiste en un valor de expectación de un producto
de dos operadores (que pueden ser iguales o distintos) en tiempos diferentes. Esto
genéricamente se denomina función de correlación o función de Green, y ya vimos
que en este caso es una función retardada. Observemos que el obsevable i-ésimo para
el que estamos tomando su valor de expectación no necesariamente tiene que estar
perturbado, basta que la respuesta χij sea no nula con algún observable perturbado
para obtener un resultado no trivial.
Dada la expresión de la función respuesta en términos de un conmutador de
operadores hermı́ticos, es claro que la respuesta del operador i a una perturbación
externa que se acopla con j está simplemente relacionada con la respuesta de j a
una perturbación que se acopla con i, en otras palabras, donde los operadores tienen
roles invertidos. Estas son las relaciones de reciprocidad de Onsager.

1.13. Fórmula de Kubo para la conductividad eléctri-

ca: hacia una teorı́a de campos
Finalicemos este capı́tulo describiendo cómo esta teorı́a de la respuesta lineal
puede utilizarse para calcular propiedades de transporte en un sistema de muchas
partı́culas. Consideremos un sistema de partı́culas cargadas en presencia de un cam-
po electromagnético. Cómo hemos visto, el Hamiltoniano está dado por (1.162), que
bajo las suposiciones realizadas en la sección 1.9 se escribe H = H0 + V (t), donde
N
X p2i
H0 = , (1.237)
i=1 2m
ˆ
e
V (t) = − dr j(r) · A(r, t), (1.238)
c

y el vector corriente (1.168) se escribe

N
1X pi pi

j(r) = δ (r − ri ) + δ (r − ri ) . (1.239)
2 i=1 m m
Potenciales dependientes del tiempo 45

este operador, un observable, al ser una función de la posición, está describiendo una
teorı́a cuántica de campos, que es el lenguaje en el que los sistemas de partı́culas
se expresan naturalmente. Una extensión natural de la fórmula de Kubo (1.235)
al continuo, es decir, cuando los ı́ndices i se convierten en un continuo en tres
dimensiones, el valor medio del operador corriente está dado por
ˆ
dr ′ dt′ χαβ (r − r ′ , t − t′ ) Aβ (r ′ , t′ )
X
⟨jα (r, t)⟩ = ⟨jα (r)⟩0 + (1.240)
β

donde la función respuesta para la corriente es

i
χαβ (r, t) = − θ(t) ⟨[jα (r, t), jβ (0, 0)]⟩ , (1.241)
ℏ
y ⟨. . .⟩0 es un valor de expectación calculado en el estado fundamental del Hamil-
toniano H0 (que no vamos a especificar por ahora, baste decir que si se trata de un
sistema de electrones, éste tendrá que ser un mar de Fermi). Usualmente el primer
término en la ecuación anterior se anula (no hay corriente inducida en ausencia de
campo). La invarianza frente a traslaciones se traduce en el hecho de que la función
respuesta depende sólo de la diferencia entre coordenadas. Sin embargo, si lo que
buscamos es obtener la conductividad, necesitamos recuperar una ley de Ohm. Para
ello quisiéramos encontrar una expresión análoga a (1.240) pero que involucre al
campo eléctrico en lugar del potencial vector
Detengámonos un momento en el operador corriente (1.239): es una suma de
términos de la forma velocidad de la partı́cula i-ésima multiplicada por la δ(r − ri ),
que es la justamente su densidad. Sin embargo, como se ha discutido, pi /m no puede
ser la velocidad de cada partı́cula en presencia de un campo electromagnético, porque
p es momento canónico. En su lugar, en presencia de un campo electromagnético,
la velocidad de una partı́cula está representada por por el momento cinemático (o
mecánico) Π:
Π 1 e

v= = p − A(r, t) . (1.242)
m m c
Esto significa que el verdadero operador corriente, o corriente fı́sica, es
N
1X
J (r, t) = [vi δ (r − ri ) + δ (r − ri ) vi ] (1.243)
2 i=1
N
1 X e e

= pi − A (ri , t) δ (r − ri ) + δ (r − ri ) pi − A (ri , t)
2m i=1 c c
(1.244)
N N
1 X e X
= [pi δ (r − ri ) + δ (r − ri ) pi ] − δ (r − ri ) A (ri , t) (1.245)
2m i=1 mc i=1
e
= j(r) − A(r, t)ρ(r) (1.246)
mc
46
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

donde hemos definido el operador

N
X
ρ(r) = δ(r − ri ). (1.247)
i=1

Este operador se interpreta como la densidad de partı́culas,20 ya que

ˆ
dr ρ(r) = N. (1.249)

El primer término en (1.246) se denomina paramagnético, mientras que el se-

gundo es el término diamagnético. Este es el observable que debe entrar en la ley
de Ohm.
Utilizando su definición (1.246), calculemos entonces el valor de expectación de
la corriente fı́sica
e
⟨J (r, t)⟩ = ⟨j(r, t)⟩ − A(r, t)⟨ρ(r, t)⟩ (1.250)
mc
Para el primer término podemos utilizar (??). Para el segundo, tendrı́amos que es-
cribir una nueva fórmula de Kubo. Sin embargo, puede mostrarse que el conmutador
de ρ con jα se anula en muchos casos, y si no se anulara, en todo caso la contribuión
adicional es de orden A2 y la despreciamos. Por lo tanto escribimos
N
⟨ρ(r)⟩ = ⟨ρ(r)⟩0 = =n (1.251)
V
donde V es el volumen del sistema, y n la densidad media de partı́culas.
El potencial vector y el campo eléctrico se relacionan mediante
1∂
E(r, t) = − A(r, t) − ∇ϕ(r, t) (1.252)
c ∂t
En el gauge de Coulomb y en ausencia de cargas y corrientes ϕ = 0.
Es conveniente trabajar en el espacio recı́proco, donde observables y fuentes
dependen de la frecuencia. En el caso del campo eléctrico tenemos,
ˆ
E(r, ω) = dt eiωt E(r, t), (1.253)

20
Un eventual término de potencial escalar en el Hamiltoniano se puede escribir como
N
X ˆ
eϕ(ri , t) = e drρ(r)ϕ(r, t) (1.248)
i=1

donde ahora ϕ es una función clásica.

Potenciales dependientes del tiempo 47

y una expresión análoga para el potencial vector. Por un lado, la relación entre
campo eléctrico y potencial vector (en el gauge de Coulomb, donde ϕ = 0) se escribe

iω
E(r, ω) = A(r, ω), (1.254)
c
y por otro, para el valor de expectación de la corriente fı́sica tenemos
en
⟨Jα (r, ω)⟩ = ⟨jα (r, ω)⟩ − Aα (r, ω) (1.255)
ˆ mc
en
dr ′ χαβ (r − r ′ , ω)Aβ (r ′ , ω) −
X
= Aα (r, ω) (1.256)
β mc
ˆ
en c

′ ′ ′
Eα (r ′ , ω)
X
= dr χαβ (r − r , ω) − δ(r − r )δαβ (1.257)
β mc iω
(1.258)

Adicionalmente, podemos tomar la transformada de Fourier en el espacio y es-

cribir X
⟨Jα (q, ω)⟩ = σαβ (q, ω)Eβ (q, ω) (1.259)
β

donde
c en

σαβ (q, ω) = −i χαβ (q, ω) − δαβ (1.260)
ω + iη mc
Finalmente, hemos agregado una pequeña parte imaginaria ε a la frecuencia porque
la función respuesta causal debe ser analı́tica en el semiplano superior.
En un gas de electrones libres, el operador corriente conmuta con el Hamilto-
niano. En consecuencia,

j(0, t) = eiH0 t j(0, 0)e−iH0 t = j(0, 0) y [jα (0, t), jβ (0, 0)] = 0. (1.261)

De este modo,
" #
ne2 ne2 ne2
σαβ (0, ω) = iδαβ = δ αβ πδ(ω) + i . (1.262)
mω + m mω

La parte real corresponde al llamado “pico de Drude”. Notando que

τ −1
πδ(ω) = lı́m ,
τ →∞ (ωτ )2 + 1

vemos que obtenemos para ω = 0 el modelo de Drude para la conductividad,

2
Re σ = nem τ , donde τ es el tiempo de vida medio de las cuasipartı́culas entre dos
48
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos

colisiones; para electrones libres, sin embargo, este tiempo de vida medio es infini-
to y lo mismo para la conductividad dc21 . Si incluyéramos interacciones entre los
electrones obtendrı́amos un tiempo de vida finito. La parte imaginaria de σαβ (0, ω)
describe la absorción óptica (aquı́ entra la disipación) que decrece como 1/ω.

21
En ingles se utiliza la sigla dc, o direct current para la corriente continua y ac o alternate
current para la acorriente alterna.
Capı́tulo 2

Dispersión de partı́culas

La dispersión, procesos en los cuales un haz de electrones, protones, fotones,

etc. incide sobre un blanco compuesto a la vez por átomos o núcleos, es un proceso
fundamental que es importante en una amplia gama de aplicaciones. Por ejemplo, la
mayor parte del trabajo experimental en fı́sica de partı́culas involucra la dispersión,
y una gran parte de lo que se sabe sobre las propiedades de las partı́culas se ha
obtenido a través de experimentos de dispersión. Para otro ejemplo, la dispersión
de especies nucleares en un plasma caliente es importante para determinar las tasas
de reacción termonuclear en estrellas o en el universo primitivo. Por otro lado, una
de las técnicas experimentales actuales para investigar los nanotubos de carbono es
la dispersión de fotones. Se podrı́a acumular una larga lista de ejemplos.
En capı́tulo ?? consideramos algunos problemas de dispersión como una aplica-
ción de la teorı́a de la perturbación dependiente del tiempo. En este capı́tulo consi-
deramos la dispersión por un potencial en tres dimensiones, adoptando un enfoque
independiente del tiempo y presentando algunos de los hechos básicos más impor-
tantes. Desde el punto de vista teórico, el aspecto más relevante de los procesos de
dispersión es que nos proveen información sobre el sector continuo del espectro. Nos
enfocamos entonces en las soluciones con energı́a positiva de la ecuación de Schrödin-
ger independiente del tiempo, que satisfacen ciertas condiciones de contorno. Estas
soluciones en general se extienden hasta el infinito y no son normalizables.

2.1. Condiciones de Contorno

En estas notas nos concentraremos en la dispersión por un potencial V (r) que
decae en el infinito,
V (r) −−−−→ 0 (2.1)
|r|→∞

y en general consideraremos potenciales que decaen más rápido que 1/|r|, a los
que llamamos de corto alcance. Hablaremos de la dispersión de una partı́cula por

49
50 2.1 Condiciones de Contorno

el potencial V (r), como si fuera un potencial fijo en el espacio, pero en realidad

la partı́cula del haz incidente interactúa con un blanco que muchas veces es otra
partı́cula móvil, y un tratamiento adecuado nos obliga a tener en cuenta la dinámica
de ambas partı́culas, por ejemplo utilizando las coordenadas del centro de masa.
Omitiremos aquı́ los detalles, y sólo supondremos en lo que sigue que que se utiliza
este sistema de referencia
Estamos interesados en resolver la ecuación de Schrödinger independiente del
tiempo,
ℏ2 2
Hψ = − ∇ ψ + V ψ = Eψ (2.2)
2m
para energı́as positivas E > 0. Como la energı́a es positiva, la función de onda se
extiende hasta el infinito y no hay cuantización, es decir, existe una solución para
cada valor de E > 0. De hecho, existen muchas soluciones linealmente independientes
para una dada energı́a y buscamos aquella que satisfaga las condiciones de contorno
correctas para representar la fı́sica del problema de dispersión.
Supongamos un haz de partı́culas que incide con momento p sobre un blanco,
como se muestra en la figura 2.1. Como el potencial es de corto alcance, muy lejos
del blanco las partı́culas del haz no lo perciben, y entonces supondremos que el
haz incidente está representado por una onda plana de momento definido p. Esto
implica cierta idealización ya que una onda plana real llena todo el espacio y, en
particular, se extiende hasta el infinito en la dirección transversal, mientras que los
haces reales son siempre de extensión finita en la dirección transversal. En la figura
2.2 se muestra una imagen de lo que sucede cuando la onda plana incidente golpea el
objetivo; la interacción produce la onda dispersada, que se irradia lejos del objetivo.
Si el potencial de dispersión es de corto alcance, podemos esperar intuitivamente que
parte de la onda incidente, aquella con un gran parámetro de impacto, no alcancen
el objetivo y continúen corriente abajo como una onda plana casi sin modificar.
Consideraremos dispersión elástica, en la que si las partı́culas incidentes ganan
algo de energı́a cinética al caer en el pozo de potencial creado por el blanco, la pierden
al escapar del pozo, y a grandes distancias las partı́culas dispersadas conservan su
energı́a. Sin embargo, en general van a cambiar su momento, y por lo tanto su
dirección.
Otra idealización recae en el uso de autofunciones ψ para describir el proceso
de dispersión, ya que una función propia es un estado estacionario, y los haces
reales se encienden en algún momento y se apagan en un momento posterior. Una
autofunción representa el estado estacionario idealizado que se obtendrı́a si una onda
plana pudiera dirigirse contra un objetivo para todos los tiempos desde t → ∞.
Otro problema es que las autofunciones de energı́a positiva no son normalizables,
por lo que no pueden representar el estado de una sola partı́cula. Tratamos con este
problema en estas notas interpretando la densidad ρ = |ψ|2 , no como una densidad
de probabilidad, sino como una densidad de partı́culas en el haz.
mayor que la del proyectil (mB " mA ), la masa reducida coincide
aproximadamente con la del proyectil (mA ≈ m) y los sistemas CM y
del laboratorio (sistema L) son, a los efectos prácticos, idénticos.
Consideremos ahora el caso cuántico. Dado un haz de partı́culas A
que incide según el eje z, como en la figura, pretendemos calcular la
probabilidad de que las partı́culas sean dispersadas dentro de un cono
con ángulos polares (θ, ϕ) y una abertura del cono de ángulo sólido dΩ:
Dispersión de partı́culas 51

detector

dA
dΩ
haz dispersado
r

θ
haz incidente
z

Figura 2.1: Un detector de partı́culas intercepta partı́culas que se dispersan dentro

de unHablamos
pequeño ángulo
de “hazsólido dΩ.
incidente” porque en una experiencia real en
que inciden muchas partı́culas idénticas debemos considerar un flujo de
Del mismo
partı́culas modo, interpretamos
incidentes la corriente,
que en un diferencial de tiempo dt atraviesa un
" ! #
∗ iℏ∇
J = Re ψ − ψ , (2.3)
m
como una corriente de partı́culas, no una corriente de probabilidad. La normalización
general de la función de onda ilimitada es arbitraria y representa simplemente la
intensidad del haz. Las cantidades de interés, como la sección eficaz diferencial, son
independientes de esta normalización.
La solución ψ debe tener las condiciones de contorno correctas a grandes dis-
tancias del centro dispersor de manera de representar tanto la onda plana incidente
como la onda dispersada. Definimos la onda incidente por
ψi = eik·r (2.4)
que se entiende que está presente en todo el espacio, incluso en zonas de |r| chico,
donde el potencial V está activo. La onda incidente está parametrizada por un vec-
tor de onda k o un momento equivalente p = ℏk. En general esta onda incidente no
satisface la ecuación de Schrödinger (5.4) en todo el espacio, pero, al suponer que
V (r) decae lo suficientemente rápido, lo podemos ignorar lejos del centro dispersor.
Esto se aplica también a grandes distancias, cerca del detector y luego de ser dis-
persado el haz. Entonces, a grandes distancias, en todo el espacio, la onda incidente
satisface la ecuación de Schrödinger (5.4) y, posee una energı́a
ℏ2 k2
E= (2.5)
2m
52 2.1 Condiciones de Contorno

Para un vector de onda incidente k dado, el efecto del potencial será dispersar esta
onda, de manera que en el detector, a grandes distancias del potencial, la función
de onda será
ψ|r|→∞ ∼ ψi + ψd = eik·r + ψd (2.6)
donde ψd representa el efecto del potencial dispersor. De acuerdo con la imagen de
la figura 2.2, requerimos que a grandes distancias la onda dispersada sea puramente
saliente, es decir, que sea una onda esférica que se propague en dirección radial,
pero que el efecto de la dispersión dependa de los ángulos (θ, φ) . Por esta razón
suponemos que la forma asintótica de la función de onda será

eikr
ψ|r|→∞ ∼ eik·r + fk (θ, φ) . (2.7)
r
Suponiendo que V (r) puede ignorarse a grandes distancias y observando que la
ecuación solo se aplica asintóticamente, requerimos que la onda dispersada satisfaga
la ecuación de Schrödinger para partı́culas libres a orden dominante en 1/r, lo cual
se verifica debido a que
eikr ikr
" # " #
2 e 1

2
∇ fk (θ, φ) = −k fk (θ, φ) + O 3 , (2.8)
r r r
donde el termino dominante proviene del término radial del Laplaciano en coorde-
nadas esféricas1
Las condiciones de contorno están completamente parametrizadas por el vector
de onda incidente k, que también determina el valor de la energı́a E a través de la
relación (2.5). Una misma energı́a incidente puede obtenerse con muchas números
de onda diferentes, variando su dirección. La familia está parametrizada por puntos
en una esfera (la dirección de k). (En la dispersión unidimensional, esta familia se
reduce a dos miembros, ondas de dispersión que inciden desde la derecha o desde
la izquierda). Por esta razón, de ahora en adelante denotaremos las soluciones de
dispersión de la ecuación de Schrödinger ψk , donde se entiende que k y el valor
propio de la energı́a E están conectados por la relación de partı́culas libres (2.5).
Es plausible que para cada k existe una única solución a la ecuación de Schrödin-
ger con energı́a (2.5) y que satisface las condiciones de contorno (2.7). Este es un
hecho que se puede probar con la teorı́a de las ecuaciones integrales de Fredholm.
Observamos que en la teorı́a de la dispersión las únicas cantidades que son intere-
santes fı́sicamente son aquellas definidas por las propiedades asintóticas (r grande)
1
El Laplaciano en coordenadas esféricas posee la forma
∂2ψ

2 1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1
∇ ψ= 2 r + 2 sin θ + 2 2 . (2.9)
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
Dispersión de partı́culas 53

282 Chapter 13 Scattering

t= 0

Figure 13.2. Scattering of a wave packet incident from the left with mean momentum hko.
In elastic scattering, the wave packet is scattered with equal energy but varying amplitudes
Figura 2.2: Dispersión de un paquete de ondas incidente desde la izquierda con
in different directions (indicated by the thickness of the arrows). In the forward direction,
impulso the
medio
scattered 0 . En
ℏkwave la dispersión
interferes elástica,
with the advancing el paquete
incident wave. de ondas se dispersa con
igual energı́a pero con amplitudes variables en diferentes direcciones (indicadas por
el grosorof-mass
de las frame
flechas). En la dirección de avance, la onda dispersada interfiere con
in which the total momentum of the system is zero, or with the use
la onda of
incidente que avanza.
relative coordinates appropriate to the interaction between two particles. The cross
section depends on the collision parameters (incident energy, polarization, etc.) and
the particular variables (scattering angle, energy loss, etc.) which quantify the out-
come X. If these variables are denoted by x in the theoretically preferred frame-of-
reference, a transformation to the corresponding variables, x', in the laboratory
frame must be carried out. Formally, the differential cross-sections in the two frames
are related by
dax = dax dx
(13.6)
dx' dx dx'
This relation cautions us that the two differential cross sections do not have the same
value. A numerical example at the end of this section illustrates this for the angular
distribution.
We now turn to the theoretical calculation of a scattering cross section. In an
idealized scattering process, a single fixed scattering center or target particle is bom-
barded by particles incident along the z axis. It is assumed that the effect of the
scattering center on the particles can be represented by a potential energy V(r) which
is appreciably different from zero only within a finite region. Although this as-
sumption excludes as common a long-range force as the Coulomb field, represented
by a potential proportional to 1/r and observable as Rutherford scattering, this lim-
itation is not severe. In actual fact, the Coulomb field is screened at large distances
by the presence of electrons in atoms and by other particles, and for large r the
potential falls off faster than 1/r.
54 2.2 Amplitud de dispersión y sección eficaz

de la función onda. Esto se aplica a la sección transversal diferencial, que es lo que

normalmente se mide en experimentos reales.

2.2. Amplitud de dispersión y sección eficaz

La función fk (θ, φ) se denomina amplitud de dispersión. Es en general una fun-
ción compleja de los ángulos. El objetivo de la teorı́a de la dispersión es su determi-
nación, ya que guarda una relación simple con la sección eficaz diferencial.
Imaginemos una situación experimental como la ilustrada en la figura 2.1. Un
detector, ubicado a cierta distancia del dispersor, intercepta todas las partı́culas
dispersadas dentro de un pequeño cono de ángulo sólido ∆Ω, centrado en alguna
dirección k̂ = (θ, φ).
El flujo incidente es

ℏ ℏk
Ji = (ψi∗ ∇ψi − ψi ∇ψi∗ ) = k̂ ≡ vi k̂ (2.10)
2mi m
con vi = ℏk/m nes la velocidad de las partı́culas incidentes. En cuanto al dispersado,
toma la forma, a grandes distancias2

2

ℏ ℏ
Jd = [ψd∗ ∇ψd − ψd ∇ψd∗ ) = 2
|fk (θ, φ)|2 iker
2mi 2mi r
∂fk∗ (θ, φ)
!
1 ∗ ∂f k (θ, φ)
+ 3 fk (θ, φ) − fk (θ, φ) eθ +
r ∂θ ∂θ
∗
! #
1 ∂f k (θ, φ) ∂f (θ, φ)
f ∗ (θ, φ) − fk (θ, φ) k eφ (2.12)
r3 sin θ k ∂φ ∂φ

A grandes distancias es el término radial el que domina por lo que podemos

escribir
ℏk 1 1
Jd ∼ |fk (θ, φ)|2 2 er = vi |fk (θ, φ)|2 2 er (2.13)
m r r
A partir del flujo dispersado podemos calcular el número de partı́culas dispersadas
por unidad de tiempo que atraviesan el detector,

dN = Jd · dA = Jd · er r2 dΩ = vi |fk (θ, φ)|2 dΩ. (2.14)

2
En coordenadas esféricas el gradiente se escribe

∂ψ 1 ∂ψ 1 ∂ψ
∇ψ(r, θ, φ) = er + eθ + eφ . (2.11)
∂r r ∂θ r sin θ ∂φ
Dispersión de partı́culas 55

Al dividir esta cantidad por el flujo de partı́culas incidentes se obtiene el diferencial

de la sección eficaz de dispersión,
dN
dσ ≡ = |fk (θ, φ)|2 dΩ (2.15)
Ji
La sección eficaz diferencial, que mide el número de partı́culas dispersadas por uni-
dad de flujo incidente y por unidad de ángulo sólido, se obtiene dividiendo por el
elemento de ángulo sólido
dσ
= |fk (θ, φ)|2 (2.16)
dΩ
Si se mide la sección eficaz diferencial en un experimento, se puede determinar el
módulo de la amplitud de dispersión y, de él, tener idea de la función de onda de las
partı́culas dispersadas. Notemos que fk (θ, φ), además de depender de los ángulos
(θ, φ), en general depende de k, y por lo tanto, de la energı́a de las partı́culas
incidentes.
La sección eficaz total, σ, se obtiene integrando sobre todos los ángulos sólidos,
ˆ
σ = dΩ |fk (θ, φ)|2 . (2.17)

y refleja la probabilidad total de que una partı́cula sea dispersada, dividida por el
flujo de probabilidad incidente.

2.3. Funciones de Green

Para completar la discusión, deberı́amos mostrar que efectivamente existen au-
tofunciones de la forma (2.7). Esto puede hacerse construyendo explı́citamente so-
luciones ψk (r). Consideremos la ecuación de Schrödinger independiente del tiempo
para un problema como el que nos ocupa. Es decir,
ℏ2 2
− ∇ ψ(r) + V (r)ψ(r) = Eψ(r) (2.18)
2m
donde V (r) es el potencial dispersor. Escribiendo
ℏ2 k 2 2mV (r)
E= u(r) = (2.19)
2m ℏ2
tendremos
∇2 + k 2 ψk (r) = u(r)ψk (r) (2.20)
En este punto, introducimos la función de Green asociada al problema libre, en
ausencia de potencial:

∇2 + k 2 Gk (r, r ′ ) = −4πδ (3) (r − r ′ ) (2.21)
56 2.3 Funciones de Green

Aquı́ hemos supuesto que la función de Green depende sólo de k y no de su dirección,

lo que mostraremos a la brevedad. Conocemos además la solución de la ecuación
homogénea correspondiente a una onda plana:

∇2 + k 2 ψk0 (r) = 0 =⇒ ψk0 = eik·r (2.22)

Con esto, podemos escribir la solución general de (2.20) en la forma

ˆ
1
ψk (r) = eik·r
− d3 r′ Gk (r, r ′ ) u (r ′ ) ψk (r ′ ) (2.23)
4π

Hemos pasado de esta manera del problema de resolver una ecuación diferencial,
(2.18), al problema de resolver la ecuación integral. Veremos que la solución, que
será iterativa, nos permitirá en particular, calcular fk (θ, φ) y ası́ podremos calcular
la sección eficaz de dispersión.

2.3.1. Cálculo de la función de Green

Proponemos para Gk (r, r ′ ) = Gk (r − r ′ ) un desarrollo de Fourier de la forma
ˆ
′
Gk (r) ≡ d3 k ′ gk (k ′ )eik ·r (2.24)

de manera que, si además introducimos la representación de la delta de Dirac,

ˆ
1 ′
(3)
δ (r) = 3
d3 k ′ eik ·r (2.25)
(2π)

obtenemos
1 1
gk (r) = ′2
. (2.26)
2π k − k 2
2

Sólo nos resta realizar la transformada para obtener Gk (r),

ˆ
1 1 ′
Gk (r) = 2 d3 k ′ ′2 eik ·r (2.27)
2π k −k 2

Dado que todo el integrando es invariante frente a rotaciones, podemos elegir el

sistema de coordenadas de manera tal que r coincida con la dirección del eje ẑ (de
la variable de integración k′ ), la exponencial entonces se simplifica a
ˆ
1 1 ′ ′
Gk (r) = 2 k ′2 dk ′ sin θ′ dθ′ dφ′ ′2 eik r cos θ (2.28)
2π k −k 2
Figure 13.5). The poles of the integrand are at

k' = +VJ?-
- + i1'/ "'" +(k
- + 2k
i1'/)

for small 1'/. The path of integration leads along the real axis from - 00 to + 00.
Since r is necessarily positive, a closed contour may be used if we complete
the path by a semicircle of very large radius through the upper half k' -plane. It
encloses the pole in the right half plane. The result of the integration is not altered
Dispersión
by introducing detours avoiding the two de k' = +k and k' = -k, as indicated
partı́culas
points 57

Imk'

,,"
.". ... -- ---- ----- ......... ....
.... .
/"""" "
"
;
"....
,
;
;
;
..
,, , "",,
I
I ,
\

\
I

I
f \
I \

,,
I
,,
\

,
I I
I
----'------L-_:---I.----+---.,----+---r--_-...L.--Re k'
o
X.
-k- 17J
2k
Figure 13.5. Path of integration in the complex k' plane.
Figura 2.3: Camino de integración en el plano complejo k ′ .

donde θ′ es el ángulo que forma k con el eje z. Luego de integrar trivialmente sobre
φ′ y sobre θ′ , llegamos a
ˆ ∞
i 1 h ′
−ik′ r
i
Gk (r) = k ′ dk ′ ′2 e ik r
− e
πr 0 k − k2
ˆ ∞ ik′ r (2.29)
1 ′ ′ e
= k dk ′2
iπr −∞ k − k2
Esta es una integral que tiene singularidades en el camino de integración. Se trata
de un problema que tiene una solución muy simple en la teorı́a de una variable
compleja y que consiste en deformar ligeramente el camino de manera de esquivar
los polos. Alternativamente se pueden desplazar esos polos del eje real.
ˆ ∞ ′
± 1 ′ ′ eik r
Gk (r) = k dk ′2
iπr −∞ k − (k 2 ± iε)
ˆ ∞ ′ (2.30)
1 ′ ′ eik r
= k dk √ √
iπr −∞ k ′ − k 2 ± iε k ′ + k 2 ± iε
′
Si consideramos que k ′ es una variable compleja con parte imaginaria positiva, eik r
decrece exponencialmente cuando r → ∞. En tal caso, si consideramos un camino
de integración en el semiplano positivo como el de la figura 2.3, la integral sobre el
semicı́rculo se anula.
Los polos corresponden a los valores de k ′ tales que
′
√
iε

k = ± k ± iε ≈ ±k 1 ± 2 + O ε2 .
2 (2.31)
2k
58 2.3 Funciones de Green

Para el caso en que se suma +ε a la parte imaginaria los polos están en k ′ = k + iε̄ y
en k ′ = −k − iε̄ por lo que, en el camino de la figura 2.3 solo contribuye el primero.
En este caso se obtiene fácilmente, utilizando el teorema de Cauchy,
eikr
G+
k (r) = (2.32)
r
Análogamente, para el caso en que se suma −ε solo contribuye el polo que co-
rresponde a k ′ = −k + iε y se obtiene
e−ikr
G−
k (r) = (2.33)
r
Lo mismo se hubiera obtenido de considerar un camino en el semiplano inferior.
Tenemos entonces para la solución (2.23),
ˆ ±ik|r−r ′ |
± 1 3 ′e
ψk (r) = eik·r
− dr u (r ′ ) ψk± (r ′ ) (2.34)
4π |r − r ′ |
Que existan dos soluciones se debe a que la ecuación a resolver es de segundo
orden. Debemos entonces elegir la solución que se adecue a la condición de contorno
que impusimos, i. e. a una onda esférica saliente a grandes distancias. Es fácil con-
vencerse que, para r → ∞, es la solución ψk+ la que tiene el buen comportamiento.
En efecto, desarrollando el argumento del exponencial se tiene
√
k|r − r ′ | = k r2 − 2rr′ cos α + r′2 (2.35)
!1/2
2r′ r′2
= kr 1 − cos α + 2 (2.36)
r r
′
!
r·r 1

≈ kr 1 − 2 +O 2 (2.37)
r r
de manera que
ˆ
1 e±ikr ′ ′
ψk± (r) ik·r
=e − d3 r′ e∓ik ·r u (r ′ ) ψk± (r ′ ) (2.38)
4π r
donde hemos llamado k′ = k r̂. Tenemos entonces como solución acorde con las
condiciones de contorno a aquella que se escribe
ˆ
1 eikr ′ ′
+
ψk (r) = eik·r
− d3 r′ e−ik ·r u (r ′ ) ψk+ (r ′ ) . (2.39)
4π r
De esta expresión podemos identificar a la amplitud de dispersión fk (θ, φ), ya que
la habı́amos definido ası́:
eikr
ψr→∞ ∼ eik·r + fk (θ, φ) . (2.40)
r
Dispersión de partı́culas 59

Tendremos entonces
ˆ
m ′ ′
fk (θ, φ) = − d3 r′ V (r ′ ) ψk+ (r ′ ) e−ik ·r . (2.41)
2πℏ2

2.4. Aproximación de Born

Evidentemente, como no hemos resuelto la ecuación, no conocemos ψk+ por lo que
no conocemos fk (θ). Podemos sin embargo hacer una primera aproximación (llamada
de Born) que consiste, sin más, en tomar a ψk+ como la onda plana incidente. En tal
caso tendremos
ˆ
(1) m ′ ′ m
fk (θ, φ) = − 2
d3 r′ V (r ′ ) ei(k−k )·r = − V (k − k′ ) (2.42)
2πℏ 2πℏ2

donde V (q) es la transformada de Fourier del potencial evaluada en el momento

transferido q = k − k′ . Insertando este resultado en la fórmula (2.16),

dσ
= |fk (θ, φ)|2 (2.43)
dΩ
obtendremos la sección eficaz diferencial en la aproximación de Born
ˆ 2
dσ (0) 2 m2 3 ′ ′ i(k−k′ )·r ′
= fk (θ, φ) = 2 4 d r V (r ) e (2.44)
dΩ 4π ℏ

Notemos que en la aproximación de Born es conveniente considerar a la sección

eficaz diferencial, no como una función de los ángulos θ, φ, sino como función del
momento transferido q = k − k′ , como se ilustra en la figura 2.4.
En particular, para un potencial esféricamente simétrico, de
ˆ
4π
dΩ eiq·r = sin qr (2.45)
qr

obtenemos ˆ ∞
4π
V (q) ≡ V (q) = dr V (r)r sin qr (2.46)
q 0

Por lo tanto, la amplitud de dispersión sólo depende q ≡ |q| (recordar que k ′ = k):
h i1/2 θ
q = |k − k′ | = 2k 2 (1 − cos θ) = 2k sin (2.47)
2
El ángulo θ está ilustrado en la figura 2.4.
solo depende de q = lql (recordar que k' = k):
q = lk- k'I . J 2k 2 (1 - cos 0)] 112 = 2k sin;, (2.54)

~El. ángulo-0.. está ilustrado [Link] figura 2.6. Notemos que-en la aproximación de Bornes .
n -- •-···-·
conveniente considerar a la sección eficaz diferencial, no como una función del ángulo 0,
60 sino como función del momento transferido ·q. de Born
2.4 Aproximación

Fig. 2.6. El impulso transferido es q = k - k'.

Como ejemplo analizamos al potencial de Yukawa,
−µr
Como ejemplo analizamos al potencial e Yukawa,
V (r) = Vde
0 , (2.48)
µr
(2.55)
donde: (i) V0 no depende de r y (ii) a la cantidad 1/µ se la puede considerar como el
alcance del potencial, ya que V (r) tiende rápidamente a cero para r ≫ 1/µ. Usando
ˆ ∞ ˆ ∞ !
−µr −µr+iqr 1 q
e sin qrdr = Im e dr 48
= Im = 2 (2.49)
0 0 −µ + iq µ + q2

obtenemos,
2mV0 1
f (1) (q) = − (2.50)
µℏ q + µ2
2 2

que insertando en (2,16) da lugar a la fórmula:

!2 !2
dσ 2mV0 1
= (2.51)
dΩ µℏ2 4k 2 sin2 2θ + µ2

Es interesante observar que si µ → 0, al mismo tiempo que V0 /µ → ZZ ′ e2 , el

potencial de Yukawa se se reduce al potencial Coulombiano, y
!2
dσ 1 ZZ ′ e2 1
= θ (2.52)
dΩ 16 Ecin sin4 2

donde Ecin = ℏ2 k 2 /2m. El último resultado es precisamente la sección eficaz para

la dispersión de Rutherford que se obtiene clásicamente. (Ha desaparecido ℏ !) Sin
embargo, la obtención del resultado correcto es accidental, ya que la ec. (2.51) no es
válida para el potencial Coulombiano cuyo alcance es infinito.
Remarquemos las siguientes propiedades de la amplitud f (1) cuando se trata de
un potencial central:

1. f (1) depende solamente de q.

2. f (1) es siempre real. Notemos que esto lleva, en principio, a una dificultad
con respecto al teorema óptico (2.83). Como éste esencialmente expresa la
Dispersión de partı́culas 61

conservación del número de partı́culas, se dice que la aproximación de Born

no es conservativa. Sin embargo, la aproximación de Born es consistente, por
lo siguiente: f (1) es de orden V , luego σ es de orden de V 2 , y por lo tanto
según (2.83) la parte imaginaria de fk (θ, φ) también tendrá que ser de orden
V 2.
dσ
3. dΩ
no depende del signo del potencial.
′ ′
4. Para k pequeños [de (2.42) con ei(k−k )·r ≃ 1]
ˆ
m
(1)
f = − 2 V (r)r2 dr (2.53)
ℏ
dσ
y dΩ
es isotrópica.

5. f (1) es pequeña para valores grandes de q, debido a las oscilaciones rápidas

oscilaciones del integrando en (2.46).

Vamos a discutir ahora brevemente la validez de la aproximación de Born de

primer orden. De la deducción de la misma es obvio que será aplicable cuando
(+)
ψk (r) no sea muy diferente de ϕk (r) dentro del rango del potencial. En otras
palabras la modificación de la onda incidente tiene que ser pequena. De la ecuación
integarl, ec. (2.23) vemos que esta condición se satisface en el centro del potencial
dispersor (r = 0) cuando:
ˆ ikr′
m 1 ′e ′ ik·r ′
dr V (r ) e ≪ 1. (2.54)
ℏ2 2π r′

En particular, en el caso del potencial de Yukawa (2.48), y para bajas energı́as

′
(k ≪ µ) cuando es legı́timo reemplazar eik·r por 1 , resulta
Es interesante comparar este resultado con la condición para que el potencial de
Yukawa desarrolle un estado ligado, que es:
2m |V0 |
⩾ 2,7, (2.55)
ℏ2 µ2
con V0 = 0. En otras palabras, si el potencial es lo suficientemente atractivo como
para desarrollar un estado ligado, la aproximación de Born probablemente llevará a
un resultado incorrecto.
Se puede demostrar que, para el potencial de Yukawa, la condición para que el
segundo término de (2.23) sea pequeño, en el lı́mite de k grande implica
!
2m |V0 | k
2
ln ≪ 1. (2.56)
ℏ µk µ
62 2.5 Ondas parciales

2.5. Ondas parciales

El problema de la dispersión que estamos considerando no es más que la búsqueda
de soluciones de la ecuación de Schrödinger con energı́a positiva y que satisfacen las
condiciones de contorno (2.7). Concentrémonos en potenciales con simetrı́a esférica,
es decir, que depende sólo de |r| = r, V = V (r), para los cuales la ecuación de
Schrödinger es separable en coordenadas esféricas, y las soluciones pueden escribirse
en la forma
ψklm (r) = ψklm (r, θ, φ) = Rkl (r)Ylm (θ, φ), (2.57)
donde Ylm (θ, φ) son los armónicos esféricos, y

ukl (r)
Rkl (r) = , (2.58)
r
donde ukl es solución de la ecuación radial,
!
d2 2m l(l + 1)
− 2 + 2 V (r) + − k 2 ukl (r) = 0, (2.59)
dr ℏ r2

que satisface
ukl (0) = 0. (2.60)
Aquı́ hemos parametrizado a la energı́a positiva usando (2.5). En los problemas de
dispersión, tı́picamente V (r) es de rango finito b (es decir, que V (r) ≃ 0 para r > b
y por lo tanto puede despreciarse), y entonces para r grande las soluciones son de
la forma
Rkl (r) = Al jl (kr) + Bl nl (kr), r ⩾ b, (2.61)
donde jl y nl son las funciones de Bessel esféricas, relacionadas con las funciones de
Bessel de primera y segunda especie (o función de Neumann):

π
r
jl (x) = Jl+1/2 (x), (2.62)
2x
π
r
nl (x) = Nl+1/2 (x). (2.63)
2x
Al y Bl son dos constantes que deberı́an determinarse (para cada l) para que la
solución sea continua y bien comporatada en todo el espacio, para lo cual se necesi-
tarı́a resolver la ecuación para r < b, lo cual es muy engorroso. Para evitar este paso
concentrémonos en el comportamiento asintótico de la solución radial en r ⩾ b, que
es de la forma
sin(kr − lπ/2) cos(kr − lπ/2)
Rkl (r) = Al (k) − Bl (k) , r ⩾ b. (2.64)
kr kr
Dispersión de partı́culas 63

sin(kr − lπ/2) sin(kr − lπ/2 + δl )

for δl > 0

Figura 2.4: δl > 0 implica que la onda asintótica es empujada hacia adentro, mientras
que para δl < 0 es empujada hacia afuera.

Si el problema fuera el de una partı́cula libre, la solución (2.61) serı́a válida para
todo r y no sólo en forma asintótica. En este caso deberı́amos tomar Bl = 0 ya que
la función nl es divergente en el origen y buscamos soluciones regulares. La presencia
de un Bl no nulo viene determinada por el potencial, y cuanto más intenso sea éste,
mayor la dispersión que produce y más importante el Bl . Si escribimos en (2.61)

Bl = −Al tan δl (2.65)

obtenemos
sin(kr − lπ/2 + δl )
Rkl (r) ≃ Cl (2.66)
kr
donde Cl = Al / cos δl es otra constante. Observamos que el comportamiento asintóti-
co de la onda parcial l es el mismo que el de la partı́cula libre, pero con una fase
corrida en δl . Por ello δl se denomina corrimiento de fase producido por el potencial.
Estos corrimientos de fase (o phase shifts en inglés) dependen de la energı́a, o del
número de onda k en módulo. Veremos que la amplitud de dispersión y por lo tanto
las secciones eficaces ¡sólo dependen de los corrimientos de fase! y por lo tanto éstos
poseen toda la información que nos interesa. Entonces, en lugar de resolver la ecua-
ción diferencial completa para todos los valores de r, utilizaremos las expresiones
asintóticas (2.61), a las que le impondremos las condiciones de contorno.
Dado que en ausencia de potencial la función radial es
sin(kr − lπ/2)
Rkl (r) ∝ (2.67)
kr
Observamos que el efecto del potencial consiste en “empujar hacia dentro” a la
función de onda cuando δl > 0 o “empujarla para fuera” cuando δl < 0 (ver la figura
2.4).
La solución más general posible de energı́a definida (k fijo) es la superposición
X
ψk (r) = aklm Ylm (θ, φ)Rkl (r). (2.68)
lm
64 2.5 Ondas parciales

y resta encontrar los coeficientes aklm imponiendo las condiciones de contorno en

|r| → ∞, ecuación (2.7). El problema que se nos presenta es que la función de onda
incidente está expresada como una onda plana eik·r que es una solución de partı́cula
libre de la ecuación de Schrödinger que se obtiene separando la ecuación de onda en
coordenadas rectangulares, mientras que las soluciones (2.61) y (2.57) se obtienen
separándola en coordenadas esféricas. Para poder imponer condiciones de contorno,
necesitamos que todo esté expresado en el mismo lenguaje, y comparar bananas
con bananas. Esto es posible, ya que siendo ambas formas soluciones de la misma
ecuación, la onda plana incidente debe poder expresarse como una combinación lineal
de las soluciones (2.57) junto con (2.61). Vamos a omitir los detalles, y simplemente
escribir la expansión de la onda plana en armónicos esféricos. El lector interesado
puede consultar la Referencia [11] donde se muestra que
∗
eik·r = 4π il Ylm
X
(k̂)jl (kr)Ylm (r̂). (2.69)
lm

Si además utilizamos el teorema de adición para los armónicos esféricos,

4π X ∗
Y (k̂)Ylm (r̂) = Pl (k̂ · r̂) = Pl (cos γ), (2.70)
2l + 1 m lm

donde γ es el ángulo entre r y k, y Pl son los polinomios de Legendre, obtenemos

para la onda plana la expansión

eik·r = il (2l + 1)jl (kr)Pl (cos γ).

X
(2.71)
l

Tomemos al vector incidente k en la dirección del eje polar, por ser el eje de
simetrı́a rotacional del sistema. En tal caso, k · r → kr cos θ = kz. En ese caso,
además, el ángulo γ se reduce al ángulo θ, y entonces

eikz = il (2l + 1)jl (kr)Pl (cos θ).

X
(2.72)
l

Escribimos ahora la condición de contorno (2.7) expresada como expansión en

ondas esféricas,

eikr
il (2l + 1)jl (kr)Pl (cos θ) + fk (θ)
X
ψ|r|→∞ ∼ , (2.73)
l r

que utilizando la forma asintótica para jl se escribe

sin(kr − lπ/2) eikr

il (2l + 1)
X
ψ|r|→∞ ∼ Pl (cos θ) + fk (θ) . (2.74)
l kr r
Dispersión de partı́culas 65

Por otro lado, la forma asintótica de la solución general (2.75), para k en la dirección
del eje z es
X sin(kr − lπ/2 + δl )
ψk (r, θ) = akl Pl (cos θ) , r grande. (2.75)
l kr

donde reemplazamos la parte radial por su forma asintótica.

Igualando los coeficientes de e−ikr Pl (cos θ) en los lados derechos de (16,37) y
(16.39) obtenemos
−(2l + 1)il = −e−iδl (k) alk , (2.76)
o
alk = (2l + 1)il eiδl (k) . (2.77)
Si ahora igualamos el coeficiente de eikr ,
∞ ∞
X 2l + 1 X 2l + 1 2iδl (k)
Pl (cos θ) + fk (cos θ) = e Pl (cos θ) (2.78)
l=0 2ik l=0 2ik

obtenemos una expresión explı́cita para fk (θ) en términos de los corrimientos de

fase: ∞
1X
fk (θ) = (2l + 1)eiδl (k) sin δl (k)Pl (cos θ) (2.79)
k l=0
de manera que la sección eficaz diferencial toma la forma
∞
dσ 1 X
= |fk (θ)|2 = 2
(2l + 1) (2l′ + 1) eiδl (k) e−iδl′ (k)
dΩ k l,l′ =0 (2.80)
sin δl (k) sin δl′ (k)Pl (cos θ)Pl′ (cos θ)

La integral sobre Ω de esta sección eficaz diferencial da la sección eficaz total. Uti-
lizando la ortogonalidad de los polinomios de Legendre se obtiene finalmente:
ˆ ˆ 1 ∞
dσ dσ 4π X
σ = dΩ = 2π du = 2 (2l + 1) sin2 δl (k) (2.81)
dΩ −1 dΩ k l=0

Vemos que hemos obtenido una expresión muy simple para la sección eficaz de
dispersión en términos de los corrimientos de fase,
∞
4π X
σ= (2l + 1) sin2 δl (k), (2.82)
k 2 l=0

Si comparamos esta expresión con la ec. (16.43) que da fk (θ), se tiene la importante
relación
4π
σ= Im fk (θ = 0) (2.83)
k
66 2.5 Ondas parciales

Este resultado se conoce como el teorema óptico y refleja la conservación de la

probabilidad. Se llama ası́ por la analogı́a con lo que sucede con la luz cuando
atraviesa un medio. En efecto, cuando las ondas electromagnéticas inciden sobre un
centro dispersor, la sección eficaz del mismo es proporcional a la parte imaginaria de
la amplitud de dispersión de la onda. El cálculo que lleva a esta relación se hace a
partir de la potencia total absorbida por el centro dispersor, que a su vez se obtiene
de los vectores de Poynting de las ondas incidente y dispersada.
La sección eficaz total puede escribirse como
∞
4π 4π 1
(2l + 1) sin2 δl (k) = 2 (2l + 1)
X
σ= σl , σl = . (2.84)
l=0 k 2 k 1 + cot2 δl (k)

La segunda forma será utilizada con asiduidad en estas notas. La cantidad σl es

la sección eficaz parcial para la dispersión de la partı́cula en el estado l de impulso
angular. Notemos que la sección eficaz total σ no hay interferencia entre las diferentes
ondas parciales; este efecto, en cambio, está presente en la sección eficaz parcial
dσ/dΩ.

4π(2l + 1)
σl ⩽ 2
= 4π(2l + 1)λ̄2 (2.85)
k
Para visualizar el significado fı́sico de las ondas parciales es conveniente pensar
por un momento en términos clásicos, dividiendo el haz de partı́culas incidentes en
zonas cilı́ndricas de radios: (l + 1)λ̄ = λ̄, 2λ̄, 3λ̄ · · · (λ̄ = 1/k), como se muestra en
la Fig. (2.5). Todas las partı́culas con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l3 y

σlclásica ⩽ π(2l + 1)λ̄2 (2.87)

ya que π(2l + 1)λ̄2 es la superficie del anillo l-ésimo.

Comparando este último resultado con (2.160) vemos que la sección eficaz clásica
es menor en un factor 4. Esto se debe a la inevitable presencia de efectos de difracción
para los cuales es responsable la naturaleza ondulotoria de la materia; más detalles
se darán al discutir la dispersión por una esfera rı́gida.
Si el alcance del potencial es b, clásicamente habrá dispersión en el anillo l cuando
lλ̄ ⩽ b. De ahı́ se puede inferir que en caso cuántico y para un potencial de corto
alcance:
3
Como la dimensión transversal de una onda plana es infinita, es de esperar que contenga todos
los posibles valores del parámetro de impacto

ℓ = lℏ/p = lλ̄ (2.86)

Dispersión de partı́culas 67

Figura 2.5: Las partı́culas con con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l. El alcance del potencial es b.

contribuirá solamente un número limitado de ondas parciales con lmáx = kb,

si para un dado l es λ̄l ≫ b, será σl ≃ 0,
si λ̄ ≫ b solo σl=0 será apreciable (energı́as bajas),
si λ̄ ≪ b contribuyen todas las ondas parciales (energı́as altas).

2.5.1. Determinación de corrimientos de fase

Veamos como se determinan los δl (k) a partir de un potencial V . Supondremos
que V se anula para r > b, siendo b el rango del potencial. Para para r > b) la
función de onda tiene una forma asintótica que es superposición de ondas esféricas:
1 X l
ψk (r) = i (2l + 1)Rkl (r)Pl (cos θ) (r > b) (2.88)
(2π)3/2 l
con
Rkl (r) = Cl [cos δl (k)jl (kr) − sin δl (k)nl (kr)] . (2.89)
En la zona interior tendremos que resolver la ecuación radial de Schrödinger de ma-
nera aproximada, analı́ticamente, numéricamente, etc. Supongamos haber obtenido
tal solución Rkl (r) para 0 < r < b. En r = b, la función Rkl (r) y su derivada deben
ser continuas. Introducimos, entonces, la derivada logarı́tmica interior
!
1 dRkl (r)
αl (k) ≡ (2.90)
Rkl (b) dr r=b

que podemos evaluar por medio de (2.89):

cos δl (k)jl′ (kb) − sin δl (k)n′l (kb)
αl (k) = k (2.91)
cos δl (k)jl (kb) − sin δl (k)nl (kb)
68 2.5 Ondas parciales

que si conocemos las derivadas logarı́tmicas en r = b, podemos invertir y el corri-

miento de fase δl (k)
αl (k)nl (kb) − kn′l (kb)
cot δl (k) = . (2.92)
αl (k)jl (kb) − kjl′ (kb)
Esto significa que los corrimientos de fase dependen del potencial solamente por
medio de las derivadas logaritmicas correspondientes. Es más, la elección del punto
b es arbitraria (siempre que corresponda a la región donde el potencial se anula). Solo
necesitamos entonces integrar la ecuación radial desde r = 0 hasta b para obtener
los αl

Esfera rı́gida
Es interesante mencionar la dispersión por una esfera rı́gida de radio b. El po-
tencial es 
∞ para r ⩽ b
V (r) = (2.93)
0 para r > b
En este problema ni siquiera necesitamos de los αl (que valen ∞). Solamente tenemos
que saber que en r = b la función de onda se anula ya que la esfera es impenetrable.
Será Rl (r)|r=b = 0 y de (2.89),

cos δl jl (kb) − sin δl nl (kb) = 0 (2.94)

Por lo tanto conocemos los corrimientos de fase para todo l,

nl (kb)
cot δ[Link]. = , (2.95)
jl (kb)
sin haber hecho ninguna aproximación. Las secciones eficaces parciales resultan, de
(2.160) y (2.95)
4π jl2 (kb)
σl = 2 (2l + 1) 2 (2.96)
k jl (kb) + n2l (kb)
En particular para l = 0 (veremos mas adelante que la onda s, o con l = 0 es de
particular importancia a bajas energias), usando que
sin x cos x
j0 (x) = , n0 (x) = − , (2.97)
x x
hallamos
− cos kb/kb
cot δ0 (k) = = − cot kb, (2.98)
sin kb/kb
o δ0 = −kb, y
sin2 kb
σ0 = 4π (2.99)
k2
Dispersión de partı́culas 69

Figura 2.6: La función rR0 (r). La curva punteada es para V = 0 y se comporta

como sin kr. La curva sólida, desplazada en b = −δ0 /k, corresponde a la dispersión
de la onda s por la esfera rı́gida.

La función de onda radial s es, a menos de una fase,

sin kr cos kr sin (kr + δ0 )
R0 (r) ∼ cos δ0 + sin δ0 = . (2.100)
kr kr kr
Luego, si representamos u0 (r) = rR0 (r) en función de r, obtenemos una onda
sinusoidal, que comparada con la onda libre sinusoidal está corrida en b = −δ0 /k;
ver figura 2.6.

Pozo esférico finito

Consideremos ahora el potencial representado por

−V para r ⩽ b
0
V (r) = (2.101)
0 para r > b

con V0 > 0 para el potencial atractivo. La solución externa para la función de onda
estará de nuevo dada por (2.89),
>
Rkl (r) = Cl [cos δl (k)jl (kr) − sin δl (k)nl (kr)] . (2.102)

Mientras que la solución interior sólo contiene a la jl pues la función de Neumann

es divergente en el origen,
<
Rkl (r) = Dl jl (k̄r), (2.103)
con
1q
k̄ = 2m (E + V0 ). (2.104)
ℏ
70 2.5 Ondas parciales

Observemos de (2.104) que para un potencial atractivo, V0 > 0, la función de

onda en r < b tendrá una curvatura mayor que en r > b. Podemos convencernos
fácilmente que al crecer el potencial lentamente desde cero hasta su valor final,
la función de onda tenderá a oscilar cada vez más rápidamente en la región del
potencial, como se ilustra en la figura 2.7, y disminuir su longitud de onda allı́. Esto
es consistente con que la onda se vea “empujada hacia adentro”, lo que ocurre para
δl > 0.
La Fig. 2.7 sugiere que un potencial atractivo puede ser lo suficientemente fuerte
como para empujar a la onda parcial l = 0 en 180◦ . Lo interesante de este caso es que,
por ser sin2 δ0 = 0, resulta: σl=0 = 0. Y si, además, la energı́a de la partı́cula incidente
es lo suficientemente baja, para que se puedan despreciar las contribuciones de las
ondas parciales con l > 0, habrá una perfecta transmisión de la onda incidente
(σ = 0). Este fenómeno se conoce como el efecto de Ramsauer-Townsen y fue
observado experimentalmente. Por ejemplo, al bombardear los átomos de los gases
raros con electrones, la sección eficaz presenta un mı́nimo pronunciado para una
energı́a incidente de ≃ 0,7 eV.
Los corrimientos de fase se obtienen igualando derivadas logarı́tmicas dentro y
fuera del potencial, o calculando la derivada logarı́tmica interior (2.90),

jl′ (k̄b)
αl (k) = k̄ , (2.105)
jl (k̄b)

e insertándola en (2.92). Resulta

k̄nl (kb)jl′ (k̄b) − kn′l (kb)jl (k̄b)

cot δl (k) = . (2.106)
k̄jl (kb)jl′ (k̄b) − kjl′ (kb)jl (k̄b)

Por ejemplo, para la onda s tenemos

bα0 (k) = k̄b cot k̄b − 1 (2.107)

y por lo tanto
kb + k̄b cot k̄b cot kb
cot δ0 (k) = . (2.108)
kb cot kb − k̄b cot k̄b

2.5.2. Matriz de dispersión

Observemos que existe otro par de soluciones linealmente independientes de la
parte radial la ecuación de Schrödinger para partı́culas libres en coordenadas esféri-
cas. Estas son las funciones de Hankel esféricas, que se definen como

hl (x) = jl (x) + inl (x) (2.109)

Dispersión de partı́culas 71

Figura 2.7: Un potencial atractivo “empuja para dentro” a la función de onda dis-
persada. Para esto, disminuye la longitud de onda dentro del pozo.
72 2.5 Ondas parciales

la de primera especie, junto con

h̄l (x) = jl (x) − inl (x) (2.110)
la de segunda especie. Su expansión asintótica es
ei(kr−lπ/2) e−i(kr−lπ/2)
hl (kr) ∼ , h̄l (kr) ∼ ; (2.111)
kr kr
hl (kr) representa entonces una onda esférica saliente, mientras que h̄l representa la
onda entrante. En esta base, podemos escribir la solución de la ecuación radial con
energı́a positiva como
h i
Rkl (r) = Dl h̄l (kr) + Sl (k)hl (kr) (2.112)
Dl y Sl son funciones de k que deben determinarse y pueden expresarse en términos
de Cl y δl . En particular,
Sl (k) = e2iδl (k) (2.113)
y es llamada la matriz de dispersión o matriz S 4 .
Observemos que
|Sl (k)| = 1 (2.114)
lo que se conoce como relación de unitariedad para la onda parcial l, e indica que
sólo puede haber un cambio de fase en la onda saliente.
Dado que los corrimientos de fase sólo dependen del potencial a través de la
derivada logarı́tmica, veamos cómo se expresa Sl mediante ésta. Si reemplazamos en
(2.91),
cos δl (k)jl′ (kb) − sin δl (k)n′l (kb)
αl (k) = k , (2.115)
cos δl (k)jl (kb) − sin δl (k)nl (kb)
los senos y cosenos por e±iδl , e introducimos a notación en términos de las funciones
de Hankel, es inmediato despejar
h̄′ (kb)
h̄l (kb) αl (k) − k h̄l (kb)
l

Sl (k) = − × ′ . (2.116)
hl (kb) αl (k) − k hl (kb)
hl (kb)

Observemos que para el caso la esfera rı́gida la derivada logarı́tmica en r = b es

infinita, y la matriz S se reduce a
[Link]. h̄l (kb)
[Link]. (k) ≡ e2iδl (k)
=− . (2.117)
hl (kb)
4
Puede llamar la atención que se la llame “matriz”. Como el potencial es central, las ondas
parciales con los distintos l se dispersan de manera independiente unas de otras, y entonces la
matriz Sl es diagonal. Para un potencial más general, las ondas parciales estarı́an acopladas, y la
matriz S tendrı́a dos ı́ndices, Sll′
Dispersión de partı́culas 73

Se deja como ejercicio mostrar que este resultado coincide con (2.95). Usando es-
te resultado para reemplazar el primer factor del lado derecho de la ec. (2.116).
Entonces
h̄′ (kb)
αl (k) − k h̄l (kb)
Sl (k) = Sl (k)[Link]. × l
h′l (kb)
. (2.118)
αl (k) − k hl (kb)
Otra forma útil de escribir la matriz S en términos de los corrimientos de fase
es la siguiente: escribimos
eiδl cos δl + i sin δl cot δl + i
Sl = e2iδl = = = (2.119)
e−iδl cos δl − i sin δl cot δl − i
con esta podemos obtener una expresión para Sl a partir de cot δl . Por ejemplo, para
el pozo finito y l = 0, usando (2.108) obtenemos

kb − ik̄b cot k̄b

S0 (k) = [Link]. (k) × (2.120)
kb + ik̄b cot k̄b
con
cot kb − i
[Link]. (k) = − (2.121)
cot kb + i

2.5.3. Extension analitica de la matriz de dispersion

Consideremos ahora un potencial atractivo y de corto alcance, de modo que
V (r) = 0 para r ⩾ b, y consideremos las soluciones de la ecuación de Schrödinger
radial [véase (2.59) y (2.58)] de energı́a negativa en la región r ⩾ b. Estas son de la
forma
Rnl (r) = Cnl hl (iκn r) (2.122)
donde hl es la función de Hankel (2.109), que posee un comportamiento asintótico
exponencialmente decreciente hl (ix) ∼ e−x /ix.5 La energı́a de estas soluciones se
parametriza como
ℏ2 κ2n
En = − (2.123)
2m
donde κn es una cantidad real. Para determinarla, y con ello los valores de las
energı́as, debemos igualar las derivadas logarı́tmicas a derecha e izquierda de la
función de onda en r = b. Se obtiene la ecuación
h′l (iκb)
αl (iκ) = iκ (2.124)
hl (iκb)
5
La función de Hankel esférica de segunda especie h̄l (x) = jl (x) − inl (x) es linealmente inde-
pendiente de la de primera especie, pero para argumento imaginario, su comportamiento asintótico
es exponencialmente creciente, h̄(ix) ∼ e+x /ix, y entonces debe descartarse en este problema.
74 2.5 Ondas parciales

cuyas soluciones son κ = κn . Es interesante destacar que si pensamos a la variable

real k extendida a todo el plano complejo,

k → k = k + iκ, (2.125)

y extendemos la matriz S para el problema de energı́as positivas (2.118), como

función de k a Sl (k), observamos que ésta posee polos para

h′l (kb)
αl (k) = k . (2.126)
hl (kb)
Como la derivada logarı́tmica interior αl es la misma para ambos problemas, esto
significa que la matriz S, pensada como una función en todo el plano complejo Sl (k)
tiene polos en cada uno de los estados ligados k = iκn .
Existe entonces una ı́ntima relación entre los estados ligados y los estados de
dispersión, y la descripción teórica que engloba tanto a las soluciones de la ecua-
ción de Schrödinger con energı́as positivas como con energı́as negativas proviene de
considerar la extensión analı́tica de la matriz de dispersión (2.113).
De (2.119),
cot δl + i
Sl = (2.127)
cot δl − i
observamos que la condición sobre el corrimiento de fase para que Sl (k) tenga un
polo es
cot δl (k) = i, (2.128)
de manera que si disponemos de los corrimientos de fase, a partir de ellos podemos
buscar los estados ligados del potencial.
Para entender fı́sicamente por qué aparecen los estados ligados como polos de Sl
volvamos por un momento al comportamiento asintótico de la función de dispersada
en el lenguaje de las funciones de Hankel (2.109), que para l = 0 es proporcional a

e−ikr eikr
+ Sl=0 (k) . (2.129)
r r
Comparémosla con la función de onda para un estado ligado para r > b
e−κL r
(2.130)
r
La existencia de un estado ligado implica que existe una solución no trivial de la
ecuación de de Schrödinger con E < 0 para un valor particular (discreto) de κL .
Podemos argumentar que e−κL r /r es como e−ikr /r excepto que k es ahora imaginario
puro. Una diferencia importante entre (2.129) y (2.130), además de k → iκL , es que
en el caso del estado ligado no tenemos el análogo de la onda incidente e−ikr /r. Lo
Dispersión de partı́culas 75

que es de interés fı́sico es el cociente entre los coeficientes de eikr /r y e−ikr /r que
es Sl=0 (k). En el caso del estado ligado podemos sostener la onda saliente (con k
imaginario) sin que exista la onda incidente. Por lo tanto el cociente es ∞, lo que
significa que Sl=0 (k) tiene un polo en k = iκL . Es decir que el estado ligado implica
un polo (que se puede mostrar que es un polo simple) sobre el eje positivo imaginario
del plano complejo de k. La región para la dispersión fı́sica corresponde a k real y
positivo (k = k) y a δ0 (k) real.
La estructura de la matriz S, sin embargo, es incluso más rica y puede contener
polos fuera del eje imaginario. Consideremos la esfera rigida, cuya matriz S es (2.117)

[Link]. h̄l (kb)

[Link]. (k) ≡ e2iδl (k)
=− . (2.131)
hl (kb)

Usando expresiones explicitas para las funciones de Hankel esféricas, obtenemos para
la extension analı́tica de los distintos valores de l,

[Link]. (k) = e−2ikb , (2.132)

kb − z1 −2ikb
[Link]. (k) = − e , z1 = i, (2.133)
kb − z1∗
(kb + z2 )(kb − z2∗ ) −2ikb √
[Link]. (k) = e , z2 = −3i − 3, (2.134)
(kb − z2 )(kb + z2∗ )
... (2.135)

Por un lado sabemos que la esfera rı́gida no pose estados ligados, y observamos que
los polos de Sl no están en el eje imaginario positivo (es facil verlo para l = 0, 1, 2
pero se puede mostrar para todo valor de l). Por otro lado, vemos que su S1 posee
polos para k = −i/b, es decir, para κ = −1/b que resulta ser negativo. S2 también
tiene polos con parte imaginaria negativa. Si los estados ligados correspondı́an a
polos en el eje k imaginario positivo, y sus funciones de onda resultaban soluciones
normalizables de energı́a negativa de la ecuación de Schrödinger, los estados con
κ < 0 corresponden a polos de la matriz S en el semiplano inferior de k. En este
caso, las soluciones de la ecuación de Schrödinger no son normalizables (divergen
exponencialmente), y por lo tanto, no son fı́sicas. En general se denominan virtuales
o antiligadas. Sin embargo, veremos que hay un tipo particular de solución del
semiplano inferior que sı́ resulta ser fı́sica y que corresponde a estados metaestables
o cuasiestacionarios, llamados resonancias. Antes de estudiarlas analicemos algunas
propiedades de la matriz S.
76 2.5 Ondas parciales

2.5.4. Propiedades de la matriz S

Discutiremos ahora algunas propiedades generales de la matriz S. Demostremos
primero que la generalización de la condición de unitariedad (2.114) es

Sl (k)Sl∗ (k∗ ) = 1 (2.136)

Para simplificar los cálculos vamos a hacer la demostración para l = 0, usando la

ecuación radial (2.59) que ahora escribimos como
2m
u′′ (k, r) − 2
V (r)u(k, r) + k2 u(k, r) = 0, u(k, 0) = 0 (2.137)
ℏ
Las soluciones de de esta ecuación continen dos constantes arbitrarias, que tomare-
mos como u(k, 0) y una constante multiplicando toda la amplitud. Luego, ignorando
la segunda,

u(k, r) ∝ e−ikr − S(k)eikr (2.138)

1 −ikr
∝− e + eikr . (2.139)
S(k)

donde en la segunda lı́nea sacamos −S(k) como factor común (que ignoramos, ya
que se lo asignamos a la constante de proporcionalidad).
Consideremos el reemplazo k → −k. La ec. (2.137), incluyendo las condiciones
de contorno en r = 0, es invariante con respecto a este cambio, mientras que para
u(−k, r) obtenemos
u(−k, r) ∝ −S(−k)e−ikr + eikr . (2.140)
Vemos que (2.139) y esta son la misma solución de la misma ecuación y por lo tanto,
al igualarlas, obtenemos
Sl (k)Sl (−k) = 1 (2.141)
Del mismo modo escribimos (2.137) para k∗
2m
u′′ (k∗ , r) − V (r)u (k∗ , r) + k∗2 u (k∗ , r) = 0 (2.142)
ℏ2
y tomamos el complejo conjugado, resulta
2m
u′′∗ (k∗ , r) − V (r)u∗ (k∗ , r) + k2 u∗ (k∗ , r) = 0 (2.143)
ℏ2
donde, una vez más, u∗ (k∗ , r) es una función de k y no de k∗ . De nuevo la última
ecuación es la misma que (2.137) y (2.138) toma la forma

u∗ (k∗ , r) ∼ eikr − S ∗ (k∗ ) e−ikr , (2.144)

Dispersión de partı́culas 77

que al comparar con (2.139) nos lleva a (2.136). De (2.136) y (2.141) es fácil ver que
también se satisface la relación

Sl (−k∗ ) = Sl∗ (k∗ ) , (2.145)

Como consecuencia de estas relaciones, se verifica que:

Si Sl (k) tiene un cero para un valor complejo k1 , entonces

Sl (k) ∝ (k − k1 ). (2.146)

Luego,
Sl∗ (k∗ ) ∝ (k − k1∗ ). (2.147)
Y por lo tanto, de (2.136)

1 1
Sl (k) = ∝ . (2.148)
S ∗ (k∗ ) k − k1∗

tendrá que tener necesariamente un polo en k1∗ .

De (2.145), si Sl (k) tiene un polo para un valor complejo k1 , tendrá que tener
necesariamente otro polo en −k1∗ .

Se puede verificar inmediatamente que las expresiones (2.132)-(2.135) para la

esfera rı́gida satisfacen estas propiedades.

2.5.5. Resonancias
Para un potencial atractivo V (r), el potencial efectivo que ve la partı́cula inci-
dente es:
ℏ2 l(l + 1)
Vefec (r) = V (r) + (2.149)
2mr2
donde el último término es la barrera centrı́fuga (ver la figura 2.8). Los estados
con energı́a corresponden a los estados ligados. Sin embargo, podrı́an existir esta-
dos cuasi ligados, con energı́a positiva, dentro de la barrera, estos corresponden a
los estados resonantes. ¿Por qué cuasi ligados? En general, salvo que posean una
energı́a mayor que la barrera, las partı́culas incidentes son detenidas por la barrera
centrı́fuga. Eventualmente, sin embargo, puede atravesar la barrera por el efecto
túnel y permanecer un cierto tiempo dentro del pozo. Cuando la partı́cula incidente
llega con una energı́a próxima a la energı́a resonante tiene una mayor probabilidad
de ser atrapada en un estado cuasi-ligado. Esta mayor probabilidad, a su vez, se
verá refleja en el aumento de la sección eficaz, como veremos más adelante.
78 2.5 Ondas parciales

E ℏ2 l(l+1)
2mr 2

Vefec (r)
n
Estados resonantes r
n
Estados ligados

V (r)

ℏ2 l(l+1)
Figura 2.8: Potencial efectivo resulta de sumar el término centrı́fugo 2mr2
al po-
tencial V (r).

Al extender k al plano complejo, la energı́a tambien se vuelve compleja6 ,

iΓ ℏ2 k2 ℏ2 2
E→E=E− = = k − κ2 + 2ikκ , (2.150)
2 2m 2m
de donde
ℏ2 ℏ2
E = (k 2 − κ2 )
, Γ = −2kκ . (2.151)
2m 2m
Para comprender el significado de cada tipo de polo en el plano k estudiamos el
comportamiento completo de la función de onda (2.112), incluyendo su dependencia
temporal. Como estamos interesados en los polos de la matriz S, donde es infinita,
sólo tenemos en cuenta el término hl que corresponde a la onda saliente ∼ e+ikr . La
función de onda resulta

u (k, r; t) ∼ eikr e−iEt/ℏ = eikr e−iEt/ℏ e−κr e−Γt/2ℏ . (2.152)

Aunque un estado con κ > 0 crece exponencialmente con la r, observamos que para
k > 0, Γ resulta positivo, y entonces la función de onda se atenúa exponencialmente
en el tiempo y resulta ser fı́sicamente aceptable; se trata de un estado en decaimiento
(véase la figura 2.9). Como además debe tener energı́a positiva, de (2.151) tenemos
que |k| > |κ|. Entonces estos estados resonantes en decaimiento corresponden a polos
de S(k) en el sector entre el eje k real positivo y la bisección del cuarto cuadrante.
6
Valores complejos de energı́a son usados en la fı́sica para describir los estados no-estacionarios
de un sistema. Como ya vimos en la sección 1.8, la cantidad Γ determina la probabilidad de
decaimiento y se llama constante de decaimento; Γ será positiva si la función de onda decrece con
el tiempo (que es el caso de un decaimieto radioactivo) o negativa si la norma de la función de
onda aumenta con el tiempo, que corresponde a los procesos de captura (por ejemplo, cuando el
núcleo átomico captura a un nucleón).
Dispersión de partı́culas 79

r = vT

r=b

Figura 2.9: Representación esquemática de la onda emergente en una realización

fı́sica (aproximada) del decaimiento de un estado resonante en t = T . Para r > b
la onda es saliente (kR > 0) y aumenta con la distancia (κR < 0). Este incremento
refleja precisamente el hecho de que las partı́culas que están en r = vT fueron
emitidas en un tiempo t = −T cuando la intensidad de la fuente fue mayor.

Por otra parte, la relación (2.145) nos dice que tiene que existir también un
polo en el tercer cuadrante. Este necesariamente debe corresponder al proceso de
captura de la partı́cula, o a la formación de la resonancia. Sin embargo, para este polo
la función de onda resulta, además de exponencialmente creciente con r, creciente
con t. Esto debemos entenderlo de la siguiente forma: Con nuestro requerimiento
S = ∞, las ondas entrantes están siempre excluidas, pero durante el perı́odo de
formación del estado, estas últimas tienen que estar presentes también. Por lo tanto,
no estamos describiendo una situación fı́sicamente realizable. Pero, podemos obtener
una realización fı́sica aproximada del decaimiento del estado resonante, suponiendo
que el sistema fue formado en un tiempo muy anterior al momento de la medición.
Finalmente para relacionar los polos de S(E) con los de S(k) tenemos que hacer
la transformación de k en E. El plano k se trasformará en una superficie de Riemann
de dos hojas en el plano E. Si estas hojas se juntan a lo largo del semi eje 0 < E < ∞,
donde se encuentran los estados fı́sicos de dispersión, la primera hoja corresponde
al semi-plano superior de k:
S(k) = S(E); (κ ⩾ 0). (2.153)
Los valores de S(E), en la primera y segunda hoja de Riemann, para la lı́nea de
ramificación 0 < E < ∞, están relacionados por
S(E + iϵ) = S ∗ (E − iϵ); (E > 0) (2.154)
ya que en lı́mite ϵ → 0, E ± iϵ corresponde, respectivamente, a ±k.
En resumen, los polos de la matriz S están distribuidos de la siguiente manera:
80 2.5 Ondas parciales

estados ligados (k = 0, κ > 0; E < 0, Γ = 0): sobre el semi-eje κ > 0 en el

plano k (sobre el semi-eje E < 0 de la primera superficie de Riemann en el
plano E).
estados resonantes en formación (k < 0, κ < 0; E > 0, Γ < 0): en el tercer
cuadrante del plano k (en el primer cuadrante de la segunda superficie de
Riemann del plano E).
estados resonantes en decaimiento (k > 0, κ < 0; E > 0, Γ > 0): en el cuar-
to cuadrante del plano k (en el cuarto cuadrante de la segunda superficie de
Riemann del plano E).
estados virtuales (k = 0, κ < 0; E < 0, Γ = 0): sobre el semi-eje κ < 0 en el
plano k (sobre el semi-eje E < 0 de la segunda superficie de Riemann en el
plano E).
La región para la dispersión fı́sica corresponde a k real y positivo (k > 0, κ = 0)
y al semi-eje E > 0 de la primera superficie de Riemann en el plano E. Los polos en
otras regiones del plano k también se denominan virtuales. Los estados virtuales de
una partı́cula son similares a las resonancias. En estos estados, la barrera centrı́fuga
de confinamiento está ausente, pero el potencial presenta un gran salto en su región
lı́mite (r = b, por ejemplo, en la esfera rı́gida), lo que, a su vez, provoca un salto en
la longitud de onda de la partı́cula, y una atenuación exponencial de la función de
onda hacia el interior del pozo. Las resonancias y los estados virtuales son fenómenos
especı́ficamente cuánticos que no tienen contraparte en la fı́sica clásica.

2.5.6. Dispersión a bajas energı́as

Como ya vimos, cuando λ̄ = 1/k es comparable a o mayor que el rango b, las on-
das parciales con l grandes no son en general importantes. Examinemos brevemente
el comportamiento de δl para valores pequeños de k. Usando que para x pequeño7 ,
xl (2l − 1)!!
jl (x) ∼ , nl (x) ∼ − , (2.156)
(2l + 1)!! xl+1
donde (2l + 1)!! ≡ (2l + 1)(2l − 1) · · · 5 · 3 · 1, para kb ≪ 1 tenemos que (2.92),
αl (k)nl (kb) − kn′l (kb)
cot δl (k) = . (2.157)
αl (k)jl (kb) − kjl′ (kb)
7
Observemos que para l = 0, tenemos
cos x 1
n0 (x) = − ≈− , x ≪ 1, (2.155)
x x
consistente con identificar (−1)! = 1
Dispersión de partı́culas 81

se aproxima como
(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)
cot δl (k) ≃ . (2.158)
(kb)2l+1 l − bαl (k)
Cuando kb → 0, αl (k) → αl (0) que resulta ser finito en la mayorı́a de los casos
de interés8 . Como cot x ∼ 1/x para x chico, tenemos que

(kb)2l+1 l − bαl (0)

δl (k) ∼ (2.159)
(2l − 1)!!(2l + 1)!! l + 1 + bαl (0)
Observamos que, para momentos bajos, los corrimientos de fase disminuyen a medida
que l aumenta, y lo mismo ocurre con las secciones eficaces,
4π
σl = 2
(2l + 1) sin2 δl (k) ∼ k 4l . (2.160)
k
Esto es previsible: la barrera centrı́fuga l(l + 1)/r2 es más alta para l mayor. Clási-
camente, esto impedirı́a que los modos de baja energı́a la penetren y alcancen la
esfera. En mecánica cuántica, solo las colas exponenciales de estos modos alcanzan
r = b, por lo que su dispersión se ve suprimida. Vemos entonces que para energias
incidentes suficientemente bajas, las contribuciones a la sección eficaz de todas las
ondas parciales con l ⩾ 1, pueden despreciarse, y entonces la sección eficaz total
resulta σ ≈ σ0
Esto también implica que a bajas energias la dispersión es isotrópica, dado que
la amplitud de dispersión eq. (2.79) solo conserva el primer término que, por ser
P0 (cos θ) = 1 es independiente de los ángulos.

Longitud de dispersión
Si tenemos en cuenta con cuidado las constantes α0 (0) el resultado para el corri-
miento de fase de la onda s es

δ0 (k) = −ak + O(k 2 ) (2.161)

donde definimos
b2 α0 (0)
a= (2.162)
1 + bα0 (0)
como la longitud de dispersión. La sección eficaz a bajas energı́as se escribe en
términos de esta en la forma

σ ≈ σ0 = 4πa2 1 + O(k 4 ) (2.163)
8
Puede verificarse que αl (0) es finita en el pozo cuadrado, ecuación (2.105) y lo es en general
para cualquier potencial.
82 2.5 Ondas parciales

En el caso de la esfera rı́gida, αl = ∞, y la ec. (2.95) se reduce a:

(2l − 1)!!(2l + 1)!!

cot δ[Link]. (k) ≃ − , (2.164)
(kb)2l+1

de donde también vemos que es correcto ignorar todos los δl con l ̸= 0 y que además,
en especial
δ[Link]. (k) = −kb, (2.165)
y
σ[Link]. = 4πb2 , para kb ≪ 1. (2.166)
Comparando los resultados generales (2.161) y (2.163) con los de la esfera rı́gida
(2.165) y (2.166) Podemos concluir que a muy bajas energı́as el potencial actúa,
cualquiera sea su forma, como una esfera rı́gida de radio igual a la longitud de
dispersión. Puesto que las longitudes de onda son muy grandes, las partı́culas no
logran ver los detalles del potencial.
Es interesante comparar este resultado con el que se obtiene a altas energı́as
kb ≫ 1. Para ello, necesitamos propiedades adicionales de las funciones esféricas
de Bessel. Aquı́ simplemente enunciamos los resultados. Los corrimientos de fase δl
varı́an entre 0 y 2π para l ≲ kb. Sin embargo, cuando l < kb, los corrimientos de
fase caen rápidamente a cero. La intuición detrás de esto se desprende del análisis
semiclásico, que indica que para l ≫ kb, el parámetro de impacto es ℓ ≫ b. Por
lo tanto, no sorprende que no se produzca dispersión en este régimen. Resulta que,
cuando kb → ∞, la sección eficaz total se convierte en σ → 2πb.
Para profundizar el significado fı́sico de a partimos de la solución externa para
la onda s (2.100) para el problema de dispersión por un potencial de corto alcance
en el lı́mite kr ≪ 1:
sin(kr + δ0 ) C0
u0 (r) = C0 → (kr cos δ0 + sin δ0 ) (2.167)
k k
Recordando que ul (0) = 0, podemos dibujar tres diferentes casos, como muestra la
figura 2.10. Si nos preguntamos para que otro valor de r se anula la función de onda,
encontramos de (2.167) que eso ocurre en r = −k −1 tan δ0 , que es exactamente la
relación (??) que define a la longitud de dispersión. Tenemos entonces una interpre-
tación geométrica para a y una manera de visualizar a la relación (2.163). Mientras
que para la esfera rı́gida u0 (r) se anula en r = b y la sección eficaz está dada por
(2.166), en el caso general u0 (r) se anula en r = a y σ está dada por (2.163). La
única deferencia es que a puede ser negativa.
Para ver el significado del signo de a, analicemos de la ecuación radial
2m
u′′0 (r) − V (r)u0 (r) + k 2 u0 (r) = 0; u0 (0) = 0 (2.168)
ℏ2
Dispersión de partı́culas 83

Figura 2.10: Función de onda u0 (r) para (a) potencial repulsivo, (b) para potencial
atractivo, y (c) para una atracción major. La intersección de lı́mkb→0 u0 (r) con el eje
r se muestra en cada uno de los tres casos.

para k = 0. En la región donde V (r) es atractivo (negativo) u′′ (r) es negativa (si u(r)
es positiva) y por lo tanto tiene que ser cóncava hacia abajo. Cuanto más negativo es
V (r) tanto major es la concavidad. La cuestión es si la concavidad es suficiente para
curvar a u(r) y orientarla hacia abajo mientras que actúa el potencial, Esto, a su vez,
está ı́ntimamente relacionado con la existencia del estado ligado, ya que para que
haya un estado ligado es necesario que, para r > b, u(r) se junte con una función de
la forma e−κL r , cuya pendiente es negativa. (Notemos que para valores pequeños de
−κL r −1
κL , e es también esencialmente una recta y a = κL . En resumen, si el potencial
es suficientemente atractivo producirá un estado ligado y a será positiva. En el caso
contrario a es negativa y la función de onda crece exponencialmente para distancias
grandes. En ese caso estamos en presencia de un estado virtual.
84 2.5 Ondas parciales

Estados ligados a bajas energias

Consideremos un estado débilmente ligado, es decir que satisface κL b ≪ 1. Po-
demos usar entonces la expresión para argumento pequeño de hl (x),

(2l − 1)!!
hl (x) ∼ −i , x ≪ 1, (2.169)
xl+1
y obtener de (2.124):
l+1
αl (iκL ) = − (2.170)
b
o equivalentemente

l + 1 + bαl (iκL ) = 0; para κL b ≪ 1 (2.171)

Esta es la condición, a orden κL b, para que exista un estado ligado con EL ≃ 0. Más
precisamente, (2,171) es la condición para tener un estado ligado con

ℏ2 κ2L ℏ2
|EL | = ≪ . (2.172)
2m 2mb2
Luego, en el caso de existir un tal estado, por la continuidad de αl (k), la cantidad
(l + 1 + bαl (k = 0)) será pequeña. La expresión (2.158) para cot δl (k),

(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)

cot δl (k) ≃ (2.173)
(kb)2l+1 l − bαl (k)

nos indica que cot δl (k) será pequeño, y por lo tanto la sección eficaz parcial
4π 4π 1
σl (k) = sin2 δl (k) = 2 . (2.174)
k 2 k 1 + cot2 δl (k)

esto implica que el valor relativo de sin δl (y por lo tanto de σl ) será incrementado
con respecto al valor que tendrı́a de no existir el estado ligado9 .

Dispersión resonante a bajas energı́as

Sabemos que a energı́as muy bajas la dispersión ocurre dominantemente en el
canal s. Examinaremos ahora los procesos de dispersión a energı́as un poco más altas
para que las ondas con l ⩾ 1 también entren en juego. Supondremos, sin embargo,
9
Cuidado, los términos de orden κb hacen la diferencia entre cot δl = 0, que se obtendrı́a al
llevar (2.171) a (2.173) y el resultado (2.128), cot δl = i, que es la condición correcta para un estado
ligado. Por ejemplo, para l = 0 la función de onda del estado ligado es h0 (iκL r) ∼ −e−κL r /κL r
y de (2.124), en lugar de (2.171), se obtiene 1 + bα0 (iκL ) + κL b = 0, que al ser usada en (2.173)
conduce a cot δ0 ≃ (1 + bα0 (iκL )) / (−bα0 (iκL )) / (iκL b) = (−κL b) / (1 + κL b) / (iκL b) ≃ i
Dispersión de partı́culas 85

σl

Ancho a media altura = ΓR

0 E
ER

Figura 2.11: Pico resonante en la energı́a ER , con un ancho igual a ΓR . Cuando

E = ER ± Γ2R , σl (E) cae a la mitad de su valor máximo que alcanza para E = ER ,
y por lo tanto ΓR es el ancho de la resonancia.

que kb continúa siendo lo suficientemente pequeño para que la aproximación de

cot δl (k) a bajas energı́as, ec. (2.158),

(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)

cot δl (k) ≃ . (2.175)
(kb)2l+1 l − bαl (k)

siga siendo válida. De esta vemos que si estamos cerca de la energı́a ER = kR2 ℏ2 /2m,
para la cual l + 1 + bαl (k) pasa por cero, i. e. si

l + 1 + bαl (kR ) = 0, para kR b ≪ 1. (2.176)

cot δl (E) también pasará por cero. [Nótese la similitud con (2.171)]. En esta situación
σl será proporcional a k −2 y por lo tanto relativamente grande. Este tipo de salto
en la sección eficaz se denomina resonancia (o dispersión resonante); véaser la figura
2.11.
Expandiendo αl (E) en torno a ER , obtenemos:
!
∂αl (E)
αl (E) = αl (ER ) + (E − ER ) + ··· , (2.177)
∂E E=ER

y de (2.176) resulta:
!
∂αl (E)
l + 1 + bαl (E) ≃ (E − ER ) b . (2.178)
∂E E=ER
86 2.5 Ondas parciales

δl

π
2

0 E
ER

Figura 2.12: Comportamiento de δl (E) cerca de una resonancia.

Luego la ec. (2.158) se puede ahora expresar en la forma (l − bαl (E) ≃ 2l + 1):
2 (E − ER )
cot δl (E) ≃ − , (2.179)
ΓR
donde
2k 2l+1 b2l
ΓR = −
∂αl (E)
(2.180)
[(2l − 1)!!]2 ∂E E=ER

∂αl (E)
(Se puede demostrar que para el decaimiento de un estado resonante ∂E
<
E=ER
0 y por lo tanto ΓR > 0.) Es decir que cerca de una resonancia
4π Γ2R
σl (E) = (2l + 1) (2.181)
k2 4 (E − ER )2 + Γ2R
que es la formula de Breit-Wigner representada en la figura 2.11 De la ecuación
(2.180) vemos que, cuanto más rápidamente varı́a αl (E) con respecto a E tanto más
angosta será la resonancia. También se ve que cuanto menor sea el valor de kb y
mayor el valor de l para el cual ocurre la resonancia, tanto mayor será el ancho ΓR .
Para l ⩾ 1 la resonancia se produce cada vez que cot δl (E) se anula, o cuando:
1

δl (ER ) = +n π (2.182)
2
donde n es un entero. Además de (2.178) vemos que cerca de la resonancia δl (E) se
comporta como: !
π E − ER
δl (E) = + arctan . (2.183)
2 ΓR /2
Dispersión de partı́culas 87

Es decir que al pasar E por ER , el corrimiento de fase varı́a bruscamente desde un

valor próximo a cero (más nπ ) a un valor próximo a π (más nπ ); el salto se produce
en un pequeño intervalo de enrgı́a de orden de ΓR , como se ilustra en la figura 2.12.
La condición (2.176) para una resonancia es muy similar a la condición (2.171) para
un estado ligado.
Capı́tulo 3

Partı́culas Idénticas

La indistinguibilidad de las partı́culas constituyentes de un sistema fı́sico, o sea

la no existencia de propiedades fı́sicas que permitan identificarlas individualmente,
tiene consecuencias mucho más radicales en el contexto de la Mecánica Cuántica
que en la Mecánica Clásica. Veamos esto con más detalles.
Cuando en la mecánica clásica enfrentamos el estudio de un sistema con dos o
más partı́culas idénticas (es decir, partı́culas indistinguibles por tener masa, carga,
momento angular y cualquier otra propiedad fı́sica idéntica) nada cambia en la
manera en que aplicamos las leyes de la cinemática y la dinámica respecto del caso
de una única partı́cula o de varias partı́culas diferentes.
Si se trata de partı́culas idénticas, podemos, eventualmente “numerarlas” (por
ejemplo, para dos partı́culas escribiendo las coordenadas con un subı́ndice r1 , r2 , etc.
para distinguir a las dos partı́culas) y entonces, conocida la posición y velocidad de
cada partı́cula del sistema en un instante inicial podemos, en el caso de la mecánica
clásica, seguir sus trayectorias aplicando las leyes de Newton, y reconocer en el
estado final cuál partı́cula ha seguido cada una de las trayectorias.
Es evidente que lo anterior no es posible en el caso de la mecánica cuántica.
Básicamente, esta imposibilidad se debe a que, eliminada la noción de trayectoria
(por el principio de incerteza), aunque sepamos con precisión absoluta la posición
inicial de cada partı́cula idéntica del sistema, al no poder seguir o calcular trayecto-
rias individuales pues el momento pi estarı́a indeterminado, no podremos saber en
el estado final cuál partı́cula es la que ocupa una dada posición. En otras palabras,
las situaciones a) y b) de la figura no pueden diferenciarse. Al intentar medir algún
observable, a lo sumo podremos medir la densidad de probabilidad de encontrar a
las partı́culas, y ambas situaciones darán lugar a la misma distribución de probabili-
dad. Esto se conoce como principio de indistinguibilidad cuántico: Si un sistema está
constituido por dos partı́culas idénticas 1 y 2 , la densidad de probabilidad asociada
al sistema no permite determinar cuál de ellas es la partı́cula “1” y cuál la “2”. Esto

88
Partı́culas Idénticas 89

implica que debe verificarse la identidad

|Ψ(1, 2)|2 = |Ψ(2, 1)|2 (3.1)

lo cual nos dice que la función de onda debe satisfacer

Ψ(1, 2) = exp(iα)Ψ(2, 1) (3.2)

Esto resultado es interesante dado que si bien el observable fı́sico permanece inva-
riante frente a la permutación de partı́culas, ¡la función de onda no tiene por que
hacerlo! Sin embargo, esta condición es demasiado débil. La indistinguibilidad im-
pone que el Hamiltoniano sea invariante frente a la permutación de partı́culas, y
esto a su vez impone valores precisos que puede tomar el valor de α.

3.1. Permutaciones y simetrı́as

Consideremos primero el caso de dos partı́culas idénticas, con la función de onda
Ψ(1, 2); el ı́ndice 1 especifica las coordenadas espaciales r1 y de spin s1 y análoga-
mente el ı́ndice 2. A la partı́cula descripta por el primer argumento de la función
de onda la llamaremos primera partı́cula y a la descripta por el segundo argunn-
to segunda partı́cula. Es decir que Ψ(1, 2) es la amplitud de observar la primera
partı́cula en el punto r1 con el valor de spin s1 y la segunda partı́cula en el punto r2
con el valor de spin s2 . Nótese que al proponer estos nombres no estamos agregando
ninguna información adicional y tanto la matemática como los aparatos de medición
tendrán que tratar a las dos partı́culas de forma totalmente equivalente.
Decir que dos partı́culas son idénticas significa que no existe ninguna interac-
ción que pueda diferenciarlas. En otras palabras, todo operador que corresponde a
un observable fı́sico tiene que ser simétrico con respecto a las coordenadas de las
partı́culas. Por ejemplo, un Hamiltoniano de lla forma

p21 p2
H= + 2 + Vpar (|r1 − r2 |) + Vext (r1 ) + Vext (r2 ) (3.1)
2m 2m
es simétrico con respecto al intercambio de los indices 1 y 2. Aquı́ Vpar es la in-
teracción entre las dos partı́culas, y Vext representa el acoplamiento con un campo
externo.
Es conveniente introducir en este punto un operator P12 , cuya acción consiste
en intercambiar o permutar a la partı́cula 1 y la partı́cula 2, i.e. un operador de
permutación de partı́culas:

P12 Ψ(1, 2) = Ψ(2, 1). (3.3)

90 3.1 Permutaciones y simetrı́as

Debe cumplirse que

2
P12 Ψ(1, 2) = P12 Ψ(2, 1) = Ψ(2, 1), (3.4)
para cualquier función Ψ(1, 2), y por lo tanto
2
P12 = 1. (3.5)

Ahora, dado que el Hamiltoniano es simétrico respecto del intercambio de partı́cu-

las, conmuta con este operador,

[P12 , H] = 0 (3.6)

Esta simetrı́a, llamada simetrı́a de intercambio, implica que el Hamiltoniano po-

see una degeneración, la degeneración de intercambio1 : si considero a Ψ(1, 2) una
autofunción de H con energı́a E,

HΨ(1, 2) = EΨ(1, 2) (3.9)

entonces, la autofunción Ψ(2, 1) = P12 Ψ(1, 2) también es autofunción de H con la

misma energı́a:

HΨ(2, 1) = HP12 Ψ(1, 2) = P12 HΨ(1, 2) = EP12 Ψ(1, 2) = EΨ(2, 1). (3.10)

Para clasificarlas, buscamos los autovalores y autofunciones de P12

P12 Ψp (1, 2) = λp Ψp (1, 2) (3.11)

Por (3.5) tenemos

Ψp (1, 2) = λ2p Ψ(1, 2), (3.12)
o,
λ2p = 1, (3.13)
es decir que
λp = ±1, (3.14)
1
Supongamos que tenemos un operador O que conmuta con H, y tomemos un autoestado de
H con energı́a E:
H|ψ⟩ = E|ψ⟩ (3.7)
Entonces, la función |ϕ⟩ = O|ψ⟩ también es autofunción de H con la misma energı́a. En efecto,

H|ϕ⟩ = HO|ψ⟩ = OH|ψ⟩ = EO|ψ⟩ = E|ϕ⟩ (3.8)

Salvo que correspondan a la misma autoestado(cosa que podrı́a ocurrir) forman un espacio dege-
nerado
Partı́culas Idénticas 91

debido a que el operador de permutación es hermı́tico. Podemos clasificar entonces

a las funciones de onda en simétricas y antisimétricas respecto al intercambio de
partı́culas:

P12 ΨS (1, 2) = +ΨS (1, 2) (3.15)

P12 ΨA (1, 2) = −ΨA (1, 2) (3.16)

que podemos construit a partir de Ψ(1, 2) como:

1
ΨS (1, 2) = √ [Ψ(1, 2) + Ψ(2, 1)] , (3.17)
2
1
ΨA (1, 2) = √ [Ψ(1, 2) − Ψ(2, 1)] , (3.18)
2
√
donde hemos introducido el factor 1/ 2 por razones de normalización. Obviamente
si Ψ(1, 2) es una autofunción de H, las funciones de onda ΨS (1, 2) y ΨA (1, 2) lo son
de H y de P12 .
Podemos también definir los operadores de simetrización y de antisimetrización
como:
1
S12 ≡ √ (1 + P12 ) , (3.19)
2
1
A12 ≡ √ (1 − P12 ) , (3.20)
2

Al aplicar S12 o A12 a una combinación lineal arbitraria de Ψ(1, 2) y Ψ(2, 1) la función
de onda resultante es necesariamente simétrica o antisimétrica respectivamente; en
efecto:
( )
S12 1 1
[aΨ(1, 2) + bΨ(2, 1)] = √ [aΨ(1, 2) + bΨ(2, 1)] ± √ [aΨ(2, 1) + bΨ(1, 2)]
A12 2 2
(3.21)
a±b
= √ [Ψ(1, 2) ± Ψ(2, 1)]. (3.22)
2

Las consideraciones anteriores se pueden extender a sistemas que tienen más de

dos partı́culas idénticas. Definimos:

Pij Ψ(1, 2, . . . , i, . . . , j, . . . N ) = Ψ(1, 2, . . . , j, . . . , i, . . . N ) (3.23)

Obviamente, igual que antes:

Pij2 = 1 (3.24)
92 3.1 Permutaciones y simetrı́as

y los autovalores permitidos de Pij son +1 y −1. Es importante notar que en general
[Pij , Pki ] ̸= 0 (3.25)
aunque sı́ conmutan en el caso en que i, j ̸= k, l. Un Hamiltoniano H(1, 2, . . . , N )
totalmente simétrico debe verificar
[H, Pki ] = 0 (3.26)
Decimos que una función de onda Ψ (1, 2, . . . N ) es totalmente simétrica o totalmente
antisimétrica si:
Pij ΨS (1, 2, . . . , i, . . . , j . . . N ) = +ψS (1, 2, . . . , i, . . . , j, . . . N ) , (3.27)
Pij ΨA (1, 2, . . . , i, . . . , j, . . . N ) = −ψA (1, 2, . . . , i, . . . , j, . . . N ) (3.28)
para todo Pij . Para construirlas, extendemos las definiciones de los proyectores de
simetrización y antisimetrización en la forma
N! N!
1 X 1 X
S=√ Pν , A= √ (−1)sν Pν (3.29)
N ! ν=1 N ! ν=1
donde la suma se extiende sobre todas las N ! permutaciones Pν de las N partı́culas y
sν es la firma o signatura de la permutación Pν (es decir, el número de transposiciones
en Pν ), de manera que (−1)sν es igual +1 si la permutación es par o a −1 para una
permutación impar. Las funciones simetrizadas resultan entonces,
N!
1 X
ΨS (1, 2, . . . , N ) = √ Pν Ψ(1, 2, . . . , N ) (3.30)
N ! ν=1
N!
1 X
ΨA (1, 2, . . . , N ) = √ (−1)sν Pν Ψ(1, 2, . . . , N ). (3.31)
N ! ν=1
Por ejemplo, para tres partı́culas,
1
S = √ (1 + P12 + P12 P13 + P13 + P23 P13 + P23 ) , (3.32)
3!
1
A = √ (1 − P12 + P12 P13 − P13 + P23 P13 − P23 ) . (3.33)
3!
Y entonces las funciones simétricas y antisimétricas resultan
1
ΨS (1, 2, 3) = √ [Ψ(1, 2, 3) + Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.34)
6
+ Ψ(3, 2, 1) + Ψ(3, 1, 2) + Ψ(1, 3, 2)] (3.35)
1
ΨA (1, 2, 3) = √ [Ψ(1, 2, 3) − Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.36)
6
− Ψ(3, 2, 1) + Ψ(3, 1, 2) − Ψ(1, 3, 2)]. (3.37)
Partı́culas Idénticas 93

En total hay 3! = 6 funciones de onda diferentes. Las restantes cuatro:

1
ΨI (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(2, 3, 1) − Ψ(3, 2, 1)] (3.38)
2
1
ΨII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(3, 1, 2) − Ψ(1, 3, 2)] (3.39)
2
1
ΨIII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(2, 1, 3) − Ψ(3, 1, 2)] (3.40)
2
1
ΨIV (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(1, 3, 2) − Ψ(2, 3, 1)] (3.41)
2
no son totalmente simétricas ni totalmente antisimétricas.
Experimentalmente se verifica que la función de onda que describe a un sistema
de N partı́culas idénticas es o bien totalmente simétrica, o totalmente antisimétrica.
En el primer caso se dice que las partı́culas obedecen la estadı́stica de Bose-Einstein
(BE) y se conocen como bosones, y en el segundo caso decimos que satisfacen la
estadı́stica de Fermi-Dirac (FD) y hablamos de fermiones. Resumiendo,

Pij Ψ(N bosones idénticos ) = +Ψ(N bosones idénticos ), (3.42)

Pij Ψ(N fermiones idénticos ) = −Ψ(N fermiones idénticos ). (3.43)

Es notable que la simetrı́a mixta no ocurre en la naturaleza. Pero es más no-

table todavı́a la correspondencia entre el spin de las partı́culas y la estadı́stica que
obedecen:

partı́culas con spin entero (S = 0, 1, 2, . . .) son bosones

partı́culas con spin semi-enter (S = 12 , 32 , . . .) son fermiones.

En la mecánica cuántica no-relativista esta correspondencia tiene que ser aceptada

como un postulado empı́rico y para entenderla habrı́a que utilizar el formalismo
relativista.
Supongamos ahora que estamos estudiando las propiedades de un átomo de
hidrógeno localizado en La Plata, y nos hacemos la siguientes preguntas: ¿Por qué
las funciones de onda de un solo electrón describen correctamente las propiedades
del átomo de hidrógeno? ¿No tendrı́amos que tomar en cuenta a todos los demás
electrones que existen en el universo, y construir una función de onda totalmente
antisimétrica para todos estos electrones, incluyendo el nuestro? La respuesta es
que no tenemos que antisimetrizar ya que no existe ninguna superposición entre la
función de onda de nuestro electrón y las funciones de onda de los demás electro-
nes. Para ver esto más claramente supongamos que la función de onda de nuestro
electrón es ϕL (r) y que tenemos otro electrón en Paris que describimos por medio
94 3.1 Permutaciones y simetrı́as

de la función de onda ϕP (r). También suponemos que las funciones de onda no se

superponen,es decir que:

ϕL (r)ϕP (r) = 0 para todo r (3.44)

La función de onda antisimetrizada y normalizada es:

1
Ψ (r1 , r2 ) = √ [ϕL (r1 ) ϕP (r2 ) − ϕH (r1 ) ϕL (r2 )] , (3.45)
2
y la probabilidad de encontrar un electrón en el punto r es
ˆ ˆ
P (r) = dr2 |Ψ (r, r2 )| + dr1 |Ψ (r1 , r)|2 ,
2
(3.46)

es decir, igual a la probabilidad de que el electrón 1 esté en el punto r y el electrón

2 en cualquier otro punto más la probabilidad de que el electrón 2 esté en el punto
r y el electrón 1 en cualquier otro punto del espacio. Luego:
ˆ ˆ
2 ′ ′ 2 2 2
P (r) = |ϕL (r)| dr |ϕP (r )| + |ϕP (r)| dr ′ |ϕL (r ′ )| (3.47)
ˆ !
∗ ′ ∗ ′ ′
− 2 Re ϕL (r)ϕP (r) dr ϕL (r ) ϕP (r ) (3.48)

y por ser ϕL (r)ϕ∗P (r) = 0, se cumple que

P (r) = |ϕL (r)|2 + |ϕP (r)|2 (3.49)

Si el punto r está en La Plata, será P (r) = |ϕL (r)|2 , ya que un electrón que está en
Parı́s tiene probabilidad nula de encontrarse en La Plata. De tal modo obtenemos
el mismo resultado como si de entrada nos hubiésemos olvidado de todos los demás
electrones. La regla es: tenemos que antisimetrizar o simetrizar la función de onda de
un conjunto de fermiones o bosones solamente para las partı́culas que son relevantes.
Otra pregunta: ¿Cómo son las funciones de onda de sistemas formados por
partı́culas idénticas compuestas, tales como átomos? Consideremos, por ejemplo,
la función de onda Ψ(re1 , rp1 , re2 , rp2 ), que describe a dos átomos de hidrógeno; re1
es la posición del electrón del primer átomo, rp1 es la posición del protón del primer
átomo, etc. Ψ(re1 , rp1 , re2 , rp2 ) cambiará de signo si intercambiamos las coordenadas
de los electrones o de los protones. En cambio, no habrá ningún cambio de signo si
intercambiamos las coordenadas de un electrón con las coordenadas de un protón,
por ser partı́culas diferentes. Por otro lado, si intercambiamos los dos átomos entre
sı́, será

Ψ(re1 , rp1 , re2 , rp2 ) = −Ψ(re2 , rp1 , re1 , rp2 ) = Ψ(re2 , rp2 , re1 , rp1 ) (3.50)
Partı́culas Idénticas 95

y por lo tanto los átomos de hidrógeno se comportan como bosones. Es fácil con-
vencerse que la regla general es: las partı́culas compuestas que contienen un número
par de fermiones y cualquier número de bosones se comportan como bosones, mien-
tras que áquellas con un número impar de fermiones y cualquier número de bosones
se comportan como fermiones. Por ejemplo, los átomos de 4 He se comportan como
bosones y los de 3 He como fermiones.
En este punto conviene detenerse un poco para preguntarse: ¿Que significa la
palabra partı́cula, o más bien que es una partı́cula elemental? Supongamos que es-
tamos haciendo un experimento con el helio lı́quido, que está formado por átomos de
4
He. A muy bajas temperaturas las colisiones en el fluido no son lo suficientemente
energéticas como para excitar al átomo desde su estado fundamental y el átomo
de 4 He puede ser tratado como una partı́cula elemental de spin cero. En cambio,
cuando irradiamos el lı́quido con luz ultravioleta aparecen en el espectro de absor-
ción los estados excitados del átomo y el 4 He ya no podrá ser tratado como una
partı́cula elemental. Los datos experimentales en este caso los podemos interpretar
satisfactoriamente utilizando un modelo de tres partı́culas: un núcleo atómico con
spin igual a cero (partı́cula α) y dos electrones de spin 21 . Al cambiar la sonda que
usamos para estudiar el sistema, por otra de energı́a ⩾ 25 MeV (por ejemplo rayos γ)
descubrimos que la descripción anterior ya no es más válida: la partı́cula α se puede
romper y entramos al dominio de la fı́sica nuclear, donde las partı́culas elementales
son los nucleones. Para energı́as ⩾ 140 MeV hay producción de piones, que tam-
bién tienen que ser considerados. Aumentando más todavı́a la energı́a de la sonda
hallamos que el nucleón tiene varios estados excitados. Por lo tanto no podrá seguir
siendo tratado como una partı́cula elemental; se recurre al modelo de los quarks en
el cual el nucleón está formado por tres quarks. Podemos concluir entonces que: el
concepto de partı́cula elemental y el tamaño espacio de Hilbert necesario para una
descripción adecuada del sistema depende del dominio de energı́a en el cual stamos
trabajando.
La antisimetrı́a de la función de onda para fermiones idénticos implica que la pro-
babilidad de hallar dos fermiones idénticos en el mismo punto es nula. Más precisa-
mente: dos fermiones idénticos no pueden ocupar el mismo punto espacial si sus spi-
nes están orientados en la misma dirección. Este es el principio de exclusión de Pauli,
que se demuestra muy fácilmente. En efecto, como ΨA (2, 1, 3, . . .) = −ΨA (1, 2, 3, . . .)
vemos que si 1 = 2, resulta ΨA (1, 1, 3, . . .) ≡ 0.

3.2. Interacción de intercambio

Consideremos el caso de partı́culas idénticas, cargadas, en presencia de un campo
eléctrico constante. Hemos aprendido en el curso de mecánica cuántica I que en este
caso, el Hamiltoniano H no incluye términos con operador de spin S, es decir que H
96 3.2 Interacción de intercambio

es diagonal en lo que respecta al spin) y la función de onda se factoriza trivialmente

en una parte que depende solo de las coordenadas ri , i = 1, 2, . . . , N y otra que
depende solo de las variables de spin, si ,

Ψ (r1 , r2 , . . . , rN ; s1 , s2 , . . . , sN ) = Φ (r1 , r2 , . . . , rN ) Υ (s1 , s2 , . . . , sN ) (3.51)

Nótese que el hecho de que H no contenga al operador de spin no implica que la

partı́cula cuya dinámica es gobernada por H no tenga spin.
En principio, el factor Υ de la función de onda es arbitrario ya que como el Ha-
miltoniano no contiene al spin, H solo determina la dependencia de las coordenadas.
O sea que parecerı́a que podemos olvidar el spin para resolver tal problema. Pero si
se trata de un sistema de partı́culas idénticas, veremos que la necesidad de simetrı́a
o antisimetrı́a de la función de onda completa (i.e., los dos factores incluı́dos) hace
que el spin juegue un rol aún en este caso.
Para comprender esto, volvamos al caso más simple, de dos partı́culas idénticas
que obedecen la ecuación de Schrödinger,

HΨ(r1 , r2 ; s1 , s2 ) = EΨ(r1 , r2 ; s1 , s2 ) (3.52)

con un Hamiltoniano en el que el operador de spin está ausente (no hay interacción
spin-órbita, no hay campo magnético, etc). Es decir un Hamiltoniano que podemos
escribir ası́:
H = Hc ⊗ Is (3.53)
donde los subı́ndices c y s indican los factores de coordenadas y de spin del producto
tensorial con el que debe escribirse el Hamiltoniano. En el caso presente el factor de
spin actúa trivialmente como la identidad en el espacio de las funciones de onda del
sistema.
Si escribimos a la función de onda como un producto,

Ψ (r1 , r2 ; s1 , s2 ) = Φ (r1 , r2 ) Υ(σ1 , σ2 ) (3.54)

entonces, para determinar los niveles de energı́a del sistema se estudia el problema
estacionario para el factor dependiente de las coordenadas.

Hψα (r1 , r2 ) = Eα Φα (r1 , r2 ) . (3.55)

En principio, a partir de las autofunciones de onda espaciales Φα podremos construir

autofunciones simétricas y antisimétricas.
Consideremos el caso en que se trata de bosones de spin cero. En tal caso, la
parte de spin que hemos llamado Υ en la ec. (3.51) estará ausente de la ec.(3.52).
Por tratarse de bosones, en general la función de onda Ψ debe ser simétrica por lo
que en este caso, sin spin, la función de onda de la parte espacial, que llamamos Φ,
es la única presente por ello debe ser simétrica.
Partı́culas Idénticas 97

Se trata entonces de un problema de dos bosones idénticos con un potencial

adecuado, por ejemplo coulombiano en que, intercambiarlos, equivale a una inversión
espacial, un cambio de paridad. En efecto, dado el vector r12 = r1 − r2 , el cambio
1 ↔ 2 equivale al cambio r12 → r21 = −r12 . En un desarrollo en armónicos esféricos,
las autofunciones con l impar cambiarán ante paridad por lo que quedan descartadas
en la construcción de estados simétricos.
Con este ejemplo hemos aprendido entonces que aunque el spin esté ausente
del Hamiltoniano, el hecho de que las partı́culas sean bosones idénticos a los que
se aplica el principio de indistinguibilidad que enunciamos, afecta la forma de la
función de onda. Hablamos por ello de una interacción de intercambio que produce
el efecto de prohibir los estados con l impar.
Si se tratara de fermiones de spin 1/2, la función de onda tendrı́a una parte
de spin Υ no trivial y, a pesar de estar el spin ausente del Hamiltoniano, debemos
encargarnos de construir las autofunciones que lo contienen. Como aclaramos al
iniciar este tema, consideramos el caso de la mecánica cuántica no relativista pero
en la que los espinores tienen dos componentes (espinores de Pauli). Tratándose
de dos partı́culas de spin 1/2, el spin total puede ser S = 0, 1, y podemos tener
cuatro estados posibles: un estado singlete con S = M = 0 y un triplete de estados
con S = 1, M = −1, 0, +1. Explı́citamente si denotamos estos estados por ΥSM
tendremos:
1
Υ00 (s1 , s2 ) = √ [Υ↑ (s1 ) Υ↓ (s2 ) − Υ↓ (s1 ) Υ↑ (s2 )] (3.56)
2
Υ11 (s1 , s2 ) = Υ↑ (s1 ) Υ↑ (s2 ) (3.57)
1
Υ10 (s1 , s2 ) = √ [Υ↑ (s1 ) Υ↓ (s2 ) + Υ↓ (s1 ) Υ↑ (s2 )] (3.58)
2
Υ1,−1 (s1 , s2 ) = Υ↓ (s1 ) Υ↓ (s2 ) (3.59)
donde Υσ (s), con σ =↑, ↓ son espinores con spin up y spin down respectivamente,
Υσ (s) = ⟨s|σ⟩ (3.60)
(Υ↑ (s =↑) = 1 y Υ↑ (s =↓) = 0, etc). Para que la función de onda total,
Ψ(1, 2) ≡ Φ (r1 , r2 ) ΥSM (s1 , s2 ) (3.61)
sea antisimétrica con respecto a la transformación: r1 ↔ r2 ; s1 ↔ s2 , la función de
onda radial Φ (r1 , r2 ) tendrá que ser simétrica con respecto al intercambio de r1 por
r2 cuando S = 0 y antisimétrica cuando S = 1.

3.3. Partı́culas Independientes

Es instructivo discutir la función de onda para N partı́culas idénticas que no
interactúan entre sı́ y que están con un pozo de potencial V (r), como el que se
98 3.3 Partı́culas Independientes

α=d

α=3
α=2
α=1

Figura 3.1: Niveles de energı́a de partı́culas independientes para un pozo de potencial

V (r).

muestra en la figura 3.1. El Hamiltoniano de una sola partı́cula es:

p21
H(1) = + V (r1 ) (3.62)
2m
y las autofunciones son φα (1) con energı́as εα :

H(1)φα (1) = εα φα (1) (3.63)

En el caso de N partı́culas independientes el Hamiltoniano será:

H = H(1) + H(2) + · · · + H(N ) (3.64)

y una de sus posibles soluciones es

Ψ(1, 2, . . . , N ) = φα1 (1)φα2 (2) · · · φαN (N ) (3.65)

donde la partı́cula 1 está en el nivel de energı́a εα1 , la partı́cula 2 está en el nivel de

energı́a εα2 , . . . la partı́cula N está en el nivel de energı́a εαN . La energı́a total es:

E = εα 1 + εα 2 + · · · εα N (3.66)

En general, la función de onda (3.65) no es una solución admisible para N partı́cu-

las idénticas, ya que no está simetrizada (o antisimetrizada) con respecto a ninguna
de las partı́culas. Notemos también que cualquier permutación de los ı́ndices en
1, 2, . . . N en (3.65) conduce a la misma energı́a, lo que se denomina degeneración
de intercambio. Por ejemplo, el vector

Ψ(2, 1, . . . N ) = φα1 (2)φα2 (1) · · · φαN (N ) (3.67)

Partı́culas Idénticas 99

tiene la misma energı́a que el vector Ψ(1, 2, . . . N ).

Para construir autofunciones admisibles para N partı́culas idénticas tenemos que
tomar combinaciones lineales de (3.65) y sus permutaciones, que sean totalmente
simétricas para bosones o totalmente antisimétricas para fermiones. Esto se consigue
con la aplicación de los operadores (3.29) sobre (3.65),
N!
1 X
ΨS (1, 2, . . . , N ) = √ Pν φα1 (1)φα2 (2) · · · φαN (N ), (3.68)
N ! ν=1
N!
1 X
ΨA (1, 2, . . . , N ) = √ (−1)sν Pν φα1 (1)φα2 (2) · · · φαN (N ). (3.69)
N ! ν=1
En particular, por ejemplo, para tres partı́culas idénticas las funciones de onda
normalizados son:
( )
ΨS (1, 2, 3) 1
= √ [φα1 (1)φα2 (2)φα3 (3) ± φα1 (2)φα2 (1)φα3 (3)
ΨA (1, 2, 3) 6
+ φα1 (2)φα2 (3)φα3 (1) ± φα1 (3)φα2 (2)φα3 (1)

+φα1 (3)φα2 (1)φα3 (2) ± φα1 (1)φα2 (3)φα3 (2)] (3.70)

que también podemos poner en la forma:

( ) φα1 (1) φα1 (2) φα1 (3)
ΨS (1, 2, 3) 1
=√ φα2 (1) φα2 (2) φα2 (3) (3.71)
ΨA (1, 2, 3) 3! φ (1) φ (2) φ (3)
α3 α3 α3 ±

donde el signo − corresponde al determinante y el signo + al “permanente”.

Al escribir (3.70) hemos supuesto implı́citamente que tenı́amos solo una partı́cula
por estado (o sea que α1 , α2 y α3 eran diferentes entre sı́). Vemos de inmediato que
no podemos tener más de un fermión por estado, ya que en ese caso se anula el
determinante. Esta es otra manera de expresar el principio de exclusión de Pauli.
En cambio, cualquier número de bosones puede ocupar el mismo estado. Notemos,
sin embargo, que en el último caso la función de onda no está normalizada a uno.
En particular, si α1 = α2 , la función de onda normalizada para tres bosones es:
1
√ [φα1 (1)φα1 (2)φα2 (3) + φα1 (1)φα2 (2)φα1 (3) + φα2 (1)φα1 (2)φα1 (3)}
3
φα1 (1) φα1 (2) φα1 (3)
1
=√ φα1 (1) φα1 (2) φα1 (3)
3!2! φ (1) φ (2) φ (3)
α2 α2 α2 +
(3.72)
100 3.3 Partı́culas Independientes

Podemos entonces generalizar los resultados anteriores para N partı́culas, resultan-

do:
φα1 (1) φα1 (2) · · · φα1 (N )
1 φα2 (1) φα2 (2) · · · φα2 (N )
ΨA (1, 2, . . . , N ) = √ .. .. .. (3.28)
N! . . .
φαN (1) φαN (2) · · · φαN (N ) −

para fermiones (determinante de Slater), y

φα1 (1) φα1 (2) · · · φα1 (N )

1 φα2 (1) φα2 (2) · · · φα2 (N )
ΨS (1, 2, . . . , N ) = q .. .. .. (3.28)
N !nα1 !nα2 ! · · · nαN ! . . .
φαN (1) φαN (2) · · · φαN (N ) +

para bosones, donde de las N partı́culas, nα1 están en el nivel α1 , nα2 están en el
nivel α2 , etc., y por supuesto que se verifica que nα1 + nα2 + · · · + nαN = N .
Como ejemplo, consideremos solamente dos bosones de spin cero y dos fermiones
de spin 21 que pueden ocupar solo dos niveles. Usaremos la notación: φ(1) ≡ φ(r, s) =
ϕ(r)Υ(s). Si los bosones fueran partı́culas distinguibles tendrı́amos 4 estados distin-
tos:

ϕα1 (r1 ) ϕα1 (r2 ) (3.73)

ϕα2 (r1 ) ϕα2 (r2 ) (3.74)
ϕα1 (r1 ) ϕα2 (r2 ) (3.75)
ϕα2 (r2 ) ϕα2 (r1 ) (3.76)

con energı́as 2εα1 , εα2 y εα1 + cα2 ; el último nivel de energı́a es dos veces degenerado.
Sin embargo, los dos últimos estados son fisicamente indistinguibles y el único estado
permitido de 2 bosones idénticos [uno en ϕα1 (r) y el otro en ϕα2 (r)] es:

1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] (3.77)
2

o sea que no existe la degeneración del nivel εα1 + εα2 . En el caso de fermiones,
a cada estado (3.76) le corresponderı́an 4 estados debido al spin. Sin embargo, el
Partı́culas Idénticas 101

principio de exclusión nos dice que los únicos estados permitidos son:
ϕα1 (r1 ) ϕα1 (r2 ) Υ00 (s1 , s2 ) (3.78)
ϕα2 (r1 ) ϕα2 (r2 ) Υ00 (s1 , s2 ) (3.79)
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] Υ00 (s1 , s2 ) (3.80)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ11 (s1 , s2 ) (3.31)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,0 (s1 , s2 ) (3.81)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,−1 (s1 , s2 ) (3.82)
2
con energı́as 2εα1 (singlete), 2εα2 (singlete) y εα1 + εα2 (un singlete y 3 tripletes).

3.4. Átomos con dos electrones

Los átomos más simples, después del átomo de hidrógeno, son aquellos que tienen
solamente dos electrones, tales como He, H− , Li+ y Be++ . La interacción spin-órbita
es una perturbación pequeña en átomos livianos y se puede despreciar en una primera
aproximación. Luego el Hamiltoniano es de la forma
H(1, 2) = H0 (1, 2) + V12 (3.83)
donde
p21 p2 Ze2 Ze2
H0 (1, 2) = + 2 − − (3.84)
2m 2m r1 r2
e2
V12 = (3.85)
|r1 − r2 |
En la aproximación de orden cero cada electrón está en el potencial Coulombiano
−Ze2 /r y el estado de energı́a más baja es aquel en el cual los dos electrones están
en el estado 1s de ese potencial, que resulta ser un singlete:
Ψ0 (1, 2) = ϕ1s (r1 ) ϕ1s (r2 ) Υ00 (s1 , s2 ) (3.86)
donde 3/2
1 Z

ϕ1s (r) = √ e−Zr/a0 (3.87)
π a0
y a0 es el radio de Bohr,
ℏ2
a0 = (3.88)
me2
102 3.4 Átomos con dos electrones

Dentro de la misma aproximación, la energı́a del estado fundamental es2

(0) Z 2 e2
E0 = 2ε1s = − = −2Z 2 Ry. (3.89)
a0
La corrección de primer orden se obtiene del valor medio de V12 para el estado (3.86):
ˆ
e2
∆E0 = d1d2 Ψ†0 (1, 2) Ψ0 (1, 2), (3.90)
|r1 − r2 |
donde ˆ ˆ
X
d1 ≡ dr1 . (3.91)
s1

Como
Υ†SM (s1 , s2 ) ΥSM (s1 , s2 ) = 1
X
(3.39)
s1 s2

obtenemos: 6 ˆ
e2 Z e−2Z(r1 +r2 )/a0

∆E0 = 2 dr1 dr2 (3.40)
π a0 |r1 − r2 |
Para hacer la integral usamos la relación:
ˆ
1 dk eik·(r1 −r2 )
= (3.92)
|r1 − r2 | 2π 2 k2
y entonces
6 ˆ ˆ 2
Z dk

∆E0 = e 2
dre−2Zr/a0 +ik·r . (3.93)
a0 2π 4 k 2
Como además, ˆ
16πZ/a0
dre−2Zr/a0 +ik·r = (3.94)
[k 2 + (2Z/a0 )]2
resulta: ˆ ∞
4Ze2 dx 5 Ze2
∆E0 = = (3.44)
πa0 0 (x2 + 1)4 8 a0
Es decir que la energı́a del estado fundamental en primer orden perturbativo es:

Ze2 5

(1) (0)
E0 = E0 + ∆E0 = − Z− (3.95)
a0 8
(1)
Para el átomo de helio Z = 2 y E0 = −5,5 Ry = −74, 8 eV, mientras que el valor
experimental es E0exp = −78,8 eV.
2
El Ry es una unidad de energı́a que corresponde a 1 Ry = e2 /2a0 = 13,6056923 eV.
Partı́culas Idénticas 103

Consideremos ahora el estado excitado que resulta de promover un electrón del

estado 1s al sstado 2s. De acuerdo a (3.82) las correspondientes funciones de onda
son:

ΨS=0,M =0 (1, 2) = ΦS (r1 , r2 ) Υ0,0 (s1 , s2 ) (3.96)

ΨS=1,M (1, 2) = ΦA (r1 , r2 ) ΥS=1,M (s1 , s2 ) (3.97)

donde ( )
ΦS (r1 , r2 ) 1
= √ [ϕ1s (r1 ) ϕ2s (r2 ) ± ϕ1s (r2 ) ϕ2s (r1 )]
ΦA (r1 , r2 ) 2
y
3/2
1 Z Zr − 2a
Zr
ϕ2s (r) = √ 2− e 0 (3.98)
4 2π a0 a0
(1) (0)
La energı́a perturbada es: E1 (S) = E1 + ∆E1 (S) donde3

(0) 3 Z 2 e2
E1 = ε1s + ε2s = −
4 a0
y * +
e2
∆E1 (S) = = D ± I,
|r1 − r2 |
con
ˆ
e2
D= dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r1 ) ϕ2s (r2 ) (3.99)
|r1 − r2 |
ˆ
e2
I = dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r2 ) ϕ2s (r1 ) (3.50)
|r1 − r2 |

El signo + corresponde a los estados de S = 0 y el − a S = 1.

Los elementos de matriz D e I se denominan, respectivamente, directo y de
intercambio. D es necesariamente positivo y los cálculos muestran que I tambı́een
(1) (1)
es positivo. Vemos por lo tanto que E1 (S = 0) > E1 (S = 1), o sea que la energı́a
del estado singlete es mayor, como se muestra en la figura ??. Para el átomo de helio
los valores experimentales son:

−4, 182
Ry = −56, 87 eV singlete - parahelio
E1exp =  (3.100)
−4, 350 Ry = −599, 16 eV triplete - ortohelio

de donde se obtiene que D ∼

= 23, 58 eV y I ∼
= 1,14 eV.
3
La perturbación es diagonal porque no conecta estados con distinto spin.
104 3.5 El método del “campo autoconsistente” a vuelo de pájaro

La interpretación fı́sica es la siguiente. En el caso del singlete la función de onda

espacial es simétrica y los dos electrones tienden de estar juntos. Luego el efecto de
la interacción Coulombiana es mayor, lo que hace que el estado singlete este menos
ligado. Es importante notar que, aunque el Hamiltoniano (3.83) no depende de spin,
la energı́a sı́ depende del spin total de los dos electrones; esta dependencia proviene
de la estadı́stica de Fermi-Dirac.

3.5. El método del “campo autoconsistente” a vue-

lo de pájaro
Cuanto más complejos se hacen los átomos, más complicado resulta un trata-
miento similar al utilizado en el caso del helio para determinar los niveles de energı́a.
Debe entonces apelarse a otras aproximaciones, entre las cuales se cuenta la del cam-
po autoconsistente, que resulta muy útil en este contexto. El método hace varias
suposiciones:
- Cada electrón en un sistema de muchos electrones es descripto por su propia
función de onda.
Esta suposición, hecha por Hartree [15], implica que cada electrón está sujeto
a un potencial único, resultante de su interacción con todos los demás electrones
y con el núcleo. Evidentemente, para conocer exactamente (si existiera) tal poten-
cial, deberı́amos conocer exactamente todas las funciones de onda de las restantes
partı́culas, de manera de poder calcular las densidades de carga y de ellas el po-
tencial. Al no poder hacerlo, se propone un potencial “realista” que aproxime la
situación, se calcula con él la función de onda aproximada, con ella se puede calcu-
lar una densidad de carga, con ella mejorar el potencial propuesto y ası́ siguiendo.
De allı́ el término de autoconsistente: en cada una de estas secuencias, se va logran-
do una auto consistencia entre la función de onda resultante y el potencial que la
produce.
- Se postula el siguiente potencial que actúa sobre el electrón iésimo, producido
por el núcleo y los demás electrones
ˆ
1 Z
|ψk,κ (ρ)|2 −
X
Vi (ri ) = dρ →
− (3.101)
k̸=i | ri − ρ| ri

Aquı́ κ representa el conjunto de números cuánticos del electrón k. Cada término

de la suma representa la densidad de carga (recordemos que en nuestras convenciones
e = 1 ) producida por cada uno de los k ̸= i electrones. Convolucionada con la
función de Green del laplaciano esta fórmula reproduce la energı́a potencial del
electrón en el campo coulombiano de los otros electrones. En cuanto al segundo
término en (10.29) representa la contribución del núcleo a la energı́a potencial. Si hay
Partı́culas Idénticas 105

N electrones, cada uno obedecerá entonces una ecuación de Schrödinger estacionaria

de la forma
1

− ∇2 + Vi (r) ψi,ι (r) = ϵi ψi,ι (r) (3.102)
2
En este punto se hace una tercera aproximación:
- Se impone manu militari simetrı́a esférica al problema. Para ello, en lugar de
usar en (10.30) el potencial (10.29), se utiliza uno que resulta de integrar Vi (r) sobre
los ángulos:
ˆ
1
Vi (r) ≡ sin θdθdφVi (r) (3.103)
4π
de manera que la ecuación de Schrödingar independiente del tiempo pasa a ser
separable en coordenadas esféricas:
1

− ∇2 + Vi (r) ψi,ι (r) = ϵi ψi,ι (r) (3.104)
2
Se escribe entonces
1 i
ψi,ι (r, θ, φ) = Rn,l (r)Ylm (θ, φ) (3.105)
r
i
con Rn,l la parte radial que satisface
i
!
1 d2 Rnl l(l + 1) i
+ ϵn,l − Vi (r) − Rnl = 0 i = 1, 2, . . . , N (3.106)
2 dr2 2r2
Aquı́ n queda definido tomándolo tal que la función de onda Rnl tenga n − l − 1
nodos (recordar el átomo de hidrógeno; no se incluye ni el cero del origen ni el del
infinito).
Aún con todas estas simplificaciones, es evidente que dado que Vi (r) es una
función en principio complicada de r y se trata de un sistema de N ecuaciones,
(10.34) es de difı́cil solución. La idea de Hartree es comenzar por hacer una “elección
inteligente” de funciones de onda de todos los electrones, sin atenerse al sistema
de ecuaciones que éstas deben obedecer. Con ellas se calcula el potencial Vi (r) y
recién entonces se resuelve con este potencial el sistema (10.34). Se obtiene entonces
funciones de onda que son un poco mejores que las propuestas inicialmente, con ellas
se vuelve a calcular el potencial y ası́ siguiendo hasta que el cambio entre una etapa
y la siguiente sea menor que el error que se pretende para la determinación de los
niveles de energı́a.
En este tratamiento no entra, en ninguna etapa la condición de que la función de
onda del sistema de N electrones debe ser antisimétrica por tratarse de partı́culas
idénticas de spin 1/2. En realidad, se está tomando la función de onda del sistema
106 3.6 El método variacional de Hartree-Fock

como el simple producto de funciones de onda con lo que la interacción de intercam-

bio es despreciada. Se puede sin embargo tener en cuenta al menos el principio de
exclusión de Pauli eligiendo los números cuánticos de cada función de onda adecua-
damente, de manera que no haya dos electrones en el mismo estado.
Estos problemas serán resueltos generalizando el método a lo que se conoce como
aproximación de Hartree-Fock. En lugar de tomar a la función de onda del sistema
como el mero producto, se construye el determinante de Slater, asegurando ası́ la
antisimetreı́a de la función de onda. En cuanto a las interacciones de intercambio,
se tratan de manera perturbativa, como se hizo en el caso del helio.

3.6. El método variacional de Hartree-Fock

Para incluir los efectos de la antisimetrı́a de la función de onda de un sistema de
N fermiones idénticos en el método de Hartree estudiaremos un método variacional
que parte de elegir como función de onda de prueba para describir al sistema a una
que, como determinante de Slater se expresa ası́:

ψ1 (2) · · · ψ1 (N )
ψ1 (1)
1 ψ2 (2) · · · ψ2 (N )
ψ2 (1)
Ψ= √ ..
.. .. .. (3.107)
N! .. . .
ψN (1) ψN (2) · · · ψN (N )
Cada función de onda de una partı́cula (se las llama orbitales para el caso de
electrones en un átomo) es el producto de una parte espacial u y una de spin χ :

ψi (p) = ui (rp ) χi (σp ) (3.108)

Aquı́ χ tiene la forma
! !
σ1 1
χ1 = =
2 σ2 0
! ! (3.109)
σ1 0
χ− 1 = =
2 σ2 1
Las funciones de onda de partı́cula independiente serán ortogonales,
ˆ
d3 xp ψi (p)ψj (p) = δij (3.110)

lo que se reduce, en vista de (6.43) a

ˆ
d3 xp ui (rp ) uj (rp ) = δij (3.111)
Partı́culas Idénticas 107

El valor de expectación de cierto operador F̂ calculado con funciones de onda

como la definida por (11.1)toma la forma

ˆ N N
D E 1 ∗
ψiA (Qi ) F̂ ψPBj (j)d3 xj
XX Y Y
ΨA |F̂ |ΨB = εP εQ (3.112)
N! P Q i=1 j=1

donde hemos usado en el segundo factor que, bajo el producto, vale que ψjB (Pj ) =
∗
Es decir, para ψiA permutamos los electrones y para ψPBj los estados.
ψPBj (j).
Vamos ahora a escribir al producto doble como un único producto. Para ello
notemos que podemos escribir j = Qi, ya que de ambas maneras se recorren los N
valores posibles de las funciones de onda de cada electrón. Se tendrá entonces

ˆ N
D E 1 ∗
ψiA (Qi)F̂ ψPBQi (Qi)d3 xQi
XX Y
ΨA |F̂ |ΨB = εP εQ (3.113)
N! P Q i=1

Notemos que εP εQ = εP Q ası́ que podemos escribir

ˆ N
1 ∗
d3 xi ψiA (i)F̂ ψPBQi (i)
X Y
⟨F ⟩ = εP Q (3.114)
N! Q,P Q i=1

donde hemos redefinido a la variable x haciendo xQi → xi . Tomamos como

ı́ndices de suma Q y P Q, por lo que no habrá signo para las permutaciones de Q.
Como además la integral no depende de Q, al sumar sobre Q se tendrá N ! términos
idénticos, de manera que
ˆ N
∗
d3 xi ψiA (i)F̂ ψPBQi (i)
X Y
⟨F ⟩ = εP Q (3.115)
PQ i=1

o, haciendo P Q → P
ˆ N
∗
d3 xi ψiA (i)F̂ ψPBi (i)
X Y
⟨F ⟩ = εP (3.116)
P i=1

Consideremos los tres casos siguientes: 1. F̂ = 1 : La ortogonalidad de las funcio-

nes de onda hace que los términos de la suma sean cero salvo aquella permutación
P para la que ψiA (i) = ψPBi (i) para todo i. Si asignamos a esa permutación el signo
+ tendremos

⟨1⟩ = 1 (3.117)
2. F̂ = fˆj : donde fˆj es un operador de un electrón. Al insertar este F̂ en cada
P

término de la suma, sólo se entera de la presencia del operador la función de onda

108 3.6 El método variacional de Hartree-Fock

j-ésima por lo que el resto debe, por ortogonalidad, acomodarse de manera que los
ı́ndices coincidan. Simplificando la notación podemos escribir
XD E
⟨F̂ ⟩ = i fˆi i (3.118)
i

Muchas veces sucede que f1 = f2 = . . . y en ese caso se tiene

⟨i|fˆ|i⟩
X
⟨F̂ ⟩ = (3.119)
i
P
3. F̂ = ij ĝij : es decir, ĝ es un “operador de dos electrones”. Con argumentos
similares a los anteriores se tendrá
X
⟨F ⟩ = (⟨ij |gij | ij⟩ − ⟨ij |gij | ji⟩) (3.120)
i<j

Estamos ahora en condiciones de atacar el problema de un átomo de muchos

electrones. El hamiltoniano a estudiar es

X 1 2 Z X 1
Ĥ = ∇ − + (3.121)
i 2 i ri i<j rij
| {z
P } |P{z }
fi gij

Podemos escribir

ˆ
d3 ru∗i (r)f ui (r) +
X X
⟨Ĥ⟩ = (⟨ij|g|ij⟩ − ⟨ij|g|ji⟩) = h1 + h2
i i<j
(3.122)
1 Z
f = − ∇2 −
2 r

1
g= (3.123)
r
Además de las funciones de onda espaciales u(r), deberemos tener en cuenta las
funciones de onda de spin χ(σ) ya que sobre la parte que contiene g no se factorearán
trivialmente. Las tomaremos ortogonales según

χ∗i (σ)χj (σ) = δmsi msj

X
(3.124)
σ

Para la segunda suma h2 tendremos entonces

Partı́culas Idénticas 109

ˆ
1
d3 r1 d3 r2 u∗i (r1 ) u∗j (r2 ) ui (r1 ) uj (r2 ) |χi (σ1 )|2 |χj (σ2 )|2 −
X X
h2 =
i<j σ1 σ2 r12
ˆ 3
1
r1 d3 r2 ui (r2 ) uj (r1 ) χ∗i (σ1 ) χj (σ1 ) χ∗j (σ2 ) χi (σ2 )
u∗i (r1 ) u∗j (r2 )
X X

i<j σ1 σ2 r12
(3.125)
Después de un poco de álgebra tendremos
ˆ
1
d3 r1 d3 r2 |ui (r1 )|2 |uj (r2 )|2 −
X
h2 =
i<j r12 (3.126)

∗ ∗
δmsi msj ui (r1 ) uj (r2 ) ui (r2 ) uj (r1 )
A esta altura, utilizaremos un método variacional, exigiendo

δ⟨Ĥ⟩ = δh1 + δh2 = 0 (3.127)

donde δ = (δ/δui ) δui , con el vı́nculo
ˆ
d3 xu∗i uj = δij (3.128)

que puede ser incluido en la variación vı́a multiplicadores de Lagrange λij :

ˆ !
3 ∗
X
hλ = h1 + h2 + λij d xui uj − δij δmsi δmsj (3.129)
i<j

de manera que se tiene

X
hλ =h1 + h2 + δmsi msj ×
ij
ˆ ˆ ˆ ! (3.130)
2
λii 3
d x |ui | + λij d 3
xu∗i uj + λji d3
xu∗j ui

En cuanto a la parte de coordenadas, el problema estacionario toma la forma

!!
ℏ2 2 ℏ2 2 e2 e2 Z e2 Z
− ∇1 − ∇2 + − − −E ψ (r1 , r2 ) = 0 (3.131)
2me 2me r12 r1 r2
Hemos utilizado aquı́ unidades atómicas (“ua”) en que me = 1, e = 1, ℏ = 1, que
fue utilizado por Douglas Hartree4 para resolver el problema. Al final del cálculo se
4
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Central Field. Part I.
Theory and Methods, Mathematical Proceedings of the Cambridge Philosophical Society 24 (1928)
89 Cambridge Univ. Press.
110 3.6 El método variacional de Hartree-Fock

pueden restituir ambos parámetros fácilmente. Como las masas de los electrones son
iguales a 1 en estas unidades, podemos reacomodar la ecuación ası́

Z Z 1

∇21 + ∇22 +2 E+ + − ψ (r1 , r2 ) = 0 (3.132)
r1 r2 r12
Vemos que el cambio r1 ↔ r2 deja invariante al hamiltoniano por lo que las
autofunciones pueden ser escritas como autofunciones de energı́a y paridad definida,
con autovalor +1 (simétrica) o -1 (antisimétrica),

ψp (r1 , r2 ) = +ψp (r2 , r1 ) , parahelio

(3.133)
ψo (r1 , r2 ) = −ψo (r2 , r1 ) , ortohelio
Como la función de onda total (9.18) debe ser antisimétrica, necesariamente la
parte de spin tendrá que tener la simetrı́a opuesta a la de la parte de coordenadas,

χp (σ1 , σ2 ) = −χp (σ2 , σ1 ) , parahelio

(3.134)
χo (σ1 , σ2 ) = +χo (σ2 , σ1 ) , ortohelio
Ya vimos que la función de onda de spin dos fermiones idénticos con s = 1/2
que se acoplan para dar un spin total S = 0 es antisimétrica por lo que en este caso
el factor espacial debe ser simétrico (parahelio).
El factor de spin tiene entonces la forma

! ! ! ! !
1 1 0 0 1
χp = √ − parahelio, singulete s = 0 (3.135)
2 0 1
1 2
1 1
0 2

24
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Cen-
tral Field. Part I. Theory and MethodsMathematical Proceedings of the Cambridge
Philosophical Society 24 (1928) 89 Cambridge Univ. Press. Aplicando el operador
ŝ2 escrito en la forma (9.12) a la autofunción (9.23) se ve fácilmente que s = 0.
También es fácil ver que cuando los spines se acoplan para dar s = 1, las funciones
de onda de spin son simétricas y el factor espacial entonces debe ser antisimétrico,
(ortohelio):

! !
0 0
χ−1
o = ortohelio, triplete sz = −1
1 1
1 2
! ! ! ! !
1 1 0 0 1
χ0o =√ + ortohelio, triplete sz = 0 (3.136)
2 0 1
1 2
1 1
0 2
! !
1 1
χ1o = ortohelio, triplete sz = +1
0 1
0 2
Partı́culas Idénticas 111

3.7. Cálculo perturbativo

Para estudiar las funciones de onda de coordenadas, se debe apelar a un método
perturbativo. Se comienza por escribir al hamiltoniano en la forma

Ĥ = Ĥ0 + λĤp (3.137)

Escribiremos a Ĥ0 y Ĥp en la forma
1 2
Ĥ0 = − ∇1 + ∇22 + V1 (r1 ) + V2 (r2 )
2
Z Z 1 (3.138)
Ĥp = − − V1 (r1 ) − − V2 (r2 ) +
r1 r2 r12
donde se suma dos potenciales V1 (r1 ) y V2 (r2 ) en principio arbitrarios en la
primera lı́nea y se los resta en la segunda (de manera que, en conjunto nada se ha
cambiado). Pero su rol es el siguiente: una elección adecuada hará que
1. Ĥ0 ψ = E0 ψ sea un problema resoluble.
2. De manera de poder considerarlo que λĤp sea una pequeña perturbación a
tratar en el marco de la teorı́a de perturbaciones
Aquı́ λ es, como aprendimos al estudiar la teorı́a de perturbaciones, un parámetro
introducido para controlar el orden de las perturbaciones) Como Ĥ0 se separó en
una parte que solo depende de las coordenadas r1 y otra que solo depende de r2 , a
orden cero de perturbaciones la función de onda será un producto, adecuadamente
simetrizado (parahelio) o antisimetrizado (ortohelio), de funciones de onda de una
partı́cula. Habrá entonces para el hamiltoniano Ĥ0 tres tipos de soluciones a orden
cero:
- Cada partı́cula está en el estado fundamental, lo que corresponde al estado
fundamental del Helio
- una solución está en el estado fundamental y la otra en un estado excitado.
- ambas partı́culas estan en estados excitados
Para el caso del Helio, solo los estados con al menos un electrón en el fundamental
son importantes ya que cuando ambos están en estados excitados se encuentra que
tienen más energı́a que la suma del ion He+ + un electrón libre y por lo tanto por lo
que ese estado se desintegrará en un ion y un electrón libre.
Comencemos entonces por el caso en que ambos electrones están en el estado
fundamental. Si bien en general podrı́amos tomar V1 ̸= V2 , la elección más simple y
obvia será
Z
V1 (r) = V2 (r) = − (3.139)
r
que corresponde a resolver para H0 un caso que estudiamos ya para átomos
hidrogenoides ya que no hay interacción entre ellos.
112 3.7 Cálculo perturbativo

Con esto, la única perturbación a tratar es 1/r12 y la funciones de onda sin per-
turbar para el estado fundamental corresponderá al productos de dos funciones de
onda ψ (0) del estado fundamental de átomos hidrogenoides. Como se trata de un pro-
ducto de funciones idénticas ya que ambos electrones están en el estado fundamental,
el resultado solo puede ser simétrico (parahelio). Debe ir acompañado entonces por
una función de onda de spin que es antisimétrica y está dada por (9.23).
Tendremos entonces, para el nivel fundamental, como función de onda de coor-
denadas, sin perturbar, el producto de las soluciones obtenidas para átomos hidro-
genoides

Z3
ψp(0) (r1 , r2 ) = ψ (0) (r1 ) ψ (0) (r2 ) = exp (−Z (r1 + r2 )) (3.140)
π
En cuanto a la energı́a E, escribiendo

E = E (0) + λE (1) + . . . (3.141)

tendremos
ˆ
(1) Z6 1 5
λE = 2 d3 r1 d3 r2 exp (−2Z (r1 + r2 )) = Z ua (3.142)
π r12 8
Nótese que los términos de potenciales individuales en Ĥp se cancelan con la
elección que hicimos para V1 y V2 y la integral se calcula fácilmente expandiendo
1/r12 en armónicos esféricos.
En el caso del Helio se tiene Z = 2 con lo que, siendo que

(Z = 2)2
E (0) = −2 = −4 ua (3.143)
2(n = 1)2
se tendrá, como corrección al primer orden
5
E = −4 += −2,75 ua (3.144)
4
un valor en buen acuerdo con la medida experimental que es un 5 % menor,
exp
E = −2,904 ua. El cálculo perturbativo se puede mejorar teniendo en cuenta que
cada electrón apantalla la carga del núcleo.
En cuanto a los estados excitados del helio, que como dijimos corresponde a un
electrón en el estado fundamental y el otro en uno excitado, discutiremos en lo que
sigue un aspecto importante del cálculo perturbativo. Para comenzar, si r1 = r2
la función de onda espacial antisimétrica (ortohelio) se anula. Esto no sucede para
la simétrica (parahelio) por lo que la probabilidad de que los dos electrones estén
muy cerca es más pequeña para los estados orto que en los estados para. Luego,
en el estado “para” los electrones pueden llegar a estar muy cerca y por lo tanto la
Partı́culas Idénticas 113

energı́a de tales estados tiene que ser más alta. En resumen, el esquema de niveles
del átomo de helio o iones con dos electrones tiene un estado de energı́a mı́nima que
corresponde al parahelio. En cuanto a los estados excitados, (que corresponderán a
uno de los electrones en el estado fundamental y el otro en uno excitado), es mayor
la energı́a de los estados para que de los estados orto.
Capı́tulo 4

Segunda cuantificación

Queremos considerar ahora el caso de muchas partı́culas cuánticas. Normalmente

este es un problema que sabemos muy bien cómo tratar en mecánica cuántica: si
conocemos el espacio de Hilbert H1 de una sola partı́cula y una base completa |α⟩
ortogonal,
⟨α|α′ ⟩ = δαα′ ,
X
|α⟩⟨α| = 1, (4.1)
α

sabemos que para N partı́culas tenemos un espacio de Hilbert que se construye como
el producto directo (tensorial) de los espacios individuales:
N
O
HN = H1 ⊗ H2 ⊗ · · · ⊗ HN = Hi , (4.2)
i=1

y que una base completa de tal espacio es simplemente

|α1 , α2 , . . . , αN ) ≡ |α1 ⟩ ⊗ |α2 ⟩ · · · |αN ⟩, (4.3)

el estado factorizado de N partı́culas independientes. Aquı́ utilizamos a notación

| · · · ) para indicar que el estado no posee ninguna simetrı́a frente al intercambio de
partı́culas.
Debemos resolver entonces una ecuación de Schrödinger con una función de onda
que depende de las N variables ri correspondientes a las N partı́culas,

Ψ(r1 , r2 , . . . , rN ) = (r1 , r2 , . . . , rN |α1 , α2 , . . . , αN ). (4.4)

Aunque este es un programa perfectamente aceptable cuando el número de partı́culas

es pequeño, es particularmente inadecuado para abordar el caso de muchos fermiones
o bosones cuánticos interactuantes, por varias razones.
La primera razón tiene que ver con la indistinguibilidad de las partı́culas. Inclu-
so si son libres entre ellas, no todos los estados son aceptables para las funciones

114
Segunda cuantificación 115

de onda de N partı́culas indistinguibles, para las que sólo se permiten las funcio-
nes de onda totalmente simétricas (para bosones) o antisimétricas (para fermiones).
Esto significa que incluso para partı́culas que no interactúan no podemos usar di-
rectamente estados producto de la forma (4.3) y debemos lidiar con sus versiones
simetrizadas o antisimetrizadas,
1 X
|α1 . . . αN ⟩S = q Pν |α1 . . . αN ), (4.5)
N !nα1 ! . . . nαN ! ν
1 X
|α1 . . . αN ⟩A = √ (−1)sν Pν |α1 . . . αN ), (4.6)
N! ν
que se obtienen del estado factorizado (4.3) aplicando los operadores de simetrización
o antisimetrización (3.29), al igual que las funciones de onda (3.28) y (3.28). En
cierto modo, el hecho de que tengamos que tratar con partı́culas indistinguibles
ya introduce correlaciones en la función de onda incluso cuando las interacciones
no están presentes. La función de onda se vuelve bastante complicada ya que deben
estar correctamente (anti-)simetrizadas y normalizadas, lo que las hace muy difı́ciles
de manejar. que se escriban en la forma de un determinante ayuda un poco para los
cálculos prácticos, pero no mucho. En resumen, incluso para los electrones que no
interactúan, ¡habrı́a que tratar con funciones de onda que contienen 1023 ! términos,
lo cual es realmente desagradable.
El segundo problema está relacionado con la forma en que representamos a los
operadores en la mecánica cuántica estándar. Si consideramos, por ejemplo, un ope-
rador que mide el momento total de un sistema de partı́culas, este tiene que escribirse
como una suma de operadores que actúan sobre cada partı́cula individualmente:
N
X
Ptot = Pi (4.7)
i=1

donde Pi es el operador que actúa sobre la partı́cula i-ésima. Téngase en cuenta que
esto es un abuso de notación ya que Ptot es un operador de HN , que rigurosamente
se debe escribir como
Pi = 1 ⊗ 1 ⊗ . . . ⊗ P ⊗ . . . ⊗ 1, (4.8)
donde 1 es la identidad y P se inserta en la posición i-ésima. El operador y las fun-
ciones de onda dependen ası́ explı́citamente del número de partı́culas. Por lo tanto,
uno deberı́a cambiar completamente todo el cálculo dependiendo de si miramos 2
o 20000 partı́culas, lo que nuevamente es particularmente molesto. También impide
tomar de manera directa el lı́mite termodinámico N → ∞ cuando el volumen de los
sistemas también tiende a infinito. Dada la gran cantidad de partı́culas, está claro
que tomar este lı́mite es lo deseable ya que simplificarı́a mucho los cálculos1 .
1
Trabajar en el lı́mite termodinámico es deseable, además, porque es allı́ donde ocurren verda-
deramente las transiciones de fase.
116 4.1 Espacio de Fock

Una tercera razón, quizás más profunda y más fı́sica, y que definitivamente liqui-
da la posibilidad de utilizar la mecánica cuántica usual, es que ¡en muchos sitemas el
número de partı́culas no se conserva! Esto puede ocurrir por varias razones, por ejem-
plo, en sistemas de altas energı́as, porque buscamos describir sistemas de partı́culas
que pueden aniquilarse y convertirse en otras, tales como electrones y positrones. O
para un ejemplo más ligado a los materiales, mencionemos el modelo BCS para un
superconductor, que discutiremos en el capı́tulo siguiente. Veremos que las cuasi-
partı́culas fermiónicas que son responsables de la superconductividad se forman por
una superposición de electrones y huecos y no se conservan en número.
Por estas razones, debemos buscar una reformulación de la representación estándar
de la mecánica cuántica (también conocida como primera cuantificación) para siste-
mas de varias partı́culas indistinguibles. Idealmente deberı́amos hallar un formalismo
que se ocupe automáticamente de lo siguiente:

1. Que la simetrización o antisimetrización se realizara de manera automática sin

tener que tratar explı́citamente con N ! términos.

2. Que la forma de describir el sistema no dependa explı́citamente del número de

partı́culas presentes en él. Esto deberı́a permitir tomar el lı́mite termodinámico
fácilmente y también abordar situaciones más generales en las que el número
de partı́culas puede cambiar.

Esto lo proporciona el llamado método de “segunda cuantificación”2 que describire-

mos en este capı́tulo.

4.1. Espacio de Fock

La idea básica es convertir el hecho de que las partı́culas sean indistinguibles en
una ventaja. De hecho, si este es el caso, significa que no es necesario conocer el
estado cuántico de cada partı́cula individual, sino simplemente cuántas partı́culas
hay en un estado cuántico dado. Supongamos que uno tiene una base completa |α⟩
de estados para una sola partı́cula. En general, esta base es infinita, pero tomemos
por conveniencia un espacio de dimensión finita d y un número finito de estados.
Siempre podemos tomar d → ∞3 .Ası́, denotamos todos los estados en esta base
como
|α1 ⟩, |α2 ⟩, . . . , |αd ⟩, (4.9)
2
La terminologı́a usual de “primera” y “segunda” cuantificación es bastante desafortunada. Da
a entender que hay otro objeto que ahora se está cuantificando, más especı́ficamente la función de
onda, pero esto es incorrecto, como veremos más adelante.
3
Por supuesto que siempre existen sistemas donde d es finita. Por ejemplo, un spin 12 .
Segunda cuantificación 117

Téngase en cuenta que el tamaño de la base no está relacionado con la cantidad

de partı́culas que están presentes en el sistema. Para los bosones, por ejemplo, uno
podrı́a tener una base completa de los estados de una partı́cula que contienen solo dos
estados y tener 10000 bosones presentes en el sistema (ya que varios de ellos pueden
ir en el mismo estado cuántico). Para los fermiones, por supuesto, el número total
de partı́culas siempre es menor que el número total de estados disponibles debido
al principio de Pauli. Podemos describir completamente el sistema y reconstruir su
función de onda si conocemos el número de partı́culas ni en cada estado |αi ⟩ de
la base completa de estados de partı́culas individuales, y por lo tanto, podemos
caracterizar completamente la función de onda del sistema mediante el conjunto de
números n1 , n2 , . . . , nd . El número total de partı́culas en el sistema es, por supuesto,
N = n1 + n2 + · · · + nd , y puede variar si uno varı́a uno de los ni .
Definamos entonces un espacio en el que puedan existir un número arbitrario de
partı́culas. Si llamamos HN al espacio de Hilbert con N partı́culas, como en la ec.
(4.2), podemos definir

+∞
M
F = H0 ⊕ H1 ⊕ H2 . . . = Hj (4.10)
j=0

que es la suma directa de todos los espacios de Hilbert con 0, 1, 2, etc. partı́culas.
Tal espacio se llama espacio de Fock. En este espacio definamos ahora el estado

|n1 , n2 , n3 , . . . , nd ⟩ (4.11)

como los estados simetrizados o antisimetrizados (4.5) y (4.6). Es. decir, en lugar de
rotular a esos estados mediante el conjunto αi de estados estados de partı́cula inde-
pendiente en el que está cada. partı́cula, los rotulamos por el número de partı́culas
que contiene cada uno de ellos. Dos estados de la forma (4.11) que tienen un número
diferente de partı́culas N pertenecen a dos espacios de Hilbert diferentes y, por lo
tanto, son obviamente ortogonales en el espacio de Fock. Para sistemas con el mismo
número total de partı́culas, se puede verificar usando (4.5) y (4.6) que los estados
(4.11) para una base ortogonal y normalizada satisfacen

⟨n1 , n2 , . . . , nd |n′1 , n′2 , . . . , n′d ⟩ = δn1 ,n′1 δn2 ,n′2 · · · δnd ,n′d (4.12)

Por lo tanto, podemos usar la base (4.11) para caracterizar cada operador y elemento
de matriz en el espacio de Fock. Como se mencionó antes, esta base es extremada-
mente conveniente ya que se basa en la cantidad mı́nima de información necesaria
para describir un sistema de partı́culas indistinguibles. En particular, el número de
“contadores” ni necesarios no crece con el número total de partı́culas.
118 4.2 Operadores de creación y destrucción

4.2. Operadores de creación y destrucción

Introduciremos a continuación un conjunto de operadores que nos permitirá ge-
nerar todos los elementos de la base (4.11). Para cada estado αi de la base completa
de una sola partı́cula, definimos un operador de creación y destrucción, que aumen-
tará o disminuirá en uno el número de partı́culas en este estado particular. De este
modo, podremos usar estos operadores para modificar el contador ni dando el núme-
ro de partı́culas en un estado cuántico dado, y ası́ abarcar todo el espacio de Fock.
La definición práctica de estos operadores es diferente dependiendo de la estadı́stica
de las partı́culas.

Bosones
Introducimos los operadores de creación a†i y destrucción ai por su acción sobre
todos los estados de una base completa en el espacio de Fock, en la forma
√
a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩,
√ (4.13)
ai |n1 , . . . , ni , . . . , nd ⟩ = ni |n1 , . . . , ni − 1, . . . , nd ⟩.

Estas definiciones determinan por completo a los operadores por sus elementos de
matriz en la base de números de ocupación (4.11). Comprobemos que los operadores
a†i y ai son efectivamente hermı́ticos conjugados uno del otro. Dado que (4.11) es
una base ortogonal, el único elemento de matriz distinto de cero para a†i es
√
⟨n1 , . . . , ni + 1, . . . , nd |a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1. (4.14)

Tomando el complejo conjugado de esta expresión se obtiene

√
⟨n1 , . . . , ni , . . . , nd |ai |n1 , . . . , ni + 1, . . . , nd ⟩ = ni + 1, (4.15)

que de hecho es exactamente la definición del operador ai en (4.13) (con el reemplazo

de ni por ni + 1). Otra propiedad importante de los operadores es que solo abarcan
el espacio de Fock. De hecho, aunque parece formalmente de (4.13) que el operador
ai podrı́a operar en un estado que tiene ni = 0 partı́culas en el estado αi el prefactor
en la definición asegura que el elemento de matriz correspondiente es cero:

ai |n1 , . . . , ni = 0, . . . , nd ⟩ = 0, (4.16)

y ası́, si uno intenta aplicar el operador de destrucción en un estado que no tiene

ninguna partı́cula en el estado cuántico correspondiente, obtiene un resultado trivial,
lo que significa que no se pueden generar estados no fı́sicos con números de ocupación
negativos.
Segunda cuantificación 119

Si definimos el estado que no contiene partı́culas en ninguno de los estados cuánti-

cos (a veces denominado vacı́o) en la forma

|0⟩ = |n1 = 0, n2 = 0, . . . , nd = 0⟩, (4.17)

se verifica que a partir de este vacı́o |0⟩ y los operadores a†i podemos construir todos
los vectores de la base completa del espacio de Fock, ya que

(a†1 )n1 . . . (a†d )nd

|n1 , . . . , ni , . . . , nd ⟩ = √ √ |0⟩. (4.18)
n1 ! . . . nd !

Por lo tanto, uno puede generar completamente el espacio de Fock desde el estado
único |0⟩ mediante los operadores de creación (y destrucción ya que son conjugados
hermı́ticos). El vacı́o verifica la propiedad de que para cualquier i

ai |0⟩ = 0 (4.19)

Debemos tener cuidado de no mezclar el vacı́o |0⟩, que es un vector del espacio de
Fock, y uno sobre el que los operadores pueden actuar para dar otros estados del
espacio de Fock, con el cero 0.
Los operadores de creación y destrucción constituyen ası́ una manera muy conve-
niente de describir el espacio de Fock. En lugar de definirlos a partir de sus elementos
de matriz en una base dada, tal como (4.11), es más conveniente definirlos a par-
tir de sus propiedades intrı́nsecas. Mostremos que la definición (4.13) implica que
los operadores a†i y ai poseen ciertas relaciones de conmutación especı́ficas. Y a la
inversa, si se obedecen estas relaciones de conmutación, entonces los operadores, y
el vacı́o correspondiente definido por (4.17), servirán para construir un espacio de
Fock a partir de (4.18) en el que tendrán los elementos de matriz (4.14) y (4.15).
Calculemos primero la acción de un producto de dos operadores de creación a†i
†
y aj en estados distintos (i ̸= j) sobre un estado arbitrario de la base:
q
a†i a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj + 1|n1 , . . . , ni , . . . , nj + 1, . . . , nd ⟩
√ q (4.20)
= ni + 1 nj + 1|n1 , . . . , ni + 1, . . . , nj + 1, . . . , nd ⟩.

y es fácil comprobar que la acción de a†j a†i producirá exactamente el mismo resultado.
Ası́, para cualquier elemento de la base se tiene
h i
a†i , a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = 0, (4.21)

lo que significa que h i

a†i , a†j = 0. (4.22)
120 4.2 Operadores de creación y destrucción

Dado que un operador conmuta consigo mismo, esto también es cierto cuando i = j.
Tomando el hermı́tico conjugado del conmutador anterior obtenemos
[ai , aj ] = 0. (4.23)
Veamos ahora qué ocurre si calculamos la acción del producto de un operador
de destrucción con uno de creación, siempre con (i ̸= j):
√
a†i aj |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj |n1 , . . . , ni , . . . , nj − 1, . . . , nd ⟩
√ √ (4.24)
= ni + 1 nj |n1 , . . . , ni + 1, . . . , nj − 1, . . . , nd ⟩
†
y deh manera i similar la acción de aj ai (con i ̸= j ) darı́a el mismo resultado. Se tiene
ası́ a†i , aj = 0 cuando i ̸= j. El caso i = j es especial. Por un lado tenemos que
√
a†i ai |n1 , . . . , ni , . . . , nd ⟩ = a†i ni |n1 , . . . , ni − 1, . . . , nd ⟩
q √
= (ni − 1) + 1 ni |n1 , . . . , ni , . . . , nd ⟩ (4.25)

= ni |n1 , . . . , ni , . . . , nd ⟩,
y por otra parte
√
ai a†i |n1 , . . . , ni , . . . , nd ⟩ = ai ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩
√ √
= ni + 1 ni + 1|n1 , . . . , ni , . . . , nd ⟩ (4.26)

= (ni + 1)|n1 , . . . , ni , . . . , nd ⟩.
Concluimos entonces que
h i
ai , a†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩. (4.27)
Juntando los dos resultados, encontramos finalmente que el conmutador es
h i
ai , a†j = δi,j . (4.28)
Se puede entonces resumir las propiedades de los operadores de creación y des-
trucción mediante el conjunto de relaciones fundamentales
h i
ai , a†j = δi,j ,
h i
a†i , a†j = 0, (4.29)

[ai , aj ] = 0.
llamado también álgebra de los operadores. Junto con la acción de los operadores de
destrucción sobre el vacı́o (4.19), son equivalentes a las definición de los elementos
de matriz (4.15) y (4.14). Esto implica que si disponemos de
Segunda cuantificación 121

1. Una base completa |αi ⟩ de estados de partı́culas individuales (y las funciones

de onda correspondientes ⟨r|αi ⟩)

2. Operadores de creación y destrucción, a†i y ai , para cada uno de estos estados,

que obedecen relaciones conmutación canónicas (4.29).

3. Un vacı́o |0⟩ que es destruido por los operadores de destrucción ai |0⟩ = 0,

podemos construir completamente un espacio de Fock para bosones. La idea es

entonces explotar directamente las propiedades anteriores y utilizar las relaciones de
conmutación canónicas entre los operadores bosónicos para calcular las propiedades
fı́sicas, en lugar de las funciones de onda. Esta descripción se conoce como segunda
cuantificación.
Tomemos por ejemplo el siguiente estado de dos partı́culas:

|ψ⟩ = a†1 a†2 |0⟩ = |n1 = 1, n2 = 1⟩. (4.30)

y reconstruyamos la expresión para la función de onda usando. Se obtiene

1
Ψ(r1 , r2 ) = (r1 r2 |ψ⟩ = √ [φα1 (r1 )φα2 (r2 ) + φα1 (r2 )φα2 (r1 )] , (4.31)
2
que es la función correctamente simetrizada que describe dos bosones. Sin embargo,
el interés de la segunda cuantificación es apegarse a los operadores y sus relaciones
de conmutación y evitar volver a las funciones de onda, que en general son bastante
intratables. Por ejemplo, los operadores de creación conmuntan entre sı́, y por lo
tanto a†1 a†2 = a†2 a†1 . Entonces
a†1 a†2 |0⟩ = a†2 a†1 |0⟩, (4.32)
y ası́ la función de onda |ψ⟩ resulta ser simétrica por permutación de las partı́culas.
Los operadores de creación y destrucción están ası́ directamente diseñados para tener
en cuenta adecuadamente la simetrización de las funciones de onda y la indistingui-
bilidad de las partı́culas. De hecho, las relaciones de conmutación permiten obtener
directamente la información sin pasar por ningún proceso de simetrización. En par-
ticular, los promedios se pueden calcular directamente. Ilustrémoslo calculando la
normalización de la función |ψ⟩. Queremos calcular

⟨ψ|ψ⟩ = ⟨0|a2 a1 a†1 a†2 |0⟩. (4.33)

Aunque este es un ejemplo especı́fico, veremos que generalmente todos los observa-
bles fı́sicos se reducen al promedio en el vacı́o de un determinado producto de los
operadores de creación y destrucción, por lo que el método que describimos se puede
aplicar de manera general. Para calcular el promedio, lo único que necesitamos usar
es el hecho de que el vacı́o es destruido por tods los ai . Por tanto, utilizando las
122 4.2 Operadores de creación y destrucción

relaciones de conmutación, deberı́amos llevar los operadores ai a la dereha, de modo

de hacerlos actuar sobre el vacı́o. para actuar sobre el vacı́o. Primero escribimos
a1 a†1 = 1 + a†1 a1 de la relación de conmutación. Tenemos entonces

⟨ψ|ψ⟩ = ⟨0|a2 (1 + a†1 a1 )a†2 |0⟩,

(4.34)
= ⟨0|a2 a†2 |0⟩ + ⟨0|a2 a†1 a1 a†2 |0⟩.

En el segundo término podemos usar ahora la relación de conmutación a1 a†2 = a†2 a1

para reescribirlo como ⟨0|a2 a†1 a†2 a1 |0⟩ que inmediatamente da cero. Para el primero
usamoe de nuevo las relaciones de conmutación, y obtenemos

⟨ψ|ψ⟩ = ⟨0|a2 a†2 |0⟩ = ⟨0|(1 + a†2 a2 )|0⟩,

= ⟨0|1|0⟩, (4.35)
= 1.

Aunque los cálculos pueden volverse tediosos cuando crece el número de operadores,
la mecánica siempre es la misma, y con un poco de práctica se pueden acelerar.

Fermiones
Pasemos ahora a los operadores de creación y destrucción de fermiones. De ma-
nera similar que para los bosones, definimos

c†i |n1 , . . . , ni , . . . , nd ⟩ = (1 − ni )(−1)ϵi |n1 , . . . , ni + 1, . . . , nd ⟩,

(4.36)
ci |n1 , . . . , ni , . . . , nd ⟩ = ni (−1)ϵi |n1 , . . . , ni − 1, . . . , nd ⟩,

donde ϵi = i−1
P
j=1 nj y ϵ1 = 0. El orden de los elementos en la base debe fijarse una
vez, y utilizar siempre la misma convención, pero, por supuesto, es arbitraria.
En estas definiciones, algunos términos son bastante transparentes: dado que
para los fermiones el principio de Pauli impide que dos fermiones estén en el miso
estado, los números de ocupación ni están restringido a toar los valores 0 o 1 . Por
lo tanto, es importante que el operador de creación no pueda crear dos partı́culas en
un estado, lo cual queda asegurado por el factor 1 − ni que garantiza que si c†i actúa
sobre un estado con ni = 1 entonces la acción del operador dará cero. De manera
similar, el factor ni asegura que el operador de destrucción no puede destruir una
partı́cula en el estado para el cual ni = 0. La fı́sica del factor extraño (−1)ϵi no es
obvia por el momento, y uno podrı́a tener la tentación de definir los operadores sin
tal factor de fase. Veremos su utilidad un poco más adelante.
Procedemos ahora exactamente como con los bosones: comprobemos primero
que los operadores c†i y ci son efectivamente hermı́ticos conjugados uno del otro. De
Segunda cuantificación 123

hecho, los cálculos con fermiones son más simples en cierto sentido, ya que para cada
estado αi solo hay dos posibilidades ni = 0 o ni = 1 para el estado correspondiente.
El único elemento de matriz distinto de cero para el operador c†i es

⟨n1 , . . . , ni = 1, . . . , nd |c†i |n1 , . . . , ni = 0, . . . , nd ⟩ = (−1)ϵi . (4.37)

mientras que para ci el único elemento de matriz distinto de cero es

⟨n1 , . . . , ni = 0, . . . , nd |ci |n1 , . . . , ni = 1, . . . , nd ⟩ = (−1)ϵi . (4.38)

que obviamente es el complejo conjugado del otro.

Para continuar con las relaciones de conmutación y comprender el papel de los
coeficientes (−1)ϵi , veamos primero la acción de ci c†i . Como esto solo afecta al estado
αi , podemos simplemente considerar su acción sobre los dos estados con ni = 0 y
ni = 1:
ci c†i |n1 , . . . , ni = 0, . . . , nd ⟩ = (−1)ϵi ci |n1 , . . . , ni = 1, . . . , nd ⟩
= (−1)2ϵi |n1 , . . . , ni = 0, . . . , nd ⟩ (4.39)
= |n1 , . . . , ni = 0, . . . , nd ⟩
Por otro lado,
c†i ci |n1 , . . . , ni = 0, . . . , nd ⟩ = 0. (4.40)
Nótese que en este resultado los factores (−1)ϵi no juegan ningún papel, y podrı́amos
haber definido los operadores sin incluirlos. En forma similar,

ci c†i |n1 , . . . , ni = 1, . . . , nd ⟩ = 0
(4.41)
c†i ci |n1 , . . . , ni = 1, . . . , nd ⟩ = |n1 , . . . , ni = 1, . . . , nd ⟩.
h i
Se observa entonces que ci , c†i no tiene ninguna expresión simple. En cambio, el
anticonmutador n o
ci , c†i = ci c†i + c†i ci (4.42)
conduce a n o
ci , c†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩, (4.43)
y por lo tanto n o
ci , c†i = 1 (4.44)
Por lo tanto, se puede adivinar que en lugar del conmutador, es el anticonmutador el
que jugará un papel importante. El rol del factor (−1)ϵi será, por lo tanto, asegurar
que para las otras combinaciones también se obtengan relaciones simples para el
124 4.2 Operadores de creación y destrucción

anticonmutador. Ilustrémoslo con la acción de ci c†j con i ̸= j. Suponiendo que i < j,

tenemos que

ci c†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = (1 − nj )(−1)ϵj ci |n1 , . . . , ni , . . . , nj + 1, . . . , nd ⟩

= (1 − nj )(−1)ϵj ni (−1)ϵi |n1 , . . . , ni − 1, . . . , nj + 1, . . . , nd ⟩.
(4.45)
Por otro lado,

c†j ci |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = ni (−1)ϵi c†j |n1 , . . . , ni − 1, . . . , nj , . . . , nd ⟩

(4.46)
ϵ′j ϵi
= (1 − nj )(−1) ni (−1) |n1 , . . . , ni − 1, . . . , nj + 1, . . . , nd ⟩.

El término ϵ′j corresponde al factor de fase en un estado con ni − 1 en lugar de ni .

Ası́, ϵ′j = ϵj − 1. En ausencia de dichos términos de fase, las dos expresiones (4.45) y
(4.45) serı́an idénticas y tendrı́amos que [ci , c†j ] = 0. Gracias a los factores de fase ϵj
ahora tenemos un signo menos entre los dos términos y la relación se convierte en
n o
ci , c†j = 0, (4.47)

lo que permitirá definir los operadores ci sólo en términos de sus anticonmutadores.

Es fácil comprobar las restantes relaciones, y ası́ se tiene, de forma similar que para
los bosones, n o
ci , c†j = δi,j ,
n o
c†i , c†j = 0, (4.48)

{ci , cj } = 0.
Por otro lado, de la misma forma que para los bosones, se puede construir todos los
estados del espacio de Fock a partir de un vacı́o |0⟩ que es destruido por todos los
ci (ci |0⟩ = 0) usando la relación (4.18)
Las funciones de onda y los promedios se pueden calcular también con las mismas
técnicas que antes„ veamos como ejemplo la función de onda de dos fermiones en
los estados α1 y α2 :
|ψ⟩ = c†1 c†2 |0⟩. (4.49)
y entonces, de (??) la función de onda resulta
1
⟨r1 r2 |ψ⟩ = √ [α1 (r1 )α2 (r2 ) − α1 (r2 )α2 (r1 )] , (4.50)
2
que es, por supuesto, la función de onda correctamente antisimetrizada para fermio-
nes. Sin ir a la función de onda, se puede ver directamente la antisimetrización a
Segunda cuantificación 125

nivel de estados y operaores: usando la relación de anticonmutación {c1 , c2 } = 0 se

encuentra que
c†1 c†2 |0⟩ = −c†2 c†1 |0⟩, (4.51)
y ası́ la función de onda |ψ⟩ es obviamente antisimétrica por permutación de las
partı́culas.
El hecho de que el operador ci se ocupe automáticamente de la antisimetrización
hace que sea muy conveniente escribir incluso funciones complicadas. Por ejemplo, el
mar de Fermi, que corresponde al estado de N fermiones de menor energı́a posible,
se escribe
N
†
Y
|F ⟩ = cj |0⟩ (4.52)
j=1

Los promedios en el vacı́o se pueden calcular exactamente con la misma técnica

descripta para los bosones. Por ejemplo, si tomamos |ψ⟩ = c†1 |0⟩, entonces (usando
las relaciones de anticonmutación),
⟨ψ|ψ⟩ = ⟨0|ci c†i |0⟩

= ⟨0|1 − c†i ci |0⟩ (4.53)

= ⟨0|1|0⟩ = 1.
Generalizando el cálculo anterior puede mostrarse el mar de Fermi está crrectamente
normalizado, ⟨F|F⟩ = 1.

4.2.1. Operadores de un cuerpo

Ahora que tenemos definidos a los operadores que permiten construir todo el
espacio de Fock, lo que queda por resolver es expresar los observables fı́sicos que
queremos calcular en términos de estos operadores. Para hacerlo, debemos tener en
cuenta que los observables deben actuar sobre partı́culas indistinguibles, lo que esta-
blece algunas restricciones sobre su forma. Antes de dar sus expresiones en segunda
cuantificación, es conveniente clasificarlos de acuerdo al número de partı́culas sobre
las que actúan. Hay observables fı́sicos que miden solo los números cuánticos de una
partı́cula a la vez (tales como el momento, la densidad, etc.) y otros que necesitan
tratar con los números cuánticos de dos de las partı́culas para determinar sus ele-
mentos de matriz. Este es caso, por ejemplo, del operador que mide las interacciones
entre las partı́culas. El primer tipo se llama operadores de un cuerpo, mientras que
el segundo es de dos cuerpos. En principio, se pueden tener operadores que invo-
lucren más de dos partı́culas (tales como colisiones de tres cuerpos y más), pero
son de poca utilidad práctica en la fı́sica del estado sólido, por lo que discutiremos
principalmente aquı́ los de uno y dos cuerpos. Las fórmulas dadas aquı́ se pueden
generalizar fácilmente si es necesario.
126 4.2 Operadores de creación y destrucción

Definición
Comencemos primero con los operadores de un cuerpo. De manera bastante
general, llamemos O a un operador que representa alguna propiedad de una partı́cula
a la vez. Por supuesto, si O actúa en el espacio de Hilbert con N partı́culas, debe
actuar sobre cada partı́cula del sistema. Llamemos O(1) al operador que actúa en
el espacio de Hilbert de una sola partı́cula; el operador O correspondiente a las N
partı́culas debe ser
(1) (1) (1)
O = O1 ⊗ 12 ⊗ . . . ⊗ 1N + 11 ⊗ O2 ⊗ . . . ⊗ 1N + . . . + 11 ⊗ . . . ⊗ ON (4.54)
(1)
donde Oi es el operador que actúa sobre la partı́cula i-ésima. El hecho de que
en la suma anterior, todos los coeficientes sean idénticos, es la consecuencia directa
del hecho de que las partı́culas son indistinguibles, y no podemos distinguir en una
medida si un cierto conjunto de números cuánticos corresponeden a una u otra
partı́cula del sistema. La forma (4.54) es por lo tanto la forma más general posible
de un operador de un solo cuerpo para partı́culas indistinguibles.
Para expresar (4.54) en segunda cuantficación, debemos comenzar por analizar
qué sucede si tenemos un sistema con una sola partı́cula (si no hay ninguna partı́cula,
un operador de un cuerpo es trivialmente nulo). En ese caso O = O(1) y usando la
base completa α podemos escribir

|α⟩⟨α|O(1) |β⟩⟨β|,
X
O= (4.55)
α,β

y luego utilizamos que |α⟩ = c†α |0⟩ para obtener

⟨α|O(1) |β⟩c†α |0⟩⟨0|cβ .

X
O= (4.56)
α,β

La interpretación fı́sica de esta fórmula es bastante simple: el operador cβ destruye

una partı́cula en un estado β; como solo tenemos una partı́cula en el sistema, nos
vemos obligados a ir al vacı́o, luego, desde el vacı́o, el operador c†α recrea la partı́cula
en el estado α. El resultado neto es que todavı́a tenemos una partı́cula en el sistema
pero ha cambiado su estado cuántico al pasar del estado β al estado α. La amplitud
de dicha transición está dada por los elementos de matriz del operador O(1) entre
los estados β y α.
Si en lugar de una partı́cula tuviéramos ahora un número arbitrario de partı́culas
en el sistema, tendrı́amos que hacer exactamente lo mismo para cada una de ellas,
dejando invariantes los números cuánticos de las demás, como sugiere (4.54), y hacer
la suma. Un operador que logra esto está dado por la expresión

⟨α|O(1) |β⟩c†α cβ
X
O= (4.57)
α,β
Segunda cuantificación 127

que es idéntica a (4.56) excepto que no estamos obligados a ir al vacı́o después de

la destrucción de la partı́cula en el estado β. De hecho, si hay varias partı́culas, el
operador c†α cβ cambiará el número cuántico de una partı́cula del estado β al estado α
y dejará intactos los números cuánticos de todas las demás partı́culas del sistema. Sin
embargo, el operador cβ operará en todas las partı́culas del sistema y, por lo tanto,
hará esa transición para la primera, segunda, etc. realizando automáticamente la
suma en (4.54). La interpretación de (4.57) se muestra en la figura ??.
La expresión (4.57) permite ası́ representar cualquier operador de un solo cuerpo
en segunda cuantificación, conociendo sólo la acción del operador O(1) en el espacio
de una sola partı́cula. Nótese que las funciones de onda provenientes de la elección
de la base completa α sólo intervienen en el cálculo de los elementos de matriz
⟨α|O(1) |β⟩. Una vez que se calculan estos elementos de matriz, todo el operador se
reduce a una combinación lineal de operadores de creación y destrucción y, por lo
tanto, todos los promedios fı́sicos se pueden calcular mediante las técnicas descriptas
en la sección anterior, sin tener que volver a las funciones de onda. Por supuesto,
todos los aspectos de su simetrización o la antisimetrización son tenidos en cuenta
automáticamente por la naturaleza de los operadores de creación o destrucción.

Ejemplos
Comencemos con el operador que mide la densidad de partı́culas en un punto
r0 , que para una partı́cula se escribe

ρ(1) (r0 ) = |r0 ⟩⟨r0 |, (4.58)

debido a que ⟨ψ|ρ(1) (r0 )|ψ⟩ = |ψ(r0 )|2 . En segunda cuantificación la forma del ope-
rador dependerá de la elección de la base completa α que tomemos. Empecemos
tomando la base de autoestados de posición |r⟩, en cuyo caso, el operador c†r es el
operador que crea una partı́cula en el punto r. Usando esta base y la relación (4.57)
se obtiene ˆ
ρ(r0 ) = drdr ′ ⟨r|r0 ⟩⟨r0 |r ′ ⟩c†r cr′ ,
ˆ
= drdr ′ δ(r − r0 )δ(r0 − r ′ )c†r cr′ , (4.59)

= c†r0 cr0 .
La expresión c†r0 cr0 es particularmente simple de interpretar. El operador c†r0 cr0
destruye y recrea una partı́cula en el mismo estado cuántico. Por lo tanto, no ha
cambiado nada en el sistema. Sin embargo, la acción del operador cr0 dará cero si
no hay ninguna partı́cula a destruir en el estado cuántico correspondiente (aquı́ una
partı́cula en el punto r0 ). El operador c†r0 cr0 da cero si no hay ninguna partı́cula en el
128 4.2 Operadores de creación y destrucción

estado cuántico correspondiente y uno si hay una partı́cula. Por tanto, simplemente
cuenta el número de partı́culas en el punto r0 . Generalmente, el operador

n̂α = c†α cα , (4.60)

cuenta el número de partı́culas en el estado α na lpha. El operador que cuenta el

número total de partı́culas en el sistema está dado entonces por

ˆ
N̂ = dr c†r cr . (4.61)

La generalización al caso de partı́culas con spin es inmediata. Para ello la base

completa será α = (r, σ) y el operador densidad solo actúa en la parte espacial, por
lo tanto

ρ(1) (r0 ) = |r0 ⟩⟨r0 | ⊗ 1spin , (4.62)

y ası́ (4.57) da lugar a

ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 |r ′ σ ′ ⟩c†rσ cr′ σ′ ,
X
ρ(r0 ) =
σ,σ ′
ˆ
=
X
drdr ′ δ(r − r0 )δ(r0 − r ′ )δσσ′ c†rσ cr′ ,σ′ , (4.63)
σ,σ ′

= c†r0 ↑ cr0 ↑ + c†r0 ↓ cr0 ↓ .

También podrı́amos calcular la densidad de spin a lo largo del eje z en el punto r0 .

En ese caso el operador de una partı́cula es

Sz(1) (r0 ) = |r0 ⟩⟨r0 | ⊗ Sz , (4.64)

Segunda cuantificación 129

y usando (4.57) se obtiene4

ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sz |r ′ σ ′ ⟩c†rσ cr′ σ′ ,
X
Sz (r0 ) =
σ,σ ′

⟨σ|Sz |σ ′ ⟩c†r0 σ cr0 σ′ ,

X
= (4.65)
σσ ′

1
= (c†r0 ↑ cr0 ↑ − c†r0 ↓ cr0 ↓ ).
2
De manera similar, la densidad de spin a lo largo de la dirección x es
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sx |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sx (r0 ) =
σ,σ ′

⟨σ|Sx |σ ′ ⟩c†r0 σ cr0 σ′ ,

X
= (4.66)
σσ ′

1
= (c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
y para la dirección y,
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sy |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sy (r0 ) =
σ,σ ′

⟨σ|Sy |σ ′ ⟩c†r0 σ cr0 σ′ ,

X
= (4.67)
σσ ′

i
= (−c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
Alternativamente, podrı́amos haber usado la base de los autoestados del operador
momento, |k⟩, cuyas funciones de onda son
1
⟨r|k⟩ = √ eikr . (4.68)
Ω
4
Recordemos que las expresiones de los operadores de spin en la base |±⟩ son
1
Sx = [|+⟩⟨−| + |−⟩⟨+|] ,
2
i
Sy = [−|+⟩⟨−| + |−⟩⟨+|],
2
1
Sz = [|+⟩⟨+| − |−⟩⟨+|].
2
130 4.2 Operadores de creación y destrucción

Dado que el spin y la parte orbital son independientes, solo daremos las expresiones
para el caso sin espı́n. Incorporar el spin se realiza exactamente de la misma forma
que en la base de coordenadas. El operador ck ahora destruye una partı́cula momento
k (es decir, en un estado de onda plana con momento k). La ecuación (4.57) da lugar
a
⟨k1 |r0 ⟩⟨r0 |k2 ⟩c†k1 ck2 ,
X
ρ(r0 ) =
k1 k2
(4.69)
1 X −ik1 r0 ik2 r0 †
= e e ck 1 ck 2 .
Ω k1 k2

La expresión (4.69) no es tan simple como (4.59) ya que el operador densidad no es

diagonal en la base de momentos. Sin embargo, tanto (4.69) como (4.59) represen-
tan el mismo operador. Esto nos da una conexión directa entre los operadores que
crean una partı́cula en el punto r y los que crean una partı́cula con momento k.
Comparando las ecuaciones (4.69) y (4.59) se obtiene

1 X ikr
cr = √ e ck . (4.70)
Ω k

Esta expresión constituye un ejemplo de una transformación, en este caso lineal

y dada por una transformada de tipo Fourier, entre operadores de creación. Esta
transformación preserva los conmutadores, como puede verificase en forma simple,
y por lo tanto constituye un ejemplo de transformación canónica. Discutiremos más
sobre este tema más adelante.
Usando la expresión (4.69) también podemos calcular el número total de partı́cu-
las en el sistema:
ˆ
1 X −ik1 r ik2 r †
N = dr e e ck 1 ck 2 ,
Ω k1 k2

δk1 k2 c†k1 ck2 ,

X
= (4.71)
k1 k2
X †
= ck ck ,
k

y si tenemos en cuenta que c†k ck cuenta el número de partı́culas en el estado cuántico

k, se obtiene nuevamente que el número total de partı́culas es la suma de todos los
números de partı́culas en todos los estados cuánticos posibles. Finalmente se puede
usar (4.69) para obtener una expresión simple de la transformada de Fourier de la
Segunda cuantificación 131

densidad: ˆ
ρ(q) = dr e−iqr ρ(r),
ˆ
1 X −ik1 r ik2 r †
= dr e−iqr e e ck 1 ck 2 ,
Ω k1 k2
(4.72)
δk2 ,k1 +q c†k1 ck2 ,
X
=
k1 k2
X †
= ck−q ck .
k

Otro operador importante es, por supuesto, la energı́a cinética de las partı́culas.
p2
Para una partı́cula se tiene H (1) = 2m , y de manera más general, podrı́amos tener
(1)
cualquier función del momento H = ϵ(p). Por lo tanto, es muy conveniente utilizar
la base de momentos. La energı́a cinética se expresa ası́ como

⟨k1 |ε(p)|k2 ⟩c†k1 ck2 ,

X
H=
k1 k2

δk1 k2 ε(ℏk2 )c†k1 ck2 ,

X
= (4.73)
k1 k2

εk c†k ck ,
X
=
k

con εk = ε(ℏk) = ℏ2 k 2 /2m que tiene la interpretación simple de que la energı́a

cinética total del sistema es la suma de el número de partı́culas en cada estado k
(dado por c†k ck ) multiplicado por la energı́a cinética ϵk de tal estado. La generali-
zación para sistemas con spin es inmediata y, en general se obtiene

ε(k)c†kσ ckσ ,
X
H= (4.74)
kσ

asumiendo que la energı́a cinética no depende del espı́n (en ausencia de acoplamiento
espı́n-órbita).

4.2.2. Mecánica estadı́stica cuántica en el gran canónico

En mecánica estadı́stica usualmente estamos interesados en calcular la función
de partición de un sistema cuántico de N partı́culas

QN (Ω, T ) = tr e−βH (4.75)

donde T es la temperatura medida en grados Kelvin, y β = 1/kB T con kB la

constante de Boltzman. Aquı́ H es el Hamiltoniano de N partı́culas.
132 4.2 Operadores de creación y destrucción

Debemos tener en cuenta que dado que el número total de partı́culas es N =

†
k ck ck , agregar un potencial quı́mico −µN no cambia la forma del Hamiltoniano:
P

ξ(k)c†kσ ckσ ,
X
H= (4.76)
kσ

y simplemente reemplaza ε(k) por ξ(k) = ε(k) − µ. A temperatura cero la energı́a

ξ(k) es cero en el nivel de Fermi, negativa por debajo, y positiva por encima.

4.2.3. Operadores de dos cuerpos

Veamos ahora los operadores que involucran dos partı́culas y como definir sus
elementos de matriz. Es en particular el caso del potencial de interacción entre dos
partı́culas X
V = V (ri , rj ). (4.77)
i̸=j

Definición
Con un espı́ritu similar al de los operadores de un solo cuerpo, llamemos O(2) al
operador correspondiente que actua en el espacio de Hilbert de sólo dos partı́culas.
El operador de dos cuerpos que actua en HN debe tener la forma
X (2) O 1 X (2) O
O= Oi,j 1k = O 1k , (4.78)
i<j k̸=i,j 2 i̸=j i,j k̸=i,j

para que el operador O(2) pueda operar sobre cada par de partı́culas en el sistema.
De manera similar que para los operadores de un solo cuerpo, los coeficientes en la
suma anterior deben ser todos iguales, de lo contrario significarı́a que las partı́culas
podrı́an distinguirse.
Para entender cómo escribir O en segunda cuantificación, veamos el caso en el
que hay exactamente dos partı́culas en el sistema. Debemos definir el operador O
por sus elementos de matiz en el espacio fı́sico de las funciones (anti)simetrizadas
|α, β⟩, lo que significa que debemos conocer todos los elementos

⟨α, β|O(2) |γ, δ⟩. (4.79)

Tomemos primero la expresión (??) y escribamos |α, β⟩ en términos de los kets

ordenados (??)
(α, β|O(2) |γ, δ) = (β, α|O(2) |δ, γ), (4.80)
aquı́ la igualdad se debe a que simplemente estamos intercambiando partı́culas, y
por lo tanto obtenemos

⟨α, β|O(2) |γ, δ⟩ = (α, β|O(2) |γ, δ) ± (α, β|O(2) |δ, γ). (4.81)
Segunda cuantificación 133

Ahora deberı́amos encontrar en segunda cuantificación un operador que reproduzca

estos elementos de matriz y, por supuesto, funcione para N partı́culas en lugar de
dos. Se verifica que
1 X
O= (α, β|O(2) |γ, δ)c†α c†β cδ cγ , (4.82)
2 α,β,γ,δ
funciona tanto para fermiones como para bosones. No demostraremos esta relación
en general, lo cual puede hacerse calculando los elementos de matriz a ambos la-
dos, sino que simplemente comprobaremos que funciona para N = 2 partı́culas.
Calculemos, a partir de (4.82), los elementos de matriz
1 X
⟨α0 , β0 |O|γ0 , δ0 ⟩ = (α, β|O(2) |γ, δ)⟨α0 , β0 |c†α c†β cδ cγ |γ0 , δ0 ⟩. (4.83)
2 α,β,γ,δ

Como |α0 , β0 ⟩ = c†α0 c†β0 |0⟩ tenemos que calcular promedios de la forma

⟨0|cβ0 cα0 c†α c†β cδ cγ c†γ0 c†δ0 |0⟩ (4.84)

lo cual puede realizarse mediante la técnica que discutimos antes, consistente en

llevar hacia la derecha a los operadores de destrucción para que actúen sobre el
vacı́o. Esto da

⟨0|cβ0 cα0 c†α c†β cδ cγ c†γ0 c†δ0 |0⟩ = [δα0 ,α δβ0 ,β ± δα0 ,β δβ0 ,α ] [δγ0 ,γ δδ0 ,δ ± δγ0 ,δ δδ0 ,γ ] . (4.85)

El signo + es el habitual para los bosones y el − para los fermiones. Fı́sicamente

significa que cuando los operadores de destrucción actúan en la forma

cδ cγ |γ0 , δ0 ⟩, (4.86)

tienen que destruir las dos partı́culas en los dos estados cuánticos posibles y ası́ δ
tiene que ser uno de los estados y γ el otro con el signo adecuado dependiendo de la
(anti)simetrı́a de la función de onda. Usando (4.85) en (4.83) de hecho recuperamos
los mismos elementos de matriz que (4.81).
Fı́sicamente, la fórmula (4.82) tiene una interpretación similar a la de los opera-
dores de un solo cuerpo. El término c†α c†β cδ cγ destruye dos partı́culas con los números
cuánticos γ y δ, para esto es necesario que el sistema contenga dos partı́culas (que
es lo que debe ocurrir para que un operador de dos cuerpos pueda actuar). Lue-
go recrea las dos partı́culas con dos nuevos números cuánticos α y β. La amplitud
para este proceso está dada por los elementos de matriz del operador O(2) en una
transición donde la primera partı́cula va del estado γ al estado α y la segunda del
estado δ al estado β. El elemento de matriz se escribir para kets ordenados (son kets
producto y por lo tanto más simples); los operadores de creación y destrucción se
encargan de todas las permutaciones y de realizar esta transición para cualquier par
de partı́culas en el sistema.
134 4.2 Operadores de creación y destrucción

Ejemplos
La interacción más común entre los electrones es aquella que depende de la
distancia entre las dos partı́culas. Los dos operadores de tal interacción son, por lo
tanto,
O(2) = V (r̂1 − r̂2 ), (4.87)
donde r̂1 y r̂2 son los operadores que miden la posición de la primera y la segunda
partı́cula respectivamente. Exepcionalmente utilizaremos aquı́ la notaión con el som-
brero para indicar que son operadores. Por ejemplo, para la interacción de Coulomb
es
e2
V (r) = , (4.88)
4πϵ0 r
pero otros tipos de interacciones como una interacción local V (r) = U δ(r) también
son opciones posibles. Mantendremos V como función general en lo que sigue.
Para expresar el operador en segunda cuantificación, tenemos nuevamente que
realizar la elección de la base. Debido a que el operador V (r̂1 − r̂2 ) es diagonal en
la base de posición, comencemos con ésta. Usando (4.82) y el hecho de que α es la
base de posiciones, obtenemos
ˆ
1
V = dr1 dr2 dr3 dr4 (r3 r4 |V (r̂1 − r̂2 )|r1 r2 )c†r3 c†r4 cr2 cr1 ,
2
ˆ
1
= dr1 dr2 d r3 dr4 V (r1 − r2 )δ(r3 − r1 )δ(r4 − r2 )c†r3 c†r4 cr2 cr1 , (4.89)
2
ˆ
1
= dr1 dr2 V (r1 − r2 )c†r1 c†r2 cr2 cr1 .
2

Si se incluye el espı́n, la base completa se convierte en α = (r, σ) y como el operador

V (r̂1 − r̂2 ) es la identidad en el sector de espı́n, se obtiene
ˆ
1 X
V = dr1 dr2 V (r1 − r2 )c†r1 σ1 c†r2 σ2 cr2 σ2 cr1 σ1 . (4.90)
2 σ1 σ2

La expresión (4.90) puede escribirse en una forma más familiar utilizando las
relaciones de (anti)conmutación para fermiones

c†r1 σ1 c†r2 σ2 cr2 σ2 cr1 σ1 = −c†r1 σ1 c†r2 σ2 cr1 σ1 cr2 σ2 ,

= −c†r1 σ1 (δr1 ,σ1;r2 σ2 − cr1 σ1 c†r2 σ2 )cr2 σ2 ,

(4.91)
= −δr1 ,σ1;r2 σ2 c†r1 σ1 cr2 σ2 + c†r1 σ1 cr1 σ1 c†r2 σ2 cr2 σ2 ,
= −δr1 ,σ1;r2 σ2 ρσ1 (r1 ) + ρσ1 (r1 )ρσ2 (r2 ),
Segunda cuantificación 135

(para bosones se obtiene una expresión similar, con signo +). El segundo término
da lugar a la expresión
ˆ
1 X
V = dr1 dr2 V (r1 − r2 )ρσ1 (r1 )ρσ2 (r2 ), (4.92)
2 σ1 σ2
que es la forma familiar de la interacción entre dos densidades de partı́culas (o
cargas) en dos puntos diferentes. La diferencia es que ahora los ρ son operadores que
miden la densidad en lugar de variables clásicas. El primer término se reduce a
ˆ
X
drV (r = 0)ρσ1 (r1 ) = V (r = 0)N, (4.93)
σ
que es simplemente un término de potencial quı́mico. Téngase en cuenta que puede
ser infinito para algunas interacciones, como la interacción de Coulomb. Este primer
término está ahı́ para corregir el hecho de que la expresión (4.92) contrariamente a
(4.90) no contiene solo la interacción entre dos partı́culas diferentes. Efectivamente,
(4.90) tiene dos operadores de destrucción a la derecha, lo que significa que los ope-
radores solo pueden actuar en estados que contienen dos partı́culas. Por el contrario,
(4.92) es de la forma
c†r1 σ1 cr1 σ1 c†r2 σ2 cr2 σ2 , (4.94)
y por lo tanto puede actuar incluso si solo hay una partı́cula en el sistema. Por lo
tanto, contiene una falsa “autointeracción” de la partı́cula consigo misma. Es esta
interacción la que conduce al potencial quı́mico (4.93) que debe incluirse adecuada-
mente junto con (4.92). No obstante, si se fija el número de partı́culas del sistema,
entonces esta modificación es irrelevante ya que simplemente se absorbe en una
redefinición del potencial quı́mico y se puede usar (4.90) o (4.92) indistintamente.
Reescribamos ahora la interacción en la base del impulsos. Usando (4.82) y una
base α = (k, σ) se tiene
1 X
V = (k3 σ3 , k4 σ4 |V (r̂1 − r̂2 )|k1 σ1 , k2 σ2 )c†k3 σ3 c†k4 σ4 ck2 σ2 ck1 σ1 . (4.95)
2 k1 σ1 ,k2 σ2 ,
k3 σ3 ,k4 σ4

Lo que sigue es calcular un elemento de matriz que involucra operadores de posición

en una base de estados de momentos. Esto se realiza, como es habitual en mecánica
cuántica, insertando resoluciones de la identidad en el espacio de coordenadas
ˆ
1 = dr |r⟩⟨r|, (4.96)

y utilizando la función de onda plana (4.68). Se obtiene

ˆ
1
dr1 dr2 e−i(k3 r1 +k4 r2 ) V (r1 − r2 )ei(k1 r1 +k2 r2 )
X
V = 2
2d σ1 σ2
k1 k2 k3 k4

× c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 , (4.97)

136 4.2 Operadores de creación y destrucción

Figura 4.1: Visualización pictórica del término (3.97). Cada operador de destrucción
está representado por una flecha entrante, cada creación por una saliente. Uno ve que
la interacción puede verse como la dispersión de una partı́cula que va del estado k1 σ1
al k1 +q, σ1 por otra que va del estado k2 σ2 al estado k2 −q, σ2 . La amplitud de estos
elementos de matriz es la transformada de Fourier del potencial de interacción V (q).
Dado que el potencial es invariable por traslación en el espacio, el impulso se conserva
a lo largo de la interacción. Dado que el potencial no depende de los grados de
libertad del espı́n, la interacción conserva individualmente el espı́n de cada partı́cula.
Esta representación se conoce como diagramas de Feynman. Es extremadamente útil
cuando se construye la teorı́a de la perturbación.

A continuación aprovechamos que el potencial depende de la diferencia de coorde-

nadas de las dos partı́culas y cambiamos a las variables de centro de masa R =
(r1 + r2 )/2 y coordenada relativa r = r1 − r2 para obtener
ˆ ˆ
1 i(k1 +k2 −k3 −k4 )R
dr V (r)ei(k1 −k3 −k2 +k4 )r/2
X
V = 2 dR e
2d σ1 σ2
k1 k2 k3 k4

× c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 (4.98)

Finalmente, integramos en r y R,

1
δk1 +k2 ,k3 +k4 V (q = k3 − k1 )c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 ,
X
V = (4.99)
2d σ1 σ2
k1 k2 k3 k4

Comentemos brevemente esta expresión. La integración sobre R da lugar al factor

δk1 +k2 ,k3 +k4 que expresa la conservación de los momentos de las dos partı́culas antes
y después de la interacción. Esto es consecuencia directa del hecho de que hemos
elegido un potencial de interacción que es invariante frente a traslaciones V (r1 − r2 )
y, por lo tanto, el momento total (k1 + k2 ) y k3 + k4 ) debe conservarse. La integral
sobre la coordenada relativa conduce directamente a la transformada de Fourier
del potencial de interacción con un vector de onda que corresponde al momento
transferido de una a otra de las partı́culas durante la interacción. Finalmente, se
puede reescribir el operador V teniendo en cuenta la restricción δk1 +k2 ,k3 +k4 como

1 X
V = V (q)c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 (4.100)
2d k1 k2 q
σ1 σ2

que se representa gráficamente como se muestra en la figura 4.1

Segunda cuantificación 137

4.3. Resolviendo con segunda cuantificación

Ahora que tenemos las herramientas para expresar todos los operadores que ne-
cesitamos en segunda cuantificación, ya sea para el Hamiltoniano u otros observables
fı́sicos, y que sabemos calcular promedios de un número arbitrario de tales opera-
dores de creación y destrucción en el vacı́o, podemos preguntarnos cómo resolver
en la práctica un problema cuando conocemos el Hamiltoniano. En el equema usual
de la mecánica cuántica, escribimos la ecuación de Schrödinger y, a partir de ella,
encontramos tanto los autovalores como las autofunciones, pero la esencia misma de
la segunda cuantificación es evitar tener que lidiar con la función de onda, por lo
que queremos seguir otra ruta para obtener tales cantidades. Cómo hacer esto es lo
que examinaremos ahora.

4.3.1. Autovalores y autoestados

Veamos primero si podemos encontrar los valores propios o vectores propios de

algún Hamiltoniano simple. Comencemos con un Hamiltoniano cuadrático general

d
Aα c†α cα
X
H= (4.101)
α

donde α es una base completa y los coeficientes Aα son números arbitrarios. Varios
Hamiltonianos de sistemas fı́sicos tienen tales formas, por ejemplo, la energı́a cinéti-
ca de un sistema de partı́culas (4.74) y (4.76). Para Hamiltonianos cuadráticos y
diagonales de la forma (4.101) el problema está resuelto. De hecho cada vector de p
partı́culas de la forma

c†α1 c†α2 c†α3 . . . c†αp |0⟩ (4.102)

es un vector propio de H con autovalor

p
X
E= Ai (4.103)
i=1
138 4.3 Resolviendo con segunda cuantificación

Para mostrar esto, ilustremos el cálculo en un estado de dos fermiones |ψ⟩ = c†α1 c†α2 |0⟩
(se puede realizar un cálculo análogo para bosones):

!
Hc†α1 c†α2 |0⟩ Aα c†α cα c†α1 c†α2 |0⟩,
X
=
α

Aα c†α (δα,α1 − c†α1 cα )c†α2 |0⟩,

X
=
α

Aα c†α c†α1 cα c†α2 |0⟩,

X
= Aα1 |ψ⟩ −
α
(4.104)
Aα c†α c†α1 (δα,α2 c†α2 cα )|0⟩,
X
= Aα1 |ψ⟩ − −
α

= Aα1 |ψ⟩ − Aα2 c†α2 c†α1 |0⟩,

= Aα1 |ψ⟩ + Aα2 |ψ⟩.

La fı́sica de este resultado es simple de entender. El operador nα = c†α cα no es otra

cosa que el número de ocpación, y cuenta las partı́culas en el estado α. Ası́, si en |ψ⟩
hay una partı́cula en tal estado devolverá 1 y la energı́a correspondiente se contará
en H.
Ası́ vemos que si tenemos un Hamiltoniano que está en una forma cuadrática
diagonal como (4.101) entonces podemos obtener todos los valores propios y vectores
propios del sistema. A temperatura cero el estado fundamental consistirá simplemen-
te (para los fermiones) en ocupar todos los estados con la mı́nima energı́a posible
según el número de partı́culas en el sistema.

N
c†αi |0⟩,
Y
|F⟩ = (4.105)
i=1

si E1 ⩽ E2 ⩽ . . . ⩽ Ed . Nótese que el mar de Fermi (??) es un caso particular de

(4.105).

4.3.2. Valores de expectación térmicos

A temperatura finita también podemos calcular los promedios de muchos ope-
radores. Un caso importante es el operador que da el número de partı́culas en el
estado αp
Segunda cuantificación 139

h i
Tr e−βH c†αp cαp
⟨c†αp cαp ⟩ = ,
Tr [e−βH ]
(4.106)
Aα c†α cα †
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e cαp cαp |n1 , . . . , nd ⟩
P
α
= .
Aα c†α cα
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e |n1 , . . . , nd ⟩
P
α

n i
Usando el hecho de que (tanto para fermiones como para bosones) c†α cα , cγ = 0 si
α ̸= γ y una relación similar para c†γ , vemos que el término e−βH se factoriza en la
forma
d
−βH −βAαj c†αj cαj
Y
e = e . (4.107)
j=1

Como en la traza cada término ni es independiente, la media tabién se factoriza, y

el numerador se convierte en
   
−βAαp c†αp cαp −βAαj c†αj cαj
c†αp cαp |nαp ⟩
X Y X
 ⟨nαp |e  ⟨nα
j
|e |nαj ⟩ . (4.108)
nαp j̸=p nαj

Todos los términos con j ̸= p son idénticos en el numerador y el denominador y se

cancelan entre sı́. La traza se reduce entonces a
−βAαp c†αp cαp †
nαp ⟨nαp |e cαp cαp |nαp ⟩
P
⟨c†αp cαp ⟩ = † , (4.109)
−βAαp cαp cαp
nαp ⟨nαp |e |nαp ⟩
P

lo cual es bastante obvio fı́sicamente. De hecho, dado que el Hamiltoniano es diagonal

en α, sólo el estado αp puede contribuir al promedio de un operador que solo involucra
al estado αp . Como c†αp cαp |np ⟩ = np |np ⟩ simplemente obtenemos

e−βAαp np np
P
nαp
⟨c†αp cαp ⟩ = P . (4.110)
nαp e−βAαp np

Hasta ahora todo lo que hicimos es independiente de tener bosones o fermiones.

Sin embargo, el resultado final dependerá de cuáles sean los valores permitidos de
np . Para fermiones solo np = 0 y np = 1 están en la suma, y de este modo

e−βAαp 1
⟨c†αp cαp ⟩ = −βAαp = , (4.111)
1+e 1 + eβAαp
y se recupera el factor de Fermi. Vemos que este es un resultado totalmente general
(no limitado a autoestados del impulso) para Hamiltonianos bilineales y se está en
equilibrio térmico.
140 4.3 Resolviendo con segunda cuantificación

Para bosones np = 0, . . . , +∞, y ası́ la suma se convierte en

 
+∞
∂
⟨c†αp cαp ⟩ = − e−βnp Aαp  ,
X
log 
∂β np =0

∂ 1

=− log ,
∂β 1 − e−βAαp (4.112)
−βAαp
e
= ,
1 − e−βAαp
1
= βAαp ,
e −1
y se recupera el factor de Bose.

4.3.3. Transformaciones canónicas

Con Hamiltonianos cuadráticos diagonales podemos calcular entonces esencial-
mente cualquier valor de expectación o cantidad fı́sica que se necesite. Por supuesto,
en general, el Hamiltoniano del sistema no será ni cuadrático ni diagonal. Entonces,
resolver en segunda cuantificación significa esencialmente que tenemos que encon-
trar una transformación de los operadores c y c† que lleven al Hamiltoniano en una
forma diagonal cuadrática. Aunque en principio cualquier transformación es posi-
ble, no todas las son buenas. Queremos que los nuevos operadores d y d† que son
los resultados de la transformación sigan generando el espacio Fock. Significa que
sólo podemos considerar transformaciones que conserven las relaciones canónicas
de conmutación. Por supuesto, encontrar tales transformaciones es, en general, una
tarea formidable. Sin embargo, hay una clase muy importante de transformaciones
cuando el Hamiltoniano sigue siendo una forma cuadrática, pero no diagonal, que
examinaremos en la siguiente sección.
Antes de hacerlo, comentemos finalmente que incluso sin resolver el Hamilto-
niano se puede explotar la libertad de elegir diferentes operadores de creación y
destrucción para usar una representación más conveniente. Como ya se mencionó,
se permite toda transformación que conserve las relaciones canónicas de conmuta-
ción. Pongamos un ejemplo sencillo, se verán más ejemplos en la siguiente sección.
La transformación más simple es la transformación partı́cula-agujero.

c†α = dα ,
(4.113)
cα = d†α .

Para los fermiones es fácil comprobar, por sustitución de los operadores d verifican
Segunda cuantificación 141

las relaciones canónicas de anticonmutación. Por ejemplo

[dα , d†β ]+ = [c†α , cβ ]+ = δα,β . (4.114)

Si los operadores cα y c†α respectivamente destruyen y crean un electrón en el estado

α, el operador dα y d†α también son operadores de destrucción y creación de “algo
más”, que también tiene una estadı́stica fermiónica y por lo tanto, se puede utilizar
para construir un espacio de Fock. En ese caso particular, el operador dα destruye
un hueco en el estado estado α (que es idéntico a crear un electrón) y el operador
d†α crea un hueco (que es lo mismo que destruir un electrón).
Un punto importante al hacer la transformación es no olvidar modificar también
el vacı́o. De hecho, el vacı́o de las partı́culas d no es el mismo que el vacı́o de las
partı́culas c. Se tiene ası́ |0c ⟩ y |0d ⟩. El vacı́o de las partı́culas d se define como
siempre por
dα |0d ⟩ = 0,
para todos los estados α. Es fácil comprobar usando la relación (4.113) que

c†α |0c ⟩.
Y
|0d ⟩ =
α

Destruir una partı́cula d sobre este vacı́o es equivalente a crear una de tipo c. Pero
esto no es posible, porque todos los estados están ocupados.
Más generalmente, consideremos un Hamiltoniano cuadrático, no diagonal, arbi-
trario:
Ns
†
X
H= ci Aij cj (4.115)
i,j=1

donde Aij son los elementos de una matriz hermı́tica A, y Ns es un número del
orden del volúmen del sistema, d, que especifica la cantidad de estados accesibles
de partı́cula independiente. Para simplificar la notación conviene escribir en forma
matricial:
H = c† Ac (4.116)
donde  
c1
 c2
 
c† = c†1 c†2 · · · c†Ns

c=
 ..
, (4.117)
 .


cNs
es un vector de Ns elementos, donde cada elemento es un operador de creación, y su
transpuesto conjugado. Obsérvese que hemos introducido la notación con una barra
sobre c para indicar la operación de transposición sobre el vector en conjunto con
el dagado de sus elementos. La utilidad de esta notación quedará más clara en la
142 4.3 Resolviendo con segunda cuantificación

próxima sección. La matriz A, al ser hermı́tica, puede ser diagonalizada por una
matriz unitaria U ,
U † AU = Ã (4.118)
donde Ã es la matriz diagonal que contiene a los autovalores de A, A1 , . . . , ANs
y U se construye ordenando los autovectores de A en columnas. Una vez hallada
la matriz U , podemos utilizarla para definir un nuevo conjunto de operadores dα
mediante la transformación
Ns
† ∗
X
d = U c, (en componentes, dα = Uiα ci ) (4.119)
k=1

de manera tal que el Hamiltoniano, expresado en términos de los d resulta

H = d† U † AU d = d† Ãd = Aα d†α dα .
X
(4.120)
α

Es decir, resulta ser de la forma diagonal (4.101).

Una condición importante para que esto funcione es que la transformación (4.119)
conserve los anticonmutadores entre d, que es el caso debido a su unitariedad, ya
que
h i n o
†
d†α , dβ c†i , cj = †
= (U † U )βα = δαβ .
X X
= Uiα Uβj Ujα Uβj (4.121)
+
ij j

Una vez hallada la forma diagonal (4.120), el estado fundamental de N partı́culas

y viceversa, si aplicamos cj sobre |0d ⟩ también se anula, utilizando la transformación

inversa.
Por supuesto, en general, la matriz Aαβ es de tamaño Ns ×Ns y la diagonalización
será muy difı́cil de realizar analı́ticamente. Sin embargo, hay casos simples donde
puede hacerse. En especial, obsérvese que la transformada de Fourier (4.70), utilizada
para relacionar la base de coordenadas, donde la energı́a cinética de los electrones
en una caja es no diagonal, con la base de momentos, donde sı́ lo es, es un ejemplo
de tal transformación unitaria.
Segunda cuantificación 143

4.3.4. Ejemplo: Modelo tight binding

Veamos otro modelo que puede resolverse mediante este tipo de transformacio-
nes: el Hamiltoniano de ligadura fuerte o tight-binding que vimos en la sección ??.
Adicionalmente, esto nos permitirá escribir este Hamiltoniano en segunda cuantifi-
cación. Los estados en cada sitio |i⟩ proporcionan una base completa y, por lo tanto,
podemos definir los operadores de creación y destrucción asociados con él, es decir,
c†i es el operador que crea una partı́cula en el sitio i. Estos son los análogos a los c†r
utilizados al estudiar operadores de un cuerpo, sólo que en un espacio discreto. La
expresión en segunda cuantificación de H se escribe

(i|H (1) |j)c†i cj ,

X
H=
i,j

donde H (1) es el Hamiltoniano (??). Obtenemos ası́

X † X †
H=ϵ ci ci − t ci cj . (4.125)
i ⟨i,j⟩

El segundo término describe un proceso en el que una partı́cula en el sitio i reaparece

en el sitio vecino j y viceversa. Si bien es posible hacer todo este análisis en dimensión
arbitraria, para simplificar la diagonalización partición supondremos que los sitios
electrónicos se acomodan en un anillo, e identificamos el sitio en la posición Ns + 1
con el sitio 1, es decir, introducimos un operador de destrucción fermiónico adicional

cNs +1 ≡ c1 , (4.126)

y su complejo conjugado. Este Hamiltoniano es obviamente cuadrático pero no dia-

gonal. En el lenguaje de (4.115) corresponde a una matriz tridiagonal. Para dia-
gonalizarla, primero pensamos en la fı́sica del problema: dado que el Hamiltoniano
es invariante frente a traslaciones, el momento debe ser un buen número cuánti-
co, y vamos utilizar entonces una combinación lineal de operadores de creación y
destrucción ci que corresponden a su transformada de Fourier. Este es exactamen-
te el mismo razonamiento que el que conduce a (4.70), sólo que ahora utilizaremos
una transformada de Fourier discreta [véase el apéndice 5.31]. Tratados simplemente
como una combinación lineal de operadores, podemos definir
s −1
1 NX
d†k = √ eikrj c†j , (4.127)
Ns j=0

donde hemos usado un nombre diferente d para enfatizar que se trata de nuevos
operadores, e introducido las posiciones rj = aj donde a es la constante de red, y
2πnk
k= , nk ∈ Z.
Ns a
144 4.3 Resolviendo con segunda cuantificación

Se puede comprobar inmediatamente que los operadores dk cumplen las reglas

canónicas de conmutación. Verifiquemos uno de los anticonmutadores y dejemos
las otras relaciones como ejercicio:
n o 1 X −ikri iqrj n o
dk , d†q = e e ci , c†j ,
Ns ij
1 X −ikri iqrj
= e e δij ,
Ns ij
(4.128)
1 X i(k−q)rj
= e ,
Ns j

= δkq .

Los operadores dk son, por lo tanto, buenos operadores de Fermiones. Hay exacta-
mente Ns operadores diferentes (el tamaño del espacio de Hilbert no puede cambiar)
y k está confinado dentro de la primera zona de Brillouin k ∈ [−π/a, π/a] como se
discutió para la solución en primera cuantificación. Además, como resulta obvio de
la definición (4.127), |0d ⟩ = |0c ⟩. La transformación (4.127) se invierte fácilmente

1 X −ikrj †
c†j = √ e dk , (4.129)
Ns k

y ası́, reemplazando los cj en (4.125) y haciendo un poco de álgebra, se encuentra

X †
2t cos(ka)d†k dk .
X
H=ϵ dk dk − (4.130)
k k

Ahora que el Hamiltoniano es diagonal, podemos usar los operadores dk para obtener
el estado fundamental y los diversos promedios. A nivel fı́sico, hemos utilizado que,
dado que la cantidad de movimiento se conserva, se pueden diagonalizar simultánea-
mente los operadores de impulso y el Hamiltoniano. Por lo tanto, el Hamiltoniano es
una matriz diagonal por bloques en la base a los autovectores del operador impulso.
Como esta base es de tamaño Ns (Ns diferentes k valores en la primera zona de
Brillouin) nos queda para cada valor de k una matriz de 1 × 1 a diagonalizar, con
lo cual el problema está completamente resuelto.

4.3.5. Términos anómalos

Estudiemos ahora un Hamiltoniano más general, que incluya términos de la forma
ci cj . Este tipo de términos se denominan anómalos, y hacen que en el Hamiltoniano
no conmute con el operador N y por lo tanto no conserve el número de partı́culas,
Segunda cuantificación 145

y por lo tanto no tiene una expresión simple en primera cuantificación. Tı́picamen-

te aparecen cuando uno considera teorı́as para superconductividad, tales como el
llamado Hamiltoniano de Bardeen-Cooper-Schrieffer (BCS) que estudiaremos más
adelante. Consideremos el Hamiltoniano
Ns Ns
X † 1 X
H= ci Aij cj + ci Bij cj + h.c. (4.131)
ij=1 2 ij=1

siendo i, j = 1, . . . , Ns , A una matriz hermı́tica (A† = A), y B una matriz anti-

simétrica (B t = −B), ambas condiciones impuestas por la necesidad de que H sea
un operador hermı́tico en conjunto con la estadı́stica fermiónica. Para escribirlo en
forma matricial, debemos considerar ahora que existen estos dos tipos de términos.
Si buscamos utilizar una sola matriz, no será posible que su dimensión sea Ns . La
forma usual de hacerlo consiste en introducir la notación de Nambu, en la cual se
define un vector o spinor de Nambu de dimensión 2Ns cuyos elementos son tanto
los operadores de creación como de destrucción:

Ψ† = c†1 · · · c†Ns c1 · · · cNs (4.132)
en conjunto con la matriz !
A −B ∗
H= , (4.133)
B −A∗
que se conoce como Hamiltoniano de Bogoliubov-de Gennes. Con estas definiciones
el Hamiltoniano se escribe
1
H = Ψ† HΨ + E0 (4.134)
2
dónde
1
E0 = − tr A, (4.135)
2
Obsérvese que a matriz H continúa siendo hermı́tica (para mostrarlo es impor-
tante la antisimetrı́a de B) y por lo tanto diagonalizable mediante una transforma-
ción unitaria M de 2Ns × 2NS , de manera similar a como lo realizamos en la sección
anterior, de manera tal que
M † HM = H̃ = diag(Λ1 , . . . , ΛNs , Λ̄1 , . . . , Λ̄Ns ), (4.136)
donde Λα y Λ̄α son los autovalores de H. El spinor transformado Φ se relaciona con
el sin transformar a través de M :
Φ = M Ψ, (4.137)
Y entonces el Hamiltoniano, en términos de los nuevos operadores, resulta
1 1
H = Φ† M † HM Φ = Φ† H̃Φ (4.138)
2 2
146 4.3 Resolviendo con segunda cuantificación

Si escribimos al vector Φ en términos de un nuevo conjunto de operadores ηα , ξα en

la forma
Φ† = η1† · · · ηN†
s
ξ1
†
· · · ξ †
Ns . (4.139)
el Hamiltoniano se escribe
Ns Ns
1X † 1X
H= Λα ηα ηα + Λ̄α ξα† ξα (4.140)
2 α=1 2 α=1

Al ser unitaria, la transformación M preserva los conmutadores y es por lo tanto

canónica, pero observemos que ahora la transformación mezcla a los operadores de
creación y destrucción.
La forma (4.140) del Hamiltoniano posee dos términos y a simple vista darı́a la
impresión de que como consecuencia de la existencia de términos anómalos debimos
duplicar el número de grados de libertad. Veamos que esto es sólo ası́ en apariencia.
Observemos que H satisface la relación

H = −σx H ∗ σx , (4.141)

donde la matriz de Pauli σx actua sobre la estructura de Nambu (4.133), de 2 × 2.

Esta transformación constituye una simetrı́a de H, y resulta ser antiunitaria5 . La
transformación (4.141) no es más que la simetrı́a partı́cula-hueco. Esto implica que
si ψ es un autoestado de H con autovalor λ,

Hψ = λψ,

entonces ψ ∗ es autoestado de H ∗ con el mismo autovalor (que es real, dado que H

es hermı́tico):
H ∗ ψ ∗ = λψ ∗
y entonces el vector ψ ′ = σx ψ ∗ también es vector de H con autovalor −λ:

Hψ ′ = Hσx ψ ∗ = −σx H ∗ σx σx ψ ∗ = −σx H ∗ ψ ∗ = −λσx ψ ∗ = −λψ ′ .

5
Una transformación antiunitaria K entre vectores |x⟩, |y⟩ de un espacio de Hilbert (|y⟩ = K|x⟩)
es un operador antilineal (es decir, tal que K(a|x⟩ + b|y⟩) = a∗ K|x⟩ + b∗ K|y⟩ con a, b ∈ C) tal que
transforma el producto escalar en el producto escalar conjugado:

⟨x|K † K|y⟩ = ⟨x|y⟩∗ . (4.142)

Este tipo de operadores, al igual que los operadores unitarios, no cambia el resultado de una
medida, es decir que
|⟨x|K † K|y⟩|2 = |⟨x|y⟩|2 . (4.143)
Segunda cuantificación 147

Dado que son vectores distintos, de otro modo tendrı́an distinto autovalor (a menos
que λ = 0), si escribimos al autovector en la forma
!
u
ψ=
v

donde u y v son vectores columna de Ns elementos, entonces

!
v∗
′
ψ = ∗
u

La matriz M , que posee los autovectores en columnas, posee entonces la forma

!
u v∗
M= , (4.144)
v u∗

donde u y v son matrices de Ns × Ns .En otras palabras, la forma (4.144) es conse-

cuencia de la simetrı́a partı́cula-hueco de H, ec. (4.141). Los autovalores Λ̄α puede
tomarse como Λ̄α = −Λα y la forma diagonal de la matriz de autovalores se escribe
entonces
H̃ = diag(Λ1 , . . . , ΛNs , −Λ1 , . . . , −ΛNs ), (4.145)
donde Λα son todos positivos. Observemos además la transformación (4.137) se
escribe explı́citamente

ηi = uij cj + vij∗ c†j , (4.146)

ξi = vij cj + u∗ij c†j , (4.147)

pero entonces ξi no es más que el adjunto de ηi , ξi = ηi† , y el Hamiltoniano se escribe

Ns
Λj ηj† ηj + Const.
X
H= (4.148)
j=1

De modo que sólo tenemos Ns grados de libertad, como se esperaba fı́sicamente.

Para diagonalizar el Hamiltoniano debimos duplicar el número de grados de libertad
introduciendo huecos, pero vimos que esta duplicación es espuria. Sin embargo, en
determinadas circunstancias puede ser útil mantener la duplicación, pero en ese caso
debe recordarse que el par de niveles con energı́a ±Λj no corresponde a dos estados
cuánticos distintos, sino a uno solo, que es una superposición coherente de electrones
y huecos —una cuasipartı́cula de Bogoliubov, el bogoliubon: tiene una energı́a de
excitación Λj , y es creada por el operador ηj† = uij cj +vij c∗j . Llenar el estado asociado
en energı́a −Λj es equivalente a vaciar el estado de energı́a positiva.
148 4.4 Gas de Fermi

El Hamiltoniano (4.131) no conserva el número de partı́culas, ya que no conmuta

con N = j c†j cj , aunque conserva el número de cuasi partı́culas, M = j ηj† ηj .
P P

Como consecuencia de que la transformación M mezcla operadores cj y c†j el vacı́o

no es invariante, tenemos un vacı́o |0c ⟩ que satisface cj |0c ⟩ = 0, y un vacı́o |0η ⟩
que verifica ηj |0η ⟩ = 0. Encontrar la relación entre ambos puede ser complicado y
depende de la forma de A y B. Lo haremos en el caso especı́fico del modelo BCS más
adelante. Una vez determinado |0η ⟩, el estado fundamental de M cuasipartı́culas se
escribe como un mar de Fermi de bogoliubones:
M
†
Y
|F ⟩ = ηj |0η ⟩. (4.149)
j

cuya energı́a resulta

M
X
E= Λj (4.150)
j

El estdo de mı́nima energı́a para un cierto potencial quı́mico es entonces aquel con
M = 0 cuasipartı́culas, es decir, el vacı́o mismo de los Bogoliubones.
Si bien el número de partı́culas no es una cantidad conservada, el operador de
paridad global,
P = (−1)N = eiπN (4.151)
conmuta con H, y por lo tanto los autoestados de energı́a poseen paridad fermiónica
definida ±1.

4.4. Gas de Fermi

Desarrollaremos las propiedades básicas de un gas de N fermiones no interac-
tuantes de masa m, utilizando las técnicas de segunda cuantización. Esto lo haremos
no sólo por tratarse de un buen ejercicio, sino también por la enorme utilidad que
tienen los resultados que obtendremos, como una aproximación de orden cero, en el
tratamiento de sistemas de muchos fermiones. Podemos imaginarnos que estos fer-
miones están en una caja cúbica de volumen V , que eventualmente puede ser muy
grande, y que se imponen condiciones de contorno periódicas. La base de partı́cula
independiente se refiere, por lo tanto, a los autoestados de de impulso hk y proyec-
ción de spin σ = ± 21 :

1
φκ (rs) = √ eik·r χσ (s); κ = {k, σ} (4.152)
Ω

con energı́a εk = ℏ2 k 2 /2m y degencrados en spin σ = ± 21 .

Segunda cuantificación 149

Para construir el estado fundamental del gas de Fermi ocupamos a cada uno
de los estados disponibles de partı́cula independiente más bajos con un fermión, de
acuerdo con el principio de exclusión de Pauli. Esta ocupación es de a pares ya que
las energı́as de partı́cula independiente no depende de spin y por cada εk tenemos
un fermión con σ = + 21 y uno con σ = − 12 . Los niveles llenos conforman el mar de
h2 k2
Fermi y el último nivel lleno, con impulso kF y energı́a εF = 2mF , se llama nivel de
Fermi o superficie de Fermi (en el espacio de los impulsos). La estructura del estado
fundamental es:
c†kσ |0⟩.
Y
|F ⟩ = (4.153)
k⩽kF ,σ

La energı́a del nivel de Fermi se halla de la condición que el número total de

partı́culas N sea,
( )
1 ; k ⩽ kF
⟨F |c†kσ ckσ |F ⟩
X X X
N= nkσ = =2
kσ kσ k
0 ; k > kF
X X (4.154)
=2 1=2 θ(kF − k).
k⩽kF k

Convirtiendo la suma en la integral, i. e.,

ˆ ˆ kF 2 2
1X θ(kF − k)k 2 dk k dk
θ(kF − k) → 3
dΩ = (4.155)
Ω k (2π) 0 2π 2

se obtiene, ˆ kF
Ω kF3
N= 2 k 2 dk = Ω (4.156)
π 0 3π 2
o sea,
N k3
= F2
ρ0 = (4.157)
Ω 3π
donde ρ0 es la densidad media de partı́culas.
Calculemos ahora la densidad de partı́culas en el estado fundamental, que es

⟨F |c†rσ crσ |F ),
X X
ρ(r) = ⟨F |ρ̂(rσ)|F ⟩ = (4.158)
σ s

o
1 X X ir·(k′ −k)
ρ(r) = e ⟨F |c†kσ ck′ σ |F ⟩. (4.159)
Ω σ kk′
El último valor medio será nulo a menos que k = k′ , ya que si removemos del estado
fundamental una partı́cula con impulso ℏk′ , podremos volver de nuevo a ese estado
sólo creando una partı́cula con el mismo impulso. Por lo tanto,

⟨F |c†kσ ck′ σ |F ⟩ = δkk′ nkσ (4.160)

150 4.4 Gas de Fermi

y
1X
ρ(r) = nkσ = ρ0 . (4.161)
Ω kσ
Como era de esperar, la densidad del gas es uniforme. Una cantidad muy útil, como
veremos más adelante, es la matriz densidad de una partı́cula definida como

Gσ (r − r ′ ) = ⟨F |c†rσ cr′ σ |F ⟩, (4.162)

es deicr, la amplitud de remover del estado fundamental una partı́cula que está en el
punto r ′ con spin σ para luego ponerla de nuevo al estado fundamental, pero ahora
en la posición r. Utilizando (4.70),
1 X ik·r
crσ = √ e ckσ , (4.163)
Ω kσ

y (4.152) el cálculo es:

1 X −ik·r+k′ ·r′
Gσ (r − r ′ ) = e ⟨F |c†kσ ck′ σ |F ⟩
Ω kk′
(4.164)
1 X −ik·r+k′ ·r′
= e δk′ k nkσ ,
Ω kk′
o ˆ kF
1 X −ik·(r−r′ )
′ dk −ik·(r−r′ )
Gσ (r − r ) = e → e . (4.165)
Ω k⩽kF 0 (2π)3
Evaluando la integral se tiene6

ρ0 3 3j1 (u)
Gσ (r − r ′ ) = C(kF |r − r ′ |); C(u) = 3
(sin u − u cos u) = . (4.169)
2 u u
A la cantidad C(kF |r − r ′ |) se la denomina función de correlación y tiene las
propiedades de tener un máximo para r = r ′ , con C(0) = 1, y de decaer rápidamente
para kF |r − r ′ | > 1 (ver Fig. 4.4).
6

ˆ kF ˆ kF ˆ 1
dk −ik·(r−r′ ) 1 ′ ′
Gσ (r − r ′ ) = 3
e = 2
k 2
dk e−ik|r −r |u du (4.166)
0 (2π) 4π 0 −1
ˆ kF
1 1
= kdk sin k|r − r ′ | (4.167)
2π 2 |r − r ′ | 0
1 1
= (sin kF |r − r ′ | − kF |r − r ′ | cos kF |r − r ′ |). (4.168)
2π |r − r ′ |3
2
Segunda cuantificación 151

0,8

0,6

0,4

0,2

−0,2
0 2 4 6 8 10

Vamos a calcular ahora la probabilidad de hallar una partı́cula del sistema en

el punto r ′ (con spin σ ′ ), sabiendo que lay otra partı́cula en el punto r (con spin
σ). Esto significa que primero removemos del sistema una partı́cula que está en rσ,
dejando las N − 1 partı́culas en el estado |rσ⟩ = c†rσ |F ⟩. Posteriormente, calculamos
el valor medio de la densidad ρ(r ′ , σ ′ ) en ese nuevo estado. Es decir, evaluamos

2
ρ0

gσσ′ (r − r ′ ) ≡ ⟨F |c†rσ c†r′ σ′ cr′ σ′ crσ |F ⟩. (4.170)
2

Utilizando la representacion en el espacio k, (4.70), tenemos

2
ρ0 1

′ ′
gσσ′ (r − r ′ ) = e−ik1 ·r e−ik2 ·r eik3 ·r eik4 ·r ⟨F |c†k1 σ c†k2 σ′ ck3 σ′ ck4 σ |F ⟩.
X
2 Ω2 k1 k2 k3 k4
(4.171)
Dado que ckσ |F ⟩ = 0, si k > kF (i. e., no podemos destruir partı́culas que no
están), vemos de inmediato que la sumatoria está restringida a los estados con
|k3 |, |k4 | ⩽ kF . Además, el valor de expectación se anula a menos que las partı́culas
que repongamos tengan los mismos impulsos y spines que las partı́culas removidas.
La forma de hacerlo es emplear los anticonmutadores, y escribir

⟨F |c†κ c†λ cµ cν |F ⟩ = ⟨F |c†κ (δλ,µ − cµ c†λ )cν |F ⟩ = δλµ ⟨F |c†κ cν |F ⟩ − ⟨F |c†κ cµ c†λ cν |F ⟩
= δλ,µ δκ,ν − δκ,µ δλ,ν (4.172)
152 4.4 Gas de Fermi

con κ, λ, µ, ν ⩽ kF , y por lo tanto7

2 kF
ρ0 1

′ ′ ′
e−ik1 ·r e−ik2 ·r eik3 ·r eik4 ·r (δk2 k3 δk1 k4 − δσσ′ δk1 k3 δk2 k4 ) ,
X
gσσ′ (r − r ) = 2
2 Ω k1 k2 k3 k4
(4.173)
kF h
1 X −ik1 ·(r−r ′ ) −ik2 ·(r ′ −r)
i
= 1 − δσσ ′ e e , (4.174)
Ω2 k1 k2
!2
Ω
= − δσσ′ G2σ (r − r ′ ) (4.175)
2N
donde hemos utilizado (4.165). Finalmente de (4.169) se tiene
gσσ′ (r − r ′ ) = 1 − δσσ′ C 2 (kF |r − r ′ |). (4.176)
La cantidad gσσ′ (r − r ′ ) se denomina densidad de correlación para dos partı́culas y
en la Fig. 4.4 se ilustra su comportamiento.
Veamos el significado fı́sico de esta densidad de correlación. Si los spines son
diferentes, la probabilidad relativa de encontrar las partı́culas en r y r ′ no depende
de la distancia |r − r ′ |. Esto es lo mismo que se obtendrı́a clásicamente para un gas
de partı́culas que no interactúan entre sı́. En cambio, si los dos electrones tienen
el mismo spin habrá una reducción muy grande en la probabilidad de hallarlos a
distancias menores que kF−1 . Es decir que el principio de Pauli produce correlacio-
nes muy importantes sobre el movimiento de partı́culas con el mismo spin. Ocurre
como si los fermiones con la misma orientación de spin se rechazaran entre sı́. Esta
“repulsión” efectiva proviene de la simetrı́a de intercambio de la función de onda y
no de una fuerza real entre las partı́culas. Para separaciones grandes gσσ′ (r − r ′ ) se
aproxima a uno, o sea al mismo valor que tienen dos partı́culas con spines diferentes.
Calculemos ahora la energı́a del estado fundamental del gas de Fermi. En par-
ticular, vamos a considerar que se trata de un gas de electrones de densidad media
ρ0 , que interactúan entre sı́ por medio de la interacción Coulombiana. Partiremos
del Hamiltoniano,
Ĥ = T̂ + V̂ (4.177)
donde
X ℏ2 ∇2r
T̂ = t̂(ri ); t̂(r) = − (4.178)
i 2m
es el operador para la energı́a cinética, y
1X e2
V̂ = v̂(ri , rj ); v̂(r1 , r2 ) = (4.179)
2 ij |r1 − r2 |
7
Notemos que, como las sumas se extienden solo sobre estados ocupados, no se pueden usar
relaciones de completitud.
Segunda cuantificación 153

es el operador para la energı́a potencial. Dado que

εk c†kσ ckσ ,
X
T̂ = (4.180)
kσ

la energı́a cinética será8

3
E (0) = ⟨F |T̂ |F ⟩ = εF N. (4.182)
5
Para la energı́a potencial, podemos utilizar la ecuación (4.90)

E (1) = ⟨F |V̂ |F ⟩ (4.183)

ˆ
1
drdr ′ v̂(r, r ′ ) ⟨F |c†rσ c†r′ σ′ cr′ σ′ crσ |F ⟩
X
= (4.184)
2 σσ ′
2 ˆ
1 ρ0
drdr ′ v̂(r, r ′ ) gσσ′ (r − r ′ )
X
= (4.185)
2 2 ′
2 ˆ
σσ
ρ0 h i
= drdr ′ v̂(r, r ′ ) 2 − C 2 (kF |r − r ′ |) , (4.186)
2

donde hemos usado (4.176). Escribimos ahora,

(1) (1)
E (1) = ED + EI (4.187)

con ˆ
(1) 1 e2 ρ20
′
ED = drdr , (4.188)
2 |r − r ′ |
y ˆ
(1) e2 ρ2 C 2 (kF |r − r ′ |)
EI =− 0 drdr ′ . (4.189)
4 |r − r ′ |
(1)
ED representa la interacción media de las partı́culas entre sı́ y se denomina energı́a
(1)
directa ó energı́a de Hartree, mientras que EI es la energı́a de intercambio y se
debe al principio de exclusion de Pauli. Haciendo el cambio de variables: r → r ′ y
r − r ′ → r, también resulta,
ˆ
(1) N ρ0 e2 dr
ED = v0 ; v0 = , (4.190)
2 r
8

ˆ kF
X X dk ℏ2 k2 ℏ2 kF5 3
⟨F |T̂ |F ⟩ = εk nkσ = εk θ(k − kF ) → 2Ω 3
=Ω 2
= εF N (4.181)
0 (2π) 2m 2m 5π 5
k,σ kσ
154 4.4 Gas de Fermi

y ˆ
(1) N ρ0 e2 C 2 (kF r)
=−
EI dr . (4.191)
4 r
Los electrones de conducción en un metal corresponden al gas de electrones que
estamos considerando. Notemos que en cualquier situación fı́sica nunca se tiene un
gas aislado, sino que hay siempre un número suficiente de cargas positivas, que hacen
que el sistema, como un todo, sea neutro. En una primera aproximación, todos los
iones positivos dentro del metal o dentro de un plasma, se pueden reemplazar por
un fondo (o “background”) de densidad de cargas positivas ρ0 e. La autoenergı́a de
ese fondo es: ˆ
1 e2 ρ20
drdr ′ (4.192)
2 |r − r ′ |
que junto con la energı́a electrostática media entre el fondo positivo y los electrones,
ˆ
e2 ρ20
− drdr ′ (4.193)
|r − r ′ |
cancela exactamente la energı́a de Hartree de los electrones. Por lo tanto, en primer
orden de aproximación, la interacción neta en un gas de electrones es precisamente
la energı́a de intercambio (4.191), que integrando resulta:
(1) 3 2
EI = − e kF . (4.194)
4π
Definiendo ahora la distancia media entre las partı́culas, d, por medio de
4πd3
Ω=N , (4.195)
3
resulta,
3π 2 N 9π 1/3 1 ∼

kF = = = 1,92d−1 , (4.196)
Ω 4 d
es decir que kF−1 ∼
= d/2. Otra longitud caracterı́stica es el radio de Bohr, a0 = ℏ2 /me2 .
Introducimos entonces un parámetro sin dimensiones,
d
rs = (4.197)
a0
por medio del cual escribimos
3 ℏ2 kF2 N 3 9π 2/3 c2 2,12 e2

(0)
E = N= 2 =N 2 (4.198)
5 2m rs 5 4 2a0 rs 2a0
1/3 2
N 3 9π e 0,916 e2

(1)
EI =− = −N (4.199)
rs 2π 4 2a0 rs 2a0
Segunda cuantificación 155

E/N
0,1

HF
0 rs

−0,1

RPA
−0,2
2 4 6 8 10 12

Figura 4.2: Energı́a por partı́cula, en unidades de Ry (e2 /2a0 ), para el estado fun-
damental del gas de Fermi.

La energı́a total ⟨F |Ĥ|F ⟩, evaluada con una función de onda antisimetrizada, se

denomina energı́a de Hartree-Fock (HF)
!
2,21 0,916 e2
EHF = N − + ··· . (4.200)
rs2 rs 2a0

De la Fig. 4.2 vemos que para rs ≳ 2 resulta EHF < 0, lo que indica que el
sistema se torna ligado. El principio de exclusión juega un papael importante en
esto, evitando que los electrones con los mismos spines se acerquen y de este modo
hace disminuir su energı́a electrostática. Notemos que la aproximación de HF es solo
válida para gases densos (rs ≪ 1) y no para los metales con 1, 8 ⩽ rs ⩽ 5, 5.
La energı́a se puede bajar más todavı́a por el hecho de que también los electrones
con spines opuestos tienden a separarse, debido a la interacción Coulombiana. Esta
aproximación se denomina de fases al azar o “random phase approximation” (RPA)
y lleva al resultado9
!
2,21 0,916 e2
ERP A = N − + 0,062 ln rs − 0,142 + · · · (4.201)
rs2 rs 2a0

que tambićn se muestra en la Fig. 4.2.

9
Véase D. Pines, Elementary Excitations in Solids p. 118 y M. Gell-Mann and K. Brueckner,
Phys. Rev. 106, 364 (1957).
156 4.5 Teorı́a cuántica de la radiación

4.5. Teorı́a cuántica de la radiación

Como ya señalamos previamente y en el curso en que aprendimos la mecánica
cuántica de Schrödinger y Heisenberg, para el tratamiento cuántico de sistemas de
partı́culas cargadas en interacción con un campo electromagnético habı́amos consi-
derado a este último como un “fondo” (“background”) clásico. En efecto, se tomó
para el campo electromagnético una solución clásica de las ecuaciones de Maxwell
(por ejemplo la de un campo coulombiano) y se la “sumergió”, como potencial ex-
terno, en la ecuación cuántica para una o varias partı́culas cuánticas cargadas. Ası́
se analizó el átomo de Hidrógeno: se estudió la ecuación de Schrödinger un electrón
cuántico sometido al campo eléctrico coulombiano clásico producido por el núcleo.
En el caso del átomo de helio, también el potencial de repulsión entre los electrones
fue tomado como un potencial coulombiano clásico mientras que los electrones eran
considerados como partı́culas cuánticas.
También estudiamos lo que llamamos la teorı́a semiclásica de la radiación. Pe-
ro ahora aprendimos el método de segunda cuantificación y podremos considerar
al electromagnetismo también de manera cuántica (recordemos que los campos de
gauge son bosones de spin 1) y ası́ tener una descripción más precisa de la radiación
electromagnética en términos de cuantos (fotones).
Repasemos las ideas básicas de la sección 1.9. En el gauge transversal de Cou-
lomb, y en ausencia de cargas y corrientes, las ecuaciones de Maxwell se reducen a
la ecuación de onda para el potencial vector,
!
2 1 ∂22
□ A(r, t) ≡ ∇ − 2 2 A(r, t) = o (4.202)
c ∂t

cuya solución más general se puede expresar como una superposición de ondas planas
con número de onda k y polarización ϵ,
1 X
A(r, t) = bkα ϵα eik·r−iωk t + b∗kα ϵ∗α e−ik·r+iωk t (4.203)
Ω k,α

donde α = 1, 2 y ϵ real para el caso de polarización lineal, y

ωk = ck. (4.204)

El vector de polarización tiene que ser perpendicular a k,

ϵα · k = 0, (4.205)

es decir, la onda debe ser transversal. La combinación de los coeficientes y sus

conjugados ha sido elegida para que A sea real.
Segunda cuantificación 157

De la densidad de energı́a para el campo electromagnético (1.158), obtenemos el

Hamiltoniano clásico asociado a las ecuaciones de Maxwell en ausencia de fuentes,
ˆ
1
H= dr E 2 + B 2
2
A partir de las expresiones de los campos eléctricos y magnético en términos del
potencial vector, E = −(1/c)∂A/∂t y B = ∇ × A, e insertando el desarrollo
(4.203) en esta expresión, el Hamiltoniano del sistema puede escribirse en la forma
X ωk 2
H=2 b∗kα bkα (4.206)
kα c
Podemos interpretar a estos coeficientes bkα y b∗kα como “coordenadas” con las que
se determina al campo A. Dando un determinado conjunto (infinito) de valores de
bkα y b∗kα queda determinado un potencial vector A. Dando otro conjunto, se tiene
otro A. Esto se manifiesta más claramente si se escribe
1
Qkα = (bkα + b∗kα ) (4.207)
c
iωk
Pkα = − (bkα − b∗kα ) (4.208)
c
de manera que el Hamiltoniano puede escribirse
1 X 2
H= Pkα + ωk2 Q2kα
2 kα
lo que corresponde claramente a una superposición de infinitos osciladores.
Las ecuaciones de Maxwell para A pasan a ser las ecuaciones de Hamilton:
∂H
= −Ṗkα (4.209)
∂Qkα
∂H
= Q̇kα (4.210)
∂Pkα
Con estos P y Q se puede definir a los corchetes de Poisson del problema clásico
{Pkα , Qk′ α′ } = δk,k′ δα,α′
{Pkα , Pk′ α′ } = 0, {Qkα , Qk′ α′ } = 0
En este punto, podemos atacar el problema de la cuantificación del campo electro-
magnético, siguiendo los pasos de la cuantificación canónica. Es decir, imponemos
las relaciones de conmutación inferidas de las relaciones clásicas (4.5)
h i
P̂kα , Q̂k′ α′ = −iℏδk,k′ δα,α′
h i h i
P̂kα , P̂k′ α′ = 0, Q̂kα , Q̂k′ α′ = 0
158 4.5 Teorı́a cuántica de la radiación

De estas reglas es facil deducir las reglas de conmutación las que obedecen b̂ y b̂† .
Conviene antes adimensionalizar estos operadores definiendo
s
2ωk
âkα = b̂kα (4.211)
c2 ℏ
s
2ωk †
â†kα = b̂ (4.212)
c2 ℏ kα

Usando el análogo a (4.207) y (4.208)

1
Qkα = (bkα + b∗kα ) (4.213)
c
iωk
Pkα =− (bkα − b∗kα ) (4.214)
c
para el caso de operadores, se tiene, invirtiendo esta ecuación
1
âkα = √ ωk Q̂kα + iP̂kα (4.215)
2ℏω
1
â†kα =√ ωk Q̂kα − iP̂kα (4.216)
2ℏω

con lo que las reglas de conmutación para â y â† resultan

h i
âkα , â†k′ α′ = δkk′ δαα′
h i
â†kα , â†k′ α′ = 0, [âkα , âk′ α′ ] = 0

Vemos entonces que con este procedimiento, el campo A pasa a ser un objeto que
tiene un desarrollo en términos de operadores â y â† que obedecen un álgebra de
operadores de aniquilación y creación bosónica,
s
1 X ℏ ik·r−iωk t
Â(r, t) = √ c ϵα e âkα + ϵα e−ik·r+iωk t â†kα (4.217)
Ω kα 2ωk

Las ondas planas de la teorı́a clásica que representan el campo de radiación jue-
gan aquı́ el rol de las funciones de onda cuando tomábamos un sistema cuántico de
partı́culas, bosones o fermiones, que obedecı́an la ecuación de Schrödinger y pro-
cedı́amos a la segunda cuantificación del mismo.
Es importante notar que aquı́ el campo de radiación no obedece una ecuación
cuántica (como era el caso de las funciones φn (r) que obedecı́an la ecuación de
Schrödinger), como vimos para el caso que ya discutimos para los bosones de spin
cero y los fermiones. En este caso son directamente soluciones de las ecuaciones
Segunda cuantificación 159

clásicas de Maxwell. Pero, como en los casos anteriores, los coeficientes del desarrollo
son operadores de segunda cuantificación, en este caso en el esquema de Heisenberg
puesto que el campo Â(r, t) ha pasado a ser un operador dependiente del tiempo.
El Hamiltoniano (4.206) se vueve ahora un operador cuántico:
1
X
Ĥ = ℏωk n̂kα +
kα 2
donde, como antes, hemos definido el operador número de partı́cula como
n̂kα = â†kα âkα
El hamiltoniano cuántico (4.5) corresponde a un sistema de infinitos osciladores de
frecuencia ωk = ck.

4.6. Emisión y absorción de fotones por un átomo

Estamos ahora en condiciones de tratar el problema de absorción y emisión de
radiación por un átomo de manera verdaderamente cuántica. Es decir, tomando
también al campo de radiación en el contexto de la segunda cuantificación.
Vamos a trabajar en la representación de Schrödinger en la que que los operadores
son independientes del tiempo. Es decir que Âµ = Âµ (r). A diferencia de lo que
hicimos en el caso libre, en que habı́amos podido complementar la condición de
Lorentz con la elección de A0 = 0 trabajando entonces en el gauge de Coulomb todo
se complica por una de las ecuaciones de Maxwell
□Aµ = jµ
que tiene un lado derecho no trivial por la existencia de la corriente jµ que repre-
senta la interacción de la materia (los electrones en el caso que discutiremos) con
la readiación con una componente j0 en principio no nula. Y en particular, como
j0 ̸= 0 no podemos elegir A0 = 0 como habı́amos hecho anteriormente. Para encarar
esta situación procederemos de la siguiente manera: - Todo vector puede descom-
ponerse en una componente longitudinal V∥ (para el caso del campo de las ondas
que tratamos, por ejemplo, esta componente fue tomada como la componente en
la dirección k ) y una perpendicular V⊥ (que para las ondas de radiación es la del
plano perpendicular a k). El vector resultante puede escribirse como la suma del
rotor de un vector V⊥ = ∇ × v y el gradiente de un escalar V∥ = ∇ϕ,
V⊥ = ∇ × v, V∥ = ∇ϕ
Vemos que dada esta definición, se tiene
∇ · V⊥ = 0, ∇ × V∥ = 0
160 4.6 Emisión y absorción de fotones por un átomo

Luego, si descomponenos al potencial vector A en sus partes transversa V⊥ de di-

vergencia nula por ser un rotor y longitudinal A∥ de rotor nulo por ser un gradiente,
tendremos
A = A⊥ + A∥
con
∇A⊥ = 0, ∇ × A∥ = 0
En tal caso el campo magnético solo dependera de A⊥ ,

B = ∇ × A = ∇ × A⊥ + 0 ⇒ B = B (A⊥ )

O sea, que el campo magnético “no se entera” de la existencia de A∥ . En cuanto al

campo eléctrico, tenemos que en la ecuación de Maxwell ∇E = ρ solo aparecerá la
su componente paralela

∇ · E = 0 + ∇E∥ = 4πρ ⇒ ∇ · E = 4πρ

Las ecuaciones de Maxwell que ligan a E y B y con j = j⊥ + j∥ toman la forma

∂E⊥
∇ × B (A⊥ ) + = 4πj⊥ (4.218)
∂t
∂E∥
= 4πj∥ (4.219)
∂t
De aquı́ concluimos que el campo E∥ es creado por las cargas y corrientes mientras
que el campo magnético solo depende de A⊥ y E∥ . Es decir que para B en ningun
momento necesitamos hacer referencia a A∥ para determinar cantidades fı́sicas. Es
por ello que, si se elige desde un principio el gauge de Coulomb,

∇·A=0

resulta que A∥ tiene rotor y divergencia nulos. Es decir, es idénticamente nulo (o

una constante irrelevante). Lo tomaremos entonces como nulo. O sea que este caso
A∥ = 0 reemplaza a la condición A0 = 0 cuando discutimos la ecuación de ondas
homogénea.
El hamiltoniano clásico de nuestro sistema completo (átomo y radiación) es

e2 X Ze2 1
2
1 e 1
X X
H= pj − A⊥ (rj ) + − + Hrad
j 2m c i>j 4π |xi − xj | i 4π ri

con ˆ  !2 
1 1 ∂A⊥
Hrad = dr (∇ × A⊥ )2 + 2 
2 c ∂t
Segunda cuantificación 161

Proceder a la segunda cuantificación de este hamiltoniano implica promover pj , rj y

A⊥ a la categorı́a de operadores, dejando solamente a los potenciales coulombianos
de repulsión entre los electrones y de atracción del núcleo (segundo y tercer términos
en (22.30) como objetos clásicos. Podemos entonces reescribir (22.30) en la forma
cuántica
Ĥ = Ĥ0 + Ĥrad + Ĥint
con
1 X e2 1 X Ze2 1
(p̂j )2 +
X
Ĥ0 = − (4.220)
j 2m i>j 4π |xi − xj | i 4π ri
ˆ  !2 
1
 ∇ × Â⊥
2 1 ∂ Â⊥
Ĥrad = dr + 2  (4.221)
2 c ∂t
 
X e2 2 e X
Ĥint =  Â ⊥ − p̂ j · Â ⊥j + Â ⊥j · p̂ j
 (4.222)
j 2mc2 2mc j

Si Ĥint fuera nulo, las autofunciones del hamiltoniano podrı́an escribirse como |
Atomo ⟩ | radiación ⟩ Aquı́ es natural identificar —radiación ⟩ con un ket en el
espacio de los números de ocupación de fotones,
| radiación ⟩ = |n1 n2 . . . ni . . .⟩
Podemos ahora pensar que Ĥint produce, como perturbación, transiciones entre los
niveles no perturbados descriptos por (22.34). Como trabajaremos en la represen-
tación de Schrödinger en la que los operadores no dependen del tiempo, se trata
de una perturbación constante pero como ya lo discutimos, puede ser tratada en
el marco de la teorı́a de perturbaciones dependientes del tiempo. Dado que la per-
turbación corresponde a una constante de acoplamiento suficientemente pequeña,
e2 /(ℏc) ≈ 1/137, calcular la primera corrección al problema libre es una buena
aproximación por lo que trabajaremos al primer orden.
En términos de operadores de creación y aniquilación â† y â tendremos entonces
una perturbación lineal en la que se crearán o destruirán fotones. Para obtener la
probabilidad de transición entre un estado inicial i y uno final f utilizaremos la
fórmula dada por la regla de oro que obtuvimos oportunamente,
2π D E2
f Ĥint i δ (ϵf − ϵi )
Wi→f =
ℏ
Supongamos estudiar un proceso de absorción de un fotón de impulso ℏk y polari-
zación α. En tal caso
|i⟩ =| Atomo A + nkα fotones ⟩ (4.223)
|f ⟩ =| Atomo B + (nkα − 1) fotones ⟩ (4.224)
162 4.6 Emisión y absorción de fotones por un átomo

donde A indican el estado incial del átomo y B el estado final luego de absorber un
fotón. Es fácil entonces calcular
E
⟨B; nkα − 1 Ĥint A; nkα = (4.225)
s
N
* +
e ℏ
akα exp (ik · rj ) pj · ϵ(α) A; nkα
X
− B; nkα − 1 c (4.226)
mc j=1 2ωV

No aparece en esta fórmula el término del desarrollo que contiene el operador de

creación â†kα ya que su acción implicarı́a crear un estado con nkα +1 fotones mientras
que el bra que aparecerı́a a la izquierda corresponde a nkα − 1 fotones. En contraste,
el ak,α que sı́ debe ser incluido, actúa sobre el bra como uno de creación por lo
que que el producto en el espacio de numero de fotones resulta ser 1 quedando por
calcular solamente el elemento de matriz atómico
s
D E e ℏnkα X D E
B; nkα − 1 Ĥint A; nkα =− B exp (ik · rj ) pj · ϵ(α) A
m 2ωV j

El factor que multiplica el elemento de matriz atómico corresponde a la contribución

de la radiación. El factor que aparecı́a multiplicando a la delta de Dirac en (22.36)
2π D E2
Wi→f = f Ĥint i δ (ϵf − ϵi )
ℏ
Coincide con el que habı́amos calculado de manera semiclásica en el que cuando
elevábamos al cuadrado el elemento de matriz era en el caso semiclásico
4π 2 c
I
ℏω 2
con
ω2 →− 2
I= A0
2πc
→
−
Basta identificar a la amplitud clásica de la onda A 0
s
→
− e ℏnkα
A0 → ϵ̌
m 2ωV
para que la fórmula que habı́amos obtenido (14.30)

4π 2 c 2
WfAi = 2
I vf† i δ (Ei + ℏω − Ef ) Absorción
ℏω
coincida con la actual, en que la intensidad de la radiación es ahora proporcional al
número nk de fotones.
Segunda cuantificación 163

El cálculo para el caso de emisión de fotones se trata de manera análoga. Podemos

representar el proceso para un átomo en el estado A de la siguiente manera

A + nkα −→ B + (nkα + 1)

En este caso, es el operador â†kα el que contribuye en la expansión pues actuando

sobre el ket |A; nkα ⟩ lo transformarı́a en |A; nkα + 1⟩. Se obtiene entonces
s
D E e ℏ (nkα + 1) X D E
B; nkα + 1 Ĥint A; nkα =− B exp (−ik · rj ) pj · ϵ(α) A
m 2ωV j

Notemos que en este caso, aún si nkα = 0 (es decir, cuando no hay fotones en el
estado inicial) el átomo puede puede emitir un fotón. Se trata en tal caso de una
emisión espontánea que es observable experimentalmente y que no puede obtenerse
cuande se trata a la radiación de manera clásica. Cuando nkα ̸= 0 habrá emisión
inducida por los fotones de la radiación incidente.
La contribución de emisión espontánea corresponde a un fenómeno puramente
cuántico que se obtiene limpiamente al tratar a la radiación de manera cuántica.
Finalmente, también existe la llamada emisión estimulada. Para comprenderla,
comencemos por recordar que cuando un electrón se encuentra en un estado excita-
do, tiende a decaer a un nivel más bajo emitiendo un fotón portador de una energı́a
que es la diferencia entre la de los dos niveles. Para lograr tener muchos electrones
en un dado nivel excitado de los átomos debe existir una fuente de energı́a exterior
de manera de que los estados excitados estén más poblados que los del más bajo.
Se habla de “bombeo de población” y de “inversión de población” que puede ser un
generador eléctrico o la accion de otro laser (bombeo óptico). En respuesta al cam-
po electromagnético externo que corresponde a la misma energı́a, la probabilidad
de transición al estado más bajo es grandemente aumentada, más allá de la emi-
sión espontánea. Esos átomos pueden desexcitarse emitiendo fotones de frecuencias
extremadamente próximas. en un proceso que se conoce como emisión estimulada.
Los cáculos relativos a la emisión y absorción de fotones en los átomos fueron
hechos en 1916 por Einstein 40 . Estos resultados, que 40 Einstein, A., 18 (1916) 318
“Strahlungs-emission und -absorption nach der Quantentheorie”. Verhandlungen der
Deutschen Physikalischen Gesellschaft. Einstein, A., Physikalische Zeitschrift. 18
(1917) 121. “Zur Quantentheorie der Strahlung”
Einstein obtuvo en su incansable búsqueda de contradicciones de la mecánica
cuántica tuvieron una confirmación trascendental a principios la década de 1950
cuando Charles Townes pudo generar experimentalmente luz amplificada por emisión
de radiacin estimulada con un aparato precursor de lo que hoy llamamos Laser.
No pudo hacer este experimento en los laboratoriosde llamados por entonces “Bell
Laboratories” donde trabajaba porque los directivos no vieron una posible utilidad
164 4.6 Emisión y absorción de fotones por un átomo

en su [Link]́ construir el aparato cuando pasó a trabajar en la academia

(la Universidad de Columbia en New York) y por ello compartió el premio Nobel con
los por entonces soviéticos Nikolay Basov and Alexander Prokhorov, que también
trabajaban en instituciones académicas.
Capı́tulo 5

Mecánica cuántica Relativista

5.1. La ecuación de Klein-Gordon

A partir de las reglas de cuantificación canónica se puede obtener la ecuación
cuántica (no relativista) que describe la dinámica de una partı́cula libre de masa
m. En efecto, de la relación de la mecánica clásica no relativista entre energı́a E y
momento p,
p2
+ V = E, (5.1)
2m
y de las reglas de cuantificación canónica1

p → (−iℏ)∇, (5.2)
∂
E → iℏ , (5.3)
∂t
se obtiene la ecuación de Schrödinger para la función de onda ψ(r, t) que contiene
toda la información posible sobre el estado de una partı́cula libre de masa m,
ℏ2 2 ∂
− ∇ ψ(r, t) = iℏ ψ(r, t). (5.4)
2m ∂t
Esta ecuación es obviamente no covariante relativista (i.e. frente a trasnformaciones
de Lorentz): el tiempo y las coordenadas espaciales no son tratados en un pie de
igualdad; incluye una derivada primera en el tiempo y derivadas segundas espaciales.
Conviene aquı́ precisar lo que entendemos por una ecuación covariante relativista.
Dada una función f (r, t) y un operador diferencial Dr,t diremos que la ecuación

Dr,t fs (r, t) = 0, (5.5)

1
Estas reglas pueden ser enunciada de varias maneras, la elegida es la más simple para los
presentes fines.

165
166 5.1 La ecuación de Klein-Gordon

es covariante relativista si, dada una solución fs (x, t) en cierto sistema de coorde-
nadas de espacio-tiempo, cuando por ejemplo hacemos una rotación espacial o un
boost (i.e., transformación del grupo deLorentz propio) para pasar a otro sistema
de coordenadas, la función transformada satisface la misma ecuación, expresada en
términos de las nuevas coordenadas r ′ , t′

Dr′ ,t′ fs (r ′ , t′ ) = 0. (5.6)

Si a una solución ψs (r, t) de la ecuación de Schrödinger (5.4) le asignamos el carácter

de escalar (complejo) frente a transformaciones de Lorentz, un cálculo sencillo con-
firma que ψs (r ′ , t′ ) no es solución de la correspondiente ecuación transformada.
El cuarto trabajo de la serie de artı́culos que Schrödinger publicó en 1926 [1] pre-
senta una versión covariante relativista de la ecuación que rige la dinámica cuántica
de una partı́cula masiva, ecuación que fue obtenida independientemente por Os-
kar Klein, Vladimir Fock y Walter Gordon en el mismo año, [2]-[4]. En su trabajo
Schrödinger consideró el caso de un electrón de masa m sometido a la acción de un
campo eléctrico coulombiano pero su idea puede presentarse de manera muy simple
para el caso de una partı́cula libre. La propuesta de Schrödinger es muy natural: para
llegar a una ecuación relativista que describa la dinámica cuántica de una partı́cula
libre, en lugar de partir de la fórmula de la mecánica clásica newtoniana (5.1), debe
hacérselo a partir de la relación de energı́a-impulso de la mecánica clásica relativista,

c2 p2 + m2 c4 = E 2 . (5.7)

La aplicación de las reglas de cuantificación canónica (5.2) y (5.3) lleva a una ecua-
ción cuántica relativista, la ecuación de Klein-Gordon [2]-[4] para una partı́cula libre
(i.e. sin potencial) de masa m,
ℏ2 ∂ 2 ψ(r, t)
ℏ2 ∇2 ψ(r, t) − m2 c2 ψ(r, t) = . (5.8)
c2 ∂t2
No es inesperado que, habiendo partido de la ecuación relativista (5.7), se llegue
a una ecuación en la que el orden de las derivadas espaciales y temporal sea el mismo.
Si introducimos el operador d’Alembertiano2 □
1 ∂2
□≡ − ∇2 (5.9)
c2 ∂t2
entonces la ecuación(5.8) se puede escribir de manera compacta como
m 2 c2
□ψ(r, t) + ψ(r, t) = 0. (5.10)
ℏ2
2
Este operador diferencial lleva el nombre de Jean Le Rond d’Alambert quien lo introdujo en
1747 en un trabajo sobre cuerdas vibrantes.
Mecánica cuántica Relativista 167

Es evidente ahora que si el carácter de ψ ante transformaciones de Lorentz es el de

un escalar, esta ecuación no solo es covariante sino también invariante relativista ya
que tanto la función ψ como el operador □ lo son.
Es fácil encontrar una solución de la ecuación de Klein Gordon para la partı́cula
libre. Basta hacer un “ansatz”3 como el que se hace en el caso no-relativista, de la
forma
ψ(r, t) = Aei(p·r−Ep t)/ℏ , (5.11)
y ajustar las constantes p y Ep (asociadas con el impulso y la energı́a de la partı́cula
respectivamente) de manera que se satisfaga (5.8). En efecto, si se inserta el ansatz
(5.11) en la ecuación (5.8), para que se satisfaga la ecuación debe satisfacerse la
condición: q
Ep = ±c p2 + m2 c2 , (5.12)
que coincide con la relación clásica relativista entre el impulso y la energı́a.
Recordemos que en la mecánica relativista clásica, al escribir (5.12) solo se retiene
el signo positivo. Si bien ambos signos son aceptables, de incluir a ambos se tendrı́a
un espectro de energı́a que no serı́a continuo: habrı́a un “salto” entre el valor mı́nimo
positivo E0+ = mc2 y el valor máximo negativo E0− = −mc2 . Como en mecánica
clásica no hay ninguna razón para aceptar discontinuidades en la energı́a, debe
elegirse un signo y resulta natural, por tratarse del caso de una partı́cula libre, el
seleccionar la rama positiva (Recordemos que en el caso no-relativista los niveles con
energa negativa corresponden a estados ligados y aquı́ se trata de partı́culas libres).
Con lo anterior, el desarrollo para valores pequeños (en comparación con mc )
del impulso conduce, si no se tiene en cuenta la energı́a en reposo, a la conocida
expresión clásica del Hamiltoniano no-relativista de una partı́cula de masa m,

p2
Ep ≃ . (5.13)
2m
En contraste con las argumentación de la fı́sica clásica y de la cuántica no relativista
para desechar el signo negativo de la energı́a de una partı́cula libre, notemos que
las discontinuidades en los valores posibles de la energı́a son precisamente una de
las caracterı́sticas fundamentales de la mecánica cuántica, por lo que en este caso
relativista no hay razón alguna para descartar una de las dos ramas, aún para el
caso de una partı́cula libre.
Pero se plantea en este caso un problema serio: de no descartarse la solución
con signo negativo la energı́a de la partı́cula libre no estarı́a acotada por abajo y se
podrı́a entonces extraer una cantidad arbitrariamente grande de energı́a tomando
simplemente una partı́cula en reposo con energı́a +mc2 y perturbándola de manera
3
Ansätze: del alemán, propuesta.
168 5.1 La ecuación de Klein-Gordon

de que saltara el “gap”4 de 2mc2 y cayera en un estado con más y más energı́a
negativa. Volveremos a este asunto más adelante.
Ahora bien, utilizando la ecuación relativista propuesta por Schrödinger (y que
hoy se conoce ecuación de Klein Gordon), se obtienen resultados razonables para
las series de Balmer y Lyman del átomo de hidrógeno pero los resultados eran
inaceptables para la constante de estructura fina α determinada ya en esa época
con bastante precisión por F. Paschen y E. Back en el estudio de la acción de
un campo magnético intenso sobre los niveles de energı́a del átomo de hidrógeno
(α = e2 / (4πϵ0 ℏc).
Es importante aquı́ recordar que Schrödinger no ignoraba la existencia del spin
del electrón, sugerido por G. Uhlenbeck y S. Goudsmit en 1925 para dar cuenta del
desdoblamiento de niveles atómicos en un campo magnético externo (efecto Zee-
man). Comprendı́a correctamente que las discrepancias que encontraba provenı́an
de que su ecuación no tenı́a en cuenta el spin del electrón. De tenerlo, la función
de onda asociada al electrón no debı́a tomarse como un escalar frente, en particu-
lar, a rotaciones, y la ecuación que rija su dinámica cuántica tendrı́a que incluir
interacciones que tengan en cuenta a este momento angular intrı́nseco.
Existı́a además un problema conceptual más básico que mostraba la invalidez de
la ecuación de Klein-Gordon para describir la dinámica del electrón en el contexto
de la fı́sica cuántica en la que |ψ|2 se interpreta como una densidad de probabilidad.
Fue este problema, que tiene que ver con la imposibilidad de definir una densidad de
probabilidad consistente a partir de la ecuación de Klein-Gordon, el que llevó a Paul
Dirac a cambiar radicalmente el frente de ataque y proponer la ecuación que lleva
su nombre y que sı́ daba cuenta de todos los resultados experimentales conocidos al
momento (1928) sobre el átomo de hidrógeno.
Para comprender la contradicción entre la ecuación de Klein-Gordon y una den-
sidad de probabilidad consistente, recordemos que en el caso no relativista descripto
por la ecuación (5.4), a partir de la función de onda ψ(r, t) se puede construir la
densidad de probabilidad ρ y la corriente de probabilidad J . La densidad ρ(r, t) re-
sulta ser una función real, semidefinida positiva y de carácter escalar que satisface,
junto a J (r, t), que tiene carácter vectorial, una ecuación de continuidad:

∂ρ
∇·J + = 0, (5.14)
∂t
donde

ρ = |ψ(r, t)|2 (5.15)

ℏ
J= [ψ ∗ (r, t)∇ψ(r, t) − ψ(r, t)∇ψ ∗ (r, t)] (5.16)
2mi
4
gap: del inglés, hueco, brecha.
Mecánica cuántica Relativista 169

Esta ecuación confirma la interpretación de |ψ(r, t)|2 dr como la probabilidad de

encontrar, en el instante t, a la partı́cula en el diferencial de volumen dr centrado
en el punto r. Como siempre, de tal ecuación de continuidad se prueba fácilmente
la conservación de una “carga”, en este caso probabilidad, siempre que el flujo de J
se anule adecuadamente en el infinito. Se obtiene
ˆ
d
ρ(r, t)dr = 0, (5.17)
dt
o, ˆ
dQ
= 0, Q≡ ρ(r, t)dr . (5.18)
dt
En el párrafo anterior el entrecomillado de la palabra “carga” se debe a lo siguiente.
La definición de Q dada por (5.18) corresponde a la probabilidad de encontrar al
sistema descripto por ψ en el volumen de integración. Pero vista a la luz del teorema
de Noether, Q puede interpretarse como la carga conservada asociada a la invarianza
de la ecuación de Schrödinger frente a un cambio de fase constante α de la forma

ψ(x, t) → exp(iα)ψ(x, t). (5.19)

Es decir, existe en la mecánica cuántica una invarianza global U(1) (el grupo unitario
U(N ) representado por matrices es el grupo de las matrices U unitarias de N ×N –i.e.
U † U = U U † = I. El caso N = 1 puede identificarse con el de los números complejos
de módulo 1. que es el caso de la transformación (5.19). Cuando se trata de una
partı́cula cargada eléctricamente en interacción con el campo electromagnético, esta
invarianza pasa a ser una invarianza local (es decir, α = α(r, t) ) donde un cambio
con fase α(x) en la función de onda va acompañado de un cambio de gauge en el
campo electromagnético.
Planteada la ecuación de conservación (5.18), la interpretación de ρ, definida
positiva, como densidad de probabilidad se vuelve natural. A ello se agrega que la
probabilidad de encontrar a la partı́cula en algún lugar de todo el espacio resulta
constante en el tiempo –conservada– (e igual a 1 con una adecuada normalización
de la función de onda).
Para obtener tal ecuación de continuidad se multiplica la ecuación de Schrödinger
por ψ ∗ (r, t) y se resta el resultado de multiplicar la ecuación conjugada por ψ(r, t). Si
procedemos de la misma manera con la ecuación de Klein-Gordon (5.8), obtenemos

∂ρR
∇ · JR + =0 (5.20)
∂t
donde JR (con R indicamos que se trata del caso relativista) tiene la misma forma
que en el caso no relativista mientras que la densidad de carga ρR cambia radical-
170 5.2 La ecuación de Dirac

mente:
∂ψ ∗ (r, t)
" #
iℏ ∗ ∂ψ(r, t)
ρR = ψ (r, t) − ψ(r, t) , (5.21)
2mc2 ∂t ∂t
ℏ
JR = [ψ ∗ (r, t)∇ψ(r, t) − ψ(r, t)∇ψ ∗ (r, t)] . (5.22)
2mi
Haber forzado la covarianza implica que ρR tenga una forma funcional análoga a las
componentes de JR con t jugando un rol idéntico al de las coordenadas.
Es evidente que ρR es una función escalar real pero, a diferencia de ρ = |ψ(r, t)|2 ,
puede ser negativa y por ello se pierde la posibilidad de asociarla con una densidad
de probabilidad. Esto es consecuencia de que siendo la ecuación de Klein-Gordon de
segundo orden en el tiempo, es en principio necesario dar dos condiciones iniciales
(para ψ(r, t)y para ∂ψ(r, t)/∂t) para determinarla y no queda excluı́da la posibilidad
de elegir la función y su derivada de manera que ρR < 0. De hecho, dada una
elección de ψ(r, t) y ∂ψ(r, t)/∂t en el instante inicial que haga a ρR positiva, la
elección igualmente aceptable de ψ(r, t) y −∂ψ(r, t)/∂t como condición inicial hará
que ρR < 0.
Otra manera de ver el problema señalado arriba es la siguiente: si se considera
un estado estacionario, puede reemplazarse en (5.21) iℏ ∂ψ(r, t)/∂t por Eψ(r, t),
obteniéndose
E
ρR = |ψ(r, t)|2 (5.23)
mc2
y las soluciones con energı́a negativa (rama negativa de la raı́z (5.12)) correspon-
derán, evidentemente a ρR < 0. De esta última fórmula vemos que, en el lı́mite no
relativista, cuando E → mc2 , ρR deviene la densidad de probabilidad no relativista
habitual,
ρR → |ψ(r, t)|2 = ρ. (5.24)

5.2. La ecuación de Dirac

P.A.M. Dirac (1902-1984) logró resolver en 1928 el problema de cómo compati-
bilizar la necesaria covarianza relativista de una ecuación de ondas, con la necesidad
de tener una densidad de probabilidad definida positiva asociada con la función de
onda cuántica que describe el estado de un electrón5 .
5
Según G. Gamow, Dirac entrevió la solución una noche del invierno de 1928 , mientras meditaba
sentado frente al fuego en el St. John College de Cambridge. Cuenta Dirac que en esa noche jugaba
con matrices de 2 × 2 con propiedades muy notables que habı́a inventado y que no son otra cosa
que las que llamamos matrices de Pauli. En ese relato comenta que él ignoraba que Pauli habia
encontrado esas matrices y que suponı́a que Pauli igualmente ignoraba que él también las habia
inventado.
Mecánica cuántica Relativista 171

Dirac hizo hincapié que el hecho de que la densidad de probabilidad no tuviera

signo definido provenı́a de que la derivada temporal en la ecuación de Klein-Gordon
era de segundo orden (y no de primero como en la ecuación no relativista). Cambió
entonces radicalmente el punto de partida de Schrödinger para la obtención de una
ecuación de ondas relativista que describiera correctamente la dinámica cuántica de
partı́culas de spin 1/2 como el electrón. Publicó un trabajo con su propuesta [6] y
desde entonces la ecuación básica de la mecánica cuántica relativista para el electrón
ha tomado su nombre.
Quedó claro en el análisis previo que la ecuación de Klein-Gordon conduce a una
densidad de probabilidad negativa por tratarse de una ecuación de segundo orden en
el tiempo. Esto último, a su turno, es obligado por requerimientos de la covarianza
relativista: las derivadas espaciales que resultan de la cuantificación canónica de la
energı́a cinética
son de segundo orden.
Dando un corte drástico a la contradicción, Dirac propuso una ecuación de primer
orden tanto en las variables espaciales como en las temporales. En cierto modo, en
lugar de aplicar las reglas de cuantificación canónica a la relación entre el cuadrado
de la energı́a y el impulso,

E 2 = p 2 c2 + m 2 c4 (5.25)
Dirac lo hizo con la idea de que relativı́sticamente la energı́a se elaciona con la
masa y el impulso a través de una raı́z cuadrada,
q
E = ± p2 c2 + m2 c4 (5.26)
Pero como no era razonable abandonar la linealidad de la ecuación de ondas
escribiendo para la ecuación de ondas una en que ψ apareciera dentro de raı́ces cua-
dradas, lo que vioları́a el principio de superposición), Dirac no planteó una ecuación
con raı́ces cuadradas sino que propuso una que, “elevada al cuadrado”, reproduje-
ra (5.25) de manera que en el lı́mite c → ∞ se recupera el resultado no relativista
E = p2 /(2m) (El sentido de de escribir “elevar al cuadrado” una ecuación diferencial
quedará aclarado más adelante).
En este punto recordemos que cuando en la mecánica cuántica no relativista
se pretende describir al electrón incluido su spin, debe considerarse una función de
onda que no es un escalar sino que tiene 2 componentes (más precisamente se trata
de un espinor de dos componentes χ que suele llamarse espinor de Pauli),
!
χ1 (r, t)
χ(r, t) = . (5.27)
χ2 (r, t)

Por ejemplo, consideremos el caso de un electrón en presencia de un campo

172 5.2 La ecuación de Dirac

eléctrico
r dϕ
E = −e (5.28)
r dr
con ϕ el potencial escalar. Vimos en el primer curso de mecánica cuántica que el
hamiltoniano del electrón, tratado como un espinor de 2 componentes toma en este
caso la forma
!
p2 /2m + eϕ(r) 0
H= 2 + w(r)σ · L (5.29)
0 p /2m + eϕ(r)
con
e2 ℏ dϕ
w(r) = − (5.30)
4m2 c2 rdr
donde σ = (σ 1 , σ 2 , σ 3 ) son las matrices de Pauli, de 2 × 2.
! ! !
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (5.31)
1 0 i 0 0 −1
Para mayor generalidad que la de los espinores de Pauli, Dirac consideró a la
función de onda como un objeto no de 2 sino de N componentes, esperando que
ciertas propiedades básicas a exigir a la teorı́a fijaran N y el carácter espinorial de
ψ. Escribió entonces
 1 
ψ (r, t)
 2
 ψ (r, t) 

·
 
= (ψ α ) ,
 
ψ(r, t) =   α = 1, 2, . . . , N (5.32)

 · 

·
 
 
ψ N (r, t)
La ecuación diferencial lineal de primer orden con coeficientes constantes6 más
general que puede escribirse para el caso de un electrón libre en un espacio-tiempo
de 3 + 1 dimensiones es entonces:
1 ∂ψ ∂ψ ∂ψ ∂ψ imc
+ α1 1 + α2 2 + α3 3 + βψ = 0. (5.33)
c ∂t ∂x ∂x ∂x ℏ
Las constantes c (velocidad de la luz), m (masa de la partı́cula) y ℏ (constante de
Planck) aparecen por conveniencia posterior. La arbitrariedad de los coeficientes
i
está dada por constantes αρσ y βρσ que, dado que ψ es un vector columna de N
elementos, pueden considerarse 4 matrices de N × N a determinar por razones
fı́sicas. La ecuación (5.33) puede reescribirse de manera más compacta en la forma
1 ∂ψ imc
+ α · ∇ψ + βψ = 0 (5.34)
c ∂t ℏ
6
Es la homogeneidad del espacio-tiempo la que implica que sean constantes.
Mecánica cuántica Relativista 173

Nótese que las componentes αi de α = (α1 , α2 , α3 ) son cada una una matriz de
N × N . En este caso poner los ı́ndices arriba o abajo es solamente una cuestión de
estética pues se trata de ı́ndices “espinoriales”.
En camino de obtener una ecuación de continuidad, analicemos el resultado de
conjugar la ecuación (5.34) (Utilizaremos la notación f ∗ para indicar el conjugado
de una función f ). Para el caso de espinores, introducmos la notación

ψ † ≡ ψ ∗T = ψ 1∗ , ψ 2∗ , . . . , ψ N ∗ , (5.35)

que implica conjugar y trasponer al espinor definido en la ec. (5.32). La ecuación

que resulta de conjugar y trasponer (5.34) puede entonces ser escrita ası́:

1 ∂ψ † imc † †
+ ∇ψ † · α† − ψ β = 0. (5.36)
c ∂t ℏ
†
Aquı́ αi es la traspuesta conjugada de la matriz αi .
Multiplicando (5.34) a izquierda por ψ † , (5.36) a derecha por ψ y luego sumando
ambos resultados se obtiene
1 ∂|ψ|2 † imc †
+ ψ α · ∇ψ + ∇ψ † · α† ψ + ψ β − β † ψ = 0, (5.37)
c ∂t ℏ
donde hemos introducido a la función real |ψ|2 , semidefinida positiva, de la manera
siguiente:
|ψ|2 = ψ † (r, t)ψ(r, t). (5.38)
Basta pedir que las matrices αi y β sean hermı́ticas para que la ecuación (5.37) se
simplifique considerablemente y tenga las caracterı́sticas de una tı́pica ecuación de
continuidad. En efecto, si
αi = αi† , β = β † , (5.39)
la ecuación (5.37) toma la forma simple
1 ∂|ψ|2
+ ∇ ψ † αψ = 0. (5.40)
c ∂t
Entonces, si se define
ρ(r, t) = |ψ(r, t)|2 , (5.41)
y
J (r, t) = ψ † (r, t)cαψ(r, t), (5.42)
y se puede escribir a (5.40) como una ecuación de continuidad e interpretar a ρ como
una densidad de probabilidad semidefinida positiva,
∂ρ
+ ∇ · J = 0. (5.43)
∂t
174 5.2 La ecuación de Dirac

¡El problema de la ecuación de Klein-Gordon no existe entonces para la ecua-

ción de Dirac! Nótese que la definición de ρ es análoga a la que resulta en el caso
no-relativista para espinores de dos componentes. En contraste, la de J es comple-
tamente nueva (volveremos a ella más adelante cuando estemos en condiciones de
ligarla con la “velocidad” de la partı́cula cuya función de onda es el espinor ψ).
Hay una manera sugestiva de reescribir la ecuación de Dirac (5.34)

∂ψ h i
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ, (5.44)
∂t
que nos permite identificar al operador p con −iℏ∇, la misma expresión que la de
la cuantificación canónica no relativista. En cuanto al operador H,

H = cα · (−iℏ)∇ + βmc2 , (5.45)

podemos identificarlo como el generador de traslaciones temporales infinitesima-

les, es decir con el Hamiltoniano del sistema que pretendemos describir (el de una
partı́cula libre de masa m). Es importante notar que la hermiticidad de las 4 matrices
α y β garantiza que H = H † .
Para verificar que la ecuación de Dirac es consistente con la relación entre energı́a
e impulso que debe satisfacer un sistema relativista, apliquemos el operador
1∂ imc
−α·∇− β (5.46)
c ∂t ℏ
a la ecuación (5.34). Nótese el cambio de signo en los dos últimos términos respecto
del operador que aparece en (5.36). La idea está inspirada en la acción de multiplicar
por (a−b) a la cantidad (a+b) para obtener una diferencia de cuadrados. Obtenemos
! !
1∂ imc 1 ∂ψ imc
−α·∇− β + α · ∇ψ + βψ = (5.47)
c ∂t ℏ c ∂t ℏ
1 ∂ 2ψ k l ∂2 m2 c2 2 imc k k ∂ψ

− α α ψ+ β ψ − α β + βα = 0. (5.48)
c2 ∂t2 ∂xk ∂xl ℏ2 ℏ ∂xk
Dada la simetrı́a de las derivadas del segundo término de la segunda lı́nea se puede
escribir
∂2 1 k l ∂2
αk αl k l = α α + αl αk . (5.49)
∂x ∂x 2 ∂xk ∂xl
Basta entonces pedir que
1 k l
α α + αl αk = δ kl , (5.50)
2
para que el término de derivadas espaciales de la segunda lı́nea de (5.47) corres-
ponda al Laplaciano que aparece en la ecuación de Klein-Gordon como parte del
Mecánica cuántica Relativista 175

d’alambertiano. Si adoptamos esta condición y además imponemos

αk β + βαk = 0, (5.51)
β 2 = I, (5.52)

la segunda lı́nea de (5.47) deviene la ecuación de Klein-Gordon (5.8) y por ello se

verifica que toda solución de la ecuación de Dirac satisface también la ecuación de
Klein-Gordon,

ℏ2 ∂ 2 ψ(r, t)
2 2
− ℏ2 ∇2 ψ(r, t) + m2 c2 ψ(r, t) = 0 (5.53)
c ∂t
y por lo tanto es consistente con la relación energı́a impulso relativista que vimos
era verificada por esta última.
La derivación anterior aclara el sentido que tenı́a la frase que se referı́a a “elevar
al cuadrado” una ecuación.
Las condiciones que ya hemos impuesto a las matrices α y β implican varias
propiedades. En particular, si reescribimos la ecuación (5.51) en la forma

βαk = −αk β, (5.54)

calculamos el determinante,

det βαk = det −αk β = (−1)N det αk β , (5.55)

y usamos la propiedad cı́clica det AB = det BA llegamos a que

(−1)N = 1 ⇒ N ≡ par. (5.56)

Si se multiplica a derecha (5.54) por β y luego se usa (5.52), se obtiene

βαk β = −αk , (5.57)

Si ahora calculamos la traza de ambos miembros,

tr βαk β = − tr αk (5.58)
k 2 k k k
tr βα β = tr β α = tr α = − tr α . (5.59)

La propiedad cı́clica de la traza implica que el lado izquierdo de la igualdad de (5,57)

es +αk mientras quee el lado derecho tiene el signo opuesto por lo que o

tr αk = 0. (5.60)

Analogamente se obtiene que

tr β = 0. (5.61)
176 5.2 La ecuación de Dirac

Podemos ahora escribir la ecuación de Dirac (5.34) de una manera explı́citamente

covariante. Para ello introduzcamos la notación

γ 0 = β, (5.62)
γ i = βαi , (5.63)

que en forma compacta escribimos

γ µ = β, γ i . (5.64)

Puede verse fácilmente que

γ µ γ ν + γ ν γ µ = 2g µν IN , (5.65)

con la métrica g µν definida a partir de la identidad g µν gνρ = δρµ con gνρ dada matri-
cialmente por la ec. (5.72).
Si multiplicamos la ecuación de Dirac (5.34) por iℏβ y usamos la nueva notación
tendremos
∂ψ(r, t)
iℏγ µ − mcψ(r, t) = 0. (5.66)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente covariante, la
ecuación matricial que describe la dinámica relativista de una partı́cula libre de
masa m. Se puoede lograr una forma más compacta utilizando la notación (), lo
cual arroja
iℏγ µ ∂µ ψ − mcψ = 0. (5.67)

Finalmente, introducimos la notacion de Feynmann, en la que se define

∂/ = γ µ ∂µ , / = γ µ Aµ
A (5.68)

y la ecuación de Dirac resulta

(iℏ∂/ − mc)ψ = 0. (5.69)

Resta confirmar la covarianza y determinar explı́citamente las cuatro matrices γ µ

(llamadas matrices de Dirac). En particular, su orden (por ahora N ×N es arbitrario)
o, lo que es lo mismo, cuál es el número N de componentes de ψ(r, t). Luego,
deberemos analizar las propiedades de ψ(r, t) ante transformaciones de Lorentz,
determinar el spin de la partı́cula que describe y buscar las soluciones.
18

o
γ µ = (β, γ i ) (1.74)
Puede verse fácilmente que
µ ν ν µ µν
γ γ cuántica
Mecánica + γ γ = Relativista
2g IN ×N (1.75) 177
µν µν
con la métrica g definida a partir de la identidad g gνα = δαµ
con gνα
dada por la fórmula (1.29).
Si multiplicamos la ecuación de Dirac (1.45) por ih̄β y usamos la
nueva notación tendremos
∂ψ(&x, t)
ih̄γ µ − mcψ(&x, t) = 0 (1.76)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente co-
variante, la ecuación matricial que describe la dinámica relativista de
una partı́cula libre de masa m.
Resta confirmar la covarianza y determinar explı́citamente las cu-
atro matrices γ µ (llamadas matrices de Dirac). En particular, su or-
den (por ahora N × N es arbitrario) o, lo que es lo mismo, cuál es el
número N de componentes de ψ(&x, t). Luego, deberemos analizar las
propiedades de ψ(&x, t) ante transformaciones de Lorentz, determinar el
spin de la partı́cula que describe y buscar las soluciones.

Fotografı́a de la placa de pizarra verde colocada en la abadı́a de Westminster, a

pocos metros de la la tumba de Isaac Newton, en la que fue grabada la ecuación de
la mecánica cuántica relativista de una partı́cula libre de masa m para el caso en
que las unidades son aquellas en las que resulta c=1.

Figura 5.1: Fotografı́a de la placa de pizarra verde colocada en la abadı́a de West-

minster, a pocos metros de la la tumba de Isaac Newton, en la que fue grabada la
ecuación de la mecánica cuántica relativista de una partı́cula libre de masa m para
el caso en que las unidades son aquellas en las que resulta c = 1.
178 5.3 Transformaciones de Lorentz

5.3. Transformaciones de Lorentz

Antes de embarcarnos en la descripción de la ecuación de onda relativista es
conveniente mencionar brevemente las transformaciones de Lorentz (TL) que se usan
en la cinemática clásica relativista [2], para luego discutir sus análogos cuánticos
y finalmente encontrar la generalización relativista para los grados de de libertad
intrı́nsecos.
Consideremos dos eventos en el espacio-tiempo, (x, y, z, t) y (x + dx, y + dy, z +
dz, t+dt). Podemos generalizar el concepto de distancia entre dos puntos en el espacio
introduciendo el “intervalo” ds entre dos puntos en el espacio-tiempo. Para que sea
el mismo para todos los observadores (inerciales), ds tendrá que ser invariante con
respecto a las rotaciones y a las TL y por lo tanto debe estar dado por:

ds2 = c2 dt2 − dx2 + dy 2 + dz 2 (5.70)

El grupo de todas las transformaciones que dejan invariante ds2 se denomina el grupo
homogéneo de Lorentz7 . Restringiremos nuestra discusión a este tipo de transforma-
ciones y en lo que sigue omitiremos la palabra homogéneo al referirnos al grupo de
Lorentz (GL).
En un espacio 3-dimensional (x, y, z) son componentes de un 3-vector, y dr2 =
dx + dy 2 + dz 2 se puede escribir en la forma
2

dr2 = (dxi )2 , x1 = x, x2 = y, x3 = z
X
(5.71)
i=1,2,3

que resulta ser una forma bilineal definida positiva por ser suma de cuadrados,
e invariante respecto de las rotaciones en el espacio usual. Para generalizar a 4
dimensiones esta manera de escribir el intervalo ds2 tenemos el problema de que ya
no resulta positivo definido, y necesitamos introducir algún objeto que contenga la
información del signo de cada coordenada. La forma usual de hacerlo es introducir
la “métrica” del espacio, gµν , como los elementos de la matriz diagonal

1 0 0 0
 
0 −1 0 0
g= 
(5.72)
0 0 −1 0 
 

0 0 0 −1

donde las filas y las columnas corresponden a las componentes 0 ,1, 2 y 3. De esta
forma el intervalo puede escribirse

ds2 = dxµ gµν dxν

X
(5.73)
µ=0,1,2,3

7
El grupo homogéneo excluye las traslaciones
Mecánica cuántica Relativista 179

donde agregamos además la coordenada x0 = ct e introducimos el tetravector (lla-

mado contravariante, con el ı́ndice en la posición suprior)8

xµ = (x0 , x1 , x2 , x3 ) = (ct, x, y, z). (5.74)

Es conveniente, para no escribir sistemáticamente la métrica en todos lados, definir

un tetravector covariante, con el ı́ndice en posición inferior, en la forma

gµν xν = gµ0 x0 + gµ1 x1 + gµ2 x2 + gµ3 x3 .

X
xµ = (5.75)
ν

Mirando (5.75), vemos que x0 = x0 , x1 = −x1 , etc, de manera que el intervalo se

escribe
ds2 = dxµ dxµ
X
(5.76)
µ

Finalmente, para simplificar la notación, adoptaremos la convención de suma de

Einstein: un ı́ndice que aparece una vez en la posición superior y una vez en la
posición inferior se suma automaticamente de 0 a 3 :
3
V µ Vµ → V µ Vµ
X
(5.77)
µ=0

ası́, el intervalo se escribe

ds2 = dxµ dxµ . (5.78)
Ası́ escrito, posee la forma de producto interno entre un vector contravariante con
otro covariante la cual arroja como resultado un escalar (o invariante).
Dado que el determinante de gµν es no nulo, existe su inversa, que es g −1 = g. A
los elementos de matriz de g −1 los llamamos g µν Al ser inversas, satisfacen

gµρ g ρν = δµν . (5.79)

Volviendo a las transformaciones homogéneas de Lorentz, ahora que hemos in-

troducido los tetravectores, podemos escribirlas en la forma

x′µ = Λµν xν , Λµν ∈ R. (5.80)

que inducen una transformación análoga en los dxµ (atención que el orden en que
aparecen los ı́ndices µ y ν es importante). Dado que tienen que mantener invariante
el intervalo ds2 , se debe satisfacer que

gµν Λµρ Λν σ = gρσ . (5.81)

8
Lo pronunciamos tetravector o cuadrivector según la literatura.
180 5.3 Transformaciones de Lorentz

Observemos que si pensamos a Λµν como los elementos de una matriz Λ, entonces
podemos escribir (5.81) como un producto matricial9 ,
ΛT gΛ = g. (5.82)
Esto significa que el grupo de transformaciones que dejan invariante al intervalo
ds2 , lo que se conoce como grupo de Lorentz, es lo que se denomina grupo pseudo-
ortogonal O(1,3), usualmente denotado L para los fı́sicos.
Para hallar la regla de transformación del tetravector covariante, primero subimos
su ı́ndice, luego lo transformamos de acuerdo a la regla que para tetravectroes con-
travariantes (5.80), y luego bajamos su ı́ndice:
x′µ = gµν x′ν = gµν Λν ρ g ρσ xσ , (5.83)
Para simplificar esta expresión, multiplicamos (5.81) por g σλ , y usamos (5.79):

gµν Λν σ g σλ Λµρ = δρλ (5.84)
y entonces observamos que
gµν Λν σ g σλ = (Λ−1 )λµ (5.85)
es decir, las componentes µ, ν de la transformación de Lorentz inversa. Solo por
cuestiones de notación, definimos
Λν µ = (Λ−1 )µν (5.86)
Y entonces resulta10

x′µ = Λµσ xσ . (5.89)

Más generalmente, un tetravector contravariante V µ es un objeto que frente a
una transformación de coordenadas (5.80) se tranasforma de la misma manera:
V µ = Λµν V ν . (5.90)
9
Observemos que
(ΛT )µν = Λν µ .

10
Notemos la siguiente sutileza: La suma implı́cita en el lado derecho de
x′µ = Λµν xν = (Λ−1 )ν µ xν (5.87)
corre sobre un ı́ndice de fila de la matriz Λ−1 . Luego, en términos de matrices, esta transformación
debe pensarse como la inversa transpuesta de Λ actuando sobre el vector columna xµ . Es decir, en
notación matricial,
x′ = (Λ−1 )T x. (5.88)
Mecánica cuántica Relativista 181

y lo mismo para un tetravector covariante.

En especial, definimos los operadores diferenciales
! !
∂ 1∂ ∂ ∂ ∂ 1∂
∂µ = = (∂0 , ∂1 , ∂2 , ∂3 ) = , , , = ,∇ (5.91)
∂xµ c ∂t ∂x ∂y ∂z c ∂t

y su version contravariante
!
µ µν 1∂
∂ = g ∂ν = , −∇ (5.92)
c ∂t

que dan origen al operador d’Alambertiano:

!
µ 1 ∂2 ∂2 ∂2 ∂2 1 ∂2
□ = ∂ ∂µ = 2 2 − + + = − ∇2 . (5.93)
c ∂t ∂x2 ∂y 2 ∂z 2 c2 ∂t2

que resulta invariante de Lorentz.

Observemos que ∂µ efectivamente se transforma como un tetravector covariante,
dado que por la regla de la cadena

∂ ∂ ∂xν
∂µ′ = = (5.94)
∂x′µ ∂xν ∂x′µ
y de (5.80),
xµ = (Λ−1 )µν x′ν = Λν µ x′ν . (5.95)
y entonces
∂µ′ = Λµν ∂ν . (5.96)
El tetravector energı́a-impulso de una partı́cula es:

E E

µ
p = ,p , pµ = , −p (5.97)
c c
dando lugar al invariante

E2
p2 = p µ pµ = − p · p = m2 c2 (5.98)
c2
o, cuando c = 1
p2 = E 2 − p 2 = m 2 . (5.99)
Usaremos la notación p · x para el producto escalar de los tetravectores pµ y xν :

p · x = pµ xν = Et − p · r (5.100)
182 5.3 Transformaciones de Lorentz

También haremos uso de los 4-tensores antisimétricos que son de la forma:

0 V1 V2 V3
 
−V 1 0 −A 3
A2 
T µν =  ≡ {V , A};

Tµν = {−V , A} (5.101)
−V 2 A3 0 −A1 


−V 3 −A2 A1 0

Las componentes espaciales T 32 , T 13 , T 21 constituyen, con respecto a las trans-

formaciones espaciales, un un vector axial, A, en tres dimensiones. En cambio, las
componentes T 01 , T 02 y T 03 forman con relación a las mismas transformaciones, un
vector tridimensional polar V [3]. Como ejemplos podemos citar al tensor para el
campo electomagnético:

F µν = ∂ µ Aν − ∂ ν Aµ = {−E, B} (5.102)

donde Aµ ≡ (ϕ, A) es el campo electomagnético y

Lµν = xµ pν − xν pµ = {K, −L} (5.103)

donde
L=r×p (5.104)
es el impulso angular orbital y

K = ctp − Er/c = x0 p − p0 r (5.105)

El producto escalar de dos 4-tensores antisimétricos, T µν y T ′µν

T · T ′ ≡ Tµν T ′µν = 2 (A · A′ − V · V ′ ) (5.106)

es invariante con respecto a las TL. Por ejemplo, para el campo electromagnético:

F · F = 2 B 2 − E 2 = inv. (5.107)

Ejemplos de Transformaciones de Lorentz

Entre las distintas transformaciones del grupo de Lorentz, encontramos las in-
versiones espaciales, o transformaciones de paridad (r → −r, t → t),

1 0 0 0
 
0 −1 0 0
ΛP =  , (5.108)
 
0 0 −1 0 
0 0 0 −1
Mecánica cuántica Relativista 183

inversiones temporales (r → r, t → −t),

−1 0 0 0
 
 0 1 0 0
ΛT =  ,

(5.109)
 0 0 1 0


0 0 0 1
rotaciones, por ejemplo de un ángulo θ alrededor del eje z:
1 0 0 0
 
0 cos θ − sin θ 0
ΛR (θ) =  , (5.110)
 
0 sin θ cos θ 0
0 0 0 1
y tranformaciones propias de Lorentz o “boosts” temporales, que afectan a una de
las coordenadas y al tiempo, por ejemplo para el caso en que la velocidad relativa
entre los dos sistemas es v en la dirección del eje x, se escriben
cosh ω sinh ω 0 0
 
 sinh ω cosh ω 0 0
ΛB (ω) =  (5.111)

 0 0 1 0
 

0 0 0 1
−1/2 −1/2
donde tanh ω = v/c y por lo tanto cosh ω = (1 − v 2 /c2 ) y sinh ω = v/c (1 − v 2 /c2 ) .
Los boosts y las rotaciones pueden formarse mediante transformaciones infinitesi-
males consecutivas a partir de la identidad ΛI (están “continuamente conectadas” a
ΛI ), mientras que ΛT y ΛP no pueden (están “desconectadas” de ΛI , o se dice que
son transformaciones “discretas”). Cualquier producto de boosts, rotaciónes, ΛT y
ΛP pertenece al grupo de Lorentz, y resulta que saturan el grupo de Lorentz.
Adoptaremos la convención seguida hasta ahora, que corresponde a las rotaciones
activas. Esto significa que la rotación afecta al sistema fı́sico, mientras que los ejes
de coordenadas quedan fijos. Lo mismo hacemos con los boosts de Lorentz, y para
una TL en la dirección x con velocidad relativa v.
Consideremos un sistema invariante relativista que obedece la ecuación covarian-
te de Klein-Gordon. Si pretendemos que el módulo cuadrado de la función de onda,
ligado a una cantidad medible, no cambie frente a este grupo de transformaciones,
la función de onda deberá permanecer invariante a menos de una posible fase:
Λ
ψ(r, t) → ψ ′ (r ′ , t′ ) = exp(iα)ψ(r, t) (5.112)
Supongamos que α representa una inversión espacial. Entonces, si se consideran dos
inversiones espaciales, se tendrá que exp(2iα) = 1 y por lo tanto α = 0, π. Luego,
ante una inversión espacial
ψ ′ (−r, t) = ±ψ(r, t) (5.113)
184 5.4 La ecuación de continuidad

Es decir que ψ(r, t ) puede ser un escalar (signo +) o pseudoescalar (signo −).
En cuanto a rotaciones, que son continuas, debemos incluir, por continuidad, a la
identidad. Al hacer una rotación de 2π si α no se mantuviera constante tendrı́amos
una inconsistencia (lo mismo sucede para boosts, que pueden considerarse como
rotaciones hiperbólicas).
Luego ψ(r, t) es un escalar o pseudoescalar frente a reflexiones espaciales y un
escalar frente a transformaciones propias de Lorentz y rotaciones. Tal función de
onda sólo puede describir partı́culas que no tengan otros grados de libertad que
los asociados con el espacio-tiempo. Es decir, la ecuación de Klein-Gordon describe
partı́culas de spin 0. Fueron Pauli y Weisskopf [5] quienes justamente propusieron
utilizar la ecuación de Klein-Gordon para describir la dinámica cuántica de bosones.

5.4. La ecuación de continuidad

La ecuación de Dirac para una partı́cula relativista de masa m se escribe de
manera explı́citamente covariante [ec. (5.34)] como

iℏγ µ ∂µ ψ − mcψ = 0 (5.114)

donde las matrices γ µ son cuatro matrices de N × N que, de acuerdo a su definición

en términos de las matrices α y β [ecs.(5.123) y (5.63)] y de las propiedades de estas
últimas que fue necesario imponer satisfacen

γ µ γ ν + γ ν γ µ = 2g µν IN , (5.115)
tr γ µ = 0. (5.116)

En términos de estas matrices (llamadas matrices de Dirac), la ecuación de con-

tinuidad (5.43) que obtuvimos a partir de la ecuación (5.114) puede escribirse de
manera explı́citamente covariante frente a transformaciones de Lorentz. En efecto,
definiendo

J 0 (r, t) = cρ(r, t) = cψ(r, t)† ψ(r, t) = cψ(r, t)† γ 0 γ 0 ψ(r, t), (5.117)
J = cψ(r, t)† αψ(r, t) = cψ(r, t)† γ 0 γψ(r, t), (5.118)

podemos escribir
J µ = cψ(r, t)† γ 0 γ µ ψ(r, t), (5.119)
donde hemos usado la ecuación (5.115) para escribir las igualdades (5.118).
Si en este punto se introduce la importante definición

ψ̄(r, t) ≡ ψ(r, t)† γ 0 , (5.120)

Mecánica cuántica Relativista 185

la corriente puede ser escrita de manera compacta como

J µ = cψ̄(r, t)γ µ ψ(r, t), (5.121)

y la ecuación de continuidad deviene

∂J µ
= ∂µ J µ = 0. (5.122)
∂xµ

Veremos que ψ̄(r, t) jugará un papel más importante que ψ(r, t)† en el análisis
de la mecánica cuántica relativista. Más aun, en el marco de la cuantificación de las
teorı́as de campos vı́a el método de la integral funcional11 reaparecerá en un pie de
igualdad con ψ como una función independiente de ψ.
Conviene por lo anterior determinar qué ecuación satisface ψ̄(r, t). Para ello
conjugamos y trasponemos la ecuación (5.114). Luego la multiplicamos por γ 0 a
derecha y usamos que12
γ 0 γ µ† γ 0 = γ µ , (5.127)
para obtener
iℏ ∂µ ψ̄γ µ + mcψ̄ = 0. (5.128)
Recordemos que la ecuación de Dirac para ψ, ec. (5.114) tiene la forma

iℏγ µ ∂µ ψ − mcψ = 0 (5.129)

Notemos que estas ecuaciones difieren solo en el signo relativo. De hecho, toman-
do a ψ y ψ̄ como variables independientes, las ecuaciones pueden ser obtenidas a
partir de la acción ˆ
S= d4 x L (5.130)

11
El método de la integración funcional, desarrollado por R. Feynmann a partir de una idea de
Dirac provee una manera alternativa a la cuantificación de las teorı́as de campos.
12
A partir de las definiciones

γ 0 = β, (5.123)
i i
γ = βα , (5.124)

con β = β † y αi = αi† , y β 2 = 1, obtenemos

γ i† = αi β (5.125)

y entonces
γ 0 γ i† γ 0 = βαi β 2 = γ i . (5.126)
γ 0 es hermı́tica, entonces γ 0† = γ 0 = γ 0 γ 0 γ 0 .
186 5.5 Los valores posibles de N

con el Lagrangiano de Dirac dado por

L = ψ̄ (iℏγ µ ∂µ − mc) ψ (5.131)

Nótese que el diferencial en la integral que define a la acción (5.130)) implica la

integración sobre el tiempo. Recordando la definición del Lagrangiano en la formu-
lación de la mecánica clásica deberı́amos llamar a LDirac densidad Lagrangiana.
La ecuación para ψ resulta de las ecuaciones de Euler-Lagrange que resultan de
variar respecto a ψ̄
 
∂L ∂L
∂µ   = , (5.132)
∂ ∂µ ψ̄ ∂ ψ̄
∂L
0= = (iℏγ µ ∂µ − mc)ψ, (5.133)
∂ ψ̄

(la derivada respecto de ∂µ ψ̄ del lado izquierdo de esta ecuación se anula porque en
el Lagrangiano no aparecen derivadas de ψ̄). Para obtener la ecuación que obedece ψ̄
conviene integrar por partes la acción (5.130)) y luego se procede de manera análoga
al caso de ψ. Finalmente, hay otra manera de escribir el Lagrangiano de Dirac, por
ejemplo, poniendo un factor 1/2 a la suma de dos términos, uno en el que es ψ quien
aparece derivada, el otro en el que es ψ̄ quien aparece derivada.

5.5. Los valores posibles de N

Dirac introdujo cuatro matrices de N ×N, γ µ , independiente. Estudiando más en
detalle sus propiedades es posible determinar los valores de N y la forma explı́cita
de cada una de las cuatro matrices. También se puede formar 6 productos tomando
de a 2 matrices diferentes

γ 0γ 1 γ 0γ 2 γ 0γ 3 iγ 1 γ 2 iγ 1 γ 3 iγ 2 γ 3 (5.134)

En cuanto a los 4 productos posibles de tres, se tiene

iγ 0 γ 1 γ 2 iγ 0 γ 1 γ 3 iγ 0 γ 2 γ 3 γ 1γ 2γ 3 (5.135)

Finalmente, existe un único producto de a cuatro que juega un rol muy importantes
en la mecánica cuántica relativista por lo que se le asigna un sı́mbolo especı́fico, γ5

iγ 0 γ 1 γ 2 γ 3 ≡ γ5 (5.136)

asociado a una simetrı́a muy importante que discutiremos más en detalle luego y
que se denomina “quiralidad” (del griego χϵιρ, (kheir), mano).
Mecánica cuántica Relativista 187

No hay más productos distintos a los ya listados: si se tratara de armar un

producto de 5 matrices habrı́a que repetir alguna en ese producto. usando la anti-
conmutación de de las matrices de Dirac distintas entre sı́ se puede ubicar de manera
contiguas a las dos que son iguales usando esta propiedad. Y siendo que el producto
de dos iguales es proporcional a la identidad el producto de 5 se reduce a uno de 3
ya incluı́do en la lista de las ecs. (5.134)-(5.136).
Las 11 matrices (5.134)-(5.136) junto con las 4 matrices γ µ y la identidad I
forman un conjunto de 16 matrices que llamaremos Γl , con l = 1, 2, . . . , 16. A las 4
primeras las escribiremos temporariamente como
Γ1 = γ 0 , Γ2 = iγ 1 , Γ3 = iγ 2 , Γ4 = iγ 3 (5.137)
de manera que su cuadrada sea igual a la identidad. Las 12 siguientes son las que
hemos listado en las ecuaciones (5.134)-(5.136) y también cumplen con esta propie-
dad.
Se puede verificar fácilmente que las matrices Γl ası́ definidas satisfacen las si-
guientes propiedades
1. Γl Γn = aln Γm , aln = ±1, ±i
2. Γl Γn = I ⇐⇒ l = n
3. Γl Γn = ±Γn Γl
4. Si Γn ̸= I siempre existe Γl tal que Γl Γn Γl = −Γn
5. tr Γl = 0, Γl ̸= I
P16
6. k=1 bk Γk = 0 ⇐⇒ bk = 0∀k
Como ejemplo, probaremos las dos últimas propiedades, comenzamos por la 5.
Por la propiedad 4, si Γn ̸= I, siempre existe Γl tal que Γl Γn Γl = −Γn . Tomando
traza, se tiene
tr Γn = − tr Γl Γn Γl , (5.138)
o, usando la propiedad cı́clica de la traza
tr Γn = − tr Γl Γl Γn . (5.139)
Pero por la propiedad 2, Γl Γl = 1, se tiene que
tr Γn = − tr Γn =⇒ tr Γn = 0 (5.140)
La propiedad 6 establece que
16
X
bk Γk = 0 ⇐⇒ bk = 0∀k. (5.141)
k=1
188 5.5 Los valores posibles de N

Separemos uno cualquiera de los términos de la suma del resto:

X
bm Γm + bk Γk = 0 (5.142)
k̸=m

Multipliquemos a derecha por Γm y usemos el hecho de que el cuadrado de las Γ’s

es la identidad, X
bm I + bk Γk Γm = 0. (5.143)
k̸=m
Ahora por la propiedad 1, siempre existe un l tal que
Γk Γm = akm Γl , con akm = ±1, ±i. (5.144)
Se tiene X
bm I + bk akm Γl = 0 (5.145)
k̸=m

para algún l (nótese que por la propiedad 2, Γl ̸= I para m ̸= k.) Ahora tomamos
la traza de esta igualdad
 
X
tr bm I + bk akm Γl  = 0 (5.146)
k̸=m

y usamos la propiedad 5, tr Γl = 0, con Γl ̸= I con lo que mostramos que

bm N = 0 =⇒ bm = 0 ∀m. (5.147)
Este último resultado es muy importante. Por construcción, las 16 matrices Γl
son independientes y por ello propiedad 6 muestra que de son linealmente inde-
pendientes. El número mı́nimo de filas y de columnas que deben tener 16 matrices
cuadradas para ser linealmente independientes es 4. Luego, se puede tomar a las
matrices Γl y, a fortiori, a las matrices γ µ como matrices de 4 × 4. Esta es una repre-
sentación irreducible. Por supuesto, se podrı́a tomar un orden mayor. En tal caso,
puede demostrarse que esta última es una representación reducible a una matriz
diagonal por bloques de la forma
 µ
γ 0

 · 
Γµ =  
(5.148)
·
 
 
0 γµ
donde las γ µ son las matrices en la representación mı́nima de 4 × 4.
Debe señalarse que el hecho de que las dimensiones del espaciotiempo son 4
determina que las matrices de Dirac sean 4 pero esto no está ligado unı́vocamente
con que sean elegidas como matrices de 4×4. En un espacio-tiempo de 3 dimensiones,
por ejemplo, la dimensión mı́nima possible para las 3 matrices γ µ existentes es 2 pero
también es posible representarlas como 3 matrices de 4 × 4 con 2 bloques de 2 × 2
en la diagonal.
Mecánica cuántica Relativista 189

5.6. Teorema fundamental de Pauli

Dados dos conjuntos de matrices de Dirac, {γ µ } y {γ̃ µ }, existe siempre una
matriz no-singular S que los conecta por una relación de similitud:

γ̃ µ = S −1 γ µ S (5.149)

La transformación es única a menos de una constante multiplicativa. No daremos

la prueba, que es simple pero trabajosa. Está basada en escribir a S en términos de
las 16 Γi y Γ̃i a su vez construidas a partir de las γ µ y γ̃ µ , en la forma

16
X
S= Γ̃i F Γi (5.150)
i=1

y determinar la matriz F que lleva a que valga (5.149).

Este teorema implica que no existe un único conjunto de 4 matrices de Dirac
que satisfagan las condiciones necesarias que hemos ido determinando sino que, una
vez encontrado explı́citamente un conjunto podremos obtener vı́a una transforma-
ción de similitud S adecuada, conjuntos equivalentes que podrán ser más o menos
convenientes según el problema a tratar.
Para que la condición de unitariedad13 (5.127) de las matrices gama,

γ 0 γ µ† γ 0 = γ µ , (5.151)

la satisfagan también las matrices transformadas,

γ̃ 0 γ̃ µ† γ̃ 0 = γ̃ µ , (5.152)

escribimos
S −1 γ 0 S(S −1 γ µ S)† S −1 γ 0 S = S −1 γ µ S (5.153)

o,
γ 0 SS † γ µ† (S † )−1 S −1 γ 0 = γ µ (5.154)

vemos que necesitamos que S sea unitaria.14

13
Si las matrices gama satisfacen (5.151) entonces son unitarias. Se demuestra utilizando sólo su
anticonmutador, {γ µ , γ ν } = 2g µν
14
La condición de unitariedad de las matrices gama (5.151) no es estrictamente necesaria en la
teorı́a, y no se desprende de su anticonmutador, aunque las representaciones más usuales de las
matrices gama la satisfacen.
190 5.7 Formas explı́citas de las matrices de Dirac

5.7. Formas explı́citas de las matrices de Dirac

Muchas veces es útil que γ 0 , ligada a la coordenada temporal y que aparece en
el término de masa del Hamiltoniano (5.45) (recordemos que β = γ 0 )
∂ψ
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ (5.155)
∂t
2
sea diagonal. Como además se debe tener (γ 0 ) = I y tr γ 0 = 0, es natural proponer
la forma más simple:

1 0 0 0
 
!
0 1 0 0 I2 0
γ0 =  = (5.156)
 
0 0 −1 0  0 −I2
0 0 0 −1

En cuanto a las γ i , es facil ver que una elección consistente con (5.156) y con todos
los requerimientos de las matrices de Dirac es
!
i 0 σi
γ = (5.157)
−σ i 0

donde σ i son las matrices de 2 × 2 de Pauli

! ! !
1 0 1 2 0 −i 3 1 0
σ = , σ = , σ = . (5.158)
1 0 i 0 0 −1

A la representación de las γ µ dada por (5,156) − (5,157) se la conoce como repre-

sentación de Dirac de las matrices γ µ pues es la que Dirac utilizó originalmente15 .
Otra representación útil es la llamada quiral. En esta representación se tiene:
!
0 I2
0
γ = (5.159)
I2 0

mientras que las γ i coinciden con (5,157),

!
i 0 σi
γ = (5.160)
−σ i 0
15
Recordemos que según G. Gamow, Dirac entrevió la solución una noche del invierno de 1928,
mientras meditaba sentado frente al fuego en el St. John College de Cambridge. Cuenta Dirac que
en esa noche jugaba con matrices de 2 × 2 con propiedades muy notables que habı́a inventado y que
no son otra cosa que las que llamamos matrices de Pauli. En ese relato comenta que él ignoraba que
Pauli habı́a encontrado esas matrices y que suponı́a que Pauli igualmente ignoraba que él también
las habı́a inventado.
Mecánica cuántica Relativista 191

Puede comprobarse que la matriz S que pasa de una representación a la otra es

!
1 I2 −I2 µ µ
S=√ , γDirac = S −1 γquiral S (5.161)
2 I2 I2

Daremos finalmente una representación que permite escribir a la ecuación de

Dirac como una ecuación real, llamada representación de Majorana en referencia al
fı́sico italiano Ettore Majorana16 que las utilizó en su trabajo relacionado con los
neutrinos,
! ! ! !
0 0 σ2 1 iσ 3 0 2 0 −σ 2 3 −iσ 1 0
γ = , γ = , γ = , γ = (5.162)
σ2 0 0 iσ 3 σ2 0 0 iσ 1

En esta representación las soluciones de la ecuación de Dirac son combinaciones

lineales de soluciones reales. La matriz S correspondiente resulta
!
1 I2 σ 2 µ µ
S = S† = √ 2 , γMajorana = SγDirac S −1 (5.163)
2 σ −I2

Esta representación es la mas adecuada para estudiar ecuaciones relativistas para

los neutrinos, que son fermiones de caga eléctrica nula y que no solo tienen un rol
muy importante en la fı́sica de partı́cula sino muy recientemente en problemas de la
materia condensada como los de los “aisladores y superconductores topológicos”.

5.8. Invarianza relativista

Frente a una transformación de Lorentz

x′µ = Λµν xν (5.164)

las derivadas cambian según

∂µ = Λν µ ∂ν′ (5.165)
Si tomamos la ecuación de Dirac (5.114),

iℏγ µ ∂µ ψ − mcψ = 0 (5.166)

y utilizamos (5.165), podemos escribir

iℏγ µ Λν µ ∂ν′ ψ − mcψ = 0. (5.167)

16
Ettore Majorana (1906-1938(?)), “Teoria simmetrica dellelettrone e del positrone”, Il Nuovo
Cimento, 14 (1937) 171.
192 5.8 Invarianza relativista

Buscamos que la ecuación de Dirac sea covariante, es decir, que tome la misma forma
en las variables primadas x′µ que en las originales xµ . Para ello definiremos un nuevo
conjunto de matrices
γ̃ ν = Λν µ γ µ (5.168)
Es fácil ver que, dadas las condiciones que cumple Λµν , las γ̃ µ satisfacen todas las
condiciones de las matrices de Dirac, de manera que podemos tomarlas como un
nuevo conjunto de matrices de Dirac y escribir
iℏγ̃ µ ∂µ′ ψ − mcψ = 0. (5.169)
Ahora bien, por el teorema fundamental de Pauli sabemos que si {γ µ } y {γ̃ µ }
son dos conjuntos aceptables de matrices de Dirac, debe existir S tal que
γ̃ µ = S −1 γ µ S (5.170)
Notemos que de las ecs. (5.170) y (5.170) resulta
S −1 γ µ S = Λµν γ ν , (5.171)
lo que constituye una ecuación para S dada una transformación de Lorentz Λ. Po-
demos reescribir (5.169) en la forma
iℏS −1 γ µ S∂µ′ ψ − mcψ = 0 (5.172)
o
iℏγ µ ∂µ′ Sψ − mcSψ = 0 (5.173)
Basta que identifiquemos Sψ con la función de onda transformada ψ ′ para que
podamos escribir
iℏγ µ ∂µ′ ψ ′ − mcψ ′ = 0 (5.174)
O sea que hemos mostrado que la ecuación de Dirac es covariante frente a las trans-
formaciones de Lorentz (5.346) si la función de onda cambia según
ψ ′ (x′ ) = Sψ(x) (5.175)
Es importante notar que las γ µ que aparecen en la ecuación de Dirac son las
mismas en ambos sistemas inerciales. De hecho, por más que el ı́ndice µ puede
inducir a pensar que γ µ es un tetravector cuyas componentes son matrices de 4 × 4,
hacerlo serı́a incorrecto. En efecto, si lo fuera, deberı́a transformarse como tal al
pasar de un sistema de referencia al otro, pero este no es el caso. Veremos luego,
al considerar cómo transforma la corriente jµ frente a transformaciones de Lorentz
cuál es la ley de transformación general de tetravectores.
En resumen, en la ec. (5.174) solo aparecen transformadas de Lorentz las coor-
denadas del espacio-tiempo y la función de ondas. Las matrices de Dirac son un
conjunto de matrices que permanecen inalteradas.
Mecánica cuántica Relativista 193

5.9. Transformación de Lorentz de la corriente

Tenemos ahora que comprobar que esta interpretación, según la cual la función
de onda en el sistema primado esta dada por (5.175), es consistente. En particular,
tenemos que comprobar que |ψ ′ |2 tiene una interpretación de densidad de proba-
bilidad, en el sistema primado, análoga a la de ρ = |ψ|2 en el sistema sin primar.
Para ello, debemos comprobar que la corriente j µ realmente se transforma como un
tetravector y por lo tanto la ecuación de continuidad resulta invariante de Lorentz.
Antes debemos derivar nuevas propiedades de S.
Recordemos que escribimos [ec. (5.172)]
γ̃ µ = S −1 γ µ S (5.176)
Como las matrices de Dirac se relacionan con sus adjuntas según
γ µ = γ 0 γ µ† γ 0 (5.177)
se tiene
† †
γ̃ λ = Λλµ γ µ = Λλµ γ 0 γ µ† γ 0 = γ 0 Λλµ γ µ γ 0 = γ 0 S −1 γ λ S γ0 (5.178)
†
= γ 0 S † γ λ† S −1 γ0 (5.179)

Reemplazando de nuevo γ λ† a partir de la relación (5.177),

†
Λλµ γ µ = γ 0 S † γ 0 γ λ γ 0 S −1 γ0 (5.180)

Pero el lado izquierdo es de hecho S −1 γ λ S mientras que el derecho puede ordenarse

de manera que la ecuación (5.180) se escriba:
−1
S −1 γ λ S = γ 0 S † γ 0 γ λ γ 0 S † γ 0 (5.181)

(porque γ 0 = (γ 0 )−1 ). Multiplicando ambos miembros a izquierda por S obtenemos

−1
γ λS = S γ 0S †γ 0 γ λ γ 0S †γ 0 (5.182)

y a derecha por γ 0 S † γ 0 se tiene entonces

γ λ Sγ 0 S † γ 0 = Sγ 0 S † γ 0 γ λ (5.183)

Pero para que el producto entre paréntesis conmute con todas las matrices γ λ , debe
ser un múltiplo de la identidad17
Sγ 0 S † γ 0 = bI (5.184)
17
Podemos demostrar esta afirmación de la siguiente manera:
194 5.9 Transformación de Lorentz de la corriente

o
Sγ 0 S † = bγ 0 (5.185)
Tomando el adjunto en esta ecuación,
Sγ 0 S † = b∗ γ 0 (5.186)
de donde resulta que b = b∗ . Calculamos ahora el determinante en la igualdad
(5.185),
(det S)2 = b4 (5.187)
de manera que si elegimos que det S = 118 , se tendra b4 = 1 por lo que b = ±1.
Ahora, escribamos la serie de igualdades
3
S † S = γ 0 γ 0 S † γ 0 γ 0 S = bγ 0 S −1 γ 0 S = bγ 0 Λ0ν γ ν = bΛ00 I − bΛ0k γ 0 γ k .
X
(5.188)
k=1

Si tomamos traza en ambos miembros de esta igualdad y usamos que tr γ 0 γ k = 0

llegamos a que
tr S † S = 4bΛ00 (5.189)
Como el lado izquierdo es definido positivo, tenemos finalmente
4bΛ00 > 0. (5.190)
Luego b = +1 corresponde a Λ00 > 0, una transformación de Lorentz ortócrona19
mientras que b = −1 corresponde a Λ00 < 0, una inversión temporal.
En cuanto a las propiedades de transformación de ψ ′ , tenemos
†
ψ ′ = Sψ =⇒ (ψ ′ ) = ψ † S † (5.191)
Multiplicando a derecha por γ 0 y recordando la definición ψ̄ = ψ † γ 0 se tiene
ψ̄ ′ = ψ † S † γ 0 = ψ̄γ 0 S † γ 0 = bψ̄S −1 (5.192)
Dado el tetravector corriente
J µ = cψ̄γ µ ψ (5.193)
su transformado de Lorentz se escribirá
J ′µ = cψ̄ ′ γ µ ψ ′ = cbψ̄S −1 γ µ Sψ = cbψ̄Λµν γ ν ψ = bΛµν J ν (5.194)
Luego, para transformaciones ortócronas, b = +1 y J µ transforma como un tetra-
vector ante transformaciones de Lorentz, lo que da la transformación adecuada para
ρ = |ψ|2 que puede entonces ser interpretada como densidad de probabilidad.
18
Esto lo podemos hacer porque S está definida a menos de una constante multiplicativa, aunque
no sea unitaria.
19
ortócrona: que preserva el sentido del tiempo.
Mecánica cuántica Relativista 195

5.10. El grupo de Lorentz

Cada matriz Λ es real y de 4 × 4, de manera que se corresponde con un punto de
16
R . Sin embargo no todas sus componentes son independientes; éstas yacen sobre
una hipersuperficie determinada por las 10 ecuaciones algebraicas que se obtienen de
(5.82), de manera que quedan sólo seis parámetros reales libres. Esta hipersuperficie
es la variedad del grupo20 . En este caso, además, esta variedad resulta diferenciable
por lo que el grupo es un grupo de Lie. Un grupo se dice conexo si para cualquiera
de sus elementos, existe una curva sobre la variedad del grupo que lo conecta con
continuidad con la identidad ΛI . Mostremos que el grupo de Lorentz es no conexo
y está formado por cuatro hojas no conectadas.
De (5.82), ΛT gΛ = g se obtiene que

det Λ = ±1. (5.195)

Si det Λ = +1 (−1) la transformación Λ se dice propia (impropia). Además, de

(5.82) surge que
gρν Λµ0 Λν 0 = g00 (5.196)

y por lo tanto
(Λ00 )2 − Λi0 Λi0 = 1, (5.197)

y en consecuencia, (Λ00 )2 ⩾ 1, y las transformaciones son llamadas ortócronas si

Λ00 ⩾ 1, o bien no ortócronas para Λ00 ⩽ 1. Tampoco aquı́ es posible pasar de unas
a otras mediante la variación de un parámetro continuo. Dado que la identidad está
sólo en la hoja con det Λ = +1 y Λ00 ⩾ 0 sólo ésta es un subgrupo, llamado subgrupo
propio ortócrono, y denotado L↑+ (o SO+ (1,3) para los matemáticos). Este subgrupo,
sin embargo, no es simplemente conexo, ya que por ejemplo, contiene las rotaciones
que forman al grupo SO(3) que no lo es. Su grupo de cubrimiento universal21 , el gru-
po de espı́n indefinido Spin(1,3), es isomorfo tanto al grupo lineal especial SL(2, C)
(matrices complejas de 2 × 2 de determinante 1) como al grupo simpléctico Sp(2, C).
Estos isomorfismos permiten que el grupo de Lorentz actúe sobre un gran número
de estructuras matemáticas distintas, en particular los espinores.
20
En general, todo grupo continuo de n parámetros (reales) tiene sus elementos identificados de
manera biunı́voca con los puntos de una variedad n-dimensional, inmersa en Rm (con m ⩾ n) y
determinada por un conjunto de m − n ecuaciones algebraicas.
21
Una misma álgebra de Lie puede generar grupos con diferentes variedades, y que a su vez
posean topologı́as distintas. Cuando un álgebra de Lie genera varios grupos, aquel cuya variedad es
simplemente conexa se denomina grupo de cubrimiento universal: SU(2) es el grupo de cubrimiento
universal de SO(3). El grupo de cubrimiento universal es en general más grande, y es homeomorfo
al grupo (varios elementos a uno)
196 5.11 Generadores y álgebra del grupo L↑+

5.11. Generadores y álgebra del grupo L↑+

Centrémonos en el grupo de Lorentz propio ortócrono. Otros elementos del grupo
de Lorentz se pueden obtener multiplicando a los de aquel por ΛT , ΛP y ΛT ΛP .
Mostremos que todo elemento del grupo Λ continuamente conectado a la identidad
puede escribirse como

Λ = eiωi Ki +iθi Li , (i = 1, 2, 3) (5.198)

donde ωi y θi son parámetros reales y Ki y Li son matrices de 4 × 4. En general

todos los grupos de Lie pueden parametrizarse de esa forma, y los operadores Ki y
Li se denominan generadores del grupo. Para esto consideremos una transformación
de Lorentz infinitesimal, es decir, cercanas a la identidad.

Λ = ΛI + εΩ + O(ϵ2 ), (5.199)

donde Ω es una matriz con elementos reales y ε es pequeño. Si insertamos esta

expresión en la condición de definición (5.82), obtenemos

g + εΩT g + εgΩ + O(ε2 ) = g, (5.200)

o bien
(gΩ)T = −gΩ (5.201)
Es decir, gΩ resulta una matriz antisimétrica. Sólo debemos entonces elegir una base
de matrices antisimétricas de 4 × 4 para descomponer gΩ, y multiplicar por g −1 la
base para obtener la descomposición de Ω. Una elección conveniente y simple es el
conjunto

0 0 0 0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 i 0 0 −i 0
L1 =  , L2 =  , L3 =  ,
     
0 0 0 −i 0 0 0 0 0 i 0 0
0 0 i 0 0 −i 0 0 0 0 0 0
(5.202)
0 i 0 0 0 0 i 0 0 0 0 i
     
i 0 0 0 0 0 0 0 0 0 0 0
K1 =  , K2 =  , K3 =  .
     
0 0 0 0 i 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 i 0 0 0

que al multiplicarlas por g resultan antisimétricas. Luego, la matriz Ω puede escri-

birse como X
Ω=i (ωi Ki + θi Li ), (5.203)
i=1,2,3
Mecánica cuántica Relativista 197

con ωi y θi parámetros reales y ε pequeño. Las transformaciones finitas pueden

obtenerse tomando el lı́mite n → ∞ de un producto de n transformaciones infinite-
simales, con ϵ ∼ 1/n:
!n
Ω
Λ = lı́m I+ = eiωi Ki +iθi Li . (5.204)
n→∞ n
Por ejemplo, la rotación (5.110) puede expresarse como

ΛR (θ) = eiθL3 (5.205)

mientras que el boost resulta

ΛB (ω) = eiωK1 . (5.206)
Las seis matrices (5.202) satisfacen las relaciones de conmutación:

[Li , Lj ] = iϵijk Lk
[Li , Kj ] = iϵijk Kk (5.207)
[Ki , Kj ] = −iϵijk Lk
lo que se denomina el álgebra de Lie del grupo, Li y Ki son los generadores del
grupo, y las constantes ϵijk las constantes de estructura. Conocer estas constantes
(que obtuvimos analizando transformaciones próximas a la identidad) implica que
conocemos la ley de composición de todo el grupo, ya que dados dos elementos del
grupo g1 = eA y g2 = eB , su producto se obtiene aplicando la fórmula de Hausdorff,
1
eA eB = eA+B+ 2 [A,B]+... . (5.208)

El álgebra y las constantes de estructura garantizan que el lado derecho se puede

escribir como eC con C una combinación lineal de elementos del álgebra.
Dado que la transformación queda caracterizada por 6 parámetros, y que tenemos
6 generadores, resulta conveniente escribirla en la forma siguiente:
i αβ
Λ = e 2 ωαβ M (5.209)

donde
ω0i = ωi , ωij = ϵijk θk , ωαβ = −ωβα (5.210)
contiene a los 6 parámetros, y

M0i = Ki , Mij = ϵijk Lk , M αβ = −M βα (5.211)

a los generadores. Nótese que cada una de las M αβ es una matriz de 4 × 4. En

términos de éstas el álgebra (5.207) se escribe

[M αβ , M µν ] = −ig βµ M αν + ig αµ M βν + ig βν M αµ − ig αν M βµ . (5.212)
198 5.11 Generadores y álgebra del grupo L↑+

Por definición, los generadores en cualquier otra representación deben satisfacer

estas mismas relaciones. Por ejemplo, otra representación del álgebra del grupo de
Lorentz viene dada por los operadores diferenciales

Lµν = i(xµ ∂ν − xν ∂µ ), (5.213)

que es una representación de dimensión infinita. Cada generador actúa sobre fun-
ciones en vez de sobre un espacio vectorial de dimensión finita. Estos son los gene-
radores clásicos del momento angular generalizados para incluir el tiempo. Se puede
comprabar que Lµν satisface las relaciones de conmutación del álgebra, ec. (5.212).
Para encontrar las representaciones matriciales irreducibles de L↑+ (en realidad
de su grupo de cubrimiento universal) es conveniente considerar las combinaciones
lineales complejas de los generadores
1
Jk± = (Lk ± iKk ), (5.214)
2
cuyos conmutadores se reducen a

[Ji± , Jj± ] = iϵijk Jk± , [Ji+ , Jj− ] = 0. (5.215)

Esto corresponde a dos subálgebras de SU(2) que conmutan entre sı́, caracterizadas
cada una de ellas por un entero o semientero j ± , y enntonces las representaciones
matriciales irreducibles de L↑+ están caracterizadas por un par de enteros o semien-
teros (j+ , j− ), siendo su dimensión (2j+ + 1)(2j− + 1). Las transformaciones están
entonces representadas por matrices D(j+ ,j− ) . Una cantidad que transforma según
1
D(0,0) se llama escalar de Lorentz. Una que transforma según D( 2 ,0) corresponde a un
espinor de dos componentes (que se conoce como espinor de Weyl) de polarización
1
izquierda χL y uno que transforma según D(0, 2 ) corresponde a un espinor de Weyl
de polarización derecha χR ). Estos espinores de dos componentes son los que usamos
en la teorı́a de Pauli de dos componentes para representar a la función de onda en
el caso no relativista cuando se incluyó el spin. Los objetos de 4 componentes que
aparecen en la ecuación de Dirac son, por construcción, objetos que corresponden a
la suma directa ( 21 , 0) ⊕ (0, 12 , ). El espinor resultante es un espinor de 4 componentes
o espinor de Dirac, !
ψL
χ= . (5.216)
ψR
La representación ( 12 , 21 ) es una representación vectorial. Un objeto que transfor-
ma según ella es entonces lo que conocemos como tetravector.
Es importante notar que los boosts del grupo de Lorentz en una dimension
espacial y la temporal están parametrizados por tanh ω = v/c y por lo tanto la
transformación es homeomorfa a un espacio topológico en un intervalo abierto de R
Mecánica cuántica Relativista 199

que es no-compacto en la topologı́a generada por la métrica (esto contrasta con las
rotaciones en el plano como ejemplo de un grupo compacto: están parametrizadas
por un ángulo 0 ⩽ θ ⩽ 2π en el que el 0 es identificado con 2π).

5.12. El carácter de ψ
Hemos escrito a la ecuación de Dirac para una partı́cula libre de masa m de
manera explı́citamente covariente en la forma

(iℏγ µ ∂µ − mc)ψ = 0, (5.217)

donde las matrices γ µ son cuatro matrices de 4 × 4 que satisfacen lo que los ma-
temáticos llaman un álgebra de Clifford22

γ µ γ ν + γ ν γ µ = 2g µν IN . (5.218)

Vimos que la representación más pequeña posible para que la ecuación de Dirac para
una partı́cula libre de masa m cumpla la relación relativista entre energı́a e impulso
es la que corresponde a matrices γ µ de 4 × 4. Si la adoptamos, ψ será necesariamente
un objeto de cuatro componentes, un espinor de 4 componentes23
 1
ψ
ψ 2 
ψ= = [ψ α (x)] . (5.219)
 
 3
ψ 
ψ4
¿Qué tiene que ver el álgebra de Clifford con el grupo de Lorentz? Veamos.
Dada una transformación de Lorentz para las coordenadas del espacio tiempo que
anotamos como
x′µ = Λµν xν , (5.220)
ya hemos mostramos que la ley de transformación de de la función de onda ψ (el
espinor ψ ) debı́a estar dada por

ψ ′α (x′ ) = S αβ ψ β (x), (5.221)

o, de manera compacta
ψ ′ (x′ ) = S(Λ)ψ(x). (5.222)
22
El matemático y filósofo inglés William K. Clifford fue quien introdujo este álgebra cuadrática
multilineal en la década de 1870.
23
Formalmente, un espinor es un elemento de un espacio de representación para el “grupo espi-
norial”. En en el contexto de la mecánica cuántica relativista, los espinores son elementos de un
espacio vectorial complejo asociado al espacio de Minkowski. Los espinores fueron introducidos en
la matemática por Elie Cartan en 1913 y originalmente utilizados en la fı́sica por Pauli, en 1920.
200 5.12 El carácter de ψ

Aquı́ S αβ representa una matriz de 4 × 4 que queda determinada a través de la

relación que resulta de combinar las ecs. (5.170) y (5.170),

Λλµ (γ µ )αβ = S −1 γλ S , (5.223)
αρ ρσ σβ

o, nuevamente en forma compacta

Λλµ γ µ = S −1 γ λ S (5.224)
Dada una transformación de Lorentz Λ, la relación (5.224) define a la matriz S, de
allı́ que la hemos escrito como S(Λ).
Pretendemos ahora responder a la pregunta: ¿Cuál es el carácter de ψ? O, en
otras palabras, ¿cómo se define de manera precisa al objeto que llamamos espinor? La
ley de transformación frente al grupo de Lorentz, ψ ′ (x′ ) = Sψ(x), nos muestra que
no es un escalar puesto que de serlo no se transformarı́a frente a transformaciones de
Lorentz. Tampoco es un tetravector como xµ o la corriente de probabilidad J µ que
se transforman según la relación V ′µ = Λµν V ν .24 En lo que sigue determinaremos S
explı́citamente para poder responder a la pregunta del párrafo anterior.
Consideremos una transformación de Lorentz infinitesimal tal que Λ00 > 0 de
manera que se preserve el sentido del tiempo
x′µ = xµ + ϵω µν xν = (δνµ + ϵω µν ) xν , (5.225)
donde ϵ es un parámetro infinitesimal asociado a la transformación. En cuanto a
ω µν , quedará determinada según el tipo de transformación que represente Λµν (in-
versiones, rotaciones, boosts).
Para comenzar, las condiciones que debe satisfacer Λµν , (5,81),
gµν Λµρ Λν σ = gρσ , (5.226)
imponen la siguiente relación a orden ϵ, cuando se escribe Λµν = δνµ + ϵω µν

Λµν = δνµ + ϵω µν ⇒ ω µν = −ω νµ (5.227)

Para la matriz S que transforma a ψ cuando xµ se transforma como en (5.225)
escribimos también a orden ϵ,

S = I + ϵT (5.228)
Se trata ahora de determinar T para luego escribir, como hacemos siempre en el
caso finito, S = exp(ϵT ). Utilizando la relación (5.224),
Λλµ γ µ = S −1 γ λ S, (5.229)
24
Como ya indicamos, el ı́ndice α, con α = 1, . . . , 4, de (ψ α ) nada tiene que ver con los ı́ndices
de Lorentz de espacio-tiempo).
Mecánica cuántica Relativista 201

se tiene
(δνµ + ϵω µν ) γ ν = (I − ϵT )γ µ (I + ϵT ), (5.230)
y al orden ϵ en que trabajamos resulta entonces

ω µν γ ν = γ µ T − T γ µ . (5.231)

Esta relación determina T a menos de un múltiplo de la identidad (pues I es la

única matriz que conmuta con todas las γ µ ). Podemos entonces imponer que tr
T = 0 pues, si su traza diera otro valor, bastarı́a restar un múltiplo adecuado de la
identidad para anularla.
Puede verse entonces que, trabajando a orden ϵ, esto es equivalente a que det S =
1, (recordar el desarrollo de un determinante en terminos de la identidad, la traza,
etc.25 )

det S = det(1 + ϵT ) = 1 + ϵ tr T + O(ϵ2 ) = 1 + O(ϵ2 ) (5.232)

Usando reiteradamente el álgebra de las γ µ puede verse que la solución de (5.231)
es
1 i
T = ωµν (γ µ γ ν − γ ν γ µ ) = − ωµν Σµν . (5.233)
8 2
De este modo, la matriz S se escribe
i µν
S(Λ) = e− 2 ωµν Σ , (5.234)

con
i µ ν
Σµν ≡
[γ , γ ] . (5.235)
4
De manera más general, Σµν satisface el álgebra del grupo de Lorentz cuando se
construye a partir de cualquier conjunto de matrices γ que satisfaga el álgebra de
Clifford. Es decir, se puede derivar de {γµ , γν } = 2gµν que

[Σµν , Σρσ ] = i(g νρ Σµσ − g µρ Σνσ − g νσ Σµρ + g µσ Σνρ ). (5.236)

Es importante apreciar que las matrices Σµν son diferentes de las matrices M µν
correspondientes a los generadores en la representación vectorial. En especial, Σµν
son complejos. Ası́ que hemos encontrado dos representaciones de dimensión 4 no
equivalentes. En cada caso, el elemento del grupo está determinado por seis ángulos
reales ωµν (tres rotaciones y tres boosts). La representación vectorial, o ( 21 , 12 ) es
irreducible y los elementos del grupo que se obtienen por exponenciación son (5.209)
i αβ
Λ = e 2 ωαβ M , (5.237)
det(1 + ϵA) = 1 + ϵ tr(A) + ϵ2 21 tr2 A − tr A2 + . . .
25

202 5.12 El carácter de ψ

mientras que la representación de Dirac, o ( 12 , 0) ⊕ (0, 12 ) es reducible y los elementos

del grupo se escriben como en (5.234)
Ahora bien, para interpretar el significado de estas cantidades Σµν , represen-
tación espinorial de los generadores del grupo, notemos que se trata de un objeto
antisimétrico. En especial, sus componentes Σ0i pueden escribirse como
i i i i
Σ0i = [γ 0 , γ i ] = γ 0 γ i = βαi β = − αi (5.238)
4 2 2 2
(recuérdese que las matrices αi anticonmutan con β) lo cual nos indica que las
matrices αi son los generadores de boosts en la representación espinorial. De modo
que para un boost genérico tenemos
1
S(ΛB ) = e− 2 ω·α (5.239)

donde ωi = ω0i . Observemos que en la representación quiral,

! ! !
i 0 I
0 i 0 σi −σ i 0
α =γ γ = = (5.240)
I 0 −σ i 0 0 σi

y entonces
1 !
e 2 ω·σ 0
S(ΛB ) = − 12 ω·σ
. (5.241)
0 e
Por otro lado, definimos
i i
Σi ≡ ϵijk Σjk = ϵijk [γ j , γ k ] = ϵijk γ j γ k (5.242)
4 2
i ijk i
= ϵ [βαj , βαk ] = − ϵijk [αj , αk ] (5.243)
4 4
i ijk j k
=− ϵ α α , (5.244)
2
o26 ,
i
Σ=− α×α (5.245)
2
Para una rotación en el espacio tenemos [ec. (5.210)] ωij = ϵijk θk y
i
S(ΛR ) = e− 2 θ·Σ (5.246)

Quedan ası́ identificados los Σµν como los generadores de las transformaciones de
Lorentz mientras que los ωµν son los parámetros de las diferentes transformaciones
26
Nótese que este producto vectorial, al ser entre matrices, no se anula
Mecánica cuántica Relativista 203

En la representación quiral,
!
σ 0
Σ= . (5.247)
0 σ

Se trata de una matriz diagonal por bloques de 2 × 2 y que cada uno de esos bloques
coincide con el generador de rotaciones de los espinores de Pauli de 2 componentes
que estudiamos en el caso de la mecánica cuántica no relativista. La matriz S(Λ) se
escribe en la forma sugestiva
i !
e− 2 θ·σ 0
S(ΛR ) = − 2i θ·σ
. (5.248)
0 e

Estas dos expresiones valen también en la representación de Dirac, dado que, de

(5.242) Σ sólo depende de las γ i , que son iguales en ambas representaciones.
Téngase en cuenta que para las rotaciones (5.248), S(Λ) es unitaria, mientras
que para los boosts (5.241), no lo es. De hecho, al ser un grupo no compacto, no
existen representaciones unitarias de dimensión finita del grupo de Lorentz. Hemos
demostrado esto explı́citamente en la representación quiral del álgebra de Clifford.
Podemos tener una idea de por qué esto es cierto para una representación arbitraria.
De la expresión (5.234)
i µν
S(Λ) = e− 2 ωµν Σ , (5.249)
la transformación es unitaria son Σµν son hermı́ticas, pero, de (5.235)
i h µ † ν †i
(Σµν )† = (γ ) , (γ ) (5.250)
4
que es igual a Σµν si las γ µ son todas hermı́ticas o todas antihermı́ticas. Pero esto no
puede cumplirse, porque γ02 = 1 y entonces los autovalores de γ 0 son ±1, reales, por
lo tanto no puede ser antihermı́tica, mientras que γi2 = −1 y los autovalores de γ i ,
son ±i imaginarios puros, y por lo tanto γ i no puede ser hermı́tica. Podrı́amos elegir
γ 0 hermı́tica, pero γ i sólo puede elegirse antihermı́tica. En general, no hay forma
de elegir las γ µ de manera que Σµν resulten todas hermı́ticas. Esto explica por qué
necesitamos trabajar con ψ̄ = ψ † γ 0 : en la ec. (5.131) introdujimos el Lagrangiano
de Dirac, que posee un término de la forma ψ̄ψ, y que resulta un escalar, dado que
frente a una transformación de Lorentz ortócrona (b = +1, Λ00 > 0),

ψ → ψ ′ = Sψ (5.251)
′ −1
ψ̄ → ψ̄ = ψ̄S (5.252)

y por lo tanto
ψ̄ψ → ψ̄ ′ ψ ′ = ψ̄ψ (5.253)
204 5.12 El carácter de ψ

Por otro lado, ψ † ψ → ψ † S † Sψ. Como vimos, la representación no es unitaria y para

algunas transformaciones de Lorentz S † S ̸= 1, y entonces ψ † ψ no nos sirve para
construir una acción invariante
¿Cómo podemos estar seguros de que la representación espinorial es nueva, y no
es equivalente a la representación usual de los Λµν ? Para convencernos de que son
realmente distintas veamos ejemplos de algunas transformaciones especı́ficas.
Consideremos una rotación en un ángulo θ alrededor del eje z:

1 0 0 0
 
0 cos θ sin θ 0
ΛR =  (5.254)
 
0 − sin θ cos θ 0


0 0 0 1

Mientras que, por ejemplo, en la representación quiral, tenemos

 −iθ/2
e 0 0 0

− 2i θσ 3
!
e 0  0 e+iθ/2 0 0 
S(ΛR ) = = , (5.255)
 
− 2i θσ 3  0 0 e−iθ/2
0

0 e 
0 0 0 eiθ/2

que claramente es una matriz diferente a Λ. En especial, si tomamos una rotación de

θ = 2π, ¡obtenemos Λ = I, mientras que S(Λ) = −I! Y entonces, bajo una rotación
en 2π,
ψ(x) → −ψ(x) (5.256)

que definitivamente no es lo que le ocurre a un vector. Entonces S(Λ) es una repre-

sentación diferente de la representación vectorial Λµν
En el caso de un boost en la dirección del eje x con parámetro tanh ω = v/c ,
tenemos
cosh ω sinh ω 0 0
 
 sinh ω cosh ω 0 0
ΛB =  (5.257)
 
 0 0 1 0


0 0 0 1

mientras que

1 eω/2 0 0
 
1 1 !
e 2 ωσ 0 eω/2 1 0 0 
S(ΛB ) = = (5.258)
 
− 21 ωσ 1  0 0 1 e−ω/2 
0 e 
−ω/2
0 0 e 1
Mecánica cuántica Relativista 205

5.13. Espinores quirales

En la sección anterior, al necesitar una forma explı́cita de las matrices γ µ utili-
zamos la representación quiral o de Weyl,
! !
0 0 I2 i0 σi
γ = , γ = (5.259)
I2 0 −σ i 0

En esta representación, las rotaciones sobre los espinores S(ΛR ) y los boosts S(ΛB )
que obtuvimos en (5.248) y (5.241) son diagonales por bloques,
i ! 1 !
e− 2 θ·σ 0 e 2 ω·σ 0
S(ΛR ) = − 2i θ·σ
, S(ΛB ) = − 12 ω·σ
. (5.260)
0 e 0 e

Esto significa que la representación de espinores de Dirac es reducible. Se descom-

pone en dos representaciones irreducibles, y cada una actúa sobre espinores de dos
componentes χ+ y χ− , definidos de manera que
!
χ+
ψ= (5.261)
χ−

Los objetos de dos componentes χ± se llaman espinores de Weyl o espinores quirales.

Se transforman del mismo modo frente a rotaciones,
i
χ± → e− 2 θ·σ χ± , (5.262)

pero de manera opuesta frente a boosts,

1
χ± → e± 2 ω·σ χ± , (5.263)

Es decir que χ+ y χ− transforman bajo rotaciones y boosts como los espinores de dos
componentes que introdujimos en la mecánica cuántica no-relativista del electrón.
En el lenguaje de la teorı́a de grupos, χ+ está en la representación ( 21 , 0) del grupo
de Lorentz, mientras que χ− está en la representación (0, 12 ). El espinor de Dirac se
encuentra ası́ en la representación ( 12 , 0) ⊕ (0, 12 )27 .
Es sólo cuando se incluyen reflexiones espaciales (cambio de paridad) que la
representación deviene irreducible. El requerir que una teorı́a sea invariante bajo
reflexiones espaciales implica la necesidad de usar espinores de 4 componentes. En
efecto, una inversión lleva un espinor de dos componentes que pertenece a la re-
presentación ( 12 , 0) a uno que pertenece a la representación (0, 21 ). Esto puede verse
27
Estrictamente del grupo de cubrimiento SL(2, C)
206 5.14 La solución de partı́cula libre

fácilmente recordando que para el caso de una inversion espacial se tiene que (Λλµ )
son los elementos de una matriz diagonal,
1 0 0 0
 
0 −1 0 0
ΛP =  . (5.264)
 
0 0 −1 0 
0 0 0 −1
Luego, usando la relación (5.224)
Λλµ γ µ = S −1 γ λ S, (5.265)
para λ = i, se tiene
Λiµ γ µ = Λii γ i = −γ i = S −1 γ i S. (5.266)
Y entonces Sγ i + γ i S = 0. Mientras que para el caso de λ = 0 resulta que debe
conmutar. Esto implica que se puede tomar a S proporcional a γ 0 . En la represen-
tación quiral (que es la que permite caracterizas a las dos primeras componentes
frente a las 2 últimas) γ 0 es una matriz con dos bloques en la antidiagonal (cada
uno proporcional a la identidad, ver ec. (5,159), y entonces para una transformación
de paridad en la representación quiral,
!
0 I2
0
S=γ = (5.267)
I2 0
y por eso se cambian las componentes de arriba respecto de las de abajo e inversa-
mente.
Para el resto de las transformaciones del grupo de Lorentz, χ+ y χ− transforman
separadamente.
Entonces, necesitamos 4 componentes y no solamente dos porque los espinores
de dos componentes y su transformado por inversiones espaciales no se transforman
de la misma manera bajo transformaciones de Lorentz.

5.14. La solución de partı́cula libre

Buscaremos ahora las soluciones de la ecuación de Dirac para una partı́cula libre
de masa m,
∂ψ
iℏγ µ µ − mcψ = 0 (5.268)
∂x
Es fácil comprobar que esta ecuación tiene soluciones del tipo onda plana, que
describen una partı́cula cuántica relativista de masa m en ausencia de interacción.
Estas soluciones, como es esperable, tienen la forma
i

ψ(r, t) = u exp − pµ xµ (5.269)
ℏ
Mecánica cuántica Relativista 207

donde u es un espinor con las 4 componentes constantes y pµ un tetravector cons-

tante, asociado al operador pµ .
pµ = iℏ ∂µ . (5.270)
El autovalor pµ debe ajustarse para que (5.269) sea solución de (5.268), o sea que
satisfaga la relación relativista E 2 = p2 c2 + m2 c4 . Insertando la solución (5.269)
propuesta en la ecuación de Dirac se obtiene la ecuación matricial algebraica

(γ µ pµ − mcI4 ) u = 0. (5.271)

De ahora en más obviaremos en notación la matriz identidad de 4 × 4 I4 .

La fórmula (5.271) representa a 4 ecuaciones homogéneas (una para cada com-
ponente de u ) que tendrán solución no-trivial si se cumple

det (γ µ pµ − mc) = 0 (5.272)

Que se cumpla esta condición implica que la inversa “formal”

(γ µ pµ − mc)−1 (5.273)

no puede existir. Para encontrar los puntos singulares reescribamos esta inversa en
la forma

(γ µ pµ − mc)−1 = (γ µ pµ − mc)−1 (γ µ pµ + mc)−1 (γ µ pµ + mc) . (5.274)

El producto de denominadores puede reacomodarse de una manera simple:

(γ µ pµ − mc) (γ ν pν + mc) = γ µ γ ν pµ pν − m2 c2 = pµ pµ − m2 c2 . (5.275)

Luego, la inversa puede escribirse como

(γ ν pν + mc)
(γ µ pµ − mc)−1 = . (5.276)
pµ pµ − m2 c2

Establecimos que esta inversa no debe existir o, lo que es equivalente, el determi-

nante (5.272) debe anularse y la ecuación (5.271) tendrá soluciones no triviales si el
denominador de (5.276) se anula,

p µ p µ − m 2 c2 = 0 (5.277)

Si escribimos (pµ ) = (E/c, p), de manera que

E2
pµ pµ = − p2 , (5.278)
c2
208 5.14 La solución de partı́cula libre

Con esta notación es claro que podemos identificar a las componentes del tetravector
pµ con con la energı́a E y las 3 componentes del impulso p de manera que la condición
(5.278) deviene la relación entre energı́a E e impulso p de una partı́cula libre de masa
m, según la forma clásica de la relatividad restringida,

E 2 = c2 p 2 + m 2 c4 (5.279)

Entonces, dado p, la energı́a E de la partı́cula puede tomar los valores

q
E± = ±Ep = ± c2 p2 + m2 c4 (5.280)

Vemos entonces que la ecuación de Dirac libre tiene soluciones de partı́cula libre
con energı́a positiva y ¡negativa!. Volvamos a mencionar que en la ecuación de Dirac
la masa puede tener cualquier signo puesto que en la fórmula (5.280) aparece al
cuadrado.
Resta determinar las soluciones u del sistema homogéneo (5.271). Aquı́ resulta
útil dividir al espinor de cuatro componentes en dos espinores de dos componentes,
φ y χ,
u1
 
!
u  φ
 2
u= = (5.281)
u3  χ
u4
con ! !
u1 u3
φ= y χ= (5.282)
u2 u4
y utilizando nuevamente la representación de Dirac de las matrices γ µ , la ecuación
(5.271) se escribe en forma de dos ecuaciones para ϕ y χ:

(E − mc2 )φ − c σ · p χ = 0, (5.283)
(E + mc2 )χ − c σ · p φ = 0. (5.284)

Dado que el determinante de este sistema es cero, sabemos que las cuatro ecua-
ciones no pueden ser linealmente independientes. Una de ellas tiene que ser una
combinación de las tres restantes. Mostraremos más tarde que estrictamente sólo
dos ecuaciones son linealmente independientes, debido a que existe otra cantidad
que conmuta con el Hamiltoniano dando lugar a una degeneración. De manera que
podemos tomar sólo la ecuación de arriba o sólo la de abajo. Es usual tomar la de
arriba para las soluciones de energı́a positiva y la de abajo para las negativas. De
este modo, si tomamos a φ como arbitrario (y complejo), con la normalización

φ† φ = u∗1 u1 + u∗2 u2 = 1, (5.285)

Mecánica cuántica Relativista 209

y E = +Ep , χ resulta
cσ · p
χ= φ. (5.286)
E + mc2
y entonces la solución es de la forma
!
φ
u+ = N+ c σ·p (5.287)
Ep +mc2
φ

Para E = −Ep , la solución que resulta ortogonal a esta es

−c σ·p
!
Ep +mc2
φ
u− = N− . (5.288)
φ
La normalización se ajusta de manera que
4
|uα |2 = 1,
X
(5.289)
α=1

y resulta !−1
c2 p 2
|N± |2 = 1 + ≡ |N |2 . (5.290)
(Ep + mc2 )2
la misma para las dos ernergı́as y φ arbitrario, y normalizado.
El lı́mite no relativista (v/c → 0) corresponde a |E± | → mc2 , y N ∼ 1. En este
caso las soluciones toman la forma
! !
φ O(v/c) × φ
u+ = , u− = . (5.291)
O(v/c) × φ φ
Suponiendo que las componentes de φ y χ sean de orden 1 (ambos están normali-
zados a 1), se distingue ası́ a las “grandes componente”, que son las que sobreviven
al lı́mite v/c → 0, de las “pequeñas componentes” que se anulan en este lı́mite. Se
observa entonces que en el lı́mite no relativista, la parte no trivial de los espinores
de 4 componentes se reduce a espinores de 2 componentes (espinores de Pauli, φ y
χ), que corresponden, para el caso de energı́a positiva, a la solución de la ecuación
no relativista de Schrödinger para una partı́cula libre con spin 1/2:

u = ei(p·r−Et)/ℏ × φ. (5.292)

5.15. Spin
Recordemos que a partir de la ecuación de Dirac,
∂ψ(r, t)
iℏγ µ − mcψ(r, t) = 0, γ µ = γ 0, γ1, γ2, γ3 (5.293)
∂xµ
210 5.15 Spin

pudimos identificar el hamiltoniano relativista de una partı́cula libre de masa m. En

efecto, escribiendo la ec. (5.293) en términos de las matrices αi , β en lugar de las
matrices γ µ según las relaciones

γ0 = β (5.294)
γ i = βαi , (5.295)

se tiene
∂ψ
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ. (5.296)
∂t
Escrita de esta manera señalamos anteriormente una evidente analogı́a de esta ecua-
ción con la ecuación de Schrödinger no-relativista si identificamos al hamiltoniano
en la forma H,
H = cα · (−iℏ)∇ + βmc2 (5.297)
Esta identificación es consistente con el hecho de que el lado izquierdo de la ec.
(5.296) puede ser asociado a una traslación temporal infinitesimal de la función de
onda con lo que el operador H del lado derecho cumple el rol de generador de dicha
traslación.
Es fácil ver que H según la definición (5.297) no conmuta con el operador L =
r×p, asociado al momento angular orbital según las reglas de cuantificación canónica
que aceptamos en la mecánica cuántica no-relativista y que hasta aquı́ consideramos
que son consistentes en el caso relativista. En efecto, si reescribimos (5.297) usando
que (−iℏ)∇ = p se tiene
H = cα · p + βmc2 (5.298)
y se encuentra
dL i
= − [L, H] = cα × p. (5.299)
dt ℏ
Es decir que L no se conserva, no está asociado a una constante de movimiento: ¡De
aquı́ se podrı́a inferir la ausencia de invarianza bajo rotaciones, y esto aún en el caso
de la partı́cula libre!28
Por otro lado, en el caso de la partı́cula libre encontramos 4 soluciones lineal-
mente independientes, dos de energı́a positiva y dos de energı́a negativa y que, en
lo que respecta a rotaciones, ambos estaban relacionados con los espinores de Pauli
que representan a las funciones de onda para partı́culas de spin 1/2, con las dos
componentes distinguiendo a las soluciones con igual energı́a según el el signo de la
proyección a lo largo del eje z.
28
Nótese que la cantidad cα jugaba el rol de “velocidad” en la interpretación clásica de la
corriente de probabilidad de Dirac. Si la fórmula (5.299) fuera clásica, como los vectores velocidad
e impulso son paralelos resultarı́a que dL/dt = 0.
Mecánica cuántica Relativista 211

Lo anterior sugiere que debe existir algún otro operador, ligado al spin, tal que
sus autovalores distingan a estas soluciones con la misma energı́a. Ese operador
sumado al del momento orbital L deberı́a conmutar con el hamiltoniano. Es decir
que con la experiencia adquirida con la teorı́a de Pauli para el electrón no relativista
es natural adelantar tal operador debe estar asociado con un operador momento
angular total total J , al que deben contribuir el momento angular orbital y el spin.
En analogı́a con el caso no relativista, en que se tiene J = L + ℏ2 σ, es natural definir
en el caso relativista
ℏ
J =L+ Σ (5.300)
2
dado que Σ, como fue definida en la ec. (5.247) tiene la forma
!
σ 0
Σ= (5.301)
0 σ

tanto en la representación quiral como en la de Dirac, y es el operador asociado al

subgrupo de rotaciones del grupo de Lorentz que, para el caso de ángulos finitos
θ = (θ1 , θ2 , θ3 ), vimos que actúa sobre los espinores de 4 componentes en la forma
i
ψ → ψ ′ = e− 2 θ·Σ . (5.302)

Hemos propuesto entonces a Σ, que implementa las rotaciones espaciales sobre los
espinores, como el operador asociado al spin de la partı́cula de masa m. No es casual
que cada bloque de Σ corresponda al operador de spin de la teorı́a de Pauli.
Usando la ec. (5.244),
i
Σi = − ϵijk αj αk , (5.303)
2
calculemos el siguiente conmutador:
ℏ ℏ i
[ Σi , H] = [− ϵijk αj αk , cα · p + βmc2 ] (5.304)
2 2 2
i cℏ
= − ϵijk pl [αj αk , αl ] (5.305)
2 2
Luego de un poco de álgebra, se obtiene
" #
ℏ
Σ, H = −iℏcα × p (5.306)
2

que cancela exactamente la contribución del lado derecho de (5.299), y resulta

" #
ℏ
[J , H] = L + Σ, H = 0 (5.307)
2
212 5.16 Helicidad

Vemos entonces del resultado de la ec. (5.307), para el caso del Hamiltoniano de una
partı́cula libre, que J está asociado con una constante de movimiento del sistema y
es por ello natural relacionarlo con un operador de momento angular total. Contiene
al momento angular orbital L y, en cuanto a Σ, basta asociarlo al spin de la partı́cula
libre de masa m que aparece en la ecuación de Dirac para que todo sea consistente.
Los autovalores de Σ son ±1/2 (como lo son los de σ por lo que podemos
interpretar a las soluciones de la ecuación de Dirac como soluciones con spin 1/2.
Nótese que el hecho de que la ecuación de Dirac describa partı́culas de spin 1/2 es
una consecuencia de la estructura de la ecuación relativista y no una imposición
como la que hizo Pauli en el caso de la teorı́a no-relativista.
Vimos que en el lı́mite no relativista las soluciones con energı́a positiva coincidı́an
con las de la teorı́a de Pauli para proyección del spin ±1/2. Lo mismo sucede con las
de energı́a negativa. En el caso lı́mite de una partı́cula en reposo en que las cuatro
autofunciones lo son también de Σz , podemos afirmar que estas cuatro soluciones
linealmente independientes corresponden a energı́a positiva y spin ±1/2 y energı́a
negativa y spin ±1/2. (ver más adelante la discusión sobre helicidad).

5.16. Helicidad
Vimos que el spin de las partı́culas relativistas no se conserva separadamente del
momento angular orbital, en particular Σz no lo hace aún en el caso más simple de
una partı́cula libre. Por ello, la proyección del spin sobre un eje dado (al que lla-
maremos z por analogı́a con la direccion que suele elegirse en la mecánica cuántica
no-relativista) no servirá para caracterizar un estado dado. Sin embargo la proyec-
ción del spin en la dirección del movimiento sı́ se conserva, como veremos ahora.
Indicaremos a tal dirección a la direccion del movimiento como el vector unitario n,
p
n= (5.308)
|p|
donde p es el operador vectorial momento y el denominador indica que cuando se
aplique a una función de onda, el resultado (pψ) debe normalizarse con el autovalor
de manera de que n sea un versor. Partiendo de la proyección de Σ en la dirección
de n se tiene
!
ℏ ℏ p ℏ p
Σ·n= Σ· = Σ+r×p · = J · n. (5.309)
2 2 |p| 2 |p|
Luego, la cantidad
ℏ
h= Σ·n (5.310)
2
llamada helicidad es un operador que, a diferencia de Σz , sı́ conmuta con el hamil-
toniano ya que cada componente de J lo hace y, por lo tanto, se conserva.
Mecánica cuántica Relativista 213

Los estados de una partı́cula con valores de helicidad determinados se llaman

estados de helicidad. Fı́sicamente, la helicidad corresponde al spin de la partı́cula
proyectado sobre la dirección del movimiento.
Ahora bien, es facil probar que (Σ · n)2 = 1. En efecto, este producto escalar
puede escribirse como Σi Σj ni nj . Siendo que ni nj es simétrico, al producto solo
contribuirá la parte simétrica de Σi Σj . Recordando que para las matrices de Pauli
vale que
σi σj = δij I + iεijk σk , (5.311)
y que eso es lo que resulta en los bloques del producto Σi Σj el resultado es una
matriz cuya diagonal coincide con la de la identidad, diag (Σi Σj ) = δij . Luego los
autovalores de(Σ · n)2 = (δij ni nj )2 = 1 y por lo tanto los autovalores de Σ · n son
±1 y los de h son ±ℏ/2.
Como la helicidad conmuta con el hamiltoniano, pueden buscarse autofunciones
comunes a ambos operadores. Ya mostramos que las soluciones de partı́cula libre
(5.287),
−c σ·p
! !
φ Ep +mc2
φ
u+ = N c σ·p , u− = N , (5.312)
Ep +mc2
φ φ
por ejemplo, pueden ser clasificadas según su energı́a (positiva o negativa). Mostre-
mos que estas autofunciones lo son también de la helicidad, y que eso determina
a φ y su helicidad (positiva o negativa). Si aplicamos el operador helicidad a u+
obtenemos
σ · nφ
!
ℏ
hu+ = N c (σ·p) (5.313)
2 Ep +mc2 σ · n φ
de manera que si tomamos al espinor de dos componentes
!
u
φ= 1 (5.314)
u2

como autoestado de σ · n,
σ · n φ = ϵφ (5.315)
entonces automáticamente las soluciones de partı́cula libre son autoestados de heli-
cidad, con autovalor ϵℏ/2. Para hallarlas, conviene expresar al versor n en término
de variables angulares (φ, θ), con 0 ⩽ φ < 2π, 0 ⩽ θ ⩽ π,

n = (cos φ sin θ, sin φ sin θ, cos θ) (5.316)

con lo que la ec. (5,315) toma la forma

! ! !
cos θ exp(−iφ) sin θ u1 u
=ϵ 1 . (5.317)
exp(iφ) sin θ − cos θ u2 u2
214 5.17 Paridad

Los autovalores de esta ecuación se obtienen de la ecuación

!
cos θ − ϵ exp(−iφ) sin θ
det = 0, (5.318)
exp(iφ) sin θ − cos θ − ϵ
o,
ϵ2 − (cos2 θ + sin2 θ) = 0, (5.319)
por lo que se tiene
ϵ = ±1 (5.320)
En cuanto a los autovectores asociados, se encuentra
 
exp −i φ2 cos 2θ
φ+ =  
exp i φ2 sin 2θ
  (5.321)
− exp −i φ2 sin 2θ
φ− =  .
exp i φ2 cos 2θ

De este modo hemos clasificado a las cuatro soluciones de partı́cula libre de la

ecuación de Dirac, de acuerdo a su energı́a (positiva o negativa) y su helicidad,
±ℏ/2.

5.17. Paridad
Un cambio de paridad se define a partir de la transformación de coordenadas
r → −r, (5.322)
t → t. (5.323)
Es decir, la transformación de paridad corresponde a una reflexión espacial. Vimos
que esta transformación de las coordenadas espacio-temporales puede representarse
como uno de los elementos del grupo de Lorentz cuando actúa sobre el tetravector
posición
1 0 0 0
 
0 −1 0 0
ΛP =  ,

x′µ = Λµν xν . (5.324)
0 0 −1 0 


0 0 0 −1
No se trata de una transformación de las catalogadas como “propias” del grupo de
Lorentz pues det ΛP = −1.
Dada Λµν según (5,324), trataremos de asociarla con la matriz S, que ahora
llamamos P , según la cual transforman los espinores utilizando la fórmula (5.224)
Λµν γ ν = P −1 γ µ P (5.325)
Mecánica cuántica Relativista 215

de manera que se tiene, reemplazando en el lado izquierdo el valor explı́cito de Λµν

dado por la ec. (5.324), las siguientes ecuaciones

γ 0 = P −1 γ 0 P (5.326)
i −1 i
γ = −P γP (5.327)

P γ 0 = γ 0P (5.328)
i i
P γ = −γ P. (5.329)

Es decir que la matriz que representa una transformación de paridad para los espi-
nores debe conmutar con γ 0 y anticonmutar con las γ i . Basta entonces una relación
de proporcionalidad entre P y γ 0 para que esto se cumpla, segun vimos al estudiar
las propiedades de las matrices de Dirac

P = ηγ 0 (5.330)

con η por ahora una constante arbitraria.

Con esto, resulta que bajo paridad los espinores transforman según

ψ ′ (x′ ) = P ψ(x) = ηγ 0 ψ(x). (5.331)

Dos transformaciones de paridad (5.322) vuelven las coordenadas a su forma

original. Sin embargo, para que los espinores vuelvan a su forma original se necesita
aplicar cuatro veces el operador de paridad29
2
ψ ′′ (x′′ ) = P ψ ′ (x′ ) = P 2 ψ(x) = η 2 γ 0 ψ(x) = η 2 ψ(x) (5.332)

Esto debe dejar invariante a la función de onda a menos de un número complejo de

módulo 1. Por lo que se puede elegir

η = ±1, ±i. (5.333)

En caso de elegirse ±i ello corresponderı́a a una fase exp(−iπ) indetectable

cuando se trata de transformaciones de cantidades medibles, por lo que que el valor
de η sea imaginario o real no tiene interés fı́sico.
29
Esto es razonable, dado que frente a una rotación en 2π alrededor de un eje el espinor cambia
en un signo −1 y es necesario hacer dos rotaciones en 2π para que el espinor vuelva a su forma
original.
216 5.18 Ecuación de Weyl: partı́culas de masa cero

5.18. Ecuación de Weyl: partı́culas de masa cero

Originariamente la ecuación de Dirac para una partı́cula de masa m y spin 1/2 se
aplicó al estudio de la dinámica cuántica del electrón. Pero también puede aplicarse
al estudio de partı́culas de masa cero y spin 1/2. Hasta fines de la década de 1990
se pensaba que el neutrino, propuesto por Fermi para mantener la conservación de
energı́a-impulso en la desintegración beta, era una partı́cula de masa cero y spin
1/2. De hecho, en el modelo éstandar de las 3 interacciones fundamentales (fuerte,
electromagnéticas y débiles) se lo introducı́a via un lagrangiano de Dirac con masa
cero.
Hoy sabemos que el neutrino tiene una masa muy pequeña, pero no nula, del
orden de < 0,120eV/c2 = 2,1410−37 kg ) (Como comparación, la masa del electrón
es 511keV/c2 = 9, 1093829110−31 kg). En realidad el valor consignado para la masa
de los neutrinos corresponde a un promedio: los estados de los neutrinos están ca-
racterizados por un número cuántico adicional, llamado de “sabor” (flavor). Resulta
entonces que hay 3 estados de neutrinos, el asociado al electrón, al muón y al τ . Al
propagarse, los neutrinos oscilan cambiando entre estados de diferentes sabores. Lo
que se puede medir son diferencias de cuadrados de sus respectivas masas.
La ecuación de Dirac para partı́culas de masa cero que, hasta 1990, era utilizada
para estudiar al neutrino, es
∂ψ(r, t)
iℏγ µ =0 (5.334)
∂xµ
En la representación quiral,
! !
0 I2 0 σi
γ0 = , γi = (5.335)
I2 0 −σ i 0

y escribiendo !
χ+
ψ= (5.336)
χ−
la ecuaciones devienen

!
∂
iℏ 0 + iℏσ · ∇ χ− = 0, (5.337)
∂x
!
∂
iℏ 0 − iℏσ · ∇ χ+ = 0, (5.338)
∂x

que son las ecuaciones de Weyl. Observemos que en este caso de masa cero, son
ecuaciones desacopladas para las componentes χ±
Mecánica cuántica Relativista 217

5.19. Quiralidad
Las matrices S[Λ] en (5.260) resultaron ser diagonal por bloques porque elegimos
una representación especı́fica de las matrices γ (5.259). De hecho esta representa-
ción se llama quiral porque descompone explı́citamente al espinor de Dirac en la
forma (5.336). Podrı́amos preguntarnos qué ocurre si elegimos otra representación
del álgebra de Clifford, donde en general S[Λ] no va a ser diagonal por bloques.
¿Existe alguna forma invariante de definir espinores quirales? Después de todo, el
hecho de que si consideramos sólo boosts y rotaciones la representación de 4 compo-
nentes sea reducible no puede depender de la representación de las matrices γ que
elijamos.
Podemos hacer esto introduciendo la “quinta” matriz γ,

γ 5 = iγ 0 γ 1 γ 2 γ 3 , (5.339)

que satisface
{γ 5 , γ µ } = 0, y (γ 5 )2 = +1. (5.340)
Además, se verifica que
[Σµν , γ 5 ] = 0 (5.341)
lo que implica que ψ̄γ 5 ψ es un escalar frente a rotaciones y boosts. No es invarian-
te frente a transformaciones de paridad, por ello se dice que es un pseudoescalar.
Definimos entonces los operadores
1
P± = (1 ± γ 5 ) (5.342)
2
que satisfacen P+2 = P+ , P−2 = P− y P+ P− = 0, es decir, son proyectores. En la
representación quiral la matriz γ 5 es
!
5 −I 0
γ = , (5.343)
0 I

de donde hallamos que P± proyecta el espinor ψ en sus dos componentes de Weyl χ± .

Pero entonces para una representación arbitraria del álgebra de Clifford, podemos
usar γ 5 para definir los espinores quirales

ψ± = P± ψ (5.344)

que se transforman frente a rotaciones y boosts con una representación irreducible del
grupo de Lorentz. Estos dos espinores se intercambian mediante una transformación
de paridad (5.324), ψ → P ψ, donde P = γ 0 ,

ψ± → ψ∓ (5.345)
218 5.20 Una interpretación fı́sica de las matrices de Dirac

Observemos que si ψ(x, t) satisface la ecuación de Dirac, entonces el espinor trans-

formado por paridad, γ 0 ψ(−x, t) también la satisface. El signo menos extra que
aparece al conmutar γ 0 con γ i se compensa con el cambio de signo de la derivada,
que actúa sobre −x en lugar de x.

5.20. Una interpretación fı́sica de las matrices de

Dirac
Vimos que las componentes espaciales de la corriente de probabilidad que resulta
de la ecuación de Dirac tienen la forma
1
J = ψ̄γψ = ψ † γ 0 γψ = ψ † αψ (5.346)
c
o sea que
J (r, t) = ψ(r, t)† cαψ(r, t) (5.347)
y recordando que ψ(r, t)† ψ(r, t) era la densidad de probabilidad de encontrar a la
partı́cula en el punto r en el instante t
En cuanto a la corriente, la ecuación (5.347) suggerirı́a que cα juega el papel de
la velocidad clásica con que se mueve la partı́cula. Esta interpretación se ve reforzada
por el siguiente argumento: en el esquema de Heisenberg, la evolución temporal de
un operador A está regida por la ecuación
dA i
= [H, A] (5.348)
dt ℏ
con H el Hamiltoniano del sistema. Vimos que el hamiltoniano asociado con la
ecuación de Dirac esta dado por:

H = c(−iℏ)α · ∇ + γ 0 mc2 (5.349)

con lo que si tomamos A = r tendremos

dr
= c[α · ∇, r] = cα. (5.350)
dt
Por supuesto, esto debe interpretarse en el sentido de valores medios,
ˆ ˆ
d
dr ψ (r, t)rψ(r, t) = c dr ψ † (r, t)αψ(r, t)
†
(5.351)
dt
y confirma la relación entre las matrices α y la velocidad de la partı́cula.
Mecánica cuántica Relativista 219

2
Ahora bien, como (αi ) = 1, los autovalores de αi son ±1 y los autovalores de
cada componente de la “velocidad”, según la fórmula (5.350) serı́an ±c, en clara
contradicción con el hecho de que en la mecánica relativista una partı́cula masiva no
puede viajar a la velocidad de la luz. Además, dado que [αi , αj ] ̸= 0, de hacerse una
interpretación ingenua de la ecuación (5,350), se tendrı́a que no es posible medir las
tres componentes de la velocidad simultáneamente.
Volvamos a utilizar la ecuación de Heisenberg (5.348) pero ahora tomando A =
α1 = αx . Se tiene
dαx i 2 2i
= [H, αx ] = (cpx − αx H) = (Hαx − cpx ) . (5.352)
dt ℏ iℏ ℏ
Para escribir esta fórmula hemos utilizado que
Hαx = cp · ααx + βαx mc2 (5.353)
= cpx + cpy αy αx + cpz αz αx x + βαx mc2 (5.354)

= 2cpx − cαx px αx + py αy + pz αz − βmc2 (5.355)
de donde
Hαx = 2cpx − αx H (5.356)
y
[H, αx ] = 2 (cpx − αx H) (5.357)
Tanto H como px son independientes del tiempo por lo que, derivando otra vez
se tiene
d2 αx 2 dαx 2 dαx
2
= H=− H . (5.358)
dt iℏ dt iℏ dt
Aquı́ hemos usado la fórmula (5.356) y que d ⟨px ⟩ /dt = 0. Imponiendo una condición
inicial,
dαx
= αx0 (5.359)
dt t=0
se puede integrar (5.358) y se obtiene
dαx 2iHt 2iHt

= αx0 exp − = exp αx0 . (5.360)
dt ℏ ℏ
Luego, usando (5.352),
iℏ 0 2iHt

αx H = αx exp − + cpx . (5.361)
2 ℏ
Si multiplicamos por cH −1 = H/E 2 a derecha se tiene
dx iℏc 0 2iHt H H

= αx exp − 2
+ c2 p x 2 (5.362)
dt 2 ℏ E E
220 5.21 La ecuación de Dirac en presencia de un campo electromagnético

Vemos que la velocidad corresponde a un movimiento oscilatorio con frecuencia ω =

2E/ℏ, que como mı́nimo corresponde a ω = 2mc2 /ℏ. Este movimiento, bautizado
por Schrödinger [8] como Zitterbewegung (del alemán, zitter, tembloroso, trémulo
y bewegung, movimiento), no puede ser observado en la práctica. Hay una manera
alternativa de tratar al operador posición que evita este problema [9].

5.21. La ecuación de Dirac en presencia de un

campo electromagnético
Hasta aquı́ hemos considerado la ecuación de Dirac para una partı́cula de spin
1/2 libre, que cuando se incluye un término de masa describe adecuadamente la
dinámica de un electrón libre. Nos interesa por supuesto estudiar el caso en que
electrón cuántico interactúa con un campo electromagnético clásico (E, B).
Sabemos que los campos electromagnéticos pueden ligarse a los llamados “cam-
pos de gauge” ϕ, A según las relaciones
B =∇×A (5.363)
1 ∂A
E = −∇ϕ − (5.364)
c ∂t
Ya en el caso de la mecánica cuántica no relativista las reglas de cuantificación
canónica se expresaban en términos de los “campos de gauge” que incluyen al po-
tencial vector A y al escalar ϕ.
A estos cuatro campos se lo puede escribir en términos de un tetravector Aµ =
(ϕ, Ai ) , µ = 0, 1, 2, 3, i = 1, 2, 3, de manera que los campos eléctrico Ei y magnético
Bi pueden expresarse de forma compacta en términos del “tensor de campo” Fµν ,
∂Aν ∂Aµ
Fµν = µ
− = ∂µ Aν − ∂ν Aµ (5.365)
∂x ∂xν
tal que
1
B i = εijk Fjk , E i = F 0i (5.366)
2
Las reglas de cuantificación canónica que para una partı́cula libre no relativista
tomaban la forma
e
p→p− A
c (5.367)
E → E − eϕ
con e la carga eléctrica.
Las reglas de cuantificación (5.367) en presencia de campos electromagnéticos se
vuelven más compactas escritas en términos del tetravector Aµ :
∂ e
pµ = iℏ → pµ − Aµ . (5.368)
∂xµ c
Mecánica cuántica Relativista 221

Notemos que al definir el tetravector contravariante pµ , sus componentes espa-

ciales aparecen con el factor iℏ y no con el habitual ℏ/i con el que se escribe en el
caso no relativista la regla de cuantificación canónica. El cambio de signo implı́cito
se debe a que hemos adoptado una métrica negativa para las componentes espacio-
espacio de gµν por lo que hay un cambio de signo entre componentes contravariantes
y covariantes del (tri)vector impulso.
Partiendo entonces de la ecuación de Dirac para el caso de un electrón de masa
m, libre,
∂ψ
iℏγ µ µ − mcψ = (γµ pµ − mc) ψ = 0 (5.369)
∂x
y aplicando las reglas (5.368) la ecuación de Dirac en presencia de un campo elec-
tromagnético toma la forma
e

γµ p − Aµ − mc ψ = 0
µ
(5.370)
c
Para ver cómo se relaciona esta ecuación con la de Klein-Gordon para una
partı́cula
cargada
de masa m aplicamos a la ecuación anterior el operador diferencial
ν e ν
γν p − c A + mc y obtenemos

e e µ

γν γµ p − Aν pµ −
ν
A − m2 c2 ψ = 0 (5.371)
c c
e e µ

γν γµ pν − Aν pµ − 2 2
A − m c ψ = 0. (5.372)
c c
Podemos descomponer al producto γ ν γ µ en sus partes simétrica y antisimétrica,

γν γµ = gνµ − iσνµ (5.373)

donde hemos usado

1
gνµ = (γν γµ + γµ γν ) (5.374)
2
y definido
i
(γν γµ − γµ γν ) ≡ 2Σµν
σνµ = (5.375)
2
Aquı́ Σµν son los generadores de las transformaciones de Lorentz en el espacio espi-
norial. Con esto, y usando que para cualquier función f

pµ Aν f (x) = (−iℏ)∂µ Aν f (x) + Aν pµ f (x) (5.376)

se obtiene
e e eℏ

p − Aµ
µ
pµ − Aµ ψ − σ µν Fµν ψ − m2 c2 ψ = 0 (5.377)
c c 2c
222 5.22 El lı́mite no-relativista

El primero y tercer término de esta ecuación coinciden con la ecuación de Klein-

Gordon para una partı́cula de masa m y carga e, solo que, en lugar de corresponder
a una partı́cula escalar (compleja, como resulta natural para el caso de campos
escalares cargados30 ), el operador de Klein-Gordon actúa en este caso sobre un
espinor de 4 componentes. El segundo término, que es un efecto puramente cuántico
(pues se anula cuando ℏ → 0 ) es propio de la formulación de Dirac y veremos que
da cuenta de la interacción de los campos electromagnéticos con, en particular, el
spin. Su aparición se relaciona con el hecho de que la función de onda de Dirac es
un espinor de 4 componentes.
Para estudiar los estados estacionarios de la ecuación (5.377), proponemos fac-
torizar la dependencia temporal como habitualmente hacemos,
 1
ψ (r)

 2
i ψ (r) i

ψ(r, t) = exp − Et  3  ≡ exp − Et ψ(r). (5.378)
ℏ ψ (r) ℏ
ψ 4 (r)
Reemplazado este ansatz en (5.377) obtenemos
h i
(E − eϕ)2 − (cp − eA)2 + eℏc(Σ · B − iα · E) ψ(r) = m2 c4 ψ(r) (5.379)

con Σ la matriz de spin (ec. (5.301))

5.22. El lı́mite no-relativista

Para estudiar el lı́mite no-relativista de la ecuación de Dirac en un campo elec-
tromagnético nos quedaremos con el primer orden en v 2 /c2 en la ecuación (5.379)
Separaremos ahora la energı́a en reposo mc2 de la energı́a total E escribiendo
E = E ′ + mc2 (5.380)
con E ′ ≪ mc2 . También supondremos un campo ϕ débil, eϕ ≪ mc2 Con esto, el
primer término en (5.376), desarrollando el cuadrado y despreciando el término E ′2 ,
toma la forma
(E − eϕ)2 ≈ 2mc2 (E ′ − eϕ) + m2 c4 (5.381)
con lo que la ecuación (5.376) puede escribirse en este lı́mite,
2 !
1 e eℏ eℏ

p− A + eϕ − Σ·B+i α · E ψ = E ′ψ (5.382)
2m c 2mc 2mc
30
Solo si el campo escalar es complejo puede extenderse la invarianza de gauge del electromag-
netismo, Aµ → Aµ + ∂µ Λ de manera de incluir a los escalares, definiendo su ley de transformación
como ϕ → exp[(ie)/(ℏc)Λ]ϕ. Queda claro que la carga del campo escalar es e, la constante que
aparece en los términos de interacción Aµ ϕ y Aµ Aµ ϕ entre los campos Aµ y ϕ.
Mecánica cuántica Relativista 223

Al orden en que trabajamos, se puede despreciar el término proporcional al

campo eléctrico E. En efecto, vimos que |α|c ≈ |v| o sea que α ≈ v/c. Pero además
tenemos
ℏ
eϕ ≈ |eE|a ≈ e|E| (5.383)
p
donde hemos llamado a a una distancia cuántica tı́pica, ligada a p por la relación
de incerteza, a ∼ ℏ/p. O sea que se tiene,

eℏ α · E ℏ vEp v2
≈ = 2 (5.384)
2mc eϕ 2mc c E ℏ 2c
Entonces, en la aproximación no relativista tendremos
2 !
1 e eℏ

p− A + eϕ − Σ · B ψ = E ′ψ (5.385)
2m c 2mc

que no es otra cosa que la ecuación de Pauli para el electrón norelativista31 sólo que
el término que habı́a tenido que ajustarse de manera ad hoc en el caso no relativista,
por provenir de un análisis semiclásico, aquı́ aparece automáticamente. Si µs es el
momento magnético del electrón y µB = eℏ/(2mc) el magnetón de Bohr, se tiene la
relación
eℏ
µs = σ = µB σ (5.386)
2mc
Si aceptamos por el momento que, como en el caso de la ecuación para la partı́cula
libre las componentes se separan en grandes y pequeñas, tendremos para las grandes
exactamente la ecuación de Pauli, con una relación entre momento magnético y spin
dada por
µs e µB
= =2 (5.387)
s mc ℏ
que es el doble que la que resulta en el análisis clásico de la relación entre momento
angular orbital y momento magnético,
µl e µB
= = (5.388)
l 2mc ℏ
Pero justamente el factor 2 en (5.387) habı́a debido incluirse manu militari en la
formulación de Pauli del electrón no relativista para reproducir los resultados ex-
perimentales de la época. En otras palabras, debı́a postularse un factor llamado
giromagnético, que se denota como g, que multiplica la fórmula clásica (5.388),
µs µB
=g . (5.389)
s ℏ
31
Recordemos que en las soluciones de la ecuación de Dirac para una partı́cula libre las compo-
nentes de energı́a negativa eran del orden O(v 2 /c2 )
224 5.22 El lı́mite no-relativista

Se establecı́a entonces, para lograr acuerdo con la experiencia, que g = 2. La formu-

lación de Dirac, en cambio, no necesita postular g = 2 sino que tal valor resulta una
predicción. Esto fue considerado un triunfo importante de la formulación de Dirac.
Sin embargo, si buscamos hoy en una tabla de valores experimentales, obtenidos
con mucha mejor precisión que en los años 30, veremos que se consigna para el factor
giromagnético del electrón:

gexp = 2 × (1,001159652193 ± 0,000000000004). (5.390)

¿Quiere decir esto que la teorı́a de Dirac del electrón es incorrecta? La respuesta es
que en realidad, la teorı́a de Dirac es incompleta, en el sentido de que describe la
dinámica cuántica del electrón en el campo electromagnético clásico del núcleo (en
el caso de la descripción de un átomo).
Es recién cuando se hace un tratamiento completamente cuántico, tanto para el
electrón como para el campo electromagnético asociado al campo de gauge Aµ en
el que se mueve, que el valor predicho por la ecuación de Dirac recibe correcciones
(llamadas radiativas). En lo que se considera uno de los grandes triunfos de la elec-
trodinámica cuántica (la teorı́a cuántica de los campos electromagneticos asociados
al núcleo y el electrón) el valor teórico que se calcula en teorı́a de perturbaciones
resulta
gteor = 2 × (1,001159652459 ± 0,000000000123). (5.391)
Dejemos ahora a la ecuación de Klein-Gordon que es obedecida por las soluciones
de la ecuación de Dirac y analicemos directamente a esta última ab initio
e

γµ p − Aµ − mc ψ = 0
µ
(5.392)
c
Para estudiar la manera en que las componentes “grandes” (ψA ) y “pequeñas”
(ψB ) se separan, vamos a considerar una representación explı́cita para las matrices
γ µ . Conviene elegir la representación de Dirac que lleva a la ecuación (multiplicando
por γ 0 = β y recordando que γ = βα )

" ! ! # ! !
0 I I 0 ψA ψA
σ · (cp − eA) + mc2 = (E − eϕ) (5.393)
I 0 0 −I ψB ψB

Este sistema es equivalente al sistema acoplado para los espinores de dos com-
ponentes ψ A y ψ B

σ · (cp − eA)ψ B + mc2 ψ A = (E − eϕ)ψ A

(5.394)
σ · (cp − eA)ψ A − mc2 ψ B = (E − eϕ)ψ B
Despejamos de la segunda ecuación ψ B ,
Mecánica cuántica Relativista 225

−1
ψ B = E − eϕ + mc2 σ · (cp − eA)ψ A (5.395)
o, escribiendo nuevamente E = E ′ + mc2 ,
−1
ψ B = E ′ − eϕ + 2mc2 σ · (cp − eA)ψ A . (5.396)
Para simplificar los cálculos nos restringiremos al caso puramente eléctrico, A = 0,
y denotaremos eϕ = V ). El lı́mite no relativista corresponde a que

E ′ ≪ mc2 V ≪ mc2 p ≈ mv (5.397)

y por lo tanto,
cσ · p A v

B
ψ ≈ 2
ψ ∼O ψA. (5.398)
2mc c
Es decir que la solución de 4 componentes tiene dos grandes componentes ψ A y dos
pequeñas componentes ψ B como sucedı́a para la partı́cula libre. Notemos además
que, si bien ψ está normalizada, esto no implica que cada una de las componentes
ψA y ψB lo esté. En efecto, de la condición de normalización,

ψA† ψA + ψB† ψB = 1, (5.399)

insertando (5.398) se desprende, a orden (v/c)2 , que

!
p2
1+ ψA† ψA = 1, (5.400)
4m2 c2

con lo cual podemos introducir una componente grande con la normalización ade-
cuada, Ψ (spinor de dos componentes), en la forma
!
p2
ψA = 1 − Ψ. (5.401)
8m2 c2

Además, si reemplazamos la expresión exacta para ψ B dada por (5.396) en la

primera de las ecuaciones (5.394), tendremos, luego de un poco de arreglo,
 !−1 
1 E′ − V
 σ·p 1+ σ · p + V  ψA = E ′ψA (5.402)
2m 2mc2

Haremos a continuación una expansión en el lı́mite no relativista. Si guardamos sólo

el primer término en la expansión en potencias de (E ′ − V ) /2mc2 tendremos
!−1
E′ − V E′ − V
1+ ≈1− . (5.403)
2mc2 2mc2
226 5.22 El lı́mite no-relativista

Si insertamos (5.401), y utilizamos el resultado32

(σ · p)(σ · p) = p2 , (5.406)

obtenemos una ecuación para la componente grande:

E′ − V
" ! # !
p2 1 ′ p2
− σ·p σ·p+V −E 1− Ψ = 0. (5.407)
2m 2m 2mc2 8m2 c2

Para simplificar esta ecuación es conveniente multiplicarla a la izquierda por el

operador (1 − p2 /8m2 c2 ), y conservar términos a orden (v/c)2
" #
p2 p4 1 V p2 p2

+V − + σ · p σ · p − V − V Ψ = E ′Ψ
2m 8m3 c2 2m 2mc2 8m2 c2 8m2 c2
(5.408)
Para simplificarla aún más, recordemos el conmutador

[pi , V (x)] = −iℏ ∂i V, (5.409)

que permite calcular

p2 V = pi pi V = pi V pi + pi (−iℏ)∂i V = V p2 − 2iℏ ∇V · p − ℏ2 ∇2 V

(σ · p)V (σ · p) = σi σj pi V pj = δij pi V pj + iεijk σk pi V pj

= V pi pi − iℏ ∂i V pi + iεijk σk V pi pj + +iεijk σk (−iℏ)∂i V pj
= V p2 − iℏ ∂i V pi + ℏεijk σk ∂i V pj
= V p2 − iℏ∇V · p + ℏσ · (∇V × p)

Observamos que el término V p2 se cancela, al igual que el término −iℏ∇V · p. Si

además consideramos un potencial central, V (r) = V (r), entonces,

dV (r) dV (r) r
∇V = ∇r = (5.410)
dr dr r
32
De la relación entre matrices de Pauli

σi σj = δij + iεijk σk , (5.404)

obtenemos
(σ · p)(σ · p) = σi σj pi pj = δij pi pj + iεijk σk pi pj = p2 . (5.405)
El segundo término se anula por ser contracción de un tensor simétrico y uno antisimétrico.
Mecánica cuántica Relativista 227

y para el tercer término obtenemos

1 dV (r)
ℏσ · (∇V × p) = 2 S·L
r dr
donde S = (ℏ/2)σ. La ecuación finalmente resulta
" #
p2 p4 1 1 dV (r) ℏ2
+V − 3 2
+ 2 2
S · L + 2 2
∇2 V Ψ = E ′ Ψ (5.411)
2m 8m c 2m c r dr 8m c

Por ejemplo, para el potencial Coulombiano,

Ze2
V (r) = −
4πr
tenemos que (V = eϕ, E = −∇ϕ)

∇2 V = −e∇ · E = −eρn = Ze2 δ (3) (r).

donde ρn es la densidad de carga del nucleo, ρn −Ze. Esta “ecuación de Schrödinger”,

derivada de la ecuación de Dirac, concuerda bien con la que usamos para compren-
der la estructura fina del átomo de hidrógeno. Los primeros dos términos son los
términos de energı́a cinética y potencial del hamiltoniano usual. El tercer término
es la corrección relativista de la energı́a cinética. El cuarto término es la interacción
espı́n-órbita correcta, incluido el efecto de precesión de Thomas con el adecuado fac-
tor 1/2. El quinto término es el llamado término de Darwin, que da una corrección
adicional para los estados s que experimentalmente resulta ser correcta33 .
Si bien no trataremos de resolver esta ecuación, conviene señalar la manera per-
turbativa de hacerlo: se resuleve la ecuación no relativista en presencia del potencial,
sin incluir al término en p4 ni a los términos que contienen derivadas de V. Obtenidas
las dos componentes de ψ A para este problema, se forman combinaciones lineales
que sean autofunción de J 2 , Jz , L2 , s2 y luego se considera a los tres términos no
incluidos como perturbaciones.

5.23. Invarianza de gauge

La ecuación de Dirac (5.369) para un electrón en un campo electromagnético
asociado a un campo de gauge Aµ = (ϕ, A),
e

µ
γ iℏ∂µ − Aµ − mc ψ = 0 (5.412)
c
33
Nótese que este término sólo impacta en las funciones de onda que que son finitas en el origen,
tı́picamente las que tienen l = 0.
228 5.23 Invarianza de gauge

tiene una invarianza muy importante, llamada de gauge, asociada con las transfor-
maciones de gauge que dejan invariante al tensor de campo electromagnético. En
efecto, recordemos que
Fµν = ∂µ Aν − ∂ν Aµ (5.413)
permanece invariante ante el cambio del campo de gauge Aµ

Aµ (x) → Aµ (x)′ = Aµ (x) + ∂µ Λ(x) (5.414)

con Λ(x) una función real arbitraria. Que Fµν permanezca invariante frente a las
transformaciones de gauge (5.414) quiere decir que ni la medida experimental del
campo eléctrico ni la del magnético, que son las cantidades fı́sicas justamente medi-
bles detectan si trabajamos con Aµ o con A′µ : Recordemos que
1
B i [A] = εijk Fjk [A] (5.415)
2
i
E [ϕ, A] = F 0i [ϕ, A] (5.416)

La invarianza de estos campos frente a transformaciones de gauge como la (5.414)

significa entonces que

B [A′ ] = B[A], E [ϕ′ ; A′ ] = E[ϕ; A] (5.417)

donde
B =∇×A
1 ∂A (5.418)
E = −∇ϕ − .
c ∂t
Esta invarianza implica que los campos Aµ y sus transformados de gauge son
todos admisibles para describir a los campos eléctrico y magnético. Por ello, según
el problema que enfrentemos podemos trabajar usando “un dado gauge” u otro. Por
ejemplo podemos elegir una función Λ tal que anule la componente A0 simplemente
utilizando un Λ tal que ∂0 Λ cancele ese A0 . Ese gauge se conoce como “gauge de
Coulomb”. En otras circunstancias puede convenir elegir Λ tal que ∂ µ Λµ = 0 (gauge
de Lorenz34 ).
Ahora bien, podrı́a suceder que al interactuar estos campos con un electrón
descripto por una función de onda que obedece la ecuación de Dirac, la función de
onda detectara de una manera medible el cambio. Veremos que en general este no
es el caso35 .
Para analizar lo anterior, comencemos por notar que al cambiar Aµ por A′µ en
la ecuación de Dirac, se agrega un término, el gradiente de ψ. Si la transformación
34
Este Lorenz no es el Lorentz de las transformaciones relativistas sino Ludvig Lorenz, un fı́sico
y matemático danés.
35
Véase el experimento de Aharanov-Bohm para una descripción más precisa de este asunto
Mecánica cuántica Relativista 229

(5.414) va acompañada de un cambio adecuado en la fase de la función de onda ψ,

la ecuación retoma su forma inicial.
Consideremos entonces el conjunto de transformaciones de gauge

Aµ (x) → Aµ (x)′ = Aµ (x) + ∂µ Λ(x),

e

′
ψ(x) → ψ (x) = exp −i Λ(x) ψ(x), (5.419)
ℏc
e

′
ψ̄(x) → ψ̄ (x) = ψ̄(x) exp i Λ(x) .
ℏc
Ante este cambio, la ecuación (5.412) tiene la misma forma cuando es escrita en
términos de los campos transformados según (5.419) que cuando lo es en términos
de los campos sin transformar. Es decir, la ecuación de Dirac es invariante frente a
las transformaciones de gauge completas (5.419) que incluyen al campo de gauge y
a la función de onda ψ̄ que describe a la materia.
e e

γ µ iℏ∂µ − Aµ + mc ψ = 0 → γ µ iℏ∂µ − A′µ + mc ψ ′ = 0 (5.420)
c c

Notemos que en la ec. (5.419) hemos incluido la ley de transformación de ψ̄ que

por un lado no aparece en la ecuación de Dirac y, por el otro, podrı́a “deducirse” a
partir de la fórmula que relaciona ψ̄ con ψ, ψ̄ = ψ † γ 0 . Sucede que cuando se trata a ψ
como un campo cuántico en pie de igualdad con Aµ (es decir, se entra en el dominio de
una de las llamadas “teorı́as de campos cuánticos”, en este caso la electrodinámica
cuántica) resulta que ψ̄ debe tomarse como un campo “independiente” de ψ. De
hecho, esto puede verse ya a nivel de mecánica cuántica, si pretendemos escribir
una acción de la cual derive la ecuación de Dirac como ecuación de Euler Lagrange.
De manera parecida a lo que sucede con el mismo problema para la ecuación de
Schrödinger, es natural tomar como acción (junto con su Lagrangiano)
ˆ ˆ
e

4 4 µ
S = d xL = d xψ̄(x) γ iℏ∂µ − Aµ (x) + mc ψ(x) (5.421)
c

Tomando a ψ̄ y ψ como variables independientes, se tiene como ecuación de Euler-

Lagrange para ψ :
!
∂L ∂L e

∂µ ) − =⇒ γ µ iℏ∂µ − Aµ (x) + mc ψ(x) = 0. (5.422)
∂(∂µ ψ̄ δ ψ̄ c

Puede verse que no solo la acción (5.421) sino el Lagrangiano, su integrando, es inva-
riante frente a las transformaciones de gauge (5.419). Es válido entonces recurrir al
teorema de Noether que establece que, como pasa con toda invarianza de un Lagran-
giano, existe una carga conservada asociada a esa invarianza. Para encontrarla, en
230 5.23 Invarianza de gauge

el caso de la invarianza de gauge comenzamos por construir la corriente conservada

(en el sentido de que su tetradivergencia es nula) asociada a esta invarianza. Para
ello, según el método de Noether, consideramos un cambio infinitesimal del campo
de materia ψ
ie
δψ = ψϵ(x). (5.423)
ℏc
Aquı́ ϵ(x) es un parámetro infinitesimal. La corriente de materia asociada a la inva-
rianza viene dada, de acuerdo al teorema de Noether por

δL e
jµ (x)ϵ(x) = δψ = − ψ̄γ µ ψϵ(x) (5.424)
δ∂µ ψ c

¡Es decir que la corriente conservada de Noether asociada con la invarianza de gauge
coincide, a menos de un factor constante, con la corriente de probabilidad cuya
componente temporal da la densidad de probabilidad! Para ello basta reescribir a la
corriente jµ como
e
jµ (x) = − Jµ (x) (5.425)
c
con
Jµ (x) = ψ̄(x)γ µ ψ(x), ∂µ J µ (x) = 0. (5.426)
´
Luego, la carga conservada, la integral de J0 sobre todo el espacio, Q = dr ψ ∗ ψ,
no es otra cosa que la expresión de que la probabilidad de encontrar a la partı́cula
descripta por la ecuación de Schrödinger es 1.
Volviendo a la transformación de gauge (5,414) con parámetro real arbitrario
Λ(x),
Aµ (x) → A′µ = Aµ (x) + ∂µ Λ(x) (5.427)
podrı́amos escribirla en una forma en apariencia más complicada,
1
Aµ (x) → A′µ = Aµ (x) + g −1 (x)∂µ g(x) (5.428)
i
con
g(x) = exp(iΛ(x)) (5.429)
En esta forma, g(x) puede ser identificado como uno de los elementos del grupo
unitario U(1) formado por los complejos de módulo 1. Esto podrı́a pensarse que es un
detalle irrelevante para las transformaciones de gauge del electromagnetismo. Pero
no es ası́: La teorı́a de las interacciones electrodébiles, que unifican a los fenómenos
electromagnéticos con los débiles está basado en la extensión de las invarianzas de
la teorı́a agregando otro grupo unitario con determinante 1 , el identificado como
SU(2) cuya representación fundamental es el de matrices de 2×2 (por ejemplo, dada
por las 3 matrices de Pauli). Y para describir las interacciones fuertes, también se
Mecánica cuántica Relativista 231

utiliza un grupo unitario, el grupo SU(3) cuya representación fundamental es de 8

matrices de 3 × 3 conocidas como matrices de Gell-Mann.
Para el caso general del grupo de Lie SU(N ), la transformación de los campos
de gauge (5.430) se complica:
1
A′µ = g −1 Aµ (x)g + g −1 (x)∂µ g(x) (5.430)
i
Hay que notar que en el primer término a la derecha solo se puede simplificar el g −1
con el g para el caso U (1), un grupo abeliano en el que el que Λ es una función real
de x y lo mismo sucede con las componentes de Aµ . En el caso en que N ̸= 1 el
grupo es no abeliano en el sentido de que Λ y Aµ toma valores en el algebra de Lie
del grupo, que se suele anotar como su(N ) y es un álgebra no conmutativa.
El Lagrangiano del Modelo Estándar es el de una teorı́a de gauge con grupo
g ∈ SU(3)SU(2) × U(1).

5.24. Átomos hidrogenoides

Uno de los problemas en los que se puede poner a prueba a la ecuación de
Dirac es en el de la estructura fina de los espectros atómicos. En este asunto, la
mecánica cuántica no-relativista habı́a tenido sus primeros y más resonantes éxitos.
Ya en ese caso habı́a sido notable el haber podido encontrar una solución exacta
de la ecuación de ondas para el electrón en un campo coulombiano. Veremos que lo
mismo sucede en el caso de la ecuación relativista de Dirac para el electrón en un
potencial de Coulomb. Y que los resultados dan una descripción excelente, superior
al de la mecánica cuántica no relativista, de los datos experimentales para átomos
hidrogenoides.
Comencemos por hacer, a vuelo de pájaro, una enumeración de los resultados de
la mecánica cuántica no relativista para átomos hidrogenoides. Para ello recordemos
que la ecuación de Schrödinger para los estados estacionarios de un electrón de masa
me y carga e en el campo eléctrico Coulombiano producido por un núcleo de número
atómico Z toma la forma
!
ℏ2 2 Ze2
∇ + + ϵn ψn,l,m = 0 (5.431)
2µ 4πr

con el Laplaciano escrito como

∂2 2 ∂ 1
∇2 = 2
+ − 2 2 L2 (5.432)
∂r r ∂r ℏ r
L2 ψn,l,m = ℏ2 l(l + 1)ψn,l,m . (5.433)
232 5.24 Átomos hidrogenoides

En (5.431) m es la masa reducida,

1 1 1 1
= + ≈ (5.434)
µ me mN me
con mN la masa del núcleo. La constante fundamental que aparece en la teorı́a es
la constante de estructura fina α
e2 1
α= = (5.435)
4πℏc 137,037
en la que debe notarse que en la ecuación de Schrödinger en un potencial coulom-
biano las dos constantes fundamentales ℏ y c solo aparecen combinadas en α.
Los niveles de energı́a corresponden a la fórmula de Balmer

m(Zα)2
ϵn = − (5.436)
2n2
con
mα2
= 13,6eV (5.437)
2
y
n ⩾ 1, l = 0, 1, 2, . . . n − 1, −l ⩽ m ⩽ l. (5.438)
La degeneración d(n) del estado n es
n−1
(2l + 1) = n2
X
d(n) = (5.439)
l=0

Veremos que, con el tratamiento relativista, esta degeneración decrece y aparece una
estructura fina en el espectro, no prevista por el tratamiento no-relativista.
Pasemos ahora al estudio detallado del mismo problema pero utilizando la ecua-
ción relativista de Dirac. Como se trata del potencial Coulombiano en átomos hi-
drogenoides (con un número de protones Z ) tendremos
Ze
A0 = − (5.440)
4πr
y, como no hay campo magnético, pondremos nuevamente A = 0.
En lo que sigue conviene utilizar la representación de Weyl (quiral) de las matrices
de Dirac, ! !
0 0 I 0 σ
γ =− γ= (5.441)
I 0 −σ 0
En lugar de estudiar directamente la ecuación de Dirac, escribiremos la que
resulta de aplicar a esa ecuación el operador de Dirac (con el signo relativo entre
Mecánica cuántica Relativista 233

derivada y masa opuesto al de la ecuación original) a la misma. Vimos que de esta

manera se obtiene una ecuación de segundo orden que en el caso libre coincidı́a con
la de Klein-Gordon actuando sobre una función espinorial de 4 componentes.
Las soluciones de la ecuación resultante con derivadas de segundo orden son por
supuesto soluciones de la de Dirac de primer orden. La idea del camino que estamos
siguiendo es que, trabajando con una ecuación de segundo orden, nos será más fácil
utilizar como guı́a lo aprendido al estudiar al átomo de Hidrógeno con la ecuación
de Schrödinger.
Consideraremos la aproximación en que la masa reducida del sistema se toma
igual a la del electrón. Por simplicidad trabajaremos con unidades tales que ℏ = c = 1
y al final de los cálculos recuperaremos estas constantes usando el hecho de que la
constante de estructura fina cuando ℏ y c aparecen en su valor del sistema métrico
con su verdadero valor que es α = e2 /(4πℏc), ec. (5.435). La ecuación de segundo
orden que resulta de lo descripto más arriba es:
2 h i
µ 0
iγ ∂µ − eγ A0 2
−m ψ = (i∂µ − eA0 δµ0 )2 − eσ 0i F0i − m2 ψ = 0 (5.442)

con
!
σi 0
σ 0i = i . (5.443)
0 −σ i

Con esto, el término ligado al spin que aparece en la ecuación (5.442) puede escribirse
según sea el signo con que aparecen las matrices de Pauli de 2 × 2 σ i en la matriz
σ 0i de 4 × 4,
e σ·r
− σ 0i F0i = ±iZα 3 (5.444)
2 r
(téngase en cuenta que para escribir el vector contravariante r a partir de la deri-
vada covariante ∂i hay que incluir un signo − debido a la signatura elegida para la
métrica.)
En la ec. (5.444) debe tomarse el signo + cuando se trate de la componente χ+ y
el signo − cuando se trate de la componente χ− en que descomponemos al espinor
de 4 componentes. Las componentes χ± son cada una un espinor de Weyl de 2
componentes,
!
χ+
ψ= (5.445)
χ−

Tenemos entonces un par de ecuaciones que son el análogo de la ecuación de

Schrödinger para el átomo de Hidrógeno, para estados estacionarios, pero para el
caso relativista,
234 5.24 Átomos hidrogenoides

Ecuación de segundo orden que deriva de la de Dirac

(para estados estacionarios)
" #
∂2 2 ∂ L2 Z 2 α 2 Zα 2Zαϵ 2
− 2− + 2 − 2 ± i 2 σ · r̂ − − E − m2 χ± = 0 (5.446)
∂r r ∂r r r r r
donde E = mc2 − ϵ (aquı́ ϵ corresponde a la energı́a del electrón en los estados
ligados).
Los tres primeros términos del lado izquierdo corresponden al Laplaciano en
coordenadas esféricas. En cuanto al potencial coulombiano, cuya traza podemos
seguir a través de Z, aparece en los tres términos siguientes, en particular aquel
multiplicado por la energı́a ϵ. Finalmente, hay un término con el cuadrado de la
energı́a y el m2 que corresponde a la energı́a en reposo (recordar que transitoriamente
hemos puesto c = 1).
Si no fuera por el término que contiene al operador de spin (i.e., a las matrices
de Pauli), esta ecuación es exactamente la que resultarı́a de plantear la ecuación de
Klein-Gordon para una partı́cula cargada en un campo Coulombiano:

Ecuación de Klein-Gordon (sin spin)

!
∂2 2 ∂ L2 Z 2 α2 2Zαϵ 2
− 2− + 2 − 2 − − ϵ − m2 ϕ = 0 (5.447)
∂r r ∂r r r r
que puede compararse con la que resulta en el caso no-relativista (ecuación de
Schrödinger (5.431))

Ecuación de Schrödinger
!
∂2 2 ∂ L2 2mZα
− 2− + 2 − − 2mϵ ψ = 0 (5.448)
∂r r ∂r r r
Ahora bien, si comparamos las ecuaciones de Klein-Gordon y la de Schrödinger,
vemos que formalmente son idénticas si se hacen las siguientes sustituciones en la
de Schrödinger:
en el término que contiene L2
L2 → L′2 = L2 − Z 2 α2 (5.449)

en el que contiene a α
ϵ
α → α′ = α (5.450)
m
-
Mecánica cuántica Relativista 235

en el que contiene a la energı́a ϵ

ϵ2 − m2
′
ϵ→ϵ = (5.451)
2m
Si “traducimos” las relaciones anteriores al caso de los autovalores del momento
angular orbital tendremos
l(l + 1) → l(l + 1) − Z 2 α2 ≡ l′ (l′ + 1)
ϵ
α → α = α′
m . (5.452)
2 2
ϵ −m
ϵ→ = ϵ′
2m
Con esto vemos que al pasar de la ecuación de Schrödinger a la de Klein-Gordon, los
autovalores del momento angular orbital se corren en una cantidad que llamaremos δl
y que se puede calcular a partir de las soluciones de la ecuación cuadrática asociada
a la primera lı́nea de la ecuación (5.452) que era
l(l + 1) → l(l + 1) − Z 2 α2 ≡ l′ (l′ + 1) (5.453)
l → l ′ = l − δl (5.454)
s
2
1 1

δl = l + − l+ − Z 2 α2 (5.455)
2 2
Por los mismos motivos, el número cuántico principal n se corre en la misma
cantidad. En efecto, recordemos que en el caso de la ecuación de Schrödinger, para
que la función de onda tuviera el comportamiento adecuado en el infinito su parte
radial debı́a ser un polinomio ( y no una serie de infinitos términos). De aquı́ resulta
que cierto parámetro n′ ligado a l debı́a ser un entero, n′ = n − (l + 1). Luego, al
cambiar l → l′ tiene que cambiarse n → n′
Usando las relaciones (5.453) vemos entonces que podemos leer la fórmula para
los niveles de energı́a de Klein-Gordon para una partı́cula de masa m y carga e en un
campo coulombiano, a partir de la fórmula de Balmer en término de los parámetros
primados:
2
Enl − m2 m (Zα′ )2
=− (5.456)
2m 2n′2
2 2
Enl − m mZ 2 α2 Enl
2
1
=− (5.457)
2m 2 m (n − δl )2
2

de donde, finalmente, se tiene

m
Enl = r . (5.458)
2
1+ Z 2 α2 / (n − δl )
236 5.25 Potenciales esféricamente simétricos

Esta expresión se puede desarrollar en potencias de α2 , obteniéndose (recuperando

las constantes ℏ y c )
mZ 2 α2 mZ 4 α4 3 mZ 4 α4
Enl = mc2 − 2
− 3
+ 4
+ O(α6 ) (5.459)
2n n (2l + 1) 8 n
El primer término corresponde a la energı́a en reposo, el segundo término corres-
ponde a la energı́a de ligadura no relativista; el tercero, al depender de l, rompe la
degeneración O(4) presente en el caso no-relativista.
No discutiremos las patologı́as que esconde la fórmula para la energı́a que resulta
de la ecuación de Klein-Gordon. Por ejemplo, la catástrofe que ocurre para Z >
137/2, cuando δl , y por ello la energı́a, se vuelven complejas. O la singularidad en el
origen que genera en la función de onda el potencial atractivo − (Z 2 α2 /r2 ). Tampoco
nos extenderemos sobre el pobre acuerdo con los resultados experimentales que tiene
la fórmula (5.459). Simplemente concluiremos que los efectos del spin, que no son
tenidos en cuenta por la ecuación de Klein-Gordon, tienen que ser importantes por lo
que los cálculos en base a la ecuación de Dirac no deberı́an presentar estos problemas.
En lo que sigue veremos como hacer contacto entre estos resultados de la ecuación
de Klein-Gordon para espinores de 4 componentes con los de la ecuación de Dirac.

5.25. Potenciales esféricamente simétricos

Consideremos la ecuación relativista para partı́culas de spin 1/2 en un potencial
central, de la forma V (r) = V (|r|). Tendremos
eA0 = V (r), A = 0, (5.460)
Es conveniente escribir la ecuación de Dirac en el lenguaje de las matrices α y β, y
si buscamos soluciones estacionarias, de la forma, Ψ(r, t) = ψ(r)e−iEt/ℏ , tenemos la
ecuaciónen la forma HΨ = EΨ, donde el Hamiltoniano de Dirac es
H = cα · p − βmc2 + V (r). (5.461)
Este Hamiltoniano es invariante frente a rotaciones y reflexión espacial,
[H, J ] = [H, P ] = 0, (5.462)
de manera que buscaremos autofunciones de momento angular y paridad bien defi-
nidos.
Para separar la parte radial de la angular el término de momento α · p, conviente
introducir el momento radial
!
1 ∂ ∂ 1
pr = −iℏ r = −iℏ + . (5.463)
r ∂r ∂r r
Mecánica cuántica Relativista 237

Para escribir al Hamiltoniano de Dirac en términos de pr , hagamos lo siguiente:

dado que las matrices α satisfacen el álgebra de SU(2), al igual que las σ,

[αi , αj ] = 2iϵijk αk (5.464)

y el álgebra de Clifford,
{αi , αj } = 2δij , (5.465)
verifican la relación
αi αj = δij + 2iϵijk αk . (5.466)
De aquı́ se sigue que para dos vectores arbitrarios a y b se cumple que

(α · a)(α · b) = a · b + iα · (a × b) (5.467)

y por lo tanto, vale para r y p:

(α · r)(α · p) = r · p = iα · (r × p)
(5.468)
= r · p + iα · L.

Si multiplicamos a izquierda por (α · r) entonces obtenemos

1
α·p= (α · r)[r · p + iα · L] (5.469)
r2
1 i
= 2
(α · r)(r · p) + 2 (α · r)(α · L) (5.470)
r r
1 i
= 2
(α · r)(r · p) + 2 [r · L + iα(r × L)] (5.471)
r r
1 i
= 2
(α · r)(r · p) + 2 [iα · (r × L)] (5.472)
r r
1 2S · L
= 2
(α · r)pr + i(ℏ + ) (5.473)
r ℏ
donde usamos que r · ∇ = r∂/∂r. Además

(r × L)i = [r × (r × p)]i = rj ri pj − r2 pi . (5.474)

5.26. Potencial coulombiano

Pudimos conectar los niveles de energı́a de átomos hidrogenoides según resultan
de la ecuación de Schrödinger con los que se obtienen para la ecuación de Klein-
Gordon en el mismo potencial coulombiano. Podemos hacer lo mismo en el caso de
la ecuación de Dirac. Para comenzar, notemos que el momento angular total J ,

J = L + S, (5.475)
238 5.26 Potencial coulombiano

donde el operador de spin está representado por

ℏ
S= Σ, (5.476)
2
conmuta con el hamiltoniano,
[H, J ] = 0. (5.477)
Conviene entonces trabajar en los subespacios con de estados |jml⟩,

J 2 |jml⟩ = j(j + 1) |jml⟩ , j = 1/2, 3/2, . . . , (5.478)

Es decir, calcular ⟨jml|H|jml⟩. Ahora bien, dado que estos autoestados tienen una
paridad definida, ligada a l36 , tendremos que los elementos de matriz del operador
hermı́tico σ · r̂ (de paridad impar) se anulan entre estados con el mismo l,

⟨jml± |σ · r̂|jml± ⟩ = 0 (5.482)

Además, se tiene que (σ · r̂)2 = 1. Usaremos la clausura de la base de estados

elegidos X
|jml± ⟩ ⟨jml± | = 1 (5.483)
±

para insertarla en

1 = (σ · r̂)2 =
X
σ · r̂ |jml± ⟩ ⟨jml± | σ · r̂. (5.484)
±

Ahora bien, partiendo de la normalización 1 = ⟨l− | l− ⟩y usando lo anterior se tiene

D E
1 = ⟨l− | l− ⟩ = l− (σ · r̂)2 l− = ⟨l− |σ · r̂|l+ ⟩ ⟨l+ |σ · r̂|l− ⟩ = ⟨l+ |σ · r̂|l− ⟩2
(5.485)
donde hemos usado la ec. (5.482),

⟨jml± |σ · r̂|jml± ⟩ = 0 (5.486)

para cancelar los brackets entre estados + + y − −y, además, que las matrices de
Pauli son, por supuesto, hermı́ticas.
36
La parte angular de los kets, proyectados en la representación de coordenadas son armónicos
esféricos que, ante un cambio de paridad r → −r, que corresponde en coordenadas esféricas a
(r, θ, φ) → (r, π − θ, φ + π), satisfacen que Ylm (θ, φ) = (−1)l Ylm (π − θ, φ + π).
Mecánica cuántica Relativista 239

De la ecuación (5.485) se tiene finalmente

⟨l+ |σ · r̂|l− ⟩ = 1 (5.487)

Dada la ecuación (5.446), para los estados estacionarios de la ecuación de segundo

orden que deriva de la de Dirac usando el “truco” (a + b)(a − b)
!
∂2 2 ∂ L2 Z 2 α 2 Zα 2Zαϵ 2
− 2− + 2 − 2 ± i 2 σ · r̂ − − E − m2 ψ ± = 0. (5.488)
∂r r ∂r r r r r

Los brackets del tercero, cuarto y quinto término puede escribirse ası́:
D E
jml± | L2 − Z 2 α2 ∓ iZασ · r̂ |jml± =
 
1 3
j+ 2
j+ 2
− Z 2 α2 ∓iZα

1

1
. (5.489)
∓iZα j− 2
j+ 2
− Z 2 α2

Calculemos los autovalores Λ de esta matriz. Si escribimos a Λ en la forma habitual

de los autovalores de momento angular, Λ = λ(λ + 1), se obtiene
1

λ= j± − δj (5.490)
2
con δj dado por
s
2
1 1 Z 2 α2

δj = j + − j+ − Z 2 α2 ≈ + O Z 4 α4 (5.491)
2 2 2j + 1
Como en el caso de Klein-Gordon, el rol de l en el caso no relativista es aquı́
jugado por λ, que está corrido en δj . Para que el parámetro n′ que hacı́a, al tomar
valores enteros, que se cortara la serie infinita de la parte radial de la función de
onda en el caso no-relativista siga siendo un entero, (n′ = n + (l + 1)), como l está
corrido en δj , ası́ deberá estarlo n :

n′ = (n − δj ) − λ − 1 (5.492)

Como n′ ⩾ 0, se tendrá que

3
j ⩽n− 2
si λ = j + 12 − δj
1 (5.493)
j ⩽n− 2
si λ = j − 21 − δj

Podemos ahora seguir exactamente el camino que en el caso de Klein-Gordon, nos

llevó a la fórmula para la energı́a de los niveles de los átomos hidrogenoides. Es decir,
el mismo corrimiento (5.452) que nos permitı́a pasar de la ecuación de Schrödinger
240 5.26 Potencial coulombiano

a la de Klein-Gordon sirve ahora para pasar a la de Dirac siempre que utilicemos la

fórmula (5.491) para δj , pues en ella está tenido en cuenta el término de spin adicional
en Dirac. Entonces, tomando la fórmula de Balmer y haciendo los reemplazos
n → n − δj (5.494)
ϵ
α→α (5.495)
m
ϵ − m2
2
ϵ→ (5.496)
2m
que permitieron escribir la fórmula para los niveles de energı́a a partir de la modifi-
cación de la fórmula de Balmer, tendremos ahora
mc2
En,j = r (5.497)
2
1+ Z 2 α2 / (n − δj )

que formalmente coincide con la fórmula (5.458) para el caso de Klein-Gordon, pero
con δj dado en este caso por (5.491)
s
2
1 1

δj = j + − j+ − Z 2 α2 . (5.498)
2 2
Vemos que la energı́a no depende de l de manera que en principio habrá una
degeneración de los niveles. Para cada valor de j hay dos valores posibles de l, l =
j ± 1/2 excepto en el caso en que j = n − 1/2 en que l = n − 1 (la otra posibilidad
llevarı́a a n = l siendo que l ⩽ n − 1. Salvo para este caso habrá entonces una
degeneración doble de los niveles.
Desarrollando en potencias de α2 tendremos
mc2 Z 2 α2 mc2 Z 4 α4 3 mc2 Z 4 α4
En,j ≈ mc2 − − + + ... (5.499)
2n2 n3 (2j + 1) 8 n4
con n = 1, 2 . . . y j = 1/2, 3/2, . . . , n − 1/2.
Vemos entonces que, para un dado n, diferentes valores de j implican diferentes
valores de la energı́a de los niveles. Esto produce la llamada estructura fina (por ello
a la constante α se la llame constante de estructura fina).
Queda, como vemos, una degeneración de estados que se distinguen por su mo-
mento angular orbital l, que puede ser j ±1/2 excepto para el caso en que j = n−1/2
en el que l = n − 1.
Para tener una idea de la magnitud del desdoblamiento en niveles con el mismo
n y j diferente, consideremos el caso en que Z = 1; n = 2; j = 1/2, 3/2; l = 1
(correspondiendo este valor a la letra P en la notación espectroscópica). Se tiene
mα4
ϵ 2P3/2 − ϵ 2P1/2 ≈ = 4,53 × 10−5 eV → 10,9GHz (5.500)
32
Mecánica cuántica Relativista 91241

2P3/2

2S1/2 estructura fina

10.9 GHz
2P1/2

triplete

1S1/2 estructura hiperfina

1420 MHz
singulete

En la figura se representan los niveles de energı́a más bajos, utilizando la notación

espectroscópica nlj .

5.27. Interpretaciones de las soluciones de energı́a

negativa
En el final de esta clase abandonaremos la ideologı́a del avestruz y enfrentaremos
el problema de explicar cómo pueden existir soluciones de la ecuación de Dirac con
energı́a negativa aún para el caso de partı́culas libres.
Para ello, nos basaremos en la explicación intuitiva propuesta por Dirac en los
años 30, basada en la siguiente suposición: Todos los niveles de energı́a negativa
están ocupados en el estado fundamental, que llamaremos estado de vacı́o. Si ahora
consideramos un electrón libre, no podrá estar en ninguno de los estados de energı́a
negativa porque todos ellos están ocupados y el principio de exclusión de Pauli debe
ser respetado también para estos infinitos niveles de energı́a negativa. Es por ello
libre deberá necesariamente estar en un estado de energı́a po
siendo que está libre de toda interacción, será un estado estab
precisamente, escribe Dirac que:

all the states of negative energy are occupied except perhaps a

242 5.27 Interpretaciones de las soluciones de energı́a negativa
small velocity
que el electrón libre deberá necesariamente estar en un estado de energı́a positiva y,
Por interacción,
siendo que está libre de toda supuesto,será
esta propuesta
un estado [Link]́ inmediatamente gra
Más precisamente,
escribe Dirac que: ficultades: un problema obvio es cómo explicar la infinita dens

...all the states carga implicada

of negative energy arepor los omnipresentes
occupied electrones
except perhaps a few of small de energı́a n
velocity. Como respuesta Dirac propuso reinterpretar la densidad que
en las ecuaciones de Maxwell como el apartamiento del estado
Por supuesto, esta propuesta enfrentó inmediatamente grandes dificultades: un
trificación del universo.
problema obvio es cómo explicar la infinita densidad de carga implicada por los
omnipresentes electronesEn la interpretación
de energı́a negativa. Comode Dirac,Dirac
respuesta los propuso
electronesrein- que “tapan” t
terpretar la densidadestados
que aparecedeenenergı́a
las ecuaciones de Maxwell
negativa, como el apartamiento
pueden ser eyectados de ellos s
del estado de electrificación del universo.
excita. La energı́a de excitación debe ser suficiente como para
En la interpretación de Dirac, los electrones que “tapan” todos los estados de
2
brecha
energı́a negativa, pueden (el “gap”)
ser eyectados de si2mc
de ellos se los. excita.
Para Laque ello desuceda
energı́a exci- se los puede
2
por ejemplo
tación debe ser suficiente como parahaciendo que(elabsorban
saltar la brecha la energı́a
“gap”) de 2mc . Para quede un fotón que
ello suceda se los puede excitar por ejemplo haciendo que absorban la energı́a de un
con uno de ellos. Tal proceso se representa en la figura siguient
fotón que choque con uno de ellos. Tal proceso se representa en la figura siguiente:

mc2

-mc2

fotón

electrón de energía
negativa que es
excitado y salta a
un estado de
energía positiva

Al eyectarse un electrón de ese mar de electrones de energı́a negativa (“mar de

Dirac”), queda en éste un agujero (ausencia de una partı́cula con carga negativa)
que puede interpretarse como una partı́cula de carga positiva. Un proceso tal se
puede graficar ası́:
Se puede interpretar entonces al agujero como una verdadera partı́cula con carga
positiva.
(“mar de Dirac”), queda en éste un agujero (ausencia de
con carga negativa) que puede interpretarse como una
carga positiva. Un proceso tal se puede graficar ası́:
Mecánica cuántica Relativista 243

Señala Pais [10], fı́sico y biógrafo de Dirac que este, inicialmente, no vio clara-
Se puede interpretar entonces al agujero como una ver
mente lo que sucedı́a: a principios de 1928 propuso simplemente descartar la solución
con energı́a negativa. En junio de ese año admitió en una conferencia que no se la
cula con carga positiva.
podı́a ignorar y calificó por ello a su ecuación como aproximada. Hacia principios
Señala Pais [10], fı́sico y biógrafo de Dirac que este, ini
de 1929 , junto con Weyl, comienzó a especular que la solución de energı́a negativa,
como podı́a verse como una partı́cula con carga positiva, corresponderı́a a un protón
vio claramente lo que sucedı́a: a principios de 1928 propuso
y pensó que la masa de su ecuación debı́a ser un promedio de las masas del electrón
y del protón (!!). De hecho, el tı́tulo de su trabajo en 1930 era A theory of electrons
descartar la solución con energı́a negativa. En junio de es
and protons [11]. Recién en mayo de 1931 descartó esto y escribió , en lo que él llamó
en una conferencia que no se la podı́a ignorar y calificó
a small step forward (!!!) [12]:

A hole,ecuación como
if there were one, wouldaproximada. Haciaunknown
be a new kind of particle, principios
to experi- de 1929, jun
mental physics, having the same mass and opposite charge of the electron.
comienzó a especular que la solución de energı́a negativa
Antes verse
de fin decomo una
año (y de que partı́cula
Dirac cumplieracon carga
29 años) Carlpositiva,
Anderson, quecorresponderı́
aparentemente ignoraba la teorı́a de Dirac, anunció evidencia experimental para el
y pensó
anti-electrón o positrón que lapor
sugerido masa
Dirac. de su ecuación
Se trataba debı́a
de la observación de la ser
traza un promedio
dejada pordel rayoselectrón y del aprotón
cósmicos sometidos un campo(!!). De hecho,
magnético, el tı́tulo
en una cámara de de su tra
Wilson. La dirección en que se curvaba la traza correspondı́a a una partı́cula con
eray masa
carga positiva A theory
mucho menorof que
electrons
un protón. and protons [11]. Recién en m
Una vez creado el agujero, un electrón con energı́a positiva (el mismo que fuera
eyectado, udescartó esto alyestado
otro), puede “caer” escribió , en
con energı́a lo que
negativa eél llamó
correspondiente, que “ a small s
(!!!)
se encontraba [12]: Se aniquilan ası́ el electrón que cae y el positrón asociado
desocupado.
con el agujero; la energı́a disponible al desaparecer el par electrón-positrón se ma-
nifiesta como emisionón de un fotón. Usando nuevamente un diagrama, tendrı́amos,
para el proceso completo, en el cual un fotón “crea” originalmente un par electrón-
A hole, if there were one, would be a new kind of part
positrón, que luego se aniquila dando un fotón:
to experimental physics, having the same mass and oppo
De hecho, un proceso como el de la figura anterior puede suceder aún si el
fotón tiene energı́a menor que la mı́nima necesaria (Emin = 2mc2 ) para crear un
the electron.
par electrón-positrón. Esto sucede cuando un campo electromagnético produce un
reacomodamiento de carga dando origen a una “polarización del vacı́o”. Esto, que

Antes de fin de año (y de que Dirac cumpliera 29 años

son, que aparentemente ignoraba la teorı́a de Dirac, anun
experimental para el anti-electrón o positrón sugerido p
trataba de la observación de la traza dejada por rayos cós
mismo que fuera eyectado, u otro), puede “caer” al estado con energı́a
negativa correspondiente, que se encontraba desocupado. Se aniquilan
ası́ el electrón que cae y el positrón asociado con el agujero; la energı́a
disponible al desaparecer el par electrón-positrón se manifiesta como
emisionón de un fotón. Usando nuevamente un diagrama, tendrı́amos,
para el proceso completo, en el cual un fotón “crea” originalmente un
244 parInterpretaciones
5.27 electrón-positrón,
de las que luego de
soluciones se energı́a
aniquila dando un fotón:
negativa

inicialmente fue una predicción teórica, se confirmó experimentalmente a través de

De hecho, un proceso como el de la figura anterior puede suceder aún
la existencia del corrimiento de niveles al que nos referimos más arriba (de Lamb),
que puede ser si el fotóncontiene
descripto energı́a
precisión, menor
en el marcoquede lalateorı́a
mı́nima necesaria
cuántica (Emin = 2mc2 )
de campos
cuando diagramasparacomocrearelunanterior
par electrón-positrón.
son tenidos en cuenta Esto alsucede cuando
estudiar un campo elec-
los niveles
de energı́a de tromagnético produce
un electrón (cuántico) en un reacomodamiento
el campo electromagnético de(cuántico)
carga dandodel origen a
núcleo. una “polarización del vacı́o”. Esto, que inicialmente fue una predicción
Una vez que se acepta
teórica, que partı́culas
se confirmó masivas como el electrón
experimentalmente a travésy el
depositrón
la existencia del
se pueden aniquilar,
corrimiento de niveles al que nos referimos más arriba (dedeLamb), que
la descripción de las partı́culas en términos de funciones
onda pierde consistencia. En efecto, ¿qué se hace por ejemplo con la probabilidad
puede ser descripto con precisión, en el marco de la teorı́a cuántica de
de encontrar a una partı́cula en algún lugar del espacio en un instante t2 , expresada
en términos decampos cuando
la función diagramas
de onda, como fue
si la partı́cula el anterior
aniquiladason en tenidos
un instanteen cuenta al
t1 < t2 ? Sucedeestudiar los términos
que en los niveles planteados
de energı́apor deDirac
un electrón (cuántico)
al postular la existenciaen el campo
de un mar de electromagnético
infinitas partı́culas con(cuántico) del núcleo.
energı́a negativa, debe plantearse una teorı́a
de muchas partı́culas y no de una única en presencia de un potencial. Notemos que
con el abandono del concepto de función de onda de una partı́cula como medio para
Una vez que se acepta que partı́culas masivas como el electrón
describir electrones relativistas, la razón por la que se descartaba a la ecuación de
y el positrón se pueden aniquilar, la descripción de las partı́culas en
Klein-Gordon deja de existir. De hecho, como dijimos, la ecuacion de Klein-Gordon
términosendeotro
descibe correctamente, funciones
contexto,de onda pierde
partı́culas consistencia.
relativistas En efecto,
de spin cero. Pero ¿qué se
hace
la interpretación de por
Diracejemplo
sobre loscon la probabilidad
estados de encontrar
de energı́a negativa a una
deja de ser partı́cula en
válida
pues los bosonesalgún lugar delel espacio
no obedecen principioen deun instante
exclusión de tPauli
2 , expresada
y no habrı́aenrazón
términos de la
entonces para función
que el mar de Dirac de bosones estuviera “lleno”.
de onda, si la partı́cula fue aniquilada en un instante t1 < t2 ?
Será necesario entonces
Sucede que en construir una verdadera
los términos teorı́a por
planteados de muchas
Dirac alpartı́culas
postular la exis-
para acomodartencia
a partı́culas
de un mar de infinitas partı́culas con energı́a logra
y antipartı́culas de manera consistente. Esto se negativa, debe
luego de la llamada “segunda cuantificación”, que lleva a la introducción de campos
cuantificados capaces de crear o aniquilar partı́culas. La formulación de la teorı́a de
campos hace completamente innecesaria la interpretación de las antipartı́culas como
el positrón como agujeros en un mar. Julian Schwinger, uno de los que desarrolló
justamente la electrodinámica cuántica, escribió [13]:
La imagen de un mar infinito de electrones de energı́a negativa es hoy considerada
una curiosidad histórica, y olvidada.
Concluimos esta sección representando el espectro de energı́as que obtuvimos al
estudiar la ecuación de Dirac para electrón en el caso de un potencial coulombiano
atractivo (sin tener en cuenta las correcciones de la electrodinámica cuántica). En
la parte de la izquierda se representan, con rectas inclinadas, los posibles estados
de un electrón (la parte inferior corresponde a los electrones de energı́a negativa del
99

Mecánica cuántica Relativista 245

La figura
“marmuestra
de Dirac”eloespectro de de
un electrón energı́a
Dirac de
libreuncon
electrón
energı́a de Dirac:Ena la
positiva. la parte
izquierda
de en el
la derecha,
caso libre, en el cuando
derechoactúa
en elel caso
potencial el potencialCoulombiano
del potencial de Coulomb sobre un electron,
atractivo. Nótese que
vemos que el espectro comprende una franja continua de energı́a positiva que se
mc2 =extiende
511 kev mientras que el nivel ms bajo del atomo de hidrógeno
desde mc hasta +∞, una serie discreta de energı́a positiva inferior a mc2
2 corresponde
a una (el
energı́a deobservado
espectro 13.6 eV en el átomo de hidrógeno) y una franja continua de energı́a
negativa desde −mc2 hasta −∞.
La figura muestra el espectro de energı́a de un electrón de Dirac: a la izquierda en
Conjugación de carga
el caso libre, en el derecho en el caso del potencial Coulombiano atractivo. Nótese que
mc2 = 511 KeV mientras que el nivel más bajo del átomo de hidrógeno corresponde
a una energı́a de 13,6 eV
La teorı́a de agujeros para explicar el rol de los estados de energı́a ne-
gativa de la teorı́a relativista de Dirac para el electrón, implica la exis-
tencia5.28. Conjugación
de partı́culas con la misma de carga masa, el mismo spin y carga opuesta,
los electrones
La teorı́a yde positrones. La ecuación
agujeros para explicar el rol de losde Dirac
estados debenegativa
de energı́a entonces
de la admi-
teorı́a relativista de Dirac para el electrón, implica la existencia de partı́culas con la
tir una nueva simetrı́a que corresponda al intercambio entre partı́cula
misma masa, el mismo spin y carga opuesta, los electrones y positrones. La ecuación
(electrón)
de Diracydebe
antipartı́cula
entonces admitir(positrón).
una nueva simetrı́a que corresponda al intercambio
entre partı́culaentonces
Busquemos (electrón) y una
antipartı́cula (positrón).
transformación que pase de un espinor ψ,
Busquemos entonces una transformación que pase de un espinor ψ, que describa C
que describa
una partı́culaunaconpartı́cula con auna
una dada carga, dada carga,
otro espinor a otrouno
ψ c que describe espinor
con cargaψ que
describe uno
opuesta. con
Estos cargadeben
espinores opuesta. Estos
obedecer las espinores
siguientes ecuacionesdeben obedecer
(tomamos unida- las
des naturales, c = 1 y ℏ = 1)
siguientes ecuaciones
(iγ µ ∂µ − eγ µ Aµ − m) ψ = 0 para el electrón (5.501)
(iγ µ ∂µ −(iγ
eγµ∂µµA+µeγ− µ
Am) ψ ψc ==0 0para el positrón
µ − m) para el electrón
(5.502) (7.32)
µ µ
(iγ una
Buscamos ∂µ + eγ Aµ −
transformación m) ψ C = 0 para el positrón (7.33)
c
ψ→ψ (5.503)
Buscamos
que sea una
local ytransformación
que, hecha dos veces sucesivamente deje a ψ sin cambiar, a menos

ψ → ψC (7.34)

que sea local y que, hecha dos veces sucesivamente deje a ψ sin cam-
biar, a menos de una fase inobservable. Para obtenerla, tomemos (7.32),
246 5.28 Conjugación de carga

de una fase inobservable. Conjuguemos la ecuación de Dirac (5.501),

[γ µ∗ (i∂µ + eΛµ ) + m] ψ ∗ = 0. (5.504)

Supongamos que logramos encontrar una matriz C no singular tal que

γ µ∗ = −C −1 γ µ C. (5.505)

Al reemplazar en (5,504) tenemos

h i
−C −1 γ µ Q (i∂µ + eAµ ) + m ψ ∗ = 0 (5.506)

Luego, multiplicando a izquierda por −C llegamos a

[γ µ (i∂µ + eΛµ ) − m] Cψ ∗ = 0 (5.507)

que es la ecuación buscada siempre que identifiquemos al espinor conjugado de carga

con
ψ c = Cψ ∗ . (5.508)
Curiosamente, la forma de la matriz C no es independiente de la representación.
Tanto en las representaciones de Dirac como quiral, la única matriz γ imaginaria
es la γ 2 . En esas representaciones podemos tomar entonces C = −iγ 2 , a menos de
una fase arbitraria. Siempre podemos cambiar de representación usando el teorema
fundamental de Pauli.
Es importante analizar la acción de C sobre una solución con energı́a negativa,
spin hacia abajo y que, por simplicidad, corresponda a una partı́cula en reposo: en
la representación de Dirac tenemos (a menos de la normalización)

0
 
0
ψ= exp(imt)   (5.509)
 
0
1

El conjugado de carga será, de acuerdo a lo anterior

1
 
0
ψ c = −iγ 2 ψ ∗ = exp(−imt) 
 . (5.510)

0
0

Luego, el conjugado de carga de un electrón de energı́a negativa y spin hacia abajo

es un electrón de energı́a positiva y spin hacia arriba.
Mecánica cuántica Relativista 247

5.29. Fermiones de Majorana

El espinor ψ es una cantidad compleja. Debe serlo porque la representación S[Λ]
tı́picamente lo es, de manera que si ψ fuera real en algún sistema de referencia, al
hacer una transformación de Lorentz dejarı́a de serlo. Sin embargo, hay una forma
de hacer que el espinor permanezca real en todos los sistemas de referencia. Lo más
simple es utilizar la representación de Majorana (5.162),
! ! ! !
0 σ2 iσ 3 0 0 −σ 2 −iσ 1 0
γ0 = , γ 1
= , γ 2
= , γ 3
= (5.511)
σ2 0 0 iσ 3 σ2 0 0 iσ 1

en la que las matrices γ son reales, (γ µ )∗ = γ µ . Esto significa que los generadores
(5.235) Σµν = 4i [γ µ , γ ν ] son imaginarios puros, y la transformación (5.234) S[Λ] =
i µν
e− 2 ωµν Σ es real. Entonces en esta base del álgebra de Clifford podemos trabajar
con un espinor real, imponiendo la condición

ψ = ψ∗ (5.512)

que se preserva bajo transformaciones de Lorentz. Estos espinores se llaman espinores

de Majorana.
¿Qué ocurre entonces si usamos una representación arbitraria para las matrices
γ? ¿Qué aspecto tendrı́a la condición de Majorana? Anteriormente definimos el
espinor conjugado de carga del espinor de Dirac como

ψ c = Cψ ∗ (5.513)

y mostramos que si ψ satisface la ecuación de Dirac entonces ψ c también la satisface

(en presencia de un campo Aµ hay que invertir la carga). Es decir, que ψ c se trans-
forma como corresponde frente a una transformación de Lorentz. Si ψ → S(Λ)ψ
entonces ψ c → S(Λ)ψ c . En consecuencia, podemos imponer la condición

ψc = ψ (5.514)

que define al espinor de Majorana, y que se mantiene en todos los sistemas de

referencia. En la representación de Majorana las matrices de Dirac son imaginarias
puras, y entonces CMajorana = 1, y la condición de Majorana ψ = ψ c se convierte en
ψ = ψ∗.
El espinor de Majorana da lugar, en su versión cuántica, a un fermión que es su
propia antipartı́cula, lo mismo que para un campo escalar.
248 5.30 Inversión Temporal

5.30. Inversión Temporal

La inversión temporal es la operación según la cual las coordenadas espacio-
temporales cambian de la siguiente manera:
r→r (5.515)
t → −t, (5.516)
que puede escribirse
−1 0 0 0
 
 0 1 0 0
x′ν = Λν µ xµ , con ΛT =  . (5.517)
 
 0 0 1 0
0 0 0 1
con det ΛT = −1. Si escribimos ψ ′ (x′ ) ≡ ψ ′ (−t, r), a la solución transformada de la
ecuación de Dirac intentemos construirla en la forma
ψ ′ (x′ ) = T ψ ∗ (x) ⇒ ψ ∗ (x) = T −1 ψ ′ (x′ ) (5.518)
donde ψ ∗ satisface la ecuación de Dirac conjugada
(−iγ µ∗ ∂µ − mc)ψ(x)∗ = 0 (5.519)
y entonces, al escribir ∂µ = Λν µ ∂ν′ e introducir (5.518), tenemos
(−iγ µ∗ Λν µ ∂ν′ − mc)T −1 ψ ′ (x′ ) = 0. (5.520)
Multiplicamos a izquierda por T ,
(−iT γ µ∗ T −1 Λν µ ∂ν′ − mc)ψ ′ (x′ ) = 0, (5.521)
y entonces ψ(x′ ) será una solución de la ecuación de Dirac,
(iγ µ ∂µ′ − m)ψ ′ (x′ ) = 0, (5.522)
Si hallamos una matriz T que satisfaga
T γ µ∗ T −1 Λν µ = −γ ν . (5.523)
En la representación de Dirac y en la quiral, la única matriz imaginaria es γ 2 , y
entonces esa condición se escribe
T γ µ = γ µ T, µ = 0, 2 (5.524)
T γ µ = −γ µ T, µ = 1, 3. (5.525)
La matriz
T = iγ 1 γ 2 (5.526)
satisface las condiciones buscadas, y la transformación es antiunitaria. Observemos
que si introducimos un campo de gauge Aµ (x), bajo inversión temporal se relaciona
con A′µ (x′ ) en la forma A′0 (x′ ) = A0 (x) y A′i (x′ ) = −Ai (x), debido a que la corriente
cambia de signo bajo inversión temporal.
Mecánica cuántica Relativista 249

5.31. Transformada de Fourier discreta

Aunque ya la hemos usado informalmete, dedicaremos aquı́ unas lineas a definir la
transformada de Fourier discreta. Esta transformación nos resultará de gran utilidad
a lo largo del libro.
Consideremos una función f : R → R, definida sólo en un número finito n de
puntos xj , j = 0, . . . , n − 1, tal que fj = f (xj ). En tal caso es posible definir una
transformada discreta de Fourier f˜k de la siguiente forma:

1 n−1
f˜k = √ fj e−2πijk/n ,
X
k = 0, . . . , n − 1.
n j=0

Conocidos los n valores f˜k , los n valores fj pueden recuperarse exactamente mediante
la transformación inversa, dada por

1 n−1
f˜k e2πijk/n ,
X
fj = √ j = 0, . . . , n − 1
n k=0

Esto puede demostrarse fácilmente, reemplazando f˜k por su definición:

 
1 n−1 1 n=1 n−1
1 n−1
" #
′ ′
fj′ e−2πij k/n  e2πijk/n = e2πik(j−j ) = fj
X X X X
√ √ fj ′
n k=1 n j ′ =1 j ′ =0
n k=0

donde hemos utilizado el resultado


1 n−1 ′
1 j = j ′
e2πik(j−j )/n = δjj ′ = 
X
n k=0 ̸ j′
0 j=
′
válido para j, j ′ enteros. En efecto, si j = j ′ , e2πik(j−j )/n = 1 y
n−1
′
e2πik(j−j )/n = n,
X

k=0

mientras que si j ̸= j ′ (y |j − j ′ | < n)

n−1 ′
X
2πik(j−j ′ )/n 1 − e2πi(j−j )
e = =0
k=0 1 − e2πi(j−j ′ )/n

para j − j ′ entero.
Bibliografı́a

[1] Gordon Baym. Lectures on Quantum Mechanics. CRC Press, 1969.

[2] James Binney y David Skinner. The Physics of Quantum Mechanics. Oxford,
2014.
[3] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 1. Wiley, 2020.
[4] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 2. Wiley, 2020.
[5] Claude Cohen-Tannoudji, Bernard Diu y Franck Laloë. Quantum Mechanics.
2.a ed. Vol. 3. Wiley, 2020.
[6] W. Greiner. Relativistic Quantum Mechanics. 3.a ed. Springer, 2000.
[7] David J. Griffiths. Introduction to Quantum Mechanics. 2.a ed. Pearson Pren-
tice Hall, 2005.
[8] L. D. Landau y E. M. Lifshitz. Quantum Mechanics. Non-relativistic Theory.
3.a ed. Vol. 3. Course of Theoretical Physics. Pergamon Press, 1977.
[9] Robert Littlejohn. Quantum Mechanics. 2019. url: http : / / bohr . physics .
[Link]/classes/221/1112/[Link].
[10] Alastair I. M. Rae. Quantum Mechanics. 4.a ed. IOP Publishing, 2002.
[11] J. J. Sakurai. Modern Quantum Mechanics. Addison-Wesley, 1994.
[12] Fidel Schaposnik. Mecánica Cuántica I. 2001.
[13] Ramamurti Shankar. Principles of Quantum Mechanics. 2.a ed. Springer, 1994.
[14] Ben Simons. Advanced Quantum Physics. 2009. url: [Link]
[Link]/∼bds10/[Link].
[15] David Tong. Kinetic Theory. 2012. url: [Link]
tong/[Link].
[16] David Tong. Topics in Quantum Mechanics. 2017. url: [Link]
[Link]/user/tong/[Link].

250
BIBLIOGRAFÍA 251

[17] Steven Weinberg. Lectures on Quantum Mechanics. Cambridge University

Press, 2013.

También podría gustarte

IUCCI - 2024 - Mecanica Cuantica II
Aún no hay calificaciones
IUCCI - 2024 - Mecanica Cuantica II
246 páginas
Introducción a la Mecánica Cuántica
Aún no hay calificaciones
Introducción a la Mecánica Cuántica
198 páginas
Apuntes Mecanica Cuantica H Arellano
Aún no hay calificaciones
Apuntes Mecanica Cuantica H Arellano
211 páginas
NotasCuanticaII Cap1 8
100% (1)
NotasCuanticaII Cap1 8
322 páginas
QFT 2023
Aún no hay calificaciones
QFT 2023
99 páginas
Fullnotes 6 7
Aún no hay calificaciones
Fullnotes 6 7
2 páginas
Mecánica Cuántica. (Ponce)
Aún no hay calificaciones
Mecánica Cuántica. (Ponce)
196 páginas
Curso de Física Cuántica: Notas y Temario
Aún no hay calificaciones
Curso de Física Cuántica: Notas y Temario
79 páginas
Notas Fisica Moderna
Aún no hay calificaciones
Notas Fisica Moderna
354 páginas
NotasCuanticaII Cap1 10
Aún no hay calificaciones
NotasCuanticaII Cap1 10
362 páginas
Teoría Cuántica de Campos
Aún no hay calificaciones
Teoría Cuántica de Campos
148 páginas
Fullnotes PDF
Aún no hay calificaciones
Fullnotes PDF
199 páginas
Teoría Cuántica de Campos: Fundamentos
Aún no hay calificaciones
Teoría Cuántica de Campos: Fundamentos
148 páginas
Teoría Cuántica de Campos: Fundamentos
Aún no hay calificaciones
Teoría Cuántica de Campos: Fundamentos
148 páginas
Teoría del Electrón de Dirac
Aún no hay calificaciones
Teoría del Electrón de Dirac
66 páginas
Cur So Mcu Antica
Aún no hay calificaciones
Cur So Mcu Antica
136 páginas
Cuantica 1 y 2
100% (1)
Cuantica 1 y 2
106 páginas
Apunts Complets Curs Física Atòmica - Salvat
100% (1)
Apunts Complets Curs Física Atòmica - Salvat
186 páginas
(Salvat, F.) Física Atómica
Aún no hay calificaciones
(Salvat, F.) Física Atómica
186 páginas
Teoria Cuántica de Campos-Universidad de Granda PDF
Aún no hay calificaciones
Teoria Cuántica de Campos-Universidad de Granda PDF
150 páginas
Teoria Cauntica de Campos
Aún no hay calificaciones
Teoria Cauntica de Campos
152 páginas
Modelo Estándar: Fundamentos y Lagrangianos
Aún no hay calificaciones
Modelo Estándar: Fundamentos y Lagrangianos
3 páginas
Apuntes de Mecánica Cuántica 2015
Aún no hay calificaciones
Apuntes de Mecánica Cuántica 2015
211 páginas
Unidades atómicas en física atómica
Aún no hay calificaciones
Unidades atómicas en física atómica
276 páginas
Full Notes
Aún no hay calificaciones
Full Notes
302 páginas
Resumen E4
Aún no hay calificaciones
Resumen E4
78 páginas
Salvat Notes de Mecanica Quantica
100% (1)
Salvat Notes de Mecanica Quantica
258 páginas
Mecánica Cuántica: Principios y Aplicaciones
Aún no hay calificaciones
Mecánica Cuántica: Principios y Aplicaciones
128 páginas
QPhys Notas
Aún no hay calificaciones
QPhys Notas
102 páginas
Mecanica Cuantica para No Iniciados
Aún no hay calificaciones
Mecanica Cuantica para No Iniciados
146 páginas
Una Introduccion A La Mecanica Cuantica
Aún no hay calificaciones
Una Introduccion A La Mecanica Cuantica
146 páginas
Física del Sólido para Estudiantes Avanzados
100% (1)
Física del Sólido para Estudiantes Avanzados
264 páginas
Ejer Cici Os Luis de Lapena
Aún no hay calificaciones
Ejer Cici Os Luis de Lapena
850 páginas
Apuntes de Teoría Cuántica de Campos
Aún no hay calificaciones
Apuntes de Teoría Cuántica de Campos
276 páginas
Problemas y Ejercícios de Mecánica Cuántica
100% (6)
Problemas y Ejercícios de Mecánica Cuántica
850 páginas
Mecanica
Aún no hay calificaciones
Mecanica
849 páginas
Electrodinamica Clasica
Aún no hay calificaciones
Electrodinamica Clasica
152 páginas
Geser GeneralPhysics 2018
Aún no hay calificaciones
Geser GeneralPhysics 2018
77 páginas
Teoría Cuántica de Campos
Aún no hay calificaciones
Teoría Cuántica de Campos
248 páginas
Introduccion A La Teoria de Los Campos Quanticos
100% (1)
Introduccion A La Teoria de Los Campos Quanticos
246 páginas
Ugr Campos
Aún no hay calificaciones
Ugr Campos
247 páginas
Apunts Salvat
Aún no hay calificaciones
Apunts Salvat
547 páginas
Apuntes de Física Fundamental
Aún no hay calificaciones
Apuntes de Física Fundamental
240 páginas
Manuel de Llano Cuantica Unam
100% (1)
Manuel de Llano Cuantica Unam
314 páginas
Notas de Clase Física Moderna y Estado Sólido para Estudiantes de Ingeniería
100% (1)
Notas de Clase Física Moderna y Estado Sólido para Estudiantes de Ingeniería
276 páginas
Fundamentos de Física III: 2012-2013
Aún no hay calificaciones
Fundamentos de Física III: 2012-2013
369 páginas
Long MCB
Aún no hay calificaciones
Long MCB
137 páginas
Fundamentos de Física Cuántica
Aún no hay calificaciones
Fundamentos de Física Cuántica
229 páginas
Física Fundamental Avanzada
Aún no hay calificaciones
Física Fundamental Avanzada
322 páginas
Aputes de Un Curso de Mecánica Cuántica I - (Rodrigo Ferrer P., Et - Al.) PDF
Aún no hay calificaciones
Aputes de Un Curso de Mecánica Cuántica I - (Rodrigo Ferrer P., Et - Al.) PDF
311 páginas
A Punt Es Fi Sica Fundamental
Aún no hay calificaciones
A Punt Es Fi Sica Fundamental
299 páginas
Formulario Fisica
Aún no hay calificaciones
Formulario Fisica
2 páginas
El Concepto de Energía en Termoquímica
Aún no hay calificaciones
El Concepto de Energía en Termoquímica
9 páginas
Grupos de Amigos y Conducta Antisocial
Aún no hay calificaciones
Grupos de Amigos y Conducta Antisocial
30 páginas
Informe n3 - Grupo 1
Aún no hay calificaciones
Informe n3 - Grupo 1
24 páginas
Enfoque Cognitivo y Aprendizaje de La Escritura
Aún no hay calificaciones
Enfoque Cognitivo y Aprendizaje de La Escritura
14 páginas
UD04.02. Campo Electrostático 1. TEORÍA
Aún no hay calificaciones
UD04.02. Campo Electrostático 1. TEORÍA
5 páginas
Informe Científico El Sol
Aún no hay calificaciones
Informe Científico El Sol
3 páginas
TP 4 Psicologia Social
Aún no hay calificaciones
TP 4 Psicologia Social
4 páginas
Qué Es La Trayectoria
Aún no hay calificaciones
Qué Es La Trayectoria
3 páginas
2022 Empatia Estudiantes Psicología
Aún no hay calificaciones
2022 Empatia Estudiantes Psicología
101 páginas
Actividad 2 - Evidencia 2 Documento
Aún no hay calificaciones
Actividad 2 - Evidencia 2 Documento
5 páginas
Minimos Cuadrados Laboratorio Fisica
Aún no hay calificaciones
Minimos Cuadrados Laboratorio Fisica
8 páginas
Sólido Rígido
Aún no hay calificaciones
Sólido Rígido
31 páginas
Mapa Conceptual
Aún no hay calificaciones
Mapa Conceptual
1 página
Clase 1 - Hoja de Ruta y Ejercicios
Aún no hay calificaciones
Clase 1 - Hoja de Ruta y Ejercicios
4 páginas
Mod.#3.3 - Day 5 - Tratamiento de Agua Espanol 2025
Aún no hay calificaciones
Mod.#3.3 - Day 5 - Tratamiento de Agua Espanol 2025
32 páginas
Guía 7°básico Gases 2
Aún no hay calificaciones
Guía 7°básico Gases 2
5 páginas
Wa0027.
Aún no hay calificaciones
Wa0027.
5 páginas
Biomecanica Aplicada A La Fuerza
Aún no hay calificaciones
Biomecanica Aplicada A La Fuerza
11 páginas
Psicologia Social
Aún no hay calificaciones
Psicologia Social
5 páginas
Psicoandragogía
Aún no hay calificaciones
Psicoandragogía
12 páginas
9ejercicios Cap 4
Aún no hay calificaciones
9ejercicios Cap 4
5 páginas
Bitácora de Procesos Desarrollados en La Competencia GA2-220201501-AA4-EV02
Aún no hay calificaciones
Bitácora de Procesos Desarrollados en La Competencia GA2-220201501-AA4-EV02
9 páginas
Trabajo Experimental de Gases Ideales
Aún no hay calificaciones
Trabajo Experimental de Gases Ideales
5 páginas
Hipnosis Clínica Ericksoniana
Aún no hay calificaciones
Hipnosis Clínica Ericksoniana
168 páginas
Keegan Et Al 2018 Guia para Perfeccionistas en Problemas
100% (1)
Keegan Et Al 2018 Guia para Perfeccionistas en Problemas
43 páginas
Articulo El Alto, Jose Luis Vargas
Aún no hay calificaciones
Articulo El Alto, Jose Luis Vargas
12 páginas
Tema 2. Salud Mental Vs Enfermedad Mental
Aún no hay calificaciones
Tema 2. Salud Mental Vs Enfermedad Mental
37 páginas
La Energia en Los Procesos de La Vida Diaria
100% (10)
La Energia en Los Procesos de La Vida Diaria
144 páginas
2 Examen Química - Atomo
Aún no hay calificaciones
2 Examen Química - Atomo
2 páginas

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

Cargado por

Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025

Cargado por

Mecánica Cuántica II

1. Potenciales dependientes del tiempo 5

2.4. Aproximación de Born . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4. Segunda cuantificación 114

5. Mecánica cuántica Relativista 165

5.7. Formas explı́citas de las matrices de Dirac . . . . . . . . . . . . . . . 190

Potenciales dependientes del

Consideremos un sistema fı́sico con Hamiltoniano H0 , cuyos autovalores y auto-

H0 |n⟩ = En |n⟩. (1.1)

Por simplicidad supongamos que el espectro de H0 es discreto y no degenerado,

al estado inicial tomando su expansión en la base de autoestados de H0 :

donde cn = ⟨n|ψ0 ⟩. Si se tratara de un problema independiente del tiempo, la evo-

con cn constantes (independientes de t). Resulta entonces razonable, en el caso de

Representación de Schrödinger (S)

Representación de Heisenberg (H)

|ψ(t)⟩H = |ψ0 ⟩ (1.13)

mientras que los obervables dependen del tiempo según1

AH (t) = U † (t0 , t) A (t0 ) U (t0 , t) , (1.16)

y que obedecen la ecuación de movimiento de Heisenberg:

El valor de expectación ⟨A⟩ es obviamente el mismo en ambas representaciones:

En el caso en que el Hamiltoniano no depende del tiempo, la solución de la

U(t, t0 ) = e−iH(t−t0 )/ℏ . (1.21)

Lo cual permite obtener inmediatamente la dinámica de estados, observables y va-

está dada por la serie de Dyson:

1.1. Representación de Interacción

|ψ(t)⟩I = e+iH0 (t−t0 )/ℏ |ψ(t)⟩S (1.23)

AI (t) = eiH0 (t−t0 )/ℏ AS (t)e−iH0 (t−t0 )/ℏ (1.24)

En particular (VS (t) ≡ V (t)) :

VI (t) = eiH0 t/ℏ V (t)e−iH0 t/ℏ (1.25)

Vamos a deducir ahora la ecuación que caracteriza la evolución temporal de

∂ ∂  iH0 (t−t0 )/ℏ 

donde usamos la expansión (1.7) de |ψ(t)⟩. Obserevamos que al trabajar en la repre-

cn (t) = ⟨n|ψ(t)⟩I . (1.32)

Ya podemos escribir la ecuación diferencial para los cn (t). Tomemos la ecuación

Aquı́ los elementos de matriz del potencial pueden deacomponerse en la forma:

V12 eiω12 (t−t0 ) V13 eiω13 (t−t0 )

Este es el sistema de ecuaciones diferenciales acopladas que debemos resolver para

cn (t0 ) = ⟨n|ψ0 ⟩. (1.38)

Una vez hallado los coeficientes cn (t), escribimos la probabilidad de hallar al

Pn (t) = |⟨n|ψ(t)⟩|2 = |cn (t)|2 . (1.39)

Pi→n (t) = |⟨n|i(t)⟩|2 . (1.40)

Estas probabilidades se denominan probabilidades de transición.

1.2. Problemas con dos estados

H0 = E1 |1⟩ ⟨1 |+E2 | 2⟩ ⟨2|; (E2 > E1 )

c1 (t)|2 = 1 − |c2 (t)|2 , (1.46)

y que es muy grande cuando

ω ≈ ω21 = (E2 − E1 ) /ℏ (1.48)

es decir cuando la frecuencia angular del potencial –usualmente generado por un

ω = ω21 ; Ω = γ/ℏ (1.49)

|c1 (t)|2 |c2 (t)|2

Ancho a media altura = 4γ/ℏ

Figura 1.2: Representación gráfica de |c1 (t)|2máx en función de ω para γ ≪ ℏω21 ; ω =

el sistema se libera del exceso de energı́a. Este ciclo de absorsión-emisión se repite

1.3. Resonancia magnética

1.4. Teorı́a de perturbaciones: Serie de Dyson

Si derivamos la ecuación anterior obtenemos la ecuación diferencial para UI (t, t0 )

1.5. Probabilidad de Transición

donde las frecuencias están definidas por (1.42)

1.6. Primer orden perturbativo

1.6.1. Potencial constante

Insertando (1.74) en (1.73) encontramos:

1.6.2. Perturbaciones armónicas

al cuadrado la amplitud para obtener la probabilidad de transición, hay términos

El segundo término de (1.79) es resonante, en cambio, cuando

En − Ei = +ℏω > 0, (1.82)

1.6.3. Análisis de la dependencia temporal

En este caso, la teorı́a de perturbaciones de primer orden predice que la probabilidad

1.6.4. Dependencia en energı́a

mostrando que el área es efectivamente proporcional a t

central, es decir, para los estados finales que satisfacen

probabilidad de transición (1.76), vemos que tenemos un factor t adicional, de modo

Pi→n (t) = Γi→n t, para t → ∞ (1.89)

1.6.5. Estados finales en el continuo

donde ρ(E) = dN (E)/dE es la densidad de estados. Observemos que podemos

y entonces la densidad de estados resulta

Para obtener la probabilidad de transición entre un estado i y los posibles estados

∂ ∂ iH0 (t−t0 )/ℏ