Long MCB
Long MCB
K M Fonseca Romero1
1
kmfonsecar@[Link]
ii
Índice general
iii
iv ÍNDICE GENERAL
5. Teorı́a del momento angular 75
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2. Rotaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3. Teorı́a del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.1. Representaciones irreducibles (Irreps) . . . . . . . . . . . . . . . . . . . 79
5.4. Momento angular orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.1. Coordenadas curvilı́neas . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.4.2. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.4.3. Momento angular en coordenadas esféricas . . . . . . . . . . . . . . . . 89
5.5. Autoestados simultáneos de L bz y Lb2 . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5.1. Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.2. Polinomios asociados de Legendre . . . . . . . . . . . . . . . . . . . . . 95
5.6. Autoestados usando los operadores escalera . . . . . . . . . . . . . . . . . . . . 97
Necesidad histórica de la
mecánica cuántica
EJERCICIO 1. ¿Cuándo surgió la mecánica cuántica? ¿Por qué era necesaria esta teorı́a?
¿Cómo era la fı́sica de la época y cuáles fueron sus mayores éxitos? ¿Qué problemas resolvió la
fı́sica cuántica? ¿Cuál es la utilidad de esta teorı́a?
1.1. Introducción
El siglo XIX fue una época de consolidación de la fı́sica, durante la cual la fı́sica clásica se
aplicó a muchos ámbitos diferentes. La teorı́a de la elasticidad y la hidrodinámica, el desarrollo
y unificación de la teorı́a de la electricidad y el magnetismo (y su conexión con la óptica),
la termodinámica, la teorı́a cinética de los gases, la medición de la rapidez de la luz, son
algunos de los hitos de la fı́sica en esa época [1]. Aunque los experimentos de Thomas Young
en pelı́culas delgadas [2] y de la doble rendija [3, 4, 5] favorecı́an la teorı́a ondulatoria de la
luz, que por la época se pensaba como una onda longitudinal, esta teorı́a fue muy resistida,
especialmente por los fı́sicos franceses [6]. En la época, muchos fı́sicos estaban convencidos de
que si la luz es una onda, debı́a existir el éter, un medio material que las sostuviera, medio
que debı́a llenar todos los medios materiales y también el espacio interestelar [6].
Ni la polarización, descubierta por Étienne-Louis Malus en 1809, ni la ausencia de inter-
ferencia de ondas con polarizaciones particulares, demostrada en 1816, podı́an ser explicadas
por la teorı́a ondulatoria [5]. Augustin-Jean Fresnel, en su propuesta a la Academia Francesa
de Ciencias para explicar las propiedades de la luz, unió el principio de Huygens de ondas
secundarias con el principio de interferencia de Young a su hipótesis de ondas transversa-
les y mostró que explicaba casi todos los fenómenos conocidos de la luz [5]. Siméon Dennis
Poisson mostró el improbable resultado de que en el centro de la sombra proyectada por un
esfera deberı́a haber un punto brillante [6], el cual fue comprobado experimentalmente por
Dominique-François-Jean Arago [7].1 Después de la demostración de la existencia del punto
de Poisson (o de Arago), muchos fı́sicos franceses aceptaron la teorı́a ondulatoria y el éter
lumı́nico.
Los descubrimientos de Hans Christian Ørsted en 1820 de la desviación de los imanes
en presencia de corrientes eléctricas y de Michael Faraday en 1830 del febnómeno inverso
(producción de corrientes eléctricas por imanes en movimiento) señalan el nacimiento del
electromagnetismo [10]. La visualización del campo magnético mediante limaduras de hierro
le sugirieron a Faraday la existencia de lı́neas de fuerza magnética; la fuerza magnética serı́a
tangente a estas lı́neas, su magnitud serı́a proporcional a la densidad de las mismas [11]. Las
1 De hecho, este resultado ya habı́a sido encontrado por Delisle [8] y Maraldi [9] cien años antes.
1
2 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
fuerzas eléctrica y magnética se propagarı́an por medio de tensiones de un modelo elástico,
tensiones que Thomson pensó podrı́a entender mediante analogı́as matemáticas con los sólidos
elásticos [11]. Ası́, se sugerı́a la existencia de un éter electromagnético. James Clerk Maxwell
consideró un modelo mecánico refinado en varios artı́culos, hasta conseguir formular una
teorı́a dinámica del campo electromagnético [12], que condensa todo el electromagnetismo en
20 ecuaciones diferenciales parciales, y que muestra que las ondas luminosas son apenas un
caso de las ondas electromagnéticas. Maxwell publicó su libro A treatise on Electricity and
Magnetism en 1873 en donde hace un tratamiento más extenso de su ideas. Aunque no hacı́a
referencia a su modelo mecánico, al parecer Maxwell creı́a en la existencia del éter, pues en
1878 escribió un artı́culo sobre el éter en la Enciclopedia Británica [13], en donde afirma que se
prueba que la luz no es una sustancia porque puede interferir destructivamente. El éter deberı́a
ser capaz de transmitir energı́a con una cierta rapidez; la mitad de la energı́a es potencial
debido a las distorsiones que sufre y la otra mitad, cinética, debido a su movimiento. El éter
comenzó a ser cuestionado porque no es necesario para la formulación de la electrodinámica.
Sin embargo, no fue descartado ni siquiera con el experimento de Michelson y Morley, cuyo
resultado podı́a explicarse con la hipótesis de contracción de longitudes de George Francis
FitzGerald y Hendrik Antoon Lorentz. La aceptación de la teorı́a especial de la relatividad de
Einstein serı́a la causa de la desaparición del éter electromagnético de la fı́sica (aunque han
aparecido otras ideas de éter).
Al final del siglo XIX hubo un sentimiento, minoritario al parecer, de que el final de la fı́sica
estaba cerca [14]. Sin embargo, tal sentimiento se amplifica en algunos relatos del surgimiento
de la mecánica cuántica, tal vez para producir algo de dramatismo. Se cuenta, por ejemplo,
que William Thomson (Lord Kelvin) creı́a que ((en el cielo azul de la Fı́sica Clásica apenas
habı́a dos nubes para despejar))[15]. Prestar atención al énfasis en apenas. Para mayor efecto,
se usa el diminutivo nubecillas [16].
Antes de mostrar como esta historia distorsiona mucho lo que en realidad ocurrió, vea-
mos que un par de ejemplos que pueden dar la impresión de que sı́ se creı́a en el fin de la
fı́sica. James Clerk Maxwell en su discurso de posesión como primer Profesor Cavendish en
la universidad de Cambridge en 1871, dijo ((Esta caracterı́stica de los experimentos modernos
– de que consisten principalmente de medidas – es tan prominente, que se ha generalizado
la opinión de que en unos pocos años todas las grandes constantes de la fı́sica habrán sido
estimadas de forma aproximada y que la única ocupación que será dejada a los hombres de
ciencia será la de aumentar la precisión de tales medidas)). Maxwell, sin embargo, aclara en
su discurso que tal pesimismo es injustificado. Por otro lado, con alguna frecuencia se encuen-
tra nueva fı́sica con el aumento de precisión de las mediciones. Albert A. Michelson, en la
dedicatoria al Laboratorio Ryerson de la universidad de Chicago dice, entre otras cosas, que
((Aunque nunca es seguro afirmar que las ciencias f’ı́sicas no nos vayan a deparar maravillas
más impresionantes que las del pasado, parece probable que la mayor parte de los grandes
principios ya hayan sido establecidos firmemente y que los avances futuros deben buscarse
principalmente en la aplicación rigurosa de los mismos a todos los fenómenos de los que to-
memos conocimiento. Aquı́ es donde la ciencia de las mediciones demuestra su importancia –
en donde se desean más los resultados cuantitativos que los cualitativos. Un eminente fı́sico
resaltó que las verdades futuras de las ciencias fı́sicas deben buscarse en el sexto decimal)).
Se cuenta que el eminente fı́sico al que se estarı́a refiriendo Michelson serı́a Lord Kelvin [14].
También se cuenta que Michelson se arrepintió de sus palabras y se reprendió por haberlas
pronunciado [14].
Tanto Badash [14] cuanto Schulz [17] argumentan que estas historias constituyen una gran
injusticia a Kelvin, quien dictó una conferencia en la Institución Real de la Gran Bretaña el
27 de abril de 1900 que se ha usado como justificación de dichas historias. La conferencia, con
grandes adiciones, se publicó el año siguiente [18]. Allı́, escribe Kelvin en el primer parágrafo
((La belleza y claridad de la teorı́a dinámica, que establece que el calor y la luz son modos
de movimiento, están actualmente oscurecidas por dos nubes. La primera nació con la teorı́a
1.2. ESPECTROS 3
ondulatoria de la luz y fue abordada por Fresnel y el doctor Thomas Young; involucra la
cuestión: ¿cómo podrı́a la Tierra moverse a través de un sólido elástico tal y como esencial-
mente es el éter? La segunda es la doctrina de Maxwell-Boltzmann relativa a la partición de la
energı́a)). Nótese que no aparece la palabra apenas y que se habla de nubes y no de nubecillas
[17].
Su análisis de la nube I le toma seis páginas, al final de las cuales comenta que no encuentra
fallas ni en la concepción ni en la ejecución del experimento de Michelson y Morley, que tal
vez la respuesta sea la inexistencia del éter y que la nube I es muy densa. Kelvin afirma que
la aberración de la luz y experimentos como el de Michelson y Morley implican un éter con
una estructura difı́cil de aceptar [19]. Es bien sabido que la solución a esta nube dio origen
a la teorı́a especial de la relatividad. A la segunda nube le dedica Kelvin 33 páginas en las
cuales muestra como los resultados experimentales para los calores especı́ficos de los gases
riñen con el teorema de equipartición de energı́a. Por otro lado, si el éter tiene infinitos grados
de libertad, pero el universo tiene energı́a finita, cada grado de libertad tiene energı́a media
nula; pero si tuviera energı́a finita, el universo tendrı́a infinita energı́a. La resolución de este
acertijo se dió con la mecánica cuántica.
En este capı́tulo, veremos algunos de los problemas de la fı́sica clásica que dieron origen a
la mecánica cuántica. Una referencia particularmente útil es el libro de Sánchez [19].
1.2. Espectros
Roger Bacon (siglo XIII) creı́a que el arco iris se produce cuando la luz solar se refleja
y se refracta en las gotas de lluvia. Sin embargo, quien demostró que los colores ya estaban
presentes en la luz solar fue Newton con sus experimentos usando prismas, alrededor de 1666.
William Hyde Wollaston en 1802 y luego, de manera más completa y sistemática, Joseph von
Fraunhofer en 1814, descubrieron lı́neas oscuras en el espectro solar, que se le habı́an pasado
por alto a Newton.
Por otro lado, Thomas Melvill en 1752 habı́a observado el primer espectro de emisión del
cual tenemos noticia; la luz de una llama de sodio, al ser pasada por un prisma, produce un
espectro continuo con algunas lı́neas brillantes. León Foucault en 1849 mostró que las lı́neas D
(oscuras) de Fraunhoffer coinciden con las lı́neas brillantes del sodio. Si una sustancia puede
emitir una lı́nea espectral, entonces también puede absorberla; entonces las lı́neas oscuras
del sol se deberı́an a la presencia de sodio en la atmósfera solar. Esta notable conclusión de
Gustav Kirchhoff les permitió, a él y a su colaborador Robert Wilhelm Bunsen, con la ayuda
de mejores espectrómetros y del mechero de Bunsen, hacer una mejor exploración del espectro
solar para concluir la presencia del hierro, del magnesio, del potasio, del sodio, del litio, y de
dos nuevos metales alcalinos hasta entonces desconocidos, a los que llamaron Cesio y Rubidio,
en la atmósfera solar. Habı́a nacido la astrofı́sica. ¿Cómo se explican los espectros?
4N 2 −v2 /α2
dN (v) = √ v e dv,
α3 π
en donde α es una velocidad caracterı́stica, que luego se mostró es igual a α = 2kT m , donde
k es la constante de Boltzmann, T la temperatura absoluta y m la masa de las partı́culas.
Usando herramientas de la teorı́a de la probabilidad, Maxwell demostró en 1860 el teorema
de equipartición de energı́a que afirma que a cada grado de libertad de tipo cuadrático (por
p2x
ejemplo, 2m ) le corresponde la misma cantidad de energı́a, igual a 1/2kT [24]. En el caso
de moléculas diatómicas podemos hacer una separación entre la coordenada del centro de
masa y la coordenada relativa. La primera solamente tiene energı́a cinética, al igual que las
coordenadas relativas de rotación. Finalmente, si la coordenada asociada a las vibraciones se
modela omo un oscilador armónico, tendremos una contribución de energı́a cinética y otra de
energı́a potencial. Ası́, realmente tendrı́amos 7 grados de libertad, por lo cual esperamos un
valor medio de energı́a igual
a /2kT . El calor molar a volumen constante es, para cada grado
7
∂hEi
de libertad, igual a CV = ∂T = 1/2kN0 = R/2, en donde N0 es la constante de Avogadro
V
y R = N0 k.
1.4. LA FÍSICA ESTADÍSTICA 5
Figura 1.1: Calor especı́fico a volumen constante, idealizado, para un gas diatómico. By
User:PAR - Own work, Public Domain, [Link]
curid=1498790
1 P0 V0
El calor especı́fico de un gas a volumen constante es 2J T (n + e) y a presión constante
1 P0 V0
es 2J T (n + 2 + e), en donde P0 y V0 son la presión y el volumen por unidad de masa
a temperatura absoluta T , J es el equivalente dinámico del calor, e es un número positivo
que depende de la ley de fuerza de la molécula y n los grados de libertad de la misma.
Experimentalmente se encontró que, para el aire y otros gases, n + e no puede ser mayor
que 4,9. Además, de las observaciones espectroscópicas se desprende que una molécula puede
ejecutar muchos tipos diferentes de movimientos vibratorios. Sin embargo, aún para moléculas
que tienen 2 átomos, el número de grados de libertad (n = 6) produce una predicción teórica
para el calor especı́fico demasiado grande.
6 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
Capı́tulo 2
2.1. Introducción
Mucho se ha debatido sobre la interpretación de la mecánica cuántica y sobre su estatus
como teorı́a. Adam Becker: Quantum theory helps us to understand the logic behind the
periodic table of elements, why diamonds are hard and how to build electronics. The inventors
of quantum theory found the logic of the periodic table of elements and use radioactivity to
[reveal the basic working of living cells].
Comenzamos con un resumen de la formulación de la teorı́a en su vertiente ortodoxa
empleando el libro de Gillespie. Enseguida un breve resumen de la formulación de la onda
piloto de de Broglie. Después haremos algunos comentarios sobre la prueba de imposibilidad
de Neumann y el artı́culo de Grete Herman, Proseguimos con el artı́culo de EPR, usando
el libro de Clemente de la Torre. Seguiremos con la formulación de Bohm y los teoremas de
Bell-Kochen-Specker y de Bell. Algo de la formulación de Everett. Algo de las crı́ticas desde
la filosofı́a. Algo sobre las teorı́a tipo Pearl y GWR. Crı́ticas a las soluciones planteadas y
algo del programa de Smolin.
Desde el punto de vista técnico, la formulación se hace restringiéndose a sistemas mecano-
cuánticos no relativistas en una dimensión, en la representación de posición y en la imagen
de Schrödinger.
7
8 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
para las mismas operaciones para las partes real e imaginaria,
dψ(x) du(x) dv(x)
= +i ,
Z dx Z dx dxZ
ψ(x) dx = u(x) dx + i v(x) dx.
En todo espacio vectorial deben estar definidas las operaciones de multiplicación por escalar
y suma de vectores. Aquı́ los escalares son los números complejos. Si ψ1 (x) = u1 (x) + iv1 (x)
y ψ2 (x) = u2 (x) + iv2 (x) son funciones complejas, entonces su suma
ψ(x) = ψ1 (x) + ψ2 (x) = (u1 (x) + u2 (x)) + i (v1 (x) + v2 (x)) ,
es otra función compleja cuya parte real es la suma de las partes reales de ψ1 (x) y ψ2 (x) (y
cuya parte imaginaria es la suma de las partes imaginarias de ψ1 (x) y ψ2 (x)). La suma de
vectores debe ser clausurativa (la suma de dos vectores debe ser otro vector), conmutativa (no
importa el orden en que se suman los vectores), asociativa ((ψ1 + ψ2 ) + ψ3 = ψ1 + (ψ2 + ψ3 ))
y debe existir el vector cero que sumado a cualquier vector ψ da el vector ψ como resultado.
Por otro lado, si c = a + ib es un número complejo y ψ1 (x) = u1 (x) + iv1 (x) es una función
compleja, entonces el producto de la función ψ1 por el escalar c es la función
ψ(x) = cψ1 (x) = (au1 (x) − bv1 (x)) + i (av1 (x) + bu1 (x)) .
La multiplicación por escalar debe ser clausurativa (cψ es otro vector), distributiva con res-
pecto a la suma de vectores (c(ψ1 + ψ2 ) = cψ1 + cψ2 ) y con respecto a la suma de escalares
((c1 +c2 )ψ) = c1 ψ+c2 ψ), debe ser asociativa ((c1 c2 )ψ = c1 (c2 ψ)) y el producto de la identidad
del campo escalar con un vector da como resultado el mismo vector.
Los espacios de Hilbert también poseen otra operación, conocida como producto interno
o producto escalar, la cual le asigna un número complejo a cada par ordenado de vectores. Si
ψ1 (x) y ψ2 (x) son funciones complejas, el producto escalar (ψ1 , ψ2 ) se define como
Z ∞
(ψ1 , ψ2 ) = ψ1∗ (x)ψ2 (x) dx (2.1)
−∞
en donde ψ1∗ (x)es la función (u1 (x) + iv1 (x))∗ = u1 (x) − iv1 (x) correspondiente a la conju-
gación compleja de la función ψ1 (x). A partir del producto escalar se puede definir la norma
de un vector,
p
kψk = (ψ, ψ),
de modo que el cuadrado de la norma del vector ψ
Z ∞ Z ∞
kψk2 = ψ ∗ (x)ψ(x) dx = u2 (x) + v 2 (x) dx ≥ 0,
(2.2)
−∞ −∞
EJERCICIO 4. Considere las siguientes funciones complejas (recuerda que las constantes c1
y c2 son números complejos)
2 2 2 2
ψ1 (x) = c1 e−x /σx
, ψ2 (x) = c2 xe−x /σx
. (2.3)
Encuentre la norma de las funciones anteriores. Encuentre todos los valores posibles de c1 y
c2 para que la norma de ψ1 sea uno. Repita para ψ2 .
EJERCICIO 5. Calcule el producto escalar (ψ1 , ψ2 ) con las funciones definidas en el ejercicio
2.2.
No todas las funciones complejas son vectores del espacio de Hilbert H; sola-
mente aquellas con norma finita.
El producto escalar permite definir la noción de ortogonalidad. Dos funciones complejas
2 2
son ortogonales si su producto escalar es cero. Por ejemplo, las funciones ψ1 (x) = c1 e−x /σx y
2 2
ψ2 (x) = c2 xe−x /σx son ortogonales. Además, si c1 y c2 se escogen de acuerdo con el ejercicio
2.2 tenemos dos funciones ortonormales.
2 2
EJERCICIO 6. Considere la función ψ(x) = x2 e−x /σx . Emplee el método de ortonorma-
lización de Gram-Schmidt para encontrar una función de norma uno que sea ortogonal a
2 2 2 2
ψ1 (x) = c1 e−x /σx y a ψ2 (x) = c2 xe−x /σx .
Ahora podemos definir la noción de conjunto ortonormal {ψi }: un conjunto de vectores
de H (funciones complejas ψi (x)) que satisfacen
(ψi , ψj ) = δi,j ,
en donde δi,j denota la delta de Kronecker, la cual es cero a menos que los ı́ndices i y j sean
iguales. Las vectores ψ1 , ψ2 y ψ3 de los ejercicios anteriores forman un conjunto ortogonal.
Un conjunto de vectores de H, {ψi , i = 1, 2, . . . , N }, es completo si cualquier vector ψ de H
puede escribirse como una combinación lineal de elementos del conjunto,
N
X
ψ= ci ψi ,
i=1
en donde ci son números complejos. En el caso de espacios vectoriales complejos con norma
inducida por un producto escalar, el número natural N es finito. En el caso de los espacios
de Hilbert, N es necesariamente infinito.
Si un conjunto de vectores {ψi , i = 1, 2, . . .} es tanto completo cuanto ortonormal, de-
cimos que se trata de una base ortonormal. Cualquier vector ψ puede escribirse como una
combinación lineal de los elementos de esta base
∞
X
ψ= ci ψi ,
i=1
en donde ci son números complejos. Tomando el producto escalar con un elemento de la base,
digamos ψj , tendremos
∞
X ∞
X ∞
X
(ψj , ψ) = (ψj , ci ψi ) = ci (ψj , ψi ) = ci δi,j , = cj .
i=1 i=1 i=1
10 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Ası́, cualquier vector ψ puede escribirse como
∞
X
ψ= (ψi , ψ) ψi .
i=1
d
χ(x) = ψ(x).
dx
A las reglas que toman un vector del espacio de Hilbert y le asocian otro vector, se les
denomina operadores. Es común escribir
χ = Oψ.
b
(c O)ψ
b = c(Oψ) b
(O
b1 + Ob2 )ψ = (Ob1 ψ) + (Ob2 ψ),
(O
b1 O
b2 )ψ = Ob1 O b2 ψ .
La mayor parte de los operadores de la mecánica cuántica son operadores lineales, los cuales
satisfacen la igualdad
Ob (c1 ψ1 + c2 ψ2 ) = c1 Oψ
b 1 + c2 Oψb 2 .
Merece la pena notar que, de la misma forma que, en general, f (g(x)) no es igual a g(f (x)),
(O
b1 O
b2 )ψ tampoco es igual a (O
b2 O
b1 )ψ.
b1 , multiplicación por x3 , y O
EJERCICIO 9. Muestre que los operadores O b2 , segunda deri-
2
d
vada dx 2 , no conmutan.
EJERCICIO 11. Repita el ejercicio anterior usando los operadores O b1 multiplicación por x
y O2 , primera derivada con respecto a x. ¿Cómo actúa O3 sobre ψ?
b b
(Lφ(x),
b b † ψ(x)).
ψ(x)) = (φ(x), L (2.4)
El dominio de L b † es el conjunto de todos los vectores ψ(x) para los cuales se cumple la
igualdad anterior. El producto interno se define ası́:
Z 2π
(φ(x), ψ(x)) = φ∗ (x)ψ(x)dx. (2.5)
0
(Oψ,
b χ) = (ψ, Oχ)
b (2.6)
para todos los vectores ψ y χ de H. De hecho, esta definición coincide con la definición de
operadores autoadjuntos que se usa en el análisis funcional. Sin embargo, veamos que se
supone que el dominio del operador es todo el espacio de Hilbert. Esta condición es posible
para una clase de operadores que se conocen como operadores compactos (operadores cuyos
autovalores son finitos todos ellos, de manera que la razón entre las normas de Oψ b y de ψ sea
finita). Sin embargo, la inmensa mayorı́a de operadores que usamos en mecánica cuántica no
son compactos, son no acotados. Los operadores multiplicación por x y derivada, por ejemplo,
no son compactos. Como los operadores acotados no pueden definirse en todo el espacio de
Hilbert, la definición anterior tiene utilidad limitada. Se podrı́a suponer, entonces, que para
operadores no acotados un operador O b serı́a hermı́tico si satisface la igualdad
(Oψ,
b χ) = (ψ, Oχ),
b ∀φ, ψ ∈ D(O),
b (2.7)
para todos los vectores ψ y χ de su dominio D(O). b Esta suposición, sin embargo, está equi-
vocada, pues la ecuación (2.7) define operadores simétricos.
Existe otra generalización del concepto de hermiticidad (de la manera que la entience
Gillespie [37]) para operadores no acotados: la autoadjunción. En tales casos es menester
definir el dominio del operador O,
b luego encontrar Ob † , su adjunto; es decir, saber como actúa
†
y qué dominio tiene. Si tanto O b cuanto O b actúan de la misma forma y tienen el mismo
dominio, entonces se dice que O b es autoadjunto [25].
Vale la pena mencionar que la noción matemática relevante para la asociación entre obser-
vables y operadores es la de autoadjunción y no la de hermiticidad, la cual a menudo se usa
como comodı́n para designar ora operadores simétricos, ora operadores autoadjuntos. Como en
muchas situaciones no es necesario hacer las distinciones entre operadores simétricos, hermı́ti-
cos y autoadjuntos, en primera aproximación se pueden usar de manera intercambiable. Sin
2.3. OPERADORES EN EL ESPACIO DE HILBERT 13
embargo, algunos fenómenos fı́sicos como el efecto Aharonov-Bohm dependen crucialmente
de que estén claras las diferencia entre estos conceptos relacionados.
Comencemos examinando un operador constante O b = c. Teniendo en cuenta que Oψ
b = cψ
y que Oχ
b = cχ, la ecuación (2.6) queda
Como el lado izquierdo es igual a c(ψ, χ) y el lado derecho igual a c∗ (ψ, χ), ambos lados son
iguales solamente si c = c∗ , es decir, si c es un número real.
Enseguida consideremos el caso del operador derivada. El lado derecho de la ecuación (2.6)
queda
∞ Z ∞
dψ ∗ (x)
Z
dχ(x)
(ψ, Oχ)
b = = ψ ∗ (x)χ(x)|∞
dx ψ ∗ (x) −∞ − dx χ(x)
−∞ dx −∞ dx
Z ∞ ∗
dψ b † ψ, χ).
= dx − χ(x) = (O
−∞ dx
En la secuencia hemos hecho una integración por partes y luego eliminamos los términos de
frontera. La razón es que para que la derivada de una función compleja pertenezca al espa-
cio de Hlbert es necesario que sea cero o tienda a cero cuando x → ±∞. Vemos que con la
eliminación de los términos de frontera hemos sido capaces de escribir (ψ, Oχ)b = (O b1 ψ, χ),
en donde O b1 es menos la derivada. Como O b1 depende de O b de la manera como acabamos de
expresarlo, en realidad hemos encontrado el operador adjunto de la derivada (que es menos
la derivada), por lo cual lo notamos O b † . Esta es la condición que nos permite encontrar el
1
adjunto de un operador. Vemos que, como los términos de superficie se anularon debido a
las condiciones sobre χ(x), las funciones ψ(x) no deberı́an satisfacer condiciones de frontera
parecidas. Sin embargo, para que menos la derivada de una función compleja pertenezca al
espacio de Hilbert, es menester que sea cero o tienda a cero cuando x → ±∞.
EJERCICIO 14. Sin preocuparse por el problema de los dominios de los operadores, usando
la definición del adjunto de un operador, muestre que el adjunto del operador O
b1 O
b2 es O b†
b† O
2 1.
En la teorı́a cuántica los autovalores y los autovectores de los operadores hermı́ticos tienen
un lugar espacial. Supongamos que V es un espacio vectorial sobre un cuerpo F (scalar field ),
y que T es un operador lineal con dominio D(T ), subespacio de V, que transforma vectores
pertenecientes a su dominio en otros vectores de V. A un vector no nulo v, elemento de D(T ),
que satisface T v = λv para algún escalar λ, se le llama autovector de T ; λ es el autovalor
correspodiente. En fı́sica cuántica, los espacios vectoriales de interés son los espacios de Hilbert
y el cuerpo de interés son los números complejos; de manera que la definición de autovalores
y autovectores, en este caso particular, se puede enunciar ası́. Si O b es un operador y ψ es un
vector de H que cumple la ecuación
Oψ
b = oψ,
EJERCICIO 16. Muestre que la función xn , con n entero, es una autofunción del operador
d
x dx . ¿Qué tuvo que suponer acerca del espacio vectorial en dónde se definió el operador?
¿Cuál es el autovalor correspondiente?
EJERCICIO 17. ¿La función cos(ax), con a real, es autofunción de qué operador no constan-
te? Si ese operador es O, b 2 ? En caso positivo,
b ¿la función cos(ax) también es autofunción de O
¿cuál es el autovalor correspondiente?
2 2
EJERCICIO 18. ¿Puede escoger la constante a de manera que ψ1 (x) = c1 e−x /σx y ψ2 (x) =
2 2
c2 xe−x /σx , en donde c1 , c2 y σx son constantes, sean ambas autofunciones del operador
d2 2
− dx 2 + ax ? En caso positivo, ¿cuáles son los autovalores correspondientes? En caso negativo,
¿los valores obtenidos para la constante son diferentes para cada una de las funciones, o es
imposible escoger a de manera que ψ1 o ψ2 sean autofunciones?
EJERCICIO 19. Muestre que si O b es un operador hermı́tico, entonces sus autovalores son
reales. (Sugerencia: Considere que las dos cantidades (ψ, Oψ)
b y (Oψ,
b ψ) son iguales si el ope-
rador O es autoadjunto, y use el hecho de que ψ es autofunción de O
b b con autovalor c.) Si
quiere ser más formal, suponga que O es un operador compacto autoadjunto, o que es un
b
operador no acotado autoadjunto, pero que los autovalores hacen parte del espectro discreto.
d
Volvamos al caso del operador −i dx . Si a es imaginario puro, la función eax es autofunción
d
de −i dx con autovalor real; si es real, el autovalor es imaginario. Al parecer, podemos inclusive
considerar que a es complejo y la función eax parece ser autofunción. ¿Existe alguna diferen-
cia fundamental entre los diferentes casos? Recuerde que hemos dicho que las autofunciones
deben pertenecer al espacio de Hilbert.
En ambos casos usted ha debido encontrar que la función eax no tiene norma finita. ¿Es-
d
te resultado implica que el operador −i dx no tiene autofunciones? Esta pregunta se puede
responder de diferentes maneras. En fı́sica se acostumbra a definir autofunciones aún cuando
estas no tengan norma finita. Sin embargo, no pueden tener un comportamiento arbitrario.
Mientras las funciones eax , a imaginario puro, tienen crecimiento limitado cuando x es muy
grande (|eax | es finito cuando x → ±∞), crecen sin cota cuando si la parte real de a no es
cero: cuando x → ∞ si la parte real de a es positiva y cuando x → −∞ si la parte real de a
es negativa. ¿Qué pasa con exp(ix3 ) por ejemplo? El uso de funciones como eiax , en donde a
es real, no es exclusivo de la mecánica cuántica. En efecto, en electrodinámica y en el estudio
de ondas, es común usar ondas planas, del tipo ei(kx−ωt) (en realidad, se usan ondas que se
comportan como superposiciones de la parte real y de la parte imaginaria de la expresión
anterior). La energı́a contenida en una onda plana, la cual se extiende por todo el espacio,
es infinita. Claramente las ondas planas no son posibles en la realidad; no podemos producir,
2.3. OPERADORES EN EL ESPACIO DE HILBERT 15
experimentalmente, ninguna onda plana. Se usan, sin embargo, porque son aproximaciones a
situaciones fı́sicas reales y porque son simples, y permiten manipulaciones algebraicas senci-
llas. Con frecuencia, también se usan en programas numéricos. En mecánica cuántica, tenemos
una situación parecida. No es posible preparar estados descritos por ψ(x) = eiax , con a real;
pero son simples, es fácil manipularlas matemáticamente, se pueden aproximar en situaciones
reales y se emplean en cálculos numéricos. Además, funciones de onda de este tipo son los
autovectores generalizados, tanto del operador de momento, como del hamiltoniano de una
partı́cula libre.
EJERCICIO 21. Muestre que si ψ1 (x) y ψ2 (x) son autofunciones del operador hermı́tico
O,
b con autovalores diferentes c1 y c2 , entonces ψ1 (x) y ψ2 (x) son ortogonales. (Sugerencia:
Considere las dos cantidades (ψ1 , Oψ
b 2 ) y (Oψ
b 1 , ψ2 ) y use el hecho de que c1 y c2 deben ser
números reales.) Si quiere ser más formal, suponga que O b es un operador compacto autoad-
junto, o que es un operador no acotado autoadjunto, pero que los autovalores hacen parte del
espectro discreto.
en donde σac designa el(los) intervalo(s) en donde se tiene el espectro continuo. Los autovecto-
res generalizados tienen también una regla de normalización, como se muestra en el siguiente
ejemplo. √ d
Los autovectores generalizados ψk , ψk (x) = eikx / 2π son autoestados del operador −i dx ,
en donde k es un número real arbitrario. Cualquier estado puede escribirse entonces como
Z ∞ Z ∞
eikx
φ= dk (ψk , φ)ψk , φ(x) = dk (ψk , φ) √ ,
−∞ −∞ 2π
en donde
∞
e−ikx
Z
(ψk , φ) = dx √ φ(x).
−∞ 2π
2 Sin embargo, existen ejemplos fı́sicos relacionados con el estudio del efecto Hall cuántico. El lector intere-
De hecho, esta última integral, que tiene sentido dentro de la teorı́a de distribuciones, es la
eikx
que nos dice que debemos usar las autofunciones √ 2π
para que su relación de ortonormalidad
sea una delta.
Estados Una partı́cula clásica unidimensional se caracteriza por los valores de su posición
y de su momento. El estado del sistema, en un instante de tiempo t, se describe mediante
(x(t), p(t)), los valores de posición y momento de la partı́cula en ese instante. Más en general,
el estado un sistema clásico se asocia con un punto del espacio de fases del sistema, la colección
de coordenadas generalizadas y de sus momentos canónicamente conjugados. Si se conoce el
estado del sistema, se conocen los valores de todos los observables del sistema (porque son fun-
ciones de las coordenadas generalizadas y de sus momentos canónicos). Además, si se conocen
las fuerzas sobre el sistema y el estado del sistema en un instante, se puede conocer el estado
del sistema en cualquier otro instante. Cualquiera que sea el objeto matemático escogido para
representar los estados de un sistema cuántico, debe contener la información acerca de sus
observables y deberı́a ser posible conocer el estado en el futuro, cuando se conoce el estado
en un tiempo dado.
Postulado 1. Todo estado fı́sico de un sistema dado se describe mediante un vector de norma
unidad de algún espacio de Hilbert H y todo vector de norma unidad de ese espacio corres-
ponde a un posible estado fı́sico. Vectores que difieren por una fase, ψ(x) y eiφ ψ(x), donde
φ es un número real, describen el mismo estado fı́sico. Todo lo que se pueda saber acerca del
sistema en un instante de tiempo t está codificado en ψt (x), la función de onda del sistema
en ese instante.
Si pensamos en las funciones αi (x) como ejes generalizados, podemos pensar que el estado ψ
se puede escribir como un vector columna (columna por convención),
(α1 , ψ)
.
ψ = (α2 , ψ) .
..
.
EJERCICIO 22. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) =
δ(x − x0 ) puede describir un estado de este sistema? En caso de que la respuesta sea negativa,
i) encuentre una forma de “arreglar” la función para que la nueva función sı́ pueda describir
un estado de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
EJERCICIO 23. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas
se encontró con el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas
planas unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para que la
nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii) muestre que
no se puede arreglar.
EJERCICIO 24. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene
espı́n hacia arriba y espı́n hacia abajo. Escriba el estado más general de una partı́cula de
espı́n 1/2, tanto en el formalismo de Dirac como en el formalismo en el que los estados se
representan como vectores columna.
EJERCICIO 25. Escriba el estado más general de una partı́cula de dos espines 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan como
vectores columna.
EJERCICIO 26. Escriba un estado de dos partı́culas cuánticas tridimensionales. ¿Qué re-
quisitos deberı́a cumplir esta función para poder describir un estado cuántico? La función que
escribió ¿puede escribir un estado cuántico? Justifique su respuesta.
EJERCICIO 27. ¿Cómo se puede saber si un sistema está en un estado particular?
EJERCICIO 28. ¿Se puede medir el estado de un sistema?
EJERCICIO 29. ¿El estado cuántico describe un único sistema?
Se argumenta que los observables se escogen autoadjuntos para asegurar autovalores reales,
los cuales son los únicos que se obtienen en un experimento. Además, porque cualquier estado
de un sistema puede escribirse como una combinación lineal de los autovectores de cualquier
operador autoadjunto del sistema. La tercera razón en favor de los operadores autoadjuntos
tiene que ver con dos postulados posteriores. Para cada sistema fı́sico existe un operador lineal
que aparece en la ecuación de evolución temporal; si este operador es autoadjunto, entonces
la evolución es unitaria y hay conservación de la probabilidad.
[artı́culo con 2 ruidos RWA]
Aunque son buenos argumentos, podrı́a haber alternativas. Por ejemplo, un operador
podrı́a representar dos observables, de manera que la parte real de los autovalores complejos
de este operador correspondiese a un observable, y la imaginaria al otro.
Hace algunos años se encontró que existen operadores no autoadjuntos, con simetrı́a P T
(reflexión sobre un eje e inversión de movimiento), cuyos autovalores puramente reales [34].
Sin embargo, dado que estos operadores son autoadjuntos en espacios con producto escalar
indefinido (espacios de Krein), es posible relacionarlos con otros operadores, generalmente no
locales, que son autoadjuntos en un espacio de Hilbert [35].
Muchos operadores autoadjuntos presentan tanto espectro discreto como continuo. La pre-
sencia del primero es interesante porque, a diferencia de la teorı́a clásica, en la formulación
cuántica no todos los valores de un observable serı́an posibles.
Ya que los estados pueden representarse mediante vectores, es natural pensar que los
operadores lineales puedan representarse mediante matrices. Cuando se aplica un operador
lineal a un vector se obtiene otro vector, Oψ(x)
b = χ(x). Tanto ψ cuanto χ puede escribirse
en una base ortonormal, compuesta, por ejemplo, por las funciones α1 (x), α2 (x), · · ·
X X
ψ(x) = (αi , ψ)αi (x), χ(x) = (αi , χ)αi (x).
i i
Este resultado, que puede interpretarse como un producto de una matriz por un vector
(α1 , Oαb 1 ) (α1 , Oαb 2) · · · (α1 , ψ) (α1 , χ)
(α2 , Oα b 1 ) (α2 , Oαb 2 ) · · · (α2 , ψ) = (α2 , χ) ,
.. ..
.. .. ..
. . . . .
b → xψ(x),
Xψ
dψ(x)
Pbψ → −i~ ,
dx
h
en donde ~ es la constante de Planck (reducida), definida como ~ = 2π , siendo h la constante
de Planck.
Este postulado permite relacionar las variables clásicas con las cuánticas. Por ejemplo, el
Hamiltoniano cuántico de los sistemas unidimensionales se puede obtener a partir de la versión
clásica, haciendo uso de las reglas anteriores. Idem para la versión cuántica del momento
angular. cuando se tienen productos de potencias de la posición con potencias del momento,
surge el problema del ordenamiento de los operadores en la descripción cuántica. Por ejemplo,
xp podrı́a representarse
por
X P o por P X. Como el operador debe ser hermı́tico, se escoge
bb bb
el operador 12 X b . Para x2 p no se puede emplear el mismo truco, pues se tienen
b Pb + PbX
las alternativas independientes O b1 = 1 X b2 y O
b 2 Pb + PbX b2 = X b PbX;
b ası́ podemos usar
2
c1 O
b1 + c2 Ob2 , en donde los números reales c1 y c2 deben sumar uno.
Hay dos postulados que relacionan la teorı́a con los resultados de los experimentos.
Postulado 3. Si se mide el observable A, los únicos resultados posibles son ai , los auto-
valores del operador A. b Si antes de la medición el sistema se encuentra en el estado ψ, la
mejor predicción que puede hacerse es que la probabilidad de que se obtenga el resultado ai
es p(a0 , a1 ) = |(αi , ψ)|2 , en donde αi es el autovector asociado a ese autovalor.
en donde usamos el hecho de que p1 = |(α1 , ψ)|2 = (ψ, α1 )(α1 , ψ). Como αi es autovector de
A on autovalor ai , tenemos
Ā = (ψ, α1 )(Aα b 2 , ψ) + · · · .
b 1 , ψ) + (ψ, α2 )(Aα
Para P
convencernos de la última igualdad, examinemos el producto escalar (ψ1 , ψ2 ). Como
ψ1 = i (αi , ψ1 )αi , (y se tiene una expresión similar para ψ2 ) el producto escalar queda
X X XX
(ψ1 , ψ2 ) = ( (αi , ψ1 )αi , (αj , ψ2 )αj ) = ((αi , ψ1 )αi , (αj , ψ2 )αj )
i j i j
XX XX
= (αi , ψ1 )∗ (αj , ψ2 )(αi , αj ) = (ψ1 , αi )(αj , ψ2 )δi,j
i j i j
X
= (ψ1 , αj )(αj , ψ2 ).
j
Comparando este resultado con la ecuación (2.8), vemos que el valor esperado del observables
A se puede escribir de la forma siguiente
Z ∞
Ā = (ψ, Aψ)
b = dx ψ ∗ (x) Aψ(x)
b . (2.9)
−∞
Recordando el postulado 6, vemos que el valor esperado del momento se puede escribir como
Z ∞
dψ(x)
P̄ = (ψ, Pbψ) = −i~ dx ψ ∗ (x) .
−∞ dx
Postulado 5. La evolución temporal del estado de un sistema aislado está dada por la
ecuación de Schrödinger
∂Ψ(x, t)
i~ = HΨ(x, t),
∂t
en donde H un operador hermı́tico lineal caracterı́stico del sistema, conocido como el Hamil-
toniano del sistema, y Ψ(x, t) es otra notación para ψt (x). .
22 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
2.5. Lectura del postulado de Estado
Schrödinger [36] interpreta el estado cuántico como un catálogo de posibles resultados.
Hay un debate actual: ¿el estado es óntico o es ontológico?
¿El estado cuántico describe un sistema único?
Sergei Winitzki anota que las teorı́as fı́sicas pueden suponer un conocimiento completo
o incompleto del estado de los sistemas fı́sicos. En el último caso, las teorı́as se denominan
estadı́sticas. La concepción usual de la mecánica cuántica supone que el estado del sistema
contiene la información completa del mismo. Albert Einstein, por ejemplo, tenı́a una concep-
ción de que la mecánica cuántica era una teorı́a efectiva. La teorı́a de Bohm-de Broglie de la
mecánica cuántica tiene presupuestos similares. Existen trayectorias, pero no son accesibles.
Además, dichas trayectorias dependen del estado cuántico del sistema.
Continúa Winitzki recordando que las teorı́as fı́sicas pueden ser deterministas o probabilis-
tas. Esta es una de las rupturas más importantes de la mecánica cuántica con respecto a otras
teorı́as, pues es probabilista. Este aspecto de la mecánica cuántica también fue duramente
criticado por Einstein, quien acuño la famosa frase “Dios no juega a los dados”.
1. Haga una lista (puede ser vacı́a) de palabras cuyo significado no conoce.
Entre las expresiones anotadas están: sharp distinction (distinción marcado), y ψ is
defined up to an overal phase (ψ se define hasta una fase general).
2. Haga una lista (puede ser vacı́a) de las oraciones que no entendió completamente y de
las dificultades que tuvo con cada una de ellas.
ψ(x, t) is properly defined as a function of x alone, and the parameter t serves merely
to label different vectors in H.
Olvidé decir que uno puede imaginarse una serie de vectores, uno por cada instante de
tiempo.
3. Haga una lista (puede ser vacı́a) de conceptos con los cuales no se encuentra familiari-
zado, o que no recuerda bien, y escriba cuales aspectos no recuerda bien.
No se recuerda bien el concepto de espacio de Hilbert.
4. Haga una lista (puede ser vacı́a) de notación matemática con la cual no se encuentra
familiarizado.
7. Identifique porciones del texto que le parezcan vagas o equivocadas. Escriba de manera
clara por qué tiene esa impresión.
8. Identifique porciones del texto para las cuales tenga evidencia o aportes no contenidos
en el texto, que apoyen el texto.
Se hace una discusión del papel de la teorı́a en la fı́sica, teniendo en cuenta que es una
ciencia que se basa en mediciones. Cuando medimos, comparamos con respecto a un
patrón. Ası́, las mediciones arrojan como resultado una serie de números con unidades.
Desde un punto de vista utilitario, el papel de la teorı́a es el de organizar los datos que se
obtienen de las observaciones, el de condensar la información referente a las mediciones.
Se procede a través de la modelación matemática de los sistemas fı́sicos. Se espera que
tal modelación sirva para predecir y manipular.
La teorı́a crea una contrapartida a los sistemas fı́sicos, que le asigna un sı́mbolo ma-
temático a cada “cosa” del sistema fı́sico, a través de unas reglas de traducción. Estas
2.5. LECTURA DEL POSTULADO DE ESTADO 23
reglas deben funcionar en los sentidos. Con frecuencia se modela un sistema fı́sico, se
manipulan los sı́mbolos siguiendo las reglas de la matemática y se obtienen nuevos enun-
ciados matemáticos, los cuales se traducen de vuelta a los sistemas fı́sicos, en donde se
convierte en enunciados sobre los sistemas mismos y no sobre sus sı́mbolos.
9. Haga el ejercicio 25. (Si ψ(x) tiene norma uno y |c|2 = 1, muestre que cψ(x) tiene norma
1).
2 2
10. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = e−x /x0 puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Basta normalizar la función de onda. La función de onda tiende a cero cuando x → ±∞.
¿Este requisito es necesario? Se muestra un ejemplo de función de onda de cuadrado
integrable que no tiende a cero cuando x → ±∞ (de hecho, estos lı́mites no existen para
esa función).
11. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = δ(x − x0 ) puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Razones a considera de por qué podrı́a ser una función de onda. Supongamos que se
mide la posición de la partı́cula y se encuentra en la posición x0 . La función δ(x − x0 )
¿describirı́a el nuevo estado del sistema? Objeción: cuando se mide nos quedarı́amos sin
sistema. Sin sistema, no hay estado. Tesis: existen mediciones no destructivas. Ejemplo:
suponga que se tiene un átomo de Hidrógeno en el estado |nmli = |210i en el vacı́o
electromagnético. Ası́, el estado total es |210i ⊗ |0i. Por evolución temporal, el sistema
quedará en una superposición de estados |Ψ(t)i = c1 |210i⊗|0i+c2 |100i⊗|1i , en donde
ci son coeficientes dependientes del tiempo. Si en un instante de tiempo se detecta un
fotón, entonces sabremos que el átomo se encuentra en el estado |100i. Este es un ejemplo
de medición no destructiva.
Esta función no puede normalizarse.
Objeción: Cuando se hacen mediciones de posición, lo que se obtiene es el valor espera-
do.
Réplica: No. Cuando se hacen muchas mediciones, se pueden obtener no solo los momen-
tos estadı́sticos, sino también la distribución de probabilidad. Sin embargo, basta una
medición para hacer una preparación. Según Gillespie [37], tenemos que ((Postulate 4.
A measurement of an observable generally causes a drastic, uncontrollable alteration in
the state vector of the system; specifically, regardless of the form of the state vector just
before the measurement, immediately after the measurement it will coincide with the
eigenvector corresponding to the eigenvalue obtained in the measurement.))
Objeción: Esta función no describe un estado porque viola el principio de incertidumbre
de Heisenberg.
Réplica: No puede decirse que haya violación del principio de incertidumbre, porque el
producto de desviación estándar nula (en posición) por una desviación estándar infi-
nita (en momento) no está bien definido. Por otra parte, dentro del formalismo de la
mecánica cuántica, el principio de incertidumbre es una consecuencia de los postulados.
¿Cuáles son las suposiciones que llevan al principio de incertidumbre? Hay funciones de
onda normalizables que no tengan desviación estándar bien definida? (Lorentziana)
Algunas de las alternativas que podemos considerar son las siguientes.
a) El postulado 4 es falso.
24 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
b) El postulado 1 no es necesario, en el sentido de que se podrı́an tener funciones
de ondas no normalizables. En este caso, tal vez sea necesario inventar o usar
otras matemáticas. Según Gillespie [37] ((Postulate 1. Every possible physical
state of a given system corresponds to some normed Hilbert space vector ψ(x),
and conversely, every normed Hilbert space vector ψ(x) corresponds to a possible
physical state of the system. This correspondence between physical states and
normed vectors in H is one-to-one, except that two normed H-vectors that differ
only by an overall scalar factor of modulus unity correspond to thesame physical
state. The particular H-vector to which the state of the system corresponds at time
t is denoted by Ψt (x) and is called the state vector of the system; the system is
said to “be in the state Ψt (x).” The state of a system is completely described by
the state vector in the sense that anything which is in principle knowable about
the system at time t can be learned from the function Ψt (x).))
c) Una medición no puede dar como resultado x = x0 .
12. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas se encontró con
el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas planas
unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para
que la nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii)
muestre que no se puede arreglar.
La función eikx es una autofunción no normalizable de la partı́cula libre. Se usa en la
teorı́a de scattering. Se puede definir en una caja, de manera que ahora está normalizada
(esto se hace en estado sólido).
13. Escriba una función que describa el estado cuántico de una partı́cula tridimensional.
Muestre que dicha función puede escribir un estado cuántico.
14. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene espı́n hacia arriba
y espı́n hacia abajo. Escriba el estado más general de una partı́cula de espı́n 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan
como vectores columna.
Considere los estados
1 1 1 1
|ψ1 i = cos φ ,
+ sin φ , −
2 2 2 2
1 1 iθ
1 1
|ψ2 i = cos φ ,
+ e sin φ , − .
2 2 2 2
¿Uno de ellos es más general que el otro? ¿La fase θ es una fase total? Si no lo es,
¿qué información fı́sica contiene?, ¿en qué experimento aparece esa información?
15. Escriba el estado más general de dos partı́culas de espı́n 1/2, tanto en el formalismo de
Dirac como en el formalismo en el que los estados se representan como vectores columna.
2.5. LECTURA DEL POSTULADO DE ESTADO 25
16. Escriba un estado de dos partı́culas cuánticas tridimensionales. Muestre que dicha fun-
ción puede escribir un estado cuántico.
17. Escriba un estado posible de un electrón. Muestre que dicha función puede escribir un
estado cuántico.
18. ¿Cómo se puede saber si un sistema está en un estado particular?
19. ¿Se puede medir el estado de un sistema? En este sentido, ¿qué es el estado de un
sistema? ¿Qué es la tomografı́a cuántica?
en donde |+i y |−i son los autovectores de σz con autovalores 1 y -1, respectivamente.
Suponga que quiere calcular los valores esperados correspondientes a σx , σy y σz del
primer espı́n. Manipule las expresiones hasta que pueda escribirlas como
27
28 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
podrı́a verificarse la validez de esta suposición en el montaje clásico de ondas estacionarias
en cuerdas (experimento de Melde). Es razonable tener en cuenta únicamente la tensión y no
el peso (total de la cuerda), si la magnitud del último es mucho menor que la magnitud de
la primera. También vamos a suponer que las excursiones de la cuerda son pequeñas, en un
sentido que se precisará en la derivación.
Usamos un método elemental para encontrar la ecuación de movimiento de la cuerda.
Tomemos un segmento de cuerda genérico, conforme se muestra en la figura 3.1. Las coorde-
nadas de los extremos izquierdo y derecho de dicho segmento son, respectivamente, (x, y(x))
y (x + ∆x, y(x + ∆x)). La tensión que ejerce el segmento de cuerda inmediatamente anterior
(posterior) sobre el segmento analizado es T 1 (T 2 ). En la figura se ha tenido en cuenta que la
cuerda es perfectamente flexible y, por lo tanto, la fuerza de contacto entre partes adyacentes
de la cuerda es tangente a la curva que describe la cuerda.
Figura 3.1: Cuerda con extremos fijos. En el detalle, fuerzas que actúan sobre un segmento in-
finitesimal de cuerda. Nicoguaro [CC BY 4.0 ([Link]
from Wikimedia Commons.
∂ 2 y(x + ∆x
∆x 2 , t)
−T1 cos αex +T1 sin αey +T2 cos βex −T2 sin βey = ρ x + ∆x ey . (3.4)
2 ∂t2
La suposición de que las vibraciones son pequeñas se expresa matemáticamente como
α, β 1, de manera que cos α ≈ cos β ≈ 1, y por tanto, T1 = T2 = T. Empleando esta
igualdad en la ecuación de movimiento a lo largo del eje y,
∂ 2 y(x + ∆x
∆x 2 , t)
T sin α − T sin β = ρ x + ∆x . (3.5)
2 ∂t2
vemos que el lado derecho es de orden ∆. Por otro lado, el lado izquierdo también es de
ese orden, como se ve un poco más adelante. Teniendo en cuenta que α es ángulos pequeño,
sin α ≈ tan α. Esta última cantidad es la tangente a la curva y(x, t), es decir,
∂y(x, t)
tan α = . (3.6)
∂x
De manera semejante,
∂y(x + ∆x, t)
sin β ≈ tan β = , (3.7)
∂x
en donde tuvimos en cuenta que tan β es la tangente a la curva en el punto x + ∆x. Expan-
diendo a primer orden en ∆x tenemos
∂y(x, t) ∂ 2 y(x, t)
sin β ≈ + ∆x . (3.8)
∂x ∂x2
Usando este resultado en la ecuación (3.5), tenemos
∂ 2 y(x, t) ∂ 2 y(x + ∆x
∆x 2 , t)
∆xT 2
= ρ x + ∆x 2
. (3.9)
∂x 2 ∂t
Finalmente, expandiendo el lado derecho a primer orden en ∆x y cancelando el factor común,
obtenemos la ecuación de ondas
∂ 2 y(x, t) ∂ 2 y(x, t)
T = ρ (x) . (3.10)
∂x2 ∂t2
Recapitulando, si se suponen vibraciones puramente transversales en una única dirección,
tangentes a la cuerda pequeñas y se toma en cuenta únicamente la tensión, las vibraciones
satisfacen la ecuación de ondas (3.10).
Para vibraciones también a lo largo de z, bajo las mismas suposiciones encontramos eq-
cuciones de onda análogas, como se muestra en la derivación que hacemos enseguida.
Para extender este resultado, vamos a usar un marco más general. Describimos la cuerda
en un tiempo t mediante la ecuación paramétrica
∂ 2 r(ξ + ∆ξ/2, t)
ρ(ξ + ∆ξ/2)∆ξ = −T (ξ, t) + T (ξ + ∆ξ, t), (3.12)
∂t2
en donde hemos supuesto que si existen fuerzas diferentes a la tensión, son pequeñas con
relación a esta. Expandiendo a primer orden en ∆ξ y cancelando el factor común, encontramos
la ecuación de ondas
∂ 2 r(ξ, t) ∂T (ξ, t)
ρ(ξ) = . (3.13)
∂t2 ∂ξ
Hasta ahora no hemos tenido en cuenta que, como la cuerda es perfectamente flexible (no
ofrece resistencia a que se doble), la fuerza de contacto T (ξ, t) debe estar dirigida en la
dirección de la tangente a la curva, es decir,
∂r(ξ,t)
∂ξ
∂r(ξ,t)
.
T (ξ, t) = T (ξ, t)
(3.14)
∂ξ
Si las vibraciones son puramente transversales, entonces la cuerda se puede describir por la
curva ξex +y(ξ, t)ey +z(ξ, t)ez y su tangente será ex + ∂y(ξ,t) ∂z(ξ,t)
∂ξ ey + ∂ξ ez . Por otro lado, si las
vibraciones son pequeñas, se cumple que ∂y(ξ,t)
∂ξ 1 y ∂z(ξ,t)
∂ξ 1. Ası́, podemos aproximar
la tensión por
∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T (ξ, t) ex + ey + ez . (3.15)
∂ξ ∂ξ
Con estas consideraciones, la componente x de la ecuación de la cuerda es
∂T (ξ, t)
0= , (3.16)
∂ξ
cuya solución es T (ξ, t) = T (t). Suponiendo que esta tensión no se cambia (como en el caso
del experimento de Melde), tenemos que T (ξ, t) = T. Ası́, la fuerza de tensión es
∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T ex + ey + ez , (3.17)
∂ξ ∂ξ
∂ 2 y(x, t) 1 ∂ 2 y(x, t)
2
= 2 , (3.19)
∂x c ∂t2
p
en donde definimos c = T /ρ..
Hagamos un cambio de variables.
1 1
ξ = x + ct, η = x − ct; x= (ξ + η) t = (ξ − η) (3.20)
2 2c
Usando la regla de la cadena tenemos
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = + , (3.21)
∂ξ ∂ξ ∂x ∂ξ ∂t 2 ∂x 2c ∂t
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = − . (3.22)
∂η ∂η ∂x ∂η ∂t 2 ∂x 2c ∂t
Ahora, si calculamos
∂2 1 ∂2
∂ ∂ ∂ 1 ∂ ∂ 1 ∂
4 = + − = − , (3.23)
∂ξ ∂η ∂x c ∂t ∂x c ∂t ∂x2 c2 ∂t2
vemos que la ecuación de ondas, en las nuevas variables se escribe
∂ 2 y(ξ, η)
4 = 0. (3.24)
∂ξ∂η
Integrando con respecto a ξ obtenemos
∂y(ξ, η)
= g1 (η). (3.25)
∂η
32 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Ahora, integrando con respecto a ξ tenemos
Z
y(ξ, η) = dη g1 (η) + f (ξ) = f (ξ) + g(η). (3.26)
Por otro lado, derivando cada término de y(x, t) = f (x + ct) + g(x − ct) con respecto a su
argumento, y tomando t = 0, encontramos la identidad
df (z) dg(z)
V (x) = c −c . (3.32)
dz z=x dz z=x
3.1. LA CUERDA VIBRANTE 33
Cambiando x por ξ e integrando (3.32) sobre ξ en el intervalo de 0 a x, la ecuación corres-
pondiente puede escribirse como
1 x
Z
f (x) − g(x) = dξ V (ξ). (3.33)
c 0
1 x 1 x
Z Z
1 1
f (x) = Y (x) + dξ V (ξ) , g(x) = Y (x) − dξ V (ξ) . (3.34)
2 c 0 2 c 0
Finalmente, recordando que la primera función tiene como argumento x + ct, y que la segunda
como argumento x − ct, la solución general será
La controversia aludida en la sección 3.1.1 se inició cuando Euler permitió que Y y V no fuesen
funciones en el sentido ordinario, sino curvas que se pueden dibujar a mano, en particular,
curvas con esquinas, tales como la cuerda pulsada.
1 d2 X(x) 1 d2 T (t)
= . (3.37)
X(x) dx2 c2 T (t) dt2
Como un lado es función solo de x y el otro solo de t, la igualdad se cumple cuando cada lado
es igual a una constante:
d2 X(x) d2 T (t)
= λX(x). = c2 λT (t). (3.38)
dx2 dt2
Las soluciones a la ecuación de X(x) se pueden buscar haciendo el Ansatz X(x) = eax ,
dX(x) d2 X(x)
= aeax , = a2 eax = λX(x) = λeax . (3.39)
dx dx2
34 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
√ √
Se debe cumplir la igualdad a2 = λ, por lo cual se tiene a = λ o√a = − √λ. Las soluciones
independientes a la ecuación
√
diferencial
√
de X(x) son, por lo tanto, e λx y e− λx , y su solución
general es X(x) = Ae λx + Be− λx Notemos, sin embargo que, si λ = 0 ambas soluciones
2
colapsan en una, X(x) = 1. En ese caso, es mejor volver a la ecuación original d dx X(x)
2 =0e
integrarla dos veces,
dX(x)
= A, X(x) = Ax + B, (3.40)
dx
siendo A y B constantes. Ası́, las dos soluciones independientes son X(x) = 1 y X(x) = x.
Otro
√ hecho
p que debemos notar es que λ puede ser positivo o negativo. En ese último caso,
λ = i |λ|.
Las soluciones a la ecuación diferencial para T (t) son completamente análogas a aquellas
para X(x), es decir, T (t) = Ct + D, C y D constantes, si λ = 0 y
√ √
T (t) = Cec λt
+ De−c λt
, (3.41)
y cuando λ 6= 0, √ √ √ √
y(x, t) = (Ae λx
+ Be− λx
)(Cec λt
+ De−c λt
), (3.43)
El siguiente paso es escontrar vı́nculos entre las constantes de la solución general, que
aparecen cuando se aplican las condiciones de frontera y(0, t) = 0 = y(L, t). Vemos que las
condiciones restringen las funciones de x. En efecto, deben cumplirse las igualdades
si λ = 0 y
√ √
y(0, t) = (A + B)(Ce λt
+ De− λt
) = 0, (3.45)
√ √ √ √
y(L, t) = (Ae λL
+ Be− λL
)(Cec λt
+ De−c λt
) = 0, (3.46)
en donde hicimos uso de la identidad de de Moivre, eix = cos x + i sin x. Esta ecuación
claramente tiene soluciones no triviales, pues la función sin x tiene cero en x = nπ, siendo n un
entero positivo (n = 0 da la solución trivial y, como la función seno es impar, las soluciones con
√ 2 2
n y −n no son independientes). Ası́, las soluciones corresponden a −λL = nπ, λn = − nLπ2 ,
en donde se le ha agregado a λ una etiqueta (n).
3.1. LA CUERDA VIBRANTE 35
Las soluciones no triviales completas tienen en cuenta la parte temporal y se escriben
como nπx nπc nπc
yn (x, t) = 2iA sin (Cei L t + De−i L t ). (3.49)
L
Tanto la parte real como la parte imaginaria de (3.49) son soluciones; es decir,
nπx nπc
yn1 (x, t) = sin cos t (3.50)
L L
como nπx nπc
yn2 (x, t) = sin sin t (3.51)
L L
son las soluciones buscadas. Cada una de esta soluciones corresponde a una onda estacionaria,
ya que la onda no avanza sino que permanece en el mismo lugar (sin embargo, su amplitud
instantánea sı́ cambia). Las funciones sin(nπx/L) describen los llamados modos normales; el
primero se conoce como el modo fundamental, y los demás como modos excitados (también
conocidos como armónicos del modo fundamental).
Ahora, la solución general de la ecuación de ondas es la combinación lineal de todas las
soluciones encontradas, es decir,
∞
X
y(x, t) = (An yn1 (x, t) + Bn yn2 (x, t)) . (3.52)
n=1
De manera más explı́cita, la solución general de la cuerda vibrante (para vibraciones trans-
versales a lo largo de y) es
∞
X nπx nπc nπx nπc
y(x, t) = An sin cos t + Bn sin sin t , (3.53)
n=1
L L L L
en donde las constantes An y Bn deben determinarse. Bernoulli intuyó esta solución, pero
no consideró los términos asociados a Bn (corresponde a velocidad inicial nula). Además, no
mostró cómo podrı́an encontrarse los coeficientes An .
Para completar la solución de Bernoulli, debemos mostrar como hallar los coeficientes An
y Bn , suponiendo que conocemos la posición inicial de la cuerda Y (x) y su velocidad V (x).
Haciendo t = 0 en la solución, encontramos
∞
X nπx
y(0, t) = An sin = Y (x). (3.54)
n=1
L
Ası́, tenemos la expresión para los coeficientes An . Para encontrar los coeficientes Bn , se
procede de forma similar. Se deriva la solución con respecto al tiempo, se hace t = 0, y se
iguala a la velocidad inicia conocidal. Luego se multiplica por sin nπx
L y se usan las integrales
(3.55) y (3.56). El resultado final es
∞
!
Z L
X 2 mπξ nπx nπc
y(x, t) = dξ sin y(ξ, 0) sin cos t (3.59)
n=1
L 0 L L L
∞ Z L !
X 2 mπξ ∂y nπx nπc
+ dξ sin (ξ, 0) sin sin t ,
n=1
nπc 0 L ∂t L L
Figura 3.2: Figuras de Lissajou para ondas de igual amplitud, una de ellas con frecuencia
igual al doble de la otra.
3.2. POLARIZACIÓN EN CUERDAS 37
Para analizar una situación más sencilla que la solución general, consideremos solo un
término de cada suma,
nπx nπc mπx mπc
r(x, t) = An sin cos t + φn ey + Bm sin cos t + χm ez .
L L L L
Si tomamos un punto particular x = x0 , podemos escribir
e cos nπc t + δ ez .
e cos nπc t̃ ey + B
r(x0 , t̃) = A
L L
El lector atento habrá notado que hemos omitido el subı́ndice de las constantes A y B. Esta
omisión se debe a que la amplitud relativa de las dos ondas no depende del punto particular
x0 (siempre y cuando la onda no se anule en el punto escogido), aunque las amplitudes
absolutas sı́. Esto se debe a que, si multiplicamos ambas amplitudes por el mismo factor, la
curva obtenida es la misma, ampliada o reducida. Con el fin de crean un patrón, vamos a
considerar casos en los cuales A e2 + B
e > 0, eb > 0 y A e 2 = 1. Una manera de parametrizar es
A e = sin α, 0 ≤ α ≤ π, de modo que
e = cos α, B
Figura 3.3: Figuras de Lissajous lineales. Frecuencias iguales, en fase (δ = 0), con amplitudes
diferentes (cos(θ), sin(θ) para θ = 0 (arriba a la izquierda), π/4 (arriba a la derecha), π/2
(abajo izquierda) y 3π/4 (abajo a la derecha)).
donde ω = kc. Para una cuerda infinitamente larga, todos los valores de k son posibles. Vamos
a utilizar la forma compleja de la ecuación, es decir, vamos a describir las vibraciones de la
cuerda mediante la ecuación
q
Aquı́ hemos definido la amplitud A0 = A20y + A20z y el vector de polarización = y ey +z ez .
Tanto las figuras de Lissajous como el vector de polarización tienen en cuenta dos elementos
importantes: el ángulo de desfase entre las componentes ortogonales de la polarización y la
amplitud relativa de las mismas.
Notemos que el vector de polarización es un vector bidimensional que tiene entradas com-
plejas en general. De manera implı́cita estamos diciendo que cuando estos vectores se multipli-
can por un número complejo (un escalar) o cuando se suman vectores con entradas complejas
se obtiene otro vector del mismo tipo. (Existen varias propiedades que satisfacen estas opera-
ciones: la adición de vectores es asociativa y conmutativa, existen el cero y el inverso aditivo;
la multiplicación por escalar es compatible con la multiplicación entre escalares, existe la uni-
dad, la multiplicación por escalar es distributiva con respecto a la suma de vectores y con
respecto a la suma de escalares).
3.2. POLARIZACIÓN EN CUERDAS 39
Figura 3.4: Figuras de Lissajous lineales 2. Frecuencias iguales, en contrafase (δ = π), con
amplitudes diferentes (cos(θ), sin(θ) para θ = 0 (izquierda), π/4 y π/2 (derecha)).
Figura 3.5: Elipses de Lissajous. Amplitudes iguales θ = π/4, con desfases iguales a δ =
0, π/6, π/3, π/2.
Los elementos de un espacio vectorial pueden escribirse usando una convención conveniente.
Dos formas usuales de describir vectores son usar una flecha encima del sı́mbolo que designa
el vector y escribir el sı́mbolo en negrita. Aquı́, a los elementos del espacio vectorial V, los
vectores, los hemos denotado por |Ψi , |χi , etc.
Multiplicación por escalar:
A los escalares, los elementos de campo F los hemos escrito como a, b, c. Como escalares vamos
a emplear los números complejos.
40 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
que dé como resultado el vector cero, a no ser aquella en que todos los escalares son cero.
El espacio vectorial V es de dimensión n (n < ∞) si existe al menos un conjunto de n
vectores linealmente independientes, tal que cualquier vector pueda expresarse como
X
f= ci f i (3.68)
Vale la pena notar que los elementos del primer vector se conjugan (conjugación compleja).
Parecerı́a que el valor del producto interno dependiese de la base, pero no es ası́. El pro-
ducto
p interno induce una métrica, es decir, una noción de distancia. En efecto, d(a, b) =
(a − b, a − b) satisface los requerimientos de una distancia: la distancia entre dos vectores
es no negativa, y es cero únicamente cuando los dos vectores son iguales, la distancia entre dos
vectores es menor o igual a la suma de las distancias entre ellos y un tercer vector arbitrario
(desigualdad triangular).
El producto interno permite introducir la noción de ortogonalidad: dos vectores son or-
togonales si su producto interno se anula. Por ejemplo, si a = ey + iez y b = ey − iez , el
producto interno (a, b) es igual a
Se dice que un conjunto de vectores es ortonormal si los vectores son ortogonales entre sı́,
y si la norma de cada uno de ellos es uno. Se dice que un conjunto de vectores es completo si
cualquier vector se puede escribir como una combinación lineal de estos vectores. Un conjunto
de vectores es una base ortonormal si es ortonormal y completo. En el ejemplo, los vectores
1 1
√ (ey + iez ) y √ (ey − iez ),
2 2
es una base ortonormal para vectores complejos en el plano y-z.
Supongamos que a1 y a2 forman una base ortonormal, y que d es un vector arbitrario
(del mismo espacio vectorial). Por definición, podemos expresar el vector arbitrario como
combinación lineal de los vectores de la base:
d = d1 a1 + d2 a2 .
Hacemos el producto escalar del vector a1 con cada lado de la ecuación anterior.
en donde hemos empleado la propiedades del producto escalar. Explı́citamente estas propie-
dades son la simetrı́a de conjugación (a1 , a2 ) = (a2 , a1 )∗ , linealidad en el segundo argumento
(a1 , c2 a2 + c3 a3 ) = c2 (a1 , a2 ) + c3 (a1 , a3 ) y positividad ((a, a) ≥ 0, en donde la igualdad
solo ocurre para el vector cero). Como el vector a1 tiene norma uno (a1 , a1 ) = 1 y como es
perpendicular a a2 , entonces (a1 , a2 ) = 0. Ası́, obtenemos,
(a1 , d) = d1 . (3.72)
De la misma forma, podemos encontrar una expresión para d2 . Entonces, cualquier vector
arbitrario d puede escribirse como
EJERCICIO 34. En la figura 3.6 se muestran varias situaciones de una cuerda vibrante.
A partir de la descripción matemática de las ondas correspondientes a los literales a), b) y c),
encuentre los correspondientes vectores de polarización.
Consideremos el caso de una cuerda vibrante tendida a lo largo de x, en cuyo camino se
pone una rendija angosta a lo largo de y (figura 3.6). Si representamos el vector de polarización
e la base {ey , ez }, la acción de la rendija angosta puede representarse por la siguiente matriz
. 1 0
Rendija = . (3.74)
0 0
∇ × (∇×) = ∇ (∇·) − ∇2 ,
e intercambiando las derivadas espaciales con las temporales, esta ecuación queda ası́
∂
∇ (∇ · E(r, t)) − ∇2 E(r, t) = − (∇ × B(r, t)) . (3.77)
∂t
Si usamos las ecuaciones de Maxwell (3.76a) y (3.76c) en (3.77) obtenemos la ecuación de
ondas con fuentes
1 ∂ 2 E(r, t) 1 1 ∂j(r, t)
∇2 E(r, t) − 2 2
= ∇ρ(r, t) + ,
c ∂t 0 0 c2 ∂t
que en ausencia de cargas y corrientes libres se reduce a
1 ∂ 2 E(r, t)
∇2 E(r, t) − = 0. (3.78)
c2 ∂t2
La ecuación (3.78) es una ecuación de ondas tı́pica que muestra que c es la rapidez de pro-
pagación de las ondas electromagnéticas en el vacı́o. Ası́, es posible identificar la luz como
ondas electromagnéticas que pertenecen a una región espectral particular, aquella en la que
las longitudes de onda son del orden de cientos de nanómetros.
44 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Soluciones particulares
Algunas soluciones de la ecuación de onda, correspondientes a ondas viajeras, tienen la forma
En efecto, la segunda derivada parcial del campo eléctrico con respecto a la coordenada
x puede expresarse en términos de la segunda derivada de la función f con respecto a su
argumento,
∂ 2 f (u)
∂E(r, t) ∂ ∂f (u) ∂u ∂ ∂f (u) ∂u 2
= E 0 = kx E 0 = kx E 0 . (3.80)
∂x2 ∂x ∂u ∂x ∂u ∂u ∂x ∂u2
Aquı́ se sobreentiende que se debe tomar ya sea la parte real o la parte imaginaria de la
expresión a la derecha de la igualdad, E(r, t) = Re(E(r)e−i(ωt+φ) ). Si la parte espacial del
campo electromagnético también fuese compleja serı́a posible describir, entre otras, ondas
viajeras monocromáticas. Substituyendo (3.82) en la ecuación de ondas (3.78) encontramos
que
ω2
∇ E(r) + 2 E(r) e−i(ωt+φ) = 0.
2
c
Ya que esta solución debe valer para todo tiempo, la parte que está entre paréntesis se debe
anular, de modo que la parte espacial del campo eléctrico debe satisfacer la ecuación de
Helmholtz
ω2
∇2 E(r) + 2 E(r) = 0. (3.83)
c
Las soluciones de ondas planas son un caso particular de la soluciones (3.79) y (3.82), que
tienen la forma
E(r, t) = E 0 eik·r e−iωt = E 0 ei(k·r−ωt+φe ) ,
(3.84)
B(r, t) = B 0 eik·r e−iωt = B 0 ei(k·r−ωt+φb ) .
De nuevo, se supone que los campos magnéticos y eléctricos reales se obtienen tomando ya
sea la parte real o la parte imaginaria de las expresiones (3.84).
EJERCICIO 35. Muestre que B(r, t) también satisface una ecuación de ondas.
EJERCICIO 36. Muestre que, en el caso de ondas planas, E(r, t) y B(r, t) son perpendi-
culares al vector de onda k y son perpendiculares entre sı́.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 45
Solución. Usando las expresiones (3.84) para los campos eléctrico E(r, t) y magnético B(r, t)
en las leyes de Gauss magnética (3.76b) y eléctrica (3.76d), en ausencia de cargas, obtenemos
Como k es la dirección de propagación de las ondas, las ecuaciones anteriores muestran que
los campos eléctrico y magnético de las ondas planas son perpendiculares a la dirección de
propagación. Si ahora reemplazamos en la ley de inducción de Faraday (3.76b) obtenemos
Esta ecuación muestra de un lado que los campos eléctrico y magnético son perpendiculares
y de otro, teniendo en cuenta la relación de dispersión (3.81), que la magnitud del campo
eléctrico de una onda plana es c veces la magnitud el campo magnético para la misma onda
plana.
Las ondas planas son soluciones interesantes, pero muy idealizadas, puesto que cargan una
potencia infinita. En efecto, dado un único plano transversal a la dirección de propagación,
como la densidad de potencia es homogénea, la potencia total es infinita. Con el advenimiento
de los láseres tenemos fuentes de luz muy direccionales, que pueden modelarse a partir de una
aproximación paraxial a la ecuación de ondas, con longitud de onda bastante bien definida,
que puede aproximarse por una fuente monocromática. Recordemos que las soluciones mo-
nocromáticas son de la forma E(r, t) = E(r)e−i(ωt+φ) en donde E(r) satisface la ecuación
de Helmholtz (3.83). Vamos a buscar soluciones de la forma E(r) = u(x, y, z)eikz ex , para las
∂2 ∂2
cuales se cumple ∂z 2 ∂x2 .
∂u(x, y, z) ikx
= u(x, y, z), (3.89)
∂x q(z)
2
∂ u(x, y, z) ik k 2 x2
= u(x, y, z) − u(x, y, z), (3.90)
∂x2 q(z) q 2 (z)
2
∂ u(x, y, z) ik k2 y2
= u(x, y, z) − u(x, y, z). (3.91)
∂y 2 q(z) q 2 (z)
k(x2 + y 2 )q 0 (z)
∂u(x, y, z) dP
= i −i u(x, y, z), (3.92)
∂z dz 2q 2 (z)
dq
donde q 0 (z) = dz . Substituyendo en la ecuación paraxial de ondas se obtiene
Antes de resolver la ecuación de P (z), veamos que la solución que tenemos es del tipo
k(x2 +y 2 ) k(x2 +y 2 ) (x2 +y 2 )
−
u = eiP (z) ei 2q(z) = eiP (z) ei 2R(z) e w2 (z) . (3.96)
2
Aquı́, R(z) = z + az es conocido como el radio de curvatura del frente de ondas. Por otro
lado,
k 1 1 1 1 1
z 2 = 2 = 2a 2z2 = 2a z 2 =
, (3.97)
2 a +a w (z) k + ka k 1 + a2 w2 1 + z2
2 2 0 (kw0 /2)
p
en donde hemos identificado a w0 = 2a/k como la cintura del haz (a = kw02 /2).
La forma de la soluciónqdice que el spot del haz no es constante, sino que varı́a de acuerdo
2
con la ecuación w(z) = w0 1 + (kwz2 /2)2 . Para valores grandes de z, el spot del haz se compor-
0
1
ta como w(z) ∼ 2z/(kw0 ) = γz (ver figura 3.8) El radio de curvatura del haz, R(z) = 2
z+ az
es infinito para valores de z pequeños(z LR = kw02 /2 = a), comportamiento de una onda
plana, y es proporcional a z para valores grandes de la coordenada longitudinal, comporta-
miento de una onda esférica. El criterio para decidir si una onda Gaussiana es plana o esférica
hace uso de LR , la longitud de onda de Rayleigh.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 47
Figura 3.8: Spot y frente de ondas de haz guassiano, mostrando el comportamiento asintótico.
dP i i i
= = = . (3.98)
dz q(z) z − ia z − ikw02 /2
Integrando tenemos
kw02 πw02
λ = 632,8nm, w0 = 0,5mm, LR = = = 1,2m.
2 λ
donde FG (x, y, z) corresponde a una función Gaussiana que cumple la ecuación de ondas
paraxial. Supongamos que frente al haz se pone un polarizador lı́nea que deja pasar la po-
larización a lo largo de y. En la base {ex , ey } la polarización después del polarizador lineal
puede escribirse como
. 0 0 0x 0
f = = . (3.104)
0 1 0y 0y
En realidad, la matriz anterior describe un polarizador lineal ideal. En general, el polari-
zador va a introducir una diferencia de fase, por lo cual podrı́amos representarlo por
. 0 0
PL = . (3.105)
0 eiδ
Además, es posible que quede un remanente de campo a lo largo del eje que, en el caso ideal,
no se transmitirı́a,
. η1 eiδ1
0
PL = , (3.107)
0 (1 − η2 )eiδ2
en donde se espera que η1 y η2 sean muy pequeños comparados con la unidad.
Mencionamos anteriormente que los vectores de polarización se escogen de forma que
tengan norma 1. Sin embargo, si el vector de polarización estaba normalizado a 1 antes de
pasar por el polarizador, después de este no lo estará más (a menos que inicialmente ya fuera
la polarización que deja pasar el polarizador). ¿Cómo podemos interpretar este hecho?
∂E 1 ∂(E · E) ∂B 1 ∂(B · B)
·E = , ·B = .
∂t 2 ∂t ∂t 2 ∂t
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 51
La ecuación (3.112) se conoce como teorema de Poynting, ya que fue derivado por primera
vez por John Henry Pynting [59]. Tiene la estructura
de una ley de conservación, en donde la
1 B·B
densidad de energı́a electromagnética es u = 2 µ0 + E · E , el vector de Poynting, que
B
da el flujo de energı́a es S = E × µ0 , y el término de fuentes corresponde a menos el trabajo
hecho por el campo sobre las cargas. El teorema se puede extender a medios macroscópicos
que tengan pocas pérdidas [60, 61]. Esta derivación no es completamente limpia, pues no se
hizo una distinción entre los campos propios (producidos por las mismas cargas) y los campo
externos. Si se hace esta distinción, no se llega al teorema de Poynting, conforme lo muestran
Campos y Jiménez [62]. De hecho, en un punto de la derivación es necesario aproximar los
campo totales por los externos, pero de este modo se está ignorando la transferencia de energı́a
de los campos externos a los campos propios. Existen referencias posteriores que analizan este
problema. En particular, ver la referencia [63]. Sin embargo, al parecer algunos problemas
profundos de la fı́sica no se resuelven nunca, se olvidan cuando aparece otra teorı́a.
Ahora, para determinar qué tan iluminada está una superficie vamos a seguir a Hetch [64].
Para tanto vamos a usar un detector que colecte toda la potencia de la onda electromagnética
que llega a la superficie, que está dada por el vector de Poynting. Aunque el detector tiene un
área A fija, que permite la entrada de la energı́a radiante, dado que otros detectores pueden
tener otras áreas, la cantidad interesante es la energı́a total por unidad de área. Suponemos que
la superficie es perpendicular a la dirección de incidencia de la radiación. Otro tanto puede ser
dicho acerca del perı́odo de recolección, T , de la energı́a por unidad de área: para independizar
la medición de este tiempo de recolección, dividimos por T . Ası́, la cantidad interesante es la
energı́a promedio por unidad de área por unidad de tiempo. Estamos hablando, entonces, del
promedio temporal de la magnitud del vector de Poynting,
Z t+T
1
I= kSkdτ, (3.113)
T t
en donde FG (x, y, z) es una función gaussiana que satisface la ecuación paraxial de ondas,
como antes. Las expresiones que tenemos son complejas, pero los campos corresponden a la
parte real o a la parte imaginaria de esas expresiones. En un tratamiento aproximado podemos
ignorar la fase del frente de ondas (z toma un valor fijo y se vuelve una constante). Tenemos
el valor medio de un coseno al cuadrado sobre un número n de periodos Tω = 2π/ω, no
necesariamente entero. Sin embargo, si T es sificientmente grande con respecto al periodo de
la onda, T Tω , el promedio estel cuadrado del coseno será, con muy buena precisión igual a
1/2. La irradiancia en el plano z = z0 , alrededor del punto (x0 , y0 ) es aproximadamente igual
a
1 c
I= kfG (x0 , y0 , z0 )k2 (Ex2 + Ey2 ) = kfG (x0 , y0 , z0 )k2 E02 , (3.115)
2µ0 c 2
en donde E02 = Ex2 +Ey2 . Si el vector de polarización se normaliza a la entrada de un polarizador
lineal que deja pasar la componente y, = Ex e−iφx ex + Ey e−iφy ey /E0 , entonces a la salida
52 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
no está normalizado, f = Ex /E0 e−iφx ex . Además, la irradiancia de salida es
c E2 E2
Iout = kfG (x0 , y0 , z0 )k2 E02 x2 = x2 Iin . (3.116)
2 E0 E0
Esto quiere decir que, al menos en este caso, el cuadrado del vector de polarización de
salida es igual a la razón entre la irradiancia de salida y la de entrada.
Enseguida, tenemos en cuenta que el medio produce un desfase entre las dos componentes,
. cos φ 1 0 cos φ
out = iα = . (3.118)
e sin φ 0 eiα sin φ
. cos(φ + π2 )
− sin φ
˜out = = . (3.119)
sin(φ + π2 ) cos φ
Como podemos tener una fase global, sin que se cambie la polarización, escribimos la polari-
zación de salida como
. iβ − sin φ
˜out = e . (3.120)
cos φ
Las dos descripciones, que hemos hallado a partir de consideraciones diferentes, deben ser
iguales,
cos φ iβ − sin φ
=e . (3.121)
eiα sin φ cos φ
De la primera componente tenemos que, para que el lado derecho sea real, como el lado
izquierdo, δ = 0 o δ = π. Consideremos el primer caso, el cual implica la igualdad cos φ =
− sin φ, cuyas soluciones son θ = −π/4 y θ = 3π/4 (en el intervalo [−π, π]). Escojamos
la primera solución. Substituyendo en la segunda componente, vemos que se debe cumplir
δ = π + 2pπ, siendo p un entero. De nuevo escogemos la primera solución, la cual muestra
que el celofán debe acumular un desfase de π entre las dos componentes. Como ese desfase
corresponde a media longitud de onda, los elementos que producen ese desfase se llaman
placas de media onda. Dicho de otra manera, la pelı́cula de celofán debe actuar como una
placa de media onda. Por otro lado, el eje lento del celofán debe ponerse a -45◦ con respecto
al eje de transmisión del primer polarizador lineal.
EJERCICIO 38. Considere las soluciones que descartamos. Discuta si son soluciones
diferentes y a qué corresponden.
Vemos que tenemos un elemento que cambia la polarización, una placa de media onda, la
cual se representa, en la base (eje rápido, eje lento), por
. 1 0
MO = . (3.122)
0 −1
en donde el moño sobre la función gaussiana señala que todas las fases han sido incluı́das en φ,
y que, por lo tanto, f˜G (x, y, z) es puramente real. Sin pérdida de generalidad podemos suponer
que φ = 0, t = 0 y z = 0. El campo empieza apuntando en la dirección de x. Nos quedamos en
z = 0 y miramos hacia la onda que viene propagándose hacia nosotros. Después de un tiempo
∆t nos llega una parte de la onda que tenı́a z negativo en el tiempo inicial t = 0. Como z
es negativo (y relativamente pequeño, |kz| 1), el vector (cos(kz)ex + sin(kz)ex ) forma un
ángulo negativo pequeño con respecto al eje x. Un tiempo después, esta parte de la onda
coincide con el eje x. Esto quiere decir que, mirando hacia la dirección de propagación de la
onda, parados en un punto fijo, vemos que la onda gira en dirección antihoraria. Decimos que
esta onda tiene una polarización circular derecha. Si, hubiéramos tenido un campo eléctrico
Ey
= cos(τ − δ) = cos(τ ) cos(δ) − sin(τ ) sin(δ).
Ey0
r
Ex
√
Ex
2
De la ecuación (3.132) encontramos cos θ = Ex0 y sin θ = ± 1 − cos2 θ =± 1− Ex0 ,
las cuales substituı́mos en la ecuación anterior,
s 2
Ey Ex Ex
= cos(δ) − (±) 1 − sin(δ).
Ey0 Ex0 Ex0
Pasando el primer término de la derecha al lado izquierdo, y elevando ambos lados al cuadrado,
tenemos
2 2 !
Ey Ex Ex
− cos(δ) = 1 − sin2 (δ). (3.135)
Ey0 Ex0 Ex0
Enseguida vamos a demostrar que esta es la ecuación de una elipse centrada en el origen. Con
este fin reescribimos el lado izquierdo como
1
− Ecos(2δ)
! !
2
Ex0 x0 Ey0 Ex 1 1 Ex
Ex Ey cos(2δ) 1 = 2 + 2 Ex Ey M . (3.137)
− Ex0 Ey0 2
Ey0
Ey Ex0 Ey0 Ey
La matriz M
2
Ey0 Ex0 Ey0 cos(δ)
1
− Ecos(δ)
!
1 2
Ex0 x0 Ey0 E 2 +E 2 − 2 +E 2
Ex0
= x0 y0 y0 , (3.138)
− Ecos(δ)
2
1 1 1 E Ey0 cos(δ) Ex0
2
Ex0
+ 2
Ey0 x0 Ey0
2
Ey0 − x0 2 2 2 2
Ex0 +Ey0 Ex0 +Ey0
Una simple comparación entre (3.140) y nuestra parametrización nos permiter determinar el
ángulo θ !
1 −2Ex0 Ey0 cos(δ)
θ = arctan 2 − E2 , (3.145)
2 Ey0 x0
y el parámetro s
v !2 !2
u
2 − E2
Ey0
q u 2Ex0 Ey0 cos(δ) x0
s= s2x + s2y = t − 2 + E2 + 2 + E2 . (3.146)
Ex0 y0 Ex0 y0
Teniendo en cuenta
2 2 2
2 2 2 2
cos2 (δ) = Ey0
2 2 2
(1 − sin2 (δ))
Ey0 − Ex0 +4Ex0 Ey0 − Ex0 + 4Ex0 Ey0
2 2
2 2 2
sin2 (δ),
= Ey0 + Ex0 − 4Ex0 Ey0 (3.147)
podemos simplificar s v
u !2
u 2Ex0 Ey0 sin(δ)
s = t1 − 2 + E2 . (3.148)
Ex0 y0
en la forma alternativa
0 !
1 1+s 0 Ex 1 1
Ex0 Ey0 = 2 + E2 sin2 (δ), (3.150)
2 0 1−s Ey0 Ex0 y0
en donde Ex0 = cos θEx + sin θEy , y Ey0 = − sin θEx + cos θEy . Merece la pena que escribamos
la ecuación de la elipse en una forma más evidente
2 2 2 2
(Ex0 + Ey0 )(1 + s) 2 (Ex0 + Ey0 )(1 − s) 2
2 E 2 sin2 δ
(cos θEx + sin θEy ) + 2 E 2 sin2 δ
(− sin θEx + cos θEy ) = 1,
2Ex0 y0 2Ex0 y0
(3.151)
58 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
o mejor aún
2
2 2 2
(Ex0 + Ey0 ) (1 + s) cos θEx + sin θE y
q + (3.152)
2 E 2 sin2 δ
2Ex0 2 + E2
y0 Ex0 y0
2
2 2 2
(Ex0 + Ey0 ) (1 − s) − sin θEx + cos θEy
= 1.
2 E 2 sin2 δ
q
2Ex0 y0 2 + E2
Ex0 y0
1 − s2 1 − s2 1
a2 + b2 = + = (1 + s + 1 − s) = 1, (3.155)
2(1 + s) 2(1 − s) 2
s s
2 E 2 sin2 δ
r
1 − s2 1 − s2 1 − s2 Ex0 y0
ab = = = 2 + E 2 )2
2(1 + s) 2(1 − s) 4 (Ex0 y0
E E | sin δ|
= p x0 y0 (3.156)
2 + E 2 )2
(Ex0 y0
Figura 3.10: Elipse de polarización mostrando los parámetros de Stokes: el ángulo θ y los semi-
ejes mayor a y menor b. De izquierda a derecha, ejemplos correspondientes a δ = 0, π, π2 , − π2 .
Capı́tulo 4
Polarización: descripción
cuántica
59
60 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Usando menos jerga cientı́fica, y en términos de fotones, estos cristales convierten, con una
pequeña probabilidad, un fotón del haz incidente de luz, en dos fotones cuyas direcciones
están correlacionadas. Cuando uno de estos fotones es detectado en una dirección, se sabe
que hay otro fotón en la dirección correlacionada. Ese fotón se usa para los experimentos de
un fotón [82].
Sin interponer el divisor de haz, ponemos un detector de fotones ideal. Cada vez que
enviamos un fotón, este es detectado. Ahora ponemos el divisor de haz. Siempre que enviamos
un fotón, este se detecta en D1 , pero no en D2 , o al contrario; pero nunca tenemos detección
simultánea. Este experimento clave, que lleva el nombre de Grangier, [83] nos permite hablar
del fotón como si se tratase de una partı́cula, al menos en el proceso de detección.
No existe un patrón discernible en la secuencia de qué detector hace click; si un fotón es
detectado en D1 , el siguiente puede ser detectado en D1 o en D2 . La secuencia parece aleatoria.
De hecho, este esquema es usado para producir números aleatorios. Si quiere comprar uno de
estos sistemas puede consultar las siguientes páginas de internet: [Link]
com/ o [Link] Lo que sı́ podemos decir es que, después de enviar un
número grande de fotones, alrededor de la mitad se detectan en D1 y el resto en D2 , con
una desviación aproximadamente igual a la raı́z cuadrada de la mitad del número de fotones
enviados.
Clásicamente la conservación de energı́a se daba porque cada haz secundario era responsa-
ble por la mitad de la energı́a del haz primario. En el caso cuántico, toda la energı́a se la lleva
uno de los haces secundarios; en cuál de ellos se detecta la energı́a, es un proceso aleatorio.
Interpongamos una lámina de un dieléctrico ideal (sin pérdidas) entre el divisor de haz
y uno de los detectores, de manera que, en ese camino, se gane una fase eiδ . En la práctica
se puede emplear un pedazo de cristal. Nuevamente, alrededor de la mitad de los fotones se
detectan en D1 y el resto en D2 .
El lector puede considerar una variación de este experimento, correspondiente a la parte
derecha de la figura 4.1. ¿Cómo será la distribución de clicks? ¿Cuántos detectores harán click
de manera simultánea? ¿Cómo será la secuencia temporal de los detectores de hacen click?
Como el lector seguramente habrá pensado, i) la secuencia de clicks es aleatoria, ii) hay
uno y solo un click por cada fotón que se envı́e, y iii) después de enviar muchos fotones, cada
detector será responsable por aproximadamente un cuarto de los clicks totales.
Mientras la mayorı́a de los sistemas que vamos a considerar en este capı́tulo se pueden
describir usando fı́sica no relativista, la descripción de las ondas electromagnéticas es intrin-
sicamente relativista (las ecuaciones de Maxwell son invariantes ante el grupo de Lorentz).
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 61
Este hecho implica que el concepto de estado cuántico de un fotón (y no solo de su polariza-
ción) sea, cuando menos, problemático [78]. En efecto, no existen estados localizados de fotón
[79, 80]. De cualquier modo, es posible tomar una posición pragmática de usar los estados de
fotón, en particular el formalismo de Riemann-Silberstein,1 siempre que sea útil [81].
Vamos a usar la nueva notación hψ| ψ2 i para el producto escalar entre |ψ1 i y |ψ2 i (que no es
igual al producto escalar entre |ψ2 i y |ψ1 i). Las condiciones para que la base {|Hi , |V i} sea
ortonormal son las siguientes
Esta ecuación también nos dice que la base de los objetos matemáticos que llamamos bras
está conformada por {hH| , hV |}, los cuales tienen la siguiente representación:
. .
hH| = 1 0 , hV | = 0 1 . (4.7)
El nombre de los kets y los bras fue acuñado por Dirac, de tal manera que el producto escalar
se puede escribir como bra·c·ket, que es paréntesis en inglés. Tanto el espacio de los kets como
el de los bras son espacios vectoriales cuyos escalares son los números complejos.
Los bras son, de hecho, funcionales lineales, objetos matemáticos que actúan sobre vectores
y dan como resultado un escalar (en este caso un número complejo). El hecho de que sean
lineales significa que, cuando se aplican sobre una suma de vectores, el resultado es la suma de
la aplicación del funcional a cada vector. Del párrafo anterior se desprende que los funcionales
lineales forman un espacio vectorial.
Supongamos que tenemos un haz gaussiano con polarización vertical y que interponemos
un polarizador cuyo eje de transmisión forma 45◦ con respecto a las direcciones vertical y √ ho-
rizontal, de tal manera que el vector de polarización del campo transmitido es (ex + ey ) / 2.
Si por este arreglo experimental hacemos pasar un único fotón con polarización vertical, este
pasará, será transmitido, alrededor de la mitad de las veces que hagamos el intento (con una
dispersión igual a la raı́z de ese número). Si ponemos un segundo polarizador con el mismo
eje de transmisión que el primero (45◦ con respecto a las direcciones vertical y horizontal), el
fotón será transmitido por este polarizador. Por otro lado, si el eje del segundo polarizador
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 63
√
apunta en la dirección de (−ex + ey ) / 2, ningún será transmitido. Merece la pena poner
nombres: diremos que el estado √ de un fotón que sea transmitido por un polarizador con eje de
transmisión eD = (ex + ey ) / 2, es |Di (diagonal), y que el estado √ de un fotón que sea trans-
mitido por un polarizador con eje de transmisión eA = (ex − ey ) / 2, es |Ai (antidiagonal).
Si un fotón se prepara en el estado |Ai , entonces nunca será transmitido por un polarizador
lineal con eje de transmisión eD . Podemos pensar, entonces, que las propiedades asociadas
con los estados |Di y |Ai son excluyentes. Ası́, los respectivos kets deben ser ortogonales,
hD|Ai = 0.
Por medio de estos experimentos hemos clasificado los fotones verticales en diagonales y
antidiagonales. Podemos pensar, por lo tanto, que los estados correspondientes serán |V, Di y
|V, Ai , respectivamente. Para terminar de convencernos de que esto es ası́, vamos a pasar los
fotones |V, Di por un polarizador vertical. Esperamos que todos los fotones sean transmitidos
por un polarizador vertical (con eje de transmisión vertical). Cuando se hace el experimento,
sin embargo, solamente alrededor de los fotones que pasaron por el polarizador diagonal
son transmitidos por el polarizador vertical. Una alternativa es pensar que el estado vertical
se puede escribir en términos de los estados diagonal y antidiagonal, como discutimos más
adelante. Veamos sin embargo porqué esta es una alternativa inquietante.
En vez de pensar en fotones, pensemos en cubos lógicos. Supongamos que una caracterı́tica
de los cubos lógicos es su forma, pero que existen solamente dos formas posibles: cuadrado
|cuadradoi y rombo |romboi. Supongamos que otra de las caracterı́sticas de los cubos lógicos
es su color y que solamente se presentan en dos colores: azul |azuli y rojo |rojoi. Entonces
la situación que analizamos en el párrafo anterior es análoga a la siguiente. De una caja de
cubo lógicos sacamos únicamente los cuadrados. Después los clasificamos por color, por lo cual
tenemos azules y rojos. Lo sorprendente es que cuando volvamos a mirar su forma no tengamos
únicamente cuadrados, ¡sino que aproximadamente la mitad son rombos! Es más. Debemos
poder escribir |cuadradoi como una combinación de |azuli y |rojoi. Tal vez el problema es que
esta formulación solamente vale para polarización. Esta discusión la hacemos más adelante.
En el caso de la polarización, no nos espanta que el estado |V i pueda escribirse en términos
de |Di y |Ai . De hecho, sabemos que eV puede escribirse en términos de eD y eA , eV =
cD eD + cA eA . Los coeficientes cD y cA pueden ser interpretados. En el capı́tulo anterior
vimos que el cuadrado del valor absoluto de dichos coeficientes corresponden a la razón entre
la irradiancia (energı́a por unidad de área por unidad de tiempo) de salida y la de entrada.
Vamos a escribir el estado |V i como |V i = c̃D |Di+c̃A |Ai. Note que no hemos asumido que los
coeficientes son exactamente los mismos. Si consideramos la existencia de paquetes de energı́a
del campo electromagnético, el cuadrado de c̃D y c̃A deberı́a corresponder a la razón entre el
número de fotones de salida y el de entrada. 2 Dado que los fotones se detectan aleatoriamente,
ese cuadrado se puede interpretar como una probabilidad: |c̃D |2 serı́a la probabilidad de que un
fotón vertical pase por un polarizador lineal con eje de transmisión diagonal y sea detectado.
En el ejemplo, las √ probabilidades son iguales a 1/2 y por lo tanto, el valor absoluto de los
coeficientes es 1/ 2. Es decir, dabemos que c̃D = √12 eiφ1 y c̃A = √12 eiφ2 . Podemos escribir
1
|V i = √ |Di + eiφ |Ai ,
(4.8)
2
cuando vamos de campos electromagnéticos macroscópicos a campos muy débiles, correspondientes a un único
paquete de energı́a. No hay razón, sin embargo, para que los campos débiles tengan que comportarse ası́.
64 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
diagonales antes de ser detectados). El resultado final es que podemos escribir
1
|Hi = √ |Di + eiϕ |Ai .
(4.9)
2
1 1
= hH|V i = √ hD| + e−iϕ hA| √ |Di + eiφ |Ai
0 (4.10)
2 2
1 −iϕ
= hD|Di + e hA|Di + e hD|Ai + ei(φ−ϕ) hA|Ai
iφ
(4.11)
2
1
= hD|Di + ei(φ−ϕ) hA|Ai , (4.12)
2
en donde tuvimos en cuenta que las propiedades expresadas por |Di y |Ai son excluyentes.
Como a los vectores de polarización les exigı́amos norma unidad, a los kets |Di y |Ai también
se les debe exigir, hD|Di = 1 = hA|Ai. Ası́, deben cumplirse las igualdades
1
0= 1 + ei(φ−ϕ) , ei(φ−ϕ) = −1, φ = ϕ + (2n + 1)π, n ∈ Z. (4.13)
2
Es común escoger ϕ = 0, n = 0 de manera que φ = π. Las expresiones para los estados
de polarización horizontal y vertical, en términos de los estados de polarización diagonal y
antidiagonal, son
1
|Hi = √ (|Di + |Ai) (4.14a)
2
1
|V i = √ (|Di − |Ai) . (4.14b)
2
EJERCICIO 42. Escriba los estados |Di y |Ai en términos de |Hi y |V i. Escriba los
vectores columna en la base de |Hi y |V i. Describa el montaje experimental correspondiente.
A partir de la ecuación (4.14) podemos encontrar
1 . 1 1
|Di = √ (|Hi + |V i) = √ , (4.15a)
2 2 1
1 . 1 1
|Ai = √ (|Hi − |V i) = √ . (4.15b)
2 2 −1
Si preparamos un fotón en el estado de polarización diagonal y lo hacemos pasar por un
polarizador con eje de transmisión horizontal (respectivamente vertical) y por un detector,
aproximadamente la mitad de las veces que lo hagamos tendremos una detección. Algo similar
ocurre con fotones con polarización antidiagonal. Las igualdades entre estados de polarización
se escogen de tal manera que sean completamente análogas a las igualdades entre vectores de
polarización.
Ası́ como es existen los polarizadores lineales, que solamente transmiten una polarización
lineal, existen los polarizadores circulares que solamente transmiten la polarización derecha,
por ejemplo.
EJERCICIO 43. Demuestre que la combinación de una placa de cuarto de onda con su
eje rápido en la dirección diagonal seguida de un polarizador horizontal y de otra placa de
cuarto de onda con su eje rápido en la dirección antidiagonal, produce un polarizador que
solamente transmite luz con polarización circular izquierda, al cual llamaremos polarizador
izquierdo. Demuestre que si cambia el polarizador horizontal por uno vertical, solamente se
trasmitirá luz con polarización circular derecha, y tendremos un polarizador derecho.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 65
Supongamos que producimos fotones con polarización derecha, |Ri , e interponemos un
polarizador derecho y un detector. Todos los fotones se detectan. En cambio, si interponemos
un polarizador izquierdo, ninguno sera detectado. Si interponemos un polarizador horizontal,
vertical, diagonal o antidiagonal, alrededor de la mitad de los fotones será detectado. Algo
similar ocurre con los fotones con polarización circular izquierda. A partir de la discusión
que tuvimos con los fotones con polarización diagonal y antidiagonal, y los polarizadores
horizontal y vertical, podemos escribir
1
√ |Hi + eiα |V i
|Ri = (4.16a)
2
1
√ |Hi + eiβ |V i ,
|Li = (4.16b)
2
en donde α = β + (2n + 1)π, en donde n es un número entero. Si escribimos |Ri y |Li en
términos de |Di y |Ai,
el cuadrado del valor absoluto de todos los coeficientes ai , i = 1, 2, 3, 4 debe ser 1/2. Tomando
el producto escalar de las igualdades (4.17) con |Di encontramos
1 1 1
a1 = hD|Ri = √ (|Hi + |V i) √ |Hi + eiα |V i = (1 + eiα ), (4.18)
2 2 2
1 1 1
= hD|Li = √ (|Hi − |V i) √ |Hi − eiβ |V i = (1 − eiβ ).
a3 (4.19)
2 2 2
Los cuadrados de los valores absolutos de estos coeficientes son
1 1 1
= |a1 |2 = ((1 + cos α)2 + sin2 α) = (2 + 2 cos α) , (4.20)
2 22 4
1 1 1
= |a3 |2 = ((1 − cos β)2 + sin2 β) = (2 − 2 cos β) . (4.21)
2 22 4
Los valores posibles, tanto de α como de β son ± π2 hasta múltiplos de 2π. Ası́, uno de los dos
ángulos debe ser −π/2 y el otro π/2. Para que las igualdades entre estados correspondan a
las igualdades entre polarizaciones, escogemos
1 . 1 1
|Ri = √ (|Hi − i |V i) = √ (4.22a)
2 2 −i
1 . 1 1
|Li = √ (|Hi + i |V i) = √ , (4.22b)
2 2 i
estados que estudiamos en el capı́tulo anterior, por ejemplo, corresponden a gaussianas con ancho finito.
66 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
que estos estados tengan norma uno. En este caso, es posible tener otros estados, como se ve
en el segundo experimento, en donde existen cuatro alternativas excluyentes. Sin embargo,
para los propósitos de estudiar el primer experimento, podemos pensar que el espacio de ca-
minos es bidimensional. Esta estrategia, de ignorar estados, se aplica en muchas situaciones,
aquellas en las cuales, de manera efectiva, el sistema se encuentra solamente en los estados
escogidos.
Como paso inicial, vamos a modelar los divisores balanceados de haz (50/50). El estado a
la salida del divisor depende linealmente del estado a la entrada
αout d11 d12 αin
= . (4.24)
βout d21 d22 βin
Como el divisor es balanceado, el cuadrado de los valores absolutos de los coeficientes d debe
ser 1/2. Es decir, podemos escribir
αout 1 exp(iφ11 ) exp(iφ12 ) αin
=√ . (4.25)
βout 2 exp(iφ21 ) exp(iφ22 ) βin
A partir de los análisis de ondas reflejadas y transmitidas sabemos que las ondas transmitidas
no ganan fase, mientras que las ondas reflejadas ganan una fase de π solamente cuando la
luz pasa de un material de ı́ndice de refracción bajo a uno alto, por ejemplo, cuando pasa de
aire a dieléctrico reflectivo. Vamos a suponer que los diferentes espesores de los divisores son
tales que contienen un número entero de longitudes de onda, de tal manera que no agregan
fases. Vamos a suponer que los recubrimientos dieléctricos se encuentran al lado derecho de
los divisores en la figura 4.2. Cuando pasa de aire al dieléctrico reflectivo, se gana una fase de
π; por el contrario, cuando pasa del aire al reflector, el haz reflejado no gana fase de π porque
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 67
el ı́ndice de refracción del vidrio es mayor que el del reflector. Ası́, la acción del divisor se
puede modelar mediante la siguiente igualdad
αout 1 1 1 αin
=√ . (4.26)
βout 2 1 −1 βin
Esta no es la forma más general de describir un divisor balanceado de haz, pero es la más
simple. En este caso hemos descrito un divisor balanceado pero asimétrico. En caso de te-
ner divisores simétricos, hay una diferencia de fase de π/2 entre el haz reflejado y el haz
transmitido [86, 87]. El lector puede encontrar una discusión de este tema en las referencias
[88, 89, 90, 91].
EJERCICIO 44. Haga una revisión del modelamiento de divisores de haz. Haga una pre-
sentación enfatizando tanto en que sea fácil de entender, como en su generalidad. Caracterice
un divisor de haz en el laboratorio, o al menos discuta como se podrı́a hacer.
Ahora podemos analizar el estado de la luz en este experimento. Supongamos que el
inicialmente está descrito por el ket |ψ0 i. Después, atraviesa el primer divisor balanceado. En
la base {|ii , |di} el divisor está caracterizado por la matriz que aparece en la ecuación (4.26).
De manera más abstracta, hablaremos de un operador lineal, O, que es un objeto matemático
que transforma un vector (ket) en otro vector, de manera que cumple la ecuación
En el caso del divisor de haz, emplearemos la notación Udb este operador, en donde las letras
db corresponden a divisor balanceado. El estado de la luz, después del divisor de haz, es
Udb |ψ0 i. Después del divisor tenemos unos espejos, descritos por el operador Ue ,
. −1 0
Ue = , (4.28)
0 −1
en donde hemos empleado la base {|ii , |di}. El estado, después de los espejos es Ue Udb |ψ0 i ,
y después del segundo divisor de haz
Los operadores están ordenados de derecha a izquierda. En la base {|ii , |di} esta ecuación se
escribe ası́
αf 1 1 1 −1 0 1 1 1 α0
=√ √ . (4.30)
βf 2 1 −1 0 −1 2 1 −1 β0
Efectuando la multiplicación de las matrices, obtenemos el sorprendente resultado
αf −α0
= , (4.31)
βf −β0
Figura 4.3: Interferencia en un Mach-Zehnder. Fotones detectado en cada uno de los detecto-
res.
La figura 4.3 muestra los conteos en los detectores D1 (MZ1) y D2 (MZ2). Cada canal
corresponde a una diferencia de fase de λ/250. Se ve la dependencia del número de fotones
detectados en cada detector con la diferencia de la lontidud de los brazos.
A partir de la ecuación (4.35), donde φ = 2π∆l λ , parece que no importa si la diferencia de
caminos es grande. En la práctica, especialmente, en experimentos de un fotón, esto no es ası́.
Las probabilidades de detección se convierten en 12 (1 ± V cos φ), en donde V es un número no
negativo menor que uno, que disminuye a medida que se aumenta la diferencia entre caminos.
El parámetro V se conoce como la visibilidad del patrón de interferencia, y puede obtenerse
mediante la ecuación
pmax − pmin
V = = pmax − pmin . (4.37)
pmax + pmin
Para diferencias de longitud suficientemente grandes, la probabilidad de detección en cada
detector es del 50 %. El origen fı́sico de la disminución de visibilidad es que la fase de la fuente
de fotones tiene fluctuaciones aleatorias. Si los caminos son iguales, estas fluctuaciones afectan
ambos brazos de manera idéntica; si no lo son, hay una componente aleatoria en la fase φ. En
diferentes corridas del experimento, estas fases son diferentes. Si la diferencia de caminos es
suficientemente grande, todas las fases son igualmente probables, por lo cual el valor medio
de cos φ es cero.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 69
Un problema del lenguaje empleado aquı́ es qué interfiere con qué. Un campo electro-
magnético interfiere con otro. Pero, si tenemos un único fotón no es claro qué objetos o
campos interfieren.
Figura 4.4: l
En el artı́culo [93] se muestra que la fracción de bombas que se pueden verificar, sin explotarlas,
se puede aproximar al 100 %, usando el efecto Zenón cuántico.
Figura 4.5: l
La norma al cuadrado de este estado es (1/2)2 + (1/2)2 = 1/2, porque las propiedades de
camino superior y camino inferior son excluyentes (también puede verse desde el punto de
vista de que polarización horizontal y vertical son excluyentes). Esto significa que hemos
perdido la mitad de los fotones. Volvamos a normalizar el estado,
1
√ (|s, Hi − |i, V i) . (4.43)
2
En el segundo divisor balanceado se debe tenr en cuenta que el haz reflejado por el camino
inferior gana una fase de π,
1
|ii → √ (− |ii + |si) . (4.44)
2
Por su parte, el estado superior se transforma ası́:
1
|si → √ (|si + |ii) . (4.45)
2
Si tenemos en cuenta la polarización, vemos que el efecto del segundo polarizador se describe
mediante las ecuaciones
1 1
|s, Hi → √ (|s, Hi + |i, Hi) , |i, V i → √ (− |i, V i + |s, V i) . (4.46)
2 2
El estado de los fotones, después del segundo divisor es, entonces
1 1 1 1
√ √ (|s, Hi + |i, Hi) − √ (− |i, V i + |s, V i) = (|s, Hi − |s, V i + |i, Hi + |i, V i) .
2 2 2 2
(4.47)
72 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Vamos a suponer que después del segundo divisor de haz tenemos los detectores. Ds detecta
si los fotones del camino superior, independientemente de que tengan polarización horizontal
o vertical. La probabilidad de que un fotón sea detectado en Ds es (1/2)2 + (1/2)2 = 1/2.
De manera análoga se puede ver que la probabilidad de que se detecte un fotón en el camino
inferior es 1/2.
Hasta ahora no tuvimos en cuenta el piezoeléctrico. Este elemento permite ajustes submi-
crométricos de la posición del espejo correspondiente y produce una diferencia de la longitud
del brazo superior del interferómetro con respecto al brazo inferior. Es decir, podemos pensar
que el espejo no produce una fase de π sino una fase −eiφ .
EJERCICIO 45. Demuestre que teniendo en cuenta esa fase el estado después del segundo
divisor de haz es
1 iφ
e |s, Hi − |s, V i + eiφ |i, Hi + |i, V i
2
y que las probabilidades de detección siguen siendo iguales a 1/2.
¿Porqué la probabilidad no varı́a con la diferencia de fase φ cómo en el interferómetro de
Mach-Zehnder original?
En este caso sabemos que las componentes con polarización horizontal vienen del camino
superior y aquellas con polarización vertical, del inferior. Como podemos distinguir cuál fue
el camino empleado por los fotones, no hay interferencia. Se dice que la polarización marca
los caminos. ¿Podemos borrar la información de los caminos y ver un patrón de interferencia?
Antes del detector Di pongamos un polarizador diagonal. Teniendo en cuenta nuevamente
que |Di = √12 (|Hi + |V i) , vemos que el estado después del polarizador es
1 iφ 1 iφ
e |s, Hi − |s, V i + √ e |i, Di + |i, Di .
2 2
La probabilidad de detección en Di es, por lo tanto,
2
1 1
√ ((eiφ + 1) = 1 (1 + cos φ).
2 2 (4.48)
4
Vemos que se recupera el patrón de interferencia, pero con una amplitud menor.
5.1. Introducción
Durante el desarrollo del curso hemos pasado de la polarización, en la cual se puede
usar un formalismo matemático bastante parecido tanto en el dominio clásico como en el
cuántico, al estudio de otros sistemas de dos niveles y a sistemas caracterizados por un grado
de libertad con espectro continuo (sistemas en una dimensión), incluyendo la partı́cula libre,
un pozo cuadrado infinito y el oscilador armónico. A pesar de que se podrı́an estudiar sistemas
de dos grados espaciales de libertad, lo usual es pasar a dimensión 3. De hecho, cuando
estudiamos el pozo infinito de potencial, estudiamos un sistema tridimensional. Entre los
sistemas tridimensionales arquetı́picos se encuentran aquelos problemas con fuerzas centrales.
Para hacer ese estudio es conveniente haber estudiado el momento angular. Ese es el propósito
de este capı́tulo.
Existen dos puntos de partida comunes para estudiar el momento angular: aquél propuesto
por la cuantización canónica y aquél que tiene que ver con las simetrı́as. En el primer abor-
daje, los operadores de posición y momento se substituyen por sus contrapartidas cuánticas.
En el segundo, se identifican los generadores de las simetrı́as espacio-temporales y se les dan
los mismos nombres a los generadores de las mismas simetrı́as. Es claro que los generadores
cuánticos actúan en un espacio diferente, el espacio de Hilbert, a aquél en que actúan los
genradores clásicos (en nuestro curso, el espacio euclı́deo tridimensional más el tiempo, supo-
niendo que el grupo de simetrı́as es el de Galileo). Las simetrı́as del grupo de Galileo incluyen
las rotaciones y las traslaciones espaciales y temporales, además de los cambios de un sistema
de referencia inercial a otro. En la siguiente sección examinamos las rotaciones e identificamos
los generadores de las mismas. Estos generadores son las componentes del momento angular.
5.2. Rotaciones
Una rotación ocurre cuando giramos algún objeto por un ángulo alrededor de un eje. Es fácil
de descubrir que las rotaciones finitas no son conmutativas. Tome un objeto que no posea ni
simetrı́a cúbica ni simetrı́a esférica; por ejemplo, el libro de la figura 5.1. Como se muestra
en la figura, el eje y apunta hacia arriba y ele eje z hacia la derecha, el eje x apunta entrando
a la figura. La posición final del objeto si lo hacemos girar primero por un ángulo de π/2
alrededor del eje x y luego por un ángulo de π/2 alrededor del eje y es diferente de la posición
final del objeto si lo hacemos girar primero por un ángulo de π/2 alrededor del eje y y luego
por un ángulo de π/2 alrededor del eje x.
Cuando rotamos un objeto estamos haciendo transformaciones activas. También podemos
hacer transformaciones pasivas si rotamos los ejes que describen la posición del objeto, pero
75
76 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
Figura 5.1: Rotación de un libro alrededor de los ejes x e y, o alrededor de los ejes y y x.
Designamos la rotación por un ángulo φ alrededor del eje z por Rz (φ) y a su representación
en el espacio tridimensional por Rz (φ). Enseguida mostramos como obtener la matriz de
rotación Rz (φ), empleando la figura 5.2.
1 − 2 /2 0
1 0 0
Rx () Ry () = 0 1 − 2 /2 − 0 1 0
2 2
0 1 − /2 − 0 1 − /2
2 2
1 − /2
= 0 1 − 2 /2 − ,
− 1 − 2
De esta manera se tiene que la diferencia entre las matrices correspondientes a las rotaciones
es
−2 0 1 −2 0
0 1 0 0
Rx () Ry () − Ry () Rx () = −2 0 0 = 2 1 0 − 0 1 0 . (5.3)
0 0 0 0 0 1 0 0 1
Ahora, una rotación infinitesimal por un ángulo 2 alrededor del eje z, hasta segundo orden
en está representada por la matriz
−2 0
1
Rz (2 ) = −2 1 0 . (5.4)
0 0 1
Finalmente, sustituyendo (5.4) en (5.3), obtenemos la relación de conmutación para las rota-
ciones infinitesimales
[Rx (), Ry ()] = Rz (2 ) − I. (5.5)
|ψ 0 i = D(R
b z (φ)) |ψi . (5.6)
Para hacer una rotación por un ángulo φ alrededor del eje z podemos hacer N rotaciones por
un ángulo de φ/N alrededor del eje z. Si el ángulo es suficientemente pequeño el operador de
la rotación debe ser cercano al operador identidad I. b La desviación del operador identidad
debe ser proporcional al ángulo recorrido, en este caso φ/N y a un operador, Jbz en este caso.
En sı́mbolos tenemos
N N
D(R
b z (φ)) = D b Rz φ ∼ i
= Ib − Jbz
φ
. (5.7)
N ~ N
Hemos introducido una constante con unidades de momento angular: la constante de Planck
~. Su valor solamente puede determinarse experimentalmente. Esta constante es la misma
constante que aparece en la relación de conmutación canónica de posición y momento [x̂, p̂x ] =
i~. Al operador Jbz lo identificamos como el generador de las rotaciones en torno al eje z. La
igualdad entre las partes izquierda y derecha de la ecuación (5.7) se obtiene en el lı́mite en
que se tienen “infinitas rotaciones infinitesimales”,
N
i b φ i b
D(Rz (φ)) = lı́m I − Jz
b b = exp − Jz φ .
N →∞ ~ N ~
en donde J
b = Jbx i + Jby j + Jbz k y n es un vector de longitud 1.
Una condición importante que se exige de los operadores que representan las rotaciones es
que deben satisfacer las mismas relaciones que las matrices de rotación. En particular, estos
operadores deben satisfacer la relación de conmutación
h i
D(R
b x ()), D(R b z (2 )) − D(I).
b y ()) = D(R b
EJERCICIO 47. Demuestre que J 2 conmuta con los generadores de las rotaciones alre-
dedor de los ejes coordenados x e y.
De manera semejante a lo que hicimos en el caso del oscilador armónico, definimos los
siguientes operadores escalera
†
Jb± = Jbx ± iJby = Jb∓ . (5.13)
Debido a que los operadores escalera en la ecuación anterior son combinaciones lineales de los
generadores de las rotaciones, ellos conmutan con el operador de Casimir:
h i
Jb2 , Jb± = b
0. (5.14)
Por otro lado, los operadores escalera no conmutan con el operador Jbz ,
h i h i h i
Jbz , Jb± = Jbz , Jbx ± i Jbz , Jby = i~Jby ± i(−i~Jbx )
Los signos superior e inferior de la ecuación (5.15) son independientes, y ası́, deben leerse dos
ecuaciones independientes de conmutación.
Es importante recordar que operadores que conmutan tienen un conjunto completo de
autovectores comunes.
EJERCICIO 48. Demostrar la afirmación anterior.
EJERCICIO 49. Demostrar que si dos operadores no conmutan, entonces no poseen un
conjunto completo de autoestados comunes. Sugerencia: Pruebe por contradicción. Demuestre
dos operadores que tienen un conjunto completo de autoestados comunes deben conmutar.
Se dice que los operadores Jb2 y Jbz son compatibles porque conmutan entre sı́. Teniendo
en cuenta que J 2 y Jz son compatibles, sabemos que existen estados que son autoestados de
80 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
ambos operadores. Podemos escribir las ecuaciones de autovalores de los operadores cuadrado
del momento angular,J 2 , y de proyección del momento angular alrededor del eje z, Jz , en la
forma
Jb2 (Jb+ |j2 , jz i) = (Jb2 Jb+ ) |j2 , jz i = (Jb+ Jb2 ) |j2 , jz i = Jb+ (Jb2 |j2 , jz i)
= Jb+ (j2 |j2 , jz i) = j2 (Jb+ |j2 , jz i). (5.17)
Esta igualdad nos deja claro que el vector |χi es autovector de Jb2 con autovalor j2 ; es decir,
tanto Jb+ |j2 , jz i como |j2 , jz i poseen el mismo autovalores del cuadrado del momento angular.
La demostración de que el operador de bajada Jb− tampoco altera el autovalor de Jb2 es
cmpletamente análoga.
Cuando se aplica un operador arbitrario a un autoestado de la tercera componente del
momento angular, Jbz , el resultado debe ser, en general, una combinación lineal de todos
los autoestados de Jbz . Los operadores escalera, sin embargo, se definen de manera que su
aplicación sobre un autoestado de Jbz conduzca a otro autoestado del mismo operador. En
efecto, veamos las siguientes igualdades
Jbz (Jb± |j2 , jz i) = (Jbz Jb± ) |j2 , jz i = Jbz Jb± − Jb± Jbz + Jb± Jbz |j2 , jz i
h i
= Jbz , Jb± + Jb± Jbz |j2 , jz i = ±~Jb± ± jz Jb± |j2 , jz i
La ecuación (5.19) indica que si aplicamos el operador escalera Jb+ a un autovector de Jbz se
obtiene un nuevo vector, Jb+ |j2 , jz i, que también es autovector de Jbz , con un autovalor que es
~ mayor que el autovalor del vector original. Por esta razón, al operador Jb+ se le denomina
operador de subida. De manera completamente análoga, la aplicación del operador Jb− sobre
un autovector de Jbz produce un nuevo autovector de que Jbz con un autovalor ~ menor que
el vector original. Por esta razón, al operador J− se le conoce como operador de bajada.
Merece la pena mencionar que, si el autoestado original |j2 , jz i está normalizado a la unidad,
k |j2 , jz i k2 = 1, el nuevo autovector Jb+ |j2 , jz i tendrá una norma que, en general, será diferente
de la unidad.
5.3. TEORÍA DEL MOMENTO ANGULAR 81
Ahora veamos que el valor esperado de J − Jz en uno de los autoestados comunes de Jb2
b2 b2
y de Jbz ,
hj2 , jz | (Jb2 − Jbz2 ) |j2 , jz i = hj2 , jz | (j2 − j2z ) |j2 , jz i = (j2 − j2z ), (5.20)
también puede escribirse como
hj2 , jz | (Jb2 − Jbz2 ) |j2 , jz i = hj2 , jz | Jbx Jbx + Jby Jby |j2 , jz i = hα | αi + hβ | βi ≥ 0, (5.21)
en donde |αi = Jbx |j2 , jz i y |βi = Jby |j2 , jz i. Empleando (5.21) en (5.20), encontramos la
desigualdad
j2 − j2z ≥ 0, (5.22)
que indica que, dado un valor de j2 existe un valor máximo de j2z . Otra manera de escribir la
desigualdad (5.22),
p
|jz | ≤ j2 ,
muestra que existe un valor máximo de jz , al cual designaremos por jzmax , y un valor mı́nimo
de jz , al cual designaremos por jzmin . Para los autovectores correspondientes a los valores
mı́nimo y máximo de Jbz , la proyección del momento angular alrededor del eje z, se deben
cumplir las igualdades
ya que no pueden existir autovectores con autovalor de Jbz mayor que jzmax , ni autovectores
con autovalor de Jbz menor que jzmin .
Vamos a ver que jzmax y jzmin pueden relacionarse con j2 . Para tanto calculamos los
productos de los operadores escalera
Jb± Jb∓ = (Jbx ± iJby )(Jbx ∓ iJby ) = Jbx2 + Jby2 ± i Jby Jbx − Jbx Jby
h i
= Jbx2 + Jby2 + Jbz2 − Jbz2 ± i Jby , Jbx = Jb2 − Jbz2 ± ~Jbz , (5.24)
(Jb2 − Jbz2 − ~Jbz ) |j2 , jzmax i = (j2 − j2zmax − ~jzmax ) |j2 , jzmax i = 0
Por otro lado, si le aplicamos el operador de subida a la ecuación del lado derecho de (5.23)
(Jb2 − Jbz2 + ~Jbz ) |j2 , jzmin i = (j2 − j2zmin + ~jzmin ) |j2 , jzmin i = 0
Figura 5.3: Entre jzmin y jzmax hay un número entero de pasos, cada uno correspondiente al
aumentar el autovalor en ~.
Si multiplicamos cada uno de los factores del lado derecho por −1, esta ecuación se puede
escribir como
j2 = −jzmin (−jzmin + ~).
Comparando j2 = jzmax (jzmax + ~) con j2 = −jzmin (−jzmin + ~) vemos que jzmin = −jzmax .
De hecho, existe otra solución: jzmax = jzmin − ~. Esta segunda solución es inválida, porque
implica que jzmax < jzmin , contrariamente a la suposición que se hizo.
Si comenzamos con el vector cuyo valor de momento angular alrededor de z es mı́nimo,
después de aplicar el operador de subida un número entero de veces, digamos n, finalmente
obtenemos el ket cuyo momento angular alrededor de z es máximo, de tal suerte que
n
jzmax = (−jzmax ) + n~ ⇒ jzmax = ~. (5.27)
2
La ecuación (5.19), en términos de los nuevos rótulos, muestra que el vector Jb+ |j, jz i es un
autovector de los operadores Jb2 y Jbz con autovalores ~2 j(j + 1) y ~(jz + 1) respectivamente.
De manera similar, el vector Jb+ |j, jz i tiene autovalores ~2 j(j + 1) y ~(jz − 1).
En la figura 5.4 se ilustra elpmodelo vectorial de los autoestados comunes de Jb2 y Jbz .
Tenemos una esfera de radio ~ j(j + 1) y planos correspondientes a jz = n~, con n =
5.3. TEORÍA DEL MOMENTO ANGULAR 83
−2, · · · , 2. De esta manera, cada estado corresponderı́a a un cı́rculo, tal como se muestra en
la figura. Los valores de las componentes x e y del momento angular no estarı́an, por lo tanto,
bien definidos.
Si suponemos que los estados |j, jz i están normalizados a la unidad, los vectores Jb± |j, jz i
no lo estarán. Ası́, podemos escribir
Ejemplo
Si suponemos que j = 1/2, los valores posibles de Jbz serán jz = −1/2 y jz = 1/2. Ası́, los
autoestados simultáneos de Jb2 y de Jbz son dos: |1/2, 1/2i y |−1/2, 1/2i.
Podemos encontrar una representación del operador Jbz haciéndolo actuar sobre un operator
identidad, ası́:
1 1 1 1 1 1 1 1
Jz I = Jz , −
b b b ,− + , ,
2 2 2 2 2 2 2 2
~ 1 1 1 1 ~ 1 1 1 1
= − ,− ,− + , , .
2 2 2 2 2 22 2 2 2
La forma matricial del operador Jbz , en la base de sus autovectores, se consigue escribiendo el
resultado anterior como
1 1
2, 2
~
1 1 1 1 0
Jbz = , ,− 2
2 2 2 2 0 ~2
1 1
2 , − 2
Para encontrar la representación del operador Jbz , recordamos que es una combinación
lineal de los operadores de subida y de bajada Jbz = 1/2(Jb+ + Jb− ) y lo aplicamos a un operador
84 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
identidad
1 1 1 1 1 1 1 1
Jbx = Jb+ , − ,− + , ,
2 2 2 2 2 2 2 2
1 1 1 1 1 1
1 1
+Jb− , − ,− + , ,
2 2 2 2 2 2 2 2
s
~ 1 1 1 1 1 1 1 1
= − − + − + 1 , − + 1 ,−
2 2 2 2 2 2 2 2 2
s
1 1 1 1 1 1 1 1
+~ + − + 1 , −1 ,
2 2 2 2 2 2 2 2
~ 1 1 1 1 ~ 1 1 1 1
= , , − + , − , .
22 2 2 2 22 2 2 2
Los dos términos que no se escribieron explı́citamente son ambos cero: uno porque corresponde
al operador de subida actuando sobre el estado con máximo valor de proyección de momento
angular; el otro porque corresponde al operador de bajada actuando sobre el estado con
mı́nimo valor de proyección de momento angular.
EJERCICIO 51. Usando la misma técnica que empleamos para hallar la representación
matricial de Jbz en la base de sus autovectores, encuentre las representaciones matriciales de
Jbx y de Jby en la base de los autovectores de Jbz .
. ~ 1 0 . ~ 0 1 . ~ 0 −i
Jbz = Jbx = Jby = . (5.33)
2 0 −1 2 1 0 2 i 0
Cada una de las componentes del operador de momento angular orbital es formalmente
hermı́tica L̂†i = L̂i . En efecto,
†
L̂†i = (imn x
bm pbn ) = imn pb†n x
b†m = imn pbn x
bm = imn x
bm pbn = L̂i .
5.4. MOMENTO ANGULAR ORBITAL 85
En la secuencia de la deducción anterior hemos tenido en cuenta que el hermı́tico conjugado
de un producto de operadores es el producto de los hermı́ticos conjugados en orden inverso y
que los operadores de posición y momento son hermı́ticos. Finalmente, tuvimos en cuenta que,
a causa del tensor antisimétrico nunca se tienen productos de una componente de posición por
su correspondiente momento. Dicho de manera diferente, siempre se tienen productos de una
componente de posición por una componente diferente del momento; como estos operadores
conmutan podemos escribirlos en el orden contrario y recuperar la definición de la i-ésima
componente del momento angular orbital. Regresemos a la forma más explı́cita de las com-
ponentes del momento angular. Si tomamos una componente del momento angular, digamos
L
bz = xbpby − ybpbx , es fácil ver que corresponde a un operador autoadjunto
b †z = (b †
L xpby − ybpbx ) = pb†y x
b† − pb†x yb† = pby x
b − pbx yb = x
bpby − ybpbx = L
bz . (5.36)
L
b j = jrs x
br pbs , (5.37)
Por otro lado el tensor de Levi-Civita tiene la siguiente propiedad de contracción de ı́ndices
X
abc aef = δbe δcf − δbf δce , abc aef = δbe δcf − δbf δce . (5.42)
a
86 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
En (5.42) hemos escrito la versión sin convención de suma antes de la versión con esta con-
vención, para recordarle al lector que se trata de una suma.
h i
L b j = i~ {nim njs x
bi , L bm pbs − mni mrj x
br pbn }
= i~ {(δij δms − δis δmj )b
xm pbs − (δnr δij − δnj δir )b
xr pbn }
= i~ {δij (b
xm pbm − x
bn pbn ) − δis δmj x br pbn }
bm pbs + δnj δir x
Claramente el primer término, que sin la convención de suma implı́cita se expresa como
X X X X
i~δij ( bm pbm −
x x
bn pbn ) = i~δij ( bn pbn −
x x
bn pbn ), (5.43)
m n n n
es cero.
h i
L b j = −i~ {δis δmj x
bi , L bm pbs − δir δnj x
br pbn }
= −i~ {δis δmj x
bm pbs − δim δsj x
bm pbs }
= −i~(δis δjm − δim δjs )b
xm pbs
En la serie de igualdades anteriores tuvimos en cuenta que los ı́ndices de suma son mudos, y
se les puede cambiar de nombre. Empleando la identidad (5.42), y luego la antisimetrı́a del
tensor de Levi-Civita ante el intercambio de dos de sus ı́ndices, podemos escribir
h i
L b j = −i~kij ksm x
bi , L bm pbs = i~ijk kms x
bm pbs = i~ijk L
bk .
Se tiene entonces que el momento angular orbital satisface las mismas reglas de conmutación
que los generadores de momento angular, a saber,
[L
bi , L
b j ] = i~ijk L
bk . (5.44)
Para obtener este mismo resultado podemos partir de las expresiones explı́citas para dos
de las componentes de momento angular. Calculemos la relación de conmutación [L bx , L
b y ].
[L
bx , L
b z ]. (5.46)
Veamos que
iφ b φ b φ
exp − Jz = cos I − i sin σ
bz .
~ j=1/2 2 2
Si hacemos una rotación de 2π no regresamos al operador identidad. Esta es una señal de que
este caso NO corresponde al momento angular orbital. De hecho, si intentáramos hallar las au-
tofunciones correspondientes, suponiendo que se trata de momento angular orbital llegarı́amos
a algunas contradicciones1 . Las representaciones correspondientes a j = 32 , 52 , ..., 2n+1
2 tam-
poco son representaciones de momento angular orbital. Si j es par puede corresponder a
momento angular intrı́nseco o a momento angular orbital.
1 ver Sakurai[39]
5.4. MOMENTO ANGULAR ORBITAL 87
Consideremos la representación en coordenadas de las componentes cartesianas del mo-
mento angular,
hx| L
b i |Ψi = ijk hx| x
bj pbk |Ψi
= ijk xj hx| pbk |Ψi
∂
= ijk xj −i~ hx | Ψi
∂xk
∂
= −i~ijk xj hx | Ψi.
∂xk
De esta manera se tiene que la representación en coordenadas del momento angular orbital
está dada por
. ∂
L
bi = −i~ijk xj . (5.47)
∂xk
∂r
El vector ∂u i
, i = 1, 2, 3 es tangente a la curva a lo largo de ui en el punto r. Como la norma
de este vector no es, en general, unitaria, podemos definir el vector unitario
∂r
∂r
ei = ∂ui , hi =
∂ui
,
hi
de forma que el incremento infinitesimal puede escribirse
3
X
dr = hi ei dui . (5.50)
i=1
en donde S es la superficie cerrada que circunda el punto r,el cual es el punto central del cubo
de la figura 5.5. Calculamos primero la contribución a la integral de superficie lo largo de u1 .
Mientras la normal de la cara de atrás apunta en la dirección de −e1 , la de adelante apunta
hacia e1 . El área de la primera cara es h2 (u1 − du2 1 , u2 , u3 )h3 (u1 − du2 1 , u2 , u3 )du2 du3 ; el área
de la segunda es h2 (u1 + du2 1 , u2 , u3 )h3 (u1 + du2 1 , u2 , u3 )du2 du3 . En la cara posterior, el campo
es g(u1 − du2 1 , u2 , u3 ); en la anterior, es g(u1 + du2 1 , u2 , u3 ). En consecuencia, la contribución
de estas dos caras a la integral de superficie es
du1 du1 du1
−h2 (u1 − , u2 , u3 )h3 (u1 − , u2 , u3 )du2 du3 e1 · g(u1 − , u2 , u3 )
2 2 2
du1 du1 du1
+h2 (u1 + , u2 , u3 )h3 (u1 + , u2 , u3 )du2 du3 e1 · g(u1 + , u2 , u3 )
2 2 2
∂
≈ (h2 (u1 , u2 , u3 )h3 (u1 , u2 , u3 )e1 · g(u1 , u2 , u3 )) du1 du2 du3 .
∂u1
EJERCICIO 54. Muestre que, calculando las contribuciones de las otras caras, la integral
de superficie es
I
∂ ∂ ∂
g · ndS ≈ (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) du1 du2 du3 ,
S ∂u1 ∂u2 ∂u3
en donde gi = ei · g.
Como el volumen infinitesimal es h1 h2 h3 du1 du2 du3 , la divergencia de g es
1 ∂ ∂ ∂
∇·g = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) . (5.55)
h1 h2 h3 ∂u1 ∂u2 ∂u3
Si hacemos g = ∇f vemos que el laplaciano de una función f es
2 1 ∂ ∂ ∂
∇ f = ∇ · (∇f ) = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 )
h1 h2 h3 ∂u1 ∂u2 ∂u3
1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + . (5.56)
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3
Las coordenadas cartesianas están definidas en todo el eje real −∞ < x, y, z < ∞, en
tanto que r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π]. Un punto en coordenadas esféricas puede
escribirse como
Recordemos que en la discusión de la teorı́a del momento angular, las componentes car-
tesianas jugaron un papel importante. Las expresiones para los operadores diferenciales que
90 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
representan las componentes del momento angular son las siguientes:
∂ 1 ∂
Lx = ex · L = −i~ ex · eφ − ex · eθ
∂θ sin θ ∂φ
∂ cos θ cos φ ∂
= −i~ − sin φ − (5.65)
∂θ sin θ ∂φ
∂ 1 ∂
Ly = ey · L = −i~ ey · eφ − ey · eθ
∂θ sin θ ∂φ
∂ cos θ sin φ ∂
= −i~ cos φ − (5.66)
∂θ sin θ ∂φ
∂ 1 ∂
Lz = ez · L = −i~ ez · eφ − ez · eθ
∂θ sin θ ∂φ
sin θ ∂ ∂
= −i~ = −i~ (5.67)
sin θ ∂φ ∂φ
Usando las expresiones arriba podemos encontrar los operadores diferenciales asocuiados
a los operadores de subida y de bajada.
iφ ∂ ∂
L+ = Lx + iLy = ~e + i cot θ (5.68)
∂θ ∂φ
∂ ∂
L− = Lx − iLy = ~e−iφ − i cot θ (5.69)
∂θ ∂φ
Dado que el vector unitario eφ no depende de θ, el cuadrado del momento angular se simplifica
a
∂2
L·L ∂ 1 ∂ 1 ∂ ∂ 1 ∂
= − 2 + eφ · eθ + eθ · eφ − eθ
~2 ∂θ ∂θ sin θ ∂φ sin θ ∂φ ∂θ sin θ ∂φ
Como ∂e
∂θ = (− sin θ cos φ, − sin θ sin φ, − cos θ) = −er , el producto escalar con eφ es cero, y
θ
y la expresión para el cuadrado del momento angular sufre una simplificación adicional
∂2
L·L 1 ∂ ∂ 1 ∂
= − 2 + eθ · eφ − eθ .
~2 ∂θ sin θ ∂φ ∂θ sin θ ∂φ
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 91
Teniendo en cuenta que eφ y eθ son ortogonales y que θ y φ son independientes, tenemos
∂2
L·L ∂eφ 1 ∂ 1 ∂ ∂
= − + eθ · − e θ · e θ .
~2 ∂θ2 ∂φ sin θ ∂θ sin2 θ ∂φ ∂φ
Esta igualdad nos permite escribir el cuadrado del momento angular en la forma
∂2
L·L cos θ ∂ 1 ∂ ∂
= − − − eθ · eθ
~2 ∂θ2 sin θ ∂θ sin2 θ ∂φ ∂φ
∂2 cos θ ∂ ∂eθ 1 ∂ 1 ∂2
=− 2 − − eθ · 2 − eθ · eθ 2 .
∂θ sin θ ∂θ ∂φ sin θ ∂φ sin θ ∂φ2
Teniendo en cuenta que ∂e ∂φ = (− cos θ sin φ, cos θ cos φ, 0) = cos θeφ vemos que el tercer
θ
∂2 1 ∂2 1 ∂2
L·L cos θ ∂ 1 ∂ ∂
= − − − 2 = − sin θ − .
~ 2 ∂θ 2 sin θ ∂θ sin θ ∂φ 2 sin θ ∂θ ∂θ sin2 θ ∂φ2
Finalmente, el operador diferencial asociado al cuadrado del momento angular es
1 ∂2
2 1 ∂ ∂
L · L = −~ sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2
b z |l, mi = ~m |l, mi ,
L b 2 |l, mi = ~2 l(l + 1) |l, mi ,
L
En las ecuaciones anteriores empleamos la notación Yl,m (θ, φ) = hθ, φ|l, mi. La solución de la
ecuación diferencial (5.70) es
donde Nl,m es una constante de normalización y Θm l (θ) es una función de θ. Para que la
función de onda sea univaluada, es necesario que m sea entero. Este argumento, sin embargo,
es relativamente débil, puesto que solo las cantidades fı́sicas medibles, como la densidad de
probabilidad, deben ser univaluadas. Un argumento interesant es el usado en la referencia
[40] en el capı́tulo 7, p 169. Entre las refrencias que tratan este asunto, mencionamos a
Whippman [42], quien discute varios métodos para probar que los valores semienteros del
92 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
momento angular orbital no ocurren; Gray [43] quien argumenta que se debe tener componente
z del momento angular igual a cero, y Gatland [44] quien usa un argumento basado en la
paridad de los autoestados y los cambios de paridad producidos por los operadores escalera.
Para determinar Nl,m de la ecuación (5.72), vamos a suponer que Θm
l (θ) está normalizada
adecuadamente, de manera que
Z 2π Z π Z π
dφ dθ sin θ|Nl,m |2 e−imφ Θ∗l,m (θ)eimφ Θm
l (θ) = 2π|Nl,m |
2
dθ sin θ|Θm
l (θ)|
2
0 0 0
2
= 2π|Nl,m | = 1.
√
Suponiendo que Nl,m es un número real positivo, encontramos que Nl,m = 1/ 2π , de manera
que la solución de la ecuación diferencial (5.70) queda ası́
1
Yl,m (θ, φ) = √ eimφ Θm
l (θ), (5.73)
2π
Ahora vamos a insertar esta función de onda en la ecuación de autovalores y autofunciones
del cuadrado del momento angular, (5.71), para obtener la ecuación diferencial
m2
imφ
eimφ m
1 ∂ ∂ e m
− sin θ − √ Θ l (θ) = l(l + 1) √ Θl (θ),
sin θ ∂θ ∂θ sin2 θ 2π 2π
∂ 2 imφ
√
en donde usamos ∂φ2 e = −m2 eimφ . Después de multiplicar por 2πe−iφ sin2 θ, encontra-
mos la ecuación
d d
sin θ sin θ + l(l + 1) sin2 θ − m2 Θm
l (θ) = 0. (5.74)
dθ dθ
d ∂ d cos θ d
= = sin θ ,
dθ d cos θ dθ d cos θ
podemos transformar la ecuación para Θm m
l (θ) = Pl (cos θ),
d d
sin2 θ sin2 θ + l(l + 1) sin2 θ − m2 Plm (cos θ) = 0.
d cos θ d cos θ
la cual define los polinomios asociados de Legendre. Ası́, las funciones Yl,m (θ, φ) sin normalizar,
conocidas como armónicos esféricos, son de la forma
en donde
l k!
= ,
k l!(k − l)!
podemos escribir el l-ésimo polinomio de Legendre, no normalizado, Pel (x), en la forma
[l/2]
dl 2
l
X l (2l − 2k)! l−2k
Pl (x) = l (x − 1) =
e x (−1)k . (5.80)
dx k (l − 2k)!
k=0
El ı́ndice superior de la suma se obtiene sabiendo que se debe satisfacer que l − 2k ≥ 0, y por
lo tanto k ≤ l/2 o k ≤ [l/2], con [x] denotando la función parte entera. De esta forma,
[l−1/2]
dPel X l (2l − 2k)!
= (−1)k (l − 2k)xl−2k−1
dx k (l − 2k)!
k=0
[l−1/2]
X
k l (2l − 2k)! l−2k−1
= (−1) x . (5.81)
k (l − 2k − 1)!
k=0
Analizamos los lı́mites superiores de las sumas, pues al parecer son diferentes. Suponiendo l
impar, digamos l = 2m + 1 resulta que
l−1 2m + 1 − 1 l 2m + 1 1
= = m, = = m+ = m.
2 2 2 2 2
Por su parte, si l es par, digamos l = 2m resulta que
l 2m l−1 2m − 1 1
[ ]= = m, = = m−1+ = m − 1.
2 2 2 2 2
Esto significa que si l es par la segunda suma de (5.86) va únicamente hasta m − 1. Sin
embargo, es posible extender la suma hasta m porque, debido al factor (l − 2k), dicho término
es idénticamente igual a cero. Ası́, podemos escribir la ecuación (5.86) de modo simplificado
m
X l (2l − 2k)! l−2k
− 2k(2l − 2k + 1)(−1l ) x
k (l − 2k)!
k=0
m
X
k l (2l − 2k)!
− (−1) (l − 2k)(l − 2k + 1)xl−2k
k (l − 2k)!
k=0
m
X l (2l − 2k)! l−2k
+ l(l + 1) x (−1)k . (5.87)
k (l − 2k)!
k=0
Es fácil verificar que los primeros polinomios de Legendre están entonces dados por
P0 (x) = 1, (5.89a)
P1 (x) = x, (5.89b)
3 1
P2 (x) = x2 − , (5.89c)
2 2
5 3
P3 (x) = x3 − x. (5.89d)
2 2
La normalización introducida es tal que Pl (1) = 1. Los polinomios de Legendre son pares o
impares como puede verse fácilmente,
[l/2]
1 X k l (2l − 2k)!
Pl (−x) = l (−1) (−x)l−2k
2 l! k (l − 2k)!
k=0
[l/2]
1 Xl k l (2l − 2k)! l−2k
= (−1) l (−1) (x)
2 l! k (l − 2k)!
k=0
= (−1)l Pl (x). (5.90)
dm 2
2 d Pl dPl
(1 − x ) − 2x + l(l + 1)P l = 0. (5.91)
dxm dx2 dx
Esta fórmula puede probarse por inducción. Es claro que la ecuación (5.92) se cumple para
n = 1. Si suponemos que la regla de Leibniz se cumple para n entonces se puede mostrar que
96 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
también se cumple para n + 1. Aplicando la regla de Leibniz se tiene entonces
m
d2 Pl dm−1 d2 Pl
m 2 d m
(1 − x ) m + (−2x)
0 dx dx2 1 dxm−1 dx2
m−2 2
m d d Pl
+ (−2) m−2 (5.93)
2 dx dx2
m
m−1
dm Pl
m d dPl m d dPl
−2 x m + + l(l + 1) = 0,
0 dx dx 1 dxm−1 dx dxm
dm d2 Pl dm−1 d2 Pl dm−2 d2 Pl
(1 − x2 ) m + (−2mx) − m(m − 1)
dx dx2 dxm−1 dx2 dxm−2 dx2
dm dPl dm−1 dPl dm Pl
−2 x m + m m−1 + l(l + 1) m = 0.
dx dx dx dx dx
Sumando los coeficientes correspondientes a las derivadas del mismo orden llegamos a
d2 dm Pl d dm Pl
(1 − x2 ) 2 − 2(m + 1)x (5.94)
dx dxm dx dxm
m
d Pl
+ [l(l + 1) − m(m + 1)] = 0.
dxm
dm Pl dm Pl
Plm (x) = (1 − x2 )m/2 , → = (1 − x2 )−m/2 Plm (x). (5.95)
dxm dxm
Derivando (5.95) con respecto a x hallamos
d d m Pl dP m (x)
m
m
= − (1 − x2 )−m/2−1 (−2x)Plm (x) + (1 − x2 )−m/2 l
dx dx 2 dx
m
dP (x)
= mx(1 − x2 )−m/2−1 Plm (x) + (1 − x2 )−m/2 l . (5.96)
dx
Empleamos la regla de Leibniz para encontrar la segunda derivada de (5.95) con respecto a
x,
d2 dm Pl
= m(1 − x2 )−m/2−1 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−2 Plm (x)
dx2 dxm
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2−1 l + (1 − x2 )−m/2 . (5.97)
dx dx2
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 97
Usando (5.95–5.97) en la ecuación diferencial (5.94) se recibe
m(1 − x2 )−m/2 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−1 Plm (x)
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2 l + (1 − x2 )−m/2+1
dx dx2
m
2 −m/2−1 m 2 −m/2 dPl (x)
− 2(m + 1)x mx(1 − x ) Pl (x) + (1 − x )
dx
+ [l(l + 1) − m(m + 1)](1 − x2 )−m/2 Plm (x) = 0.
d|m| 1 2 |m|/2 d
|m|+l
Plm (x) = (1 − x2 )|m|/2 P l (x) = (1 − x ) (x2 − 1)l . (5.99)
dx|m| 2l l! dx|m|+l
Las autofunciones comunes de Lbz y Lb 2 , teniendo en cuenta la normalización, son
1
m+|m| (2l + 1)(l − |m|)! 2 imφ |m|
Ylm (θ, φ) = (−1) 2 e Pl (cos θ). (5.100)
4π(l + |m|)
dPll
= l cot θPll ,
dθ
admite la solución ln Pll = l ln sin θ + C, en donde C es una constante. Despejando P tenemos
Pll (cos θ) = C̃ sinl (θ), siendo Pll (cos θ) = C̃ otra constante, cuya norma se puede determinar
mediante la condición de normalización de la función de onda
Z π √
πΓ(l + 1)
sin θdθ|C̃|2 sin2l θ = |C̃|2 = 1.
0 Γ(l + 23 )
EJERCICIO 57. Obtener Yll−1 (θ, φ) y Yll−2 (θ, φ) con la normalización apropiada, usando
el operador de bajada.
El desarrollo de los armónicos esféricos empleando los operadores de subida y de bajada
se puede encontrar en [41], p 320.
EJERCICIO 58. Demuestre que en la representación de coordenadas
2
1 ∂2
. ∂ ∂ ∂
L+ L− = −~2 + cot θ + + i .
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ
y
∂2 1 ∂2
. ∂ ∂
L+ L− = −~2 + cot θ + −i .
∂θ 2 ∂θ sin2 θ ∂φ2 ∂φ
Finalmente encontramos que las componentes cartesianas del momento angular se escriben
ası́
. ∂ ∂
Lx = −i~ − sin φ − cot θ cos φ , (5.102a)
∂θ ∂φ
. ∂ ∂
Ly = −i~ cos φ − cot θ sin φ , (5.102b)
∂θ ∂φ
. ∂
Lz = −i~ , (5.102c)
∂φ
en la representación de coordenadas. En el caso de los operadores de subida y bajada tenemos
. ∂ ∂
L± = ~ exp (±iφ) ± + i cot θ , (5.103)
∂θ ∂φ
y para el cuadrado del operador del momento angular
2
1 ∂2
2 . 2 ∂ ∂
L = −~ + cot θ + . (5.104)
∂θ2 ∂θ sin2 θ ∂φ2
b2 = 1 L
L b+ L
b− + L b− L
b+ + L b 2z (5.105)
2
2 iφ ∂ ∂ −iφ ∂ ∂
L+ L− = −~ e
b b − + i cot θ e + i cot θ (5.106)
∂φ ∂φ ∂φ ∂φ
Empleando la relación
∂ −iφ −iφ ∂
e =e −i + , (5.107)
∂φ ∂φ
y la relación
∂ 1 ∂
cot θ = − 2 + cot θ (5.108)
∂θ sin θ ∂θ
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 99
arribamos a
∂2 1 ∂2
. ∂ ∂
L+ L− = −~2 2
+ cot θ + 2 2
+i . (5.109)
∂θ ∂θ sin θ ∂φ ∂φ
EJERCICIO 59. De manera semejante a la presentada en el texto demostrar que en la
representación de coordenadas
2
1 ∂2
. 2 ∂ ∂ ∂
L+ L− = −~ + cot θ + −i . (5.110)
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ
El momento angular orbital no puede tomar valores semienteros porque al realizar una
rotación por 2π la función de onda adquirirı́a un signo negativo. Sin embargo, la función
de onda debe ser univaluada para que la expansión de un vector de estado en términos de
autoestados de posición sea única. Si consideramos posible la existencia de estados de momento
angular correspondientes a valores semienteros, tendremos que la función de onda
1 1
hr, θ, φ | , − i = 0, (5.111)
2 2
es diferente de aquella obtenida de
1 1
hr, θ, φ| L− | , i , (5.112)
2 2
en donde
1 1
L+ | , i = 0. (5.113)
2 2
Ejemplos de autoestados de Lz y L2 en coordenadas esféricas.
100 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
Capı́tulo 6
Potenciales Centrales
6.1. Introducción
El estudio de los sistemas cuánticos se vuelve muy complicado rápidamente, no solo por-
que los potenciales de sistemas fı́sicos reales son tridimensionales, sino porque la ecuación de
Schrödinger no se escribe en el espacio fı́sico de tres dimensiones, sino en el de configuración;
es decir, si tenemos dos partı́culas que se mueven en el espacio, la ecuación de Schrödinger
depende de seis parámetros, tres coordenadas para la primera partı́cula y otras tres coordena-
das para la segunda. Aún en el caso de una sola partı́cula, en general no es posible ni resolver
la ecuación de movimiento ni encontrar las autofunciones y los autovalores de manera analı́ti-
ca. Dentro de los casos completamente solubles, o que se pueden simplificar enormemente,
tenemos los casos de una sola partı́cula que se mueve en un potencial tridimensional central,
o de dos partı́culas cuyo potencial de interacción depende de la distancia entre ellas (y que
no están expuestas a ningún potencial externo). En este capı́tulo hacemos algunas conside-
raciones generales sobre los potenciales centrales y estudiamos en más detalle el átomo de
hidrógeno.
Comenzamos con un ejemplo para motivar el tema.
101
102 CAPÍTULO 6. POTENCIALES CENTRALES
− iEt
Dividiendo por XY Ze encontramos
~
~2 1 d2 X 1 d2 Y 1 d2 Z mω 2 2
2 2
E= − + + + (x + y + z )
2m X dx2 Y dy 2 Z ∂z 2 2
2 2 2 2 2 2
mω 2 y 2
~ d X mω x ~ d Y
= − + + − +
2mX dx2 2 2mY dy 2 2
| {z } | {z }
=EX =EY
~2 d2 Z mω 2 z 2
+ − + .
2mZ dz 2 2
| {z }
=EZ
con autoenergı́as
3
Ekmn = ~ω k + m + n + ,
2
dependen de tres enteros no negativos k, m y n.
Dado que el Hamiltoniano del oscilador armónico tridimensional (6.1) puede escribirse
como
b =p b mω 2 r
b·p b·r
b
H + ,
2m 2
parece claro que es invariante ante rotaciones. Este argumento puede escribirse de manera
más formal.
La fórmula de Rodrigues nos dice que cuando rotamos un vector r del espacio tridimen-
sional por un ángulo θ alrededor de la dirección n̂, se obtiene un nuevo vector r0
r0 = r + (n̂ × r) θ + O(θ2 ),
r = r0 − (n̂ × r0 ) θ + O(θ2 ).
Es importante ver que estamos ante una transformación activa: tenı́amos un vector y lo
rotamos para obtener un nuevo vector (o podrı́amos tomar un cuerpo y rotarlo). Podrı́amos
haber tenido una transformación pasiva, en la que un sistema de referencia se obtiene a
partir de otro mediante una rotación por un cierto ángulo alrededor de alguna dirección. La
representación matemática de una transformación activa es la inversa de la transformación
pasiva correspondiente.
Si ψ(r) es la función de onda de un sistema cuántico y ψ 0 (r) es la función correspondiente,
después de que se ha rotado el sistema, entonces el valor de ψ 0 en el punto rotado debe ser
igual a la función de onda original en el punto sin rotar,
dψ
ψ 0 (r0 ) = ψ(r) = ψ(r0 − (n̂ × r0 ) θ) = ψ|θ=0 + θ + O(θ2 )
dθ θ=0
X ∂ψ ∂(r0 − (n̂ × r0 ) θ)i
= ψ(r0 ) + θ 0
+ O(θ2 ) (6.3)
i
∂r i ∂θ
θ=0
en donde usamos
P el hecho de que la i-ésima componente del producto vectorial a × b es
(a × b)i = jk ijk aj bk , siendo ijk el tensor totalmente antisimétrico de Levi-Citiva, que
vale 1 si ijk es una permutación cı́clica de 123, -1 si es una permutación cı́clica de
P321, y
0 en los demás casos. También tuviemos en cuenta que ijk = jki y que a · b = j aj bj .
Empleando el resultado anterior en la ecuación (6.3) obtenemos
en donde
[A, •]O = [A, O], [A, •]2 O = [A, •][A, •]O = [A, •][A, O] = [A, [A, O]],
[A, •]3 O = [A, •][A, •]2 O = [A, •][A, [A, O]] = [A, [A, [A, O]]].
b0 · p
p b0 b0 · r
mω 2 r b0
H0 = + ,
2m 2
en donde p b0 y r
b0 son los que usted encontró en el ejercicio anterior.
El ejercicio anterior muestra que la forma del Hamiltoniano es la misma, antes y después
de la rotación. Es posible concluir, por lo tanto, que las autofunciones del oscilador armónico
tridimensional isotrópico deben tener alguna relación con el momento angular. Para develar
esta relación escribimos explı́citamente las funciones de onda del estado base, con energı́a
3~ω
E000 = 3 × ~ω 2 y de los tres estados degenerados con energı́a 2 × 2 + 2 = 5 × 2 ,
~ω ~ω
√
1 r2
− 2b 2z − r22
Φ000 (r) = √
4
e ,2
Φ001 (r) = √
4
e 2b ,
π 3 b6 π 3 b6
√ √
2x − r22 2y − r22
Φ100 (r) = √
4
e 2b , Φ010 (r) = √
4
e 2b .
π 3 b6 π 3 b6
Vamos a analizar el efecto de aplicar las componentes del momento angular sobre funciones
que dependen únicamente de r2 . Comenzamos calculando las derivadas parciales.
∂ dF ∂r2 dF ∂ dF ∂ dF
F (u = r2 ) = = 2x , F (u) = 2y , F (u) = 2z .
∂x du ∂x du ∂y du ∂z du
bién valen las relaciones L b 2x F (r2 ) = 0 = L b 2y F (r2 ). Finalmente, sumando estos tres resultados
2 2
encontramos L b F (r ) = 0.
Como la función de onda Φ000 (r) depende solamente de r2 , podemos concluir que
b z |000i = 0 = 0~ |000i ,
L b 2 |000i = 0 = 0(0 + 1)~2 |000i .
L
6.2. POTENCIALES CENTRALES 105
Hemos escrito estas ecuaciones de modo que quede claro que el estado |000i es autoestado de
L b 2 también con autovalor 0, es decir, corresponde a l = 0 y m = 0.
b z con autovalor 0 y de L
EJERCICIO 62. Mostrar que
b z |001i = 0~ |001i ,
L b 2 |001i = 1(1 + 1)~2 |001i
L
b z |+i = ~ |+i ,
L b 2 |+i = 1(1 + 1)~2 |+i
L
b z |−i = −~ |−i ,
L b 2 |−i = 1(1 + 1)~2 |−i
L
donde
|100i + i |010i |100i − i |010i
|+i = √ , |−i = √ .
2 2
Notar que pasamos de l = 0 a l = 1. No encontramos l = 1/2. Para el momento angular no
encontramos valores semienteros para l. Encontrar las funciones de onda correspondientes a
los estados |+i y |−i.
El último término de la ecuación (6.7), por su parte, puede ponerse en la siguiente forma
X X X X
rba pbb rbb pba = rb pba − pba rbb + pba rbb ) =
rba pbb (b rba pbb [b
rb , pba ] + rba pbb pba rbb
ab ab ab ab
X X
= rba pbb i~1̂δab + pb rbb − rbb pbb + rbb pbb )
rba pba (b
ab ab
X X X X
= i~ rba pba + rba pba [b
pb , rbb ] + rba pba rbb pbb
a a b ab
X
r·p
= i~b b·p
b+r b −i~1̂ + r
b·p
brb·p
b
b
2 2
r·p
= i~b b − 3i~b
r·p r·p
b + (b b) = −2i~b
r·p r·p
b + (b b) .
Juntando estos dos resultados vemos que el cuadrado del momento angular es
b 2 = −i~b
L r·p b + rb2 pb2 − −2i~b
r·p b)2 = rb2 pb2 + i~b
r·p
b + (b r·p
b − (b b)2 .
r·p
Además, como el vector posición es r = er r, el cuadrado del momento angular puede expre-
sarse como
2
2 2 2 2 2 ∂ 2 ∂
hr|L |ψi = −~ r ∇ ψ(r) + ~ r ψ(r) + ~ r
b ψ(r),
∂r ∂r
∂
en donde hemos tenido en cuenta que r · ∇ = ∂r . Si dividimos por 2mr2 , hallamos
2
~2 2 2 2
1 b 2 |ψi − ~ ∂ ψ(r) − ~ ∂
− ∇ ψ(r) = 2
hr|L r ψ(r), (6.10)
2m 2mr 2mr ∂r 2mr2 ∂r
después de rearreglar términos. Esta es la ecuación que relaciona la energı́a cinética (el Lapla-
ciano) con el momento angular. La ventaja de el camino empleado aquı́ es que no es necesario
tener una expresión previa para el Laplaciano en coordenadas esféricas, aunque se hace amplio
uso de la contracción de tensores de Levi-Civita.
Otro camino para encontrar esta relación es el uso de los resultados en el capı́tulo anterior:
por un lado del Laplaciano y por otro del cuadrado del momento angular. En coordenadas
curvilı́neas ortogonales, el laplaciano de una función f es
1 ∂ ∂ ∂
∇2 f = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) (6.11)
h1 h2 h3 ∂u1 ∂u2 ∂u3
1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + .
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3
En coordenadas esféricas
2
1 ∂ r sin θ ∂f ∂ r sin θ ∂f ∂ r ∂f
∇2 f = 2 + +
r sin θ ∂r 1 ∂r ∂θ r ∂θ ∂φ r sin θ ∂φ
∂2f
1 ∂ ∂f 1 ∂ ∂f 1
= 2 r2 + 2 sin θ + 2 ,
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
p2 ~2 1 ∂ 1 ∂2ψ
2 ∂ψ 1 ∂ ∂ψ
hr| |ψi = − r + 2 sin θ + 2
2m 2m r2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
1 ∂2
. 1 ∂ ∂
L · L = −~2 sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2
Ası́, podemos escribir una relación entre la energı́a cinética y el cuadrado del momento angular
p2 ~2 1 ∂
2 ∂ψ 1
hr| |ψi = − r + hr|L2 |ψi . (6.12)
2m 2m r2 ∂r ∂r 2mr2
Si pasamos a coordenadas esféricas vemos que las funciones hr|l, mi no tienen una dependencia
definida de r. Podemos, por lo tanto, identificar los autoestados comunes de L b 2 y de L
b z con
los llamados armónicos esféricos
Tales funciones nos ayudan a resolver la ecuación de Schrödinger independiente del tiempo
(6.13) empleando la factorización ψE (r) = RElm (r)Ylm (θ, φ). La ecuación resultante, para la
parte radial de la función de onda es
~2 d
2 dRElm (r) l(l + 1)
− r + V (r) + RElm (r) = ERElm (r).
2mr2 dr dr 2mr2
Ya que en la ecuación radial no hay dependencia explı́cita de m podemos ignorar el subı́ndice
m.
EJERCICIO 64. Encuentre la ecuación dinámica que satisface la función uEl (r) =
rREl (r).
p2n p2 Ze2
H(pn , pe , rn , r e ) = + e − (6.14)
2mn 2me 4π0 |r n − r e |
en donde pn y pe son los momentos del núcleo y del electrón y r n y r e sus posiciones.
EJERCICIO 65. Muestre que el hamiltoniano (6.14), en términos de la posición del
centro de masa, r CM y de la posición relativa, r rel , es
1 mn + me 2 Ze2
H(pCM , prel , r CM , r rel ) = p2CM + prel − . (6.15)
2(mn + me ) 2mn me 4π0 rrel
6.3. ÁTOMOS HIDROGENOIDES 109
Vemos que la dinámica del centro de masas se desacopla de la dinámica de la posición relativa.
El centro de masas se comporta como una partı́cula libre, en tanto que tenemos un problema
de potencial central para la coordenada relativa. Es usual denotar por M = mn + me a la
masa total y por µ a la masa reducida, siendo 1/µ = 1/mn + 1/me . Como la masa del núcleo
es mucho mayor que la masa del electrón, la masas total y reducida son muy parecidas a la
masa del núcleo y la del electrón, respectivamente; la posición del centro de masa casi coincide
con la del núcleo.
La ecuación de Schrödinger correspondiente al hamiltoniano (6.14) es la siguiente
~2 2 ~2 2 Ze2
i~∂t Ψ(r n , r e , t) = − ∇ − ∇ − Ψ(r n , r e , t). (6.16)
2mn n 2me e 4π0 |r n r e |
Vemos que, en el caso de dos partı́culas tenemos una función de onda que depende de las
coordenadas de ambas partı́culas. La interpretación probabilı́stica en este caso es como se
consigna a continuación. La probabilidad de hallar el núcleo en un volumen infinitesimal dVn
alrededor del punto r n y de hallar, simultáneamente al electrón en un volumen infinitesimal
dVe alrededor del punto r e , en el instante t, si en dicho instante el estado del sistema compuesto
por el núcleo y por el electrón se describe mediante la función de onda Ψ(r n , r e , t), es
en donde la integral se extiende sobre todas las posiciones posibles para el electrón.
Resaltamos que la función de onda describe al sistema núcleo más electrón, y que las propie-
dades de uno, por ejemplo su posición, dependen de las propiedades del otro. Este hecho tiene
consecuencias profundas que, en particular, niegan la idea de la identidad individual de cada
uno de los subsistemas de un sistema dado. El artı́culo de Einstein, Podolsky y Rosen de 1935
[107] muestra que esta falta de individualidad no es compatible con la localidad (eta es una
lectura moderna del artı́culo, cuyo propósito inicial era demostrar que la mecánica cuántica es
incompleta), mientras que las ideas modernas del procesamiento de la información cuántica
se aprovechan de esta circunstancia.
EJERCICIO 66. Escriba la ecuación de Schrödinger (6.16) en términos de las coorde-
nadas de centro de masa y relativa, y muestre que la ecuación de Schrödinger resultante es
precisamente la correspondiente al hamiltoniano (6.15), a saber
~2 2 ~2 2 Ze2
i~∂t Ψ(r CM , r rel , t) = − ∇CM − ∇rel − Ψ(r CM , rrel , t). (6.20)
2M 2µ 4π0 rrel
EJERCICIO 67. ¿Existe alguna transformación unitaria que lleve de (6.14) a un Hamil-
toniano que tenga la misma forma de (6.15)? Esta pregunta puede ser difı́cil de contestar (al
momento de escribir creo que la respuesta es sı́, pero no sé cómo serı́a la transformación).
Una pregunta relacionada, pero más simple es la siguiente. Considere transformaciones de la
forma
~2 ∇2CM ΨCM
2 2
Ze2
∂t ΨCM ∂t Ψrel ~ ∇rel Ψrel
i~ + i~ =− + − − ,
ΨCM Ψrel 2M ΨCM 2µ Ψrel 4π0 rrel
Haciendo cada uno de los lados igual a cero obtenemos sendas ecuaciones de Schrödinger
~2 2
i~∂t ΨCM = − ∇CM ΨCM , (6.23a)
2M2
Ze2
~
i~∂t Ψrel = − ∇2rel − Ψrel . (6.23b)
2µ 4π0 rrel
La primera ecuación corresponde a la de una partı́cula libre, en tanto que la segunda corres-
ponde a un potencial central.
EJERCICIO 68. ¿Cómo cambian las ecuaciones (6.23) y sus soluciones, si la constante
de separación no se escoge igual a cero?
Podemos concentrarnos en (6.23b) y dejar de escribir el subı́ndice rel. La solución general de
(6.23b) es una superposición de funciones de onda del tipo
en donde Ylm (θ, φ) designa los armónicos esféricos. Las funciones radiales satisfacen la ecuación
~2 1 d Ze2 ~2 l(l + 1)
2 d
− r − + REl (r) = EREl (r),
2m r2 dr dr 4π0 r 2mr2
Ze2
1 d 2 d 2m l(l + 1)
r + E + − REl (r) = 0.
r2 dr dr ~2 4π0 r r2
potencial centrı́fugo o la barrera centrı́fuga, porque tiende a alejar la partı́cula del origen
de coordenadas. Como la coordenada r no puede tomar valores positivos, pero uEl (r) debe
anularse en el origen, podemos pensar que el potencial es infinito para valores negativos de la
coordenada y es igual al potencial efectivo para valores positivos.
6.3. ÁTOMOS HIDROGENOIDES 111
Dado que es conveniente emplear cantidades adimensionales, introducimos ρ y mediante las
d2 1 d2
ecuaciones r = a0 ρ y E = E0 . Empleando estas definiciones hallamos dr 2 = a2 dρ2 y
0
2 2
1 d 2mE0 2mZe 1 l(l + 1)
+ + − 2 2 (a0 ρREl (a0 ρ)) = 0.
a20 dρ2 ~2 4π0 a0 ~2 ρ a0 ρ
Esta ecuación también se puede expresar en la forma
2
2mE0 a20 2mZe2 a0 1 l(l + 1)
d
+ + − (ρREl (a0 ρ)) = 0.
dρ2 ~2 4π0 ~2 ρ ρ2
mZe2 a0 2mE0 a20 4π0 ~2
Haciendo 4π0 =1y ~2 = 1, obtenemos a0 = mZe2 y
~2 ~2 m2 Z 2 e4 mZ 2 e4
E0 = = = . (6.26)
2ma20 2m (4π0 )2 ~4 32π 2 ~2 20
Con estos valores para a0 y para E0 , la ecuación radial se simplifica,
2
d 2 l(l + 1)
+ + − (ρREl (a0 ρ)) = 0. (6.27)
dρ2 ρ ρ2
Es importante darse cuenta de que, como esta ecuación no depende de ml , ı́ndice que toma
valores entre −l y l, tenemos una degeneración. Una vez encontremos un autoestado con algún
valor de energı́a para un dado valor de l, sabemos que existe un subespacio del espacio de
Hilbert de dimensión 2l + 1 tiene la misma energı́a.
Figura 6.2: Subespacios del espacio de Hilbert para potenciales centrales, caracterizados por
sus autovalores del Hamiltoniano H y del cuadrado del momento angular L2 . En general, el
Hamiltoniano puede tener un espectro puntual (valores discretos de energı́a) y un espectro
continuo (ilustrado en la parte derecha de la figura). Los autovalores de energı́a correspondien-
te a un autovalor de L2 , digamos Eql , usualmente son diferentes a los autovalores de energı́a
correspondientes a otro autovalor de L2 , digamos Eq̃l̃ ,; es decir, Eql 6= Eq̃l̃ a menos que l = ˜l (y
q̃ = q). Los subespacios con autovalores fijos de energı́a y del cuadrado del momento angular,
son mayores cuanto mayor es este último autovalor.
obtenemos
De esta forma, a partir de la ecuación (6.27) encontramos la ecuación diferencial que satisface
ηEl (ρ)
2 √ dηEl
dηEl 2 l(l + 1)
− 2 − + − ηEl = 0, (6.29)
dρ2 dρ ρ ρ2
√
en donde hemos omitido el factor común e− −ρ . A pesar de que se ha aislado el comporta-
miento deseado, una exponencial decreciente a medida que ρ aumenta, la segunda solución,
que crece exponencialmente, todavı́a está ahı́. Es necesario identificar esa solución y recha-
zarla cuando aparezca.
La ecuación (6.29) se puede resolver usando el método de Frobenius, una generalización de
las series de potencias en donde el primer término es ρs . Esta expansión también nos permite
examinar enseguida el comportamiento de la solución para valores pequeños de ρ, ρ → 0.
El método de Frobenius supone que la solución es de la forma
∞
(El) s+k
X
ηEl (ρ) = ck ρ ,
k=0
(El)
en donde el primer coeficiente, c0 , es diferente de cero. Por simplicidad, no vamos a ignorar
(El)
el superı́ndice (El) de los coeficientes ck ; es decir, vamos a usar la notación más simple ck .
Las expresiones para las dos primeras derivadas son
∞
dηEl (ρ) X
= (s + k)ck ρs+k−1 ,
dρ
k=0
2 ∞
d ηEl (ρ) X
= (s + k)(s + k − 1)ck ρs+k−2 .
dρ2
k=0
6.3. ÁTOMOS HIDROGENOIDES 113
Reemplazando estas dos expresiones en la ecuación diferencial (6.29) encontramos
∞ ∞
X √ X
(s + k)(s + k − 1)ck ρs+k−2 − 2 − (s + k)ck ρs+k−1
k=0 k=0
∞
X ∞
X
− l(l + 1) ck ρs+k−2 + 2 ck ρs+k−1 = 0.
k=0 k=0
Juntando las suma que tienen la misma potencia de ρ quedamos únicamente con dos sumas,
∞ ∞
X X √
[(s + k)(s + k − 1) − l(l + 1)] ck ρs+k−2 + 2 (1 − (s + k) −)ck ρs+k−1 = 0.
k=0 k=0
Dado que el coeficiente c0 no puede ser cero, las dos soluciones posibles son s = l + 1 y s = −l.
Escogemos la primera solución. La segunda solución produce contribuciones proporcionales a
la delta de Dirac o de sus derivadas (recuerde que es necesario tomar el Laplaciano).
Ahora, sustituı́mos el valor de s en la ecuación de sumas de potencias,
∞ ∞
X X √
[(l + 1 + k)(l + k) − l(l + 1)] ck ρl+k−1 + 2 (1 − (l + 1 + k) −)ck ρl+k = 0.
k=0 k=0
Dado que el primer término de la primera suma es cero, podemos empezar la suma desde
k = 1. En cuanto a la segunda suma, hacemos k = k̃ − 1. Haciendo estos cambios, la igualdad
anterior se convierte en
∞ ∞
X X √
k(2l + 1 + k)ck ρl+k−1 + 2 (1 − (l + k̃) −)ck̃−1 ρl+k̃−1 = 0.
k=1 k̃=1
Ahora tenemos en cuenta que podemos cambiar el nombre de los ı́ndices de las sumas. Por
ejemplo, podemos hacer k̃ = k en la segunda suma. Este cambio de nombre permite juntar
las dos suma en una,
∞
X √
k(2l + 1 + k)ck − 2((l + k) − − 1)ck−1 ρl+k−1 = 0.
k=1
Para que esta suma sea cero es necesario que cada uno de los coeficientes sea cero, es decir,
√
k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 . (6.30)
Esta recurrencia nos permite escribir todos los coeficientes de la suma infinita
√
en términos del
ck 2 −
primer coeficiente c0 . Además, como el lı́mite lı́mk→∞ ck−1 = lı́mk→∞ k = 0, el criterio de
la razón nos garantiza que la serie es convergente. De hecho la serie converge para cualquier
valor de ρ, porque lı́mk→∞ cck−1
kρ
= 0, para cualquier valor (finito) de ρ.
114 CAPÍTULO 6. POTENCIALES CENTRALES
Nos gustarı́a saber como se comporta la serie que soluciona la ecuación diferencial (6.29).
P∞ k ck λk (k−1)!
Sabiendo que eλρ = k=0 λk! ρk , vemos que la razón ck−1 se comporta como k(k−1)! λk−1
= λk .
Comparando con el comportamiento √
de la serie que soluciona la ecuación (6.29), vemos
√
que
dicha serie se comporta como √e2 −t para valores grandes de ρ, de manera que e− −t por
esta serie se comporta como e2 −t . Ası́, concluı́mos que la solución divergente que querı́amos
evitar se ha vuelto a presentar. Para evitar este comportamiento asintótico es necesario, por lo
tanto, que la serie no sea infinita, sino que se reduzca a un polinomio. A partir de la ecuación
de recurrencia (6.30), vemos que la condición para que esto suceda es que la√energı́a no
pueda tomar valores arbitrarios. De hecho, vemos que debe satisfacer (l + k) − = 1 para
algún entero no negativo k. Ya que hemos usado la letra k para rotular los coeficientes, es
necesario que empleemos una letra diferente para designar un valor arbitrario, pero √ fijo de k.
Usando la letra q, vemos que la condición que debe satisfacer la energı́a es (l + q) − = 1, es
1
decir, q,l = − (q+l)2 , en donde hemos hecho alusión directa a que la energı́a depende de dos
(El) (ql)
enteros, l y q. Podemos restaurar los rótulos en la notación de los coeficientes ck = ck , de
modo que las relaciones de recurrencia pueden escribirse como
(ql) √ (ql) 1 (ql)
k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 = 2((l + k) − 1)ck−1
q+l
l + k − l − q (ql) q − k (ql)
=2 ck−1 = −2 c .
q+l q + l k−1
P∞ (ql)
Teniendo en cuenta la definición original de la función eta ηEl (ρ) = ηql (ρ) = k=0 ck ρk+l+1 ,
en donde hemos usado el valor de s = l + 1 obtenido con el método de Frobenius, podemos
cortar la suma para no incluir términos cuyos coeficientes sean exactamente iguales a cero,
Pq−1 (ql)
ηql (ρ) = k=0 ck ρk+l+1 . Vemos que la funciones η son polinomios cuyo orden más bajo es
l + 1 y cuyo orden más alto es k + l.
EJERCICIO 69. Muestre que
k
(ql) k 2 (q − 1)! (2l + 1)! (ql)
ck = (−1) c .
q+l (q − k − 1)! k!(k + 2l + 1)! 0
EJERCICIO 70. Volviendo a las variables originales, muestre que
2
Rq=1,l=0 (r) = 3/2
e−r/a0 ,
a0
2 r
Rq=2,l=0 (r) = 1 − e−r/2a0 ,
(2a0 )3/2 2a0
1 r
Rq=1,l=1 (r) = 3/2
√ e−r/2a0 .
(2a0 ) 3a0
EJERCICIO 71. ¿Cómo están normalizadas las funciones de onda radiales del ejercicio
precendente?
En la figura 6.2 dibujamos la estructura del espacio del Hilbert para potenciales centrales,
en la cual resaltamos dos hechos. El primero es que los autovalores de energı́a para valores
diferentes del cuadrado del momento angular son, en general, diferentes. El segundo es que
existe una degeneración esencial debido a que la ecuación de Schrödinger radial independiente
del tiempo, no involucra el valor del momento angular alrededor del eje z; es decir, no depende
del valor de m. Como existen 2l + 1 valor de m, existe una degeneración esencial de orden
2l + 1. En el caso del potencial 1r , sin embargo, existe una degeneración accidental, pues
los autovalores de energı́a no dependen de los número q y l, de manera independiente, sino
solamente de su suma. En la figura 6.3 se muestra la estructura del espacio de Hilbert para
el potencial de Coulomb. La primera autoenergı́a E1 , solamente se presenta cuando l = 0; la
segunda cuando l = 0 y l = 1; la n-ésima energı́a, En se presenta cuando l = 0, 1, · · · , n − 1.
Para la parte continua del espectro, dibujada en la parte derecha de la figura 6.3, se puede
tener cualquier valor de momento angular.
La degeneración del subespacio de Hilbert con un valor dado de energı́a, dn , puede calcu-
larse empleando la degeneración conocida, dl , de los subespacios con cuadrado del momento
116 CAPÍTULO 6. POTENCIALES CENTRALES
angular dado:
Los subespacios de energı́a constante positiva, por su parte, tienen dimensión infinita (conta-
ble).
Dada la degeneración accidental, se define el número cuántico principal n = q + l. Los
autoestados del átomo de hidrógeno se caracterizan por tres números cuánticos: el número
cuántico principal n que está relacionado con los autovalores de energı́a, el número cuántico
azimutal l que indica la magnitud del cuadrado del momento angular, y el número cuántico
magnético m asociado con la componente z del momento angular. 1 En sı́mbolos, escribimos
µe4 1
H |nlmi = − 2 |nlmi , L2 |nlmi = ~2 l(l + 1) |nlmi ,
32π 0 ~ n2
2 2
Lz |nlmi = ~m |nlmi .
Por razones históricas, existe una notación para los diferentes subespacios de cuadrado del
momento angular constante: s (sharp) para l = 0, p (principal) para l = 1, d (diffuse) para
l = 2 y f (fundamental) para l = 3. 2 Los siguientes valores de cuadrado del momento angular
se caracterizan por letras en orden alfabético: g para l = 4, h para l = 5, etc.
Los niveles de energı́a también recibieron nombre por razones históricas: n = 1 es K, n = 2
es L, etc. Esta notación es la misma que se ha usado en el área de rayos X. Las transiciones
entre diferentes niveles de energı́a constituye uno de los principales hechos experimentales que
se descubrieron antes de tener una teorı́a que los explicase. La luz emitida cuando un átomo
de hidrógeno pasa de un nivel de energı́a n al primer nivel de energı́a (estado fundamental)
tiene frecuencia e inverso de la longitud de onda iguales a
µe4 µe4
1 1 1 1
ω1n = 1− 2 y = 1 − 2 = RH 1 − 2 ,
64π 3 20 ~3 n λ1n 64π 3 20 ~3 c n n
Cada serie tiene una longitud de onda mı́nima y una máxima; es decir, cada serie ocupa una
región bien definida del espectro.
EJERCICIO 72. Escriba todas las funciones de onda correspondientes al número cuántico
principal n igual a 1 y a 2, destacando los valores de l y m y relacionándolos con la notación
q, l empleada anteriormente.
1 Vale la pena mencionar que, en general, para potenciales centrales, la energı́a depende tanto de l como de
que se acuñaron estos términos, esa era la lengua de la ciencia. De hecho, en el libro de Sommerfeld (referencia
[109], p.230) se habla de Prinzipalserie (p), diffuse Nebenserie (d), scharfe Nebenserie (s) y Bergmannserie
(d). Solamente a la última serie se le asocia una letra diferente a aquella empleada en este libro.
6.3. ÁTOMOS HIDROGENOIDES 117
Figura 6.4: Espectro parcial del Hidrógeno, desde n = 1 hasta n = 3. La escala de longitud
de ondas, en nanómetros, es logarı́tmica. [Caitlin Jo Ramsay, CreativeCommons]
d2 σnl
1 dσnl 1
ρ +2 l+1− ρ + 2 1 − (l + 1) σnl = 0.
dρ2 n dρ n
Hacemos un cambio de escala adicional, ρ = nx/2, de modo que la ecuación queda ası́
d2 p d
x L (x) + (p + 1 − x) Lpm (x) + (m − p)Lpm (x) = 0. (6.32)
dx2 m dx
Si comparamos (6.31) con (6.32) encontramos p = 2l + 1, y m = p + n − l − 1 = n + l. Ası́, la
solución regular de (6.31) es σnl (x) = Lpm (x) = L2l+1
n+l (x). La notación empleada aquı́ no es,
sin embargo, única. Por ejemplo, Mathematica
R
y las referencias [116, 117, 114, 115], notan
la solución regular de la ecuación (6.32) como (−1)p L̄pm−p (x); por lo tanto, en esas referencias,
la solución regular de (6.31) es −L̄2l+1 3
n−l−1 (x). Es necesario, por lo tanto, tener mucho cuidado
con la notación empleada, especialmente si se mezclan las referencias. En cualquiera de las
dos notaciones, la escala de longitud cambia con n, el número cuántico principal.
En términos de los polinomios asociados de Laguerre las funciones de onda radiales son de la
forma
1 √
Rnl (ρ) = N e− −n ρ ηnl (ρ),
ρ
(6.33)
1 −√−n ρ l+1 2l+1 1 −√−n ρ l+1 2l+1 2ρ
=N e ρ Ln+l (x) = N e ρ Ln+l
ρ ρ n
d2 Lm (x) dLm
x 2
+ (1 − x) + mLm (x) = 0.
dx dx
Como primer paso vamos a demostrar que si Lm (x) es el m-ésimo polinomio de Laguerre,
entonces su p-ésima derivada satisface la ecuación diferencial (6.32). En efecto, derivando la
ecuación anterior p veces, y empleando la regla de Leibniz (6.28) sigue
2 p
d dp Lm d dp Lm dp Lm
d d Lm
x 2 +p + (1 − x) −p
dx dxp dx dxp dx dxp dxp
p
d Lm
+m = 0.
dxp
3 Aquı́, hemos usado L̄ en vez de L para acentuar la diferencia.
6.3. ÁTOMOS HIDROGENOIDES 119
Después de simplificar, encontramos la ecuación (6.32)
d2 dp Lm d dp Lm
p
d Lm
x 2 + (p + 1 − x) + (m − p) = 0.
dx dxp dx dxp dxp
Anteriormente, hallamos una expansión en serie de potencias para las funciones de onda
radiales (aparte del factor que decrece con la distancia de manera exponencial). Vamos a
encontrar esa expansión usando el método de la referencia [119] (p.220) esta vez, y empleando
el número cuántico principal n, en vez del parámetro q. Usamos el Ansatz,
I
p
Lm (x) = f (t)e−xt dt, (6.34)
C
curva horaria4 cerrada que encierra el origen y a es un entero, vemos que solamente el polo
simple en el origen contribuye a la integral (6.35). Expandimos (t + 1)m y e−xt como series
de potencias alrededor de t = 0,
m ∞
(−1)n xn n
I X
m! X
Lpm (x) =A tr t−m+p−1 t dt,
C r=0 r!(m − r)! n=0
n!
∞ X m
(−1)n xn
I
X m! dt
=A tn+r+p−m ,
n=0 r=0
n! r!(m − r)! C t
m
X (−1)m−p−r xm−r−p m!
= 2πiA ,
r=0
(m − p − r)! r!(m − r)!
en donde los términos que contribuyen son tales que m − r − p ≥ 0. Debido a la presencia
del factorial (m − p − r) en el denominador, los términos en que esta desigualdad se incumple
son, efectivamente, cero. Podemos, sin embargo, quitarlos explı́citamente: el máximo valor
que puede tomar r es m − p. Ası́,
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = 2πiA , (6.36)
r=0
(m − p − r)! r!(m − r)!
La constante de normalización se escoge de manera que L0m (0) = Lm (0) = m!, es decir,
m!
A = 2πi y
(t + 1)m −xt
I
m!
Lm (x) = e dt. (6.37)
2πi C tm+1
dm −x(t+1)
e = (−1)m (t + 1)m e−x(t+1) ,
dxm
dm
(t + 1)m e−xt = (−1)m ex m e−x(t+1) ,
dx
escribimos el m-ésimo polinomio de Laguerre como
Merece la pena mencionar, una vez más, que en la notación alternativa la fase se escoge de
manera diferente (note la ausencia del factor (−1)p )
(t + 1)m −xt
I
p m!
L̄m−p (x) = e dt.
2πi C tm−p+1
Volvamos a la ecuación (6.36)
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = m! ,
r=0
(m − p − r)! r!(m − r)!
Consideremos la función
t ∞ l ∞
e−x 1−t (−1)l xl t l
X 1 1
xt X
= − = . (6.40)
1−t 1 − t l! 1−t l! (1 − t)l+1
l=0 l=0
El término del denominador puede ser expandido, empleando el teorema del binomio, en el
caso |t| < 1.
1 (l + 1)t (l + 1)(l + 2)t2 (l + 1)(l + 2)(l + 3)t3
l+1
=1+ + + + ···
(1 − t) 1! 2! 3!
(l + 1)! (l + 1)! (l + 2)! 2 (l + 3)! 3
= + t+ t + t + ···
(l + 1)!0! l!1! l!2! l!3!
∞
X (l + k)! k
= t .
l!k!
k=0
Si multiplicamos las dos expresiones de la forma (6.42) y multiplicamos por e−x xp+q obtene-
mos
∞ X ∞
tp up xp+q e−x[ 1−t + 1−u +1]
t u
X
p+q −x p p tn um
p+1 = x e Ln (x)Lm (x) . (6.43)
[(1 − t)(1 − u)] n=0 m=0
n!m!
Si integramos
h i respecto a x en el intervalo [0, ∞) y hacemos el cambio de variable
(6.43) con
t u
z = x 1−t + 1−u + 1 , encontramos
∞
tp up
Z
xp+q e−x[ 1−t + 1−u +1]
t u
p+1 dx
0 [(1 − t)(1 − u)]
∞ −(p+q+1)
tp up
Z
t u
= + +1 z p+q+1−1 e−zp+1 dz
0 1−t 1−u [(1 − t)(1 − u)]
−(p+q+1)
tp up
t u
= + +1 Γ(p + q + 1) p+1 ,
1−t 1−u [(1 − t)(1 − u)]
en
R ∞donde pudimos relizar la integral empleando la definición de la función Γ(z), Γ(z) =
−t z−1
0
e t dt. Teniendo en cuenta que
−(p+q+1) −(p+q+1)
t u (1 − u)t + u(1 − t) + (1 − t)(1 − u)
+ +1 =
1−t 1−u (1 − t)(1 − u)
(p+q+1)
(1 − t)(1 − u)
= .
1 − ut
recibimos
∞
tp up
Z
−x[ 1−t
t u
+ 1−u +1]
xp+q p+1 e dx
0 [(1 − t)(1 − u)]
p+q+1
tp up
(1 − u)(1 − t)
= p+1 Γ(p + q + 1) (6.44)
[(1 − t)(1 − u)] 1 − ut
tp up (1 − u)q (1 − t)q
= p+q+1 (p + q)!,
[1 − ut]
en donde hicimos uso de la identidad Γ(x + 1) = x!. Empleando las expansiones binomiales
de (1 − tu)−(p+q+1) , (1 − u)q y (1 − t)q , el resultado de la integral es
∞ q q
X (p + q + k)! X (−)a q! a X (−)b q! b
= (p + q)! (ut)p+k u t
(p + q)!k! (q − a)!a! (q − b)!b!
k=0 l=0 b=0
q X
∞ X q
X (p + q + k)! q! q!
= (−)a+b up+k+a tp+k+b .
k! (q − a)!a! (q − b)!b!
k=0 a=0 b=0
6.3. ÁTOMOS HIDROGENOIDES 123
Empleando (6.43) hallamos el resultado
∞ Z ∞
X tn um
xp+q e−x Lpn (x)Lpm (x) dx = (6.45)
m,n=0 0 n!m!
q X
∞ X q
X (p + q + k)!q!q!
(−)a+b up+k+a tp+k+b .
k!(q − a)!a!(q − b)!b!
k=0 a=0 b=0
Finalmente comparando los coeficientes de tn um hallamos una familia de integrales. Por ejem-
plo, si hacemos q = 0 hallamos
∞ Z ∞ ∞
X tn um X (p + k)!
xp e−x Lpn (x)Lpm (x) dx = up+k tp+k .
m,n=0 0 n!m! k!
k=0
alfa α A
beta β B
gamma γ Γ
delta δ ∆
épsilon , ε E
dseda ζ Z
eta η E
zeta θ, ϑ Θ
iota ι I
kappa κ K
lambda λ Λ
mi µ M
ni ν N
xi ξ Ξ
ómicron o O
pi π, $ Π
ro ρ, % R
sigma σ, ς Σ
tau τ T
ı́psilon υ Υ
fi φ, ϕ Φ
ji chi X
psi ψ Ψ
omega ω Ω
125
126 ALFABETO GRIEGO
Bibliografı́a
[1] Barus, Carl. “The Progress of Physics in the Nineteenth Century”, Science 22, no. 560
(1905): 353-69. Accessed February 19, 2020. [Link]/stable/1631845.
[2] L. B. Spinney, “The ether concept in modern physics”, Science 72, Issue 1865, pp. 303-310
(1930).
[3] Thomas Young, “Experimental demonstration of the General Law of the Interferene of
Light, ” Philosophical Transactions of the Royal Society of London 94 (1804).
[4] Young, Thomas (1807), A Course of Lectures on Natural Philosophy and the Mechanical
Arts, London: Joseph Johnson
[5] Henry Crew, “Thomas Young’s Place in the History of the Wave Theory of Light”, J.
Opt. Soc. Am. 20, 3-10 (1930)
[6] Roberto Torretti, “Getting rid of the ether. Could Physics have achieved it sooner, with
better assistance from Philosophy?”, THEORIA. An International Journal for Theory,
History and Foundations of Science, [S.l.] 22, n. 3, 353-374, (2009).
[7] Arago (1819). “Rapport fait par M. Arago à lÁcadémie des Sciences, au nom de la
Commission qui avait été chargée déxaminer les Mémoires envoyés au concours pour le
prix de la diffraction”. Annales de Chimie et de Physique. 2nd series (in French). 11:
5–30
[8] Delisle, J.-N. (1715). “Sur léxpérience que jái rapportée à lÁcademie dún anneau lumi-
neux semblable à celui que lón apperçoit autour de la lune dans les eclipses totales du
soleil”[On the experience that I reported to the Academy about a luminous ring similar to
that which one sees around the moon during a total solar eclipse]. Histoire de lÁcadémie
Royale des Sciences ... Avec les Mémoires de Mathématique & de Physique (in French):
166–169.
[9] Maraldi, G.F. (1723). “Diverses expèriences dóptique”. Histoire de lÁcadémie Royale des
Sciences ... Avec les Mémoires de Mathématique & de Physique (in French): 111–143.
[10] Valéria Silva Dias, Roberto de Andrade Martins, “Michael Faraday: o caminho da livraria
à descoberta da indução eletromagnética”, Ciência & Educação (Bauru) 10, No. 3, 517–
530 (2004)
[11] Cibelle Celestino Silva, Roberto de Andrade Martı́ns, “William Thomson eo Uso de
Analogias e Modelos no Eletromagnetismo”, Epistemologıá e Historia de la Ciencia, Se-
lección de trabajos de las XIII Jornadas, Vol 9, No. 9, 401–409 (2003).
[12] James Clerk Maxwell VIII. A dynamical theory of the electromagnetic field Phil. Trans.
R. Soc. 155459–512 (1864)
127
128 BIBLIOGRAFÍA
[13] Maxwell, James Clerk (1878), “Ether”, Encyclopædia Britannica Ninth Edition 8: 568 -
572
[14] Badash, Lawrence. “The Completeness of Nineteenth-Century Science”, Isis 63, no. 1
(1972): 48-58. Accessed February 17, 2020. [Link]/stable/229193.
[15] Francisco Caruso, “Proceso e Transformação para além da Ciência”, Revista Brasileira
de Ensino de Fı́sica, 20 251 (1998).
[17] Schulz, Peter A. (2007). Duas nuvens ainda fazem sombra na reputação de Lorde Kelvin.
Revista Brasileira de Ensino de Fı́sica, 29(4), 509-512. [Link]
11172007000400006
[18] Lord Kelvin, “Nineteenth century clouds over the dynamical theory of heat and light”,
The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science
Series 6, 2, 1-40 (1901).
[19] José Manuel Sánchez Ron. Historia de la fı́sica cuántica I. El perı́odo fundacional (1860
- 1926). (Editorial Crı́tica, 2001).
[20] Agassi, Joseph. “The Kirchhoff-Planck Radiation Law”, Science 156, no. 3771 (1967):
30-37. Accessed February 19, 2020. [Link]/stable/1720913.
[21] Siegel, Daniel M. “Balfour Stewart and Gustav Robert Kirchhoff: Two Independent Ap-
proaches to ‘Kirchhoff’s Radiation Law’”, Isis 67, no. 4 (1976): 565-600. Accessed Fe-
bruary 19, 2020. [Link]/stable/230562.
[22] Schirrmacher, Arne. “Experimenting Theory: The Proofs of Kirchhoff’s Radiation Law
before and after Planck”, Historical Studies in the Physical and Biological Sciences 33,
no. 2 (2003): 299-335. Accessed February 19, 2020. doi:10.1525/hsps.2003.33.2.299.
[23] Vorobyev AY1, Makin VS, Guo C Brighter light sources from black metal: significant
increase in emission efficiency of incandescent light sources. Phys Rev Lett. 2009 Jun
12;102(23):234301.
[24] Joseph B. Dence, Heat capacity and the equipartition theorem, . Chem. Educ. 49, 12,
798–804 (1972).
[25] KM Fonseca, F Torres-Ardila. On the difference between hermitian operators and self-
adjoint operators. MOMENTO-Revista de Fı́sica; núm. 47 (2013); 15-31 0121-4470
[29] Bartel Leendert van der Waerden, Sources of Quantum Mechanics, (North Holland, 1967)
[30] Galliano Valent, The hydrogen atom in electric and magnetic fields: Pauli’s 1926 article,
Am. J. Phys. 71:2, 171–175 (2003).
BIBLIOGRAFÍA 129
[31] W. Rudin, Functional Analysis, McGraw-Hill, New York, 1973.
[33] AY Gordon, S Jitomirskaya, Y Last, B Simon. Duality and singular continuous spectrum
in the almost Methieu equation, Acta Math. 178, 169-183 (1997).
[37] Daniel T. Gillespie. A quantum mechanics primer. (John Wiley & Sons, 1970).
[38] Adam Becker. What is real? The unfinish quest for the meaning of quantum physics.
Basic books, New Yok, 2018.
[43] C. G. Gray Remark on Integral Orbital Angular Momentum, American Journal of Physics
37, 559 (1969)
[44] Ian R. Gatland, Integer versus half-integer angular momentum, American Journal of
Physics 74, 191 (2006)
[45] Robert Eisberg, Robert Resnick. Quantum Physics of Atoms, Molecules, Solids, Nuclei,
and Particles. (John Wiley & Sons, 2nd edition,1985)
[47] DF Styer. The strange world of quantum mechanics. (Cambridge University Press, 2000)
[48] Jeanne N Clelland, Peter J Vassiliou. arXiv:1302.6672v3. Strings attached: New light on
an old problem.
[49] Darryl Yong, SIAM Review 48, p 771, Strings, Chains, and Ropes (2006).
[50] MA Pinsky, Partial Differential Equations and Boundary-Value Problems with Applica-
tions, 3rd ed., Waveland Press, Prospect Heights, IL, 2003.
[51] GF Wheeler, WP Crummett Am. J. Phys. 55, 33. The vibrating string controversy (1986)
[52] A Torchinsky. The Fourier transform and the wave equation. arXiv:0904.3252v2 (2010).
130 BIBLIOGRAFÍA
[53] EC Zeeman (1993). Controversy in Science: on the Ideas of Daniel Bernoulli and
René Thom. Nieuw Arch. Wisk. (4), 11(3), pp. 257- 282.
[54] JB Fourier (1819). Théorie du Mouvement de la Chaleur Dans les Corps Solides. Mém.
de l’Acad. Roy. des Sci. de l’Inst. de France, 4, pp.185-556.
[55] PG Dirichlet (1829). Sur la Convergence des Séries Trigonométriques Qui Servent À
Représenter Une Fonction Arbitraire Entre des Limites Données. J. für Math., 4, 157-
169. Retrieved from arXiv:0806.1294v1.
[56] JL D’Alembert (1747). Recherches Sur la Courbe Que Forme Une Corde Tenduë Mise
en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 214-219.
[57] JL D’Alembert (1747). Suite des Recherches Sur la Courbe Que Forme Une Cor de
Tenduë Mise en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 220-249.
[58] GR Bird, M Parrish, The wire grid as a near-infrared polarizer. J. Opt. Soc. Am. 50, 886
(1960).
[60] MG Silveirinha (2010). Poynting vector, heating rate, and stored energy in structured
materials: a first principles derivation. Phys. Rev. B. 82: 037104.
[62] I Campos, JL Jimenez. Eur. J. Phys. 13, 117. About Poynting’s theorem. (1991)
[63] E Richter, M Florian, K Henneberger (2008). Poynting’s theorem and energy conserva-
tion in the propagation of light in bounded media. Europhysics Letters. 81 (6): 67005.
arXiv:0710.0515.
[65] M Monteiro, C Stari, C Cabeza, A C Martı́, The Polarization of Light and Malus’ Law
Using Smartphones. Phys. Teach. 55, 264 (2017)
[67] Sanford C Gladden, An experiment on Malus’ law for the elementary laboratory, Am. J.
Phys. 18, 395 (June 1950).
[69] H Fakhruddin, Some activities with polarized light from a laptop LCD screen, Phys.
Teach. 46, 229–231 (April 2008).
[70] Larissa Vertchenko, Lev Vertchenko, Verification of Malus’s law using a LCD monitor
and digital photography, Revista Brasileira de Ensino de Fı́sica 38 (3), e3311 (2016).
[71] H Gottlieb, The law of Malus using polaroid polarizers, Phys. Teach. 18, 612–614 (Nov.
1980).
BIBLIOGRAFÍA 131
[72] MA Dias Tavares Jr, LP Sosman, RJM da Fonseca, LACP da Mota, M Muramatsu.
Using a photo-resistor to verify irradiance inverse square and Malus’ laws, AIP Conf.
Proc. 992, 193–198 (2008).
[73] M Kutzner, R Wright, E Kutzner, An inexpensive LED light sensor, Phys. Teach. 48,
341 (May 2010).
[74] M Monteiro, P Vogt, C Stari, C Cabeza, AC Martı́, Exploring the atmosphere using
smartphones, Phys. Teach. 54, 308 (May 2016).
[77] A Kumar, A Ghatak. Polarization of Light with Applications in Optical Fibers. SPIE,
2011.
[79] Theodore Duddell Newton, EP Wigner. Localized states for elementary systems. Reviews
of Modern Physics, 21(3):400, 1949.
[81] Brian J Smith and MG Raymer. Photon wave functions, wave-packet quantization of
light, and coherence theory. New Journal of Physics, 9(11):414, 2007.
[84] Ludwig Zehnder (1891). Ein neuer Interferenzrefraktor. Zeitschrift für Instrumentenkun-
de. 11: 275–285.
[85] Ludwig Mach (1892). Über einen Interferenzrefraktor. Zeitschrift für Instrumentenkunde.
12: 89–93.
[86] V Degiorgio, Phase shift between the transmitted and reflected optical field of a semire-
flecting lossless mirror is π/2, Am. J. Phys. 48 (1980) 81–82.
[88] A Luis, LL Sanchez-Soto, A quantum description of the beam splitter, Quant. Semiclass.
Opt. 7 (1995) 153–160.
[89] MW Hamilton, Phase shifts in multilayer dielectric beam splitters, Am. J. Phys. 68 (2000)
186–191.
[90] CH Holbrow, E Galvez, ME Parks, Photon quantum mechanics and beam splitters, Am.
J. Phys. 70 (2002) 260–265.
132 BIBLIOGRAFÍA
[91] H Hénault. Quantum physics an the beam splitter mystery. Proc. SPIE 9570, VI, 95700Q
(2015). ArXiv:1509.00393
[92] AC Elitzur, L Vaidman, Quantum mechanical interaction-free measurements. Found.
Phys. 23, 987 (1993)
[93] P Kwiat, H Weinfurter, T Herzog, A Zeilinger, MA Kasevich, Interaction-free measure-
ment. Phys. Rev. Lett. 74, 4763 (1995)
[94] JA Wheeler, pp. 9-48 in Mathematical Foundations of Quantum Mechanics, editado por
AR Marlow (Academic, New-York, 1978).
[95] T Hellmuth, H Walther, A Zajonc, W Schleich (1987), Delayed-Choice Experiments in
Quantum Interference, Physical Review A 35, 2532-41.
[96] MO Scully, K Drühl (1982). Quantum eraser: A proposed photon correlation experiment
concerning observation and “delayed choice” in quantum mechanics. Physical Review A,
25(4), 2208–2213.
[97] TL Dimitrova, A Weis, Single photon quantum erasing: a demonstration experiment.
European Journal of Physics 31(3): 625, 2010
[98] Bretislav Friedrich and Dudley Herschbach. Stern and Gerlach: How a Bad Cigar Helped
Reorient Atomic Physics. Physics Today 2003 56:12, 53-59
[99] Phiwe. Stern-Gerlach experiment.
[100] E. Schrödinger, Discussion of Probability Relations Between Separated Systems, Procee-
dings of the Cambridge Philosophical Society. 31, 555 (1935).
[101] W. Wootters, Entanglement of Formation of an Arbitrary State of Two Qubits, Phys.
Rev. Lett. 80, 2245 (1998).
[102] C. Bennett, G. Brassard, C. Crépeau, R. Jozsa, A. Peres, and W. Wootters, Telepor-
ting an unknown quantum state via dual classical and Einstein-Podolsky-Rosen channels.
Phys. Rev. Lett. 70, 1895(1993).
[103] Charles Fort, Lo!, Cosimo, Inc., 2004
[104] J. Bell, Speakeable and Unspeakable in Quantum Mechanics, Cambridge University
Press, 1987.
[105] D. Boschi, S. Branca, F. De Martini, L. Hardy, S. Popescu. Experimental Realization of
Teleporting an Unknown Pure Quantum State via Dual Classical and Einstein-Podolski-
Rosen Channels. arXiv:quant=ph/9710013.
[106] By taking a uniform distribution of states over the Poincare sphere, a lower upper bound
is obtained in S. Massar and S. Popescu, Phys. Rev. Lett. 74, 1259 (1995).
[107] A Einstein, B Podolsky, N Rosen. Can quantum-mechanical description of physical
reality be considered complete?, Physical Review 47, 777 (1935).
[108] Claude Cohen-Tannoudji, Bernard Diu, Frank Laloe. Quantum Mechanics, volumen 1.
(Wiley, 1991).
[109] Arnold Sommerfeld, Atombau un Spektralinien, (Friedr. Vieweg und Sohn, Braunsch-
weig, 1921)
[110] Leonard S. Schiff. Quantum Mechanics, (McGraw-Hill, 1965).
BIBLIOGRAFÍA 133
[111] Wolfgang Pauli, Wave mechanics (Dover, Nueva York, 2000).
[112] L. Pauling, E. B. Wilson. Introduction to Quantum Mechanics, McGraw-Hill, New York,
1935.
[116] M. Beck. Quantum mechanics. Theory and experiment, Oxford University Press, New
York, 2012.
[117] R. L. Liboff. Introductory quantum mechanics. Introductory quantum mechanics,
Addison-Wesley Longman, 1980.
[118] N. J. Sonine Sur les fonctions cylindriques et le développement des fonctions continues
en séries. Math. Ann. 16, 1-80, 1880.
[119] A. N. Capri, Nonrelativistic Quantum Mechanics, 3a. edición, World Scientific, 2002.