0% encontró este documento útil (0 votos)
142 vistas137 páginas

Long MCB

Este documento describe la necesidad histórica de la mecánica cuántica. En el siglo XIX, la física clásica tuvo mucho éxito pero no pudo explicar ciertos fenómenos a nivel atómico y subatómico como los espectros de emisión de los átomos. La física estadística también tenía problemas. La mecánica cuántica surgió a principios del siglo XX para resolver estos problemas al nivel microscópico mediante una nueva descripción probabilística y ondulator

Cargado por

Jose Vellojin
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
142 vistas137 páginas

Long MCB

Este documento describe la necesidad histórica de la mecánica cuántica. En el siglo XIX, la física clásica tuvo mucho éxito pero no pudo explicar ciertos fenómenos a nivel atómico y subatómico como los espectros de emisión de los átomos. La física estadística también tenía problemas. La mecánica cuántica surgió a principios del siglo XX para resolver estos problemas al nivel microscópico mediante una nueva descripción probabilística y ondulator

Cargado por

Jose Vellojin
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Mecánica cuántica básica

K M Fonseca Romero1

Universidad Nacional de Colombia


Departamento de Fı́sica
18 de marzo de 2020

1
kmfonsecar@[Link]
ii
Índice general

1. Necesidad histórica de la mecánica cuántica 1


1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Espectros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. El cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. La fı́sica estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Un atisbo a los cimientos de la mecánica cuántica 7


2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Espacio de Hibert de funciones complejas . . . . . . . . . . . . . . . . . . . . . 7
2.3. Operadores en el espacio de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.1. Adjunto de un operador . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.2. Operadores simétricos, hermı́ticos y autoadjuntos . . . . . . . . . . . . . 12
2.4. Formulación axiomática de la teorı́a cuántica . . . . . . . . . . . . . . . . . . . 16
2.5. Lectura del postulado de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3. Polarización: descripción clásica 27


3.1. La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. Controversia sobre la solución . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.2. Solución de d’Alembert . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.3. Solución de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.4. Solución de Bernoulli-Fourier . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2. Polarización en cuerdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Polarización de ondas electromagnéticas . . . . . . . . . . . . . . . . . . . . . . 42
3.3.1. Polarizadores lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3.2. Teorema de Poynting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.3. Ley de Malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.4. Polarización circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3.5. Elipse de polarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4. Polarización: descripción cuántica 59


4.1. Los fotones existen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2. Estados cuánticos de polarización . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.1. Efecto Zenón cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3. Interferómetro de Mach-Zehnder . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3.1. El experimento de Elitzur-Vaidman . . . . . . . . . . . . . . . . . . . . 69
4.3.2. Experimento de elección postergada . . . . . . . . . . . . . . . . . . . . 69
4.4. Borrador cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.5. Ejercicios de taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

iii
iv ÍNDICE GENERAL
5. Teorı́a del momento angular 75
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2. Rotaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3. Teorı́a del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.1. Representaciones irreducibles (Irreps) . . . . . . . . . . . . . . . . . . . 79
5.4. Momento angular orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.1. Coordenadas curvilı́neas . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.4.2. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.4.3. Momento angular en coordenadas esféricas . . . . . . . . . . . . . . . . 89
5.5. Autoestados simultáneos de L bz y Lb2 . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5.1. Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.2. Polinomios asociados de Legendre . . . . . . . . . . . . . . . . . . . . . 95
5.6. Autoestados usando los operadores escalera . . . . . . . . . . . . . . . . . . . . 97

6. Potenciales Centrales 101


6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.1.1. El oscilador armónico tridimensional isotrópico . . . . . . . . . . . . . . 101
6.2. Potenciales Centrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.1. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.2. Momento angular y energı́a cinética . . . . . . . . . . . . . . . . . . . . 106
6.2.3. Momento angular y potenciales centrales . . . . . . . . . . . . . . . . . . 108
6.3. Átomos hidrogenoides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3.1. Solución de la ecuación radial . . . . . . . . . . . . . . . . . . . . . . . . 111
6.3.2. Órdenes de magnitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.3.3. Degeneración accidental . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.3.4. Autofunciones de ondas radiales como polinomios asociados de Laguerre 117
6.3.5. Polinomios de Laguerre y asociados . . . . . . . . . . . . . . . . . . . . 118

Alfabeto griego 125


Capı́tulo 1

Necesidad histórica de la
mecánica cuántica

EJERCICIO 1. ¿Cuándo surgió la mecánica cuántica? ¿Por qué era necesaria esta teorı́a?
¿Cómo era la fı́sica de la época y cuáles fueron sus mayores éxitos? ¿Qué problemas resolvió la
fı́sica cuántica? ¿Cuál es la utilidad de esta teorı́a?

1.1. Introducción
El siglo XIX fue una época de consolidación de la fı́sica, durante la cual la fı́sica clásica se
aplicó a muchos ámbitos diferentes. La teorı́a de la elasticidad y la hidrodinámica, el desarrollo
y unificación de la teorı́a de la electricidad y el magnetismo (y su conexión con la óptica),
la termodinámica, la teorı́a cinética de los gases, la medición de la rapidez de la luz, son
algunos de los hitos de la fı́sica en esa época [1]. Aunque los experimentos de Thomas Young
en pelı́culas delgadas [2] y de la doble rendija [3, 4, 5] favorecı́an la teorı́a ondulatoria de la
luz, que por la época se pensaba como una onda longitudinal, esta teorı́a fue muy resistida,
especialmente por los fı́sicos franceses [6]. En la época, muchos fı́sicos estaban convencidos de
que si la luz es una onda, debı́a existir el éter, un medio material que las sostuviera, medio
que debı́a llenar todos los medios materiales y también el espacio interestelar [6].
Ni la polarización, descubierta por Étienne-Louis Malus en 1809, ni la ausencia de inter-
ferencia de ondas con polarizaciones particulares, demostrada en 1816, podı́an ser explicadas
por la teorı́a ondulatoria [5]. Augustin-Jean Fresnel, en su propuesta a la Academia Francesa
de Ciencias para explicar las propiedades de la luz, unió el principio de Huygens de ondas
secundarias con el principio de interferencia de Young a su hipótesis de ondas transversa-
les y mostró que explicaba casi todos los fenómenos conocidos de la luz [5]. Siméon Dennis
Poisson mostró el improbable resultado de que en el centro de la sombra proyectada por un
esfera deberı́a haber un punto brillante [6], el cual fue comprobado experimentalmente por
Dominique-François-Jean Arago [7].1 Después de la demostración de la existencia del punto
de Poisson (o de Arago), muchos fı́sicos franceses aceptaron la teorı́a ondulatoria y el éter
lumı́nico.
Los descubrimientos de Hans Christian Ørsted en 1820 de la desviación de los imanes
en presencia de corrientes eléctricas y de Michael Faraday en 1830 del febnómeno inverso
(producción de corrientes eléctricas por imanes en movimiento) señalan el nacimiento del
electromagnetismo [10]. La visualización del campo magnético mediante limaduras de hierro
le sugirieron a Faraday la existencia de lı́neas de fuerza magnética; la fuerza magnética serı́a
tangente a estas lı́neas, su magnitud serı́a proporcional a la densidad de las mismas [11]. Las
1 De hecho, este resultado ya habı́a sido encontrado por Delisle [8] y Maraldi [9] cien años antes.

1
2 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
fuerzas eléctrica y magnética se propagarı́an por medio de tensiones de un modelo elástico,
tensiones que Thomson pensó podrı́a entender mediante analogı́as matemáticas con los sólidos
elásticos [11]. Ası́, se sugerı́a la existencia de un éter electromagnético. James Clerk Maxwell
consideró un modelo mecánico refinado en varios artı́culos, hasta conseguir formular una
teorı́a dinámica del campo electromagnético [12], que condensa todo el electromagnetismo en
20 ecuaciones diferenciales parciales, y que muestra que las ondas luminosas son apenas un
caso de las ondas electromagnéticas. Maxwell publicó su libro A treatise on Electricity and
Magnetism en 1873 en donde hace un tratamiento más extenso de su ideas. Aunque no hacı́a
referencia a su modelo mecánico, al parecer Maxwell creı́a en la existencia del éter, pues en
1878 escribió un artı́culo sobre el éter en la Enciclopedia Británica [13], en donde afirma que se
prueba que la luz no es una sustancia porque puede interferir destructivamente. El éter deberı́a
ser capaz de transmitir energı́a con una cierta rapidez; la mitad de la energı́a es potencial
debido a las distorsiones que sufre y la otra mitad, cinética, debido a su movimiento. El éter
comenzó a ser cuestionado porque no es necesario para la formulación de la electrodinámica.
Sin embargo, no fue descartado ni siquiera con el experimento de Michelson y Morley, cuyo
resultado podı́a explicarse con la hipótesis de contracción de longitudes de George Francis
FitzGerald y Hendrik Antoon Lorentz. La aceptación de la teorı́a especial de la relatividad de
Einstein serı́a la causa de la desaparición del éter electromagnético de la fı́sica (aunque han
aparecido otras ideas de éter).
Al final del siglo XIX hubo un sentimiento, minoritario al parecer, de que el final de la fı́sica
estaba cerca [14]. Sin embargo, tal sentimiento se amplifica en algunos relatos del surgimiento
de la mecánica cuántica, tal vez para producir algo de dramatismo. Se cuenta, por ejemplo,
que William Thomson (Lord Kelvin) creı́a que ((en el cielo azul de la Fı́sica Clásica apenas
habı́a dos nubes para despejar))[15]. Prestar atención al énfasis en apenas. Para mayor efecto,
se usa el diminutivo nubecillas [16].
Antes de mostrar como esta historia distorsiona mucho lo que en realidad ocurrió, vea-
mos que un par de ejemplos que pueden dar la impresión de que sı́ se creı́a en el fin de la
fı́sica. James Clerk Maxwell en su discurso de posesión como primer Profesor Cavendish en
la universidad de Cambridge en 1871, dijo ((Esta caracterı́stica de los experimentos modernos
– de que consisten principalmente de medidas – es tan prominente, que se ha generalizado
la opinión de que en unos pocos años todas las grandes constantes de la fı́sica habrán sido
estimadas de forma aproximada y que la única ocupación que será dejada a los hombres de
ciencia será la de aumentar la precisión de tales medidas)). Maxwell, sin embargo, aclara en
su discurso que tal pesimismo es injustificado. Por otro lado, con alguna frecuencia se encuen-
tra nueva fı́sica con el aumento de precisión de las mediciones. Albert A. Michelson, en la
dedicatoria al Laboratorio Ryerson de la universidad de Chicago dice, entre otras cosas, que
((Aunque nunca es seguro afirmar que las ciencias f’ı́sicas no nos vayan a deparar maravillas
más impresionantes que las del pasado, parece probable que la mayor parte de los grandes
principios ya hayan sido establecidos firmemente y que los avances futuros deben buscarse
principalmente en la aplicación rigurosa de los mismos a todos los fenómenos de los que to-
memos conocimiento. Aquı́ es donde la ciencia de las mediciones demuestra su importancia –
en donde se desean más los resultados cuantitativos que los cualitativos. Un eminente fı́sico
resaltó que las verdades futuras de las ciencias fı́sicas deben buscarse en el sexto decimal)).
Se cuenta que el eminente fı́sico al que se estarı́a refiriendo Michelson serı́a Lord Kelvin [14].
También se cuenta que Michelson se arrepintió de sus palabras y se reprendió por haberlas
pronunciado [14].
Tanto Badash [14] cuanto Schulz [17] argumentan que estas historias constituyen una gran
injusticia a Kelvin, quien dictó una conferencia en la Institución Real de la Gran Bretaña el
27 de abril de 1900 que se ha usado como justificación de dichas historias. La conferencia, con
grandes adiciones, se publicó el año siguiente [18]. Allı́, escribe Kelvin en el primer parágrafo
((La belleza y claridad de la teorı́a dinámica, que establece que el calor y la luz son modos
de movimiento, están actualmente oscurecidas por dos nubes. La primera nació con la teorı́a
1.2. ESPECTROS 3
ondulatoria de la luz y fue abordada por Fresnel y el doctor Thomas Young; involucra la
cuestión: ¿cómo podrı́a la Tierra moverse a través de un sólido elástico tal y como esencial-
mente es el éter? La segunda es la doctrina de Maxwell-Boltzmann relativa a la partición de la
energı́a)). Nótese que no aparece la palabra apenas y que se habla de nubes y no de nubecillas
[17].
Su análisis de la nube I le toma seis páginas, al final de las cuales comenta que no encuentra
fallas ni en la concepción ni en la ejecución del experimento de Michelson y Morley, que tal
vez la respuesta sea la inexistencia del éter y que la nube I es muy densa. Kelvin afirma que
la aberración de la luz y experimentos como el de Michelson y Morley implican un éter con
una estructura difı́cil de aceptar [19]. Es bien sabido que la solución a esta nube dio origen
a la teorı́a especial de la relatividad. A la segunda nube le dedica Kelvin 33 páginas en las
cuales muestra como los resultados experimentales para los calores especı́ficos de los gases
riñen con el teorema de equipartición de energı́a. Por otro lado, si el éter tiene infinitos grados
de libertad, pero el universo tiene energı́a finita, cada grado de libertad tiene energı́a media
nula; pero si tuviera energı́a finita, el universo tendrı́a infinita energı́a. La resolución de este
acertijo se dió con la mecánica cuántica.
En este capı́tulo, veremos algunos de los problemas de la fı́sica clásica que dieron origen a
la mecánica cuántica. Una referencia particularmente útil es el libro de Sánchez [19].

1.2. Espectros
Roger Bacon (siglo XIII) creı́a que el arco iris se produce cuando la luz solar se refleja
y se refracta en las gotas de lluvia. Sin embargo, quien demostró que los colores ya estaban
presentes en la luz solar fue Newton con sus experimentos usando prismas, alrededor de 1666.
William Hyde Wollaston en 1802 y luego, de manera más completa y sistemática, Joseph von
Fraunhofer en 1814, descubrieron lı́neas oscuras en el espectro solar, que se le habı́an pasado
por alto a Newton.
Por otro lado, Thomas Melvill en 1752 habı́a observado el primer espectro de emisión del
cual tenemos noticia; la luz de una llama de sodio, al ser pasada por un prisma, produce un
espectro continuo con algunas lı́neas brillantes. León Foucault en 1849 mostró que las lı́neas D
(oscuras) de Fraunhoffer coinciden con las lı́neas brillantes del sodio. Si una sustancia puede
emitir una lı́nea espectral, entonces también puede absorberla; entonces las lı́neas oscuras
del sol se deberı́an a la presencia de sodio en la atmósfera solar. Esta notable conclusión de
Gustav Kirchhoff les permitió, a él y a su colaborador Robert Wilhelm Bunsen, con la ayuda
de mejores espectrómetros y del mechero de Bunsen, hacer una mejor exploración del espectro
solar para concluir la presencia del hierro, del magnesio, del potasio, del sodio, del litio, y de
dos nuevos metales alcalinos hasta entonces desconocidos, a los que llamaron Cesio y Rubidio,
en la atmósfera solar. Habı́a nacido la astrofı́sica. ¿Cómo se explican los espectros?

1.3. El cuerpo negro


El concepto de cuerpo negro está relacionado con las investigaciones de Kirchhoff acerca
de la emisión y de la absorción. La intensidad de los rayos que emite un cuerpo se conoce
como capacidad de radiación o emisividad; su capacidad de absorción o absorbancia es la
fracción de los rayos incidentes que absorbe el cuerpo. Kirchhoff encontró experimentalmente
la ley térmica que lleva su nombre, que la razón entre la capacidad de emisión, e(λ, T ), y la
de absorción, a(λ, T ), para una temperatura y longitud de onda fijas, es la misma para todos
los cuerpos. En sı́mbolos,

a(λ, T )K(λ, T ) = e(λ, T ), (1.1)


4 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
en donde K(λ, T ) es una función universal. Se define un cuerpo negro (volkommen schwarze
Körper, o por brevedad, schwarze Körper ) como aquél que es capaz de absorber toda la radia-
ción que incide sobre el mismo, es decir, tal que a(λ, T ) = 1. No solamente la emisividad de un
cuerpo negro es igual a la función universal K(λ, T ), sino que la emisividad de cualquier otro
cuerpo es menor o igual a la del cuerpo negro (suponiendo equilibrio térmico a temperatura
T y a una longitud de onda dada, λ).
Schirrmacher [22] cuenta la historia de demostraciones la ley térmica de Kirchhoff, y de
como algunas de ellas fueron refutadas por el uso de objetos idealizados que no pueden existir
fı́sicamente. Por ejemplo, cuerpos que emiten y absorben radiación de una única longitud de
onda –y reflejan todas las demás (usados por Kirchhoff en 1859), violan la segunda ley de la
termodinámica si están en movimiento (probado por Wien en 1894); cuerpos diatérmanos, que
dejan pasar la radiación sin calentarse (usados por Kirchhoff en 1862) no pueden existir porque
el lı́mite de tal cuerpo serı́a el vacı́o (Kayser 1902); prismas completamente transparentes
(usados por Helmholtz en 1890 y por Drude en 1900) no pueden existir porque no puede haber
dispersión con transparencia total (Kayser 1902). Si bien los prismas pueden reemplazarse con
rejillas de difracción (como mostró Richarz en 1903), la óptica geométrica serı́a inapropiada
para tratar el éter radiante (Pringsheim 1903). Uno de los objetivos de los fı́sicos del siglo
XIX, aún más que demostrar la ley de Kirchhoff, fue encontrar la función universal K(λ, T ).
Aunque parecerı́a que en la actualidad esta historia ya carece de importancia, todavı́a se
producen desarrollos inspirados por esta ley. Como en equilibrio térmico la emisividad de una
superficie es igual a la absorbancia, se ha usado una técnica para ennegrecer el filamento de
una lámpara incandescente de tungsteno con el fin de aumentar su eficiencia de emisión hasta
casi 100 % [23].

1.4. La fı́sica estadı́stica


La fı́sica estadı́stica, cuyo fin es la descripción macroscópica de sistemas con un gran núme-
ro de átomos o moléculas, surgió y floreció en el siglo XIX, a pesar de grandes opositores (por
ejemplo, Ernest Mach) quienes no aceptaban la hipótesis atómica. Siguiendo el camino tra-
zado por Rudolf Clausius, quien derivó algunas relaciones termodinámicas empleados valores
medio de algunas cantidades (tales como el camino entre colisiones en un gas), Maxwell intro-
dujo la estadı́stica completa de tales cantidades a través de una función de distribución. Por
ejemplo, Maxwell encontró que el número medio de partı́culas cuyas rapideces se encuentran
entre v y v + dv, después de un gran número de colisiones entre partı́culas idénticas es

4N 2 −v2 /α2
dN (v) = √ v e dv,
α3 π

en donde α es una velocidad caracterı́stica, que luego se mostró es igual a α = 2kT m , donde
k es la constante de Boltzmann, T la temperatura absoluta y m la masa de las partı́culas.
Usando herramientas de la teorı́a de la probabilidad, Maxwell demostró en 1860 el teorema
de equipartición de energı́a que afirma que a cada grado de libertad de tipo cuadrático (por
p2x
ejemplo, 2m ) le corresponde la misma cantidad de energı́a, igual a 1/2kT [24]. En el caso
de moléculas diatómicas podemos hacer una separación entre la coordenada del centro de
masa y la coordenada relativa. La primera solamente tiene energı́a cinética, al igual que las
coordenadas relativas de rotación. Finalmente, si la coordenada asociada a las vibraciones se
modela omo un oscilador armónico, tendremos una contribución de energı́a cinética y otra de
energı́a potencial. Ası́, realmente tendrı́amos 7 grados de libertad, por lo cual esperamos un
valor medio de energı́a igual
 a /2kT . El calor molar a volumen constante es, para cada grado
7
∂hEi
de libertad, igual a CV = ∂T = 1/2kN0 = R/2, en donde N0 es la constante de Avogadro
V
y R = N0 k.
1.4. LA FÍSICA ESTADÍSTICA 5

Figura 1.1: Calor especı́fico a volumen constante, idealizado, para un gas diatómico. By
User:PAR - Own work, Public Domain, [Link]
curid=1498790

1 P0 V0
El calor especı́fico de un gas a volumen constante es 2J T (n + e) y a presión constante
1 P0 V0
es 2J T (n + 2 + e), en donde P0 y V0 son la presión y el volumen por unidad de masa
a temperatura absoluta T , J es el equivalente dinámico del calor, e es un número positivo
que depende de la ley de fuerza de la molécula y n los grados de libertad de la misma.
Experimentalmente se encontró que, para el aire y otros gases, n + e no puede ser mayor
que 4,9. Además, de las observaciones espectroscópicas se desprende que una molécula puede
ejecutar muchos tipos diferentes de movimientos vibratorios. Sin embargo, aún para moléculas
que tienen 2 átomos, el número de grados de libertad (n = 6) produce una predicción teórica
para el calor especı́fico demasiado grande.
6 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
Capı́tulo 2

Un atisbo a los cimientos de la


mecánica cuántica

2.1. Introducción
Mucho se ha debatido sobre la interpretación de la mecánica cuántica y sobre su estatus
como teorı́a. Adam Becker: Quantum theory helps us to understand the logic behind the
periodic table of elements, why diamonds are hard and how to build electronics. The inventors
of quantum theory found the logic of the periodic table of elements and use radioactivity to
[reveal the basic working of living cells].
Comenzamos con un resumen de la formulación de la teorı́a en su vertiente ortodoxa
empleando el libro de Gillespie. Enseguida un breve resumen de la formulación de la onda
piloto de de Broglie. Después haremos algunos comentarios sobre la prueba de imposibilidad
de Neumann y el artı́culo de Grete Herman, Proseguimos con el artı́culo de EPR, usando
el libro de Clemente de la Torre. Seguiremos con la formulación de Bohm y los teoremas de
Bell-Kochen-Specker y de Bell. Algo de la formulación de Everett. Algo de las crı́ticas desde
la filosofı́a. Algo sobre las teorı́a tipo Pearl y GWR. Crı́ticas a las soluciones planteadas y
algo del programa de Smolin.
Desde el punto de vista técnico, la formulación se hace restringiéndose a sistemas mecano-
cuánticos no relativistas en una dimensión, en la representación de posición y en la imagen
de Schrödinger.

2.2. Espacio de Hibert de funciones complejas


La mecánica cuántica se formula generalmente en espacios de Hilbert H, los cuales son
espacios vectoriales. En el contexto de sistemas unidimensionales, podemos pensar que los es-
pacios de Hilbert son espacios de funciones complejas. Vamos a considerar funciones complejas
de una variable real x, es decir función del tipo

ψ(x) = u(x) + iv(x),



en donde u(x) y v(x) son funciones reales, y hemos usado i = −1. En este caso, los vectores
son funciones complejas (de una variable real). De manera más concreta, un vector ψ es una
regla que le asigna a cada punto x de la recta real (o de un segmento finito o infinito de la
misma) un número complejo, ψ(x).
Para derivar e integrar estas funciones complejas podemos usar las definiciones conocidas

7
8 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
para las mismas operaciones para las partes real e imaginaria,
dψ(x) du(x) dv(x)
= +i ,
Z dx Z dx dxZ
ψ(x) dx = u(x) dx + i v(x) dx.

En todo espacio vectorial deben estar definidas las operaciones de multiplicación por escalar
y suma de vectores. Aquı́ los escalares son los números complejos. Si ψ1 (x) = u1 (x) + iv1 (x)
y ψ2 (x) = u2 (x) + iv2 (x) son funciones complejas, entonces su suma
ψ(x) = ψ1 (x) + ψ2 (x) = (u1 (x) + u2 (x)) + i (v1 (x) + v2 (x)) ,
es otra función compleja cuya parte real es la suma de las partes reales de ψ1 (x) y ψ2 (x) (y
cuya parte imaginaria es la suma de las partes imaginarias de ψ1 (x) y ψ2 (x)). La suma de
vectores debe ser clausurativa (la suma de dos vectores debe ser otro vector), conmutativa (no
importa el orden en que se suman los vectores), asociativa ((ψ1 + ψ2 ) + ψ3 = ψ1 + (ψ2 + ψ3 ))
y debe existir el vector cero que sumado a cualquier vector ψ da el vector ψ como resultado.
Por otro lado, si c = a + ib es un número complejo y ψ1 (x) = u1 (x) + iv1 (x) es una función
compleja, entonces el producto de la función ψ1 por el escalar c es la función
ψ(x) = cψ1 (x) = (au1 (x) − bv1 (x)) + i (av1 (x) + bu1 (x)) .
La multiplicación por escalar debe ser clausurativa (cψ es otro vector), distributiva con res-
pecto a la suma de vectores (c(ψ1 + ψ2 ) = cψ1 + cψ2 ) y con respecto a la suma de escalares
((c1 +c2 )ψ) = c1 ψ+c2 ψ), debe ser asociativa ((c1 c2 )ψ = c1 (c2 ψ)) y el producto de la identidad
del campo escalar con un vector da como resultado el mismo vector.
Los espacios de Hilbert también poseen otra operación, conocida como producto interno
o producto escalar, la cual le asigna un número complejo a cada par ordenado de vectores. Si
ψ1 (x) y ψ2 (x) son funciones complejas, el producto escalar (ψ1 , ψ2 ) se define como
Z ∞
(ψ1 , ψ2 ) = ψ1∗ (x)ψ2 (x) dx (2.1)
−∞

en donde ψ1∗ (x)es la función (u1 (x) + iv1 (x))∗ = u1 (x) − iv1 (x) correspondiente a la conju-
gación compleja de la función ψ1 (x). A partir del producto escalar se puede definir la norma
de un vector,
p
kψk = (ψ, ψ),
de modo que el cuadrado de la norma del vector ψ
Z ∞ Z ∞
kψk2 = ψ ∗ (x)ψ(x) dx = u2 (x) + v 2 (x) dx ≥ 0,

(2.2)
−∞ −∞

es un número positivo o cero. De hecho, la norma solamente es cero si la función compleja es


cero en todas partes; es decir, si corresponde al vector cero. Una norma también debe satisfa-
cer la igualdad kcψk = |c|kψk, en donde |c| es la magnitud del número complejo c. Además,
debe satisfacer la desigualdad triangular kψ1 + ψ2 k ≤ kψ1 k + kψ2 k.

Ejercicio: demostrar la desigualdad triangular?

EJERCICIO 2. Empleando la definición de producto escalar, y suponiendo que c1 y c2 son


números complejos, demostrar las siguientes propiedades

(ψ1 , ψ2 ) = (ψ2 , ψ1 )
(ψ1 , c2 ψ2 + c3 ψ3 ) = c2 (ψ1 , ψ2 ) + c3 (ψ1 , ψ3 )
(c2 ψ2 + c3 ψ3 , ψ1 ) = c∗2 (ψ2 , ψ1 ) + c∗3 (ψ3 , ψ1 ) .
2.2. ESPACIO DE HIBERT DE FUNCIONES COMPLEJAS 9
EJERCICIO 3. Demostrar la desigualdad de Cauchy-Schwarz
|(ψ1 , ψ2 )| ≤ kψ1 kkψ2 k.
Sugerencia: la norma de ψ = (ψ1 , ψ2 )ψ1 − (ψ1 , ψ1 )ψ2 es un número positivo o cero.

EJERCICIO 4. Considere las siguientes funciones complejas (recuerda que las constantes c1
y c2 son números complejos)
2 2 2 2
ψ1 (x) = c1 e−x /σx
, ψ2 (x) = c2 xe−x /σx
. (2.3)
Encuentre la norma de las funciones anteriores. Encuentre todos los valores posibles de c1 y
c2 para que la norma de ψ1 sea uno. Repita para ψ2 .

EJERCICIO 5. Calcule el producto escalar (ψ1 , ψ2 ) con las funciones definidas en el ejercicio
2.2.

No todas las funciones complejas son vectores del espacio de Hilbert H; sola-
mente aquellas con norma finita.
El producto escalar permite definir la noción de ortogonalidad. Dos funciones complejas
2 2
son ortogonales si su producto escalar es cero. Por ejemplo, las funciones ψ1 (x) = c1 e−x /σx y
2 2
ψ2 (x) = c2 xe−x /σx son ortogonales. Además, si c1 y c2 se escogen de acuerdo con el ejercicio
2.2 tenemos dos funciones ortonormales.
2 2
EJERCICIO 6. Considere la función ψ(x) = x2 e−x /σx . Emplee el método de ortonorma-
lización de Gram-Schmidt para encontrar una función de norma uno que sea ortogonal a
2 2 2 2
ψ1 (x) = c1 e−x /σx y a ψ2 (x) = c2 xe−x /σx .
Ahora podemos definir la noción de conjunto ortonormal {ψi }: un conjunto de vectores
de H (funciones complejas ψi (x)) que satisfacen
(ψi , ψj ) = δi,j ,
en donde δi,j denota la delta de Kronecker, la cual es cero a menos que los ı́ndices i y j sean
iguales. Las vectores ψ1 , ψ2 y ψ3 de los ejercicios anteriores forman un conjunto ortogonal.
Un conjunto de vectores de H, {ψi , i = 1, 2, . . . , N }, es completo si cualquier vector ψ de H
puede escribirse como una combinación lineal de elementos del conjunto,
N
X
ψ= ci ψi ,
i=1

en donde ci son números complejos. En el caso de espacios vectoriales complejos con norma
inducida por un producto escalar, el número natural N es finito. En el caso de los espacios
de Hilbert, N es necesariamente infinito.
Si un conjunto de vectores {ψi , i = 1, 2, . . .} es tanto completo cuanto ortonormal, de-
cimos que se trata de una base ortonormal. Cualquier vector ψ puede escribirse como una
combinación lineal de los elementos de esta base

X
ψ= ci ψi ,
i=1

en donde ci son números complejos. Tomando el producto escalar con un elemento de la base,
digamos ψj , tendremos

X ∞
X ∞
X
(ψj , ψ) = (ψj , ci ψi ) = ci (ψj , ψi ) = ci δi,j , = cj .
i=1 i=1 i=1
10 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Ası́, cualquier vector ψ puede escribirse como

X
ψ= (ψi , ψ) ψi .
i=1

El espacio de estados los sistemas unidimensionales, funciones complejas de cuadrado


integrable, es un espacio de Hilbert separable, es decir, uno que posee una base infinita pero
enumerable, como se supuso en el desarrollo anterior. La notación que se usa para denotar
este espacio es L2 (R).
Un hecho técnico importante es que los espacios de Hilbert son completos en su norma.
Recordemos que una secuencia de vectores {ψi } es de Cauchy si existe M () tal que la distancia
(aquı́ es donde se usa la norma) entre dos elementos de la secuencia, kψi − ψj k, i, j > M, es
menor que  > 0. Se dice que la secuencia {ψi } converge a ψ si lı́mi→∞ kψi − ψk = 0. Se dice
que un espacio de Hilbert H es completo porque todas las secuencias de Cauchy con elementos
en H convergen a un vector que también es un elementos de ese mismo espacio de Hilbert.
En esa caracterı́stica, los espacios de Hilbert se parecen a los números reales, las secuencias
de Cauchy de números convergen a un número real.

2.3. Operadores en el espacio de Hilbert


Cuando derivamos una función compleja encontramos otra función compleja. En el len-
guaje de espacios de Hilbert, podemos decir que la derivada es una regla que le asocia a ψ,
un vector de H otro vector, χ

d
χ(x) = ψ(x).
dx
A las reglas que toman un vector del espacio de Hilbert y le asocian otro vector, se les
denomina operadores. Es común escribir

χ = Oψ.
b

Si un operador Ob se multiplica por un número complejo c se obtiene un nuevo operador, c O;


b
la suma y el producto de dos operadores corresponden a un nuevo operador. Estos operadores
se definen como sigue

(c O)ψ
b = c(Oψ) b
(O
b1 + Ob2 )ψ = (Ob1 ψ) + (Ob2 ψ),
 
(O
b1 O
b2 )ψ = Ob1 O b2 ψ .

La mayor parte de los operadores de la mecánica cuántica son operadores lineales, los cuales
satisfacen la igualdad
   
Ob (c1 ψ1 + c2 ψ2 ) = c1 Oψ
b 1 + c2 Oψb 2 .

Merece la pena notar que, de la misma forma que, en general, f (g(x)) no es igual a g(f (x)),
(O
b1 O
b2 )ψ tampoco es igual a (O
b2 O
b1 )ψ.

EJERCICIO 7. Muestre que el operador multiplicación por x3 , O


b1 ψ(x) = x3 ψ(x) es un
operador lineal.
2.3. OPERADORES EN EL ESPACIO DE HILBERT 11
d2 d2 ψ(x)
EJERCICIO 8. Muestre que el operador segunda derivada dx2 , O
b2 ψ(x) =
dx2 es un ope-
rador lineal.

b1 , multiplicación por x3 , y O
EJERCICIO 9. Muestre que los operadores O b2 , segunda deri-
2
d
vada dx 2 , no conmutan.

EJERCICIO 10. Muestre que [O b1 , O


b2 ] puede escribirse como otro operador, O
b3 , en el sentido
de que [O1 , O2 ]ψ = O3 ψ. ¿Cómo actúa O3 sobre ψ?
b b b b

EJERCICIO 11. Repita el ejercicio anterior usando los operadores O b1 multiplicación por x
y O2 , primera derivada con respecto a x. ¿Cómo actúa O3 sobre ψ?
b b

2.3.1. Adjunto de un operador


Consideremos un operador Lb que asigna a cada vector φ(x) que pertenece al un dominio
D(L), subespacio denso de un espacio de Hilbert H, otro vector Lφ(x),
b b entonces Lb † es el
operador adjunto de L
b siempre y cuando

(Lφ(x),
b b † ψ(x)).
ψ(x)) = (φ(x), L (2.4)

El dominio de L b † es el conjunto de todos los vectores ψ(x) para los cuales se cumple la
igualdad anterior. El producto interno se define ası́:
Z 2π
(φ(x), ψ(x)) = φ∗ (x)ψ(x)dx. (2.5)
0

Ejemplo Consideremos el espacio de Hilbert correspondiente a las funciones complejas


φ(x) de cuadrado integrable definidas en el intervalo [0, 2π]. Consideremos el operador de-
rivada, Lφ(x)
b = dφ(x)
dx . Es necesario decir cuál es el dominio de L para definirlo; es decir,
b
dos operadores derivada L1 y L2 serán diferentes si el dominio D(L
b b b 1 ) es diferente del domi-
nio D(L b 2 ). Podemos escoger D(L b 1 ) como el conjunto de funciones complejas en el intervalo
[0, 2π] que poseen derivada, tales que tanto la función como su derivada son de cuadrado
integrable y que se anulan tanto en x = 0 como en x = 2π. De manera semejante escogemos
D(L b 2 ) como el conjunto de funciones complejas en el intervalo [0, 2π] que poseen derivada,
tales que tanto la función como su derivada son de cuadrado integrable y que se satisfacen
φ(x = 0) = φ(x = 2π).
Vamos a hallar L b † , el operador adjunto de L b1 ,
1
Z 2π
dφ(x) ∗
(L
b 1 φ(x), ψ(x)) = ψ (x)dx.
0 dx

Enseguida integramos por partes,



dψ ∗ (x)
Z
b 1 φ(x), ψ(x)) = φ(x)ψ ∗ (x)|2π −
(L φ(x) dx.
0
0 dx

Teniendo en cuenta que las funciones φ(x) en el dominio D(L


b 1 ) se anulan en los extremos, el
término de frontera se hace cero. Por lo tanto,
2π ∗
dψ ( x)
Z 
(L
b 1 φ(x), ψ(x)) = φ(x) − b † ψ(x)).
dx = (φ(x), L 1
0 dx
12 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Comparando el segundo término de la ecuación anterior con el último término concluimos
que L b † es menos el operador derivada. Como dijimos antes, el operador no está determinado
1
a menos que pongamos el dominio. Podemos esperar que las funciones para las que se aplica
deben ser de cuadrado integrable, que tengan derivada que también sea de cuadrado integrable.
Además, como el término de frontera se anuló sin exigir ninguna condición sobre ψ(x), el
dominio D(L b † ) no incluye ninguna condición sobre como ψ(x) debe comportarse en x = 0 y
1
en x = 1.
EJERCICIO 12. Encontrar L b † , el adjunto del operador Lb 2 . Recuerde que L
b 2 es el opera-
2
dor derivada tal que su dominio D(L2 ) es el conjunto de funciones complejas en el intervalo
b
[0, 2π] que poseen derivada, tales que tanto la función como su derivada son de cuadrado
integrable y que no satisfacen ninguna condición de frontera.
Comentario: Con alguna frecuencia se dice que L b † es el hermitiano conjugado de L b y
d † d

se escribe dx = − dx . Generalmente, en estos casos, se ignoran los dominios, tanto del
operador L b como de su adjunto.

2.3.2. Operadores simétricos, hermı́ticos y autoadjuntos


Existen varias formas diferentes de usar las palabras simétrico, hermı́tico y autoadjunto
cuando se aplican a operadores lineales en un espacio de Hilbert. En fı́sica, con alguna fre-
cuencia se dice que, si el hermitiano conjugado de un operador (ignorando el problema del
dominio) es igual al operador mismo, el operador es hermı́tico. Por ejemplo, se puede escri-
d † d † d †
= (−i)∗ dx d d
  
bir −i dx = i − dx = −i dx . Se dirı́a, entonces, que el operador −i dx es
hermı́tico.
Existen, sin embargo, otros usos para la palabra hermı́tico en la la literatura. Gillespie
[37], por ejemplo, dice que los operadores hermı́ticos son aquellos que satisfacen la igualdad

(Oψ,
b χ) = (ψ, Oχ)
b (2.6)
para todos los vectores ψ y χ de H. De hecho, esta definición coincide con la definición de
operadores autoadjuntos que se usa en el análisis funcional. Sin embargo, veamos que se
supone que el dominio del operador es todo el espacio de Hilbert. Esta condición es posible
para una clase de operadores que se conocen como operadores compactos (operadores cuyos
autovalores son finitos todos ellos, de manera que la razón entre las normas de Oψ b y de ψ sea
finita). Sin embargo, la inmensa mayorı́a de operadores que usamos en mecánica cuántica no
son compactos, son no acotados. Los operadores multiplicación por x y derivada, por ejemplo,
no son compactos. Como los operadores acotados no pueden definirse en todo el espacio de
Hilbert, la definición anterior tiene utilidad limitada. Se podrı́a suponer, entonces, que para
operadores no acotados un operador O b serı́a hermı́tico si satisface la igualdad

(Oψ,
b χ) = (ψ, Oχ),
b ∀φ, ψ ∈ D(O),
b (2.7)

para todos los vectores ψ y χ de su dominio D(O). b Esta suposición, sin embargo, está equi-
vocada, pues la ecuación (2.7) define operadores simétricos.
Existe otra generalización del concepto de hermiticidad (de la manera que la entience
Gillespie [37]) para operadores no acotados: la autoadjunción. En tales casos es menester
definir el dominio del operador O,
b luego encontrar Ob † , su adjunto; es decir, saber como actúa

y qué dominio tiene. Si tanto O b cuanto O b actúan de la misma forma y tienen el mismo
dominio, entonces se dice que O b es autoadjunto [25].
Vale la pena mencionar que la noción matemática relevante para la asociación entre obser-
vables y operadores es la de autoadjunción y no la de hermiticidad, la cual a menudo se usa
como comodı́n para designar ora operadores simétricos, ora operadores autoadjuntos. Como en
muchas situaciones no es necesario hacer las distinciones entre operadores simétricos, hermı́ti-
cos y autoadjuntos, en primera aproximación se pueden usar de manera intercambiable. Sin
2.3. OPERADORES EN EL ESPACIO DE HILBERT 13
embargo, algunos fenómenos fı́sicos como el efecto Aharonov-Bohm dependen crucialmente
de que estén claras las diferencia entre estos conceptos relacionados.
Comencemos examinando un operador constante O b = c. Teniendo en cuenta que Oψ
b = cψ
y que Oχ
b = cχ, la ecuación (2.6) queda

(cψ, χ) = (ψ, cχ)?

Como el lado izquierdo es igual a c(ψ, χ) y el lado derecho igual a c∗ (ψ, χ), ambos lados son
iguales solamente si c = c∗ , es decir, si c es un número real.
Enseguida consideremos el caso del operador derivada. El lado derecho de la ecuación (2.6)
queda
∞ Z ∞
dψ ∗ (x)
Z  
dχ(x)
(ψ, Oχ)
b = = ψ ∗ (x)χ(x)|∞
dx ψ ∗ (x) −∞ − dx χ(x)
−∞ dx −∞ dx
Z ∞  ∗
dψ b † ψ, χ).
= dx − χ(x) = (O
−∞ dx

En la secuencia hemos hecho una integración por partes y luego eliminamos los términos de
frontera. La razón es que para que la derivada de una función compleja pertenezca al espa-
cio de Hlbert es necesario que sea cero o tienda a cero cuando x → ±∞. Vemos que con la
eliminación de los términos de frontera hemos sido capaces de escribir (ψ, Oχ)b = (O b1 ψ, χ),
en donde O b1 es menos la derivada. Como O b1 depende de O b de la manera como acabamos de
expresarlo, en realidad hemos encontrado el operador adjunto de la derivada (que es menos
la derivada), por lo cual lo notamos O b † . Esta es la condición que nos permite encontrar el
1
adjunto de un operador. Vemos que, como los términos de superficie se anularon debido a
las condiciones sobre χ(x), las funciones ψ(x) no deberı́an satisfacer condiciones de frontera
parecidas. Sin embargo, para que menos la derivada de una función compleja pertenezca al
espacio de Hilbert, es menester que sea cero o tienda a cero cuando x → ±∞.

b igual a −i veces la derivada es un operador


EJERCICIO 13. Muestre que el operador O
hermı́tico (autoadjunto).

EJERCICIO 14. Sin preocuparse por el problema de los dominios de los operadores, usando
la definición del adjunto de un operador, muestre que el adjunto del operador O
b1 O
b2 es O b†
b† O
2 1.

En la teorı́a cuántica los autovalores y los autovectores de los operadores hermı́ticos tienen
un lugar espacial. Supongamos que V es un espacio vectorial sobre un cuerpo F (scalar field ),
y que T es un operador lineal con dominio D(T ), subespacio de V, que transforma vectores
pertenecientes a su dominio en otros vectores de V. A un vector no nulo v, elemento de D(T ),
que satisface T v = λv para algún escalar λ, se le llama autovector de T ; λ es el autovalor
correspodiente. En fı́sica cuántica, los espacios vectoriales de interés son los espacios de Hilbert
y el cuerpo de interés son los números complejos; de manera que la definición de autovalores
y autovectores, en este caso particular, se puede enunciar ası́. Si O b es un operador y ψ es un
vector de H que cumple la ecuación


b = oψ,

en donde o es un número complejo, decimos que ψ es un autovector de O


b con autovalor o.

1 Para poder encontrar el adjunto de un operador O


b es necesario que el dominio de ese operador sea denso
en H, es decir, que cualquier vector de H debe poder aproximarse por vectores del dominio de O.
b
14 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
EJERCICIO 15. Muestre que la función eax , con a real, es una autofunción del operador
d
dx , definido sobre un espacio vectorial adecuadamente escogido. ¿Cuál es el autovalor corres-
pondiente? ¿qué pasa si a es un número puramente imaginario?

Recuerde que mientras el operador derivada no es hermı́tico, en un ejercicio anterior usted


d
obtuvo que el operador −i dx si lo es. Sin importar si a es complejo, real puro o imaginario
ax d
puro, la función e es autofunción de −i dx . ¿cómo es el autovalor en caso de que a sea real
o sea puramente imaginario?

EJERCICIO 16. Muestre que la función xn , con n entero, es una autofunción del operador
d
x dx . ¿Qué tuvo que suponer acerca del espacio vectorial en dónde se definió el operador?
¿Cuál es el autovalor correspondiente?

EJERCICIO 17. ¿La función cos(ax), con a real, es autofunción de qué operador no constan-
te? Si ese operador es O, b 2 ? En caso positivo,
b ¿la función cos(ax) también es autofunción de O
¿cuál es el autovalor correspondiente?
2 2
EJERCICIO 18. ¿Puede escoger la constante a de manera que ψ1 (x) = c1 e−x /σx y ψ2 (x) =
2 2
c2 xe−x /σx , en donde c1 , c2 y σx son constantes, sean ambas autofunciones del operador
d2 2
− dx 2 + ax ? En caso positivo, ¿cuáles son los autovalores correspondientes? En caso negativo,

¿los valores obtenidos para la constante son diferentes para cada una de las funciones, o es
imposible escoger a de manera que ψ1 o ψ2 sean autofunciones?

EJERCICIO 19. Muestre que si O b es un operador hermı́tico, entonces sus autovalores son
reales. (Sugerencia: Considere que las dos cantidades (ψ, Oψ)
b y (Oψ,
b ψ) son iguales si el ope-
rador O es autoadjunto, y use el hecho de que ψ es autofunción de O
b b con autovalor c.) Si
quiere ser más formal, suponga que O es un operador compacto autoadjunto, o que es un
b
operador no acotado autoadjunto, pero que los autovalores hacen parte del espectro discreto.

d
Volvamos al caso del operador −i dx . Si a es imaginario puro, la función eax es autofunción
d
de −i dx con autovalor real; si es real, el autovalor es imaginario. Al parecer, podemos inclusive
considerar que a es complejo y la función eax parece ser autofunción. ¿Existe alguna diferen-
cia fundamental entre los diferentes casos? Recuerde que hemos dicho que las autofunciones
deben pertenecer al espacio de Hilbert.

EJERCICIO 20. Calcule la norma de la función eax . ¿Encuentra diferencias en el valor de


la norma cuando a es puramente real y cuando es puramente imaginario?

En ambos casos usted ha debido encontrar que la función eax no tiene norma finita. ¿Es-
d
te resultado implica que el operador −i dx no tiene autofunciones? Esta pregunta se puede
responder de diferentes maneras. En fı́sica se acostumbra a definir autofunciones aún cuando
estas no tengan norma finita. Sin embargo, no pueden tener un comportamiento arbitrario.
Mientras las funciones eax , a imaginario puro, tienen crecimiento limitado cuando x es muy
grande (|eax | es finito cuando x → ±∞), crecen sin cota cuando si la parte real de a no es
cero: cuando x → ∞ si la parte real de a es positiva y cuando x → −∞ si la parte real de a
es negativa. ¿Qué pasa con exp(ix3 ) por ejemplo? El uso de funciones como eiax , en donde a
es real, no es exclusivo de la mecánica cuántica. En efecto, en electrodinámica y en el estudio
de ondas, es común usar ondas planas, del tipo ei(kx−ωt) (en realidad, se usan ondas que se
comportan como superposiciones de la parte real y de la parte imaginaria de la expresión
anterior). La energı́a contenida en una onda plana, la cual se extiende por todo el espacio,
es infinita. Claramente las ondas planas no son posibles en la realidad; no podemos producir,
2.3. OPERADORES EN EL ESPACIO DE HILBERT 15
experimentalmente, ninguna onda plana. Se usan, sin embargo, porque son aproximaciones a
situaciones fı́sicas reales y porque son simples, y permiten manipulaciones algebraicas senci-
llas. Con frecuencia, también se usan en programas numéricos. En mecánica cuántica, tenemos
una situación parecida. No es posible preparar estados descritos por ψ(x) = eiax , con a real;
pero son simples, es fácil manipularlas matemáticamente, se pueden aproximar en situaciones
reales y se emplean en cálculos numéricos. Además, funciones de onda de este tipo son los
autovectores generalizados, tanto del operador de momento, como del hamiltoniano de una
partı́cula libre.

EJERCICIO 21. Muestre que si ψ1 (x) y ψ2 (x) son autofunciones del operador hermı́tico
O,
b con autovalores diferentes c1 y c2 , entonces ψ1 (x) y ψ2 (x) son ortogonales. (Sugerencia:
Considere las dos cantidades (ψ1 , Oψ
b 2 ) y (Oψ
b 1 , ψ2 ) y use el hecho de que c1 y c2 deben ser
números reales.) Si quiere ser más formal, suponga que O b es un operador compacto autoad-
junto, o que es un operador no acotado autoadjunto, pero que los autovalores hacen parte del
espectro discreto.

El espectro de un operador autoadjunto, es decir, el conjunto de autovalores del operador


se puede descomponer en tres partes [31, 32]: absolutamente continuo, singular continuo y
puntual. Desde el punto de vista práctico, podemos ignorar la segunda contribución.2 Ası́,
basta tener en cuenta ejemplos de espectro puntual y de espectro continuo (al menos un in-
tervalo de la recta real forma parte del espectro del operador), con la posibilidad de que haya
degeneración, es decir que haya más de un autoestado asociado al mismo autovalor. Mientras
que los autoestados correspondientes al espectro puntual son normalizables, es decir, verdade-
ros vectores del espacio de Hilbert, aquellos correspondientes al espectro continuo, conocidos
como vectores generalizados, no lo son. En realidad, son distribuciones. Una manera de for-
malizar tales vectores es a través del uso de las tripletas de Gelfand, o de los llamados Rigged
Hilbert spaces, algo ası́ como espacios de Hilbert alistados. Se definen, además del espacio de
Hilbert, otros dos espacios: el nuclear y el dual del espacio nuclear. El producto escalar entre
un vector del espacio nuclear y un elemento de su dual está definido y es un número complejo
de norma finita. Si un operador es autoadjunto con H, sus autovectores correspondientes al
espectro puntual son vectores del mismo espacio de Hilbert y sus autovectores (generalizados)
correspondientes al espectro continuo son elementos del espacio dual del espacio nuclear.
Supongamos entonces que un cierto operador autoadjunto en H tiene un conjunto de
autovectores ψi y otro de autovectores generalizados ψ(o). Cualquier estado φ del espacio de
Hilbert H puede escribirse como
X Z
φ= (φi , φ)φi + do (ψ(o), φ)ψ(o),
i o∈σac

en donde σac designa el(los) intervalo(s) en donde se tiene el espectro continuo. Los autovecto-
res generalizados tienen también una regla de normalización, como se muestra en el siguiente
ejemplo. √ d
Los autovectores generalizados ψk , ψk (x) = eikx / 2π son autoestados del operador −i dx ,
en donde k es un número real arbitrario. Cualquier estado puede escribirse entonces como
Z ∞ Z ∞
eikx
φ= dk (ψk , φ)ψk , φ(x) = dk (ψk , φ) √ ,
−∞ −∞ 2π
en donde

e−ikx
Z
(ψk , φ) = dx √ φ(x).
−∞ 2π
2 Sin embargo, existen ejemplos fı́sicos relacionados con el estudio del efecto Hall cuántico. El lector intere-

sado puede consultar el artı́culo [33]


16 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
iqx
e
Supongamos que φ(x) = √ 2π
= ψq . Teniendo en cuenta las regla de integración de la
distribución delta de Dirac, es necesario que (ψk , ψq ) = δ(k − q), por lo cual,
Z ∞ Z ∞
e−ikx eiqx
dx √ √ = δ(k − q), dx e−i(k−q)x = 2πδ(k − q).
−∞ 2π 2π −∞

De hecho, esta última integral, que tiene sentido dentro de la teorı́a de distribuciones, es la
eikx
que nos dice que debemos usar las autofunciones √ 2π
para que su relación de ortonormalidad
sea una delta.

2.4. Formulación axiomática de la teorı́a cuántica


La formulación actual de la mecánica cuántica no relativista requirió de los esfuerzos de
varios fı́sicos que hicieron importantes contribuciones durante un periodo de unos 25 años.
Los diferentes elementos del rompecabezas se fueron hallando uno a uno, pero aún después
de tener armado el rompecabezas no era claro el mensaje. En medio de desacuerdos que
continúan hasta el presente, Niels Bohr y colaboradores desarrollaron una interpretación con
espı́ritu positivista, que continúa siendo la presentación ortodoxa de la teorı́a, conocida como
interpretación de Copenague. La formulación axiomática de John von Neumann [26], con
algunas modificaciones, es la misma que se usa en muchos libros de texto. Aquı́ usamos la
versión del libro de Daniel Gillespie [37], suponiendo que tenemos un sistema unidimensional.
Otros libros de texto comparten el mismo orden de los postulados; por ejemplo, la referencia
[27].
Los dos primeros postulados y el sexto son de representación. Suponemos que existen
los sistemas fı́sicos que son representados en la teorı́a por objetos matemáticos. El primer
postulado dice qué objeto matemático se asocia al estado de un sistema y el segundo trata de
la representación matemática de los observables.

Estados Una partı́cula clásica unidimensional se caracteriza por los valores de su posición
y de su momento. El estado del sistema, en un instante de tiempo t, se describe mediante
(x(t), p(t)), los valores de posición y momento de la partı́cula en ese instante. Más en general,
el estado un sistema clásico se asocia con un punto del espacio de fases del sistema, la colección
de coordenadas generalizadas y de sus momentos canónicamente conjugados. Si se conoce el
estado del sistema, se conocen los valores de todos los observables del sistema (porque son fun-
ciones de las coordenadas generalizadas y de sus momentos canónicos). Además, si se conocen
las fuerzas sobre el sistema y el estado del sistema en un instante, se puede conocer el estado
del sistema en cualquier otro instante. Cualquiera que sea el objeto matemático escogido para
representar los estados de un sistema cuántico, debe contener la información acerca de sus
observables y deberı́a ser posible conocer el estado en el futuro, cuando se conoce el estado
en un tiempo dado.

Postulado 1. Todo estado fı́sico de un sistema dado se describe mediante un vector de norma
unidad de algún espacio de Hilbert H y todo vector de norma unidad de ese espacio corres-
ponde a un posible estado fı́sico. Vectores que difieren por una fase, ψ(x) y eiφ ψ(x), donde
φ es un número real, describen el mismo estado fı́sico. Todo lo que se pueda saber acerca del
sistema en un instante de tiempo t está codificado en ψt (x), la función de onda del sistema
en ese instante.

Consideremos un bolı́grafo, ¿cómo se describe clásicamente? Si pensamos en el marcador


como una partı́cula puntual, necesitarı́amos seis números que corresponden al espacio de fase
de una partı́cula puntual: tres coordenadas y dos momentos. Sin embargo, si se considera
como un cuerpo rı́gido, se necesitarı́a el doble de números, ya que es necesario usar tres
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 17
coordenadas más para especificar cómo está orientado el bolı́grafo en el espacio, y otras tres
que corresponden a los momentos canónicamente conjugados. El bolı́grafo es el mismo, pero se
puede describir de formas diferentes. Podemos hablar del nivel de descripción. En mecánica
cuántica, también se puede describir el mismo sistema fı́sico usando diferentes niveles de
descripción.
Los estados pueden representarse mediante vectores. Supongamos que tenemos una base
del espacio de Hilbert, compuesta por las funciones α1 (x), α2 (x), · · · Cualquier vector ψ del
espacio de Hilbert (cualquier estado) se puede escribir como una combinación lineal de las
funciones αi (x), X
ψ(x) = (αi , ψ)αi (x).
i

Si pensamos en las funciones αi (x) como ejes generalizados, podemos pensar que el estado ψ
se puede escribir como un vector columna (columna por convención),
 
(α1 , ψ)
. 
ψ = (α2 , ψ) .

..
.

EJERCICIO 22. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) =
δ(x − x0 ) puede describir un estado de este sistema? En caso de que la respuesta sea negativa,
i) encuentre una forma de “arreglar” la función para que la nueva función sı́ pueda describir
un estado de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
EJERCICIO 23. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas
se encontró con el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas
planas unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para que la
nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii) muestre que
no se puede arreglar.
EJERCICIO 24. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene
espı́n hacia arriba y espı́n hacia abajo. Escriba el estado más general de una partı́cula de
espı́n 1/2, tanto en el formalismo de Dirac como en el formalismo en el que los estados se
representan como vectores columna.
EJERCICIO 25. Escriba el estado más general de una partı́cula de dos espines 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan como
vectores columna.
EJERCICIO 26. Escriba un estado de dos partı́culas cuánticas tridimensionales. ¿Qué re-
quisitos deberı́a cumplir esta función para poder describir un estado cuántico? La función que
escribió ¿puede escribir un estado cuántico? Justifique su respuesta.
EJERCICIO 27. ¿Cómo se puede saber si un sistema está en un estado particular?
EJERCICIO 28. ¿Se puede medir el estado de un sistema?
EJERCICIO 29. ¿El estado cuántico describe un único sistema?

Observables En mecánica clásica, un observable es una variable dinámica (alguna función


del momento y la posición) que se puede medir. La medición del observable A es un proce-
dimiento fı́sico bien definido que, cuando se ejecuta sobre el sistema, da como resultado un
número real que es el valor del observable.

Postulado 2. A cada observable fı́sico A le corresponde un operador lineal autoadjunto


(hermı́tico) A
b y a todo operador lineal autoadjunto le corresponde algún observable fı́sico. El
operador A posee un conjunto completo de autovectores ortonormales α1 (x), α2 (x), · · · que
b
satisfacen

b i (x) = ai αi (x), i = 1, 2 · · ·
18 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
en donde los números reales ai son los únicos resultados posibles en la medición del observable
A.

Se argumenta que los observables se escogen autoadjuntos para asegurar autovalores reales,
los cuales son los únicos que se obtienen en un experimento. Además, porque cualquier estado
de un sistema puede escribirse como una combinación lineal de los autovectores de cualquier
operador autoadjunto del sistema. La tercera razón en favor de los operadores autoadjuntos
tiene que ver con dos postulados posteriores. Para cada sistema fı́sico existe un operador lineal
que aparece en la ecuación de evolución temporal; si este operador es autoadjunto, entonces
la evolución es unitaria y hay conservación de la probabilidad.
[artı́culo con 2 ruidos RWA]
Aunque son buenos argumentos, podrı́a haber alternativas. Por ejemplo, un operador
podrı́a representar dos observables, de manera que la parte real de los autovalores complejos
de este operador correspondiese a un observable, y la imaginaria al otro.
Hace algunos años se encontró que existen operadores no autoadjuntos, con simetrı́a P T
(reflexión sobre un eje e inversión de movimiento), cuyos autovalores puramente reales [34].
Sin embargo, dado que estos operadores son autoadjuntos en espacios con producto escalar
indefinido (espacios de Krein), es posible relacionarlos con otros operadores, generalmente no
locales, que son autoadjuntos en un espacio de Hilbert [35].
Muchos operadores autoadjuntos presentan tanto espectro discreto como continuo. La pre-
sencia del primero es interesante porque, a diferencia de la teorı́a clásica, en la formulación
cuántica no todos los valores de un observable serı́an posibles.

Ya que los estados pueden representarse mediante vectores, es natural pensar que los
operadores lineales puedan representarse mediante matrices. Cuando se aplica un operador
lineal a un vector se obtiene otro vector, Oψ(x)
b = χ(x). Tanto ψ cuanto χ puede escribirse
en una base ortonormal, compuesta, por ejemplo, por las funciones α1 (x), α2 (x), · · ·
X X
ψ(x) = (αi , ψ)αi (x), χ(x) = (αi , χ)αi (x).
i i

Substituyendo estas expresiones en Oψ(x)


b = χ(x), se obtiene
X X
(αi , ψ)Oα
b i (x) = (αi , χ)αi (x).
i i

Tomando el producto interno con αj (x), un elemento particular de la base, tenemos


X X
(αj (x), Oα
b i (x))(αi , ψ) = (αi , χ)(αj (x), αi (x)) = (αi , χ).
i i

Este resultado, que puede interpretarse como un producto de una matriz por un vector
    
(α1 , Oαb 1 ) (α1 , Oαb 2) · · · (α1 , ψ) (α1 , χ)
(α2 , Oα b 1 ) (α2 , Oαb 2 ) · · · (α2 , ψ) = (α2 , χ) ,
.. ..
    
.. .. ..
. . . . .

muestra que el operador O


b se representa por una matriz en la base ortonormal de funciones
α1 (x), α2 (x), · · ·

La descripción de operadores a través de matrices (que pueden ser infinitas), es la base de


la formulación de Heisenberg de la mecánica cuántica. Puede encontrar más información en las
referencias [28, 29, 30]; la primera para un enfoque moderno, la segunda contiene traducciones
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 19
de los artı́culos originales y la última rescata un artı́culo original sobre el átomo de hidrógeno
que emplean la formulación de Heisenberg de la mecánica cuántica (conocida como mecánica
matricial). La segunda referencia debe examinarse con precaución, puesto que su objetivo
es mostrar que la mecánica cuántica surge como un recorrido a tientas, pero guiado por el
principio de correspondencia.
Postulado 6. Los operadores de posición X b y de momento Pb correspondientes a un sistema
fı́sico unidimensional actúan de la siguiente forma sobre las vectores de estado ψ,

b → xψ(x),

dψ(x)
Pbψ → −i~ ,
dx
h
en donde ~ es la constante de Planck (reducida), definida como ~ = 2π , siendo h la constante
de Planck.

Este postulado permite relacionar las variables clásicas con las cuánticas. Por ejemplo, el
Hamiltoniano cuántico de los sistemas unidimensionales se puede obtener a partir de la versión
clásica, haciendo uso de las reglas anteriores. Idem para la versión cuántica del momento
angular. cuando se tienen productos de potencias de la posición con potencias del momento,
surge el problema del ordenamiento de los operadores en la descripción cuántica. Por ejemplo,
xp podrı́a representarse
 por
 X P o por P X. Como el operador debe ser hermı́tico, se escoge
bb bb
el operador 12 X b . Para x2 p no se puede emplear el mismo truco, pues se tienen
b Pb + PbX
 
las alternativas independientes O b1 = 1 X b2 y O
b 2 Pb + PbX b2 = X b PbX;
b ası́ podemos usar
2
c1 O
b1 + c2 Ob2 , en donde los números reales c1 y c2 deben sumar uno.
Hay dos postulados que relacionan la teorı́a con los resultados de los experimentos.

Postulado 3. Si se mide el observable A, los únicos resultados posibles son ai , los auto-
valores del operador A. b Si antes de la medición el sistema se encuentra en el estado ψ, la
mejor predicción que puede hacerse es que la probabilidad de que se obtenga el resultado ai
es p(a0 , a1 ) = |(αi , ψ)|2 , en donde αi es el autovector asociado a ese autovalor.

Estas predicciones guardan cierta semejanza con aquellas provenientes de la mecánica


estadı́stica. ¿Qué deberı́amos hacer para comprobar que, efectivamente, el resultado a1 tiene
probabilidad p1 ? Deberı́amos tomar un montón de sistemas idénticos, todos ellos descritos
por la misma función de onda, y someterlos a la medición del observable A. Por simplicidad,
vamos a suponer que no hay error experimental, de modo que obtenemos los resultados ai
de manera conclusiva y sin ninguna incertidumbre del valor obtenido. Deberı́amos obtener la
frecuencia con que se obtuvo el resultado a1 , es decir, la razón entre el número de veces que
se obtuvo dicho resultado y el número de veces que se efectuó la medición. Esa frecuencia se
compara con la predicción teórica, pero no se espera que sean exactamente iguales. Entonces
se deberı́a hacer una prueba que nos dé un intervalo de confianza de que el resultado obtenido
concuerde con la predicción teórica.
Vemos que, dado que las predicciones de la teorı́a cuántica son de carácter probabilista, es
necesario tener colectivos (ensembles), conjuntos de sistemas idénticos descritos por el mismo
estado cuántico. La necesidad de sistemas idénticos se extiende al caso particular de sistemas
preparados en un autoestado del observable a medir. Es verdad que debemos obtener con
probabilidad uno el autovalor asociado al autoestado. Sin embargo, para confirmar que la
probabilidad es uno han de medirse muchos sistemas idénticos.
Visto de otra manera, la mecánica cuántica predice las distribuciones de probabilidad;
por lo tanto, también predice todos los momentos de la distribución. Los momentos más
importantes son ,por supuesto, el valor esperador (la media) y la varianza (el error cuadrático
20 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
medio). Consideremos la medición del observable A. Digamos que el valor a1 se obtuvo n1
veces, a2 se obtuvo n2 veces, etc. El valor medio del observable A, proveniente del experimento
es
n1 a1 + n2 a2 + · · ·
Ā = = f1 a1 + f2 a2 + · · · ,
n1 + n2 + · · ·
en donde la i-ésima frecuencia es Pn1ni . Como las probabilidades teóricas deben ser iguales a
i
las frecuencias experimentales, la predicción teórica ara el mismo observable es

Ā = p1 a1 + p2 a2 + · · · = (ψ, α1 )a1 (α1 , ψ) + (ψ, α2 )a2 (α2 , ψ) + · · ·

en donde usamos el hecho de que p1 = |(α1 , ψ)|2 = (ψ, α1 )(α1 , ψ). Como αi es autovector de
A on autovalor ai , tenemos

Ā = (ψ, α1 )(Aα b 2 , ψ) + · · · .
b 1 , ψ) + (ψ, α2 )(Aα

Dado que el operador A


b es autoadjunto, es decir, satisface (Aφ,
b ψ) = (φ, Aψ),
b también pode-
mos escribir

Ā = (ψ, α1 )(α1 , Aψ) b + · · · = (ψ, Aψ).


b + (ψ, α2 )(α2 , Aψ) b (2.8)

Para P
convencernos de la última igualdad, examinemos el producto escalar (ψ1 , ψ2 ). Como
ψ1 = i (αi , ψ1 )αi , (y se tiene una expresión similar para ψ2 ) el producto escalar queda
X X XX
(ψ1 , ψ2 ) = ( (αi , ψ1 )αi , (αj , ψ2 )αj ) = ((αi , ψ1 )αi , (αj , ψ2 )αj )
i j i j
XX XX
= (αi , ψ1 )∗ (αj , ψ2 )(αi , αj ) = (ψ1 , αi )(αj , ψ2 )δi,j
i j i j
X
= (ψ1 , αj )(αj , ψ2 ).
j

Comparando este resultado con la ecuación (2.8), vemos que el valor esperado del observables
A se puede escribir de la forma siguiente
Z ∞  
Ā = (ψ, Aψ)
b = dx ψ ∗ (x) Aψ(x)
b . (2.9)
−∞

Recordando el postulado 6, vemos que el valor esperado del momento se puede escribir como
Z ∞
dψ(x)
P̄ = (ψ, Pbψ) = −i~ dx ψ ∗ (x) .
−∞ dx

EJERCICIO 30. Emplear el mismo procedimiento empleado aquı́, para encontrar σA , la


varianza de un observable A, a partir de la expresión
X n1 (a1 − Ā)2 + n2 (a2 − Ā)2
2
σA =
i
n1 + n2 + · · ·

Hemos supuesto autovalores discretos no degenerados. ¿Qué pasa si hay degeneración? En


este caso habrá más de un autovector asociado con el mismo autovalor. Si utilizamos un rótulo
adicional, j en este caso, para distinguir diferentes autovectores (y escogemos autovectores
ortogonales) de manera que se cumple que Aαij = ai αij , la probabilidad de obtener el auto-
valor ai será pi = j |(αij , ψt )|2 . El número de autovectores correspondientes a un autovalor
P
ai , digamos a1 generalmente difiere del número correspondiente a otro autovalor, digamos a2 .
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 21
¿Qué pasa si los autovalores hacen parte del continuo? No se espera obtener un único valor
sino un intervalo de valores, digamos [a0 , a1 ].R Si no hay degeneración, la probabilidad de ob-
a
tener un autovalor en el intervalo anterior es a01 da |(α(a), ψt )|2 . En particular, si se hace una
medición de posición a un sistema caracterizado por la función de onda ψ(x), la probabilidad
de obtener como resultado el intervalo [x0 , x1 ] es
Z x1
p(x0 , x1 ) = dx |ψ(x)|2 .
x0

Postulado 4. El estado del sistema inmediatamente después de una medición es el autovector


correspondiente al autovalor obtenido.

Este postulado se refiere a un tipo particular de mediciones, las cuales se caracterizan en


la literatura moderna como medidas proyectivas no destructivas. En muchos casos, cuando se
mide el sistema, por ejemplo, cuando se detecta un fotón, este se absorbe; de manera que no
hay un estado que el sistema, puesto que no tenemos fotón al final de la medición. Ejemplo
de la medición del espı́n en el experimento de Stern-Gerlach.
¿Qué pasa si hay degeneración? El sistema queda en una superposición de los estados
que comparten el autovalor obtenido. Si el estado antes de la medición era ψ, los estados αij
satisfacen Aαij = ai αij , y en la medición se obtiene el autovalor ai , entonces el estado final
será,
1 X
√ (αij , ψ)αij ,
pi j

en donde la probabilidad pi de obtener el valor ai es la que da el postulado anterior. ¿Qué pasa


si los autovalores hacen parte del continuo? Si la medición da el intervalo [a0 , a1 ], entonces el
estado final será
Z a1
1
p da (α(a), ψ)α(a),
p(a0 , a1 ) a0
en donde, de nuevo, la probabilidad p(a0 , a1 ) es la que se calcula empleando el postulado
anterior. En particular, después de una medición de posición que arrojó como resultado el
intervalo [x0 , x1 ], el estado después de la medición es
1
p ψ(x)W (x0 , x1 ),
p(x0 , x1 )
en donde ψ(x) era el estado antes de la medición y W (a, b) es una función que es cero en
todas partes, excepto en el intervalo [x0 , x1 ], en el cual vale 1.
Relación con la regla de Lüder.

Mediciones de alguna manera indefinidas. Hay mediciones destructivas y otras que no lo


son. Aquellas del espectro en que hay transiciones son como mediciones no destructivas de
(cambios de) energı́a. En otros casos se absorbe un fotón por ejemplo.
Existe, finalmente, un postulado que habla de la evolución temporal de un sistema aislado.

Postulado 5. La evolución temporal del estado de un sistema aislado está dada por la
ecuación de Schrödinger
∂Ψ(x, t)
i~ = HΨ(x, t),
∂t
en donde H un operador hermı́tico lineal caracterı́stico del sistema, conocido como el Hamil-
toniano del sistema, y Ψ(x, t) es otra notación para ψt (x). .
22 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
2.5. Lectura del postulado de Estado
Schrödinger [36] interpreta el estado cuántico como un catálogo de posibles resultados.
Hay un debate actual: ¿el estado es óntico o es ontológico?
¿El estado cuántico describe un sistema único?
Sergei Winitzki anota que las teorı́as fı́sicas pueden suponer un conocimiento completo
o incompleto del estado de los sistemas fı́sicos. En el último caso, las teorı́as se denominan
estadı́sticas. La concepción usual de la mecánica cuántica supone que el estado del sistema
contiene la información completa del mismo. Albert Einstein, por ejemplo, tenı́a una concep-
ción de que la mecánica cuántica era una teorı́a efectiva. La teorı́a de Bohm-de Broglie de la
mecánica cuántica tiene presupuestos similares. Existen trayectorias, pero no son accesibles.
Además, dichas trayectorias dependen del estado cuántico del sistema.
Continúa Winitzki recordando que las teorı́as fı́sicas pueden ser deterministas o probabilis-
tas. Esta es una de las rupturas más importantes de la mecánica cuántica con respecto a otras
teorı́as, pues es probabilista. Este aspecto de la mecánica cuántica también fue duramente
criticado por Einstein, quien acuño la famosa frase “Dios no juega a los dados”.

1. Haga una lista (puede ser vacı́a) de palabras cuyo significado no conoce.
Entre las expresiones anotadas están: sharp distinction (distinción marcado), y ψ is
defined up to an overal phase (ψ se define hasta una fase general).

2. Haga una lista (puede ser vacı́a) de las oraciones que no entendió completamente y de
las dificultades que tuvo con cada una de ellas.
ψ(x, t) is properly defined as a function of x alone, and the parameter t serves merely
to label different vectors in H.
Olvidé decir que uno puede imaginarse una serie de vectores, uno por cada instante de
tiempo.

3. Haga una lista (puede ser vacı́a) de conceptos con los cuales no se encuentra familiari-
zado, o que no recuerda bien, y escriba cuales aspectos no recuerda bien.
No se recuerda bien el concepto de espacio de Hilbert.

4. Haga una lista (puede ser vacı́a) de notación matemática con la cual no se encuentra
familiarizado.

5. Sin apoyarse en el texto, escriba el postulado de estados en su propias palabras.

6. Sin apoyarse en el texto, escriba un resumen del texto en su propias palabras.

7. Identifique porciones del texto que le parezcan vagas o equivocadas. Escriba de manera
clara por qué tiene esa impresión.

8. Identifique porciones del texto para las cuales tenga evidencia o aportes no contenidos
en el texto, que apoyen el texto.
Se hace una discusión del papel de la teorı́a en la fı́sica, teniendo en cuenta que es una
ciencia que se basa en mediciones. Cuando medimos, comparamos con respecto a un
patrón. Ası́, las mediciones arrojan como resultado una serie de números con unidades.
Desde un punto de vista utilitario, el papel de la teorı́a es el de organizar los datos que se
obtienen de las observaciones, el de condensar la información referente a las mediciones.
Se procede a través de la modelación matemática de los sistemas fı́sicos. Se espera que
tal modelación sirva para predecir y manipular.
La teorı́a crea una contrapartida a los sistemas fı́sicos, que le asigna un sı́mbolo ma-
temático a cada “cosa” del sistema fı́sico, a través de unas reglas de traducción. Estas
2.5. LECTURA DEL POSTULADO DE ESTADO 23
reglas deben funcionar en los sentidos. Con frecuencia se modela un sistema fı́sico, se
manipulan los sı́mbolos siguiendo las reglas de la matemática y se obtienen nuevos enun-
ciados matemáticos, los cuales se traducen de vuelta a los sistemas fı́sicos, en donde se
convierte en enunciados sobre los sistemas mismos y no sobre sus sı́mbolos.

9. Haga el ejercicio 25. (Si ψ(x) tiene norma uno y |c|2 = 1, muestre que cψ(x) tiene norma
1).
2 2
10. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = e−x /x0 puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Basta normalizar la función de onda. La función de onda tiende a cero cuando x → ±∞.
¿Este requisito es necesario? Se muestra un ejemplo de función de onda de cuadrado
integrable que no tiende a cero cuando x → ±∞ (de hecho, estos lı́mites no existen para
esa función).

11. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = δ(x − x0 ) puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Razones a considera de por qué podrı́a ser una función de onda. Supongamos que se
mide la posición de la partı́cula y se encuentra en la posición x0 . La función δ(x − x0 )
¿describirı́a el nuevo estado del sistema? Objeción: cuando se mide nos quedarı́amos sin
sistema. Sin sistema, no hay estado. Tesis: existen mediciones no destructivas. Ejemplo:
suponga que se tiene un átomo de Hidrógeno en el estado |nmli = |210i en el vacı́o
electromagnético. Ası́, el estado total es |210i ⊗ |0i. Por evolución temporal, el sistema
quedará en una superposición de estados |Ψ(t)i = c1 |210i⊗|0i+c2 |100i⊗|1i , en donde
ci son coeficientes dependientes del tiempo. Si en un instante de tiempo se detecta un
fotón, entonces sabremos que el átomo se encuentra en el estado |100i. Este es un ejemplo
de medición no destructiva.
Esta función no puede normalizarse.
Objeción: Cuando se hacen mediciones de posición, lo que se obtiene es el valor espera-
do.
Réplica: No. Cuando se hacen muchas mediciones, se pueden obtener no solo los momen-
tos estadı́sticos, sino también la distribución de probabilidad. Sin embargo, basta una
medición para hacer una preparación. Según Gillespie [37], tenemos que ((Postulate 4.
A measurement of an observable generally causes a drastic, uncontrollable alteration in
the state vector of the system; specifically, regardless of the form of the state vector just
before the measurement, immediately after the measurement it will coincide with the
eigenvector corresponding to the eigenvalue obtained in the measurement.))
Objeción: Esta función no describe un estado porque viola el principio de incertidumbre
de Heisenberg.
Réplica: No puede decirse que haya violación del principio de incertidumbre, porque el
producto de desviación estándar nula (en posición) por una desviación estándar infi-
nita (en momento) no está bien definido. Por otra parte, dentro del formalismo de la
mecánica cuántica, el principio de incertidumbre es una consecuencia de los postulados.
¿Cuáles son las suposiciones que llevan al principio de incertidumbre? Hay funciones de
onda normalizables que no tengan desviación estándar bien definida? (Lorentziana)
Algunas de las alternativas que podemos considerar son las siguientes.

a) El postulado 4 es falso.
24 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
b) El postulado 1 no es necesario, en el sentido de que se podrı́an tener funciones
de ondas no normalizables. En este caso, tal vez sea necesario inventar o usar
otras matemáticas. Según Gillespie [37] ((Postulate 1. Every possible physical
state of a given system corresponds to some normed Hilbert space vector ψ(x),
and conversely, every normed Hilbert space vector ψ(x) corresponds to a possible
physical state of the system. This correspondence between physical states and
normed vectors in H is one-to-one, except that two normed H-vectors that differ
only by an overall scalar factor of modulus unity correspond to thesame physical
state. The particular H-vector to which the state of the system corresponds at time
t is denoted by Ψt (x) and is called the state vector of the system; the system is
said to “be in the state Ψt (x).” The state of a system is completely described by
the state vector in the sense that anything which is in principle knowable about
the system at time t can be learned from the function Ψt (x).))
c) Una medición no puede dar como resultado x = x0 .

Como insumos para la discusión se sugiere considerar cómo se miden posiciones en


mecánica cuántica. También se sugiere recordar el experimento mental del microscopio
de Heisenberg.
Tarea: Haga una descripción mecano-cuántica del decaimiento 137 Cs → β + + 137 Ba +ν.
¿Este decaimiento se podrı́a usar para hacer mediciones no destructivas?
Tarea: Describa matemáticamente la luz de un láser verde mostrado en clase.
Continuous measurements.

12. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas se encontró con
el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas planas
unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para
que la nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii)
muestre que no se puede arreglar.
La función eikx es una autofunción no normalizable de la partı́cula libre. Se usa en la
teorı́a de scattering. Se puede definir en una caja, de manera que ahora está normalizada
(esto se hace en estado sólido).

13. Escriba una función que describa el estado cuántico de una partı́cula tridimensional.
Muestre que dicha función puede escribir un estado cuántico.

14. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene espı́n hacia arriba
y espı́n hacia abajo. Escriba el estado más general de una partı́cula de espı́n 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan
como vectores columna.
Considere los estados
 
1 1 1 1
|ψ1 i = cos φ ,
+ sin φ , −
2 2 2 2
 
1 1 iθ
1 1
|ψ2 i = cos φ ,
+ e sin φ , − .
2 2 2 2

¿Uno de ellos es más general que el otro? ¿La fase θ es una fase total? Si no lo es,
¿qué información fı́sica contiene?, ¿en qué experimento aparece esa información?

15. Escriba el estado más general de dos partı́culas de espı́n 1/2, tanto en el formalismo de
Dirac como en el formalismo en el que los estados se representan como vectores columna.
2.5. LECTURA DEL POSTULADO DE ESTADO 25
16. Escriba un estado de dos partı́culas cuánticas tridimensionales. Muestre que dicha fun-
ción puede escribir un estado cuántico.
17. Escriba un estado posible de un electrón. Muestre que dicha función puede escribir un
estado cuántico.
18. ¿Cómo se puede saber si un sistema está en un estado particular?
19. ¿Se puede medir el estado de un sistema? En este sentido, ¿qué es el estado de un
sistema? ¿Qué es la tomografı́a cuántica?

20. ¿El estado cuántico describe un único sistema?


21. En mecánica (estadı́stica) clásica se pueden tener estados canónicos. Y, ¿en la cuántica?
22. Considere un gas de átomos de plata a una temperatura de unos 1000 ◦C, como en el
experimento de Stern-Gerlach. Escriba el estado de espı́n de los átomos de plata. Escriba
el estado espacial de los átomos de plata. Explique cómo interpretó el enunciado. Haga
un análisis del lı́mite clásico.
23. Considere un sistema compuesto por dos espines con s = 12 . El estado del sistema es

|ψi = sin α |++i + cos α |−−i , (2.10)

en donde |+i y |−i son los autovectores de σz con autovalores 1 y -1, respectivamente.
Suponga que quiere calcular los valores esperados correspondientes a σx , σy y σz del
primer espı́n. Manipule las expresiones hasta que pueda escribirlas como

hσi i = Tr (σi a) , i = x, y, z. (2.11)

Encuentre a. Desde el punto de vista matemático, ¿qué tipo de objeto es a? ¿Existe


algún valor de α para el cual los valores esperados hσi i sean todos iguales a cero?
26 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Capı́tulo 3

Polarización: descripción clásica

En este capı́tulo, después de introducir la noción de polarización para cuerdas vibrantes,


vamos a generalizarla para campos electromagnéticos clásicos. Comenzamos haciendo una
revisión tanto de la ecuación de ondas para las cuerdas vibrantes como de algunas de sus
soluciones. Enseguida introducimos la noción de polarización para ondas en cuerdas vibran-
tes. Después de deducir la ecuación de ondas para los campos electromagnéticos, vamos a
emplear la aproximación paraxial con el fin de hallar una solución particular de esta ecuación.
La luz emitida por un láser se puede describir razonablemente bien mediante la solución ha-
llada. Además de describir como se puede evidenciar la polarización desde un punto de vista
fenomenológico, discutimos algunoes estados especiales de polarización.
Desde el punto de vista de las matemáticas empleadas, vamos a hallar algunas soluciones
de una ecuación diferencial parcial y a introducir un espacio vectorial complejo. Se emplearán
algunas identidades vectoriales y la regla de la cadena. El cálculo vectorial puede omitirse
en una primera aproximación al tema. Necesitaremos otros conceptos como la segunda ley
de Newton para partı́culas puntuales, expansiones en parámetros pequeños y expansión de
Taylor.
Presentar la cuerda vibrante es interesante porque recuerda métodos matemáticos que se
van a usar más adelante en el curso, presenta la polarización en un marco en el cual esta es
visible.

3.1. La cuerda vibrante


Definimos una cuerda como un objeto unidimensional en el cual no existen interacciones a
distancia, sino únicamente una interacción de contacto. Las cuerdas reales, por supuesto, no
satisfacen estas suposiciones simplificadoras, entre otras cosas porque en escala nanoscópica
aparecen efectos atómicos. Además, las fuerzas interatómicas son principalmente de origen
electromagnético, las cuales son de largo alcance. A pesar de todo, podemos usar como hipóte-
sis de trabajo, que las suposiciones simplificadoras enunciadas arriba son tan razonables, que
el comportamiento predicho por este modelo se aproxima bastante bien al de algunas cuerdas
delgadas reales. Una cuerda es delgada si todas sus secciones transversales son tales que la
distancia entre dos puntos cualesquiera de cada sección es mucho menor que su longitud.
En la referencia [48] se revisan dos derivaciones de las ecuaciones de movimiento de una
cuerda y las suposiciones asociadas. Para una derivación más rigurosa puede leer el artı́culo
[49] o la sección 2.4 del libro [50]. En reposo, pero templada, la cuerda se extiende sobre el
eje x, de x = 0 a x = L, y estos dos puntos permanecen fijos. Aunque vamos a considerar
vibraciones a lo largo de los ejes x, y y z, inicialmente supondremos que la cuerda no hace
excursiones en y. Esta es una suposición importante ya que, en general, la excursiones de
la cuerda tendrán una componente longitudinal. De hecho, a través de videos, por ejemplo,

27
28 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
podrı́a verificarse la validez de esta suposición en el montaje clásico de ondas estacionarias
en cuerdas (experimento de Melde). Es razonable tener en cuenta únicamente la tensión y no
el peso (total de la cuerda), si la magnitud del último es mucho menor que la magnitud de
la primera. También vamos a suponer que las excursiones de la cuerda son pequeñas, en un
sentido que se precisará en la derivación.
Usamos un método elemental para encontrar la ecuación de movimiento de la cuerda.
Tomemos un segmento de cuerda genérico, conforme se muestra en la figura 3.1. Las coorde-
nadas de los extremos izquierdo y derecho de dicho segmento son, respectivamente, (x, y(x))
y (x + ∆x, y(x + ∆x)). La tensión que ejerce el segmento de cuerda inmediatamente anterior
(posterior) sobre el segmento analizado es T 1 (T 2 ). En la figura se ha tenido en cuenta que la
cuerda es perfectamente flexible y, por lo tanto, la fuerza de contacto entre partes adyacentes
de la cuerda es tangente a la curva que describe la cuerda.

Figura 3.1: Cuerda con extremos fijos. En el detalle, fuerzas que actúan sobre un segmento in-
finitesimal de cuerda. Nicoguaro [CC BY 4.0 ([Link]
from Wikimedia Commons.

La segunda ley de Newton para un cuerpo puntual es F = ma, donde F es la fuerza


externa neta que actúa sobre él, m su masa y a su aceleración. Vamos a suponer que toda
la masa se encuentra concentrada en el punto (x + ∆x ∆x
2 , y(x + 2 )). La tensión T 1 (T 2 ) es la
fuerza de contacto que le ejerce el segmento de curva inmediatamente anterior (posterior). A
partir de la figura vemos que F es igual a
F = T 1 + T 2 = −T1 cos αex + T1 sin αey + T2 cos βex − T2 sin βey . (3.1)
Para determinar la masa vamos a tener en cuenta que supusimos que las vibraciones son
transversales. En reposo, el segmento de cuerda de cuerda analizado estarı́a sobre el eje x,
entre x y x + ∆x. Si ∆x es suficientemente pequeño, la densidad en reposo de ese segmento
puede considerarse uniforme e igual a ρ(x + ∆x
2 ); por lo tanto, la masa del segmento es igual
a  
∆x
m=ρ x+ ∆x. (3.2)
2
Vale la pena insistir en que ρ(x + ∆x
2 ), de la ecuación (3.1) es la densidad en reposo de la
cuerda; por lo tanto, no cambia en el tiempo. Finalmente, calculemos la aceleración a del
3.1. LA CUERDA VIBRANTE 29
segmento. Como hemos supuesto vibraciones transversales, a solamente puede estar dirigida
a lo largo del eje y. Como y(x+ ∆x
2 ) es la posición del (centro de masa del) segmento de cuerda,
su segunda derivada temporal es su aceleración. Esto quiere decir que debemos escribir y(x, t)
(y(x, t) si hablamos del centro de masa del segmento), puesto que la excursión del segmento
a lo largo del eje y no depende únicamente de su posición a lo largo del eje x, sino también
del tiempo. Ası́, tenemos que
∂ 2 y(x + ∆x
2 , t)
a= ey . (3.3)
∂t2
Sustituyendo las tres cantidades en la segunda ley de Newton tenemos

∂ 2 y(x + ∆x
 
∆x 2 , t)
−T1 cos αex +T1 sin αey +T2 cos βex −T2 sin βey = ρ x + ∆x ey . (3.4)
2 ∂t2
La suposición de que las vibraciones son pequeñas se expresa matemáticamente como
α, β  1, de manera que cos α ≈ cos β ≈ 1, y por tanto, T1 = T2 = T. Empleando esta
igualdad en la ecuación de movimiento a lo largo del eje y,

∂ 2 y(x + ∆x
 
∆x 2 , t)
T sin α − T sin β = ρ x + ∆x . (3.5)
2 ∂t2
vemos que el lado derecho es de orden ∆. Por otro lado, el lado izquierdo también es de
ese orden, como se ve un poco más adelante. Teniendo en cuenta que α es ángulos pequeño,
sin α ≈ tan α. Esta última cantidad es la tangente a la curva y(x, t), es decir,

∂y(x, t)
tan α = . (3.6)
∂x
De manera semejante,
∂y(x + ∆x, t)
sin β ≈ tan β = , (3.7)
∂x
en donde tuvimos en cuenta que tan β es la tangente a la curva en el punto x + ∆x. Expan-
diendo a primer orden en ∆x tenemos

∂y(x, t) ∂ 2 y(x, t)
sin β ≈ + ∆x . (3.8)
∂x ∂x2
Usando este resultado en la ecuación (3.5), tenemos

∂ 2 y(x, t) ∂ 2 y(x + ∆x
 
∆x 2 , t)
∆xT 2
= ρ x + ∆x 2
. (3.9)
∂x 2 ∂t
Finalmente, expandiendo el lado derecho a primer orden en ∆x y cancelando el factor común,
obtenemos la ecuación de ondas
∂ 2 y(x, t) ∂ 2 y(x, t)
T = ρ (x) . (3.10)
∂x2 ∂t2
Recapitulando, si se suponen vibraciones puramente transversales en una única dirección,
tangentes a la cuerda pequeñas y se toma en cuenta únicamente la tensión, las vibraciones
satisfacen la ecuación de ondas (3.10).
Para vibraciones también a lo largo de z, bajo las mismas suposiciones encontramos eq-
cuciones de onda análogas, como se muestra en la derivación que hacemos enseguida.
Para extender este resultado, vamos a usar un marco más general. Describimos la cuerda
en un tiempo t mediante la ecuación paramétrica

r(ξ, t) = x(ξ, t)ex + y(ξ, t)ey + z(ξ, t)ez , (3.11)


30 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
en donde ξ es un parámetro tal que la cuerda templada en reposo se describe por ξex , 0 ≤
ξ ≤ L. Veamos a llamar T (ξ, t) a la fuerza de contacto que el segmento de cuerda a la derecha
de ξ le ejerce al segmento a la izquierda de ξ. La tercera ley de Newton nos dice, entonces,
que −T (ξ, t) es la fuerza de contacto que el segmento de cuerda a la izquierda de ξ le ejerce
al segmento a la derecha de ξ. Teniendo en cuenta que la masa de un segmento de cuerda que
2
en reposo se extiende de ξ a ξ + ∆ξ es ρ(ξ + ∆ξ/2)∆ξ y que su aceleración es ∂ r(ξ+∆ξ/2,t)
∂t2 ,
vemos que la segunda Ley de Newton es

∂ 2 r(ξ + ∆ξ/2, t)
ρ(ξ + ∆ξ/2)∆ξ = −T (ξ, t) + T (ξ + ∆ξ, t), (3.12)
∂t2
en donde hemos supuesto que si existen fuerzas diferentes a la tensión, son pequeñas con
relación a esta. Expandiendo a primer orden en ∆ξ y cancelando el factor común, encontramos
la ecuación de ondas
∂ 2 r(ξ, t) ∂T (ξ, t)
ρ(ξ) = . (3.13)
∂t2 ∂ξ
Hasta ahora no hemos tenido en cuenta que, como la cuerda es perfectamente flexible (no
ofrece resistencia a que se doble), la fuerza de contacto T (ξ, t) debe estar dirigida en la
dirección de la tangente a la curva, es decir,
∂r(ξ,t)
∂ξ
∂r(ξ,t) .
T (ξ, t) = T (ξ, t) (3.14)
∂ξ

Si las vibraciones son puramente transversales, entonces la cuerda se puede describir por la
curva ξex +y(ξ, t)ey +z(ξ, t)ez y su tangente será ex + ∂y(ξ,t) ∂z(ξ,t)
∂ξ ey + ∂ξ ez . Por otro lado, si las
vibraciones son pequeñas, se cumple que ∂y(ξ,t)
∂ξ  1 y ∂z(ξ,t)
∂ξ  1. Ası́, podemos aproximar
la tensión por  
∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T (ξ, t) ex + ey + ez . (3.15)
∂ξ ∂ξ
Con estas consideraciones, la componente x de la ecuación de la cuerda es

∂T (ξ, t)
0= , (3.16)
∂ξ

cuya solución es T (ξ, t) = T (t). Suponiendo que esta tensión no se cambia (como en el caso
del experimento de Melde), tenemos que T (ξ, t) = T. Ası́, la fuerza de tensión es
 
∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T ex + ey + ez , (3.17)
∂ξ ∂ξ

y la ecuación de ondas toma la forma

∂ 2 r(ξ, t) ∂ 2 y(ξ, t) ∂ 2 z(ξ, t)


 
ρ(ξ) =T ey + ez . (3.18)
∂t2 ∂ξ 2 ∂ξ 2

La ecuación de ondas en z es de la misma forma de la ecuación de ondas en y. Como no


consideramos ondas longitudinales (a lo largo de x), podemos cambiar la notación y emplear
x en vez de ξ.

3.1.1. Controversia sobre la solución


La descripción de la cuerda vibrante, durante el siglo XVIII, fue una fuente de grandes
controversias entre diferentes puntos de vista, los cuales se pueden caracterizar, según Wheeler
3.1. LA CUERDA VIBRANTE 31
y Crummett [51], como correspondientes al matemático (Jean le Rond d’Alembert), al fı́sico
(Daniel Bernoulli) y al fı́sico-matemático (Leonard Euler). El punto de partida de esta discu-
sión era la ecuación de ondas (3.10) en
p el caso que la densidad lineal de masa ρ(x) es constante
y la velocidad de las ondas es c = T /ρ.. El problema era el concepto de función y su re-
lación con la forma de una cuerda vibrante. [52] Mientras d’Alembert consideraba solamente
funciones diferenciables, Euler proponı́a funciones con esquinas como aquella que se obtiene
al pulsar una cuerda. Por su parte, Bernoulli, atendiendo a la observación de que las cuerdas
se pueden escuchar, abogaba por funciones definidas por series trigonométricas. d’Alembert
se oponı́a a la solución de Euler porque su primera derivada es discontinua y, por lo tanto,
no se puede definir la segunda derivada. Ası́, la ecuación diferencial pierde sentido, al menos
en los puntos de discontinuidad de la primera derivada. Euler adujo que las funciones con
esquinas pueden aproximarse por funciones infinitamente diferenciables, tan próximas como
se quiera. d’Alembert y Euler criticaron la solución de Bernoulli porque habı́an encontrado
una enorme riqueza en la forma de las soluciones, que creı́an que no era posible de capturar en
una serie trigonométrica, aún si dicha serie fuese infinita. [53] La intuición fı́sica de Bernoulli
ganó reconocimiento matemático después de los trabajos de Joseph Fourier, sobre la ecuación
del calor [54] y de Dirichlet sobre la convergencia de las series de Fourier. [55] Por otro lado, el
cálculo diferencial se extendió a funciones como la que Euler propuso y a otras más singulares,
conocidas como funciones generalizadas o distribuciones temperadas [52].

3.1.2. Solución de d’Alembert


En 1747 d’Alembert publicó, además de la derivación de la ecuación de ondas, su solución,
[56, 57] la cual presentamos enseguida en lenguaje moderno. Suponiendo que la densidad
lineal de masa ρ(x) es constante, la ecuación de ondas toma la forma usual

∂ 2 y(x, t) 1 ∂ 2 y(x, t)
2
= 2 , (3.19)
∂x c ∂t2
p
en donde definimos c = T /ρ..
Hagamos un cambio de variables.
1 1
ξ = x + ct, η = x − ct; x= (ξ + η) t = (ξ − η) (3.20)
2 2c
Usando la regla de la cadena tenemos
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = + , (3.21)
∂ξ ∂ξ ∂x ∂ξ ∂t 2 ∂x 2c ∂t
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = − . (3.22)
∂η ∂η ∂x ∂η ∂t 2 ∂x 2c ∂t
Ahora, si calculamos

∂2 1 ∂2
  
∂ ∂ ∂ 1 ∂ ∂ 1 ∂
4 = + − = − , (3.23)
∂ξ ∂η ∂x c ∂t ∂x c ∂t ∂x2 c2 ∂t2
vemos que la ecuación de ondas, en las nuevas variables se escribe

∂ 2 y(ξ, η)
4 = 0. (3.24)
∂ξ∂η
Integrando con respecto a ξ obtenemos
∂y(ξ, η)
= g1 (η). (3.25)
∂η
32 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Ahora, integrando con respecto a ξ tenemos
Z
y(ξ, η) = dη g1 (η) + f (ξ) = f (ξ) + g(η). (3.26)

Volviendo a las variables originales, encontramos la solución general

y(x, t) = f (x + ct) + g(x − ct). (3.27)

Veamos la naturaleza de ls funciones f y g. Tomemos f (x + ct) en un instante de tiempo


t > 0 y comparémosla con f (x), la función en el instante inicial t = 0. Si tomamos un punto
arbitrario x0 , el valor de la función será f (x0 ). Este mismo valor se obtendrá en el punto
x0 − ct < x0 , desigualdad válida para tiempo positivos. Esto quiere decir que la función
está viajando hacia valores negativos de x, hacia la izquierda con rapidez c. De manera
semejante, podemos ver que g(x − ct) describe ondas que viajan a la derecha con rapidez c.
A las funciones f (x + ct) y g(x − ct) se les denomina ondas viajeras.
Hasta ahora no hemos tenido en cuenta la suposición de extremos fijos de la cuerda y(0, t) =
0 = y(L, t). Primero vamos a usar el hecho de que una función de una variable siempre
puede escroibirse como la suma de una función par y de otra impar. Ası́, podemos escribir
y(x, t) = fP (x + ct) + fI (x + ct) + gP (x − ct) + gI (x − ct), en donde fP (−z) = fP (z),
gP (−z) = gP (z), fI (−z) = fI (z), y gI (−z) = −gI (z). En x = 0 deberı́an cumplirse las
condiciones

fP (ct) + gP (−ct) = fP (ct) + gP (ct), gP (ct) = −fP (ct), (3.28)


fI (ct) + gI (−ct) = fI (ct) − gP (ct), gI (ct) = fI (ct). (3.29)

Ası́, la solución general se puede escribir como

y(x, t) = fP (x + ct) − fP (x − ct) + fI (x + ct) − fI (x − ct). (3.30)

También deben cumplirse las condiciones en x = L. Como la solución debe cumplirse en el


intevalo [0, L], podemos extender la función fuera de ese intervalo a conveniencia. Por ejemplo,
podemos exigir que la función extendida sea periódica. Dado que la función tiene una parte
impar, y que y(0, t) = y(L, t), el periodo mı́nimo es 2L. Recapitulando, la solución general es
de la forma (3.30) en donde las funciones f son periódicas de periodo 2L, tales que fI (L) = 0.
Jean le Rond d’Alembert, el mismo del principio de d’Alembert y los equinoccios, quien
ocupa la silla de “el matemático”, derivó la ecuación de ondas (3.10) en el caso ρ(x) = T y
mostró que la solución general es y(x, t) = f (x + ct) + g(x − ct). D’Alembert exigı́a que f
fuese periódica, impar y diferenciable en todas partes.
EJERCICIO 31. Demostrar que, en el caso de un cuerda con condiciones periódicas
y(0, t) = y(L, t), la solución de D’Alembert se reduce a y(x, t) = f (x + ct) + f (x − ct) =
f (ct + x) − f (ct − x).

3.1.3. Solución de Euler


Leonard Euler, uno de los matemáticos más prolı́ficos, mostró que la solución puede escri-
birse en términos de la posición inicial de la cuerda, Y (x, y de su velocidad, V (x). En efecto,
si hacemos t = 0 en la expresión y(x, t) = f (x + ct) + g(x − ct),

Y (x) = f (x) + g(x). (3.31)

Por otro lado, derivando cada término de y(x, t) = f (x + ct) + g(x − ct) con respecto a su
argumento, y tomando t = 0, encontramos la identidad

df (z) dg(z)
V (x) = c −c . (3.32)
dz z=x dz z=x
3.1. LA CUERDA VIBRANTE 33
Cambiando x por ξ e integrando (3.32) sobre ξ en el intervalo de 0 a x, la ecuación corres-
pondiente puede escribirse como

1 x
Z
f (x) − g(x) = dξ V (ξ). (3.33)
c 0

Sumando y restando (3.31) y (3.33) podemos hallar f y g como

1 x 1 x
 Z   Z 
1 1
f (x) = Y (x) + dξ V (ξ) , g(x) = Y (x) − dξ V (ξ) . (3.34)
2 c 0 2 c 0

Finalmente, recordando que la primera función tiene como argumento x + ct, y que la segunda
como argumento x − ct, la solución general será

y(x, t) = f (x + ct) + g(x − ct) (3.35)


1 x+ct 1 x−ct
 Z   Z 
1 1
= Y (x + ct) + dξ V (ξ) + Y (x − ct) − dξ V (ξ)
2 c 0 2 c 0
1 x+ct
 Z 
1
= Y (x + ct) + Y (x − ct) + dξ V (ξ) .
2 c x−ct

La controversia aludida en la sección 3.1.1 se inició cuando Euler permitió que Y y V no fuesen
funciones en el sentido ordinario, sino curvas que se pueden dibujar a mano, en particular,
curvas con esquinas, tales como la cuerda pulsada.

3.1.4. Solución de Bernoulli-Fourier


La solución intuida por Bernoulli demoró en ser formalizada, a pesar de que investigadores
como Lagrange estuvieron muy cerca de obtenerla. Este método, el de separación de variables,
se basa en la siguiente observación. Sean y1 (x, t) y y2 (x, t) dos soluciones de la ecuación de
ondas, entonces la combinación lineal de las soluciones, c1 y1 (x, t) + c2 y2 (x, t), en donde c1 y c2
son coeficientes, también es una solución de la ecuación de ondas. Esta condición es verdadera,
no solo para la ecuación de ondas, sino para todas las ecuaciones diferenciales lineales. Las
condiciones de frontera también deben ser lineales: si dos soluciones diferentes satisfacen las
condiciones de frontera, la combinación lineal de las mismas también debe satisfacerla.
Debemos encontrar todas las soluciones que sean un producto de funciones

y(x, t) = X(x)T (t). (3.36)

La solución general es la combinación lineal de las soluciones. Las condiciones de frontera


deben aplicarse; este paso implica ciertas relaciones entre coeficientes. Sustituyendo en la
ecuación de ondas (3.19) y dividiendo por X(x)T (t) obtenemos

1 d2 X(x) 1 d2 T (t)
= . (3.37)
X(x) dx2 c2 T (t) dt2

Como un lado es función solo de x y el otro solo de t, la igualdad se cumple cuando cada lado
es igual a una constante:

d2 X(x) d2 T (t)
= λX(x). = c2 λT (t). (3.38)
dx2 dt2
Las soluciones a la ecuación de X(x) se pueden buscar haciendo el Ansatz X(x) = eax ,

dX(x) d2 X(x)
= aeax , = a2 eax = λX(x) = λeax . (3.39)
dx dx2
34 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
√ √
Se debe cumplir la igualdad a2 = λ, por lo cual se tiene a = λ o√a = − √λ. Las soluciones
independientes a la ecuación

diferencial

de X(x) son, por lo tanto, e λx y e− λx , y su solución
general es X(x) = Ae λx + Be− λx Notemos, sin embargo que, si λ = 0 ambas soluciones
2
colapsan en una, X(x) = 1. En ese caso, es mejor volver a la ecuación original d dx X(x)
2 =0e
integrarla dos veces,
dX(x)
= A, X(x) = Ax + B, (3.40)
dx
siendo A y B constantes. Ası́, las dos soluciones independientes son X(x) = 1 y X(x) = x.
Otro
√ hecho
p que debemos notar es que λ puede ser positivo o negativo. En ese último caso,
λ = i |λ|.
Las soluciones a la ecuación diferencial para T (t) son completamente análogas a aquellas
para X(x), es decir, T (t) = Ct + D, C y D constantes, si λ = 0 y
√ √
T (t) = Cec λt
+ De−c λt
, (3.41)

si λ 6= 0. Hemos encontrado las soluciones cuando λ = 0,

y(x, t) = (Ax + B)(Ct + D), (3.42)

y cuando λ 6= 0, √ √ √ √
y(x, t) = (Ae λx
+ Be− λx
)(Cec λt
+ De−c λt
), (3.43)
El siguiente paso es escontrar vı́nculos entre las constantes de la solución general, que
aparecen cuando se aplican las condiciones de frontera y(0, t) = 0 = y(L, t). Vemos que las
condiciones restringen las funciones de x. En efecto, deben cumplirse las igualdades

y(0, t) = B(Ct + D) = 0, y(L, t) = (LA + B)(Ct + D) = 0, (3.44)

si λ = 0 y
√ √
y(0, t) = (A + B)(Ce λt
+ De− λt
) = 0, (3.45)
√ √ √ √
y(L, t) = (Ae λL
+ Be− λL
)(Cec λt
+ De−c λt
) = 0, (3.46)

si λ 6= 0. Como se notó previamente, podemos concentrarnos únicamente en la partes espacial


(es decir, podrı́amos haber escrito las condiciones de frontera como X(0) = 0 = X(L).)
Ahora, de la primera igualdad de (3.44) encontramos B = 0. Usando este valor en la
segunda igualdad, se tiene AL = 0, es decir, A = 0. En estas condiciones, la solución es trivial
y(x, t) = 0. Decimos que no hay soluciones (no triviales) si λ = 0.
Enseguida consideramos λ 6= 0. La solución a la ecuación (3.45) es B = −A. La ecuación
(3.46) se convierte en √ √ √
A(e λL − e− λL ) = 0 = 2A sinh( λL). (3.47)
Como el único cero (real) de la función seno hiperbólico es cero (sinh 0 = 0,) parecerı́a que la
ecuación (3.47) tampoco tiene soluciones no triviales. Sin embargo, recordemos que λ puede
ser negativo. En ese caso podemos escribir
√ √ √
A(ei −λL − e−i −λL ) = 0 = 2iA sin( −λL), (3.48)

en donde hicimos uso de la identidad de de Moivre, eix = cos x + i sin x. Esta ecuación
claramente tiene soluciones no triviales, pues la función sin x tiene cero en x = nπ, siendo n un
entero positivo (n = 0 da la solución trivial y, como la función seno es impar, las soluciones con
√ 2 2
n y −n no son independientes). Ası́, las soluciones corresponden a −λL = nπ, λn = − nLπ2 ,
en donde se le ha agregado a λ una etiqueta (n).
3.1. LA CUERDA VIBRANTE 35
Las soluciones no triviales completas tienen en cuenta la parte temporal y se escriben
como  nπx  nπc nπc
yn (x, t) = 2iA sin (Cei L t + De−i L t ). (3.49)
L
Tanto la parte real como la parte imaginaria de (3.49) son soluciones; es decir,
 nπx   nπc 
yn1 (x, t) = sin cos t (3.50)
L L
como  nπx   nπc 
yn2 (x, t) = sin sin t (3.51)
L L
son las soluciones buscadas. Cada una de esta soluciones corresponde a una onda estacionaria,
ya que la onda no avanza sino que permanece en el mismo lugar (sin embargo, su amplitud
instantánea sı́ cambia). Las funciones sin(nπx/L) describen los llamados modos normales; el
primero se conoce como el modo fundamental, y los demás como modos excitados (también
conocidos como armónicos del modo fundamental).
Ahora, la solución general de la ecuación de ondas es la combinación lineal de todas las
soluciones encontradas, es decir,

X
y(x, t) = (An yn1 (x, t) + Bn yn2 (x, t)) . (3.52)
n=1

De manera más explı́cita, la solución general de la cuerda vibrante (para vibraciones trans-
versales a lo largo de y) es
∞ 
X  nπx   nπc   nπx   nπc 
y(x, t) = An sin cos t + Bn sin sin t , (3.53)
n=1
L L L L

en donde las constantes An y Bn deben determinarse. Bernoulli intuyó esta solución, pero
no consideró los términos asociados a Bn (corresponde a velocidad inicial nula). Además, no
mostró cómo podrı́an encontrarse los coeficientes An .
Para completar la solución de Bernoulli, debemos mostrar como hallar los coeficientes An
y Bn , suponiendo que conocemos la posición inicial de la cuerda Y (x) y su velocidad V (x).
Haciendo t = 0 en la solución, encontramos

X  nπx 
y(0, t) = An sin = Y (x). (3.54)
n=1
L

Vamos a usar las integrales


Z L  nπx  Z π
Ldu
sin2 dx = sin2 (nu) (3.55)
0 L 0 π
L π
Z
L
= (1 − cos(2nu)) du = ,
2π 0 2
Z L  nπx   mπx  Z π
Ldu
sin sin dx = sin(nu) sin(mu) (3.56)
0 L L 0 π
L π
Z
= (cos((m − n)u) − cos((m + n)u)) du = 0.
2π 0
En la ecuación (3.56) se supuso m 6= n. Las integrales de los cosenos son cero porque se
hace un promedio sobre un número entero de periodos. Multiplicando la ecuación (3.54) por
sin mπx

L e integrando sobre x tenemos
Z L  mπx  X∞  nπx  Z L  mπx 
dx sin An sin = dx sin Y (x). (3.57)
0 L n=1
L 0 L
36 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Suponiendo que podemos intercambiar la suma y la integral, y teniendo en cuenta las dos
integrales de arriba, vemos que casi todas las integrales del lado izquierdo de la ecuación son
cero, excepto aquella para la cual n = m.
Z L
L  mπx 
Am = dx sin Y (x). (3.58)
2 0 L

Ası́, tenemos la expresión para los coeficientes An . Para encontrar los coeficientes Bn , se
procede de forma similar. Se deriva la solución con respecto al tiempo, se hace t = 0, y se
iguala a la velocidad inicia conocidal. Luego se multiplica por sin nπx

L y se usan las integrales
(3.55) y (3.56). El resultado final es


!
Z L 
X 2 mπξ  nπx   nπc 
y(x, t) = dξ sin y(ξ, 0) sin cos t (3.59)
n=1
L 0 L L L
∞ Z L   !
X 2 mπξ ∂y  nπx   nπc 
+ dξ sin (ξ, 0) sin sin t ,
n=1
nπc 0 L ∂t L L

EJERCICIO 32. Encontrar los coeficientes Bn de la soliución de Bernoulli-Fourier. Ve-


rificar la solución de Bernoulli-Fourier (3.59) y corregirla si fuese necesario.

3.2. Polarización en cuerdas


En la sección anterior estudiamos la cuerda vibrante haciendo algunas aproximaciones y
encontramos varias formas de la solución. Aunque no desarrollamos explı́citamente las solu-
ciones de la cuerda vibrante tensada a lo largo del eje x que hace pequeñas excursiones tanto
en el eje y como en el eje z, no es difı́cil ver que son del tipo

X  nπx   nπc  ∞
X  mπx   mπc 
r(x, t) = An sin cos t + φn e y + Bm sin cos t + χm ez ,
n=1
L L m=1
L L

en donde An , Bm , φn y χm son constantes (notar que An y Bm no son iguales a aquellas de


la sección anterior).

Figura 3.2: Figuras de Lissajou para ondas de igual amplitud, una de ellas con frecuencia
igual al doble de la otra.
3.2. POLARIZACIÓN EN CUERDAS 37
Para analizar una situación más sencilla que la solución general, consideremos solo un
término de cada suma,
 nπx   nπc   mπx   mπc 
r(x, t) = An sin cos t + φn ey + Bm sin cos t + χm ez .
L L L L
Si tomamos un punto particular x = x0 , podemos escribir

e0 cos nπc t + φn ey + Be0 cos mπc t + χm ez .


   
r(x0 , t) = A
L L
Hemos agregado el subı́ndice 0 para recordar que la amplitud relativa de las dos ondas depen-
den del punto x0 . Haciendo una traslación temporal podemos presentar la ecuación anterior
en la forma
e0 cos nπc t̃ ey + Be0 cos mπc t + δ ez .
   
r(x0 , t̃) = A
L L
Estas son las ecuaciones que estudiaron Nathaniel Bowditch en 1815 y Jules Antoine Lissajous
en 1857 y que producen las llamadas curvas de Bowditch o figuras de Lissajous. En la figura
3.2 se ven dos ejemplos correspondientes a amplitudes A0 y B0 iguales y una de las frecuencias
igual al doble de la otra. Estos ejemplos, sin embargo, no son los que más nos interesan. Nos
concentraremos en el caso en el cual ambas frecuencias son iguales,

e cos nπc t + δ ez .
e cos nπc t̃ ey + B
   
r(x0 , t̃) = A
L L
El lector atento habrá notado que hemos omitido el subı́ndice de las constantes A y B. Esta
omisión se debe a que la amplitud relativa de las dos ondas no depende del punto particular
x0 (siempre y cuando la onda no se anule en el punto escogido), aunque las amplitudes
absolutas sı́. Esto se debe a que, si multiplicamos ambas amplitudes por el mismo factor, la
curva obtenida es la misma, ampliada o reducida. Con el fin de crean un patrón, vamos a
considerar casos en los cuales A e2 + B
e > 0, eb > 0 y A e 2 = 1. Una manera de parametrizar es
A e = sin α, 0 ≤ α ≤ π, de modo que
e = cos α, B

r(t) = cos α cos (ωt) ey + sin α cos (ωt + δ) ez ,

en donde hemos definido ω = nπc L . Comencemos analizando el caso δ = 0.


Vemos que todas las figuras de Lissajous son lı́neas rectas de longitud 1, las cuales forman
un ángulo θ con el eje horizontal positivo. Hemos incluido un caso con θ > π/2, para ilustrar la
rotación de la lı́nea recta como función del ángulo θ. En realidad, las otras figuras de Lissajous
lineales se pueden obtener con 0 ≤ θ ≤ π/2 y δ = π, como se ilustra en la figura 3.4.
En general, para frecuencias iguales, las figuras de Lissajous son elipses, como se ilustra
en el caso de amplitudes iguales (θ = π/4) con desfase variable (figura 3.5). En el lenguaje de
polarización, que aún no hemos definido, estas figuras de Lissajous, para frecuencias iguales, se
conocen como elipses de polarización. Si la elipse degenera en una lı́nea, tenemos polarización
lineal; si degenera en un cı́rculo, polarización circular. En los demás casos, se tiene polarización
elı́ptica.
EJERCICIO 33. En la figura 3.6 se muestran varias situaciones de una cuerda vibrante.
Describa matemáticamente las ondas correspondientes a los literales a), b) y c). ¿Cuál es la
figura de Lissajous de cada una de estas situaciones? ¿Cómo cambian las figuras de Lissajous
en los casos d) y e)?
Aún no hemos definido el vector de polarización. Es común definirlo para ondas viajeras.
Si tenemos una cuerda infinitamente larga, las ondas de frecuencia bien definida ω, podemos
escribir las vibraciones en la forma

r(x, t) = A0x cos(kx − kct)ey + A0y cos(kx − kct + φ)ez (3.60)


 
= Re A0x ei(kx−kct) ey + A0y ei(kx−kct+φ) ez , (3.61)
38 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA

Figura 3.3: Figuras de Lissajous lineales. Frecuencias iguales, en fase (δ = 0), con amplitudes
diferentes (cos(θ), sin(θ) para θ = 0 (arriba a la izquierda), π/4 (arriba a la derecha), π/2
(abajo izquierda) y 3π/4 (abajo a la derecha)).

donde ω = kc. Para una cuerda infinitamente larga, todos los valores de k son posibles. Vamos
a utilizar la forma compleja de la ecuación, es decir, vamos a describir las vibraciones de la
cuerda mediante la ecuación

r(x, t) = A0y ei(kx−kct) ey + A0z ei(kx−kct+φ) ez (3.62)


 
A0y A0z iφ
= A0 ei(kx−kct)  = A0 ei(kx−kct) ey + e ey . (3.63)
A0 A0

q
Aquı́ hemos definido la amplitud A0 = A20y + A20z y el vector de polarización  = y ey +z ez .
Tanto las figuras de Lissajous como el vector de polarización tienen en cuenta dos elementos
importantes: el ángulo de desfase entre las componentes ortogonales de la polarización y la
amplitud relativa de las mismas.
Notemos que el vector de polarización es un vector bidimensional que tiene entradas com-
plejas en general. De manera implı́cita estamos diciendo que cuando estos vectores se multipli-
can por un número complejo (un escalar) o cuando se suman vectores con entradas complejas
se obtiene otro vector del mismo tipo. (Existen varias propiedades que satisfacen estas opera-
ciones: la adición de vectores es asociativa y conmutativa, existen el cero y el inverso aditivo;
la multiplicación por escalar es compatible con la multiplicación entre escalares, existe la uni-
dad, la multiplicación por escalar es distributiva con respecto a la suma de vectores y con
respecto a la suma de escalares).
3.2. POLARIZACIÓN EN CUERDAS 39

Figura 3.4: Figuras de Lissajous lineales 2. Frecuencias iguales, en contrafase (δ = π), con
amplitudes diferentes (cos(θ), sin(θ) para θ = 0 (izquierda), π/4 y π/2 (derecha)).

Figura 3.5: Elipses de Lissajous. Amplitudes iguales θ = π/4, con desfases iguales a δ =
0, π/6, π/3, π/2.

Espacios vectoriales sobre el campo de los escalares


Se denomina espacio vectorial V a cualquier conjunto de objetos matemáticos en el cual
las operaciones de suma de vectores y multiplicación por escalar estén definidas. La operación
de suma de vectores es un mapa de V × V en V mientras que la multiplicación por un escalar
es otro mapa, de F × V en V,en donde F es un campo de escalares. Estos mapas satisfacen
las siguientes propiedades:
Suma de vectores:

|Ψi + |χi = |zi ∈ V es clausurativa (3.64a)


|Ψi + |χi = |χi + |Ψi es conmutativa (3.64b)
|Ψi + (|χi + |ξi) = (|Ψi + |χi) + |ξi es asociativa (3.64c)
|Ψi + 0 = 0 + |Ψi = |Ψi existe el vector cero (3.64d)

Los elementos de un espacio vectorial pueden escribirse usando una convención conveniente.
Dos formas usuales de describir vectores son usar una flecha encima del sı́mbolo que designa
el vector y escribir el sı́mbolo en negrita. Aquı́, a los elementos del espacio vectorial V, los
vectores, los hemos denotado por |Ψi , |χi , etc.
Multiplicación por escalar:

c |Ψi = |zi ∈ V es clausurativa (3.65a)


c(|Ψi + |χi) = c |Ψi + c |χi es distributiva respecto a suma de vectores (3.65b)
(a + b) |Ψi = a |Ψi + b |Ψi es distributiva respecto a suma de escalares (3.65c)
(ab) |Ψi = a(b |Ψi) es compatible con la multiplicación de escalares (3.65d)
1 |Ψi = |Ψi 1 es la identidad del campo escalar (3.65e)

A los escalares, los elementos de campo F los hemos escrito como a, b, c. Como escalares vamos
a emplear los números complejos.
40 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA

Figura 3.6: Cuerda vibrante. Ondas con polarizaciones diferentes.


3.2. POLARIZACIÓN EN CUERDAS 41
Existe un único vector inverso aditivo − |Ψi tal que al sumarlo con el vector |Ψi da el
vector cero.

|Ψi + (− |Ψi) = 0. (3.66)

Un conjunto de vectores {|φi1 , |φi2 , · · · , |φiN } es linealmente independiente si no existe


ninguna combinación lineal de los mismos
X
ci |φii (3.67)

que dé como resultado el vector cero, a no ser aquella en que todos los escalares son cero.
El espacio vectorial V es de dimensión n (n < ∞) si existe al menos un conjunto de n
vectores linealmente independientes, tal que cualquier vector pueda expresarse como
X
f= ci f i (3.68)

y los escalares ci están determinados de manera unı́voca por f .


Ocasionalmente vamos a usar la noción de span: si todos los vectores de V son combi-
naciones de numero finito de vectores de S, entonces span(S) = V. Si los vectores de S son
linealmente independientes entonces S es una base de V.
Tradicionalmente  se representa por un vector columna
 
. 
= y . (3.69)
z

Es importante darse cuenta de que en la representación de arriba se definió una base de la


siguiente manera:    
. 1 . 0
ey = , ez = . (3.70)
0 1
Claramente, si se cambia la base, las componentes del vector en esa nueva base (los elementos
del vector columna) son otras. La determinación de las componentes de un vector en una
base dada puede realizarse usando el llamado producto escalar o producto interno entre dos
vectores. Esta es una operación matemática que a cada par ordenado de vectores, a, b les
asigna un número complejo (a, b) definido de la siguiente manera

(a, b) = a∗y by + a∗z bz . (3.71)

Vale la pena notar que los elementos del primer vector se conjugan (conjugación compleja).
Parecerı́a que el valor del producto interno dependiese de la base, pero no es ası́. El pro-
ducto
p interno induce una métrica, es decir, una noción de distancia. En efecto, d(a, b) =
(a − b, a − b) satisface los requerimientos de una distancia: la distancia entre dos vectores
es no negativa, y es cero únicamente cuando los dos vectores son iguales, la distancia entre dos
vectores es menor o igual a la suma de las distancias entre ellos y un tercer vector arbitrario
(desigualdad triangular).
El producto interno permite introducir la noción de ortogonalidad: dos vectores son or-
togonales si su producto interno se anula. Por ejemplo, si a = ey + iez y b = ey − iez , el
producto interno (a, b) es igual a

(a, b) = 1 × 1 + (−i)∗ × (i) = 1 + i × i = 1 − 1 = 0.

El producto interno también nos permite hallar la norma de un vector, k(ak,

kak = (a, a).


42 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Para los vectores del ejemplo,
p √ p √
kak = 1 + (−i) × (i) = 2, kbk = 1 + (i) × (−) = 2.

Se dice que un conjunto de vectores es ortonormal si los vectores son ortogonales entre sı́,
y si la norma de cada uno de ellos es uno. Se dice que un conjunto de vectores es completo si
cualquier vector se puede escribir como una combinación lineal de estos vectores. Un conjunto
de vectores es una base ortonormal si es ortonormal y completo. En el ejemplo, los vectores
1 1
√ (ey + iez ) y √ (ey − iez ),
2 2
es una base ortonormal para vectores complejos en el plano y-z.
Supongamos que a1 y a2 forman una base ortonormal, y que d es un vector arbitrario
(del mismo espacio vectorial). Por definición, podemos expresar el vector arbitrario como
combinación lineal de los vectores de la base:

d = d1 a1 + d2 a2 .

Hacemos el producto escalar del vector a1 con cada lado de la ecuación anterior.

(a1 , d) = (a1 , d1 a1 + d2 a2 ) = (a1 , d1 a1 ) + (a1 , d2 a2 ) = d1 (a1 , a1 ) + d2 (a1 , a2 ),

en donde hemos empleado la propiedades del producto escalar. Explı́citamente estas propie-
dades son la simetrı́a de conjugación (a1 , a2 ) = (a2 , a1 )∗ , linealidad en el segundo argumento
(a1 , c2 a2 + c3 a3 ) = c2 (a1 , a2 ) + c3 (a1 , a3 ) y positividad ((a, a) ≥ 0, en donde la igualdad
solo ocurre para el vector cero). Como el vector a1 tiene norma uno (a1 , a1 ) = 1 y como es
perpendicular a a2 , entonces (a1 , a2 ) = 0. Ası́, obtenemos,

(a1 , d) = d1 . (3.72)

De la misma forma, podemos encontrar una expresión para d2 . Entonces, cualquier vector
arbitrario d puede escribirse como

d = (a1 , d)a1 + (a2 , d)a2 . (3.73)

EJERCICIO 34. En la figura 3.6 se muestran varias situaciones de una cuerda vibrante.
A partir de la descripción matemática de las ondas correspondientes a los literales a), b) y c),
encuentre los correspondientes vectores de polarización.
Consideremos el caso de una cuerda vibrante tendida a lo largo de x, en cuyo camino se
pone una rendija angosta a lo largo de y (figura 3.6). Si representamos el vector de polarización
e la base {ey , ez }, la acción de la rendija angosta puede representarse por la siguiente matriz
 
. 1 0
Rendija = . (3.74)
0 0

En efecto, si la polarización antes de la rendija se representa por (y , z )T , la polarización


después es     
1 0 y 
= y . (3.75)
0 0 z 0

3.3. Polarización de ondas electromagnéticas


Cuenta la leyenda que los vikingos descubrieron la polarización de la luz usando los cristales
de Islandia y que la usaron para la navegación, aprovechando que la luz se polariza al pasar
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 43
por la atmósfera. Erasmi Bartholini fue el primero que describió la doble refracción de la luz
usando los cristales de Islandia en su libro Experimenta crystalli Islandici publicado en 1669.
En esta sección mostramos algunos aspectos de la polarización de ondas electromagnéticas.
Las ecuaciones de Maxwell en el vacı́o, las cuales describen los fenómenos electromagnéticos
de manera condensada, expresadas en forma diferencial, son
1 1 ∂E(r, t)
∇ × B(r, t) = 2
j(r, t) + 2 , (3.76a)
0 c c ∂t
∇ · B(r, t) = 0, (3.76b)
∂B(r, t)
∇ × E(r, t) = − , (3.76c)
∂t
1
∇ · E(r, t) = ρ(r, t). (3.76d)
0
Las ecuaciones de Maxwell relacionan los campos eléctrico E(r, t) y magnético B(r, t) con
la densidad de cargas libres ρ(r, t) y la densidad de corrientes libres j(r, t). Estas ecuaciones
están escritas en el sistema internacional de unidades SI, en donde 0 es la constante dieléctri-
ca del vacı́o y c la rapidez de propagación de las ondas electromagnéticas en el vacı́o. La
ecuación (3.76a) es conocida como la ley de Ampère–Maxwell y describe entre otras cosas que
las corrientes producen campos magnéticos; la ecuación (3.76b), la ley de Gauss para campos
magnéticos, prohibe la existencia de monopolos magnéticos; la ecuación (3.76c) conocida co-
mo ley de inducción de Faraday, predice la producción de una fuerza electromotriz debido a
la variación del campo magnético; y la ecuación (3.76d), la ley de Gauss (para campos eléctri-
cos), muestra que las fuentes y sumideros de los campos eléctricos son las cargas eléctricas.

Una de las consecuencias de las ecuaciones de Maxwell es la existencia de ondas electro-


magnéticas, como se muestra a continuación. Tomando el rotacional de la ecuación (3.76c)
tenemos
 
∂B(r, t)
∇ × (∇ × E(r, t)) = −∇ × .
∂t

Usando la identidad vectorial

∇ × (∇×) = ∇ (∇·) − ∇2 ,

e intercambiando las derivadas espaciales con las temporales, esta ecuación queda ası́


∇ (∇ · E(r, t)) − ∇2 E(r, t) = − (∇ × B(r, t)) . (3.77)
∂t
Si usamos las ecuaciones de Maxwell (3.76a) y (3.76c) en (3.77) obtenemos la ecuación de
ondas con fuentes
1 ∂ 2 E(r, t) 1 1 ∂j(r, t)
∇2 E(r, t) − 2 2
= ∇ρ(r, t) + ,
c ∂t 0 0 c2 ∂t
que en ausencia de cargas y corrientes libres se reduce a
1 ∂ 2 E(r, t)
∇2 E(r, t) − = 0. (3.78)
c2 ∂t2
La ecuación (3.78) es una ecuación de ondas tı́pica que muestra que c es la rapidez de pro-
pagación de las ondas electromagnéticas en el vacı́o. Ası́, es posible identificar la luz como
ondas electromagnéticas que pertenecen a una región espectral particular, aquella en la que
las longitudes de onda son del orden de cientos de nanómetros.
44 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Soluciones particulares
Algunas soluciones de la ecuación de onda, correspondientes a ondas viajeras, tienen la forma

E(r, t) = E0 f (k · r − ωt) = E0 f (u). (3.79)

En efecto, la segunda derivada parcial del campo eléctrico con respecto a la coordenada
x puede expresarse en términos de la segunda derivada de la función f con respecto a su
argumento,

∂ 2 f (u)
     
∂E(r, t) ∂ ∂f (u) ∂u ∂ ∂f (u) ∂u 2
= E 0 = kx E 0 = kx E 0 . (3.80)
∂x2 ∂x ∂u ∂x ∂u ∂u ∂x ∂u2

La ecuación (3.80) se puede generalizar de la siguiente manera

∂ 2 f (u) ∂ 2 E(r, t) ∂ 2 f (u)



2 2
∇ E(r, t) = k · kE0 , = ω E0 .
∂u2 u=k·r−ωt ∂t2 ∂u2 u=k·r−ωt

Empleando estos resultados, percibimos que la ecuación (3.78) se satisface si se cumple la


igualdad
ω 2 = c2 k · k = c2 k 2 . (3.81)
La ecuación (3.81) se conoce como relación de dispersión, y las soluciones de la forma (3.79)
como ondas viajeras.
Otra familia importante de soluciones es la de ondas monocromáticas. Ellas son tales que el
campo eléctrico se puede descomponer en una parte temporal y una parte espacial

E(r, t) = E(r)e−i(ωt+φ) . (3.82)

Aquı́ se sobreentiende que se debe tomar ya sea la parte real o la parte imaginaria de la
expresión a la derecha de la igualdad, E(r, t) = Re(E(r)e−i(ωt+φ) ). Si la parte espacial del
campo electromagnético también fuese compleja serı́a posible describir, entre otras, ondas
viajeras monocromáticas. Substituyendo (3.82) en la ecuación de ondas (3.78) encontramos
que
ω2
 
∇ E(r) + 2 E(r) e−i(ωt+φ) = 0.
2
c
Ya que esta solución debe valer para todo tiempo, la parte que está entre paréntesis se debe
anular, de modo que la parte espacial del campo eléctrico debe satisfacer la ecuación de
Helmholtz
ω2
∇2 E(r) + 2 E(r) = 0. (3.83)
c
Las soluciones de ondas planas son un caso particular de la soluciones (3.79) y (3.82), que
tienen la forma
E(r, t) = E 0 eik·r e−iωt = E 0 ei(k·r−ωt+φe ) ,
(3.84)
B(r, t) = B 0 eik·r e−iωt = B 0 ei(k·r−ωt+φb ) .

De nuevo, se supone que los campos magnéticos y eléctricos reales se obtienen tomando ya
sea la parte real o la parte imaginaria de las expresiones (3.84).

EJERCICIO 35. Muestre que B(r, t) también satisface una ecuación de ondas.

EJERCICIO 36. Muestre que, en el caso de ondas planas, E(r, t) y B(r, t) son perpendi-
culares al vector de onda k y son perpendiculares entre sı́.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 45
Solución. Usando las expresiones (3.84) para los campos eléctrico E(r, t) y magnético B(r, t)
en las leyes de Gauss magnética (3.76b) y eléctrica (3.76d), en ausencia de cargas, obtenemos

∇ · B(r, t) = ik · B0 ei(k·r−ωt−φe ) = 0, ∇ · E(r, t) = ik · E0 ei(k·r−ωt−φe ) = 0.

Como k es la dirección de propagación de las ondas, las ecuaciones anteriores muestran que
los campos eléctrico y magnético de las ondas planas son perpendiculares a la dirección de
propagación. Si ahora reemplazamos en la ley de inducción de Faraday (3.76b) obtenemos

ik × E(r, t) = iωB(r, t).

Esta ecuación muestra de un lado que los campos eléctrico y magnético son perpendiculares
y de otro, teniendo en cuenta la relación de dispersión (3.81), que la magnitud del campo
eléctrico de una onda plana es c veces la magnitud el campo magnético para la misma onda
plana.
Las ondas planas son soluciones interesantes, pero muy idealizadas, puesto que cargan una
potencia infinita. En efecto, dado un único plano transversal a la dirección de propagación,
como la densidad de potencia es homogénea, la potencia total es infinita. Con el advenimiento
de los láseres tenemos fuentes de luz muy direccionales, que pueden modelarse a partir de una
aproximación paraxial a la ecuación de ondas, con longitud de onda bastante bien definida,
que puede aproximarse por una fuente monocromática. Recordemos que las soluciones mo-
nocromáticas son de la forma E(r, t) = E(r)e−i(ωt+φ) en donde E(r) satisface la ecuación
de Helmholtz (3.83). Vamos a buscar soluciones de la forma E(r) = u(x, y, z)eikz ex , para las
∂2 ∂2
cuales se cumple ∂z 2  ∂x2 .

Figura 3.7: Haces paraxial y no paraxial. En azul la variación transversal y en naranja la


variación logitudinal de la función u. En los haces en los que se puede hace la aproximación
paraxial la segunda derivada longitudinal varı́a mucho más lentamente que la segunda derivada
transversal.

Cuando se inserta el Ansatz en la ecuación de Helmholtz se tiene


 2
∂ u ∂2u ∂2u

ikz ∂u 2 2
e ex + 2 + 2 + 2ik − k u + k u = 0. (3.85)
∂x2 ∂y ∂z ∂z
Teniendo en cuenta que la variación longitudinal de u es lenta, la función u aproximadamente
cumple la ecuación
∂2u ∂2u ∂u
2
+ 2 + 2ik = 0. (3.86)
∂x ∂y ∂z
Esta ecuación se conoce como la ecuación de ondas paraxiales.
Existen muchas maneras de resolver esta ecuación. Como sospechamos que una solución
que podrı́a describir los haces láser serı́a una función gaussiana con simetrı́a cilı́ndrica, hacemos
el Ansatz  
k(x2 +y 2 )
i P (z)+ 2q(z)
u(x, y, z) = e . (3.87)
46 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Vamos a suponer que en z = 0 la onda se reduce a
k(x2 +y 2 )
u(x, y, z) = e− 2a , (3.88)

de manera que P (z = 0) = 0 y q(0) = −ia. Las derivadas transversales son

∂u(x, y, z) ikx
= u(x, y, z), (3.89)
∂x q(z)
2
∂ u(x, y, z) ik k 2 x2
= u(x, y, z) − u(x, y, z), (3.90)
∂x2 q(z) q 2 (z)
2
∂ u(x, y, z) ik k2 y2
= u(x, y, z) − u(x, y, z). (3.91)
∂y 2 q(z) q 2 (z)

La derivada longitudinal por su parte es

k(x2 + y 2 )q 0 (z)
 
∂u(x, y, z) dP
= i −i u(x, y, z), (3.92)
∂z dz 2q 2 (z)
dq
donde q 0 (z) = dz . Substituyendo en la ecuación paraxial de ondas se obtiene

k 2 (x2 + y 2 ) k(x2 + y 2 )q 0 (z)


 
ik dP
2 u(x, y, z) − u(x, y, z) + (2ik) i − i u(x, y, z). (3.93)
q(z) q 2 (z) dz 2q 2 (z)

Comparando términos encontramos


ik dP
2 = 2k (3.94a)
q(z) dz
dq
−k 2 = −k 2 . (3.94b)
dz
Integrado (3.94b) tenemos q(z) = q(0) + z= −ia + z, de manera que
1 1 z a 1 1 1 2
= = 2 +i 2 = 2 + i z2 = +i 2 . (3.95)
q(z) −ia + z z + a2 z + a2 z + az a + a R(z) kw (z)

Antes de resolver la ecuación de P (z), veamos que la solución que tenemos es del tipo
k(x2 +y 2 ) k(x2 +y 2 ) (x2 +y 2 )

u = eiP (z) ei 2q(z) = eiP (z) ei 2R(z) e w2 (z) . (3.96)
2
Aquı́, R(z) = z + az es conocido como el radio de curvatura del frente de ondas. Por otro
lado,
k 1 1 1 1 1
z 2 = 2 = 2a 2z2 = 2a z 2 =
 , (3.97)
2 a +a w (z) k + ka k 1 + a2 w2 1 + z2
2 2 0 (kw0 /2)
p
en donde hemos identificado a w0 = 2a/k como la cintura del haz (a = kw02 /2).
La forma de la soluciónqdice que el spot del haz no es constante, sino que varı́a de acuerdo
2
con la ecuación w(z) = w0 1 + (kwz2 /2)2 . Para valores grandes de z, el spot del haz se compor-
0
1
ta como w(z) ∼ 2z/(kw0 ) = γz (ver figura 3.8) El radio de curvatura del haz, R(z) = 2
z+ az
es infinito para valores de z pequeños(z  LR = kw02 /2 = a), comportamiento de una onda
plana, y es proporcional a z para valores grandes de la coordenada longitudinal, comporta-
miento de una onda esférica. El criterio para decidir si una onda Gaussiana es plana o esférica
hace uso de LR , la longitud de onda de Rayleigh.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 47

Figura 3.8: Spot y frente de ondas de haz guassiano, mostrando el comportamiento asintótico.

La función P (z) es la solución de la ecuación (3.94a)

dP i i i
= = = . (3.98)
dz q(z) z − ia z − ikw02 /2

Integrando tenemos

P (z) − P (0) = i log (z − ia) − i log(−ia)


r !
 z z 2 i arctan(z/a)
P (z) = i log 1 + i = i log 1 + 2e
a a
 
w(z)
= i log − arctan(z/LR ). (3.99)
w0

Substituyendo la solución de P (z) en el Ansatz para la u, encontramos la forma de la onda


gaussiana como función de la coordenada longitudinal (y de las coordenadas transversales)
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
u(x, y, z) = e e e w2 (z) , (3.100)
w(0)
q
z2 1 w(z)
en donde w(z) = w0 1+ (kw02 /2)2
, L2
y kw02 /2. Aquı́, el término w(0) asegura la conser-
z+ R
z
vación de energı́a, mientras arctan(z/LR ) es un corrimiento de fase con respecto a la onda
plana, conocido como fase de Gouy. 1 En los experimentos con láseres, generalmente se cumple
la desigualdad λ  w0  LR . Por ejemplo, si el haz de un láser de HeNe se enfoca en una
cintura de 0.5 mm, tenemos

kw02 πw02
λ = 632,8nm, w0 = 0,5mm, LR = = = 1,2m.
2 λ

Volviendo a la expresión para el campo eléctrico E(r, t) = E(r)e−i(ωt+φ) con E(r) =


u(x, y, z)eikz ex , podemos decir que hemos encontrado soluciones de la forma
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
E(r, t) = Ex ei(kz−ωt−φx ) e e e w2 (z) ex . (3.101)
w(0)
1 Ver [Link] en donde se

muestra como tener los haces de Hermite-Gauss. [Link]


98c178dc-7e5b-4a04-b0a1-a73abf7f13d5/imagegallery/[Link]
48 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
De forma semejante podrı́amos haber encontrado una solución gaussiana en la cual el campo
eléctrico estuviese apuntando en la dirección ey . Ası́, podrı́amos tener campos eléctricos de
la forma
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
E(r, t) = ei(kz−ωt e w2 (z) Ex e−iφx ex + Ey e−iφy ey . (3.102)

e e
w(0)

El término entre paréntesis es proporcional a la polarización. En este caso, la polarización


pertenece al plano x-y, a diferencia del caso de la cuerda, en la que la polarización era un
vector en el plano y-z. Naturalmente, no hay nada fundamental en que la dirección de pro-
pagación sea ez , como en nuestro ejemplo de los campos eléctricos, o en la dirección de ez ,
como en nuestro ejemplo de la cuerda. En ambos ejemplos, sin embargo, la polarización es
perpendicular a la dirección de propagación (esta es una caracterı́stica de las ondas transver-
sales). Una descripción simplificada puede hacer uso de ondas planas, en el entendimiento de
que la parte espacial que limita la región de validez de la descripción ha sido omitida.

3.3.1. Polarizadores lineales


Como los seres humanos no somos sensibles a la polarización de ls luz y gran parte de
nuestras fuentes de luz no son polarizadas, tendemos a pensar que la polarización no ocurre
naturalmente. Sin embargo, esto no es ası́. La luz que proviene del sol se polariza en la
atmósfera y muchos insectos utilizan la polarización para orientarse. Los pulpos pigmeos
pueden modificar su piel de manera que reflejan luz con patrones cambiantes de luz polarizada.
Una demostración común muestra que el efecto de un polarizador lineal de rejilla (fig. 3.9.
La demostración se describe a continuación.

Figura 3.9: Izquierda:Polarizador de rejilla de alambres metálicos. Derecha: esquema de un


emisor y receptor de microndas. El emisor produce onds electromagnéticas en la región de
las microondas en las que la longitud de onda es el orden de unos pocos centı́metros. El
campo eléctrico emitido está polarizado verticalmente. El receptor produce una señal audible
proporcional la intensidad detectada. Cuando se gira noventa grados, la señal cae a cero.

Se tienen un emisor de microondas y el receptor correspondiente. El emisor produce ondas


de microondas con longitud de onda tı́pica de 3 cm, polarizadas verticalmente (el campo
eléctrico apunta hacia arriba o hacia abajo). El receptor detecta microondas polarizadas
verticalmente y emite un sonido cuya intensidad es proporcional a la señal detectada. Cuando
el receptor se gira 90◦ , el sonido cesa de producirse. Se tiene además un polizador lineal de
rejilla de alambre, que consta de un marco y de una serie de alambres metálicos paralelos. Los
alambres están separados por una distancia mucho menor que la longitud de onda del campo
eléctrico, y su diámetro es mucho menor que la separación. El receptor se orienta de manera
que la señal detectada sea máxima. Después se interpone el polarizador de rejilla entre el
emisor y el receptor. Si los alambres están orientados horizontalmente, ¿qué espera el lector
que ocurra?
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 49
Como los alambres son metálicos, los electrones son libres para moverse, esencialmente
en la dirección del alambre. Ası́, los campos elécricos en la dirección de los alambres inducen
el movimiento de los electrones a lo largo de los alambres, de modo que el campo se refleja.
Por supuesto, una parte de la energı́a transportada por el campo se pierde por efecto Joule,
por el calentamiento de los alambres. Ası́, si el polarizador está orientado horizontalmente,
no hay cambio apreciable de la señal detectada por el receptor. Sin embargo, si los alambres
se orientan verticalmente, no hay campo eléctrico transmitido y la señal detectada por el
receptor es nula.
Para campos electromagnéticos en la región visible, cuyas longitudes de onda son del orden
de cientos de nanómetros, existen los polarizadores hechos en plástico de alcohol polivinı́lico
(PVA, por sus siglas en inglés, polyvinyl alcohol ) dopado con yodo. El proceso de fabricación
incluye una etapa de estiramiento que alinea las moléculas de PVA en una cierta dirección, a
lo largo de la cual la luz no se transmite. Ası́, podemos imaginarnos un polarizador Polaroid
como un polarizador de rejilla con “alambres” de dimensiones nanométricas. De hecho, es
posible construir un polarizador de rejilla hecho con alambres metálicos, cuando menos para
el infrarrojo cercano. Bird y Parrish construyeron uno en 1960, que tenı́a 2160 alambres por
milı́metro [58].
Supongamos que un campo eléctrico de la forma

E(r, t) = ei(kz−ωt FG (x, y, z) Ex e−iφx ex + Ey e−iφy ey ,



(3.103)

donde FG (x, y, z) corresponde a una función Gaussiana que cumple la ecuación de ondas
paraxial. Supongamos que frente al haz se pone un polarizador lı́nea que deja pasar la po-
larización a lo largo de y. En la base {ex , ey } la polarización después del polarizador lineal
puede escribirse como     
. 0 0 0x 0
f = = . (3.104)
0 1 0y 0y
En realidad, la matriz anterior describe un polarizador lineal ideal. En general, el polari-
zador va a introducir una diferencia de fase, por lo cual podrı́amos representarlo por
 
. 0 0
PL = . (3.105)
0 eiδ

Además, podrı́amos tener pérdidas, es decir, el polarizador podrı́a absorber parcialmente el


campo polarizado verticalmente. Ası́, podemos representarlo por
 
. 0 0
PL = . (3.106)
0 (1 − η)eiδ

Además, es posible que quede un remanente de campo a lo largo del eje que, en el caso ideal,
no se transmitirı́a,
. η1 eiδ1
 
0
PL = , (3.107)
0 (1 − η2 )eiδ2
en donde se espera que η1 y η2 sean muy pequeños comparados con la unidad.
Mencionamos anteriormente que los vectores de polarización se escogen de forma que
tengan norma 1. Sin embargo, si el vector de polarización estaba normalizado a 1 antes de
pasar por el polarizador, después de este no lo estará más (a menos que inicialmente ya fuera
la polarización que deja pasar el polarizador). ¿Cómo podemos interpretar este hecho?

3.3.2. Teorema de Poynting


Para responder esta pregunta vamos a revisar la estructura de una ley de conservación, a
partir de ejemplo sencillo. Tomemos un volumen fijo, digamos una parte de una ciudad, en la
50 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
cual, en un momento dado hay n automóviles. El número de autos puede variar porque hay
autos que entran en ese voliumen y otros que salen de él, no necesariamente por las calles
(podrı́a ser izado por un helicópeto o un avión, salir por un subterráneo, etc). Existe otra
forma en que el número de autos puede variar. Puede haber una fábrica de automóviles. Por
otro lado, puede que haya un derby de demolición, que haya accidentes que dejen los carros
inservibles, o que se chatarricen los autos viejos.
De modo más formal, podemos escribir la ley de conservación en un volumen fijo Ω con
frontera ∂Ω como Z Z Z
d
U dx + F (U ) · dS = S(U, t) dx, (3.108)
dt Ω ∂Ω Ω

en donde U es la cantidad conservada, F (U ) su flujo, S el elemento de superficie que apunta


en la dirección hacia afuera de Ω y S(U, t) es el término de fuentes y sumideros. El primer
término de la ecuación a la diferencia en corresponde a la variación del número de autos en
cierto volumen de una ciudad, el segundo a la diferencia entre los autos que salen y los que
entran, y el último entre los autos fabricados y los destruidos.
R De la ecaciónR que se obtiene
al aplicar el teorema de la divergencia al segundo término ∂Ω F (U ) · dS = lΩ ∇ · F (U )dx,
intercambiarla derivada temporal con la integral espacial y pasar todos los términos al lado
izquierdo, Z  

U + ∇ · F (U ) − S(U, t) dx, (3.109)
Ω ∂t
válida para un volumen Ω fijo pero arbitrario, se obtiene la forma diferencial de la ley de
conservación,

U + ∇ · F (U ) = S(U, t). (3.110)
∂t
Enseguida derivamos una ley de conservación para la energı́a almacenda en un campo
electromagnético. La fuerza que este le ejerce a una carga,

F = q(E + v × B). (3.111)

se conoce como fuerza de Lorentz. La potencia que el campo le transfiere a la carga es


∂W
= q(E + v × B) · v = qv · E.
∂t
La energı́a que el campo le transfiere a la carga puede aparecer como energı́a cinética, poten-
cial, calor, etc. El producto de la velocidad por la carga es la corriente, j, aparece en la ley de
Ampère-Maxwell (3.76a), ∇ × B = c12 j + c12 ∂E ∂t . La potencia transferida adquiere la forma
 
2 1 ∂E
j · E = c ∇ × B − 2 · E.
c ∂t

Teniendo en cuenta la identidad vectorial ∇ · (E × B) = B · ∇ × E − E · ∇ × B podemos


escribir
∂E
j · E = c2 (−∇ · (E × B) + B · ∇ × E) −  · E.
∂t
Hacemos una transformación adicional, empleando la ley de Faraday (3.76c), ∇ × E(r, t) =
− ∂B(r,t)
∂t    
∂ 1 B·B B
+ E · E + ∇ E × = −j · E, (3.112)
∂t 2 µ0 µ0
en donde tuvimos en cuenta que µ0 0 c2 = 1, y

∂E 1 ∂(E · E) ∂B 1 ∂(B · B)
·E = , ·B = .
∂t 2 ∂t ∂t 2 ∂t
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 51
La ecuación (3.112) se conoce como teorema de Poynting, ya que fue derivado por primera
vez por John Henry Pynting [59]. Tiene la estructura
 de una ley de conservación, en donde la
1 B·B
densidad de energı́a electromagnética es u = 2 µ0 + E · E , el vector de Poynting, que
B
da el flujo de energı́a es S = E × µ0 , y el término de fuentes corresponde a menos el trabajo
hecho por el campo sobre las cargas. El teorema se puede extender a medios macroscópicos
que tengan pocas pérdidas [60, 61]. Esta derivación no es completamente limpia, pues no se
hizo una distinción entre los campos propios (producidos por las mismas cargas) y los campo
externos. Si se hace esta distinción, no se llega al teorema de Poynting, conforme lo muestran
Campos y Jiménez [62]. De hecho, en un punto de la derivación es necesario aproximar los
campo totales por los externos, pero de este modo se está ignorando la transferencia de energı́a
de los campos externos a los campos propios. Existen referencias posteriores que analizan este
problema. En particular, ver la referencia [63]. Sin embargo, al parecer algunos problemas
profundos de la fı́sica no se resuelven nunca, se olvidan cuando aparece otra teorı́a.
Ahora, para determinar qué tan iluminada está una superficie vamos a seguir a Hetch [64].
Para tanto vamos a usar un detector que colecte toda la potencia de la onda electromagnética
que llega a la superficie, que está dada por el vector de Poynting. Aunque el detector tiene un
área A fija, que permite la entrada de la energı́a radiante, dado que otros detectores pueden
tener otras áreas, la cantidad interesante es la energı́a total por unidad de área. Suponemos que
la superficie es perpendicular a la dirección de incidencia de la radiación. Otro tanto puede ser
dicho acerca del perı́odo de recolección, T , de la energı́a por unidad de área: para independizar
la medición de este tiempo de recolección, dividimos por T . Ası́, la cantidad interesante es la
energı́a promedio por unidad de área por unidad de tiempo. Estamos hablando, entonces, del
promedio temporal de la magnitud del vector de Poynting,
Z t+T
1
I= kSkdτ, (3.113)
T t

promedio temporal conocido como la irradiancia (anteriormente conocida como intensidad,


un nombre que es usado de manera diferente en áreas diferentes a la fı́sica).
Debido a la aproximación paraxial que hicimos, la forma del campo magnético es parecida
a la del campo eléctrico, con una amplitud 1/c de la del campo eléctrico, perpendicular a la
dirección de propagación, pero a noventa grados del campo eléctrico. Las expresiones para el
campo electromagnético es la siguiente

= ei(kz−ωt FG (x, y, z) Ex e−iφx ex + Ey e−iφy ey ,



E(r, t) (3.114a)
1
= ei(kz−ωt FG (x, y, z) Ex e−iφx ey − Ey e−iφy ex ,

B(r, t) (3.114b)
c

en donde FG (x, y, z) es una función gaussiana que satisface la ecuación paraxial de ondas,
como antes. Las expresiones que tenemos son complejas, pero los campos corresponden a la
parte real o a la parte imaginaria de esas expresiones. En un tratamiento aproximado podemos
ignorar la fase del frente de ondas (z toma un valor fijo y se vuelve una constante). Tenemos
el valor medio de un coseno al cuadrado sobre un número n de periodos Tω = 2π/ω, no
necesariamente entero. Sin embargo, si T es sificientmente grande con respecto al periodo de
la onda, T  Tω , el promedio estel cuadrado del coseno será, con muy buena precisión igual a
1/2. La irradiancia en el plano z = z0 , alrededor del punto (x0 , y0 ) es aproximadamente igual
a
1 c
I= kfG (x0 , y0 , z0 )k2 (Ex2 + Ey2 ) = kfG (x0 , y0 , z0 )k2 E02 , (3.115)
2µ0 c 2
en donde E02 = Ex2 +Ey2 . Si el vector de polarización se normaliza a la entrada de un polarizador
lineal que deja pasar la componente y,  = Ex e−iφx ex + Ey e−iφy ey /E0 , entonces a la salida

52 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
no está normalizado, f = Ex /E0 e−iφx ex . Además, la irradiancia de salida es

c E2 E2
Iout = kfG (x0 , y0 , z0 )k2 E02 x2 = x2 Iin . (3.116)
2 E0 E0

Esto quiere decir que, al menos en este caso, el cuadrado del vector de polarización de
salida es igual a la razón entre la irradiancia de salida y la de entrada.

3.3.3. Ley de Malus


Recientemente se describió un procedimiento para verificar la Ley de Malus usando un
teléfono inteligente [65]. Para esto se necesita la app Physics Toolbox, la cual accede a los
sensores de los teléfonos inteligentes. En este experimento se usa la opción Multi report de
los sensores de luz y orientación. Además de teléfono inteligente, se necesitan una fuente de
luz polarizada (un monitor plano de computador o un televisor LCD) y un polarizador lineal
de 1 cm por 1 cm (de un viejo display de calculadora, o de Polaroid ). Aunque el sensor mide
iluminancia y no exitancia (irradiancia de fuentes de luz), es decir, pesa las contribuciones
espectrales de la fuente de acuerdo con la respuesta tipica del ojo humano, como la fuente no
varı́a en el experimento, la iluminancia es proporcional a la exitancia.
El sensor de luz usualmente se encuentra al lado de la cámara frontal. Con el teléfono
en posición vertical se rota el polarizador hasta obtener un mı́nimo, de tal manera que el
polarizador está a noventa grados de la polarización de la fuente de luz. Después se gira el
teléfono un cuarto de vuelta y se analizan los datos. Después de hacer un ajuste de los datos
se obtiene I(θ) = I(0) cosd (θ), donde d es cercano a 2 y θ es el ángulo entre la polarización
permitida por el polarizador y la polarización de la fuente.
Merecen su lectura y tal vez su reproducción otros artı́culos que tienen que ver con la ley
de Malus o con el uso de teléfono inteligentes para hacer mediciones usando los sensores de
luz o de orientación [66, 67, 68, 69, 70, 71, 72, 73, 74, 75].
Ahora, el modelo vectorial de la polarización da cuenta de este comportamiento. Supon-
gamos que tenemos una fuente de luz polarizada que emite luz que se propaga a lo largo del
eje x, de tal manera que su vector de polarización apunta hacia arriba, en la dirección de z
positivo. Supongamos, además, que tenemos un polarizador lineal que rotamos, de tal manera
que deja pasar luz con polarización a lo largo de cos θez + sin θey . La intensidad de la luz que
2
pasa es Iout = Iin (ey · (cos θez + sin θey )) = Iin cos2 θ.
Merece la pena recordar que la polarización es lineal si no hay diferencia de fase entre sus
componentes, es decir, si  = cos θeiφ ex + sin θeiφ ey .
Supongamos que tenemos luz con polarización lineal y queremos girar la polarización. El
cálculo que hicimos anteriormente muestra que podemos girar la polarización por un ángulo
θ poniendo un polarizador lineal cuyo eje de transmisión forme ese ángulo con la dirección
orginal de polarización. Esto se logra con un costo: que la intensidad transmitida sea Iout =
Iin cos2 θ. Es decir que, no podemos girar la polarización por noventa grados . . . a menos
que tengamos dos polarizadores: los ejes de transmisión de los polarizadores se ponen ası́:
el primero a 45 grados de la dirección original de polarización y el segundo a 45 grados del
primer eje, a noventa grados del segundo.
EJERCICIO 37. Suponga que va a girar noventa grados el eje de polarización de un haz
de luz polarizado linealmente y que tiene N polarizadores lineales a disposición. ¿Cómo debe
disponerlos para que la luz transmitida sea máxima?
Suponga que tiene dos polarizadores lineales y que pone uno encima de otro de manera
que el eje de transmisión de uno forma noventa grado con el del otro. Ahora, suponga que
pone una pelı́cula de celofán, más pequeña que los polarizadores, entre ambos. Si comienza a
rotar el celofán, a un determinado ángulo la región del celofán se ve clara, mientras el resto
es oscuro. Describa matemáticamente el celofán (desde el punto de vista de su efecto sobre la
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 53
polarización). Puede tener en cuenta que el celofán es un material anisotrópico, birrefringente,
es decir, posee dos ı́ndices de refracción.
Si una pelı́cula transparente tiene dos ı́ndices de refracción, n1 y n2 , tiene dos velocidades
de propagación, c/n1 y c/n2 , y dos longitudes de onda λ1 = nλ01 y λ2 = nλ02 . Si el ancho de
la pelı́cula es δ el campo eléctrico gana una fase kδ, es decir, una componente gana una fase
2πδn1
2πδ
λ1 = λ0 y la otra una fase 2πδn
λ0 . Es decir, un material birrefringente produce un desfase
2

entre su dos componentes.


Primero, vamos a escribir el vector de polarización en la base de las componentes rápida
(la que gana una fase menor) y lenta (la que gana una fase mayor) del medio birrefringente.
 
. cos φ
in = . (3.117)
sin φ

Enseguida, tenemos en cuenta que el medio produce un desfase entre las dos componentes,
    
. cos φ 1 0 cos φ
out = iα = . (3.118)
e sin φ 0 eiα sin φ

La matriz describe el efecto de la pelicula de celofán sobre la polarización. Sabemos, a partir


del resultado observado, que la polarización se rota noventa grados, es decir,

. cos(φ + π2 )
   
− sin φ
˜out = = . (3.119)
sin(φ + π2 ) cos φ

Como podemos tener una fase global, sin que se cambie la polarización, escribimos la polari-
zación de salida como  
. iβ − sin φ
˜out = e . (3.120)
cos φ
Las dos descripciones, que hemos hallado a partir de consideraciones diferentes, deben ser
iguales,    
cos φ iβ − sin φ
=e . (3.121)
eiα sin φ cos φ
De la primera componente tenemos que, para que el lado derecho sea real, como el lado
izquierdo, δ = 0 o δ = π. Consideremos el primer caso, el cual implica la igualdad cos φ =
− sin φ, cuyas soluciones son θ = −π/4 y θ = 3π/4 (en el intervalo [−π, π]). Escojamos
la primera solución. Substituyendo en la segunda componente, vemos que se debe cumplir
δ = π + 2pπ, siendo p un entero. De nuevo escogemos la primera solución, la cual muestra
que el celofán debe acumular un desfase de π entre las dos componentes. Como ese desfase
corresponde a media longitud de onda, los elementos que producen ese desfase se llaman
placas de media onda. Dicho de otra manera, la pelı́cula de celofán debe actuar como una
placa de media onda. Por otro lado, el eje lento del celofán debe ponerse a -45◦ con respecto
al eje de transmisión del primer polarizador lineal.
EJERCICIO 38. Considere las soluciones que descartamos. Discuta si son soluciones
diferentes y a qué corresponden.
Vemos que tenemos un elemento que cambia la polarización, una placa de media onda, la
cual se representa, en la base (eje rápido, eje lento), por
 
. 1 0
MO = . (3.122)
0 −1

Veamos el efecto sobre una polarización lineal arbitraria.


    
. 1 0 cos φ cos φ
out = = . (3.123)
0 −1 sin φ − sin φ
54 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Tenemos una reflexión sobre el eje lento. Visto de otra manera, corresponde a una rotación
por un ángulo 2φ en el sentido antihorario.
EJERCICIO 39. Aunque siempre podemos cambiar la base de polarización, con frecuen-
cia es conveniente trabajar en una base fija (por ejemplo, la base {ex , ey }). ¿Qué matriz
representa una placa de media onda cuyo eje rápido forma un ángulo θ con ex ?
Como un vector de polarización a lo largo del eje rápido no gana una fase (de hecho sı́ lo
hace, pero lo importante es la diferencia de la fase ganada entre el eje rápido y el eje lento),
se cumple lo siguiente     
a11 a12 cos θ cos θ
= . (3.124)
a21 a22 sin θ sin θ
El eje lento, por su parte, gana una fase de π,
    
a11 a12 − sin θ − sin θ
=− . (3.125)
a21 a22 cos θ cos θ

Las dos ecuaciones pueden escribirse en una sola


     
a11 a12 cos θ − sin θ cos θ − sin θ 1 0
= . (3.126)
a21 a22 sin θ cos θ sin θ cos θ 0 −1
 
cos θ − sin θ
Multiplicando a la derecha por la inversa de la matriz encontramos la matriz
sin θ cos θ
que representa una placa de media onda cuyo eje rápido forma un ángulo θ con ex
       
a11 a12 cos θ − sin θ 1 0 cos θ sin θ cos(2θ) sin(2θ)
= = .
a21 a22 sin θ cos θ 0 −1 − sin θ cos θ sin(2θ) − cos(2θ)
(3.127)
EJERCICIO 40. Si se hace pasar luz con polarización lineal arbitraria por una placa de
media onda tal que su eje rápido forma un ángulo θ con la polarización horizontal ex , ¿cuál
es la polarización de salida? Haga una interpretación geométrica del resultado.
Un detalle que no hemos discutido es que las placas de media onda dependen de la longitud
de onda. En el experimento descrito se usa luz natural, que contiene todo el visible. Podemos
considerar que las longitudes de onda involucradas van de los 400 a los 800 nanómetros. Si
tomamos una longitud de onda de referencia de 600 nm, vemos que la diferencia de fase
corresponde a 300 nm, es decir, (nlento − nrapido )× espesor= 300 nm.
EJERCICIO 41. Estime los vectores de polarización de salida correspondientes a 400 nm
y 800 nm, suponiendo una pelı́cula de celofán que funciona como una placa de media onda a
600 nm.
En la referencia [76] se midieron los ı́ndices de refracción de celofán a 632.8 nm, nl =
1,4721 ± 0,0002, y nr = 1,4680 ± 0,0002. La diferencia de los ı́ndices es de unos 4 × 10−3 . Ası́,
suponiendo que esta diferencia es aproximadamente igual en todo el espectro visible, tenemos
que el espesor de la pelı́cula, δ, es de aproximadamente, d ≈ 300nm/(4 × 10−3 ) = 75µm,
menos de un décima de milı́metro.
En realidad estos datos no son necesarios si se supone que la diferencia de ı́ndices de
λ0r
refracción es igual en todo el espectro visible. Tenemos 2πδ∆n λ0r = π, es decir, δ = 2∆n , en
donde λ0r es la longitud de onda, en el vacı́o, de la luz para la cual la pelı́cula se comporta
como una placa de media onda. Esto quiere decir que el desfase para luz de otra longitud de
onda será α(λ0 ) = 2πδ∆n
λ0 = π λλ0r0 . Ası́, para 400 nm tenemos un desfase de 3π/2 y para 800 nm
de 3π/4. La componente de luz solar en el violeta (400 nm) es relativamente pequeña. Además
la respuesta del ojo humano es pequeña para longitudes de onda del orden y menores a la del
azul, y para aquellas del orden o mayores que la rojo (800 nm). Además, la desviación angular
para el rojo es relativamente pequeña, mientras que para el azul, es más significativa. Esto
quiere decir que, después de pasar por el segundo polarizador linear, habrá mayores pérdida
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 55
hacia el azul y el rojo de longitudes de onda mayores. Sin ambargo, como esa longitudes de
onda no pesan mucho en el conjunto del espectro de la luz solar conforme lo ve un ojo humano,
no se espera una coloración apreciable.

3.3.4. Polarización circular


Volvamos a considerar un haz gaussiano. Esta vez supongamos que que el campo eléctrico
puede escribirse como

E(r, t) = E0 f˜G (x, y, z) (cos(kz − ωt + φ)ex + sin(kz − ωt + φ)ex ) , (3.128)

en donde el moño sobre la función gaussiana señala que todas las fases han sido incluı́das en φ,
y que, por lo tanto, f˜G (x, y, z) es puramente real. Sin pérdida de generalidad podemos suponer
que φ = 0, t = 0 y z = 0. El campo empieza apuntando en la dirección de x. Nos quedamos en
z = 0 y miramos hacia la onda que viene propagándose hacia nosotros. Después de un tiempo
∆t nos llega una parte de la onda que tenı́a z negativo en el tiempo inicial t = 0. Como z
es negativo (y relativamente pequeño, |kz|  1), el vector (cos(kz)ex + sin(kz)ex ) forma un
ángulo negativo pequeño con respecto al eje x. Un tiempo después, esta parte de la onda
coincide con el eje x. Esto quiere decir que, mirando hacia la dirección de propagación de la
onda, parados en un punto fijo, vemos que la onda gira en dirección antihoraria. Decimos que
esta onda tiene una polarización circular derecha. Si, hubiéramos tenido un campo eléctrico

E(r, t) = E0 f˜G (x, y, z) (cos(kz − ωt + φ)ex − sin(kz − ωt + φ)ex ) , (3.129)

al realizar el mismo análisis, verı́amos a la onda girando en la dirección horario. Habrı́amos


tenido un campo electromagnético con polarización circular izquierda. Teniendo en cuenta
que Re(eiu ) = cos u y Re−ieiu = sin u, vemos que la polarización derecha corresponde a un
vector que apunta en la dirección de ex − iey . Después de normalizar este vector vemos que,
en la base {ex , ey } se representa mediante
 
. 1 1
R = √ . (3.130)
2 −i

De manera semejante, vemos que la polarización circular izquierda, en la misma base, se


representa mediante el vector  
. 1 1
L = √ . (3.131)
2 i
Supongamos que tenemos luz polarizada linealmente y la pasamos a través de un elemento
birrefringente cuya acción es (únicamente) retardar una de las componentes con respecto a la
otra por una fase de π/2.

3.3.5. Elipse de polarización


Como mencionamos anteriormente, las figuras de Lissajous de dos osciladores de la misma
frecuencia son las elipses de polarización. Aquı́ hacemos una derivación de dichas elipses,
a partir de las expresiones para el campo eléctrico. Para una derivación diferente, vea la
referencia [77].
En un punto r particular, las componentes del campo eléctrico de una onda electromagnéti-
ca que se propaga en la dirección de z son

Ex = Ex0 cos(−ωt + δx ) = (3.132)


Ey = Ey0 cos(−ωt + δy ) = Ey0 cos(−ωt + δx − (δx − δy )). (3.133)
56 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
El vector de polarización correspondiente es

Ex0 Ey0 e−iδ


= q ex + q ey , (3.134)
2 + E2
Ex0 E 2 + E2
y0 x0 y0

en donde hemos definido δ = δx − δy . Definiendo además τ = −ωt + δx podemos escribir la


componente y reescalada como

Ey
= cos(τ − δ) = cos(τ ) cos(δ) − sin(τ ) sin(δ).
Ey0
r
Ex
√ 
Ex
2
De la ecuación (3.132) encontramos cos θ = Ex0 y sin θ = ± 1 − cos2 θ =± 1− Ex0 ,
las cuales substituı́mos en la ecuación anterior,
s  2
Ey Ex Ex
= cos(δ) − (±) 1 − sin(δ).
Ey0 Ex0 Ex0

Pasando el primer término de la derecha al lado izquierdo, y elevando ambos lados al cuadrado,
tenemos
 2  2 !
Ey Ex Ex
− cos(δ) = 1 − sin2 (δ). (3.135)
Ey0 Ex0 Ex0

Una forma más conveniente de escribir esta igualdad es


 2  2
Ex Ey Ey Ex
+ −2 cos(δ) = sin2 (δ). (3.136)
Ex0 Ey0 Ey0 Ex0

Enseguida vamos a demostrar que esta es la ecuación de una elipse centrada en el origen. Con
este fin reescribimos el lado izquierdo como

1
− Ecos(2δ)
!  !  
 2
Ex0 x0 Ey0 Ex 1 1  Ex
Ex Ey cos(2δ) 1 = 2 + 2 Ex Ey M . (3.137)
− Ex0 Ey0 2
Ey0
Ey Ex0 Ey0 Ey

La matriz M
 2 
Ey0 Ex0 Ey0 cos(δ)
1
− Ecos(δ)
!
1 2
Ex0 x0 Ey0 E 2 +E 2 − 2 +E 2
Ex0
= x0 y0 y0 , (3.138)
− Ecos(δ)
 2
1 1 1 E Ey0 cos(δ) Ex0
2
Ex0
+ 2
Ey0 x0 Ey0
2
Ey0 − x0 2 2 2 2
Ex0 +Ey0 Ex0 +Ey0

puede escribirse como una combinación lineal de las matrices


     
1 0 0 1 1 0
I= , σx = , σz = . (3.139)
0 1 1 0 0 −1

En efecto, esta matriz se puede escribir como


!
2 2
1 2Ex0 Ey0 cos(δ) Ey0 − Ex0 1
M= I− 2 + E2 σ x + 2 + E 2 σz = (I + sx σx + sz σz ) . (3.140)
2 Ex0 y0 Ex0 y0 2

Es conveniente usar la parametrización sx = s sin(2θ), sz = s cos(2θ), para verificar que los


vectores (cos θ, sin θ)T y (− sin θ, cos θ) son los autovectores de M con autovalores 21 (1 + s) y
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 57
1
2 (1 − s), respectivamente,
    
cos θ 1 1 + s cos(2θ) s sin(2θ) cos θ
M = (3.141)
sin θ 2 s sin(2θ) 1 − s cos(2θ) sin θ
 
1 cos θ
= (1 + s) , (3.142)
2 sin θ
    
− sin θ 1 1 + s cos(2θ) s sin(2θ) − sin θ
M = (3.143)
cos θ 2 s sin(2θ) 1 − s cos(2θ) cos θ
 
1 − sin θ
= (1 − s) . (3.144)
2 cos θ

Una simple comparación entre (3.140) y nuestra parametrización nos permiter determinar el
ángulo θ !
1 −2Ex0 Ey0 cos(δ)
θ = arctan 2 − E2 , (3.145)
2 Ey0 x0

y el parámetro s
v !2 !2
u
2 − E2
Ey0
q u 2Ex0 Ey0 cos(δ) x0
s= s2x + s2y = t − 2 + E2 + 2 + E2 . (3.146)
Ex0 y0 Ex0 y0

Teniendo en cuenta
2 2 2
2 2 2 2
cos2 (δ) = Ey0
2 2 2
(1 − sin2 (δ))

Ey0 − Ex0 +4Ex0 Ey0 − Ex0 + 4Ex0 Ey0
2 2
2 2 2
sin2 (δ),

= Ey0 + Ex0 − 4Ex0 Ey0 (3.147)

podemos simplificar s v
u !2
u 2Ex0 Ey0 sin(δ)
s = t1 − 2 + E2 . (3.148)
Ex0 y0

Observando que la matriz M admite la descomposición


   
−1 1 1 + s 0 cos θ sin θ
M=R R, R= , (3.149)
2 0 1 − s − sin θ cos θ

permite escribir la ecuación (3.136), escrita en términos de θ


   !
1 1 + s cos(2θ) s sin(2θ) Ex 1 1
Ex Ey = 2 + E2 sin2 (δ).
2 s sin(2θ) 1 − s cos(2θ) Ey Ex0 y0

en la forma alternativa
  0 !
1 1+s 0 Ex 1 1
Ex0 Ey0 = 2 + E2 sin2 (δ), (3.150)
2 0 1−s Ey0 Ex0 y0

en donde Ex0 = cos θEx + sin θEy , y Ey0 = − sin θEx + cos θEy . Merece la pena que escribamos
la ecuación de la elipse en una forma más evidente
2 2 2 2
(Ex0 + Ey0 )(1 + s) 2 (Ex0 + Ey0 )(1 − s) 2
2 E 2 sin2 δ
(cos θEx + sin θEy ) + 2 E 2 sin2 δ
(− sin θEx + cos θEy ) = 1,
2Ex0 y0 2Ex0 y0
(3.151)
58 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
o mejor aún
 2
2 2 2
(Ex0 + Ey0 ) (1 + s) cos θEx + sin θE y
 q  + (3.152)
2 E 2 sin2 δ
2Ex0 2 + E2
y0 Ex0 y0
 2
2 2 2
(Ex0 + Ey0 ) (1 − s) − sin θEx + cos θEy
  = 1.
2 E 2 sin2 δ
q
2Ex0 y0 2 + E2
Ex0 y0

Como de la ecuación (3.148) se desprende que


2
4Ex0 2
Ey0 sin2 δ 2
2 + E 2 )2 = 1 − s ,
(Ex0
(3.153)
y0

podemos escribir la ecuación de la elipse ası́


 2  2
2(1 + s)  cos θEx + sin θEy  2(1 − s)  − sin θEx + cos θEy 
+ = 1. (3.154)
1 − s2 1 − s2
q q
E2 + E2
x0 y0 E2 + E2
x0 y0

Los semiejes a y b satisfacen las ecuaciones

1 − s2 1 − s2 1
a2 + b2 = + = (1 + s + 1 − s) = 1, (3.155)
2(1 + s) 2(1 − s) 2
s s
2 E 2 sin2 δ
r
1 − s2 1 − s2 1 − s2 Ex0 y0
ab = = = 2 + E 2 )2
2(1 + s) 2(1 − s) 4 (Ex0 y0
E E | sin δ|
= p x0 y0 (3.156)
2 + E 2 )2
(Ex0 y0

Figura 3.10: Elipse de polarización mostrando los parámetros de Stokes: el ángulo θ y los semi-
ejes mayor a y menor b. De izquierda a derecha, ejemplos correspondientes a δ = 0, π, π2 , − π2 .
Capı́tulo 4

Polarización: descripción
cuántica

En el capı́tulo anterior, después de hacer la deducción de la ecuación de ondas para una


cuerda vibrante, discutimos las soluciones de D’Alembert, de Euler y de Bernoulli y Fourier. La
vibración bidimensional de las ondas transversales permite definir el concepto de polarización,
el cual se puede ilustrar usando, por ejemplo, figuras de Lissajous. A partir de las ecuaciones de
Maxwell en el vacı́o dedujimos la ecuación de ondas para el campo eléctrico (la deducción para
el campo magnético es similar). Las soluciones de ondas planas y gaussianas que dedujimos son
transversales (campos perpendiculares a la dirección de propagación), de modo que también
podemos definir el vector de polarización. Elementos tales como polarizadores lineales, y
placas de cuarto de onda y de media onda, permiten manipular la polarización. En contraste
con el tratamiento del capı́tulo anterior, el cual fue puramente clásico, en este haremos una
descripción cuántica de la polarización de ondas electromagnéticas. Esta manera de introducir
la noción de estado cuántico es conveniente, puesto que el tratamiento matemático es igual al
caso clásico. La interpretación, sin embargo, es muy diferente. La descripción cuántica tiene
su origen en la observación de Planck de que la transferencia de energı́a entre radiación y
materia se da en cuantos o paquetes de energı́a. A tales paquetes de energı́a se les dió, muchos
años después, el nombre de fotones. En este capı́tulo abordamos experimentos de un fotón,
los cuales no solo se describen muy bien empleando la mecánica cuántica no relativista, sino
que son pasibles de exploración experimental usando equipo de costo relativamente bajo.

4.1. Los fotones existen


Introduzcamos un elemento del que no hablamos en el capı́tulo anterior. Se trata de un
divisor de haz: si se tiene un haz incidente, se tienen un haz reflejado y otro transmitido. Un
pedazo de vidrio con una fina pelı́cula de plata, insuficiente para tener un espejo, es un divisor
de haz. La suma de la energı́a de los haces secundarios (los dos últimos) es igual a la energı́a
del haz primario (el incidente). Un caso particular de este elemento ocurre cuando la energı́a se
reparte por igual, en cuyo caso tendremos un divisor de haz 50/50. Supongamos que tenemos
una fuente de un fotón. Si bien existen varias formas de producir fotones únicos, aquella que
ha resultado conveniente para los laboratorios de enseñanza es la que emplea la conversión
paramétrica descendente para producir pares de fotones. En esta técnica se dirige un haz de
luz láser hacia un cristal no lineal (como un KDP o un BBO) cuyo tensor de susceptibilidad
eléctrica sea no lineal (tensor de tercer orden χ(2) no nulo.) Ası́, tenemos tres haces de salida,
uno de la misma frecuencia del haz de entrada y otros dos haces, mucho menos intensos,
cuyas frecuencias son tales que las suma de ellas es igual a la frecuencia del haz de entrada.

59
60 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA

Figura 4.1: Experimento de Grangier: un fotón no se puede dividir.

Usando menos jerga cientı́fica, y en términos de fotones, estos cristales convierten, con una
pequeña probabilidad, un fotón del haz incidente de luz, en dos fotones cuyas direcciones
están correlacionadas. Cuando uno de estos fotones es detectado en una dirección, se sabe
que hay otro fotón en la dirección correlacionada. Ese fotón se usa para los experimentos de
un fotón [82].
Sin interponer el divisor de haz, ponemos un detector de fotones ideal. Cada vez que
enviamos un fotón, este es detectado. Ahora ponemos el divisor de haz. Siempre que enviamos
un fotón, este se detecta en D1 , pero no en D2 , o al contrario; pero nunca tenemos detección
simultánea. Este experimento clave, que lleva el nombre de Grangier, [83] nos permite hablar
del fotón como si se tratase de una partı́cula, al menos en el proceso de detección.
No existe un patrón discernible en la secuencia de qué detector hace click; si un fotón es
detectado en D1 , el siguiente puede ser detectado en D1 o en D2 . La secuencia parece aleatoria.
De hecho, este esquema es usado para producir números aleatorios. Si quiere comprar uno de
estos sistemas puede consultar las siguientes páginas de internet: [Link]
com/ o [Link] Lo que sı́ podemos decir es que, después de enviar un
número grande de fotones, alrededor de la mitad se detectan en D1 y el resto en D2 , con
una desviación aproximadamente igual a la raı́z cuadrada de la mitad del número de fotones
enviados.
Clásicamente la conservación de energı́a se daba porque cada haz secundario era responsa-
ble por la mitad de la energı́a del haz primario. En el caso cuántico, toda la energı́a se la lleva
uno de los haces secundarios; en cuál de ellos se detecta la energı́a, es un proceso aleatorio.
Interpongamos una lámina de un dieléctrico ideal (sin pérdidas) entre el divisor de haz
y uno de los detectores, de manera que, en ese camino, se gane una fase eiδ . En la práctica
se puede emplear un pedazo de cristal. Nuevamente, alrededor de la mitad de los fotones se
detectan en D1 y el resto en D2 .
El lector puede considerar una variación de este experimento, correspondiente a la parte
derecha de la figura 4.1. ¿Cómo será la distribución de clicks? ¿Cuántos detectores harán click
de manera simultánea? ¿Cómo será la secuencia temporal de los detectores de hacen click?
Como el lector seguramente habrá pensado, i) la secuencia de clicks es aleatoria, ii) hay
uno y solo un click por cada fotón que se envı́e, y iii) después de enviar muchos fotones, cada
detector será responsable por aproximadamente un cuarto de los clicks totales.
Mientras la mayorı́a de los sistemas que vamos a considerar en este capı́tulo se pueden
describir usando fı́sica no relativista, la descripción de las ondas electromagnéticas es intrin-
sicamente relativista (las ecuaciones de Maxwell son invariantes ante el grupo de Lorentz).
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 61
Este hecho implica que el concepto de estado cuántico de un fotón (y no solo de su polariza-
ción) sea, cuando menos, problemático [78]. En efecto, no existen estados localizados de fotón
[79, 80]. De cualquier modo, es posible tomar una posición pragmática de usar los estados de
fotón, en particular el formalismo de Riemann-Silberstein,1 siempre que sea útil [81].

4.2. Estados cuánticos de polarización


Supongamos que existen los fotones, que tenemos un fuente de un solo fotón y que tenemos
una situación en la cual un fotón atraviesa un polarizador lineal. Supongamos, además, que
en la descripción clásica el vector de polarización del haz transmitido sea diferente al de
entrada, es decir, una situación en la cual la energı́a del haz transmitido es menor que la
energı́a del incidente. Vamos a poner un detector ideal de fotones: si el fotón atraviesa el
polarizador, el detector hará un click.(?) Solamente hay dos opciones: que haya o que no
haya click. ¿cómo conciliar este hecho con la pérdida de energı́a del campo electromagnético
que atraviesa el polarizador en la imagen clásica? Podemos pasar un segundo fotón por el
polarizador. ¿Qué pasa?
Los vectores de polarización  que introdujimos anteriormente son bidimensionales, porque
pertenecen al plano perpendicular a la dirección de propagación. Además, son complejos
porque, fuera de guardar información sobre la amplitud del campo eléctrico a lo largo de cada
dirección, codifican información acerca de la fase relativa de los campos. El estado cuántico
de los fotones también es un vector, pero en un espacio abstracto llamado espacio de Hilbert.
Tenemos una correspondencia entre vectores de polarización y estados cuánticos. Por ejemplo,
tenemos campos clásicos polarizados a lo largo de ex , y tenemos fotones en el estado horizontal
|Hi. La notación |i (ket) fue ideada por Dirac, como una manera elegante de eludir y a veces de
ocultar las dificultades matemáticas del análisis funcional, el lenguaje en el que von Neumann
escribió la teorı́a cuántica. Los estados caracterizan propiedades: cuando un polarizador lineal
ideal (transmisión 100 %) cuyo eje de transmisión es el horizontal se interpone en el camino
de un fotón |Hi, el fotón es transmitido. A la polarización ey , le corresponden los fotones
en el estado |V i , (vertical). Cuando un polarizador lineal ideal cuyo eje de transmisión es el
vertical se interpone en el camino de un fotón |V i, el fotón es transmitido. Ahora, los vectores
ex y ey son ortogonales. De la misma manera, los kets |Hi y |V i son ortogonales; en esta
caso porque corresponden a propiedades excluyentes. Cuando un polarizador lineal ideal cuyo
eje de transmisión es el vertical (respectivamente horizontal) se interpone en el camino de un
fotón |Hi (respectivamente |V i), el fotón no es transmitido.
Los argumentos que hemos usado hasta el momento pueden verse como procedimientos ex-
perimentales. Por ejemplo, supongamos que tenemos una fuente de un solo fotón, que produce
fotones polarizados verticalmente. Si interponemos un polarizador vertical (eje transmitido
en esta dirección) en el camino del fotón, y después un detector, cada fotón que se produce,
se detecta.
Podemos hacer una variación de este experimento. Supongamos que tenemos una fuente de
fotones, pero estos no se encuentran verticalmente polarizados. Podemos utilizar un polariza-
dor divisor de haz que es un dispositivo tal que, por ejemplo, el haz reflejado tiene polarización
horizontal y el transmitido polarización vertical. Interponemos un polarizador horizontal en
el haz reflejado y uno vertical en el transmitido. Todos los fotones que se producen son detec-
tados en Dh , el detector situado después del polarizador horizontal o en Dv (situado después
del polarizador vertical). El conjunto de aparatos hasta el polarizador divisor de haz puede
considerarse como una preparación, y el resto del experimento como una medición. Si consi-
deramos solo el haz transmitido (respectivamente reflejado) estamos preparando fotones con
polarización vertical (respectivamente horizontal). Todos los estados preparados con polariza-
ción vertical pasan por un polarizador vertical. Una forma de interpretar este experimento es
1 En este formalismo se usa el vector complejo E(r, t) + icB(r, t) como estado del campo electromagnético.
62 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
decir que se han producido fotones con la propiedad de que atraviesan polarizadores verticales
y que, por supuesto, si se pone un polarizador vertical en su camino, estos son transmitidos.
Antes de seguir adelante, hagamos un resumen de la notación. Tenemos una base de los
estados, compuesta por los kets |Hi y |V i,
   
. 1 . 0
|Hi = , |V i = . (4.1)
0 1

Cualquier estado de polarización se puede escribir en esa base


     
. 1 0 c
|ψi = cH |Hi + cV |V i , |ψi = cH + cV = H . (4.2)
0 1 cV

Vamos a usar la nueva notación hψ| ψ2 i para el producto escalar entre |ψ1 i y |ψ2 i (que no es
igual al producto escalar entre |ψ2 i y |ψ1 i). Las condiciones para que la base {|Hi , |V i} sea
ortonormal son las siguientes

hH|Hi = 1, hV |V i = 1, hH|V i = 0. (4.3)

Si tenemos dos estados arbitrarios |ψ1 i = cH |Hi + cV |V i y |ψ2 i = dH |Hi + dV |V i , el


producto escalar del primero con el segundo es igual al que definimos para vectores clásicos
de polarización,  
∗ ∗ ∗ ∗
 dH
hψ1 |ψ2 i = cH dH + cV dV = cH cV . (4.4)
dV
Observando esta expresión es natural definir un objeto matemático, relacionado con el |ψ1 i .
A este objeto matemático lo llamaremos bra y lo notaremos hψ1 | . Si el ket |ψ1 i se representa
por el vector  
. c
|ψ1 i = H , (4.5)
cV
en la base {|Hi , |V i}, entonces el bra hψ1 | , se representa por
.
hψ1 | = c∗H c∗V = c∗H 1 0 + c∗V 0
  
1 . (4.6)

Esta ecuación también nos dice que la base de los objetos matemáticos que llamamos bras
está conformada por {hH| , hV |}, los cuales tienen la siguiente representación:
.  . 
hH| = 1 0 , hV | = 0 1 . (4.7)

El nombre de los kets y los bras fue acuñado por Dirac, de tal manera que el producto escalar
se puede escribir como bra·c·ket, que es paréntesis en inglés. Tanto el espacio de los kets como
el de los bras son espacios vectoriales cuyos escalares son los números complejos.
Los bras son, de hecho, funcionales lineales, objetos matemáticos que actúan sobre vectores
y dan como resultado un escalar (en este caso un número complejo). El hecho de que sean
lineales significa que, cuando se aplican sobre una suma de vectores, el resultado es la suma de
la aplicación del funcional a cada vector. Del párrafo anterior se desprende que los funcionales
lineales forman un espacio vectorial.
Supongamos que tenemos un haz gaussiano con polarización vertical y que interponemos
un polarizador cuyo eje de transmisión forma 45◦ con respecto a las direcciones vertical y √ ho-
rizontal, de tal manera que el vector de polarización del campo transmitido es (ex + ey ) / 2.
Si por este arreglo experimental hacemos pasar un único fotón con polarización vertical, este
pasará, será transmitido, alrededor de la mitad de las veces que hagamos el intento (con una
dispersión igual a la raı́z de ese número). Si ponemos un segundo polarizador con el mismo
eje de transmisión que el primero (45◦ con respecto a las direcciones vertical y horizontal), el
fotón será transmitido por este polarizador. Por otro lado, si el eje del segundo polarizador
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 63

apunta en la dirección de (−ex + ey ) / 2, ningún será transmitido. Merece la pena poner
nombres: diremos que el estado √ de un fotón que sea transmitido por un polarizador con eje de
transmisión eD = (ex + ey ) / 2, es |Di (diagonal), y que el estado √ de un fotón que sea trans-
mitido por un polarizador con eje de transmisión eA = (ex − ey ) / 2, es |Ai (antidiagonal).
Si un fotón se prepara en el estado |Ai , entonces nunca será transmitido por un polarizador
lineal con eje de transmisión eD . Podemos pensar, entonces, que las propiedades asociadas
con los estados |Di y |Ai son excluyentes. Ası́, los respectivos kets deben ser ortogonales,
hD|Ai = 0.
Por medio de estos experimentos hemos clasificado los fotones verticales en diagonales y
antidiagonales. Podemos pensar, por lo tanto, que los estados correspondientes serán |V, Di y
|V, Ai , respectivamente. Para terminar de convencernos de que esto es ası́, vamos a pasar los
fotones |V, Di por un polarizador vertical. Esperamos que todos los fotones sean transmitidos
por un polarizador vertical (con eje de transmisión vertical). Cuando se hace el experimento,
sin embargo, solamente alrededor de los fotones que pasaron por el polarizador diagonal
son transmitidos por el polarizador vertical. Una alternativa es pensar que el estado vertical
se puede escribir en términos de los estados diagonal y antidiagonal, como discutimos más
adelante. Veamos sin embargo porqué esta es una alternativa inquietante.
En vez de pensar en fotones, pensemos en cubos lógicos. Supongamos que una caracterı́tica
de los cubos lógicos es su forma, pero que existen solamente dos formas posibles: cuadrado
|cuadradoi y rombo |romboi. Supongamos que otra de las caracterı́sticas de los cubos lógicos
es su color y que solamente se presentan en dos colores: azul |azuli y rojo |rojoi. Entonces
la situación que analizamos en el párrafo anterior es análoga a la siguiente. De una caja de
cubo lógicos sacamos únicamente los cuadrados. Después los clasificamos por color, por lo cual
tenemos azules y rojos. Lo sorprendente es que cuando volvamos a mirar su forma no tengamos
únicamente cuadrados, ¡sino que aproximadamente la mitad son rombos! Es más. Debemos
poder escribir |cuadradoi como una combinación de |azuli y |rojoi. Tal vez el problema es que
esta formulación solamente vale para polarización. Esta discusión la hacemos más adelante.
En el caso de la polarización, no nos espanta que el estado |V i pueda escribirse en términos
de |Di y |Ai . De hecho, sabemos que eV puede escribirse en términos de eD y eA , eV =
cD eD + cA eA . Los coeficientes cD y cA pueden ser interpretados. En el capı́tulo anterior
vimos que el cuadrado del valor absoluto de dichos coeficientes corresponden a la razón entre
la irradiancia (energı́a por unidad de área por unidad de tiempo) de salida y la de entrada.
Vamos a escribir el estado |V i como |V i = c̃D |Di+c̃A |Ai. Note que no hemos asumido que los
coeficientes son exactamente los mismos. Si consideramos la existencia de paquetes de energı́a
del campo electromagnético, el cuadrado de c̃D y c̃A deberı́a corresponder a la razón entre el
número de fotones de salida y el de entrada. 2 Dado que los fotones se detectan aleatoriamente,
ese cuadrado se puede interpretar como una probabilidad: |c̃D |2 serı́a la probabilidad de que un
fotón vertical pase por un polarizador lineal con eje de transmisión diagonal y sea detectado.
En el ejemplo, las √ probabilidades son iguales a 1/2 y por lo tanto, el valor absoluto de los
coeficientes es 1/ 2. Es decir, dabemos que c̃D = √12 eiφ1 y c̃A = √12 eiφ2 . Podemos escribir

1
|V i = √ |Di + eiφ |Ai ,

(4.8)
2

en donde escogimos φ1 = 0 y φ2 = φ, teniendo en cuenta que, en el caso de campos electro-


magnéticos macroscópicos, el vector de polarización está bien definido hasta una fase global
eiα (los vectores  y eiα  definen la misma polarización).
El tipo de argumentación que empleamos para fotones con polarización vertical, puede
aplicarse a fotones con polarización horizontal (atravesando polarizadores diagonales y anti-
2 Merece la pena ver que estamos usando un argumento de una especie de continuidad en la interpretación

cuando vamos de campos electromagnéticos macroscópicos a campos muy débiles, correspondientes a un único
paquete de energı́a. No hay razón, sin embargo, para que los campos débiles tengan que comportarse ası́.
64 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
diagonales antes de ser detectados). El resultado final es que podemos escribir

1
|Hi = √ |Di + eiϕ |Ai .

(4.9)
2

Como |Hi y |V i corresponden a alternativas excluyentes, son ortogonales

1  1
= hH|V i = √ hD| + e−iϕ hA| √ |Di + eiφ |Ai

0 (4.10)
2 2
1 −iϕ

= hD|Di + e hA|Di + e hD|Ai + ei(φ−ϕ) hA|Ai

(4.11)
2
1 
= hD|Di + ei(φ−ϕ) hA|Ai , (4.12)
2
en donde tuvimos en cuenta que las propiedades expresadas por |Di y |Ai son excluyentes.
Como a los vectores de polarización les exigı́amos norma unidad, a los kets |Di y |Ai también
se les debe exigir, hD|Di = 1 = hA|Ai. Ası́, deben cumplirse las igualdades

1 
0= 1 + ei(φ−ϕ) , ei(φ−ϕ) = −1, φ = ϕ + (2n + 1)π, n ∈ Z. (4.13)
2
Es común escoger ϕ = 0, n = 0 de manera que φ = π. Las expresiones para los estados
de polarización horizontal y vertical, en términos de los estados de polarización diagonal y
antidiagonal, son
1
|Hi = √ (|Di + |Ai) (4.14a)
2
1
|V i = √ (|Di − |Ai) . (4.14b)
2

EJERCICIO 42. Escriba los estados |Di y |Ai en términos de |Hi y |V i. Escriba los
vectores columna en la base de |Hi y |V i. Describa el montaje experimental correspondiente.
A partir de la ecuación (4.14) podemos encontrar
 
1 . 1 1
|Di = √ (|Hi + |V i) = √ , (4.15a)
2 2 1
 
1 . 1 1
|Ai = √ (|Hi − |V i) = √ . (4.15b)
2 2 −1
Si preparamos un fotón en el estado de polarización diagonal y lo hacemos pasar por un
polarizador con eje de transmisión horizontal (respectivamente vertical) y por un detector,
aproximadamente la mitad de las veces que lo hagamos tendremos una detección. Algo similar
ocurre con fotones con polarización antidiagonal. Las igualdades entre estados de polarización
se escogen de tal manera que sean completamente análogas a las igualdades entre vectores de
polarización.
Ası́ como es existen los polarizadores lineales, que solamente transmiten una polarización
lineal, existen los polarizadores circulares que solamente transmiten la polarización derecha,
por ejemplo.
EJERCICIO 43. Demuestre que la combinación de una placa de cuarto de onda con su
eje rápido en la dirección diagonal seguida de un polarizador horizontal y de otra placa de
cuarto de onda con su eje rápido en la dirección antidiagonal, produce un polarizador que
solamente transmite luz con polarización circular izquierda, al cual llamaremos polarizador
izquierdo. Demuestre que si cambia el polarizador horizontal por uno vertical, solamente se
trasmitirá luz con polarización circular derecha, y tendremos un polarizador derecho.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 65
Supongamos que producimos fotones con polarización derecha, |Ri , e interponemos un
polarizador derecho y un detector. Todos los fotones se detectan. En cambio, si interponemos
un polarizador izquierdo, ninguno sera detectado. Si interponemos un polarizador horizontal,
vertical, diagonal o antidiagonal, alrededor de la mitad de los fotones será detectado. Algo
similar ocurre con los fotones con polarización circular izquierda. A partir de la discusión
que tuvimos con los fotones con polarización diagonal y antidiagonal, y los polarizadores
horizontal y vertical, podemos escribir
1
√ |Hi + eiα |V i

|Ri = (4.16a)
2
1
√ |Hi + eiβ |V i ,

|Li = (4.16b)
2
en donde α = β + (2n + 1)π, en donde n es un número entero. Si escribimos |Ri y |Li en
términos de |Di y |Ai,

|Ri = a1 |Di + a2 |Ai (4.17a)


|Li = a3 |Di + a4 |Ai , (4.17b)

el cuadrado del valor absoluto de todos los coeficientes ai , i = 1, 2, 3, 4 debe ser 1/2. Tomando
el producto escalar de las igualdades (4.17) con |Di encontramos
1 1  1
a1 = hD|Ri = √ (|Hi + |V i) √ |Hi + eiα |V i = (1 + eiα ), (4.18)
2 2 2
1 1 1
= hD|Li = √ (|Hi − |V i) √ |Hi − eiβ |V i = (1 − eiβ ).

a3 (4.19)
2 2 2
Los cuadrados de los valores absolutos de estos coeficientes son
1 1 1
= |a1 |2 = ((1 + cos α)2 + sin2 α) = (2 + 2 cos α) , (4.20)
2 22 4
1 1 1
= |a3 |2 = ((1 − cos β)2 + sin2 β) = (2 − 2 cos β) . (4.21)
2 22 4
Los valores posibles, tanto de α como de β son ± π2 hasta múltiplos de 2π. Ası́, uno de los dos
ángulos debe ser −π/2 y el otro π/2. Para que las igualdades entre estados correspondan a
las igualdades entre polarizaciones, escogemos
 
1 . 1 1
|Ri = √ (|Hi − i |V i) = √ (4.22a)
2 2 −i
 
1 . 1 1
|Li = √ (|Hi + i |V i) = √ , (4.22b)
2 2 i

4.2.1. Efecto Zenón cuántico

4.3. Interferómetro de Mach-Zehnder


Volvamos a los experimentos descritos al comienzo del capı́tulo. El lector atento se pre-
guntará ¿cuál es el estado de los fotones en esos dos experimentos? Podemos ignorar todos los
detalles y decir que uno de los estados corresponde al camino izquierdo |ii, mientras el otro al
derecho |di . Teniendo en cuenta que si un fotón está, con seguridad, en el camino izquierdo, no
está en el derecho y viceversa, los estados |ii y |di deben ser ortogonales.3 Podemos imponer
3 Es posible afinar esta discusión, teniendo en cuenta que los caminos no corresponden a una lı́nea. Los

estados que estudiamos en el capı́tulo anterior, por ejemplo, corresponden a gaussianas con ancho finito.
66 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
que estos estados tengan norma uno. En este caso, es posible tener otros estados, como se ve
en el segundo experimento, en donde existen cuatro alternativas excluyentes. Sin embargo,
para los propósitos de estudiar el primer experimento, podemos pensar que el espacio de ca-
minos es bidimensional. Esta estrategia, de ignorar estados, se aplica en muchas situaciones,
aquellas en las cuales, de manera efectiva, el sistema se encuentra solamente en los estados
escogidos.

Figura 4.2: Mach-Zehnder interferómetro simétrico a la izquierda y asimétrico a la derecha.

Analicemos el montaje de la figura 4.2, conocido como interferómetro de Mach-Zehnder


[84, 85]. La parte inferior de este montaje es igual al primero que consideramos en este capı́tulo,
en donde un divisor de haz 50/50 se interpone en el camino de un haz de luz. En vez de poner
los detectores directamente a las salidas del divisor de haz, interponemos espejos en cada
uno de los haces secundarios de modo que los haces vuelven a encontrarse. En ese punto de
encuentro ponemos otro divisor de haz 50/50 y finalmente, en las salidas del divisor de haz,
ponemos los detectores. Aprovechando que en todo el montaje los estados de camino izquierdo
y camino derecho son claros, vamos a escribir el estado en esa base,

|ψi = α |ii + β |di . (4.23)

Como paso inicial, vamos a modelar los divisores balanceados de haz (50/50). El estado a
la salida del divisor depende linealmente del estado a la entrada
    
αout d11 d12 αin
= . (4.24)
βout d21 d22 βin

Como el divisor es balanceado, el cuadrado de los valores absolutos de los coeficientes d debe
ser 1/2. Es decir, podemos escribir
    
αout 1 exp(iφ11 ) exp(iφ12 ) αin
=√ . (4.25)
βout 2 exp(iφ21 ) exp(iφ22 ) βin

A partir de los análisis de ondas reflejadas y transmitidas sabemos que las ondas transmitidas
no ganan fase, mientras que las ondas reflejadas ganan una fase de π solamente cuando la
luz pasa de un material de ı́ndice de refracción bajo a uno alto, por ejemplo, cuando pasa de
aire a dieléctrico reflectivo. Vamos a suponer que los diferentes espesores de los divisores son
tales que contienen un número entero de longitudes de onda, de tal manera que no agregan
fases. Vamos a suponer que los recubrimientos dieléctricos se encuentran al lado derecho de
los divisores en la figura 4.2. Cuando pasa de aire al dieléctrico reflectivo, se gana una fase de
π; por el contrario, cuando pasa del aire al reflector, el haz reflejado no gana fase de π porque
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 67
el ı́ndice de refracción del vidrio es mayor que el del reflector. Ası́, la acción del divisor se
puede modelar mediante la siguiente igualdad
    
αout 1 1 1 αin
=√ . (4.26)
βout 2 1 −1 βin

Esta no es la forma más general de describir un divisor balanceado de haz, pero es la más
simple. En este caso hemos descrito un divisor balanceado pero asimétrico. En caso de te-
ner divisores simétricos, hay una diferencia de fase de π/2 entre el haz reflejado y el haz
transmitido [86, 87]. El lector puede encontrar una discusión de este tema en las referencias
[88, 89, 90, 91].
EJERCICIO 44. Haga una revisión del modelamiento de divisores de haz. Haga una pre-
sentación enfatizando tanto en que sea fácil de entender, como en su generalidad. Caracterice
un divisor de haz en el laboratorio, o al menos discuta como se podrı́a hacer.
Ahora podemos analizar el estado de la luz en este experimento. Supongamos que el
inicialmente está descrito por el ket |ψ0 i. Después, atraviesa el primer divisor balanceado. En
la base {|ii , |di} el divisor está caracterizado por la matriz que aparece en la ecuación (4.26).
De manera más abstracta, hablaremos de un operador lineal, O, que es un objeto matemático
que transforma un vector (ket) en otro vector, de manera que cumple la ecuación

O (c |ψi + d |χi) = cO(|ψi) + dO(|χi). (4.27)

En el caso del divisor de haz, emplearemos la notación Udb este operador, en donde las letras
db corresponden a divisor balanceado. El estado de la luz, después del divisor de haz, es
Udb |ψ0 i. Después del divisor tenemos unos espejos, descritos por el operador Ue ,
 
. −1 0
Ue = , (4.28)
0 −1

en donde hemos empleado la base {|ii , |di}. El estado, después de los espejos es Ue Udb |ψ0 i ,
y después del segundo divisor de haz

|ψf i = Udb Ue Udb |ψ0 i . (4.29)

Los operadores están ordenados de derecha a izquierda. En la base {|ii , |di} esta ecuación se
escribe ası́        
αf 1 1 1 −1 0 1 1 1 α0
=√ √ . (4.30)
βf 2 1 −1 0 −1 2 1 −1 β0
Efectuando la multiplicación de las matrices, obtenemos el sorprendente resultado
   
αf −α0
= , (4.31)
βf −β0

es decir, el estado únicamente adquirión una fase de π. Si inicialmente el fotón estaba en el


camino izquierdo, α0 = 1, β0 = 0, tendremos que el detector izquierdo (D1 ) detecta todos los
fotones, en cuenta el derecho (D2 ) no detecta ninguno.
Otro detalle sorprendente es que el estado después del primer divisor balanceado es
    
1 1 1 1 1 1
√ =√ . (4.32)
2 1 −1 0 2 1
¿Cómo entendemos un estado en el que el fotón está simultáneamente en el camino izquierdo
y en el derecho?
Para que el experimento funcione como se ha descrito es muy importante que la longitud
de los brazos del interferómetro de Mach-Zehnder sean iguales hasta una pequeña fracción
68 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
de una longitud de onda, o que la diferencia entre las longitudes sea un número entero de
longitudes de onda (de nuevo, con un error que sea una pequeña fracción de una longitud
de onda). También es importante que no haya vibración de ninguno de los elementos que
conforman el divisor de haz. La parte derecha de la figura 4.2 ejemplifica una diferencia de
caminos, una fase que se introduce en el camino izquierdo, después de los espejos simétricos
(uno en el camino izquierdo y otro en el derecho). Esa fase se describe por el operador Uφ , la
cual se representa mediante la matriz
 iφ 
e 0
Uφ = . (4.33)
0 1
En este caso, el estado antes de los detectores es, en términos de kets y operadores, igual a

|ψf i = Udb Uφ Ue Udb |ψ0 i . (4.34)

En la base de caminos izquierdo y derecho,


      iφ    
αf 1 1 1 −1 0 e 0 1 1 1 1
= √ √ (4.35)
βf 2 1 −1 0 −1 0 1 2 1 −1 0
iφ iφ
!  iφ
!
− 21 − e2 1
2 − 2
e
1 − 21 − e2
= eiφ iφ = eiφ
. (4.36)
1
− 12 − e2 0 1
2 − 2 2 − 2

La probabilidad de detectar un fotón en D1 es igual a la norma al cuadrado del primer


coeficiente, 12 (1 + cos φ), y la de detectar un fotón en D1 es 21 (1 − cos φ).

Figura 4.3: Interferencia en un Mach-Zehnder. Fotones detectado en cada uno de los detecto-
res.
La figura 4.3 muestra los conteos en los detectores D1 (MZ1) y D2 (MZ2). Cada canal
corresponde a una diferencia de fase de λ/250. Se ve la dependencia del número de fotones
detectados en cada detector con la diferencia de la lontidud de los brazos.
A partir de la ecuación (4.35), donde φ = 2π∆l λ , parece que no importa si la diferencia de
caminos es grande. En la práctica, especialmente, en experimentos de un fotón, esto no es ası́.
Las probabilidades de detección se convierten en 12 (1 ± V cos φ), en donde V es un número no
negativo menor que uno, que disminuye a medida que se aumenta la diferencia entre caminos.
El parámetro V se conoce como la visibilidad del patrón de interferencia, y puede obtenerse
mediante la ecuación
pmax − pmin
V = = pmax − pmin . (4.37)
pmax + pmin
Para diferencias de longitud suficientemente grandes, la probabilidad de detección en cada
detector es del 50 %. El origen fı́sico de la disminución de visibilidad es que la fase de la fuente
de fotones tiene fluctuaciones aleatorias. Si los caminos son iguales, estas fluctuaciones afectan
ambos brazos de manera idéntica; si no lo son, hay una componente aleatoria en la fase φ. En
diferentes corridas del experimento, estas fases son diferentes. Si la diferencia de caminos es
suficientemente grande, todas las fases son igualmente probables, por lo cual el valor medio
de cos φ es cero.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 69
Un problema del lenguaje empleado aquı́ es qué interfiere con qué. Un campo electro-
magnético interfiere con otro. Pero, si tenemos un único fotón no es claro qué objetos o
campos interfieren.

4.3.1. El experimento de Elitzur-Vaidman

Figura 4.4: l

En 1993 Elitzur y Vaidman [92] propusieron un experimento, realizado un par de años


después [93], para hacer una medición sin interacción. La idea de medir sin que haya interac-
ción no es nueva. Por ejemplo, si tenemos dos cajas, una de ellas con un objeto. Si abrimos
una de las cajas, sin encontrar dicho objeto, sabemos que está en la otra caja.
Supongamos que un fabricante produce bombas que se activan con la absorción de un
único fotón. Debido a problemas de manufactura, el gatillo activado por el sensor de luz (de
un fotón) no funciona en una fracción de las bombas. Los fotones atraviesan el sensor sin
ser detectados. Se quieren encontrar las bombas que funcionan. Sin embargo, si se prueban
y explotan, nos quedamos sin bombas funcionales. Como un único fotón harı́a explotar las
bombas reales, esta parece una misión imposible.
Se propone, sin embargo, el esquema de la figura 4.4, en donde la bomba se sitúa en uno
de los brazos de un interferómetro. Si la bomba es real, hay un 50 % de probabilidad de que
sea detectada por el sensor y haga explotar la bomba. En el 50 % de los casos en los que
no explota, el fotón se detecta en D1 o en D2 , más precisamente, en (cerca de) 25 % de los
casos se detecta en D1 y en los otros 25 %, en D2 . Si la bomba no funciona, hay interferencia
y la bomba se detecta en D1 únicamente. Es decir, si hay detección en D2 , sabemos que
la bomba es funcional, sin explotarla. Si hay detección en D1 no sabemos si la bomba es
funcional. Pasando otro fotón tendremos un 25 % del 25 % de probabilidad de verificar que
es una bomba funcional y 25 % del 25 % de continuar sin saber. Repitiendo este proceso,
tendremos una probabilidad de encontrar bombas funcionales sin explotarlas de
 2  3
1 1 1 1/4 1
p= + + + ··· = 1 = 3. (4.38)
4 4 4 1− 4

En el artı́culo [93] se muestra que la fracción de bombas que se pueden verificar, sin explotarlas,
se puede aproximar al 100 %, usando el efecto Zenón cuántico.

4.3.2. Experimento de elección postergada


Wheeler [94] propuso un experimento (una serie de experimentos) que es una variante del
interferómetro de Mach-Zehnder, en el cual la decisión de poner o quitar el segundo divisor
70 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
de haz se toma después de que el fotón ya ha pasado por el primer divisor. La detección en
D1 o D2 ocurre según la decisión que se tomó, como si se hubiese tomado al comienzo del
experimento.
Descrito de la manera en la que aparece en el párrafo anterior, no lo encontramos ex-
traordinario. El experimento se vuelve sorprendente solamente después de que introducimos
una interpretación clásica diferente para el interferómetro completo de la que tenemos para el
experimento con un único divisor de haz. La retórica consiste en decir que en el primer caso el
fotón se comporta como una onda en el primer caso porque exhibe interferencia, mientras que
en el segundo caso se comporta como una partı́cula, y que esa decisión debe tomarse cuando
se atraviesa el primer divisor de haz. Para aumentar el dramatismo podemos pensar que los
brazos del interferómetro son muy largos; incluso más que la dimensión lineal tı́pica de una
galaxia (en un experimento que usa lentes gravitacionales). Usando ese lenguaje llegamos a la
conclusión de que cuando el fotón llega al lugar en donde hay (o no) segundo divisor de haz,
el cual se puso después de que el fotón atravesara el primero, manda una señal hacia atrás en
el tiempo para corregir la elección, en caso de que esta no hubiese sido la “correcta”. Incluso
existe una formulación de la mecánica cuántica que tiene una propagación hacia el futuro y
otra hacia el pasado.
Los resultados de este experimento en un interferómetro de Mach-Zehnder se reportan en
la referencia [95].

4.4. Borrador cuántico

Figura 4.5: l

El denominado borrador cuántico, originalmente debido a Scully y Drühl[96], es una de


las variaciones más sorprendentes del interferómetro de Mach-Zehnder. En el experimento
ilustrado en la figura 4.5 [97] se aprovechan tanto el camino del fotón, como la polarización.
Empleamos la lı́nea formada al unir los divisores de haz para caracterizar los estados de
4.4. BORRADOR CUÁNTICO 71
camino: el superior |si, por encima y el inferior |ii, por debajo de dicha lı́nea. El montaje
comienza con un polarizador cuyo eje de transmisión es el diagonal, de manera que el estado de
los fotones que entran al primer divisor de haz corresponde al camino superior y polarización
diagonal, |s, Di . Como tenemos esas dos caracterı́sticas, debemos ver qué pasa con cada una
en cada paso del experimento. En el primer divisor de haz solamente se altera el estado de
camino. Como el lado del dieléctrico es el del camino superior, este gan una fase de π; es decir,
el estado después del primer divisor es
1
√ (− |s, Di + |i, Di) . (4.39)
2
Enseguida, el camino inferior encuentra un polarizador lineal vertical. Teniendo en cuenta que
|Di = √12 (|Hi + |V i) , el estado después del polarizador es
 
1 1
√ − |s, Di + √ |i, V i . (4.40)
2 2
Luego, los dos espejos producen una fase de π en cada uno de los caminos,
 
1 1
√ |s, Di − √ |i, V i . (4.41)
2 2
El siguiente elemento es un polarizador lineal en el camino superior. De nuevo, teniendo en
cuenta que |Di = √12 (|Hi + |V i) , podemos escribir el estado como
 
1 1 1 1
√ √ |s, Hi − √ |i, V i = (|s, Hi − |i, V i) . (4.42)
2 2 2 2

La norma al cuadrado de este estado es (1/2)2 + (1/2)2 = 1/2, porque las propiedades de
camino superior y camino inferior son excluyentes (también puede verse desde el punto de
vista de que polarización horizontal y vertical son excluyentes). Esto significa que hemos
perdido la mitad de los fotones. Volvamos a normalizar el estado,
1
√ (|s, Hi − |i, V i) . (4.43)
2
En el segundo divisor balanceado se debe tenr en cuenta que el haz reflejado por el camino
inferior gana una fase de π,
1
|ii → √ (− |ii + |si) . (4.44)
2
Por su parte, el estado superior se transforma ası́:
1
|si → √ (|si + |ii) . (4.45)
2
Si tenemos en cuenta la polarización, vemos que el efecto del segundo polarizador se describe
mediante las ecuaciones
1 1
|s, Hi → √ (|s, Hi + |i, Hi) , |i, V i → √ (− |i, V i + |s, V i) . (4.46)
2 2
El estado de los fotones, después del segundo divisor es, entonces
 
1 1 1 1
√ √ (|s, Hi + |i, Hi) − √ (− |i, V i + |s, V i) = (|s, Hi − |s, V i + |i, Hi + |i, V i) .
2 2 2 2
(4.47)
72 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Vamos a suponer que después del segundo divisor de haz tenemos los detectores. Ds detecta
si los fotones del camino superior, independientemente de que tengan polarización horizontal
o vertical. La probabilidad de que un fotón sea detectado en Ds es (1/2)2 + (1/2)2 = 1/2.
De manera análoga se puede ver que la probabilidad de que se detecte un fotón en el camino
inferior es 1/2.
Hasta ahora no tuvimos en cuenta el piezoeléctrico. Este elemento permite ajustes submi-
crométricos de la posición del espejo correspondiente y produce una diferencia de la longitud
del brazo superior del interferómetro con respecto al brazo inferior. Es decir, podemos pensar
que el espejo no produce una fase de π sino una fase −eiφ .
EJERCICIO 45. Demuestre que teniendo en cuenta esa fase el estado después del segundo
divisor de haz es
1 iφ
e |s, Hi − |s, V i + eiφ |i, Hi + |i, V i

2
y que las probabilidades de detección siguen siendo iguales a 1/2.
¿Porqué la probabilidad no varı́a con la diferencia de fase φ cómo en el interferómetro de
Mach-Zehnder original?
En este caso sabemos que las componentes con polarización horizontal vienen del camino
superior y aquellas con polarización vertical, del inferior. Como podemos distinguir cuál fue
el camino empleado por los fotones, no hay interferencia. Se dice que la polarización marca
los caminos. ¿Podemos borrar la información de los caminos y ver un patrón de interferencia?
Antes del detector Di pongamos un polarizador diagonal. Teniendo en cuenta nuevamente
que |Di = √12 (|Hi + |V i) , vemos que el estado después del polarizador es
 
1 iφ 1 iφ

e |s, Hi − |s, V i + √ e |i, Di + |i, Di .
2 2
La probabilidad de detección en Di es, por lo tanto,
2
1 1
√ ((eiφ + 1) = 1 (1 + cos φ).

2 2 (4.48)
4
Vemos que se recupera el patrón de interferencia, pero con una amplitud menor.

4.5. Ejercicios de taller


1. Suponga que un haz de luz polarizado circularmente a izquierda incide sobre un po-
larizador lineal cuyo eje de transmisión forma un ángulo θ con la horizontal. ¿Cuál es
la probabilidad de que un fotón de dicho haz sea absorbido por el polarizador? ¿Su
respuesta depende del ángulo θ?
2. Cuando un campo eléctrico atraviesa una placa de un cuarto de onda, la componente
lenta gana una fase de π/2 con respecto a la componente rápida. Cuando el campo
atraviesa una placa de media onda, la componente lenta gana una fase de π con respecto
a la componente rápida. Suponga un aparato que consiste de una placa de media onda
con su eje rápido a +22.5◦ de la horizontal, una placa de un cuarto de onda con su eje
rápido en la dirección de la vertical, y una placa de cuarto de onda con su eje rápido
a +45◦ de la horizontal. Encuentre la matriz que representa este aparato. Si un haz de
luz polarizada horizontalmente incide en este aparato, ¿cuál es la polarización del haz
saliente? ¿Cuál es la probabilidad de que un fotón polarizado horizontalmente atraviese
el aparato? ¿Cuál es su polarización final?
3. Demuestre que si un fotón con polarización circular derecha pasa por una placa de
media onda su nueva polarización es circular izquierda, independientemente de cual es
la dirección del eje rápido de la placa.
4.5. EJERCICIOS DE TALLER 73
4. Un aparato consiste de una placa de media onda cuyo eje rápido forma un ángulo θ1
con la horizontal, un polarizador vertical, y una placa de media onda cuyo eje rápido
forma un ángulo θ2 con la horizontal. ¿En qué condiciones este aparato es indistinguible
de un polarizador lineal cuyo eje de transmisión forma un ángulo θ con la horizontal?
¿Cómo cambiarı́an sus respuestas si el polarizador intermedio fuese horizontal?
5. Suponga que tiene un (PBD) Polarizing Beam Displacer que separa la componente
vertical de la horizontal. ¿Cómo puede convertir este aparato en uno que separe la
componente diagonal de la antidiagonal?

6. Diseñe un experimento, o conjunto de experimentos que permitan medir la polarización


de un haz de luz.
7. Demuestre que no existe un vector de polarización que se pueda asociar con luz polari-
zada aleatoriamente.

from wikipedia ([Link] solutions using


rigorous coupled-wave analysis for wire grid polarizers have shown that for electric field com-
ponents perpendicular to the wires, the medium behaves like a dielectric, and for electric
field components parallel to the wires, the medium behaves like a metal (reflective). Yu, X.
J.; Kwok, H. S. (2003). “Optical wire-grid polarizers at oblique angles of incidence”. Journal
of Applied Physics. 93 (8): 4407. Bibcode:2003JAP....93.4407Y. doi:10.1063/1.1559937. ISSN
0021-8979.
74 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Capı́tulo 5

Teorı́a del momento angular

5.1. Introducción
Durante el desarrollo del curso hemos pasado de la polarización, en la cual se puede
usar un formalismo matemático bastante parecido tanto en el dominio clásico como en el
cuántico, al estudio de otros sistemas de dos niveles y a sistemas caracterizados por un grado
de libertad con espectro continuo (sistemas en una dimensión), incluyendo la partı́cula libre,
un pozo cuadrado infinito y el oscilador armónico. A pesar de que se podrı́an estudiar sistemas
de dos grados espaciales de libertad, lo usual es pasar a dimensión 3. De hecho, cuando
estudiamos el pozo infinito de potencial, estudiamos un sistema tridimensional. Entre los
sistemas tridimensionales arquetı́picos se encuentran aquelos problemas con fuerzas centrales.
Para hacer ese estudio es conveniente haber estudiado el momento angular. Ese es el propósito
de este capı́tulo.
Existen dos puntos de partida comunes para estudiar el momento angular: aquél propuesto
por la cuantización canónica y aquél que tiene que ver con las simetrı́as. En el primer abor-
daje, los operadores de posición y momento se substituyen por sus contrapartidas cuánticas.
En el segundo, se identifican los generadores de las simetrı́as espacio-temporales y se les dan
los mismos nombres a los generadores de las mismas simetrı́as. Es claro que los generadores
cuánticos actúan en un espacio diferente, el espacio de Hilbert, a aquél en que actúan los
genradores clásicos (en nuestro curso, el espacio euclı́deo tridimensional más el tiempo, supo-
niendo que el grupo de simetrı́as es el de Galileo). Las simetrı́as del grupo de Galileo incluyen
las rotaciones y las traslaciones espaciales y temporales, además de los cambios de un sistema
de referencia inercial a otro. En la siguiente sección examinamos las rotaciones e identificamos
los generadores de las mismas. Estos generadores son las componentes del momento angular.

5.2. Rotaciones
Una rotación ocurre cuando giramos algún objeto por un ángulo alrededor de un eje. Es fácil
de descubrir que las rotaciones finitas no son conmutativas. Tome un objeto que no posea ni
simetrı́a cúbica ni simetrı́a esférica; por ejemplo, el libro de la figura 5.1. Como se muestra
en la figura, el eje y apunta hacia arriba y ele eje z hacia la derecha, el eje x apunta entrando
a la figura. La posición final del objeto si lo hacemos girar primero por un ángulo de π/2
alrededor del eje x y luego por un ángulo de π/2 alrededor del eje y es diferente de la posición
final del objeto si lo hacemos girar primero por un ángulo de π/2 alrededor del eje y y luego
por un ángulo de π/2 alrededor del eje x.
Cuando rotamos un objeto estamos haciendo transformaciones activas. También podemos
hacer transformaciones pasivas si rotamos los ejes que describen la posición del objeto, pero

75
76 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR

Figura 5.1: Rotación de un libro alrededor de los ejes x e y, o alrededor de los ejes y y x.

dejando que el objeto mismo permanezca fijo.


Si un punto genérico de un cuerpo rı́gido tiene coordenadas (x, y, z) y sufre una rotación
por un ángulo φ alrededor del eje z, mostramos enseguida que las nuevas coordenadas de tal
punto genérico (x0 , y 0 , z 0 ) son
 0    
x x cos φ sin φ 0
y 0  = Rz (φ) y  , ⇒ − sin φ cos φ 0 = Rz (φ). (5.1)
z0 z 0 0 1

Designamos la rotación por un ángulo φ alrededor del eje z por Rz (φ) y a su representación
en el espacio tridimensional por Rz (φ). Enseguida mostramos como obtener la matriz de
rotación Rz (φ), empleando la figura 5.2.

Figura 5.2: Rotación de un punto alrededor del eje z por un ángulo ϕ.

Como la coordenada z no cambia nos concentraremos en la coordenadas (x, y). Si las


coordenadas iniciales del punto eran (x, y) = r(cos θ, sin θ), después de la rotación serán

(x0 , y 0 ) = r(cos(θ + ϕ), sin(θ + ϕ))


= r(cos θ cos ϕ − sin θ sin ϕ, sin θ cos ϕ + cos θ sin ϕ)
= (x cos ϕ − y sin ϕ, y cos ϕ + x sin ϕ).

Si juntamos la ecuación z 0 = z y escribimos el sistema de ecuaciones en forma matricial


llegaremos a la ecuación (5.1). Para describir las rotaciones sobre el eje x y el eje y tenemos
5.3. TEORÍA DEL MOMENTO ANGULAR 77
0 0 0
expresiones similares a la señalada en (5.1), reordenando x, y, z y x , y , z en forma cı́clica, a
saber    
cos φ 0 sin φ 1 0 0
Ry (φ) =  0 1 0 , Rx (φ) = 0 cos φ − sin φ . (5.2)
− sin φ 0 cos φ 0 sin φ cos φ
Para un ángulo infinitesimal  y empleando expansiones hasta segundo orden tenemos que
la matriz correspondiente a una rotación infinitesimal alrededor del eje y seguida por una
rotación infinitesimal alrededor del eje x es

1 − 2 /2 0
  
1 0 0 
Rx () Ry () = 0 1 − 2 /2 −   0 1 0 
2 2
0  1 −  /2 − 0 1 −  /2
2 2
 
1 −  /2  
= 0 1 − 2 /2 −  ,
−  1 − 2

De manera semejante, la matriz correspondiente a las misma rotaciones infinitesimales, en el


orden contrario es
1 − 2 /2 0
  
 1 0 0
Rx () Ry () =  0 1 0  0 1 − 2 /2 − 
2
− 0 1 −  /2 0  1 − 2 /2
1 − 2 /2
 
0 
=  2 1 − 2 /2 −  .
−  1 − 2

De esta manera se tiene que la diferencia entre las matrices correspondientes a las rotaciones
es
−2 0 1 −2 0
     
0 1 0 0
Rx () Ry () − Ry () Rx () = −2 0 0 = 2 1 0 − 0 1 0 . (5.3)
0 0 0 0 0 1 0 0 1

Ahora, una rotación infinitesimal por un ángulo 2 alrededor del eje z, hasta segundo orden
en  está representada por la matriz

−2 0
 
1
Rz (2 ) = −2 1 0 . (5.4)
0 0 1

Finalmente, sustituyendo (5.4) en (5.3), obtenemos la relación de conmutación para las rota-
ciones infinitesimales
[Rx (), Ry ()] = Rz (2 ) − I. (5.5)

5.3. Teorı́a del momento angular


Las rotaciones son operaciones fı́sicas. A cada operación fı́sica le asignamos un sı́mbolo, una
representación matemática. En el caso del espacio tridimensional real la representación se
realiza empleando matrices de rotación R, tal y como lo hemos hecho en la sección anterior.
En el caso del espacio de Hilbert podemos definir un operador asociado a la rotación D(R), b
tal que aplicado sobre un ket represente una transformación de este tipo. Es decir, si el estado
del sistema antes de realizar la rotación es |ψi, en tanto que el estado del sistema después de
realizar la rotación es |ψ 0 i, entonces |ψ 0 i = D(R)
b |ψi . Si, en particular, la rotación es de un
78 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
ángulo φ alrededor del eje z, |ψi el estado antes de la rotación está relacionado con |ψ 0 i el
estado después de la rotación, mediante la igualdad

|ψ 0 i = D(R
b z (φ)) |ψi . (5.6)

Para hacer una rotación por un ángulo φ alrededor del eje z podemos hacer N rotaciones por
un ángulo de φ/N alrededor del eje z. Si el ángulo es suficientemente pequeño el operador de
la rotación debe ser cercano al operador identidad I. b La desviación del operador identidad
debe ser proporcional al ángulo recorrido, en este caso φ/N y a un operador, Jbz en este caso.
En sı́mbolos tenemos
   N  N
D(R
b z (φ)) = D b Rz φ ∼ i
= Ib − Jbz
φ
. (5.7)
N ~ N
Hemos introducido una constante con unidades de momento angular: la constante de Planck
~. Su valor solamente puede determinarse experimentalmente. Esta constante es la misma
constante que aparece en la relación de conmutación canónica de posición y momento [x̂, p̂x ] =
i~. Al operador Jbz lo identificamos como el generador de las rotaciones en torno al eje z. La
igualdad entre las partes izquierda y derecha de la ecuación (5.7) se obtiene en el lı́mite en
que se tienen “infinitas rotaciones infinitesimales”,
 N  
i b φ i b
D(Rz (φ)) = lı́m I − Jz
b b = exp − Jz φ .
N →∞ ~ N ~

Para que el operador D(R


b z (φ)) sea unitario, es necesario que el operador Jbz sea hermı́tico.
EJERCICIO 46. Demuestre la afirmación anterior. Sugerencia: puede ser más fácil hacer
la demostración para transformaciones infinitesimales.
En el caso de una rotación por un ángulo φ alrededor del eje n obtenemos
 
b n (φ)) = exp − i J
D(R b · nφ , (5.8)
~

en donde J
b = Jbx i + Jby j + Jbz k y n es un vector de longitud 1.
Una condición importante que se exige de los operadores que representan las rotaciones es
que deben satisfacer las mismas relaciones que las matrices de rotación. En particular, estos
operadores deben satisfacer la relación de conmutación
h i
D(R
b x ()), D(R b z (2 )) − D(I).
b y ()) = D(R b

Si empleamos la forma infinitesimal de los operadores de rotación, (5.7), y tenemos en cuenta


hasta los términos cuadráticos en , sigue
 
i b 1 b2 2 b i b 1 b2 2 i
I − Jx  − 2 Jx  , I − Jy  − 2 Jx  = Ib − Jbz 2 − Ib
b
~ 2~ ~ 2~ ~
 2 h i  i 
i
−  Jbx , Jby = −  Jbz .
~ ~
De esta forma se tiene la relación de conmutación
h i
Jbx , Jby = i~Jbz . (5.9)

Haciendo permutaciones cı́clicas de los ı́ndices (x → y → z → x ) también se cumplen las


relaciones de conmutación
h i h i
Jby , Jbz = i~Jbx , Jbz , Jbx = i~Jby . (5.10)
5.3. TEORÍA DEL MOMENTO ANGULAR 79
Podemos juntar las relaciones de conmutación (5.9) y (5.10) en la forma compacta,
h i
Jbi , Jbj = i~ijk Jbk . (5.11)

En la ecuación (5.11) empleamos


h i la Pconvención de suma sobre ı́ndices repetidos (es decir,
podrı́amos haber escrito Ji , Jj = i~
b b ijk Jbk ) y el tensor totalmente antisimétrico de Levi-
k
Civita, 
1
 si ijk es una permutación cı́clica de 123,
ijk = −1 si ijk es una permutación cı́clica de 321,

0 en otro caso.

5.3.1. Representaciones irreducibles (Irreps)


Existen muchas maneras de cumplir las relaciones de conmutación para los generadores del
momento angular. Por ejemplo, usando matrices 2×2, matrices 3×3, etc. Para caracterizar una
manera particular de cumplir las relaciones de conmutación (por ejemplo de las rotaciones)
suelen emplearse operadores de Casimir, que son no lineales en los generadores del grupo. En
el caso de las rotaciones tenemos solamente un operador de Casimir, a saber

Jb2 = Jbx2 + Jby2 + Jbz2 .

Veamos que el operador J 2 conmuta con el operador Jz .


h i h i h i h i h i
Jb2 , Jbz = Jbx Jbx , Jbz + Jbx , Jbz Jbx + Jby Jby , Jbz + Jby , Jbz Jby

= −i~Jbx Jby − i~Jby Jbx + i~Jby Jbx + i~Jbx Jby = b


0. (5.12)

EJERCICIO 47. Demuestre que J 2 conmuta con los generadores de las rotaciones alre-
dedor de los ejes coordenados x e y.
De manera semejante a lo que hicimos en el caso del oscilador armónico, definimos los
siguientes operadores escalera

Jb± = Jbx ± iJby = Jb∓ . (5.13)
Debido a que los operadores escalera en la ecuación anterior son combinaciones lineales de los
generadores de las rotaciones, ellos conmutan con el operador de Casimir:
h i
Jb2 , Jb± = b
0. (5.14)

Por otro lado, los operadores escalera no conmutan con el operador Jbz ,
h i h i h i
Jbz , Jb± = Jbz , Jbx ± i Jbz , Jby = i~Jby ± i(−i~Jbx )

= i~Jby ± ~Jbx = ±~(Jbx ± iJby ) = ±~Jb± . (5.15)

Los signos superior e inferior de la ecuación (5.15) son independientes, y ası́, deben leerse dos
ecuaciones independientes de conmutación.
Es importante recordar que operadores que conmutan tienen un conjunto completo de
autovectores comunes.
EJERCICIO 48. Demostrar la afirmación anterior.
EJERCICIO 49. Demostrar que si dos operadores no conmutan, entonces no poseen un
conjunto completo de autoestados comunes. Sugerencia: Pruebe por contradicción. Demuestre
dos operadores que tienen un conjunto completo de autoestados comunes deben conmutar.
Se dice que los operadores Jb2 y Jbz son compatibles porque conmutan entre sı́. Teniendo
en cuenta que J 2 y Jz son compatibles, sabemos que existen estados que son autoestados de
80 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
ambos operadores. Podemos escribir las ecuaciones de autovalores de los operadores cuadrado
del momento angular,J 2 , y de proyección del momento angular alrededor del eje z, Jz , en la
forma

Jb2 |j2 , jz i = j2 |j2 , jz i


Jbz |j2 , jz i = jz |j2 , jz i . (5.16)

Hemos supuesto que el autovalor de J 2 es j2 y que el autovalor de Jz es jz . En el caso del


oscilador armónico, demostramos que si el estado |ni es autoestado del operador número ↠â
con autovalor n, entonces el estado â |ni también es autoestado del operador número ↠â pero
que su autovalor es n−1. Para entender la acción de los operadores escalera los hacemos actuar
sobre un vector propio del cuadrado del momento angular y de la proyección del momento
angular sobre el eje z. Por ejemplo, calculemos

Jb2 (Jb+ |j2 , jz i) = (Jb2 Jb+ ) |j2 , jz i = (Jb+ Jb2 ) |j2 , jz i = Jb+ (Jb2 |j2 , jz i)
= Jb+ (j2 |j2 , jz i) = j2 (Jb+ |j2 , jz i). (5.17)

En la secuencia de igualdades hemos utilizado varias propiedades matemáticas, tales como


que aplicar un operador Jb2 al vector definido por la aplicación del operador Jb+ al vector
|j2 , jz i es equivalente a aplicar el operador producto Jb2 Jb+ al vector |j2 , jz i. Una importante
propiedad que se utilizó es que, como el operador de Casimir Jb2 conmuta con cada una de
las componentes del momento angular, también conmutan con las combinaciones lineales de
las mismas; en particular, con Jb+ . Veamos que definiendo el vector |χi = Jb+ |j2 , jz i , podemos
escribir la ecuación anterior como

Jb2 |χi = j2 |χi . (5.18)

Esta igualdad nos deja claro que el vector |χi es autovector de Jb2 con autovalor j2 ; es decir,
tanto Jb+ |j2 , jz i como |j2 , jz i poseen el mismo autovalores del cuadrado del momento angular.
La demostración de que el operador de bajada Jb− tampoco altera el autovalor de Jb2 es
cmpletamente análoga.
Cuando se aplica un operador arbitrario a un autoestado de la tercera componente del
momento angular, Jbz , el resultado debe ser, en general, una combinación lineal de todos
los autoestados de Jbz . Los operadores escalera, sin embargo, se definen de manera que su
aplicación sobre un autoestado de Jbz conduzca a otro autoestado del mismo operador. En
efecto, veamos las siguientes igualdades
 
Jbz (Jb± |j2 , jz i) = (Jbz Jb± ) |j2 , jz i = Jbz Jb± − Jb± Jbz + Jb± Jbz |j2 , jz i
h i   
= Jbz , Jb± + Jb± Jbz |j2 , jz i = ±~Jb± ± jz Jb± |j2 , jz i

= (jz ± ~)(Jb± |j2 , jz i). (5.19)

La ecuación (5.19) indica que si aplicamos el operador escalera Jb+ a un autovector de Jbz se
obtiene un nuevo vector, Jb+ |j2 , jz i, que también es autovector de Jbz , con un autovalor que es
~ mayor que el autovalor del vector original. Por esta razón, al operador Jb+ se le denomina
operador de subida. De manera completamente análoga, la aplicación del operador Jb− sobre
un autovector de Jbz produce un nuevo autovector de que Jbz con un autovalor ~ menor que
el vector original. Por esta razón, al operador J− se le conoce como operador de bajada.
Merece la pena mencionar que, si el autoestado original |j2 , jz i está normalizado a la unidad,
k |j2 , jz i k2 = 1, el nuevo autovector Jb+ |j2 , jz i tendrá una norma que, en general, será diferente
de la unidad.
5.3. TEORÍA DEL MOMENTO ANGULAR 81
Ahora veamos que el valor esperado de J − Jz en uno de los autoestados comunes de Jb2
b2 b2

y de Jbz ,
hj2 , jz | (Jb2 − Jbz2 ) |j2 , jz i = hj2 , jz | (j2 − j2z ) |j2 , jz i = (j2 − j2z ), (5.20)
también puede escribirse como

hj2 , jz | (Jb2 − Jbz2 ) |j2 , jz i = hj2 , jz | Jbx Jbx + Jby Jby |j2 , jz i = hα | αi + hβ | βi ≥ 0, (5.21)

en donde |αi = Jbx |j2 , jz i y |βi = Jby |j2 , jz i. Empleando (5.21) en (5.20), encontramos la
desigualdad
j2 − j2z ≥ 0, (5.22)
que indica que, dado un valor de j2 existe un valor máximo de j2z . Otra manera de escribir la
desigualdad (5.22),
p
|jz | ≤ j2 ,

muestra que existe un valor máximo de jz , al cual designaremos por jzmax , y un valor mı́nimo
de jz , al cual designaremos por jzmin . Para los autovectores correspondientes a los valores
mı́nimo y máximo de Jbz , la proyección del momento angular alrededor del eje z, se deben
cumplir las igualdades

Jb+ |j2 , jzmax i = 0, y Jb− |j2 , jzmin i = 0, (5.23)

ya que no pueden existir autovectores con autovalor de Jbz mayor que jzmax , ni autovectores
con autovalor de Jbz menor que jzmin .
Vamos a ver que jzmax y jzmin pueden relacionarse con j2 . Para tanto calculamos los
productos de los operadores escalera
 
Jb± Jb∓ = (Jbx ± iJby )(Jbx ∓ iJby ) = Jbx2 + Jby2 ± i Jby Jbx − Jbx Jby
  h i
= Jbx2 + Jby2 + Jbz2 − Jbz2 ± i Jby , Jbx = Jb2 − Jbz2 ± ~Jbz , (5.24)

en donde se ha tenido en cuenta que [Jby , Jbx ] = −i~Jbz .


Si le aplicamos el operador de subida a la ecuación del lado izquierdo de (5.23)

Jb− Jb+ |j2 , jzmax i = 0, (5.25)

y empleamos la identidad (5.24), llegamos a

(Jb2 − Jbz2 − ~Jbz ) |j2 , jzmax i = (j2 − j2zmax − ~jzmax ) |j2 , jzmax i = 0

De aquı́ encontramos la relación deseada entre j2 y jzmax , a saber,

j2 = jzmax (jzmax + ~).

Por otro lado, si le aplicamos el operador de subida a la ecuación del lado derecho de (5.23)

Jb+ Jb− |j2 , jzmin i = 0, (5.26)

y empleamos la identidad (5.24), llegamos a

(Jb2 − Jbz2 + ~Jbz ) |j2 , jzmin i = (j2 − j2zmin + ~jzmin ) |j2 , jzmin i = 0

De aquı́ encontramos que


j2 = jzmin (jzmin − ~).
82 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR

Figura 5.3: Entre jzmin y jzmax hay un número entero de pasos, cada uno correspondiente al
aumentar el autovalor en ~.

Si multiplicamos cada uno de los factores del lado derecho por −1, esta ecuación se puede
escribir como
j2 = −jzmin (−jzmin + ~).
Comparando j2 = jzmax (jzmax + ~) con j2 = −jzmin (−jzmin + ~) vemos que jzmin = −jzmax .
De hecho, existe otra solución: jzmax = jzmin − ~. Esta segunda solución es inválida, porque
implica que jzmax < jzmin , contrariamente a la suposición que se hizo.
Si comenzamos con el vector cuyo valor de momento angular alrededor de z es mı́nimo,
después de aplicar el operador de subida un número entero de veces, digamos n, finalmente
obtenemos el ket cuyo momento angular alrededor de z es máximo, de tal suerte que
n
jzmax = (−jzmax ) + n~ ⇒ jzmax = ~. (5.27)
2

Concluimos que el valor máximo de Jbz corresponde a un múltiplo entero de la mitad de la


constante de Planck.
En general, los autovalores del cuadrado del momento angular y de la componente del
momento angular en la dirección del eje z no se usan para rotular los autovectores comunes
entre ellos. En vez de estos se usan dos rótulos adimensionales, j = n/2 y jz = −j, −j +
1, ..., j − 1, j. Las ecuaciones de autovalores, en términos de j y jz quedan

Jb2 |j, jz i = ~2 j(j + 1) |j, jz i , (5.28)


Jbz |j, jz i = ~jz |j, jz i . (5.29)

La ecuación (5.19), en términos de los nuevos rótulos, muestra que el vector Jb+ |j, jz i es un
autovector de los operadores Jb2 y Jbz con autovalores ~2 j(j + 1) y ~(jz + 1) respectivamente.
De manera similar, el vector Jb+ |j, jz i tiene autovalores ~2 j(j + 1) y ~(jz − 1).

Figura 5.4: Modelo vectorial de los autoestados de Jb2 y Jbz .

En la figura 5.4 se ilustra elpmodelo vectorial de los autoestados comunes de Jb2 y Jbz .
Tenemos una esfera de radio ~ j(j + 1) y planos correspondientes a jz = n~, con n =
5.3. TEORÍA DEL MOMENTO ANGULAR 83
−2, · · · , 2. De esta manera, cada estado corresponderı́a a un cı́rculo, tal como se muestra en
la figura. Los valores de las componentes x e y del momento angular no estarı́an, por lo tanto,
bien definidos.
Si suponemos que los estados |j, jz i están normalizados a la unidad, los vectores Jb± |j, jz i
no lo estarán. Ası́, podemos escribir

hj, jz | Jb− = N ∗ hj, jz + 1| ,


D.C.
Jb+ |j, jz i = N |j, jz + 1i −→

en donde N es una constante de normalización. La letras D.C. se refieren al dual conjugado,


o hermitiano conjugado. Para determinar el valor de N multiplicamos ambas expresiones y
obtenemos

hj, jz | Jb− Jb+ |j, jz i = N N ∗ hj, jz + 1 | j, jz + 1i = |N |2


= hj, jz | Jb2 − Jbz2 − ~Jbz |j, jz i
= ~2 j(j + 1) − ~2 jz2 − ~2 jz
= ~2 j(j + 1) − jz2 − jz
 

= ~2 (j(j + 1) − jz (jz + 1)).

En la derivación anterior empleamos la ecuación (5.24). Si definimos N como la raı́z real


positiva de ~2 (j(j + 1) − jz (jz + 1)) tendremos
p
Jb+ |j, jz i = ~ (j(j + 1) − jz (jz + 1)) |j, jz + 1i . (5.30)

EJERCICIO 50. Mostrar que


p
Jb− |j, jz i = ~ (j(j + 1) + jz (jz − 1)) |j, jz − 1i . (5.31)

Teniendo en cuenta que j 2 + j − jz2 − jz = (j − jz )(j + jz + 1), podemos escribir la acción


de los operadores escalera sobre un autovector de Jb2 y de Jbz como
p
Jb± |j, jz i = ~ (j ∓ jz )(j + ±jz + 1) |j, jz ± 1i . (5.32)

Ejemplo
Si suponemos que j = 1/2, los valores posibles de Jbz serán jz = −1/2 y jz = 1/2. Ası́, los
autoestados simultáneos de Jb2 y de Jbz son dos: |1/2, 1/2i y |−1/2, 1/2i.
Podemos encontrar una representación del operador Jbz haciéndolo actuar sobre un operator
identidad, ası́:
   
1 1 1 1 1 1 1 1
Jz I = Jz , −
b b b ,− + , ,
2 2 2 2 2 2 2 2
 
~ 1 1 1 1 ~ 1 1 1 1
= − ,− ,− + , , .
2 2 2 2 2 2 2 2 2 2

La forma matricial del operador Jbz , en la base de sus autovectores, se consigue escribiendo el
resultado anterior como

1 1 
2, 2
    ~ 
1 1 1 1 0
Jbz = , ,− 2  
2 2 2 2 0 ~2
1 1
2 , − 2

Para encontrar la representación del operador Jbz , recordamos que es una combinación
lineal de los operadores de subida y de bajada Jbz = 1/2(Jb+ + Jb− ) y lo aplicamos a un operador
84 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
identidad
   
1 1 1 1 1 1 1 1
Jbx = Jb+ , − ,− + , ,
2 2 2 2 2 2 2 2
   
1 1 1 1 1 1
1 1
+Jb− , − ,− + , ,
2 2 2 2 2 2 2 2
s         
~ 1 1 1 1 1 1 1 1
= − − + − + 1 , − + 1 ,−
2 2 2 2 2 2 2 2 2
s     
1 1 1 1 1 1 1 1
+~ + − + 1 , −1 ,
2 2 2 2 2 2 2 2
 
~ 1 1 1 1 ~ 1 1 1 1
= , , − + , − , .
2 2 2 2 2 2 2 2 2 2

Los dos términos que no se escribieron explı́citamente son ambos cero: uno porque corresponde
al operador de subida actuando sobre el estado con máximo valor de proyección de momento
angular; el otro porque corresponde al operador de bajada actuando sobre el estado con
mı́nimo valor de proyección de momento angular.
EJERCICIO 51. Usando la misma técnica que empleamos para hallar la representación
matricial de Jbz en la base de sus autovectores, encuentre las representaciones matriciales de
Jbx y de Jby en la base de los autovectores de Jbz .
     
. ~ 1 0 . ~ 0 1 . ~ 0 −i
Jbz = Jbx = Jby = . (5.33)
2 0 −1 2 1 0 2 i 0

EJERCICIO 52. De manera semejante al ejemplo, construya las representaciones ma-


triciales de los operadores Jbx , Jby y Jbz para j = 3/2. También encuentre la representación
matricial de Jb2 .

5.4. Momento angular orbital


Mencionamos, en la introducción, que un punto de partida común para el estudio del momen-
to angular en el formalismo cuántico es la cuantixación canónica. Teniendo en cuenta que el
momento angular en mecánica clásica se define como L = r × p, la cuantización canónica pro-
pone definir el operador de momento angular orbital como L b =b r×p
b . La i-ésima componente
del operador de momento angular orbital será
X
L bm pbn ≡
b i = imn x imn x
bm pbn , (5.34)
mn

en donde en la expresión intermedia hemos empleado la convención de suma sobre ı́ndices


repetidos. Los ı́ndices i, m, n toman los valores 1, 2 y 3. Una alternativa más simple para
definir el momento angular es usar el determinante

ex ey ez

L
b =rb×p b = x
b yb zb . (5.35)
pbx pby pbz

Cada una de las componentes del operador de momento angular orbital es formalmente
hermı́tica L̂†i = L̂i . En efecto,

L̂†i = (imn x
bm pbn ) = imn pb†n x
b†m = imn pbn x
bm = imn x
bm pbn = L̂i .
5.4. MOMENTO ANGULAR ORBITAL 85
En la secuencia de la deducción anterior hemos tenido en cuenta que el hermı́tico conjugado
de un producto de operadores es el producto de los hermı́ticos conjugados en orden inverso y
que los operadores de posición y momento son hermı́ticos. Finalmente, tuvimos en cuenta que,
a causa del tensor antisimétrico nunca se tienen productos de una componente de posición por
su correspondiente momento. Dicho de manera diferente, siempre se tienen productos de una
componente de posición por una componente diferente del momento; como estos operadores
conmutan podemos escribirlos en el orden contrario y recuperar la definición de la i-ésima
componente del momento angular orbital. Regresemos a la forma más explı́cita de las com-
ponentes del momento angular. Si tomamos una componente del momento angular, digamos
L
bz = xbpby − ybpbx , es fácil ver que corresponde a un operador autoadjunto

b †z = (b †
L xpby − ybpbx ) = pb†y x
b† − pb†x yb† = pby x
b − pbx yb = x
bpby − ybpbx = L
bz . (5.36)

Calculemos enseguida el conmutador entre la i-ésima componente del momento angular


orbital, (5.34), con la j-ésima componente,

L
b j = jrs x
br pbs , (5.37)

en donde, nuevamente se empleó la convención de suma sobre ı́ndices repetidos. Recordemos


que cada componente del operador momento pbi (posición x bi ) conmuta con cualquiera otra
componente del operador de momento pbi0 (posición x bi0 ). El conmutador entre las componentes
i y j del momento angular orbital es
h i
Lbi , L
b j = imn jrs [b
xm pbn , x
br pbs ]
= imn jrs {b
xm [b
pn , x
br pbs ] + [b br pbs ] pbn }
xm , x
= imn jrs {b
xm [b
pn , x
br ] pbs + x xm , pbs ] pbn }
br [b
= imn jrs {b
xm (−i~δn,r )b
ps + x pn } .
br (i~δm,s )b (5.38)

En este punto es conveniente reinsertar las sumas implı́citas.


h i X X
L b j = −i~
bi , L imn jrs δn,r x
bm pbs + i~ imn jrs δm,s x
br pbn
mnrs mnrs
X X
= −i~ imn jns x
bm pbs + i~ imn jrm x
br pbn
mns mnr
= −i~ {imn jns x
bm pbs − imn jrm x
br pbn } . (5.39)

En el último paso de la ecuación anterior volvimos a emplear la convención de suma. Ob-


servemos que los ı́ndices sobre los cuales se hacen las dos sumas son diferentes. Comparando
(5.38) con (5.39) vemos que es suficiente eliminar uno de los dos ı́ndices que aparecen en la
delta de Kronecker. Teniendo en cuenta que el tensor totalmente antisimétrico de Levi-Civita
satisface ijk = kij = jki , podemos reordenar los ı́ndices de modo que
h i
L b j = −i~ {nim nsj x
bi , L bm pbs − mni mjr x
br pbn } . (5.40)

Si permutamos dos ı́ndices el signo cambia (ijk = −jik ). Ası́,


h i
L b j = i~ {nim njs x
bi , L bm pbs − mni mrj x
br pbn } . (5.41)

Por otro lado el tensor de Levi-Civita tiene la siguiente propiedad de contracción de ı́ndices
X
abc aef = δbe δcf − δbf δce , abc aef = δbe δcf − δbf δce . (5.42)
a
86 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
En (5.42) hemos escrito la versión sin convención de suma antes de la versión con esta con-
vención, para recordarle al lector que se trata de una suma.
h i
L b j = i~ {nim njs x
bi , L bm pbs − mni mrj x
br pbn }
= i~ {(δij δms − δis δmj )b
xm pbs − (δnr δij − δnj δir )b
xr pbn }
= i~ {δij (b
xm pbm − x
bn pbn ) − δis δmj x br pbn }
bm pbs + δnj δir x

Claramente el primer término, que sin la convención de suma implı́cita se expresa como
X X X X
i~δij ( bm pbm −
x x
bn pbn ) = i~δij ( bn pbn −
x x
bn pbn ), (5.43)
m n n n

es cero.
h i
L b j = −i~ {δis δmj x
bi , L bm pbs − δir δnj x
br pbn }
= −i~ {δis δmj x
bm pbs − δim δsj x
bm pbs }
= −i~(δis δjm − δim δjs )b
xm pbs

En la serie de igualdades anteriores tuvimos en cuenta que los ı́ndices de suma son mudos, y
se les puede cambiar de nombre. Empleando la identidad (5.42), y luego la antisimetrı́a del
tensor de Levi-Civita ante el intercambio de dos de sus ı́ndices, podemos escribir
h i
L b j = −i~kij ksm x
bi , L bm pbs = i~ijk kms x
bm pbs = i~ijk L
bk .

Se tiene entonces que el momento angular orbital satisface las mismas reglas de conmutación
que los generadores de momento angular, a saber,

[L
bi , L
b j ] = i~ijk L
bk . (5.44)

Para obtener este mismo resultado podemos partir de las expresiones explı́citas para dos
de las componentes de momento angular. Calculemos la relación de conmutación [L bx , L
b y ].

[Lx , Ly ] = [ypz − zpy , −xpz + zpx ] = y[pz , z]px + x[z, pz ]py


= i~(xpy − ypx ) = i~Lz (5.45)

Los demás conmutadores se obtienen haciendo permutaciones (Lx → Ly → Lz → Lx ), o


teniendo en cuenta que [A, B] = −[B, A] y haciendo permutaciones, o teniendo encuenta que
un operador conmuta consigo mismo.
EJERCICIO 53. Mostrar directamente, sin emplear el resultado general dado por la
ecuación (5.44), el siguiente conmutador

[L
bx , L
b z ]. (5.46)

Veamos que      
iφ b φ b φ
exp − Jz = cos I − i sin σ
bz .
~ j=1/2 2 2
Si hacemos una rotación de 2π no regresamos al operador identidad. Esta es una señal de que
este caso NO corresponde al momento angular orbital. De hecho, si intentáramos hallar las au-
tofunciones correspondientes, suponiendo que se trata de momento angular orbital llegarı́amos
a algunas contradicciones1 . Las representaciones correspondientes a j = 32 , 52 , ..., 2n+1
2 tam-
poco son representaciones de momento angular orbital. Si j es par puede corresponder a
momento angular intrı́nseco o a momento angular orbital.
1 ver Sakurai[39]
5.4. MOMENTO ANGULAR ORBITAL 87
Consideremos la representación en coordenadas de las componentes cartesianas del mo-
mento angular,

hx| L
b i |Ψi = ijk hx| x
bj pbk |Ψi
= ijk xj hx| pbk |Ψi
 

= ijk xj −i~ hx | Ψi
∂xk

= −i~ijk xj hx | Ψi.
∂xk
De esta manera se tiene que la representación en coordenadas del momento angular orbital
está dada por
. ∂
L
bi = −i~ijk xj . (5.47)
∂xk

5.4.1. Coordenadas curvilı́neas


Una manera alternativa de encontrar los operadores diferenciales consiste en el uso de
los resultados del cálculo vectorial en coordenadas curvilineas ortogonales. Tomando tres
dimensiones espaciales y coordenadas u1 , u2 , u3 , podemos escribir el vector de posición como

r = x(u1 , u2 , u3 )ex + y(u1 , u2 , u3 )ey + z(u1 , u2 , u3 )ez . (5.48)

Podemos definir las superficies u1 = c1 , u2 = c2 , u3 = c3 , donde c1 , c2 , c3 son constantes.


La intersección entre dos de estas superficies constituye una curva coordenada; existen tres
curvas coordenadas. En cada punto, por lo tanto, se pueden construir tres lı́neas tangentes.
En un sistema coordenado ortogonal estas lı́neas tangentes son ortogonales. Si hacemos un
incremento infinitesimal de las coordenadas, la posición también varı́a de forma infinitesimal,
∂r ∂r ∂r
dr = du1 + du2 + du3 . (5.49)
∂u1 ∂u2 ∂u3
|{z} |{z} |{z}
=h1 e1 =h2 e2 =h3 e3

∂r
El vector ∂u i
, i = 1, 2, 3 es tangente a la curva a lo largo de ui en el punto r. Como la norma
de este vector no es, en general, unitaria, podemos definir el vector unitario
∂r
∂r
ei = ∂ui , hi = ∂ui ,

hi
de forma que el incremento infinitesimal puede escribirse
3
X
dr = hi ei dui . (5.50)
i=1

Para encontrar el gradiente en coordenadas curvilı́neas, empleamos las dos expresiones


siguientes
X ∂f
df = ∇f · dr = dui . (5.51)
i
∂ui

A partir de (5.50), encontramos que ei · dr = hi dui . Empleando esta identidad en la ecuación


de arriba enconteamos que
X ∂f 1
∇f · dr = ei · dr, (5.52)
i
∂ui hi
88 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
de modo que la expresión para el gradiente es
X 1 ∂
∇= ei . (5.53)
i
hi ∂ui

Figura 5.5: Elemento de volumen en coordenadas curvilı́neas ortogonales

La divergencia de un campo vectorial g en un punto r se define como


I
1
lı́m g · ndS, (5.54)
∆V →0 ∆V S

en donde S es la superficie cerrada que circunda el punto r,el cual es el punto central del cubo
de la figura 5.5. Calculamos primero la contribución a la integral de superficie lo largo de u1 .
Mientras la normal de la cara de atrás apunta en la dirección de −e1 , la de adelante apunta
hacia e1 . El área de la primera cara es h2 (u1 − du2 1 , u2 , u3 )h3 (u1 − du2 1 , u2 , u3 )du2 du3 ; el área
de la segunda es h2 (u1 + du2 1 , u2 , u3 )h3 (u1 + du2 1 , u2 , u3 )du2 du3 . En la cara posterior, el campo
es g(u1 − du2 1 , u2 , u3 ); en la anterior, es g(u1 + du2 1 , u2 , u3 ). En consecuencia, la contribución
de estas dos caras a la integral de superficie es
du1 du1 du1
−h2 (u1 − , u2 , u3 )h3 (u1 − , u2 , u3 )du2 du3 e1 · g(u1 − , u2 , u3 )
2 2 2
du1 du1 du1
+h2 (u1 + , u2 , u3 )h3 (u1 + , u2 , u3 )du2 du3 e1 · g(u1 + , u2 , u3 )
2 2 2

≈ (h2 (u1 , u2 , u3 )h3 (u1 , u2 , u3 )e1 · g(u1 , u2 , u3 )) du1 du2 du3 .
∂u1
EJERCICIO 54. Muestre que, calculando las contribuciones de las otras caras, la integral
de superficie es
I  
∂ ∂ ∂
g · ndS ≈ (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) du1 du2 du3 ,
S ∂u1 ∂u2 ∂u3
en donde gi = ei · g.
Como el volumen infinitesimal es h1 h2 h3 du1 du2 du3 , la divergencia de g es
 
1 ∂ ∂ ∂
∇·g = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) . (5.55)
h1 h2 h3 ∂u1 ∂u2 ∂u3
Si hacemos g = ∇f vemos que el laplaciano de una función f es
 
2 1 ∂ ∂ ∂
∇ f = ∇ · (∇f ) = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 )
h1 h2 h3 ∂u1 ∂u2 ∂u3
      
1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + . (5.56)
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3

5.4.2. Coordenadas esféricas


Consideremos las coordenadas esféricas ilustradas en la figura 6.1. Las coordenadas cartesianas
pueden ser escritas en términos de las coordenadas esféricas, y viceversa.

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ, (5.57)


p z y
r = x2 + y 2 + z 2 , cos θ = , tan φ = . (5.58)
r x
5.4. MOMENTO ANGULAR ORBITAL 89

Figura 5.6: Coordenadas esféricas.

Las coordenadas cartesianas están definidas en todo el eje real −∞ < x, y, z < ∞, en
tanto que r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π]. Un punto en coordenadas esféricas puede
escribirse como

r = r sin θ cos φ ex + r sin θ sin φ ey + r cos θ ez . (5.59)

Vamos a adoptar la convención u1 = r, u2 = θ y u3 = φ. Si derivamos con respecto a r


tenemos
∂r
= sin θ cos φ ex + sin θ sin φ ey + cos θ ez = h1 er . (5.60)
∂r
Teniendo en cuenta que
2 2 2
(sin θ cos φ) + (sin θ sin φ) + (cos θ) = 1, (5.61)

encontramos que h1 = 1 y, por lo tanto, er = ∂r


∂r .
EJERCICIO 55. Mostrar que h2 = r, h3 = r sin θ y que los vectores unitarios están dados
por
    
er sin θ cos φ sin θ sin φ cos θ ex
 eθ  = cos θ cos φ cos θ sin φ − sin θ ey  . (5.62)
eφ − sin φ cos φ 0 ez

5.4.3. Momento angular en coordenadas esféricas


Teniendo en cuenta los resultados de la sección anterior podemos escribir el gradiente de
una función en coordenadas esféricas como
∂ 1 ∂ 1 ∂
∇ = er + eθ + eφ . (5.63)
∂r r ∂θ r sin θ ∂φ
Teniendo en cuenta que el vector posición es r = er r en coordenadas esféricas y que los
vectores er , eθ , eφ constituyen un conjunto de vectores ortonormales asociados a un sistemas
de ejes derecho (er × eθ = eφ y permutaciones cı́clicas), el momento angular orbital es
 
∂ 1 ∂
L = er r × (−i~∇) = −i~ eφ − eθ . (5.64)
∂θ sin θ ∂φ

Recordemos que en la discusión de la teorı́a del momento angular, las componentes car-
tesianas jugaron un papel importante. Las expresiones para los operadores diferenciales que
90 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
representan las componentes del momento angular son las siguientes:
 
∂ 1 ∂
Lx = ex · L = −i~ ex · eφ − ex · eθ
∂θ sin θ ∂φ
 
∂ cos θ cos φ ∂
= −i~ − sin φ − (5.65)
∂θ sin θ ∂φ

 
∂ 1 ∂
Ly = ey · L = −i~ ey · eφ − ey · eθ
∂θ sin θ ∂φ
 
∂ cos θ sin φ ∂
= −i~ cos φ − (5.66)
∂θ sin θ ∂φ

 
∂ 1 ∂
Lz = ez · L = −i~ ez · eφ − ez · eθ
∂θ sin θ ∂φ
sin θ ∂ ∂
= −i~ = −i~ (5.67)
sin θ ∂φ ∂φ

Usando las expresiones arriba podemos encontrar los operadores diferenciales asocuiados
a los operadores de subida y de bajada.
 
iφ ∂ ∂
L+ = Lx + iLy = ~e + i cot θ (5.68)
∂θ ∂φ

 
∂ ∂
L− = Lx − iLy = ~e−iφ − i cot θ (5.69)
∂θ ∂φ

Enseguida, vamos a calcular el operador diferencial correspondiente al cuadrado del mo-


mento angular.
   
L·L ∂ 1 ∂ ∂ 1 ∂
= − eφ − e θ · e φ − e θ
~2 ∂θ sin θ ∂φ ∂θ sin θ ∂φ
   
∂ ∂ 1 ∂ 1 ∂ ∂ 1 ∂
= −eφ · eφ − eθ + eθ · eφ − eθ
∂θ ∂θ sin θ ∂φ sin θ ∂φ ∂θ sin θ ∂φ

Dado que el vector unitario eφ no depende de θ, el cuadrado del momento angular se simplifica
a
∂2
   
L·L ∂ 1 ∂ 1 ∂ ∂ 1 ∂
= − 2 + eφ · eθ + eθ · eφ − eθ
~2 ∂θ ∂θ sin θ ∂φ sin θ ∂φ ∂θ sin θ ∂φ

Como ∂e
∂θ = (− sin θ cos φ, − sin θ sin φ, − cos θ) = −er , el producto escalar con eφ es cero, y
θ

como eφ y eθ son ortogonales, el segundo término de arriba es cero


   
∂ 1 ∂ ∂eθ 1 ∂ ∂ 1 ∂
eφ · eθ = eφ · + eφ · eθ = 0,
∂θ sin θ ∂φ ∂θ sin θ ∂φ ∂θ sin θ ∂φ

y la expresión para el cuadrado del momento angular sufre una simplificación adicional

∂2
 
L·L 1 ∂ ∂ 1 ∂
= − 2 + eθ · eφ − eθ .
~2 ∂θ sin θ ∂φ ∂θ sin θ ∂φ
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 91
Teniendo en cuenta que eφ y eθ son ortogonales y que θ y φ son independientes, tenemos

∂2
 
L·L ∂eφ 1 ∂ 1 ∂ ∂
= − + eθ · − e θ · e θ .
~2 ∂θ2 ∂φ sin θ ∂θ sin2 θ ∂φ ∂φ

El segundo término de la derecha es


∂eφ
eθ · = (cos θ cos φ, cos θ sin φ, − sin θ) · (− cos φ, − sin φ, 0)
∂φ
= − cos θ cos2 φ − cos θ sin2 φ = − cos θ.

Esta igualdad nos permite escribir el cuadrado del momento angular en la forma

∂2
 
L·L cos θ ∂ 1 ∂ ∂
= − − − eθ · eθ
~2 ∂θ2 sin θ ∂θ sin2 θ ∂φ ∂φ
∂2 cos θ ∂ ∂eθ 1 ∂ 1 ∂2
=− 2 − − eθ · 2 − eθ · eθ 2 .
∂θ sin θ ∂θ ∂φ sin θ ∂φ sin θ ∂φ2

Teniendo en cuenta que ∂e ∂φ = (− cos θ sin φ, cos θ cos φ, 0) = cos θeφ vemos que el tercer
θ

término de la derecha es cero. Por lo tanto,

∂2 1 ∂2 1 ∂2
 
L·L cos θ ∂ 1 ∂ ∂
= − − − 2 = − sin θ − .
~ 2 ∂θ 2 sin θ ∂θ sin θ ∂φ 2 sin θ ∂θ ∂θ sin2 θ ∂φ2
Finalmente, el operador diferencial asociado al cuadrado del momento angular es

1 ∂2
   
2 1 ∂ ∂
L · L = −~ sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2

5.5. Autoestados simultáneos de L b2


bz y L
Aprovechando las expresiones obtenidas en la sección anterior, las ecuaciones de autova-
lores y autovectores simultáneos de L b2 ,
bz y L

b z |l, mi = ~m |l, mi ,
L b 2 |l, mi = ~2 l(l + 1) |l, mi ,
L

pueden escribirse en coordenadas



−i~ Yl,m (θ, φ) = ~mYl,m (θ, φ), (5.70)
∂φ
1 ∂2
   
1 ∂ ∂
−~2 sin θ + Yl,m (θ, φ) = ~2 l(l + 1)Yl,m (θ, φ). (5.71)
sin θ ∂θ ∂θ sin2 θ ∂φ2

En las ecuaciones anteriores empleamos la notación Yl,m (θ, φ) = hθ, φ|l, mi. La solución de la
ecuación diferencial (5.70) es

Yl,m (θ, φ) = Nl,m eimφ Θm


l (θ), (5.72)

donde Nl,m es una constante de normalización y Θm l (θ) es una función de θ. Para que la
función de onda sea univaluada, es necesario que m sea entero. Este argumento, sin embargo,
es relativamente débil, puesto que solo las cantidades fı́sicas medibles, como la densidad de
probabilidad, deben ser univaluadas. Un argumento interesant es el usado en la referencia
[40] en el capı́tulo 7, p 169. Entre las refrencias que tratan este asunto, mencionamos a
Whippman [42], quien discute varios métodos para probar que los valores semienteros del
92 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
momento angular orbital no ocurren; Gray [43] quien argumenta que se debe tener componente
z del momento angular igual a cero, y Gatland [44] quien usa un argumento basado en la
paridad de los autoestados y los cambios de paridad producidos por los operadores escalera.
Para determinar Nl,m de la ecuación (5.72), vamos a suponer que Θm
l (θ) está normalizada
adecuadamente, de manera que
Z 2π Z π Z π
dφ dθ sin θ|Nl,m |2 e−imφ Θ∗l,m (θ)eimφ Θm
l (θ) = 2π|Nl,m |
2
dθ sin θ|Θm
l (θ)|
2
0 0 0
2
= 2π|Nl,m | = 1.

Suponiendo que Nl,m es un número real positivo, encontramos que Nl,m = 1/ 2π , de manera
que la solución de la ecuación diferencial (5.70) queda ası́

1
Yl,m (θ, φ) = √ eimφ Θm
l (θ), (5.73)

Ahora vamos a insertar esta función de onda en la ecuación de autovalores y autofunciones
del cuadrado del momento angular, (5.71), para obtener la ecuación diferencial

m2
 imφ
eimφ m
  
1 ∂ ∂ e m
− sin θ − √ Θ l (θ) = l(l + 1) √ Θl (θ),
sin θ ∂θ ∂θ sin2 θ 2π 2π
∂ 2 imφ

en donde usamos ∂φ2 e = −m2 eimφ . Después de multiplicar por 2πe−iφ sin2 θ, encontra-
mos la ecuación
   
d d
sin θ sin θ + l(l + 1) sin2 θ − m2 Θm
l (θ) = 0. (5.74)
dθ dθ

Tomando en cuenta que

d ∂ d cos θ d
= = sin θ ,
dθ d cos θ dθ d cos θ
podemos transformar la ecuación para Θm m
l (θ) = Pl (cos θ),
   
d d
sin2 θ sin2 θ + l(l + 1) sin2 θ − m2 Plm (cos θ) = 0.
d cos θ d cos θ

Haciendo x = cos θ, recordando que sin2 θ = 1 − cos2 θ = 1 − x2 y dividiendo por 1 − x2 ,


encontramos la ecuación diferencial
m2
    
d d
(1 − x2 ) + l(l + 1) − Plm (x) = 0, (5.75)
dx dx 1 − x2

la cual define los polinomios asociados de Legendre. Ası́, las funciones Yl,m (θ, φ) sin normalizar,
conocidas como armónicos esféricos, son de la forma

Yl,m (θ, φ) = eimφ Plm (cos θ).

5.5.1. Polinomios de Legendre


Si hacemos m=0 en la ecuación (5.75) recibimos
 
d 2 dPl (x)
(1 − x ) + l(l + 1)Pl (x) = 0, (5.76)
dx dx
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 93
ecuación que también se puede escribir como
d2 Pl (x)
 
d 2 dPl (x)
− x + l(l + 1)Pl (x) = 0. (5.77)
dx2 dx dx
La fórmula de Rodrigues define los polinomios de Legendre Pl (x), soluciones de (5.76),
como
1 dl 2
Pl (x) = l (x − 1)l . (5.78)
2 l! dxl
Enseguida mostramos que los polinomios definidos en la ecuación anterior satisfacen la ecua-
ción diferencial (5.77). Teniendo en cuenta que
l  
2 l
X l
(x − 1) = (x2 )(l−k) (−1)k , (5.79)
k
k=0

en donde  
l k!
= ,
k l!(k − l)!
podemos escribir el l-ésimo polinomio de Legendre, no normalizado, Pel (x), en la forma
[l/2] 
dl 2

l
X l (2l − 2k)! l−2k
Pl (x) = l (x − 1) =
e x (−1)k . (5.80)
dx k (l − 2k)!
k=0

El ı́ndice superior de la suma se obtiene sabiendo que se debe satisfacer que l − 2k ≥ 0, y por
lo tanto k ≤ l/2 o k ≤ [l/2], con [x] denotando la función parte entera. De esta forma,
[l−1/2]  
dPel X l (2l − 2k)!
= (−1)k (l − 2k)xl−2k−1
dx k (l − 2k)!
k=0
[l−1/2]  
X
k l (2l − 2k)! l−2k−1
= (−1) x . (5.81)
k (l − 2k − 1)!
k=0

De manera análoga la segunda derivada posee la expansión


[(l−2)/2]
d2 Pel
 
X
k l (2l − 2k)!
= (−1) xl−2k−2 ,
dx 2 k (l − 2(k + 1))!
k=0

en donde el lı́mite superior de la suma se determinó como en la ecuación anterior, exigiendo


que las potencias de x sean positivas, l − 2k − 2 ≥ 0. Haciendo el cambio de ı́ndice n = k + 1
(k = n − 1) resulta
[l/2]
d2 Pel
 
X
n−1 l (2l − 2(n − 1))! l−2n
= (−1) x . (5.82)
dx2 n−1 (l − 2n)!
n=1

Recordemos las relaciones entre coeficientes binomiales


   
l l!n n l
= = , (5.83)
n−1 (n − 1)!(l − (n − 1))!n l−n−1 n
en donde hemos empleado (l − n + 1)! = (l − n)!(l − n + 1). Reemplazando (5.83) en la segunda
derivada dada en (5.82) resulta
[l/2]
d2 Pel
 
X
n n l (2l − 2n + 2)(2l − 2n + 1)(2l − 2n)! l−2k
=− (−1) x ,
dx2 l − n + 1 n (l − 2n)!
n=0
[l/2]  
X
l l (2l − 2k)! l−2k
=− 2k(2l − 2k + 1)(−1 ) x , (5.84)
k (l − 2k)!
k=0
94 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
en donde se ha cambiado n por k. Multiplicando por x2 a la ecuación (5.81) se tiene
[(l−1)/2]  
2 dPl
e X
k l (2l − 2k)! l−2k+1
x = (−1) x .
dx k (l − 2k − 1)!
k=0

El resultado de derivar este producto con respecto a x es


! [(l−1)/2]  
d 2 dPl
e X l (2l − 2k)! (l − 2k + 1) l−2k
x = (−1)k x (l − 2k)
dx dx k (l − 2k − 1)! (l − 2k)
k=0
[(l−1)/2]  
X
k l (2l − 2k)!
= (−1) (l − 2k)(l − 2k + 1)xl−2k . (5.85)
k (l − 2k)!
k=0

Substituyendo (5.84), (5.85) y (5.80) en (5.77) se recibe


[l/2]  
X
l l (2l − 2k)! l−2k
− 2k(2l − 2k + 1)(−1 ) x
k (l − 2k)!
k=0
[(l−1)/2]  
X
k l (2l − 2k)!
− (−1) (l − 2k)(l − 2k + 1)xl−2k
k (l − 2k)!
k=0
[l/2]  
X l (2l − 2k)! l−2k
+ l(l + 1) x (−1)k . (5.86)
k (l − 2k)!
k=0

Analizamos los lı́mites superiores de las sumas, pues al parecer son diferentes. Suponiendo l
impar, digamos l = 2m + 1 resulta que
         
l−1 2m + 1 − 1 l 2m + 1 1
= = m, = = m+ = m.
2 2 2 2 2
Por su parte, si l es par, digamos l = 2m resulta que
       
l 2m l−1 2m − 1 1
[ ]= = m, = = m−1+ = m − 1.
2 2 2 2 2
Esto significa que si l es par la segunda suma de (5.86) va únicamente hasta m − 1. Sin
embargo, es posible extender la suma hasta m porque, debido al factor (l − 2k), dicho término
es idénticamente igual a cero. Ası́, podemos escribir la ecuación (5.86) de modo simplificado
m  
X l (2l − 2k)! l−2k
− 2k(2l − 2k + 1)(−1l ) x
k (l − 2k)!
k=0
m  
X
k l (2l − 2k)!
− (−1) (l − 2k)(l − 2k + 1)xl−2k
k (l − 2k)!
k=0
m  
X l (2l − 2k)! l−2k
+ l(l + 1) x (−1)k . (5.87)
k (l − 2k)!
k=0

Sacando el factor común en las tres sumas llegamos a


m
X
(−2k(2l − 2k + 1) − (l − 2k)(l − 2k + 1) + l(l + 1)) ×
k=0
 
l l (2l − 2k)! l−2k
× (−1) x .
k (l − 2k)!
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 95
Para que esta suma sea idénticamente cero es necesario y suficiente que los coeficientes de
cada una de las potencias de x que están presentes en la suma sean cero. Los coeficientes son
realmente cero como se ve enseguida:

l(l + 1) − 2k(2l − 2k + 1) − (l − 2k)(l − 2k + 1)


= l2 + l − 4kl + 4k 2 − 2k − (l2 − 4kl + 4k 2 ) − (l − 2k) = 0.

Pongamos de nuevo el factor de normalización definido en la fórmula de Rodrigues (5.78)


[l/2]  
1 X k l (2l − 2k)! l−2k
Pl (x) = (−1) x . (5.88)
l
2 l! k (l − 2k)!
k=0

Es fácil verificar que los primeros polinomios de Legendre están entonces dados por

P0 (x) = 1, (5.89a)
P1 (x) = x, (5.89b)
3 1
P2 (x) = x2 − , (5.89c)
2 2
5 3
P3 (x) = x3 − x. (5.89d)
2 2
La normalización introducida es tal que Pl (1) = 1. Los polinomios de Legendre son pares o
impares como puede verse fácilmente,
[l/2]  
1 X k l (2l − 2k)!
Pl (−x) = l (−1) (−x)l−2k
2 l! k (l − 2k)!
k=0
[l/2]  
1 Xl k l (2l − 2k)! l−2k
= (−1) l (−1) (x)
2 l! k (l − 2k)!
k=0
= (−1)l Pl (x). (5.90)

EJERCICIO 56. Determinar los Pl (cos θ) hasta l = 3.

5.5.2. Polinomios asociados de Legendre


Pasamos a encontrar las soluciones a la ecuación (5.75). Si escribimos la ecuación (5.76)
en la forma
d2 Pl (x) dPl (x)
(1 − x2 ) 2
− 2x l(l + 1)Pl (x) = 0,
dx dx
y la derivamos m veces con respecto a x, tenemos

dm 2
 
2 d Pl dPl
(1 − x ) − 2x + l(l + 1)P l = 0. (5.91)
dxm dx2 dx

Para realizar las derivadas usamos la Regla de Leibniz, a saber,


n
dn
 
X n
(f (x)g(x)) = (f g)(n) = f (n−k) g (k) . (5.92)
dx n k
k=0

Esta fórmula puede probarse por inducción. Es claro que la ecuación (5.92) se cumple para
n = 1. Si suponemos que la regla de Leibniz se cumple para n entonces se puede mostrar que
96 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
también se cumple para n + 1. Aplicando la regla de Leibniz se tiene entonces
m
d2 Pl dm−1 d2 Pl
   
m 2 d m
(1 − x ) m + (−2x)
0 dx dx2 1 dxm−1 dx2
m−2 2
 
m d d Pl
+ (−2) m−2 (5.93)
2 dx dx2
m
 m−1
dm Pl
   
m d dPl m d dPl
−2 x m + + l(l + 1) = 0,
0 dx dx 1 dxm−1 dx dxm

en donde los coeficientes combinatorios son


     
m m m m(m − 1)
= 1, = m, = .
0 1 2 2

Substituyendo los valores de los coeficientes tenemos

dm d2 Pl dm−1 d2 Pl dm−2 d2 Pl
(1 − x2 ) m + (−2mx) − m(m − 1)
 dx dx2 dxm−1 dx2 dxm−2 dx2
dm dPl dm−1 dPl dm Pl

−2 x m + m m−1 + l(l + 1) m = 0.
dx dx dx dx dx

Reorganizando las derivadas escribimos


2
 m 
d d m Pl
 m 
d dm P l
 
2 d d Pl d Pl
(1 − x ) 2 − 2mx − m(m − 1) − 2x
dx dxm dx dxm dxm dx dxm
 m  m
d Pl d Pl
− 2m + l(l + 1) m = 0.
dxm dx

Sumando los coeficientes correspondientes a las derivadas del mismo orden llegamos a

d2 dm Pl d dm Pl
   
(1 − x2 ) 2 − 2(m + 1)x (5.94)
dx dxm dx dxm
 m 
d Pl
+ [l(l + 1) − m(m + 1)] = 0.
dxm

Definimos las funciones Plm (x) a través de

dm Pl dm Pl
Plm (x) = (1 − x2 )m/2 , → = (1 − x2 )−m/2 Plm (x). (5.95)
dxm dxm
Derivando (5.95) con respecto a x hallamos

d d m Pl dP m (x)
 
m
m
= − (1 − x2 )−m/2−1 (−2x)Plm (x) + (1 − x2 )−m/2 l
dx dx 2 dx
m
dP (x)
= mx(1 − x2 )−m/2−1 Plm (x) + (1 − x2 )−m/2 l . (5.96)
dx
Empleamos la regla de Leibniz para encontrar la segunda derivada de (5.95) con respecto a
x,

d2 dm Pl
 
= m(1 − x2 )−m/2−1 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−2 Plm (x)
dx2 dxm
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2−1 l + (1 − x2 )−m/2 . (5.97)
dx dx2
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 97
Usando (5.95–5.97) en la ecuación diferencial (5.94) se recibe
m(1 − x2 )−m/2 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−1 Plm (x)
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2 l + (1 − x2 )−m/2+1
dx dx2
m
 
2 −m/2−1 m 2 −m/2 dPl (x)
− 2(m + 1)x mx(1 − x ) Pl (x) + (1 − x )
dx
+ [l(l + 1) − m(m + 1)](1 − x2 )−m/2 Plm (x) = 0.

Multiplicando ahora por (1 − x2 )m/2 produce


dP m (x) d2 Plm (x)
mPlm (x) + m(m + 2)x2 (1 − x2 )−1 Plm (x) + 2mx l + (1 − x2 )
 dx dx2
m

dPl (x)
− 2(m + 1)x mx(1 − x2 )−1 Plm (x) +
dx
+ [l(l + 1) − m(m + 1)]Plm (x) = 0.
Juntamos los coeficientes de la función P y sus derivadas,
(m + m(m + 2)x2 (1 − x2 )−1 − 2(m + 1)mx2 (1 − x2 )−1 + l(l + 1) − m(m + 1))Plm (x)
dPlm (x) d2 Plm (x)
+ (2mx − 2(m + 1)x) + (1 − x2 ) = 0.
dx dx2
Simplificando arribamos a
1 − x2 x2 dP m (x) d2 Plm (x)
(l(l + 1) − m2 2
− m2 2
)Plm (x) − 2x l + (1 − x2 ) = 0.
1−x 1−x dx dx2
d2 Plm (x) dPlm (x)
 
1
(1 − x2 ) 2
− 2x + l(l + 1) − m2 Plm (x) = 0. (5.98)
dx dx 1 − x2
Comparando (5.98) con (5.75) percibimos que son idénticas. Es decir, hemos encontrado las
soluciones a dicha ecuación. Recordando la definición de Plm (x), (5.75), y la de los polinomios
de Legendre, (5.78), podemos escribir los polinomios asociados de Legendre en la forma

d|m| 1 2 |m|/2 d
|m|+l
Plm (x) = (1 − x2 )|m|/2 P l (x) = (1 − x ) (x2 − 1)l . (5.99)
dx|m| 2l l! dx|m|+l
Las autofunciones comunes de Lbz y Lb 2 , teniendo en cuenta la normalización, son
 1
m+|m| (2l + 1)(l − |m|)! 2 imφ |m|
Ylm (θ, φ) = (−1) 2 e Pl (cos θ). (5.100)
4π(l + |m|)

5.6. Autoestados usando los operadores escalera


Recordemos que una manera de obtener los autoestados normalizados del oscilador armóni-
co simple es haciendo actuar el operador de subida sobre la función de onda normalizada del
estado base.
Para determinar los armónicos esféricos se puede comenzar escribendo en coordenadas
L+ |l, li = 0, (5.101)
y luego empleando el operador de bajada. La ecuación en coordenadas
 
iφ ∂ ∂
hθ, φ| L+ |l, li = ~e + i cot θ Ylm (θ, φ) = 0,
∂θ ∂φ
98 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
imφ
e√
puede resolverse recordando que Ylm (θ, φ) = Θm (θ).
2π l
La ecuación resultante

dPll
= l cot θPll ,

admite la solución ln Pll = l ln sin θ + C, en donde C es una constante. Despejando P tenemos
Pll (cos θ) = C̃ sinl (θ), siendo Pll (cos θ) = C̃ otra constante, cuya norma se puede determinar
mediante la condición de normalización de la función de onda
Z π √
πΓ(l + 1)
sin θdθ|C̃|2 sin2l θ = |C̃|2 = 1.
0 Γ(l + 23 )

EJERCICIO 57. Obtener Yll−1 (θ, φ) y Yll−2 (θ, φ) con la normalización apropiada, usando
el operador de bajada.
El desarrollo de los armónicos esféricos empleando los operadores de subida y de bajada
se puede encontrar en [41], p 320.
EJERCICIO 58. Demuestre que en la representación de coordenadas
 2
1 ∂2

. ∂ ∂ ∂
L+ L− = −~2 + cot θ + + i .
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ
y
∂2 1 ∂2
 
. ∂ ∂
L+ L− = −~2 + cot θ + −i .
∂θ 2 ∂θ sin2 θ ∂φ2 ∂φ
Finalmente encontramos que las componentes cartesianas del momento angular se escriben
ası́
 
. ∂ ∂
Lx = −i~ − sin φ − cot θ cos φ , (5.102a)
∂θ ∂φ
 
. ∂ ∂
Ly = −i~ cos φ − cot θ sin φ , (5.102b)
∂θ ∂φ
. ∂
Lz = −i~ , (5.102c)
∂φ
en la representación de coordenadas. En el caso de los operadores de subida y bajada tenemos
 
. ∂ ∂
L± = ~ exp (±iφ) ± + i cot θ , (5.103)
∂θ ∂φ
y para el cuadrado del operador del momento angular
 2
1 ∂2

2 . 2 ∂ ∂
L = −~ + cot θ + . (5.104)
∂θ2 ∂θ sin2 θ ∂φ2

b2 = 1 L
 
L b+ L
b− + L b− L
b+ + L b 2z (5.105)
2
   
2 iφ ∂ ∂ −iφ ∂ ∂
L+ L− = −~ e
b b − + i cot θ e + i cot θ (5.106)
∂φ ∂φ ∂φ ∂φ
Empleando la relación  
∂ −iφ −iφ ∂
e =e −i + , (5.107)
∂φ ∂φ
y la relación
∂ 1 ∂
cot θ = − 2 + cot θ (5.108)
∂θ sin θ ∂θ
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 99
arribamos a
∂2 1 ∂2
 
. ∂ ∂
L+ L− = −~2 2
+ cot θ + 2 2
+i . (5.109)
∂θ ∂θ sin θ ∂φ ∂φ
EJERCICIO 59. De manera semejante a la presentada en el texto demostrar que en la
representación de coordenadas
 2
1 ∂2

. 2 ∂ ∂ ∂
L+ L− = −~ + cot θ + −i . (5.110)
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ

El momento angular orbital no puede tomar valores semienteros porque al realizar una
rotación por 2π la función de onda adquirirı́a un signo negativo. Sin embargo, la función
de onda debe ser univaluada para que la expansión de un vector de estado en términos de
autoestados de posición sea única. Si consideramos posible la existencia de estados de momento
angular correspondientes a valores semienteros, tendremos que la función de onda
1 1
hr, θ, φ | , − i = 0, (5.111)
2 2
es diferente de aquella obtenida de
1 1
hr, θ, φ| L− | , i , (5.112)
2 2
en donde
1 1
L+ | , i = 0. (5.113)
2 2
Ejemplos de autoestados de Lz y L2 en coordenadas esféricas.
100 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
Capı́tulo 6

Potenciales Centrales

6.1. Introducción
El estudio de los sistemas cuánticos se vuelve muy complicado rápidamente, no solo por-
que los potenciales de sistemas fı́sicos reales son tridimensionales, sino porque la ecuación de
Schrödinger no se escribe en el espacio fı́sico de tres dimensiones, sino en el de configuración;
es decir, si tenemos dos partı́culas que se mueven en el espacio, la ecuación de Schrödinger
depende de seis parámetros, tres coordenadas para la primera partı́cula y otras tres coordena-
das para la segunda. Aún en el caso de una sola partı́cula, en general no es posible ni resolver
la ecuación de movimiento ni encontrar las autofunciones y los autovalores de manera analı́ti-
ca. Dentro de los casos completamente solubles, o que se pueden simplificar enormemente,
tenemos los casos de una sola partı́cula que se mueve en un potencial tridimensional central,
o de dos partı́culas cuyo potencial de interacción depende de la distancia entre ellas (y que
no están expuestas a ningún potencial externo). En este capı́tulo hacemos algunas conside-
raciones generales sobre los potenciales centrales y estudiamos en más detalle el átomo de
hidrógeno.
Comenzamos con un ejemplo para motivar el tema.

6.1.1. El oscilador armónico tridimensional isotrópico


Supongamos que tenemos un oscilador armónico tridimensional isotrópico, cuyo Hamilto-
niano es
p2x + p2y + p2z mω 2 2
H= + (x + y 2 + z 2 ). (6.1)
2m 2
La solución general de la ecuación de Schrödinger correspondiente,
~2
 2
∂2 ∂2 mω 2 2
  
∂Ψ(x, y, z, t) ∂ 2 2
i~ = − + + + (x + y + z ) Ψ(x, y, z, t),
∂t 2m ∂x2 ∂y 2 ∂z 2 2
que puede encontrarse utilizando el método de separación de variables, es la combinación
lineal de todas las soluciones de la forma
Ψ(x, y, z, t) = X(x)Y (y)Z(z)e−iEt/~ . (6.2)
Substituyendo la función de onda de prueba (6.2) en la ecuación de Schrödinger, obtenemos
iEt
EXY Ze− ~ =
~2 d2 X d2 Y d2 Z mω 2 2
   
iEt
− Y Z 2 + XZ 2 + XY + (x + y + z )XY Z e− ~ .
2 2
2m dx dy ∂z 2 2

101
102 CAPÍTULO 6. POTENCIALES CENTRALES
− iEt
Dividiendo por XY Ze encontramos
~

~2 1 d2 X 1 d2 Y 1 d2 Z mω 2 2
   
2 2
E= − + + + (x + y + z )
2m X dx2 Y dy 2 Z ∂z 2 2
2 2 2 2 2 2
mω 2 y 2
   
~ d X mω x ~ d Y
= − + + − +
2mX dx2 2 2mY dy 2 2
| {z } | {z }
=EX =EY

~2 d2 Z mω 2 z 2
 
+ − + .
2mZ dz 2 2
| {z }
=EZ

De este modo hemos encontrado las tres ecuaciones


~2 d2 X mω 2 x2
− + X = EX X,
2m dx2 2
~2 d2 Y mω 2 y 2
− 2
+ Y = EY Y,
2m dy 2
~2 d2 Z mω 2 z 2
− 2
+ X = EZ Z,
2m dz 2
que son las ecuaciones de Schrödinger, independientes del tiempo, para osciladores unidi-
mensionales de frecuencia ω, en las coordenadas x, y y z, respectivamente. Las autoenergı́as
totales son la suma de las autoenergı́as de cada uno de los problemas unidimensionales. Las
autoenergı́as y autofunciones del oscilador armónico cuántico unidimensional, que estudiamos
anteriormente, son
1 Hk ( xb ) − x22
φk (x) = √
4
√ e 2b , k = 0, 1, 2 · · ·
πb2 2k k!
p
en donde b = ~/(mω). Los primeros polinomios de Hermite, Hn (x), son

H0 (x) = 1, H1 (x) = 2x, H2 (x) = 4x2 − 2.

Las autoenergı́as, por su parte, son En = ~ω(n + 21 ). Si tenemos un oscilador armónico


tridimensional, sus autofunciones

Φkmn (r) = φk (x)φm (y)φn (z),

con autoenergı́as
 
3
Ekmn = ~ω k + m + n + ,
2
dependen de tres enteros no negativos k, m y n.
Dado que el Hamiltoniano del oscilador armónico tridimensional (6.1) puede escribirse
como

b =p b mω 2 r
b·p b·r
b
H + ,
2m 2
parece claro que es invariante ante rotaciones. Este argumento puede escribirse de manera
más formal.
La fórmula de Rodrigues nos dice que cuando rotamos un vector r del espacio tridimen-
sional por un ángulo θ alrededor de la dirección n̂, se obtiene un nuevo vector r0

r0 = r cos θ + (n̂ × r) sin θ + n̂ (n̂ · r)(1 − cos θ).


6.1. INTRODUCCIÓN 103
Si el ángulo es infinitesimal, la fórmula de Rodrigues se reduce a

r0 = r + (n̂ × r) θ + O(θ2 ),
r = r0 − (n̂ × r0 ) θ + O(θ2 ).

Es importante ver que estamos ante una transformación activa: tenı́amos un vector y lo
rotamos para obtener un nuevo vector (o podrı́amos tomar un cuerpo y rotarlo). Podrı́amos
haber tenido una transformación pasiva, en la que un sistema de referencia se obtiene a
partir de otro mediante una rotación por un cierto ángulo alrededor de alguna dirección. La
representación matemática de una transformación activa es la inversa de la transformación
pasiva correspondiente.
Si ψ(r) es la función de onda de un sistema cuántico y ψ 0 (r) es la función correspondiente,
después de que se ha rotado el sistema, entonces el valor de ψ 0 en el punto rotado debe ser
igual a la función de onda original en el punto sin rotar,


ψ 0 (r0 ) = ψ(r) = ψ(r0 − (n̂ × r0 ) θ) = ψ|θ=0 + θ + O(θ2 )
dθ θ=0
X ∂ψ ∂(r0 − (n̂ × r0 ) θ)i
= ψ(r0 ) + θ 0
+ O(θ2 ) (6.3)
i
∂r i ∂θ
θ=0

El segundo término de la derecha puede evaluarse usando el siguiente resultado


X ∂ψ ∂(r0 − (n̂ × r0 ) θ)i X ∂ψ ∂(r0 − ijk nj r0 θ)
i k
0
= 0

i
∂ri ∂θ
θ=0 i
∂ri ∂θ
θ=0
 
X X ∂ψ X ∂ψ
=−  ijk nj rk0  0 = − jki nj rk0 0
i
∂ri ∂ri
jk ijk
!
X X ∂ψ
=− nj jki rk0 0 = −n · r0 × ∇0 ψ(r0 ),
j
∂r i
ki

en donde usamos
P el hecho de que la i-ésima componente del producto vectorial a × b es
(a × b)i = jk ijk aj bk , siendo ijk el tensor totalmente antisimétrico de Levi-Citiva, que
vale 1 si ijk es una permutación cı́clica de 123, -1 si es una permutación cı́clica de
P321, y
0 en los demás casos. También tuviemos en cuenta que ijk = jki y que a · b = j aj bj .
Empleando el resultado anterior en la ecuación (6.3) obtenemos

ψ 0 (r0 ) = ψ(r0 ) − θn · r0 × ∇0 ψ(r0 ) + O(θ2 ).

Teniendo en cuenta que r0 es un punto genérico, podemos sustituirlo por r,


i
ψ 0 (r) = ψ(r) − θn · r × ∇ψ(r) + O(θ2 ) = ψ(r) − θn · r × (−i~∇ψ(r)) + O(θ2 ).
~
Ahora es posible identificar el vector de momento angular. Ası́, hasta primer orden en θ (es
decir, suponiendo que θ es infinitesimal)
i
hr|ψ 0 i = hr| I − θn · L̂ |ψi .
~
Si θ es finito, se puede alcanzar haciendo N rotaciones sucesivas por un ángulo de θ/N,
 N
0 i
|ψ i = lı́m I − θn · L̂ |ψi = e−iθn·L̂/~ |ψi .
N →∞ ~
104 CAPÍTULO 6. POTENCIALES CENTRALES
Hemos concluido que el operador unitario Un (θ) = e−iθn·L̂/~ representa una rotación
por un ángulo θ alrededor de la dirección n. Si O es un operador de un sistema cuántico, el
operador correspondiente después de rotar el sistema por un ángulo θ alrededor de la dirección
n es
∞  m
0 −iθn·L̂/~ iθn·L̂/~
X 1 −iθ
O =e Oe = [n · L̂, •]m O, (6.4)
m=0
m! ~

en donde

[A, •]O = [A, O], [A, •]2 O = [A, •][A, •]O = [A, •][A, O] = [A, [A, O]],
[A, •]3 O = [A, •][A, •]2 O = [A, •][A, [A, O]] = [A, [A, [A, O]]].

Las demás potencias se pueden encontrar de manera semejante.


EJERCICIO 60. Empleando la ecuación (6.4) encontrar e−iθn·L̂/~ Oeiθn·L̂/~ , en donde O
corresponde a cada una de las componentes de la posición y a cada una de las componentes
del momento.
EJERCICIO 61. Teniendo en cuenta que H 0 = e−iθn·L̂/~ Heiθn·L̂/~ , en donde H está dado
por la ecuación (6.1), se puede escribir como

b0 · p
p b0 b0 · r
mω 2 r b0
H0 = + ,
2m 2

en donde p b0 y r
b0 son los que usted encontró en el ejercicio anterior.
El ejercicio anterior muestra que la forma del Hamiltoniano es la misma, antes y después
de la rotación. Es posible concluir, por lo tanto, que las autofunciones del oscilador armónico
tridimensional isotrópico deben tener alguna relación con el momento angular. Para develar
esta relación escribimos explı́citamente las funciones de onda del estado base, con energı́a
3~ω
E000 = 3 × ~ω 2 y de los tres estados degenerados con energı́a 2 × 2 + 2 = 5 × 2 ,
~ω ~ω


1 r2
− 2b 2z − r22
Φ000 (r) = √
4
e ,2
Φ001 (r) = √
4
e 2b ,
π 3 b6 π 3 b6
√ √
2x − r22 2y − r22
Φ100 (r) = √
4
e 2b , Φ010 (r) = √
4
e 2b .
π 3 b6 π 3 b6
Vamos a analizar el efecto de aplicar las componentes del momento angular sobre funciones
que dependen únicamente de r2 . Comenzamos calculando las derivadas parciales.

∂ dF ∂r2 dF ∂ dF ∂ dF
F (u = r2 ) = = 2x , F (u) = 2y , F (u) = 2z .
∂x du ∂x du ∂y du ∂z du

Ası́, al aplicar la componente z del momento angular sobre F obtenemos


 
b z F (r2 ) = −i~ x ∂ − y ∂ F (u = r2 ) = −i~ (x × 2y − y × 2x) dF = 0.
L
∂y ∂x du
 
También tenemos L b 2 F (r2 ) = L bz L b z F (r2 ) = L b z 0 = 0. Debido a la simetrı́a vemos que tam-
z

bién valen las relaciones L b 2x F (r2 ) = 0 = L b 2y F (r2 ). Finalmente, sumando estos tres resultados
2 2
encontramos L b F (r ) = 0.
Como la función de onda Φ000 (r) depende solamente de r2 , podemos concluir que

b z |000i = 0 = 0~ |000i ,
L b 2 |000i = 0 = 0(0 + 1)~2 |000i .
L
6.2. POTENCIALES CENTRALES 105
Hemos escrito estas ecuaciones de modo que quede claro que el estado |000i es autoestado de
L b 2 también con autovalor 0, es decir, corresponde a l = 0 y m = 0.
b z con autovalor 0 y de L
EJERCICIO 62. Mostrar que
b z |001i = 0~ |001i ,
L b 2 |001i = 1(1 + 1)~2 |001i
L
b z |+i = ~ |+i ,
L b 2 |+i = 1(1 + 1)~2 |+i
L
b z |−i = −~ |−i ,
L b 2 |−i = 1(1 + 1)~2 |−i
L

donde
|100i + i |010i |100i − i |010i
|+i = √ , |−i = √ .
2 2
Notar que pasamos de l = 0 a l = 1. No encontramos l = 1/2. Para el momento angular no
encontramos valores semienteros para l. Encontrar las funciones de onda correspondientes a
los estados |+i y |−i.

6.2. Potenciales Centrales


Como fue mencionado al comienzo del capı́tulo, uno de los problemas importantes, tanto
en la mecánica clásica, como en la mecánica cuántica es el de los potenciales centrales, aquellos
que dependen únicamente de la distancia a un punto central. Ellos surgen tı́picamente de las
interacciones entre dos cuerpos, tales como la atracción gravitacional o la electrostática o la
interacción de Yukawa, por mencionar algunas, que dependen solamente de la distancia entre
los dos cuerpos. Todos los potenciales centrales tienen algunas caracterı́sticas comunes, que
provienen de la invariancia ante rotaciones. En la siguiente sección hacemos una deducción
rápida de la forma de las autofunciones de los potenciales centrales.

6.2.1. Coordenadas esféricas


Consideremos las coordenadas esféricas ilustradas en la figura 6.1. Se tiene que

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ, (6.5)


p z y
r = x2 + y 2 + z 2 , cos θ = , tan φ = . (6.6)
r x
Las coordenadas cartesianas están definidas en todo el eje real −∞ < x, y, z < ∞, en tanto

Figura 6.1: Coordenadas esféricas.

que r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π].


106 CAPÍTULO 6. POTENCIALES CENTRALES
6.2.2. Momento angular y energı́a cinética
Aquı́ encontraremos una relación entre el cuadrado del momento angular y el laplaciano
(básicamente la energı́a cinética). Dado que la i-ésima componente del momento angular
b i = P abi rba pbb , en donde todos los ı́ndices corren sobre 1, 2 y 3, el cuadrado
está dada por L ab
del momento angular es
XX X X
b2 =
L abi rba pbb jki rba pbb = abi jki rba pbb rbj pbk .
i ab jk abijk

Empleando la siguiente propiedad de contracción del tensor de Levi-Civita


X
abi jki = δaj δbk − δak δbj ,
i

encontramos que el cuadrado del momento angular es


X X X
b2 =
L (δaj δbk − δak δbj) rba pbb rbj pbk = rba pbb rba pbb − rba pbb rbb pba . (6.7)
abjk ab ab

Podemos escribir el primer término de la derecha como


X X X X
rba pbb rba pbb = pb rba − rba pbb + rba pbb ) pbb =
rba (b rba [b
pb , rba ]b
pb + rba rba pbb pbb
ab ab ab ab
X X X X
rba pba + rb2 pb2

= rba −i~1̂δab pbb + rba rba pbb pbb = −i~
ab a b a

= −i~b b + rb2 pb2 .


r·p

El último término de la ecuación (6.7), por su parte, puede ponerse en la siguiente forma
X X X X
rba pbb rbb pba = rb pba − pba rbb + pba rbb ) =
rba pbb (b rba pbb [b
rb , pba ] + rba pbb pba rbb
ab ab ab ab
X  X
= rba pbb i~1̂δab + pb rbb − rbb pbb + rbb pbb )
rba pba (b
ab ab
X X X X
= i~ rba pba + rba pba [b
pb , rbb ] + rba pba rbb pbb
a a b ab
X 
r·p
= i~b b·p
b+r b −i~1̂ + r
b·p
brb·p
b
b
2 2
r·p
= i~b b − 3i~b
r·p r·p
b + (b b) = −2i~b
r·p r·p
b + (b b) .

Juntando estos dos resultados vemos que el cuadrado del momento angular es
 
b 2 = −i~b
L r·p b + rb2 pb2 − −2i~b
r·p b)2 = rb2 pb2 + i~b
r·p
b + (b r·p
b − (b b)2 .
r·p

b 2 a una función de onda tenemos


Si aplicamos el operador L
b 2 |ψi = −~2 r2 ∇2 ψ(r) + ~2 r · ∇ψ(r) + ~2 (r · ∇) ψ(r). 2
hr|L

Teniendo en cuenta que


X 1 ∂
∇= ei (6.8)
i
hi ∂ui
6.2. POTENCIALES CENTRALES 107
y que en el caso de coordenadas esféricas h1 = 1, h2 = r, y h3 = r sin θ, el gradiente en
coordenadas esféricas es
∂ 1 ∂ 1 ∂
∇ = er + eθ + eφ . (6.9)
∂r r ∂θ r sin θ ∂φ

Además, como el vector posición es r = er r, el cuadrado del momento angular puede expre-
sarse como
 2
2 2 2 2 2 ∂ 2 ∂
hr|L |ψi = −~ r ∇ ψ(r) + ~ r ψ(r) + ~ r
b ψ(r),
∂r ∂r

en donde hemos tenido en cuenta que r · ∇ = ∂r . Si dividimos por 2mr2 , hallamos
2
~2 2 2 2

1 b 2 |ψi − ~ ∂ ψ(r) − ~ ∂
− ∇ ψ(r) = 2
hr|L r ψ(r), (6.10)
2m 2mr 2mr ∂r 2mr2 ∂r

después de rearreglar términos. Esta es la ecuación que relaciona la energı́a cinética (el Lapla-
ciano) con el momento angular. La ventaja de el camino empleado aquı́ es que no es necesario
tener una expresión previa para el Laplaciano en coordenadas esféricas, aunque se hace amplio
uso de la contracción de tensores de Levi-Civita.
Otro camino para encontrar esta relación es el uso de los resultados en el capı́tulo anterior:
por un lado del Laplaciano y por otro del cuadrado del momento angular. En coordenadas
curvilı́neas ortogonales, el laplaciano de una función f es
 
1 ∂ ∂ ∂
∇2 f = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) (6.11)
h1 h2 h3 ∂u1 ∂u2 ∂u3
      
1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + .
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3

En coordenadas esféricas
  2     
1 ∂ r sin θ ∂f ∂ r sin θ ∂f ∂ r ∂f
∇2 f = 2 + +
r sin θ ∂r 1 ∂r ∂θ r ∂θ ∂φ r sin θ ∂φ
∂2f
   
1 ∂ ∂f 1 ∂ ∂f 1
= 2 r2 + 2 sin θ + 2 ,
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2

de manera que, para el operador de energı́a cinética tenemos

p2 ~2 1 ∂ 1 ∂2ψ
     
2 ∂ψ 1 ∂ ∂ψ
hr| |ψi = − r + 2 sin θ + 2
2m 2m r2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2

Por su parte, el operador diferencial asociado al cuadrado del momento angular es

1 ∂2
   
. 1 ∂ ∂
L · L = −~2 sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2

Ası́, podemos escribir una relación entre la energı́a cinética y el cuadrado del momento angular

p2 ~2 1 ∂
 
2 ∂ψ 1
hr| |ψi = − r + hr|L2 |ψi . (6.12)
2m 2m r2 ∂r ∂r 2mr2

EJERCICIO 63. Muestre que (6.10) y (6.12) son equivalentes.


108 CAPÍTULO 6. POTENCIALES CENTRALES
6.2.3. Momento angular y potenciales centrales
La ecuación de Schrödinger para una partı́cula en un potencial central independiente del
tiempo
∂Ψ(r, t) ~2 2
i~ =− ∇ Ψ(r, t) + V (r)Ψ(r, t),
∂t 2m
se puede simplificar empleando el Ansatz Ψ(r, t) = ψE (r)e−iEt/~ . Después de dividir a ambos
lados por e−iEt/~ se obtiene la ecuación de Schrödinger independiente del tiempo
~2 2
− ∇ ψE (r) + V (r)ψE (r) = EψE (r).
2m
Empleando (6.12) escribimos la ecuación anterior como
2
 
1 b 2 |ψE i − ~ ∂ 2 ∂ψE (r)
hr|L r + V (r)ψE (r) = EψE (r). (6.13)
2mr2 2mr2 ∂r ∂r
Con excepción del primer término, los siguientes términos dependen únicamente de r. Por
otro lado, sabemos que existen autofunciones de Lb 2 y de L
b z , que satisfacen

b 2 |l, mi = ~2 l(l + 1) hr|l, mi ,


hr|L l = 0, 1, . . .
hr|L
b z |l, mi = ~m hr|l, mi , m = −l, −l + 1, . . . , l.

Si pasamos a coordenadas esféricas vemos que las funciones hr|l, mi no tienen una dependencia
definida de r. Podemos, por lo tanto, identificar los autoestados comunes de L b 2 y de L
b z con
los llamados armónicos esféricos

Ylm (θ, φ) = hθ, φ|l, mi .

Tales funciones nos ayudan a resolver la ecuación de Schrödinger independiente del tiempo
(6.13) empleando la factorización ψE (r) = RElm (r)Ylm (θ, φ). La ecuación resultante, para la
parte radial de la función de onda es
~2 d
   
2 dRElm (r) l(l + 1)
− r + V (r) + RElm (r) = ERElm (r).
2mr2 dr dr 2mr2
Ya que en la ecuación radial no hay dependencia explı́cita de m podemos ignorar el subı́ndice
m.
EJERCICIO 64. Encuentre la ecuación dinámica que satisface la función uEl (r) =
rREl (r).

6.3. Átomos hidrogenoides


Los átomo hidrogenoides se modelan como dos partı́culas puntuales: un núcleo de carga Ze
y un electrón de carga −e. La función de energı́a (Hamiltoniano) es

p2n p2 Ze2
H(pn , pe , rn , r e ) = + e − (6.14)
2mn 2me 4π0 |r n − r e |
en donde pn y pe son los momentos del núcleo y del electrón y r n y r e sus posiciones.
EJERCICIO 65. Muestre que el hamiltoniano (6.14), en términos de la posición del
centro de masa, r CM y de la posición relativa, r rel , es
1 mn + me 2 Ze2
H(pCM , prel , r CM , r rel ) = p2CM + prel − . (6.15)
2(mn + me ) 2mn me 4π0 rrel
6.3. ÁTOMOS HIDROGENOIDES 109
Vemos que la dinámica del centro de masas se desacopla de la dinámica de la posición relativa.
El centro de masas se comporta como una partı́cula libre, en tanto que tenemos un problema
de potencial central para la coordenada relativa. Es usual denotar por M = mn + me a la
masa total y por µ a la masa reducida, siendo 1/µ = 1/mn + 1/me . Como la masa del núcleo
es mucho mayor que la masa del electrón, la masas total y reducida son muy parecidas a la
masa del núcleo y la del electrón, respectivamente; la posición del centro de masa casi coincide
con la del núcleo.
La ecuación de Schrödinger correspondiente al hamiltoniano (6.14) es la siguiente

~2 2 ~2 2 Ze2
 
i~∂t Ψ(r n , r e , t) = − ∇ − ∇ − Ψ(r n , r e , t). (6.16)
2mn n 2me e 4π0 |r n r e |
Vemos que, en el caso de dos partı́culas tenemos una función de onda que depende de las
coordenadas de ambas partı́culas. La interpretación probabilı́stica en este caso es como se
consigna a continuación. La probabilidad de hallar el núcleo en un volumen infinitesimal dVn
alrededor del punto r n y de hallar, simultáneamente al electrón en un volumen infinitesimal
dVe alrededor del punto r e , en el instante t, si en dicho instante el estado del sistema compuesto
por el núcleo y por el electrón se describe mediante la función de onda Ψ(r n , r e , t), es

|Ψ(r n , r e , t)|2 dVn dVe . (6.17)

Bajo las mismas circunstancias la densidad de probabilidad de hallar al núcleo en el punto


r n y al electrón en el punto r e es
|Ψ(r n , r e , t)|2 (6.18)
y la de hallar al núcleo en r n , independiente de la posición del electrón es
Z
|Ψ(r n , r e , t)|2 dVe , (6.19)

en donde la integral se extiende sobre todas las posiciones posibles para el electrón.
Resaltamos que la función de onda describe al sistema núcleo más electrón, y que las propie-
dades de uno, por ejemplo su posición, dependen de las propiedades del otro. Este hecho tiene
consecuencias profundas que, en particular, niegan la idea de la identidad individual de cada
uno de los subsistemas de un sistema dado. El artı́culo de Einstein, Podolsky y Rosen de 1935
[107] muestra que esta falta de individualidad no es compatible con la localidad (eta es una
lectura moderna del artı́culo, cuyo propósito inicial era demostrar que la mecánica cuántica es
incompleta), mientras que las ideas modernas del procesamiento de la información cuántica
se aprovechan de esta circunstancia.
EJERCICIO 66. Escriba la ecuación de Schrödinger (6.16) en términos de las coorde-
nadas de centro de masa y relativa, y muestre que la ecuación de Schrödinger resultante es
precisamente la correspondiente al hamiltoniano (6.15), a saber

~2 2 ~2 2 Ze2
 
i~∂t Ψ(r CM , r rel , t) = − ∇CM − ∇rel − Ψ(r CM , rrel , t). (6.20)
2M 2µ 4π0 rrel
EJERCICIO 67. ¿Existe alguna transformación unitaria que lleve de (6.14) a un Hamil-
toniano que tenga la misma forma de (6.15)? Esta pregunta puede ser difı́cil de contestar (al
momento de escribir creo que la respuesta es sı́, pero no sé cómo serı́a la transformación).
Una pregunta relacionada, pero más simple es la siguiente. Considere transformaciones de la
forma

U = ei(a1 ·re +a2 ·rn +b1 ·pe +b2 ·pn ) ,

en donde ai y bi , i = 1, 2, son vectores. ¿Cómo se transforma (6.14) bajo transformaciones


de este tipo?
110 CAPÍTULO 6. POTENCIALES CENTRALES
La ecuación de Schrödinger (6.20) admite la separación de las variables correspondientes
al centro de masa de aquellas de la coordenada relativa,

Ψ(r CM , r rel , t) = ΨCM (r CM , t)Ψrel (r rel , t). (6.21)

Sustituyendo (6.21) en (6.20) y dividiendo por (6.21) obtenemos

~2 ∇2CM ΨCM
 2 2
Ze2

∂t ΨCM ∂t Ψrel ~ ∇rel Ψrel
i~ + i~ =− + − − ,
ΨCM Ψrel 2M ΨCM 2µ Ψrel 4π0 rrel

que puede reordenarse en la forma

~2 ∇2CM ΨCM ~2 ∇2rel Ψrel Ze2


 
∂t ΨCM ∂t Ψrel
i~ + = − i~ + + . (6.22)
ΨCM 2M ΨCM Ψrel 2µ Ψrel 4π0 rrel

Haciendo cada uno de los lados igual a cero obtenemos sendas ecuaciones de Schrödinger

~2 2
i~∂t ΨCM = − ∇CM ΨCM , (6.23a)
 2M2
Ze2

~
i~∂t Ψrel = − ∇2rel − Ψrel . (6.23b)
2µ 4π0 rrel

La primera ecuación corresponde a la de una partı́cula libre, en tanto que la segunda corres-
ponde a un potencial central.

EJERCICIO 68. ¿Cómo cambian las ecuaciones (6.23) y sus soluciones, si la constante
de separación no se escoge igual a cero?
Podemos concentrarnos en (6.23b) y dejar de escribir el subı́ndice rel. La solución general de
(6.23b) es una superposición de funciones de onda del tipo

ΨElm (r, θ, φ) = REl (r)Ylm (θ, φ), (6.24)

en donde Ylm (θ, φ) designa los armónicos esféricos. Las funciones radiales satisfacen la ecuación

~2 1 d Ze2 ~2 l(l + 1)
   
2 d
− r − + REl (r) = EREl (r),
2m r2 dr dr 4π0 r 2mr2

en donde hemos empleado m para la masa reducida, en vez de µ. Pasando el término de la


derecha al lado izquierdo y multiplicando por −2m/~2 recibimos

Ze2
     
1 d 2 d 2m l(l + 1)
r + E + − REl (r) = 0.
r2 dr dr ~2 4π0 r r2

Esta ecuación no tiene la forma de una ecuación de Schrödinger unidimensional.


En un ejercicio anterior se pidió encontrar la siguiente ecuación dinámica (uEl (r) =
rREl (r))  2
Ze2
   
d 2m l(l + 1)
+ E+ − (rREl (r)) = 0. (6.25)
dr2 ~2 4π0 r r2
La anterior tiene la forma de una ecuación de Schrödinger unidimensional con un potencial
2
Ze2 l(l+1)
efectivo igual a Vef (r) = − 4π 0r
+ ~ 2mr 2 , en donde el segundo término se conoce como el

potencial centrı́fugo o la barrera centrı́fuga, porque tiende a alejar la partı́cula del origen
de coordenadas. Como la coordenada r no puede tomar valores positivos, pero uEl (r) debe
anularse en el origen, podemos pensar que el potencial es infinito para valores negativos de la
coordenada y es igual al potencial efectivo para valores positivos.
6.3. ÁTOMOS HIDROGENOIDES 111
Dado que es conveniente emplear cantidades adimensionales, introducimos ρ y  mediante las
d2 1 d2
ecuaciones r = a0 ρ y E = E0 . Empleando estas definiciones hallamos dr 2 = a2 dρ2 y
0

2 2
 
1 d 2mE0 2mZe 1 l(l + 1)
+ + − 2 2 (a0 ρREl (a0 ρ)) = 0.
a20 dρ2 ~2 4π0 a0 ~2 ρ a0 ρ
Esta ecuación también se puede expresar en la forma
 2
2mE0 a20 2mZe2 a0 1 l(l + 1)

d
+ + − (ρREl (a0 ρ)) = 0.
dρ2 ~2 4π0 ~2 ρ ρ2
mZe2 a0 2mE0 a20 4π0 ~2
Haciendo 4π0 =1y ~2 = 1, obtenemos a0 = mZe2 y

~2 ~2 m2 Z 2 e4 mZ 2 e4
E0 = = = . (6.26)
2ma20 2m (4π0 )2 ~4 32π 2 ~2 20
Con estos valores para a0 y para E0 , la ecuación radial se simplifica,
 2 
d 2 l(l + 1)
+  + − (ρREl (a0 ρ)) = 0. (6.27)
dρ2 ρ ρ2
Es importante darse cuenta de que, como esta ecuación no depende de ml , ı́ndice que toma
valores entre −l y l, tenemos una degeneración. Una vez encontremos un autoestado con algún
valor de energı́a para un dado valor de l, sabemos que existe un subespacio del espacio de
Hilbert de dimensión 2l + 1 tiene la misma energı́a.

Figura 6.2: Subespacios del espacio de Hilbert para potenciales centrales, caracterizados por
sus autovalores del Hamiltoniano H y del cuadrado del momento angular L2 . En general, el
Hamiltoniano puede tener un espectro puntual (valores discretos de energı́a) y un espectro
continuo (ilustrado en la parte derecha de la figura). Los autovalores de energı́a correspondien-
te a un autovalor de L2 , digamos Eql , usualmente son diferentes a los autovalores de energı́a
correspondientes a otro autovalor de L2 , digamos Eq̃l̃ ,; es decir, Eql 6= Eq̃l̃ a menos que l = ˜l (y
q̃ = q). Los subespacios con autovalores fijos de energı́a y del cuadrado del momento angular,
son mayores cuanto mayor es este último autovalor.

6.3.1. Solución de la ecuación radial


Esta sección está basada en el apéndice C del capı́tulo VII de la referencia [108]. Con el fin de
solucionar la ecuación radial, hallamos primero su comportamiento asintótico para grandes
distancias. Cuando ρ → ∞ podemos ignorar los términos tercero y cuarto de (6.27) para
obtener  2 
d
+  (ρREl (a0 ρ)) = 0, ρ → ∞,
dρ2
112 CAPÍTULO 6. POTENCIALES CENTRALES
cuyas soluciones son
1 ±√−ρ
REl (a0 ρ) ∼ (e ).
ρ
Si la energı́a es positiva (todos los valores positivos son posibles) tendremos ondas esféricas.
Estas soluciones no son normalizables. En caso de que la energı́a sea negativa  < 0 la solución
que puede tener interpretación probabilı́stica es aquella con el signo negativo. De esta forma,
escogemos la función radial en la forma

ρREl (a0 ρ) = e− −ρ
ηEl (ρ)

de suerte que, empleando la regla de Leibniz


n
dn
 
X n
(f (x)g(x)) = (f g)(n) = f (n−k) g (k) , (6.28)
dx n k
k=0

obtenemos

d2 d2 −√−ρ d √ dηEl √ d2 ηEl


(ρREl (a0 ρ)) = (e )ηEl (ρ) + 2 (e− −ρ ) + e− −ρ
dρ2 dρ 2 dρ dρ dρ2
√ √ √ dηEl √ d2 ηEl
= −e− −ρ ηEl (ρ) − 2 −e− −ρ + e− −ρ
dρ dρ2
√ 2 √ dηEl
 
d ηEl
= e− −ρ 2
− 2 − − ηEl (ρ) .
dρ dρ

De esta forma, a partir de la ecuación (6.27) encontramos la ecuación diferencial que satisface
ηEl (ρ)
2 √ dηEl
 
dηEl 2 l(l + 1)
− 2 − + − ηEl = 0, (6.29)
dρ2 dρ ρ ρ2

en donde hemos omitido el factor común e− −ρ . A pesar de que se ha aislado el comporta-
miento deseado, una exponencial decreciente a medida que ρ aumenta, la segunda solución,
que crece exponencialmente, todavı́a está ahı́. Es necesario identificar esa solución y recha-
zarla cuando aparezca.
La ecuación (6.29) se puede resolver usando el método de Frobenius, una generalización de
las series de potencias en donde el primer término es ρs . Esta expansión también nos permite
examinar enseguida el comportamiento de la solución para valores pequeños de ρ, ρ → 0.
El método de Frobenius supone que la solución es de la forma

(El) s+k
X
ηEl (ρ) = ck ρ ,
k=0

(El)
en donde el primer coeficiente, c0 , es diferente de cero. Por simplicidad, no vamos a ignorar
(El)
el superı́ndice (El) de los coeficientes ck ; es decir, vamos a usar la notación más simple ck .
Las expresiones para las dos primeras derivadas son

dηEl (ρ) X
= (s + k)ck ρs+k−1 ,

k=0
2 ∞
d ηEl (ρ) X
= (s + k)(s + k − 1)ck ρs+k−2 .
dρ2
k=0
6.3. ÁTOMOS HIDROGENOIDES 113
Reemplazando estas dos expresiones en la ecuación diferencial (6.29) encontramos
∞ ∞
X √ X
(s + k)(s + k − 1)ck ρs+k−2 − 2 − (s + k)ck ρs+k−1
k=0 k=0

X ∞
X
− l(l + 1) ck ρs+k−2 + 2 ck ρs+k−1 = 0.
k=0 k=0

Juntando las suma que tienen la misma potencia de ρ quedamos únicamente con dos sumas,
∞ ∞
X X √
[(s + k)(s + k − 1) − l(l + 1)] ck ρs+k−2 + 2 (1 − (s + k) −)ck ρs+k−1 = 0.
k=0 k=0

El primer término de la serie, el de más baja potencia, es el correspondiente a s − 2. El


coeficiente de este término viene únicamente de la primera suma y es

[(s − 1)s − l(l + 1)] c0 = [(s − 1)s − (−l − 1)(−l)] c0 = 0.

Dado que el coeficiente c0 no puede ser cero, las dos soluciones posibles son s = l + 1 y s = −l.
Escogemos la primera solución. La segunda solución produce contribuciones proporcionales a
la delta de Dirac o de sus derivadas (recuerde que es necesario tomar el Laplaciano).
Ahora, sustituı́mos el valor de s en la ecuación de sumas de potencias,
∞ ∞
X X √
[(l + 1 + k)(l + k) − l(l + 1)] ck ρl+k−1 + 2 (1 − (l + 1 + k) −)ck ρl+k = 0.
k=0 k=0

Teniendo en cuenta que (l + 1 + k)(l + k) = (l + 1)l + (l + 1)k + kl + k 2 = (l + 1)l + k(2l + 1 + k),


podemos simplificar la ecuación anterior
∞ ∞
X X √
k(2l + 1 + k)ck ρl+k−1 + 2 (1 − (l + 1 + k) −)ck ρl+k = 0.
k=0 k=0

Dado que el primer término de la primera suma es cero, podemos empezar la suma desde
k = 1. En cuanto a la segunda suma, hacemos k = k̃ − 1. Haciendo estos cambios, la igualdad
anterior se convierte en
∞ ∞
X X √
k(2l + 1 + k)ck ρl+k−1 + 2 (1 − (l + k̃) −)ck̃−1 ρl+k̃−1 = 0.
k=1 k̃=1

Ahora tenemos en cuenta que podemos cambiar el nombre de los ı́ndices de las sumas. Por
ejemplo, podemos hacer k̃ = k en la segunda suma. Este cambio de nombre permite juntar
las dos suma en una,

X √
k(2l + 1 + k)ck − 2((l + k) − − 1)ck−1 ρl+k−1 = 0.
 

k=1

Para que esta suma sea cero es necesario que cada uno de los coeficientes sea cero, es decir,

k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 . (6.30)

Esta recurrencia nos permite escribir todos los coeficientes de la suma infinita

en términos del
ck 2 −
primer coeficiente c0 . Además, como el lı́mite lı́mk→∞ ck−1 = lı́mk→∞ k = 0, el criterio de
la razón nos garantiza que la serie es convergente. De hecho la serie converge para cualquier
valor de ρ, porque lı́mk→∞ cck−1

= 0, para cualquier valor (finito) de ρ.
114 CAPÍTULO 6. POTENCIALES CENTRALES
Nos gustarı́a saber como se comporta la serie que soluciona la ecuación diferencial (6.29).
P∞ k ck λk (k−1)!
Sabiendo que eλρ = k=0 λk! ρk , vemos que la razón ck−1 se comporta como k(k−1)! λk−1
= λk .
Comparando con el comportamiento √
de la serie que soluciona la ecuación (6.29), vemos

que
dicha serie se comporta como √e2 −t para valores grandes de ρ, de manera que e− −t por
esta serie se comporta como e2 −t . Ası́, concluı́mos que la solución divergente que querı́amos
evitar se ha vuelto a presentar. Para evitar este comportamiento asintótico es necesario, por lo
tanto, que la serie no sea infinita, sino que se reduzca a un polinomio. A partir de la ecuación
de recurrencia (6.30), vemos que la condición para que esto suceda es que la√energı́a  no
pueda tomar valores arbitrarios. De hecho, vemos que  debe satisfacer (l + k) − = 1 para
algún entero no negativo k. Ya que hemos usado la letra k para rotular los coeficientes, es
necesario que empleemos una letra diferente para designar un valor arbitrario, pero √ fijo de k.
Usando la letra q, vemos que la condición que debe satisfacer la energı́a es (l + q) − = 1, es
1
decir, q,l = − (q+l)2 , en donde hemos hecho alusión directa a que la energı́a depende de dos

(El) (ql)
enteros, l y q. Podemos restaurar los rótulos en la notación de los coeficientes ck = ck , de
modo que las relaciones de recurrencia pueden escribirse como
(ql) √ (ql) 1 (ql)
k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 = 2((l + k) − 1)ck−1
q+l
l + k − l − q (ql) q − k (ql)
=2 ck−1 = −2 c .
q+l q + l k−1
P∞ (ql)
Teniendo en cuenta la definición original de la función eta ηEl (ρ) = ηql (ρ) = k=0 ck ρk+l+1 ,
en donde hemos usado el valor de s = l + 1 obtenido con el método de Frobenius, podemos
cortar la suma para no incluir términos cuyos coeficientes sean exactamente iguales a cero,
Pq−1 (ql)
ηql (ρ) = k=0 ck ρk+l+1 . Vemos que la funciones η son polinomios cuyo orden más bajo es
l + 1 y cuyo orden más alto es k + l.
EJERCICIO 69. Muestre que
 k
(ql) k 2 (q − 1)! (2l + 1)! (ql)
ck = (−1) c .
q+l (q − k − 1)! k!(k + 2l + 1)! 0
EJERCICIO 70. Volviendo a las variables originales, muestre que
2
Rq=1,l=0 (r) = 3/2
e−r/a0 ,
a0
 
2 r
Rq=2,l=0 (r) = 1 − e−r/2a0 ,
(2a0 )3/2 2a0
1 r
Rq=1,l=1 (r) = 3/2
√ e−r/2a0 .
(2a0 ) 3a0
EJERCICIO 71. ¿Cómo están normalizadas las funciones de onda radiales del ejercicio
precendente?

6.3.2. Órdenes de magnitud


2
En la subsección anterior empleamos a0 como escala de longitud, a0 = 4π 0~
µZe2 . Recordemos
que las masas del protón del protón y del electrón son mp = 1,7 × 10−27 kg y 0,91 × 10−30 kg,
respectivamente. La magnitud de las cargas de estas partı́culas es 1,6×10−19 C, siendo positiva
la del protón y negativa la del electrón. Mientras la permitividad el vacı́o, 0 , es 8,854 × 10−12
Fm−1 , la fracción 4π
1
0
tiene el valor aproximado de 9×109 N m2 C−2 . Finalmente, ~ = 1,055×
−34
10 Js. Empleando estos valores, recordando que la masa reducida µ es aproximadamente
igual a la masa del electrón y haciendo Z = 1 obtenemos a0 ≈ 0,52 Å.
6.3. ÁTOMOS HIDROGENOIDES 115
~2
Además de la escala de longitud, también hemos usado una escala de energı́a E0 = 2µa 2.
0
−19
Usando los valores de las constantes citados arriba, y recordando que 1 eV = 1,6 × 10 J,
encontramos E0 ≈ 13,6 eV. Una forma alternativa de escribir la escala de energı́a, introdu-
µZ 2 e4 Z2 e4 2
ciendo la rapidez de la luz en el vacı́o,c, es E0 = 32π 2 ~2 2 = 2 16π 2 2 ~2 c2 µc
2
= Z2 α2 µc2 , en
0 0
2
1
donde α = 4πe0 ~c ≈ 137 es la llamada constante de estructura fina. Como la escala de energı́a
es mucho menor que la energı́a de reposo del electrón (más precisamente, de la masa asociada
a la coordenada relativa), E0  µc2 , entonces se justifica usar la versión no relativista de la
mecánica cuántica, en donde los efectos relativistas se pueden calcular como perturbaciones.

6.3.3. Degeneración accidental

Figura 6.3: Subespacios de Hilbert para potencial atractivo 1r .

En la figura 6.2 dibujamos la estructura del espacio del Hilbert para potenciales centrales,
en la cual resaltamos dos hechos. El primero es que los autovalores de energı́a para valores
diferentes del cuadrado del momento angular son, en general, diferentes. El segundo es que
existe una degeneración esencial debido a que la ecuación de Schrödinger radial independiente
del tiempo, no involucra el valor del momento angular alrededor del eje z; es decir, no depende
del valor de m. Como existen 2l + 1 valor de m, existe una degeneración esencial de orden
2l + 1. En el caso del potencial 1r , sin embargo, existe una degeneración accidental, pues
los autovalores de energı́a no dependen de los número q y l, de manera independiente, sino
solamente de su suma. En la figura 6.3 se muestra la estructura del espacio de Hilbert para
el potencial de Coulomb. La primera autoenergı́a E1 , solamente se presenta cuando l = 0; la
segunda cuando l = 0 y l = 1; la n-ésima energı́a, En se presenta cuando l = 0, 1, · · · , n − 1.
Para la parte continua del espectro, dibujada en la parte derecha de la figura 6.3, se puede
tener cualquier valor de momento angular.
La degeneración del subespacio de Hilbert con un valor dado de energı́a, dn , puede calcu-
larse empleando la degeneración conocida, dl , de los subespacios con cuadrado del momento
116 CAPÍTULO 6. POTENCIALES CENTRALES
angular dado:

n−1 n−1 n−1 n−1


X X X X (n − 1)n
dn = dl = (2l + 1) = 2 l+ 1=2 + n = n2 .
2
l=0 l=0 l=0 l=0

Los subespacios de energı́a constante positiva, por su parte, tienen dimensión infinita (conta-
ble).
Dada la degeneración accidental, se define el número cuántico principal n = q + l. Los
autoestados del átomo de hidrógeno se caracterizan por tres números cuánticos: el número
cuántico principal n que está relacionado con los autovalores de energı́a, el número cuántico
azimutal l que indica la magnitud del cuadrado del momento angular, y el número cuántico
magnético m asociado con la componente z del momento angular. 1 En sı́mbolos, escribimos

µe4 1
H |nlmi = − 2 |nlmi , L2 |nlmi = ~2 l(l + 1) |nlmi ,
32π 0 ~ n2
2 2

Lz |nlmi = ~m |nlmi .

Por razones históricas, existe una notación para los diferentes subespacios de cuadrado del
momento angular constante: s (sharp) para l = 0, p (principal) para l = 1, d (diffuse) para
l = 2 y f (fundamental) para l = 3. 2 Los siguientes valores de cuadrado del momento angular
se caracterizan por letras en orden alfabético: g para l = 4, h para l = 5, etc.
Los niveles de energı́a también recibieron nombre por razones históricas: n = 1 es K, n = 2
es L, etc. Esta notación es la misma que se ha usado en el área de rayos X. Las transiciones
entre diferentes niveles de energı́a constituye uno de los principales hechos experimentales que
se descubrieron antes de tener una teorı́a que los explicase. La luz emitida cuando un átomo
de hidrógeno pasa de un nivel de energı́a n al primer nivel de energı́a (estado fundamental)
tiene frecuencia e inverso de la longitud de onda iguales a

µe4 µe4
     
1 1 1 1
ω1n = 1− 2 y = 1 − 2 = RH 1 − 2 ,
64π 3 20 ~3 n λ1n 64π 3 20 ~3 c n n

respectivamente, en donde supusimos que n ≥ 2. Johannes Rydberg introdujo en 1988 la


constante RH , que ahora lleva su nombre, como un parámetro para ajustar las series espec-
trales del hidrógeno. La lı́neas de emisión predichas por la ecuación anterior corresponden a
la llamada serie de Lyman y caen en el ultravioleta (ver Figura 6.4). Las series de Balmer
y de Paschen, dadas por λ2n (n ≥ 3) y λ3n (n ≥ 3), caen parcialmente en el visible y en el
infrarrojo, respectivamente (ver Figura 6.4), y están dadas por la fórmula general
 
1 1 1
= RH − 2 , n2 > n1 .
λn1 ,n2 n21 n2

Cada serie tiene una longitud de onda mı́nima y una máxima; es decir, cada serie ocupa una
región bien definida del espectro.
EJERCICIO 72. Escriba todas las funciones de onda correspondientes al número cuántico
principal n igual a 1 y a 2, destacando los valores de l y m y relacionándolos con la notación
q, l empleada anteriormente.
1 Vale la pena mencionar que, en general, para potenciales centrales, la energı́a depende tanto de l como de

otro número cuántico.


2 De hecho, se argumenta que estas letras no deben venir del inglés, sino del alemán, pues en la época en

que se acuñaron estos términos, esa era la lengua de la ciencia. De hecho, en el libro de Sommerfeld (referencia
[109], p.230) se habla de Prinzipalserie (p), diffuse Nebenserie (d), scharfe Nebenserie (s) y Bergmannserie
(d). Solamente a la última serie se le asocia una letra diferente a aquella empleada en este libro.
6.3. ÁTOMOS HIDROGENOIDES 117

Figura 6.4: Espectro parcial del Hidrógeno, desde n = 1 hasta n = 3. La escala de longitud
de ondas, en nanómetros, es logarı́tmica. [Caitlin Jo Ramsay, CreativeCommons]

6.3.4. Autofunciones de ondas radiales como polinomios asociados


de Laguerre
Las autofunciones radiales que escribimos anteriormente pueden escribirse en términos
de polinomios asociados de Laguerre (antes conocidos como polinomios de Sonine, debido a
su inventor Nikolay Yakovlevich Sonin [118]), como vamos a mostrar. Algunos cálculos se
facilitan cuando las autofunciones se escriben de esta

manera. Recordemos que la función
− −ρ
de onda radial puede escribirse como REl (a0 ρ) = e ρ ηEl (ρ), en donde la función ηnl (ρ)
satisface la ecuación diferencial
d2 ηEl √ dηEl
 
2 l(l + 1)
− 2 − + − ηEl = 0.
dρ2 dρ ρ ρ2
Aquı́, hemos retornado a la notación que empleamos antes de encontrar los autovalores de
energı́a. Dado que ya sabemos que  = n = − n12 , en donde n es el número cuántico principal,
reescribimos la ecuación anterior en la forma
d2 ηnl
 
2 dηnl 2 l(l + 1)
− + − ηnl = 0.
dρ2 n dρ ρ ρ2
Aislamos el comportamiento que debe tener la función de onda para distancias cortas,
ηnl (ρ) = ρl+1 σnl (ρ), y encontramos la ecuación diferencial correspondiente a σnl (ρ). Em-
pleamos nuevamente la regla de Leibniz (6.28), para calcular las dos primeras derivadas de
ηnl (ρ),
d2 ηnl d2 d dσnl d2 σnl
2
= 2 (ρl+1 )σ + 2 (ρl+1 ) + ρl+1
dρ dρ dρ dρ dρ2
dσnl d2 σnl
= l(l + 1)ρl−1 σ + 2(l + 1)ρl + ρl+1 ,
dρ dρ2
dηnl d(ρl+1 ) dσnl dσnl
= σnl + ρl+1 = (l + 1)ρl σnl + ρl+1 .
dρ dρ dρ dρ
Sustituyendo estos resultados en la ecuación de autovalores y autovectores de ηnl (ρ), encon-
tramos la ecuación correspondiente para σnl (ρ)
d2 σnl dσnl
ρl+1 + 2(l + 1)ρl + l(l + 1)ρl−1 σnl
dρ2 dρ
2 dσnl 2
− ρl+1 − (l + 1)ρl σnl + 2ρl σnl − l(l + 1)ρl−1 σnl = 0.
n dρ n
118 CAPÍTULO 6. POTENCIALES CENTRALES
Juntando términos simplificamos esta ecuación

d2 σnl
   
1 dσnl 1
ρ +2 l+1− ρ + 2 1 − (l + 1) σnl = 0.
dρ2 n dρ n

Hacemos un cambio de escala adicional, ρ = nx/2, de modo que la ecuación queda ası́

n 4d2 σnl  x  2 dσnl 1


x 2 2 +2 l+1− + (2 − 2 (l + 1))σnl = 0.
2 n dx 2 ndx n
Después de multiplicar por n/2 y simplificar, encontramos la ecuación diferencial satisfecha
por σnl (x),
d2 σnl dσnl
x 2
+ (2(l + 1) − x) + (n − (l + 1))σnl = 0. (6.31)
dx dx
Recordemos que, en la notación de las referencias [111, 112, 110, 113], la ecuación satisfecha
por los polinomios asociados de Laguerre es

d2 p d
x L (x) + (p + 1 − x) Lpm (x) + (m − p)Lpm (x) = 0. (6.32)
dx2 m dx
Si comparamos (6.31) con (6.32) encontramos p = 2l + 1, y m = p + n − l − 1 = n + l. Ası́, la
solución regular de (6.31) es σnl (x) = Lpm (x) = L2l+1
n+l (x). La notación empleada aquı́ no es,
sin embargo, única. Por ejemplo, Mathematica R
y las referencias [116, 117, 114, 115], notan
la solución regular de la ecuación (6.32) como (−1)p L̄pm−p (x); por lo tanto, en esas referencias,
la solución regular de (6.31) es −L̄2l+1 3
n−l−1 (x). Es necesario, por lo tanto, tener mucho cuidado
con la notación empleada, especialmente si se mezclan las referencias. En cualquiera de las
dos notaciones, la escala de longitud cambia con n, el número cuántico principal.

En términos de los polinomios asociados de Laguerre las funciones de onda radiales son de la
forma
1 √
Rnl (ρ) = N e− −n ρ ηnl (ρ),
ρ
(6.33)
1 −√−n ρ l+1 2l+1 1 −√−n ρ l+1 2l+1 2ρ
 
=N e ρ Ln+l (x) = N e ρ Ln+l
ρ ρ n

En las ecuaciones (6.33) N es una constante de normalización.

6.3.5. Polinomios de Laguerre y asociados


p
d
Los polinomios asociados de Laguerre están definidos como Lpm (x) = dx p Lm (x), en donde

Lm (x), el m-ésimo polinomio de Laguerre, satisface la ecuación diferencial

d2 Lm (x) dLm
x 2
+ (1 − x) + mLm (x) = 0.
dx dx
Como primer paso vamos a demostrar que si Lm (x) es el m-ésimo polinomio de Laguerre,
entonces su p-ésima derivada satisface la ecuación diferencial (6.32). En efecto, derivando la
ecuación anterior p veces, y empleando la regla de Leibniz (6.28) sigue
 2  p
d dp Lm d dp Lm dp Lm
      
d d Lm
x 2 +p + (1 − x) −p
dx dxp dx dxp dx dxp dxp
p
d Lm
+m = 0.
dxp
3 Aquı́, hemos usado L̄ en vez de L para acentuar la diferencia.
6.3. ÁTOMOS HIDROGENOIDES 119
Después de simplificar, encontramos la ecuación (6.32)

d2 dp Lm d dp Lm
     p 
d Lm
x 2 + (p + 1 − x) + (m − p) = 0.
dx dxp dx dxp dxp
Anteriormente, hallamos una expansión en serie de potencias para las funciones de onda
radiales (aparte del factor que decrece con la distancia de manera exponencial). Vamos a
encontrar esa expansión usando el método de la referencia [119] (p.220) esta vez, y empleando
el número cuántico principal n, en vez del parámetro q. Usamos el Ansatz,
I
p
Lm (x) = f (t)e−xt dt, (6.34)
C

en donde la curva de integración, C, no se ha definido todavı́a. Empleando este Ansatz en la


ecuación diferencial (6.31) obtenemos
I
f (t) xt2 − (p + 1 − x)t + m − p e−xt dt,

0=
IC    
d d
= f (t) −t2 − t p + 1 + + m − p e−xt dt,
dt dt
I  C  I
d d
f (t) t2 + t e−xt dt = f (t) (−t (p + 1) + m − p) e−xt dt.
C dt dt C

Transformamos el lado izquierdo teniendo en cuenta que


d de−xt df
(t2 + t)e−xt f (t) = (2t + 1)e−xt f (t) + (t2 + t) f (t) + (t2 + t)e−xt .

dt dt dt
Las nuevas integrales sobre el plano complejo son
I I  
d 2 −xt
 −xt 2 df
(t + t)e f (t) dt − e (2t + 1)f (t) + (t + t) dt
C dt C dt
I
= f (t) (−t (p + 1) + m − p) e−xt dt.
C

Escogiendo un camino cerrado C, la primera integral es cero. Si pasamos la segunda integral


al lado derecho encontramos
I  
df −xt
0= f (t) (−t (p − 1) + m − p + 1) + t(t + 1) e dt.
C dt
Esta integral es cero si el integrando es cero,
df −t (p − 1) + m − p + 1 m−p+1 m
=− dt = − dt + dt.
f t(t + 1) t t+1
Al integrar encontramos

ln(f ) = −(m − p + 1) ln t + m ln(t + 1) + ln A,


(t + 1)m
f (t) = A ,
tm−p+1
en donde A es una constante. Substituimos en el Ansatz (6.34) para obtener una representación
integral de los polinomios de Laguerre (todavı́a sin normalización definida)
(t + 1)m −xt
I
p
Lm (x) = A m−p+1
e dt, (6.35)
C t
120 CAPÍTULO 6. POTENCIALES CENTRALES
en donde podemos escoger C como una curva cerrada que incluye el origen, porque la función
(t+1)m
tm−p+1 no tiene puntos de ramificación a lo largo de esa curva (tanto m como m − p + 1 son
números enteros).
Teniendo en cuenta la integral en el plano complejo C ta dt = 2πiδa,−1 , en donde C es una
H

curva horaria4 cerrada que encierra el origen y a es un entero, vemos que solamente el polo
simple en el origen contribuye a la integral (6.35). Expandimos (t + 1)m y e−xt como series
de potencias alrededor de t = 0,
m ∞
(−1)n xn n
I X
m! X
Lpm (x) =A tr t−m+p−1 t dt,
C r=0 r!(m − r)! n=0
n!
∞ X m
(−1)n xn
I
X m! dt
=A tn+r+p−m ,
n=0 r=0
n! r!(m − r)! C t
m
X (−1)m−p−r xm−r−p m!
= 2πiA ,
r=0
(m − p − r)! r!(m − r)!

en donde los términos que contribuyen son tales que m − r − p ≥ 0. Debido a la presencia
del factorial (m − p − r) en el denominador, los términos en que esta desigualdad se incumple
son, efectivamente, cero. Podemos, sin embargo, quitarlos explı́citamente: el máximo valor
que puede tomar r es m − p. Ası́,
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = 2πiA , (6.36)
r=0
(m − p − r)! r!(m − r)!

La constante de normalización se escoge de manera que L0m (0) = Lm (0) = m!, es decir,
m!
A = 2πi y

(t + 1)m −xt
I
m!
Lm (x) = e dt. (6.37)
2πi C tm+1

En Fı́sica, la constante de normalización es m! más grande que en otras convenciones utilizadas


para los polinomios de Laguerre.
Teniendo en cuenta que

dm −x(t+1)
e = (−1)m (t + 1)m e−x(t+1) ,
dxm
dm
(t + 1)m e−xt = (−1)m ex m e−x(t+1) ,
dx
escribimos el m-ésimo polinomio de Laguerre como

(−1)m m!ex dm e−x(t+1)


I
Lm (x) = dt.
2πi dxm C tm+1
P∞ n
(−xt)
Usando nuevamente e−x(t+1) = e −x
ta dt = 2πiδa,−1 podemos evaluar la
H
n=0 n! y C
integral,

(−1)m m!ex dm (−x)m −x dm


 
= ex m xm e−x .

Lm (x) = 2πi e (6.38)
2πi dxm m! dx

La ecuación (6.38) es la fórmula de Rodrigues para los polinomios de Laguerre.


4 Una curva que se recorre en el sentido horario en el plano complejo
6.3. ÁTOMOS HIDROGENOIDES 121
A partir de la representación integral (6.37) podemos hallar la fórmula siguiente para los
polinomios asociados de Laguerre
m! dp (t + 1)m −xt (−1)p m! (t + 1)m −xt
I I
Lpm (x) = p m+1
e dt = m−p+1
e dt.
2πi dx C t 2πi C t

Merece la pena mencionar, una vez más, que en la notación alternativa la fase se escoge de
manera diferente (note la ausencia del factor (−1)p )
(t + 1)m −xt
I
p m!
L̄m−p (x) = e dt.
2πi C tm−p+1
Volvamos a la ecuación (6.36)
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = m! ,
r=0
(m − p − r)! r!(m − r)!

Vamos a escribir los términos de la serie anterior, comenzando por el término r = m − p y


finalizando en el término r = 0.
x0 m! x m! x2 m!
Lpm (x) = m! − m! + m!
0! (m − p)!p! 1! (m − p − 1)!(p + 1)! 2! (m − p − 2)!(p + 2)!
(−1)m−p xm−p m!
+ · · · + m! .
(m − p)! (m − p − (m − p))!(p + m − p)!
El patrón es evidente; el polinomio asociado de Legendre, Lpm (x), como una serie ascendente
de potencias de x es
m−p
X (−1)n xn m!
Lpm (x) = m! . (6.39)
n=0
n! (m − p − n)!(p + n)!

Consideremos la función
t ∞ l ∞
e−x 1−t (−1)l xl t l
X 1 1 
xt X
= − = . (6.40)
1−t 1 − t l! 1−t l! (1 − t)l+1
l=0 l=0

El término del denominador puede ser expandido, empleando el teorema del binomio, en el
caso |t| < 1.
1 (l + 1)t (l + 1)(l + 2)t2 (l + 1)(l + 2)(l + 3)t3
l+1
=1+ + + + ···
(1 − t) 1! 2! 3!
(l + 1)! (l + 1)! (l + 2)! 2 (l + 3)! 3
= + t+ t + t + ···
(l + 1)!0! l!1! l!2! l!3!

X (l + k)! k
= t .
l!k!
k=0

Insertando esta expansión en la ecuación (6.40) se tiene


t ∞ ∞
ex 1−t X X (−1)l (l + k)!tk
= xl t l .
1−t l! l!k!
l=0 k=0

Después de hacer el cambio de ı́ndice m = l + k, la expansión queda


t ∞ X m ∞
e−x 1−t X (−1)n m!xn tm X
0 tm
= m! = L (x) , (6.41)
1−t m=0 n=0
(n!)2 (m − n)! m! m=0 m m!
122 CAPÍTULO 6. POTENCIALES CENTRALES
en donde, a partir de haber reconocido explı́citamente que n va desde cero hasta m, hemos
−x t
1−t
verificado que la función e 1−t genera los polinomios de Laguerre.
Si derivamos (6.41) p veces con respecto a x, encontramos las funciones generadoras de los
polinomios asociados de Laguerre
p −x t t ∞ ∞
(−1)p tp e−x 1−t dp Ln (x) tn tn

t e 1−t X X
p
− = = = Ln (x) . (6.42)
1−t 1−t (1 − t)p+1 n=0
dxp n! n=0 n!

Si multiplicamos las dos expresiones de la forma (6.42) y multiplicamos por e−x xp+q obtene-
mos
∞ X ∞
tp up xp+q e−x[ 1−t + 1−u +1]
t u
X
p+q −x p p tn um
p+1 = x e Ln (x)Lm (x) . (6.43)
[(1 − t)(1 − u)] n=0 m=0
n!m!

Si integramos
h i respecto a x en el intervalo [0, ∞) y hacemos el cambio de variable
(6.43) con
t u
z = x 1−t + 1−u + 1 , encontramos


tp up
Z
xp+q e−x[ 1−t + 1−u +1]
t u

p+1 dx
0 [(1 − t)(1 − u)]
∞ −(p+q+1)
tp up
Z 
t u
= + +1 z p+q+1−1 e−zp+1 dz
0 1−t 1−u [(1 − t)(1 − u)]
−(p+q+1)
tp up

t u
= + +1 Γ(p + q + 1) p+1 ,
1−t 1−u [(1 − t)(1 − u)]

en
R ∞donde pudimos relizar la integral empleando la definición de la función Γ(z), Γ(z) =
−t z−1
0
e t dt. Teniendo en cuenta que
 −(p+q+1)  −(p+q+1)
t u (1 − u)t + u(1 − t) + (1 − t)(1 − u)
+ +1 =
1−t 1−u (1 − t)(1 − u)
 (p+q+1)
(1 − t)(1 − u)
= .
1 − ut

recibimos

tp up
Z
−x[ 1−t
t u
+ 1−u +1]
xp+q p+1 e dx
0 [(1 − t)(1 − u)]
p+q+1
tp up

(1 − u)(1 − t)
= p+1 Γ(p + q + 1) (6.44)
[(1 − t)(1 − u)] 1 − ut
tp up (1 − u)q (1 − t)q
= p+q+1 (p + q)!,
[1 − ut]

en donde hicimos uso de la identidad Γ(x + 1) = x!. Empleando las expansiones binomiales
de (1 − tu)−(p+q+1) , (1 − u)q y (1 − t)q , el resultado de la integral es
∞ q q
X (p + q + k)! X (−)a q! a X (−)b q! b
= (p + q)! (ut)p+k u t
(p + q)!k! (q − a)!a! (q − b)!b!
k=0 l=0 b=0
q X
∞ X q
X (p + q + k)! q! q!
= (−)a+b up+k+a tp+k+b .
k! (q − a)!a! (q − b)!b!
k=0 a=0 b=0
6.3. ÁTOMOS HIDROGENOIDES 123
Empleando (6.43) hallamos el resultado
∞ Z ∞
X tn um
xp+q e−x Lpn (x)Lpm (x) dx = (6.45)
m,n=0 0 n!m!
q X
∞ X q
X (p + q + k)!q!q!
(−)a+b up+k+a tp+k+b .
k!(q − a)!a!(q − b)!b!
k=0 a=0 b=0

Finalmente comparando los coeficientes de tn um hallamos una familia de integrales. Por ejem-
plo, si hacemos q = 0 hallamos
∞ Z ∞ ∞
X tn um X (p + k)!
xp e−x Lpn (x)Lpm (x) dx = up+k tp+k .
m,n=0 0 n!m! k!
k=0

Comparando los coeficientes del polinomio en las variables u y t encontramos


Z ∞
n!
xp e−x Lpn (x)Lpm (x)dx = n!m! δm,n n ≥ p, (6.46)
0 (n − p)!

relación que con ı́ndices ligeramente diferentes se puede expresar como


Z ∞
(n + l)!
x2l+1 e−x L2l+1 2l+1
n+l (x)Ln0 +l (x)dx = δn,n0 (6.47)
0 (n + l − (2l + 1))!
(n + l)!
= δn,n0 l ≤ n − 1.
(n − l − 1)!

Las relaciones (6.46) y (6.47) corresponden a la relación de ortogonalidad de los polinomios


de Laguerre.
EJERCICIO 73. Usando como ejemplos las funciones de onda correspondientes a n=0,
1 y 2, escriba explı́citamente los polinomios y verifique las integrales del tipo (6.47).
EJERCICIO 74. Vuelva a las variables originales y escriba las autofunciones normalizadas
del átomo de Hidrógeno con autovalores negativos.
EJERCICIO 75. Calcule el valor esperado de la distancia relativa entre el electrón y el
protón en un átomo de Hidrógeno que se encuentra en uno de sus autoestados de energı́a y
tiene un valor bien definido del cuadrado del momento angular.
EJERCICIO 76. Calcule el valor esperado de la energı́a potencial en un átomo de
Hidrógeno que se encuentra en uno de sus autoestados de energı́a y tiene un valor bien
definido del cuadrado del momento angular.
124 CAPÍTULO 6. POTENCIALES CENTRALES
Alfabeto griego

alfa α A
beta β B
gamma γ Γ
delta δ ∆
épsilon , ε E
dseda ζ Z
eta η E
zeta θ, ϑ Θ
iota ι I
kappa κ K
lambda λ Λ
mi µ M
ni ν N
xi ξ Ξ
ómicron o O
pi π, $ Π
ro ρ, % R
sigma σ, ς Σ
tau τ T
ı́psilon υ Υ
fi φ, ϕ Φ
ji chi X
psi ψ Ψ
omega ω Ω

125
126 ALFABETO GRIEGO
Bibliografı́a

[1] Barus, Carl. “The Progress of Physics in the Nineteenth Century”, Science 22, no. 560
(1905): 353-69. Accessed February 19, 2020. [Link]/stable/1631845.

[2] L. B. Spinney, “The ether concept in modern physics”, Science 72, Issue 1865, pp. 303-310
(1930).

[3] Thomas Young, “Experimental demonstration of the General Law of the Interferene of
Light, ” Philosophical Transactions of the Royal Society of London 94 (1804).

[4] Young, Thomas (1807), A Course of Lectures on Natural Philosophy and the Mechanical
Arts, London: Joseph Johnson

[5] Henry Crew, “Thomas Young’s Place in the History of the Wave Theory of Light”, J.
Opt. Soc. Am. 20, 3-10 (1930)

[6] Roberto Torretti, “Getting rid of the ether. Could Physics have achieved it sooner, with
better assistance from Philosophy?”, THEORIA. An International Journal for Theory,
History and Foundations of Science, [S.l.] 22, n. 3, 353-374, (2009).

[7] Arago (1819). “Rapport fait par M. Arago à lÁcadémie des Sciences, au nom de la
Commission qui avait été chargée déxaminer les Mémoires envoyés au concours pour le
prix de la diffraction”. Annales de Chimie et de Physique. 2nd series (in French). 11:
5–30

[8] Delisle, J.-N. (1715). “Sur léxpérience que jái rapportée à lÁcademie dún anneau lumi-
neux semblable à celui que lón apperçoit autour de la lune dans les eclipses totales du
soleil”[On the experience that I reported to the Academy about a luminous ring similar to
that which one sees around the moon during a total solar eclipse]. Histoire de lÁcadémie
Royale des Sciences ... Avec les Mémoires de Mathématique & de Physique (in French):
166–169.

[9] Maraldi, G.F. (1723). “Diverses expèriences dóptique”. Histoire de lÁcadémie Royale des
Sciences ... Avec les Mémoires de Mathématique & de Physique (in French): 111–143.

[10] Valéria Silva Dias, Roberto de Andrade Martins, “Michael Faraday: o caminho da livraria
à descoberta da indução eletromagnética”, Ciência & Educação (Bauru) 10, No. 3, 517–
530 (2004)

[11] Cibelle Celestino Silva, Roberto de Andrade Martı́ns, “William Thomson eo Uso de
Analogias e Modelos no Eletromagnetismo”, Epistemologıá e Historia de la Ciencia, Se-
lección de trabajos de las XIII Jornadas, Vol 9, No. 9, 401–409 (2003).

[12] James Clerk Maxwell VIII. A dynamical theory of the electromagnetic field Phil. Trans.
R. Soc. 155459–512 (1864)

127
128 BIBLIOGRAFÍA
[13] Maxwell, James Clerk (1878), “Ether”, Encyclopædia Britannica Ninth Edition 8: 568 -
572

[14] Badash, Lawrence. “The Completeness of Nineteenth-Century Science”, Isis 63, no. 1
(1972): 48-58. Accessed February 17, 2020. [Link]/stable/229193.

[15] Francisco Caruso, “Proceso e Transformação para além da Ciência”, Revista Brasileira
de Ensino de Fı́sica, 20 251 (1998).

[16] Renato Álvarez Nodarse (5 de junio de 2018), “El triunfo de la Razón:


El Programa de Newton”, Blog del Instituto de Matemáticas de la universi-
dad de Sevilla. Recuperado de [Link]
el-triunfo-de-la-razon-el-programa-de-newton/ el 17 de febrero de 2020.

[17] Schulz, Peter A. (2007). Duas nuvens ainda fazem sombra na reputação de Lorde Kelvin.
Revista Brasileira de Ensino de Fı́sica, 29(4), 509-512. [Link]
11172007000400006

[18] Lord Kelvin, “Nineteenth century clouds over the dynamical theory of heat and light”,
The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science
Series 6, 2, 1-40 (1901).

[19] José Manuel Sánchez Ron. Historia de la fı́sica cuántica I. El perı́odo fundacional (1860
- 1926). (Editorial Crı́tica, 2001).

[20] Agassi, Joseph. “The Kirchhoff-Planck Radiation Law”, Science 156, no. 3771 (1967):
30-37. Accessed February 19, 2020. [Link]/stable/1720913.

[21] Siegel, Daniel M. “Balfour Stewart and Gustav Robert Kirchhoff: Two Independent Ap-
proaches to ‘Kirchhoff’s Radiation Law’”, Isis 67, no. 4 (1976): 565-600. Accessed Fe-
bruary 19, 2020. [Link]/stable/230562.

[22] Schirrmacher, Arne. “Experimenting Theory: The Proofs of Kirchhoff’s Radiation Law
before and after Planck”, Historical Studies in the Physical and Biological Sciences 33,
no. 2 (2003): 299-335. Accessed February 19, 2020. doi:10.1525/hsps.2003.33.2.299.

[23] Vorobyev AY1, Makin VS, Guo C Brighter light sources from black metal: significant
increase in emission efficiency of incandescent light sources. Phys Rev Lett. 2009 Jun
12;102(23):234301.

[24] Joseph B. Dence, Heat capacity and the equipartition theorem, . Chem. Educ. 49, 12,
798–804 (1972).

[25] KM Fonseca, F Torres-Ardila. On the difference between hermitian operators and self-
adjoint operators. MOMENTO-Revista de Fı́sica; núm. 47 (2013); 15-31 0121-4470

[26] J. von Neumann, Mathematische Grundlagen der Quantenmechanik. (Mathematical Fou-


dations of Quantum Mechanics), traducido del alemán por Robert T. Beyer, Princeton
University Press (1955).

[27] A. Galindo, P. Pascual. Mecánica Cuántica (I). (Alhambra, Madrid, 1978).

[28] Mohsen Razavy, Heisenberg’s Quantum Mechanics, (World Scientific, 2011)

[29] Bartel Leendert van der Waerden, Sources of Quantum Mechanics, (North Holland, 1967)

[30] Galliano Valent, The hydrogen atom in electric and magnetic fields: Pauli’s 1926 article,
Am. J. Phys. 71:2, 171–175 (2003).
BIBLIOGRAFÍA 129
[31] W. Rudin, Functional Analysis, McGraw-Hill, New York, 1973.

[32] A. Pankov. Introduction to Spectral Theory of Schrödinger operators, preimpreso de Ap-


plied Mathematics E-Notes, 2001-12-07. [Link]/~amen/posters/pankov.
pdf

[33] AY Gordon, S Jitomirskaya, Y Last, B Simon. Duality and singular continuous spectrum
in the almost Methieu equation, Acta Math. 178, 169-183 (1997).

[34] C. M. Bender, S. Boettcher, Real spectra in non-Hermitian Hamiltonians having PT


symmetry, Phys. Rev. Lett. 80 (1998), no. 24, 5243-5246.

[35] A. Mostafazadeh, Pseudo-Hermitian Representation of Quantum Mechanics, Internatio-


nal Journal of Geometric Methods in Modern Physics Vol. 07, No. 07, pp. 1191-1306
(2010).

[36] Schrödinger, E. (1935). Die gegenwartige Situation in der Quanten-mechanik, Naturwis-


senschaften 23, pp. 807–812; 823–828; 844–849.

[37] Daniel T. Gillespie. A quantum mechanics primer. (John Wiley & Sons, 1970).

[38] Adam Becker. What is real? The unfinish quest for the meaning of quantum physics.
Basic books, New Yok, 2018.

[39] J J Sakurai. Modern quantum mechanics. (Addison-Wesley 1994).

[40] L. Ballentine. Quantum mechanics, a modern development. 1998.

[41] D. Bohm. Quantum theory. (Dover, 1989).

[42] ML Whippman, Orbital angular momentum in quantum mechanics, American Journal


of Physics 34, 656 (1966)

[43] C. G. Gray Remark on Integral Orbital Angular Momentum, American Journal of Physics
37, 559 (1969)

[44] Ian R. Gatland, Integer versus half-integer angular momentum, American Journal of
Physics 74, 191 (2006)

[45] Robert Eisberg, Robert Resnick. Quantum Physics of Atoms, Molecules, Solids, Nuclei,
and Particles. (John Wiley & Sons, 2nd edition,1985)

[46] R Feynman, R Leighton, M Sands. The Feynman Lectures on Physics. (Addison-WEsley,


1966)

[47] DF Styer. The strange world of quantum mechanics. (Cambridge University Press, 2000)

[48] Jeanne N Clelland, Peter J Vassiliou. arXiv:1302.6672v3. Strings attached: New light on
an old problem.

[49] Darryl Yong, SIAM Review 48, p 771, Strings, Chains, and Ropes (2006).

[50] MA Pinsky, Partial Differential Equations and Boundary-Value Problems with Applica-
tions, 3rd ed., Waveland Press, Prospect Heights, IL, 2003.

[51] GF Wheeler, WP Crummett Am. J. Phys. 55, 33. The vibrating string controversy (1986)

[52] A Torchinsky. The Fourier transform and the wave equation. arXiv:0904.3252v2 (2010).
130 BIBLIOGRAFÍA
[53] EC Zeeman (1993). Controversy in Science: on the Ideas of Daniel Bernoulli and
René Thom. Nieuw Arch. Wisk. (4), 11(3), pp. 257- 282.

[54] JB Fourier (1819). Théorie du Mouvement de la Chaleur Dans les Corps Solides. Mém.
de l’Acad. Roy. des Sci. de l’Inst. de France, 4, pp.185-556.

[55] PG Dirichlet (1829). Sur la Convergence des Séries Trigonométriques Qui Servent À
Représenter Une Fonction Arbitraire Entre des Limites Données. J. für Math., 4, 157-
169. Retrieved from arXiv:0806.1294v1.

[56] JL D’Alembert (1747). Recherches Sur la Courbe Que Forme Une Corde Tenduë Mise
en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 214-219.

[57] JL D’Alembert (1747). Suite des Recherches Sur la Courbe Que Forme Une Cor de
Tenduë Mise en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 220-249.

[58] GR Bird, M Parrish, The wire grid as a near-infrared polarizer. J. Opt. Soc. Am. 50, 886
(1960).

[59] JH Poynting. On the Transfer of Energy in the Electromagnetic Field. Philo-


sophical Transactions of the Royal Society of London, 175: 343–361 (1884).
[Link]
Electromagnetic_Field.

[60] MG Silveirinha (2010). Poynting vector, heating rate, and stored energy in structured
materials: a first principles derivation. Phys. Rev. B. 82: 037104.

[61] JT Costa, MG Silveirinha, A Alù (2011). Poynting Vector in Negative-Index Metamate-


rials. Phys. Rev. B. 83: 165120.

[62] I Campos, JL Jimenez. Eur. J. Phys. 13, 117. About Poynting’s theorem. (1991)

[63] E Richter, M Florian, K Henneberger (2008). Poynting’s theorem and energy conserva-
tion in the propagation of light in bounded media. Europhysics Letters. 81 (6): 67005.
arXiv:0710.0515.

[64] E Hetch. Optics. 4a ed. (Addison Wesley, 2002)

[65] M Monteiro, C Stari, C Cabeza, A C Martı́, The Polarization of Light and Malus’ Law
Using Smartphones. Phys. Teach. 55, 264 (2017)

[66] JA Sans, FJ Manjón, ALJ Pereira, JA Gómez-Tejedor, and JA Monsoriu, Oscillations


studied with the smartphone ambient light sensor, Eur. J. Phys. 34 (6), 1349 (2013).

[67] Sanford C Gladden, An experiment on Malus’ law for the elementary laboratory, Am. J.
Phys. 18, 395 (June 1950).

[68] Thomas M Ciferno, Renate J Ondris-Crawford, Gregory P. Crawford. Inexpensive elec-


trooptic experiments on liquid crystal displays, Phys. Teach. 33, 104–110 (Feb. 1995).

[69] H Fakhruddin, Some activities with polarized light from a laptop LCD screen, Phys.
Teach. 46, 229–231 (April 2008).

[70] Larissa Vertchenko, Lev Vertchenko, Verification of Malus’s law using a LCD monitor
and digital photography, Revista Brasileira de Ensino de Fı́sica 38 (3), e3311 (2016).

[71] H Gottlieb, The law of Malus using polaroid polarizers, Phys. Teach. 18, 612–614 (Nov.
1980).
BIBLIOGRAFÍA 131
[72] MA Dias Tavares Jr, LP Sosman, RJM da Fonseca, LACP da Mota, M Muramatsu.
Using a photo-resistor to verify irradiance inverse square and Malus’ laws, AIP Conf.
Proc. 992, 193–198 (2008).

[73] M Kutzner, R Wright, E Kutzner, An inexpensive LED light sensor, Phys. Teach. 48,
341 (May 2010).

[74] M Monteiro, P Vogt, C Stari, C Cabeza, AC Martı́, Exploring the atmosphere using
smartphones, Phys. Teach. 54, 308 (May 2016).

[75] P Velasquez, M del Mar Sánchez-López, I Moreno, D Puerto, F Mateos, Interference


birefringent filters fabricated with low cost commercial polymers, Am. J. Phys. 73, 357
(April 2005).

[76] D Kinyua, G Rurimo, P Karimi, S Maina, C Ominde. Interpherometric analysis of ce-


llophane birefringence. Optics and Photonics Jounral, 3, 337 (2013)

[77] A Kumar, A Ghatak. Polarization of Light with Applications in Optical Fibers. SPIE,
2011.

[78] M Scully, O Zubairy. Quantum optics, 1997.

[79] Theodore Duddell Newton, EP Wigner. Localized states for elementary systems. Reviews
of Modern Physics, 21(3):400, 1949.

[80] Arthur S Wightman. On the localizability of quantum mechanical systems. Reviews of


Modern Physics, 34(4):845, 1962.

[81] Brian J Smith and MG Raymer. Photon wave functions, wave-packet quantization of
light, and coherence theory. New Journal of Physics, 9(11):414, 2007.

[82] CK Hong, L Mandel, (1986), Experimental Realization of a Localized One-Photon State,


Physical Review Letters 56, 58

[83] P Grangier, G Roger, A Aspect. Experimental evidence for a photon anti-correlation


effect on a beamsplitter: A new light on single photon inteferences, Europhys. Lett. 1,
173 (1986).

[84] Ludwig Zehnder (1891). Ein neuer Interferenzrefraktor. Zeitschrift für Instrumentenkun-
de. 11: 275–285.

[85] Ludwig Mach (1892). Über einen Interferenzrefraktor. Zeitschrift für Instrumentenkunde.
12: 89–93.

[86] V Degiorgio, Phase shift between the transmitted and reflected optical field of a semire-
flecting lossless mirror is π/2, Am. J. Phys. 48 (1980) 81–82.

[87] A Zeilinger. General properties of lossless beam splitters in interferometry. American


Journal of Physics 49, 882 (1981)

[88] A Luis, LL Sanchez-Soto, A quantum description of the beam splitter, Quant. Semiclass.
Opt. 7 (1995) 153–160.

[89] MW Hamilton, Phase shifts in multilayer dielectric beam splitters, Am. J. Phys. 68 (2000)
186–191.

[90] CH Holbrow, E Galvez, ME Parks, Photon quantum mechanics and beam splitters, Am.
J. Phys. 70 (2002) 260–265.
132 BIBLIOGRAFÍA
[91] H Hénault. Quantum physics an the beam splitter mystery. Proc. SPIE 9570, VI, 95700Q
(2015). ArXiv:1509.00393
[92] AC Elitzur, L Vaidman, Quantum mechanical interaction-free measurements. Found.
Phys. 23, 987 (1993)
[93] P Kwiat, H Weinfurter, T Herzog, A Zeilinger, MA Kasevich, Interaction-free measure-
ment. Phys. Rev. Lett. 74, 4763 (1995)
[94] JA Wheeler, pp. 9-48 in Mathematical Foundations of Quantum Mechanics, editado por
AR Marlow (Academic, New-York, 1978).
[95] T Hellmuth, H Walther, A Zajonc, W Schleich (1987), Delayed-Choice Experiments in
Quantum Interference, Physical Review A 35, 2532-41.
[96] MO Scully, K Drühl (1982). Quantum eraser: A proposed photon correlation experiment
concerning observation and “delayed choice” in quantum mechanics. Physical Review A,
25(4), 2208–2213.
[97] TL Dimitrova, A Weis, Single photon quantum erasing: a demonstration experiment.
European Journal of Physics 31(3): 625, 2010
[98] Bretislav Friedrich and Dudley Herschbach. Stern and Gerlach: How a Bad Cigar Helped
Reorient Atomic Physics. Physics Today 2003 56:12, 53-59
[99] Phiwe. Stern-Gerlach experiment.
[100] E. Schrödinger, Discussion of Probability Relations Between Separated Systems, Procee-
dings of the Cambridge Philosophical Society. 31, 555 (1935).
[101] W. Wootters, Entanglement of Formation of an Arbitrary State of Two Qubits, Phys.
Rev. Lett. 80, 2245 (1998).
[102] C. Bennett, G. Brassard, C. Crépeau, R. Jozsa, A. Peres, and W. Wootters, Telepor-
ting an unknown quantum state via dual classical and Einstein-Podolsky-Rosen channels.
Phys. Rev. Lett. 70, 1895(1993).
[103] Charles Fort, Lo!, Cosimo, Inc., 2004
[104] J. Bell, Speakeable and Unspeakable in Quantum Mechanics, Cambridge University
Press, 1987.
[105] D. Boschi, S. Branca, F. De Martini, L. Hardy, S. Popescu. Experimental Realization of
Teleporting an Unknown Pure Quantum State via Dual Classical and Einstein-Podolski-
Rosen Channels. arXiv:quant=ph/9710013.
[106] By taking a uniform distribution of states over the Poincare sphere, a lower upper bound
is obtained in S. Massar and S. Popescu, Phys. Rev. Lett. 74, 1259 (1995).
[107] A Einstein, B Podolsky, N Rosen. Can quantum-mechanical description of physical
reality be considered complete?, Physical Review 47, 777 (1935).
[108] Claude Cohen-Tannoudji, Bernard Diu, Frank Laloe. Quantum Mechanics, volumen 1.
(Wiley, 1991).
[109] Arnold Sommerfeld, Atombau un Spektralinien, (Friedr. Vieweg und Sohn, Braunsch-
weig, 1921)
[110] Leonard S. Schiff. Quantum Mechanics, (McGraw-Hill, 1965).
BIBLIOGRAFÍA 133
[111] Wolfgang Pauli, Wave mechanics (Dover, Nueva York, 2000).
[112] L. Pauling, E. B. Wilson. Introduction to Quantum Mechanics, McGraw-Hill, New York,
1935.

[113] S. Tomonaga. Quantum Mechanics, North-Holland, Amsterdam, 1966.


[114] E. Merzbacher. Quantum mechanics, 2da edición, Wiley, New York, 1970.
[115] A. Messiah, Quantum mechanics, Wiley, New York, 1966.

[116] M. Beck. Quantum mechanics. Theory and experiment, Oxford University Press, New
York, 2012.
[117] R. L. Liboff. Introductory quantum mechanics. Introductory quantum mechanics,
Addison-Wesley Longman, 1980.
[118] N. J. Sonine Sur les fonctions cylindriques et le développement des fonctions continues
en séries. Math. Ann. 16, 1-80, 1880.
[119] A. N. Capri, Nonrelativistic Quantum Mechanics, 3a. edición, World Scientific, 2002.

También podría gustarte