0% encontró este documento útil (0 votos)

142 vistas137 páginas

Long MCB

Este documento describe la necesidad histórica de la mecánica cuántica. En el siglo XIX, la física clásica tuvo mucho éxito pero no pudo explicar ciertos fenómenos a nivel atómico y subatómico como los espectros de emisión de los átomos. La física estadística también tenía problemas. La mecánica cuántica surgió a principios del siglo XX para resolver estos problemas al nivel microscópico mediante una nueva descripción probabilística y ondulator

Cargado por

Jose Vellojin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

142 vistas137 páginas

Long MCB

Cargado por

Jose Vellojin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Mecánica cuántica básica

K M Fonseca Romero1

Universidad Nacional de Colombia

Departamento de Fı́sica
18 de marzo de 2020

1
kmfonsecar@[Link]
ii
Índice general

1. Necesidad histórica de la mecánica cuántica 1

1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Espectros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. El cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. La fı́sica estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Un atisbo a los cimientos de la mecánica cuántica 7

2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Espacio de Hibert de funciones complejas . . . . . . . . . . . . . . . . . . . . . 7
2.3. Operadores en el espacio de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.1. Adjunto de un operador . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.2. Operadores simétricos, hermı́ticos y autoadjuntos . . . . . . . . . . . . . 12
2.4. Formulación axiomática de la teorı́a cuántica . . . . . . . . . . . . . . . . . . . 16
2.5. Lectura del postulado de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3. Polarización: descripción clásica 27

3.1. La cuerda vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. Controversia sobre la solución . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.2. Solución de d’Alembert . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.3. Solución de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1.4. Solución de Bernoulli-Fourier . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2. Polarización en cuerdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Polarización de ondas electromagnéticas . . . . . . . . . . . . . . . . . . . . . . 42
3.3.1. Polarizadores lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3.2. Teorema de Poynting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.3. Ley de Malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.4. Polarización circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3.5. Elipse de polarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4. Polarización: descripción cuántica 59

4.1. Los fotones existen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2. Estados cuánticos de polarización . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2.1. Efecto Zenón cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3. Interferómetro de Mach-Zehnder . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3.1. El experimento de Elitzur-Vaidman . . . . . . . . . . . . . . . . . . . . 69
4.3.2. Experimento de elección postergada . . . . . . . . . . . . . . . . . . . . 69
4.4. Borrador cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.5. Ejercicios de taller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

iii
iv ÍNDICE GENERAL
5. Teorı́a del momento angular 75
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2. Rotaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3. Teorı́a del momento angular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.1. Representaciones irreducibles (Irreps) . . . . . . . . . . . . . . . . . . . 79
5.4. Momento angular orbital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.1. Coordenadas curvilı́neas . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.4.2. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.4.3. Momento angular en coordenadas esféricas . . . . . . . . . . . . . . . . 89
5.5. Autoestados simultáneos de L bz y Lb2 . . . . . . . . . . . . . . . . . . . . . . . . 91
5.5.1. Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.5.2. Polinomios asociados de Legendre . . . . . . . . . . . . . . . . . . . . . 95
5.6. Autoestados usando los operadores escalera . . . . . . . . . . . . . . . . . . . . 97

6. Potenciales Centrales 101

6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.1.1. El oscilador armónico tridimensional isotrópico . . . . . . . . . . . . . . 101
6.2. Potenciales Centrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.1. Coordenadas esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.2. Momento angular y energı́a cinética . . . . . . . . . . . . . . . . . . . . 106
6.2.3. Momento angular y potenciales centrales . . . . . . . . . . . . . . . . . . 108
6.3. Átomos hidrogenoides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.3.1. Solución de la ecuación radial . . . . . . . . . . . . . . . . . . . . . . . . 111
6.3.2. Órdenes de magnitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.3.3. Degeneración accidental . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.3.4. Autofunciones de ondas radiales como polinomios asociados de Laguerre 117
6.3.5. Polinomios de Laguerre y asociados . . . . . . . . . . . . . . . . . . . . 118

Alfabeto griego 125

Capı́tulo 1

Necesidad histórica de la
mecánica cuántica

EJERCICIO 1. ¿Cuándo surgió la mecánica cuántica? ¿Por qué era necesaria esta teorı́a?
¿Cómo era la fı́sica de la época y cuáles fueron sus mayores éxitos? ¿Qué problemas resolvió la
fı́sica cuántica? ¿Cuál es la utilidad de esta teorı́a?

1.1. Introducción
El siglo XIX fue una época de consolidación de la fı́sica, durante la cual la fı́sica clásica se
aplicó a muchos ámbitos diferentes. La teorı́a de la elasticidad y la hidrodinámica, el desarrollo
y unificación de la teorı́a de la electricidad y el magnetismo (y su conexión con la óptica),
la termodinámica, la teorı́a cinética de los gases, la medición de la rapidez de la luz, son
algunos de los hitos de la fı́sica en esa época [1]. Aunque los experimentos de Thomas Young
en pelı́culas delgadas [2] y de la doble rendija [3, 4, 5] favorecı́an la teorı́a ondulatoria de la
luz, que por la época se pensaba como una onda longitudinal, esta teorı́a fue muy resistida,
especialmente por los fı́sicos franceses [6]. En la época, muchos fı́sicos estaban convencidos de
que si la luz es una onda, debı́a existir el éter, un medio material que las sostuviera, medio
que debı́a llenar todos los medios materiales y también el espacio interestelar [6].
Ni la polarización, descubierta por Étienne-Louis Malus en 1809, ni la ausencia de inter-
ferencia de ondas con polarizaciones particulares, demostrada en 1816, podı́an ser explicadas
por la teorı́a ondulatoria [5]. Augustin-Jean Fresnel, en su propuesta a la Academia Francesa
de Ciencias para explicar las propiedades de la luz, unió el principio de Huygens de ondas
secundarias con el principio de interferencia de Young a su hipótesis de ondas transversa-
les y mostró que explicaba casi todos los fenómenos conocidos de la luz [5]. Siméon Dennis
Poisson mostró el improbable resultado de que en el centro de la sombra proyectada por un
esfera deberı́a haber un punto brillante [6], el cual fue comprobado experimentalmente por
Dominique-François-Jean Arago [7].1 Después de la demostración de la existencia del punto
de Poisson (o de Arago), muchos fı́sicos franceses aceptaron la teorı́a ondulatoria y el éter
lumı́nico.
Los descubrimientos de Hans Christian Ørsted en 1820 de la desviación de los imanes
en presencia de corrientes eléctricas y de Michael Faraday en 1830 del febnómeno inverso
(producción de corrientes eléctricas por imanes en movimiento) señalan el nacimiento del
electromagnetismo [10]. La visualización del campo magnético mediante limaduras de hierro
le sugirieron a Faraday la existencia de lı́neas de fuerza magnética; la fuerza magnética serı́a
tangente a estas lı́neas, su magnitud serı́a proporcional a la densidad de las mismas [11]. Las
1 De hecho, este resultado ya habı́a sido encontrado por Delisle [8] y Maraldi [9] cien años antes.

1
2 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
fuerzas eléctrica y magnética se propagarı́an por medio de tensiones de un modelo elástico,
tensiones que Thomson pensó podrı́a entender mediante analogı́as matemáticas con los sólidos
elásticos [11]. Ası́, se sugerı́a la existencia de un éter electromagnético. James Clerk Maxwell
consideró un modelo mecánico refinado en varios artı́culos, hasta conseguir formular una
teorı́a dinámica del campo electromagnético [12], que condensa todo el electromagnetismo en
20 ecuaciones diferenciales parciales, y que muestra que las ondas luminosas son apenas un
caso de las ondas electromagnéticas. Maxwell publicó su libro A treatise on Electricity and
Magnetism en 1873 en donde hace un tratamiento más extenso de su ideas. Aunque no hacı́a
referencia a su modelo mecánico, al parecer Maxwell creı́a en la existencia del éter, pues en
1878 escribió un artı́culo sobre el éter en la Enciclopedia Británica [13], en donde afirma que se
prueba que la luz no es una sustancia porque puede interferir destructivamente. El éter deberı́a
ser capaz de transmitir energı́a con una cierta rapidez; la mitad de la energı́a es potencial
debido a las distorsiones que sufre y la otra mitad, cinética, debido a su movimiento. El éter
comenzó a ser cuestionado porque no es necesario para la formulación de la electrodinámica.
Sin embargo, no fue descartado ni siquiera con el experimento de Michelson y Morley, cuyo
resultado podı́a explicarse con la hipótesis de contracción de longitudes de George Francis
FitzGerald y Hendrik Antoon Lorentz. La aceptación de la teorı́a especial de la relatividad de
Einstein serı́a la causa de la desaparición del éter electromagnético de la fı́sica (aunque han
aparecido otras ideas de éter).
Al final del siglo XIX hubo un sentimiento, minoritario al parecer, de que el final de la fı́sica
estaba cerca [14]. Sin embargo, tal sentimiento se amplifica en algunos relatos del surgimiento
de la mecánica cuántica, tal vez para producir algo de dramatismo. Se cuenta, por ejemplo,
que William Thomson (Lord Kelvin) creı́a que ((en el cielo azul de la Fı́sica Clásica apenas
habı́a dos nubes para despejar))[15]. Prestar atención al énfasis en apenas. Para mayor efecto,
se usa el diminutivo nubecillas [16].
Antes de mostrar como esta historia distorsiona mucho lo que en realidad ocurrió, vea-
mos que un par de ejemplos que pueden dar la impresión de que sı́ se creı́a en el fin de la
fı́sica. James Clerk Maxwell en su discurso de posesión como primer Profesor Cavendish en
la universidad de Cambridge en 1871, dijo ((Esta caracterı́stica de los experimentos modernos
– de que consisten principalmente de medidas – es tan prominente, que se ha generalizado
la opinión de que en unos pocos años todas las grandes constantes de la fı́sica habrán sido
estimadas de forma aproximada y que la única ocupación que será dejada a los hombres de
ciencia será la de aumentar la precisión de tales medidas)). Maxwell, sin embargo, aclara en
su discurso que tal pesimismo es injustificado. Por otro lado, con alguna frecuencia se encuen-
tra nueva fı́sica con el aumento de precisión de las mediciones. Albert A. Michelson, en la
dedicatoria al Laboratorio Ryerson de la universidad de Chicago dice, entre otras cosas, que
((Aunque nunca es seguro afirmar que las ciencias f’ı́sicas no nos vayan a deparar maravillas
más impresionantes que las del pasado, parece probable que la mayor parte de los grandes
principios ya hayan sido establecidos firmemente y que los avances futuros deben buscarse
principalmente en la aplicación rigurosa de los mismos a todos los fenómenos de los que to-
memos conocimiento. Aquı́ es donde la ciencia de las mediciones demuestra su importancia –
en donde se desean más los resultados cuantitativos que los cualitativos. Un eminente fı́sico
resaltó que las verdades futuras de las ciencias fı́sicas deben buscarse en el sexto decimal)).
Se cuenta que el eminente fı́sico al que se estarı́a refiriendo Michelson serı́a Lord Kelvin [14].
También se cuenta que Michelson se arrepintió de sus palabras y se reprendió por haberlas
pronunciado [14].
Tanto Badash [14] cuanto Schulz [17] argumentan que estas historias constituyen una gran
injusticia a Kelvin, quien dictó una conferencia en la Institución Real de la Gran Bretaña el
27 de abril de 1900 que se ha usado como justificación de dichas historias. La conferencia, con
grandes adiciones, se publicó el año siguiente [18]. Allı́, escribe Kelvin en el primer parágrafo
((La belleza y claridad de la teorı́a dinámica, que establece que el calor y la luz son modos
de movimiento, están actualmente oscurecidas por dos nubes. La primera nació con la teorı́a
1.2. ESPECTROS 3
ondulatoria de la luz y fue abordada por Fresnel y el doctor Thomas Young; involucra la
cuestión: ¿cómo podrı́a la Tierra moverse a través de un sólido elástico tal y como esencial-
mente es el éter? La segunda es la doctrina de Maxwell-Boltzmann relativa a la partición de la
energı́a)). Nótese que no aparece la palabra apenas y que se habla de nubes y no de nubecillas
[17].
Su análisis de la nube I le toma seis páginas, al final de las cuales comenta que no encuentra
fallas ni en la concepción ni en la ejecución del experimento de Michelson y Morley, que tal
vez la respuesta sea la inexistencia del éter y que la nube I es muy densa. Kelvin afirma que
la aberración de la luz y experimentos como el de Michelson y Morley implican un éter con
una estructura difı́cil de aceptar [19]. Es bien sabido que la solución a esta nube dio origen
a la teorı́a especial de la relatividad. A la segunda nube le dedica Kelvin 33 páginas en las
cuales muestra como los resultados experimentales para los calores especı́ficos de los gases
riñen con el teorema de equipartición de energı́a. Por otro lado, si el éter tiene infinitos grados
de libertad, pero el universo tiene energı́a finita, cada grado de libertad tiene energı́a media
nula; pero si tuviera energı́a finita, el universo tendrı́a infinita energı́a. La resolución de este
acertijo se dió con la mecánica cuántica.
En este capı́tulo, veremos algunos de los problemas de la fı́sica clásica que dieron origen a
la mecánica cuántica. Una referencia particularmente útil es el libro de Sánchez [19].

1.2. Espectros
Roger Bacon (siglo XIII) creı́a que el arco iris se produce cuando la luz solar se refleja
y se refracta en las gotas de lluvia. Sin embargo, quien demostró que los colores ya estaban
presentes en la luz solar fue Newton con sus experimentos usando prismas, alrededor de 1666.
William Hyde Wollaston en 1802 y luego, de manera más completa y sistemática, Joseph von
Fraunhofer en 1814, descubrieron lı́neas oscuras en el espectro solar, que se le habı́an pasado
por alto a Newton.
Por otro lado, Thomas Melvill en 1752 habı́a observado el primer espectro de emisión del
cual tenemos noticia; la luz de una llama de sodio, al ser pasada por un prisma, produce un
espectro continuo con algunas lı́neas brillantes. León Foucault en 1849 mostró que las lı́neas D
(oscuras) de Fraunhoffer coinciden con las lı́neas brillantes del sodio. Si una sustancia puede
emitir una lı́nea espectral, entonces también puede absorberla; entonces las lı́neas oscuras
del sol se deberı́an a la presencia de sodio en la atmósfera solar. Esta notable conclusión de
Gustav Kirchhoff les permitió, a él y a su colaborador Robert Wilhelm Bunsen, con la ayuda
de mejores espectrómetros y del mechero de Bunsen, hacer una mejor exploración del espectro
solar para concluir la presencia del hierro, del magnesio, del potasio, del sodio, del litio, y de
dos nuevos metales alcalinos hasta entonces desconocidos, a los que llamaron Cesio y Rubidio,
en la atmósfera solar. Habı́a nacido la astrofı́sica. ¿Cómo se explican los espectros?

1.3. El cuerpo negro

El concepto de cuerpo negro está relacionado con las investigaciones de Kirchhoff acerca
de la emisión y de la absorción. La intensidad de los rayos que emite un cuerpo se conoce
como capacidad de radiación o emisividad; su capacidad de absorción o absorbancia es la
fracción de los rayos incidentes que absorbe el cuerpo. Kirchhoff encontró experimentalmente
la ley térmica que lleva su nombre, que la razón entre la capacidad de emisión, e(λ, T ), y la
de absorción, a(λ, T ), para una temperatura y longitud de onda fijas, es la misma para todos
los cuerpos. En sı́mbolos,

a(λ, T )K(λ, T ) = e(λ, T ), (1.1)

4 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
en donde K(λ, T ) es una función universal. Se define un cuerpo negro (volkommen schwarze
Körper, o por brevedad, schwarze Körper ) como aquél que es capaz de absorber toda la radia-
ción que incide sobre el mismo, es decir, tal que a(λ, T ) = 1. No solamente la emisividad de un
cuerpo negro es igual a la función universal K(λ, T ), sino que la emisividad de cualquier otro
cuerpo es menor o igual a la del cuerpo negro (suponiendo equilibrio térmico a temperatura
T y a una longitud de onda dada, λ).
Schirrmacher [22] cuenta la historia de demostraciones la ley térmica de Kirchhoff, y de
como algunas de ellas fueron refutadas por el uso de objetos idealizados que no pueden existir
fı́sicamente. Por ejemplo, cuerpos que emiten y absorben radiación de una única longitud de
onda –y reflejan todas las demás (usados por Kirchhoff en 1859), violan la segunda ley de la
termodinámica si están en movimiento (probado por Wien en 1894); cuerpos diatérmanos, que
dejan pasar la radiación sin calentarse (usados por Kirchhoff en 1862) no pueden existir porque
el lı́mite de tal cuerpo serı́a el vacı́o (Kayser 1902); prismas completamente transparentes
(usados por Helmholtz en 1890 y por Drude en 1900) no pueden existir porque no puede haber
dispersión con transparencia total (Kayser 1902). Si bien los prismas pueden reemplazarse con
rejillas de difracción (como mostró Richarz en 1903), la óptica geométrica serı́a inapropiada
para tratar el éter radiante (Pringsheim 1903). Uno de los objetivos de los fı́sicos del siglo
XIX, aún más que demostrar la ley de Kirchhoff, fue encontrar la función universal K(λ, T ).
Aunque parecerı́a que en la actualidad esta historia ya carece de importancia, todavı́a se
producen desarrollos inspirados por esta ley. Como en equilibrio térmico la emisividad de una
superficie es igual a la absorbancia, se ha usado una técnica para ennegrecer el filamento de
una lámpara incandescente de tungsteno con el fin de aumentar su eficiencia de emisión hasta
casi 100 % [23].

1.4. La fı́sica estadı́stica

La fı́sica estadı́stica, cuyo fin es la descripción macroscópica de sistemas con un gran núme-
ro de átomos o moléculas, surgió y floreció en el siglo XIX, a pesar de grandes opositores (por
ejemplo, Ernest Mach) quienes no aceptaban la hipótesis atómica. Siguiendo el camino tra-
zado por Rudolf Clausius, quien derivó algunas relaciones termodinámicas empleados valores
medio de algunas cantidades (tales como el camino entre colisiones en un gas), Maxwell intro-
dujo la estadı́stica completa de tales cantidades a través de una función de distribución. Por
ejemplo, Maxwell encontró que el número medio de partı́culas cuyas rapideces se encuentran
entre v y v + dv, después de un gran número de colisiones entre partı́culas idénticas es

4N 2 −v2 /α2
dN (v) = √ v e dv,
α3 π

en donde α es una velocidad caracterı́stica, que luego se mostró es igual a α = 2kT m , donde
k es la constante de Boltzmann, T la temperatura absoluta y m la masa de las partı́culas.
Usando herramientas de la teorı́a de la probabilidad, Maxwell demostró en 1860 el teorema
de equipartición de energı́a que afirma que a cada grado de libertad de tipo cuadrático (por
p2x
ejemplo, 2m ) le corresponde la misma cantidad de energı́a, igual a 1/2kT [24]. En el caso
de moléculas diatómicas podemos hacer una separación entre la coordenada del centro de
masa y la coordenada relativa. La primera solamente tiene energı́a cinética, al igual que las
coordenadas relativas de rotación. Finalmente, si la coordenada asociada a las vibraciones se
modela omo un oscilador armónico, tendremos una contribución de energı́a cinética y otra de
energı́a potencial. Ası́, realmente tendrı́amos 7 grados de libertad, por lo cual esperamos un
valor medio de energı́a igual
a /2kT . El calor molar a volumen constante es, para cada grado
7
∂hEi
de libertad, igual a CV = ∂T = 1/2kN0 = R/2, en donde N0 es la constante de Avogadro
V
y R = N0 k.
1.4. LA FÍSICA ESTADÍSTICA 5

Figura 1.1: Calor especı́fico a volumen constante, idealizado, para un gas diatómico. By
User:PAR - Own work, Public Domain, [Link]
curid=1498790

1 P0 V0
El calor especı́fico de un gas a volumen constante es 2J T (n + e) y a presión constante
1 P0 V0
es 2J T (n + 2 + e), en donde P0 y V0 son la presión y el volumen por unidad de masa
a temperatura absoluta T , J es el equivalente dinámico del calor, e es un número positivo
que depende de la ley de fuerza de la molécula y n los grados de libertad de la misma.
Experimentalmente se encontró que, para el aire y otros gases, n + e no puede ser mayor
que 4,9. Además, de las observaciones espectroscópicas se desprende que una molécula puede
ejecutar muchos tipos diferentes de movimientos vibratorios. Sin embargo, aún para moléculas
que tienen 2 átomos, el número de grados de libertad (n = 6) produce una predicción teórica
para el calor especı́fico demasiado grande.
6 CAPÍTULO 1. NECESIDAD HISTÓRICA DE LA MECÁNICA CUÁNTICA
Capı́tulo 2

Un atisbo a los cimientos de la

mecánica cuántica

2.1. Introducción
Mucho se ha debatido sobre la interpretación de la mecánica cuántica y sobre su estatus
como teorı́a. Adam Becker: Quantum theory helps us to understand the logic behind the
periodic table of elements, why diamonds are hard and how to build electronics. The inventors
of quantum theory found the logic of the periodic table of elements and use radioactivity to
[reveal the basic working of living cells].
Comenzamos con un resumen de la formulación de la teorı́a en su vertiente ortodoxa
empleando el libro de Gillespie. Enseguida un breve resumen de la formulación de la onda
piloto de de Broglie. Después haremos algunos comentarios sobre la prueba de imposibilidad
de Neumann y el artı́culo de Grete Herman, Proseguimos con el artı́culo de EPR, usando
el libro de Clemente de la Torre. Seguiremos con la formulación de Bohm y los teoremas de
Bell-Kochen-Specker y de Bell. Algo de la formulación de Everett. Algo de las crı́ticas desde
la filosofı́a. Algo sobre las teorı́a tipo Pearl y GWR. Crı́ticas a las soluciones planteadas y
algo del programa de Smolin.
Desde el punto de vista técnico, la formulación se hace restringiéndose a sistemas mecano-
cuánticos no relativistas en una dimensión, en la representación de posición y en la imagen
de Schrödinger.

2.2. Espacio de Hibert de funciones complejas

La mecánica cuántica se formula generalmente en espacios de Hilbert H, los cuales son
espacios vectoriales. En el contexto de sistemas unidimensionales, podemos pensar que los es-
pacios de Hilbert son espacios de funciones complejas. Vamos a considerar funciones complejas
de una variable real x, es decir función del tipo

ψ(x) = u(x) + iv(x),

√
en donde u(x) y v(x) son funciones reales, y hemos usado i = −1. En este caso, los vectores
son funciones complejas (de una variable real). De manera más concreta, un vector ψ es una
regla que le asigna a cada punto x de la recta real (o de un segmento finito o infinito de la
misma) un número complejo, ψ(x).
Para derivar e integrar estas funciones complejas podemos usar las definiciones conocidas

7
8 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
para las mismas operaciones para las partes real e imaginaria,
dψ(x) du(x) dv(x)
= +i ,
Z dx Z dx dxZ
ψ(x) dx = u(x) dx + i v(x) dx.

En todo espacio vectorial deben estar definidas las operaciones de multiplicación por escalar
y suma de vectores. Aquı́ los escalares son los números complejos. Si ψ1 (x) = u1 (x) + iv1 (x)
y ψ2 (x) = u2 (x) + iv2 (x) son funciones complejas, entonces su suma
ψ(x) = ψ1 (x) + ψ2 (x) = (u1 (x) + u2 (x)) + i (v1 (x) + v2 (x)) ,
es otra función compleja cuya parte real es la suma de las partes reales de ψ1 (x) y ψ2 (x) (y
cuya parte imaginaria es la suma de las partes imaginarias de ψ1 (x) y ψ2 (x)). La suma de
vectores debe ser clausurativa (la suma de dos vectores debe ser otro vector), conmutativa (no
importa el orden en que se suman los vectores), asociativa ((ψ1 + ψ2 ) + ψ3 = ψ1 + (ψ2 + ψ3 ))
y debe existir el vector cero que sumado a cualquier vector ψ da el vector ψ como resultado.
Por otro lado, si c = a + ib es un número complejo y ψ1 (x) = u1 (x) + iv1 (x) es una función
compleja, entonces el producto de la función ψ1 por el escalar c es la función
ψ(x) = cψ1 (x) = (au1 (x) − bv1 (x)) + i (av1 (x) + bu1 (x)) .
La multiplicación por escalar debe ser clausurativa (cψ es otro vector), distributiva con res-
pecto a la suma de vectores (c(ψ1 + ψ2 ) = cψ1 + cψ2 ) y con respecto a la suma de escalares
((c1 +c2 )ψ) = c1 ψ+c2 ψ), debe ser asociativa ((c1 c2 )ψ = c1 (c2 ψ)) y el producto de la identidad
del campo escalar con un vector da como resultado el mismo vector.
Los espacios de Hilbert también poseen otra operación, conocida como producto interno
o producto escalar, la cual le asigna un número complejo a cada par ordenado de vectores. Si
ψ1 (x) y ψ2 (x) son funciones complejas, el producto escalar (ψ1 , ψ2 ) se define como
Z ∞
(ψ1 , ψ2 ) = ψ1∗ (x)ψ2 (x) dx (2.1)
−∞

en donde ψ1∗ (x)es la función (u1 (x) + iv1 (x))∗ = u1 (x) − iv1 (x) correspondiente a la conju-
gación compleja de la función ψ1 (x). A partir del producto escalar se puede definir la norma
de un vector,
p
kψk = (ψ, ψ),
de modo que el cuadrado de la norma del vector ψ
Z ∞ Z ∞
kψk2 = ψ ∗ (x)ψ(x) dx = u2 (x) + v 2 (x) dx ≥ 0,

(2.2)
−∞ −∞

es un número positivo o cero. De hecho, la norma solamente es cero si la función compleja es

cero en todas partes; es decir, si corresponde al vector cero. Una norma también debe satisfa-
cer la igualdad kcψk = |c|kψk, en donde |c| es la magnitud del número complejo c. Además,
debe satisfacer la desigualdad triangular kψ1 + ψ2 k ≤ kψ1 k + kψ2 k.

Ejercicio: demostrar la desigualdad triangular?

EJERCICIO 2. Empleando la definición de producto escalar, y suponiendo que c1 y c2 son

números complejos, demostrar las siguientes propiedades
∗
(ψ1 , ψ2 ) = (ψ2 , ψ1 )
(ψ1 , c2 ψ2 + c3 ψ3 ) = c2 (ψ1 , ψ2 ) + c3 (ψ1 , ψ3 )
(c2 ψ2 + c3 ψ3 , ψ1 ) = c∗2 (ψ2 , ψ1 ) + c∗3 (ψ3 , ψ1 ) .
2.2. ESPACIO DE HIBERT DE FUNCIONES COMPLEJAS 9
EJERCICIO 3. Demostrar la desigualdad de Cauchy-Schwarz
|(ψ1 , ψ2 )| ≤ kψ1 kkψ2 k.
Sugerencia: la norma de ψ = (ψ1 , ψ2 )ψ1 − (ψ1 , ψ1 )ψ2 es un número positivo o cero.

EJERCICIO 4. Considere las siguientes funciones complejas (recuerda que las constantes c1
y c2 son números complejos)
2 2 2 2
ψ1 (x) = c1 e−x /σx
, ψ2 (x) = c2 xe−x /σx
. (2.3)
Encuentre la norma de las funciones anteriores. Encuentre todos los valores posibles de c1 y
c2 para que la norma de ψ1 sea uno. Repita para ψ2 .

EJERCICIO 5. Calcule el producto escalar (ψ1 , ψ2 ) con las funciones definidas en el ejercicio
2.2.

No todas las funciones complejas son vectores del espacio de Hilbert H; sola-
mente aquellas con norma finita.
El producto escalar permite definir la noción de ortogonalidad. Dos funciones complejas
2 2
son ortogonales si su producto escalar es cero. Por ejemplo, las funciones ψ1 (x) = c1 e−x /σx y
2 2
ψ2 (x) = c2 xe−x /σx son ortogonales. Además, si c1 y c2 se escogen de acuerdo con el ejercicio
2.2 tenemos dos funciones ortonormales.
2 2
EJERCICIO 6. Considere la función ψ(x) = x2 e−x /σx . Emplee el método de ortonorma-
lización de Gram-Schmidt para encontrar una función de norma uno que sea ortogonal a
2 2 2 2
ψ1 (x) = c1 e−x /σx y a ψ2 (x) = c2 xe−x /σx .
Ahora podemos definir la noción de conjunto ortonormal {ψi }: un conjunto de vectores
de H (funciones complejas ψi (x)) que satisfacen
(ψi , ψj ) = δi,j ,
en donde δi,j denota la delta de Kronecker, la cual es cero a menos que los ı́ndices i y j sean
iguales. Las vectores ψ1 , ψ2 y ψ3 de los ejercicios anteriores forman un conjunto ortogonal.
Un conjunto de vectores de H, {ψi , i = 1, 2, . . . , N }, es completo si cualquier vector ψ de H
puede escribirse como una combinación lineal de elementos del conjunto,
N
X
ψ= ci ψi ,
i=1

en donde ci son números complejos. En el caso de espacios vectoriales complejos con norma
inducida por un producto escalar, el número natural N es finito. En el caso de los espacios
de Hilbert, N es necesariamente infinito.
Si un conjunto de vectores {ψi , i = 1, 2, . . .} es tanto completo cuanto ortonormal, de-
cimos que se trata de una base ortonormal. Cualquier vector ψ puede escribirse como una
combinación lineal de los elementos de esta base
∞
X
ψ= ci ψi ,
i=1

en donde ci son números complejos. Tomando el producto escalar con un elemento de la base,
digamos ψj , tendremos
∞
X ∞
X ∞
X
(ψj , ψ) = (ψj , ci ψi ) = ci (ψj , ψi ) = ci δi,j , = cj .
i=1 i=1 i=1
10 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Ası́, cualquier vector ψ puede escribirse como
∞
X
ψ= (ψi , ψ) ψi .
i=1

El espacio de estados los sistemas unidimensionales, funciones complejas de cuadrado

integrable, es un espacio de Hilbert separable, es decir, uno que posee una base infinita pero
enumerable, como se supuso en el desarrollo anterior. La notación que se usa para denotar
este espacio es L2 (R).
Un hecho técnico importante es que los espacios de Hilbert son completos en su norma.
Recordemos que una secuencia de vectores {ψi } es de Cauchy si existe M () tal que la distancia
(aquı́ es donde se usa la norma) entre dos elementos de la secuencia, kψi − ψj k, i, j > M, es
menor que > 0. Se dice que la secuencia {ψi } converge a ψ si lı́mi→∞ kψi − ψk = 0. Se dice
que un espacio de Hilbert H es completo porque todas las secuencias de Cauchy con elementos
en H convergen a un vector que también es un elementos de ese mismo espacio de Hilbert.
En esa caracterı́stica, los espacios de Hilbert se parecen a los números reales, las secuencias
de Cauchy de números convergen a un número real.

2.3. Operadores en el espacio de Hilbert

Cuando derivamos una función compleja encontramos otra función compleja. En el len-
guaje de espacios de Hilbert, podemos decir que la derivada es una regla que le asocia a ψ,
un vector de H otro vector, χ

d
χ(x) = ψ(x).
dx
A las reglas que toman un vector del espacio de Hilbert y le asocian otro vector, se les
denomina operadores. Es común escribir

χ = Oψ.
b

Si un operador Ob se multiplica por un número complejo c se obtiene un nuevo operador, c O;

b
la suma y el producto de dos operadores corresponden a un nuevo operador. Estos operadores
se definen como sigue

(c O)ψ
b = c(Oψ) b
(O
b1 + Ob2 )ψ = (Ob1 ψ) + (Ob2 ψ),

(O
b1 O
b2 )ψ = Ob1 O b2 ψ .

La mayor parte de los operadores de la mecánica cuántica son operadores lineales, los cuales
satisfacen la igualdad

Ob (c1 ψ1 + c2 ψ2 ) = c1 Oψ
b 1 + c2 Oψb 2 .

Merece la pena notar que, de la misma forma que, en general, f (g(x)) no es igual a g(f (x)),
(O
b1 O
b2 )ψ tampoco es igual a (O
b2 O
b1 )ψ.

EJERCICIO 7. Muestre que el operador multiplicación por x3 , O

b1 ψ(x) = x3 ψ(x) es un
operador lineal.
2.3. OPERADORES EN EL ESPACIO DE HILBERT 11
d2 d2 ψ(x)
EJERCICIO 8. Muestre que el operador segunda derivada dx2 , O
b2 ψ(x) =
dx2 es un ope-
rador lineal.

b1 , multiplicación por x3 , y O
EJERCICIO 9. Muestre que los operadores O b2 , segunda deri-
2
d
vada dx 2 , no conmutan.

EJERCICIO 10. Muestre que [O b1 , O

b2 ] puede escribirse como otro operador, O
b3 , en el sentido
de que [O1 , O2 ]ψ = O3 ψ. ¿Cómo actúa O3 sobre ψ?
b b b b

EJERCICIO 11. Repita el ejercicio anterior usando los operadores O b1 multiplicación por x
y O2 , primera derivada con respecto a x. ¿Cómo actúa O3 sobre ψ?
b b

2.3.1. Adjunto de un operador

Consideremos un operador Lb que asigna a cada vector φ(x) que pertenece al un dominio
D(L), subespacio denso de un espacio de Hilbert H, otro vector Lφ(x),
b b entonces Lb † es el
operador adjunto de L
b siempre y cuando

(Lφ(x),
b b † ψ(x)).
ψ(x)) = (φ(x), L (2.4)

El dominio de L b † es el conjunto de todos los vectores ψ(x) para los cuales se cumple la
igualdad anterior. El producto interno se define ası́:
Z 2π
(φ(x), ψ(x)) = φ∗ (x)ψ(x)dx. (2.5)
0

Ejemplo Consideremos el espacio de Hilbert correspondiente a las funciones complejas

φ(x) de cuadrado integrable definidas en el intervalo [0, 2π]. Consideremos el operador de-
rivada, Lφ(x)
b = dφ(x)
dx . Es necesario decir cuál es el dominio de L para definirlo; es decir,
b
dos operadores derivada L1 y L2 serán diferentes si el dominio D(L
b b b 1 ) es diferente del domi-
nio D(L b 2 ). Podemos escoger D(L b 1 ) como el conjunto de funciones complejas en el intervalo
[0, 2π] que poseen derivada, tales que tanto la función como su derivada son de cuadrado
integrable y que se anulan tanto en x = 0 como en x = 2π. De manera semejante escogemos
D(L b 2 ) como el conjunto de funciones complejas en el intervalo [0, 2π] que poseen derivada,
tales que tanto la función como su derivada son de cuadrado integrable y que se satisfacen
φ(x = 0) = φ(x = 2π).
Vamos a hallar L b † , el operador adjunto de L b1 ,
1
Z 2π
dφ(x) ∗
(L
b 1 φ(x), ψ(x)) = ψ (x)dx.
0 dx

Enseguida integramos por partes,

2π
dψ ∗ (x)
Z
b 1 φ(x), ψ(x)) = φ(x)ψ ∗ (x)|2π −
(L φ(x) dx.
0
0 dx

Teniendo en cuenta que las funciones φ(x) en el dominio D(L

b 1 ) se anulan en los extremos, el
término de frontera se hace cero. Por lo tanto,
2π ∗
dψ ( x)
Z
(L
b 1 φ(x), ψ(x)) = φ(x) − b † ψ(x)).
dx = (φ(x), L 1
0 dx
12 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Comparando el segundo término de la ecuación anterior con el último término concluimos
que L b † es menos el operador derivada. Como dijimos antes, el operador no está determinado
1
a menos que pongamos el dominio. Podemos esperar que las funciones para las que se aplica
deben ser de cuadrado integrable, que tengan derivada que también sea de cuadrado integrable.
Además, como el término de frontera se anuló sin exigir ninguna condición sobre ψ(x), el
dominio D(L b † ) no incluye ninguna condición sobre como ψ(x) debe comportarse en x = 0 y
1
en x = 1.
EJERCICIO 12. Encontrar L b † , el adjunto del operador Lb 2 . Recuerde que L
b 2 es el opera-
2
dor derivada tal que su dominio D(L2 ) es el conjunto de funciones complejas en el intervalo
b
[0, 2π] que poseen derivada, tales que tanto la función como su derivada son de cuadrado
integrable y que no satisfacen ninguna condición de frontera.
Comentario: Con alguna frecuencia se dice que L b † es el hermitiano conjugado de L b y
d † d

se escribe dx = − dx . Generalmente, en estos casos, se ignoran los dominios, tanto del
operador L b como de su adjunto.

2.3.2. Operadores simétricos, hermı́ticos y autoadjuntos

Existen varias formas diferentes de usar las palabras simétrico, hermı́tico y autoadjunto
cuando se aplican a operadores lineales en un espacio de Hilbert. En fı́sica, con alguna fre-
cuencia se dice que, si el hermitiano conjugado de un operador (ignorando el problema del
dominio) es igual al operador mismo, el operador es hermı́tico. Por ejemplo, se puede escri-
d † d † d †
= (−i)∗ dx d d

bir −i dx = i − dx = −i dx . Se dirı́a, entonces, que el operador −i dx es
hermı́tico.
Existen, sin embargo, otros usos para la palabra hermı́tico en la la literatura. Gillespie
[37], por ejemplo, dice que los operadores hermı́ticos son aquellos que satisfacen la igualdad

(Oψ,
b χ) = (ψ, Oχ)
b (2.6)
para todos los vectores ψ y χ de H. De hecho, esta definición coincide con la definición de
operadores autoadjuntos que se usa en el análisis funcional. Sin embargo, veamos que se
supone que el dominio del operador es todo el espacio de Hilbert. Esta condición es posible
para una clase de operadores que se conocen como operadores compactos (operadores cuyos
autovalores son finitos todos ellos, de manera que la razón entre las normas de Oψ b y de ψ sea
finita). Sin embargo, la inmensa mayorı́a de operadores que usamos en mecánica cuántica no
son compactos, son no acotados. Los operadores multiplicación por x y derivada, por ejemplo,
no son compactos. Como los operadores acotados no pueden definirse en todo el espacio de
Hilbert, la definición anterior tiene utilidad limitada. Se podrı́a suponer, entonces, que para
operadores no acotados un operador O b serı́a hermı́tico si satisface la igualdad

(Oψ,
b χ) = (ψ, Oχ),
b ∀φ, ψ ∈ D(O),
b (2.7)

para todos los vectores ψ y χ de su dominio D(O). b Esta suposición, sin embargo, está equi-
vocada, pues la ecuación (2.7) define operadores simétricos.
Existe otra generalización del concepto de hermiticidad (de la manera que la entience
Gillespie [37]) para operadores no acotados: la autoadjunción. En tales casos es menester
definir el dominio del operador O,
b luego encontrar Ob † , su adjunto; es decir, saber como actúa
†
y qué dominio tiene. Si tanto O b cuanto O b actúan de la misma forma y tienen el mismo
dominio, entonces se dice que O b es autoadjunto [25].
Vale la pena mencionar que la noción matemática relevante para la asociación entre obser-
vables y operadores es la de autoadjunción y no la de hermiticidad, la cual a menudo se usa
como comodı́n para designar ora operadores simétricos, ora operadores autoadjuntos. Como en
muchas situaciones no es necesario hacer las distinciones entre operadores simétricos, hermı́ti-
cos y autoadjuntos, en primera aproximación se pueden usar de manera intercambiable. Sin
2.3. OPERADORES EN EL ESPACIO DE HILBERT 13
embargo, algunos fenómenos fı́sicos como el efecto Aharonov-Bohm dependen crucialmente
de que estén claras las diferencia entre estos conceptos relacionados.
Comencemos examinando un operador constante O b = c. Teniendo en cuenta que Oψ
b = cψ
y que Oχ
b = cχ, la ecuación (2.6) queda

(cψ, χ) = (ψ, cχ)?

Como el lado izquierdo es igual a c(ψ, χ) y el lado derecho igual a c∗ (ψ, χ), ambos lados son
iguales solamente si c = c∗ , es decir, si c es un número real.
Enseguida consideremos el caso del operador derivada. El lado derecho de la ecuación (2.6)
queda
∞ Z ∞
dψ ∗ (x)
Z
dχ(x)
(ψ, Oχ)
b = = ψ ∗ (x)χ(x)|∞
dx ψ ∗ (x) −∞ − dx χ(x)
−∞ dx −∞ dx
Z ∞ ∗
dψ b † ψ, χ).
= dx − χ(x) = (O
−∞ dx

En la secuencia hemos hecho una integración por partes y luego eliminamos los términos de
frontera. La razón es que para que la derivada de una función compleja pertenezca al espa-
cio de Hlbert es necesario que sea cero o tienda a cero cuando x → ±∞. Vemos que con la
eliminación de los términos de frontera hemos sido capaces de escribir (ψ, Oχ)b = (O b1 ψ, χ),
en donde O b1 es menos la derivada. Como O b1 depende de O b de la manera como acabamos de
expresarlo, en realidad hemos encontrado el operador adjunto de la derivada (que es menos
la derivada), por lo cual lo notamos O b † . Esta es la condición que nos permite encontrar el
1
adjunto de un operador. Vemos que, como los términos de superficie se anularon debido a
las condiciones sobre χ(x), las funciones ψ(x) no deberı́an satisfacer condiciones de frontera
parecidas. Sin embargo, para que menos la derivada de una función compleja pertenezca al
espacio de Hilbert, es menester que sea cero o tienda a cero cuando x → ±∞.

b igual a −i veces la derivada es un operador

EJERCICIO 13. Muestre que el operador O
hermı́tico (autoadjunto).

EJERCICIO 14. Sin preocuparse por el problema de los dominios de los operadores, usando
la definición del adjunto de un operador, muestre que el adjunto del operador O
b1 O
b2 es O b†
b† O
2 1.

En la teorı́a cuántica los autovalores y los autovectores de los operadores hermı́ticos tienen
un lugar espacial. Supongamos que V es un espacio vectorial sobre un cuerpo F (scalar field ),
y que T es un operador lineal con dominio D(T ), subespacio de V, que transforma vectores
pertenecientes a su dominio en otros vectores de V. A un vector no nulo v, elemento de D(T ),
que satisface T v = λv para algún escalar λ, se le llama autovector de T ; λ es el autovalor
correspodiente. En fı́sica cuántica, los espacios vectoriales de interés son los espacios de Hilbert
y el cuerpo de interés son los números complejos; de manera que la definición de autovalores
y autovectores, en este caso particular, se puede enunciar ası́. Si O b es un operador y ψ es un
vector de H que cumple la ecuación

Oψ
b = oψ,

en donde o es un número complejo, decimos que ψ es un autovector de O

b con autovalor o.

1 Para poder encontrar el adjunto de un operador O

b es necesario que el dominio de ese operador sea denso
en H, es decir, que cualquier vector de H debe poder aproximarse por vectores del dominio de O.
b
14 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
EJERCICIO 15. Muestre que la función eax , con a real, es una autofunción del operador
d
dx , definido sobre un espacio vectorial adecuadamente escogido. ¿Cuál es el autovalor corres-
pondiente? ¿qué pasa si a es un número puramente imaginario?

Recuerde que mientras el operador derivada no es hermı́tico, en un ejercicio anterior usted

d
obtuvo que el operador −i dx si lo es. Sin importar si a es complejo, real puro o imaginario
ax d
puro, la función e es autofunción de −i dx . ¿cómo es el autovalor en caso de que a sea real
o sea puramente imaginario?

EJERCICIO 16. Muestre que la función xn , con n entero, es una autofunción del operador
d
x dx . ¿Qué tuvo que suponer acerca del espacio vectorial en dónde se definió el operador?
¿Cuál es el autovalor correspondiente?

EJERCICIO 17. ¿La función cos(ax), con a real, es autofunción de qué operador no constan-
te? Si ese operador es O, b 2 ? En caso positivo,
b ¿la función cos(ax) también es autofunción de O
¿cuál es el autovalor correspondiente?
2 2
EJERCICIO 18. ¿Puede escoger la constante a de manera que ψ1 (x) = c1 e−x /σx y ψ2 (x) =
2 2
c2 xe−x /σx , en donde c1 , c2 y σx son constantes, sean ambas autofunciones del operador
d2 2
− dx 2 + ax ? En caso positivo, ¿cuáles son los autovalores correspondientes? En caso negativo,

¿los valores obtenidos para la constante son diferentes para cada una de las funciones, o es
imposible escoger a de manera que ψ1 o ψ2 sean autofunciones?

EJERCICIO 19. Muestre que si O b es un operador hermı́tico, entonces sus autovalores son
reales. (Sugerencia: Considere que las dos cantidades (ψ, Oψ)
b y (Oψ,
b ψ) son iguales si el ope-
rador O es autoadjunto, y use el hecho de que ψ es autofunción de O
b b con autovalor c.) Si
quiere ser más formal, suponga que O es un operador compacto autoadjunto, o que es un
b
operador no acotado autoadjunto, pero que los autovalores hacen parte del espectro discreto.

d
Volvamos al caso del operador −i dx . Si a es imaginario puro, la función eax es autofunción
d
de −i dx con autovalor real; si es real, el autovalor es imaginario. Al parecer, podemos inclusive
considerar que a es complejo y la función eax parece ser autofunción. ¿Existe alguna diferen-
cia fundamental entre los diferentes casos? Recuerde que hemos dicho que las autofunciones
deben pertenecer al espacio de Hilbert.

EJERCICIO 20. Calcule la norma de la función eax . ¿Encuentra diferencias en el valor de

la norma cuando a es puramente real y cuando es puramente imaginario?

En ambos casos usted ha debido encontrar que la función eax no tiene norma finita. ¿Es-
d
te resultado implica que el operador −i dx no tiene autofunciones? Esta pregunta se puede
responder de diferentes maneras. En fı́sica se acostumbra a definir autofunciones aún cuando
estas no tengan norma finita. Sin embargo, no pueden tener un comportamiento arbitrario.
Mientras las funciones eax , a imaginario puro, tienen crecimiento limitado cuando x es muy
grande (|eax | es finito cuando x → ±∞), crecen sin cota cuando si la parte real de a no es
cero: cuando x → ∞ si la parte real de a es positiva y cuando x → −∞ si la parte real de a
es negativa. ¿Qué pasa con exp(ix3 ) por ejemplo? El uso de funciones como eiax , en donde a
es real, no es exclusivo de la mecánica cuántica. En efecto, en electrodinámica y en el estudio
de ondas, es común usar ondas planas, del tipo ei(kx−ωt) (en realidad, se usan ondas que se
comportan como superposiciones de la parte real y de la parte imaginaria de la expresión
anterior). La energı́a contenida en una onda plana, la cual se extiende por todo el espacio,
es infinita. Claramente las ondas planas no son posibles en la realidad; no podemos producir,
2.3. OPERADORES EN EL ESPACIO DE HILBERT 15
experimentalmente, ninguna onda plana. Se usan, sin embargo, porque son aproximaciones a
situaciones fı́sicas reales y porque son simples, y permiten manipulaciones algebraicas senci-
llas. Con frecuencia, también se usan en programas numéricos. En mecánica cuántica, tenemos
una situación parecida. No es posible preparar estados descritos por ψ(x) = eiax , con a real;
pero son simples, es fácil manipularlas matemáticamente, se pueden aproximar en situaciones
reales y se emplean en cálculos numéricos. Además, funciones de onda de este tipo son los
autovectores generalizados, tanto del operador de momento, como del hamiltoniano de una
partı́cula libre.

EJERCICIO 21. Muestre que si ψ1 (x) y ψ2 (x) son autofunciones del operador hermı́tico
O,
b con autovalores diferentes c1 y c2 , entonces ψ1 (x) y ψ2 (x) son ortogonales. (Sugerencia:
Considere las dos cantidades (ψ1 , Oψ
b 2 ) y (Oψ
b 1 , ψ2 ) y use el hecho de que c1 y c2 deben ser
números reales.) Si quiere ser más formal, suponga que O b es un operador compacto autoad-
junto, o que es un operador no acotado autoadjunto, pero que los autovalores hacen parte del
espectro discreto.

El espectro de un operador autoadjunto, es decir, el conjunto de autovalores del operador

se puede descomponer en tres partes [31, 32]: absolutamente continuo, singular continuo y
puntual. Desde el punto de vista práctico, podemos ignorar la segunda contribución.2 Ası́,
basta tener en cuenta ejemplos de espectro puntual y de espectro continuo (al menos un in-
tervalo de la recta real forma parte del espectro del operador), con la posibilidad de que haya
degeneración, es decir que haya más de un autoestado asociado al mismo autovalor. Mientras
que los autoestados correspondientes al espectro puntual son normalizables, es decir, verdade-
ros vectores del espacio de Hilbert, aquellos correspondientes al espectro continuo, conocidos
como vectores generalizados, no lo son. En realidad, son distribuciones. Una manera de for-
malizar tales vectores es a través del uso de las tripletas de Gelfand, o de los llamados Rigged
Hilbert spaces, algo ası́ como espacios de Hilbert alistados. Se definen, además del espacio de
Hilbert, otros dos espacios: el nuclear y el dual del espacio nuclear. El producto escalar entre
un vector del espacio nuclear y un elemento de su dual está definido y es un número complejo
de norma finita. Si un operador es autoadjunto con H, sus autovectores correspondientes al
espectro puntual son vectores del mismo espacio de Hilbert y sus autovectores (generalizados)
correspondientes al espectro continuo son elementos del espacio dual del espacio nuclear.
Supongamos entonces que un cierto operador autoadjunto en H tiene un conjunto de
autovectores ψi y otro de autovectores generalizados ψ(o). Cualquier estado φ del espacio de
Hilbert H puede escribirse como
X Z
φ= (φi , φ)φi + do (ψ(o), φ)ψ(o),
i o∈σac

en donde σac designa el(los) intervalo(s) en donde se tiene el espectro continuo. Los autovecto-
res generalizados tienen también una regla de normalización, como se muestra en el siguiente
ejemplo. √ d
Los autovectores generalizados ψk , ψk (x) = eikx / 2π son autoestados del operador −i dx ,
en donde k es un número real arbitrario. Cualquier estado puede escribirse entonces como
Z ∞ Z ∞
eikx
φ= dk (ψk , φ)ψk , φ(x) = dk (ψk , φ) √ ,
−∞ −∞ 2π
en donde
∞
e−ikx
Z
(ψk , φ) = dx √ φ(x).
−∞ 2π
2 Sin embargo, existen ejemplos fı́sicos relacionados con el estudio del efecto Hall cuántico. El lector intere-

sado puede consultar el artı́culo [33]

16 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
iqx
e
Supongamos que φ(x) = √ 2π
= ψq . Teniendo en cuenta las regla de integración de la
distribución delta de Dirac, es necesario que (ψk , ψq ) = δ(k − q), por lo cual,
Z ∞ Z ∞
e−ikx eiqx
dx √ √ = δ(k − q), dx e−i(k−q)x = 2πδ(k − q).
−∞ 2π 2π −∞

De hecho, esta última integral, que tiene sentido dentro de la teorı́a de distribuciones, es la
eikx
que nos dice que debemos usar las autofunciones √ 2π
para que su relación de ortonormalidad
sea una delta.

2.4. Formulación axiomática de la teorı́a cuántica

La formulación actual de la mecánica cuántica no relativista requirió de los esfuerzos de
varios fı́sicos que hicieron importantes contribuciones durante un periodo de unos 25 años.
Los diferentes elementos del rompecabezas se fueron hallando uno a uno, pero aún después
de tener armado el rompecabezas no era claro el mensaje. En medio de desacuerdos que
continúan hasta el presente, Niels Bohr y colaboradores desarrollaron una interpretación con
espı́ritu positivista, que continúa siendo la presentación ortodoxa de la teorı́a, conocida como
interpretación de Copenague. La formulación axiomática de John von Neumann [26], con
algunas modificaciones, es la misma que se usa en muchos libros de texto. Aquı́ usamos la
versión del libro de Daniel Gillespie [37], suponiendo que tenemos un sistema unidimensional.
Otros libros de texto comparten el mismo orden de los postulados; por ejemplo, la referencia
[27].
Los dos primeros postulados y el sexto son de representación. Suponemos que existen
los sistemas fı́sicos que son representados en la teorı́a por objetos matemáticos. El primer
postulado dice qué objeto matemático se asocia al estado de un sistema y el segundo trata de
la representación matemática de los observables.

Estados Una partı́cula clásica unidimensional se caracteriza por los valores de su posición
y de su momento. El estado del sistema, en un instante de tiempo t, se describe mediante
(x(t), p(t)), los valores de posición y momento de la partı́cula en ese instante. Más en general,
el estado un sistema clásico se asocia con un punto del espacio de fases del sistema, la colección
de coordenadas generalizadas y de sus momentos canónicamente conjugados. Si se conoce el
estado del sistema, se conocen los valores de todos los observables del sistema (porque son fun-
ciones de las coordenadas generalizadas y de sus momentos canónicos). Además, si se conocen
las fuerzas sobre el sistema y el estado del sistema en un instante, se puede conocer el estado
del sistema en cualquier otro instante. Cualquiera que sea el objeto matemático escogido para
representar los estados de un sistema cuántico, debe contener la información acerca de sus
observables y deberı́a ser posible conocer el estado en el futuro, cuando se conoce el estado
en un tiempo dado.

Postulado 1. Todo estado fı́sico de un sistema dado se describe mediante un vector de norma
unidad de algún espacio de Hilbert H y todo vector de norma unidad de ese espacio corres-
ponde a un posible estado fı́sico. Vectores que difieren por una fase, ψ(x) y eiφ ψ(x), donde
φ es un número real, describen el mismo estado fı́sico. Todo lo que se pueda saber acerca del
sistema en un instante de tiempo t está codificado en ψt (x), la función de onda del sistema
en ese instante.

Consideremos un bolı́grafo, ¿cómo se describe clásicamente? Si pensamos en el marcador

como una partı́cula puntual, necesitarı́amos seis números que corresponden al espacio de fase
de una partı́cula puntual: tres coordenadas y dos momentos. Sin embargo, si se considera
como un cuerpo rı́gido, se necesitarı́a el doble de números, ya que es necesario usar tres
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 17
coordenadas más para especificar cómo está orientado el bolı́grafo en el espacio, y otras tres
que corresponden a los momentos canónicamente conjugados. El bolı́grafo es el mismo, pero se
puede describir de formas diferentes. Podemos hablar del nivel de descripción. En mecánica
cuántica, también se puede describir el mismo sistema fı́sico usando diferentes niveles de
descripción.
Los estados pueden representarse mediante vectores. Supongamos que tenemos una base
del espacio de Hilbert, compuesta por las funciones α1 (x), α2 (x), · · · Cualquier vector ψ del
espacio de Hilbert (cualquier estado) se puede escribir como una combinación lineal de las
funciones αi (x), X
ψ(x) = (αi , ψ)αi (x).
i

Si pensamos en las funciones αi (x) como ejes generalizados, podemos pensar que el estado ψ
se puede escribir como un vector columna (columna por convención),
 
(α1 , ψ)
. 
ψ = (α2 , ψ) .

..
.

EJERCICIO 22. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) =
δ(x − x0 ) puede describir un estado de este sistema? En caso de que la respuesta sea negativa,
i) encuentre una forma de “arreglar” la función para que la nueva función sı́ pueda describir
un estado de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
EJERCICIO 23. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas
se encontró con el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas
planas unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para que la
nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii) muestre que
no se puede arreglar.
EJERCICIO 24. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene
espı́n hacia arriba y espı́n hacia abajo. Escriba el estado más general de una partı́cula de
espı́n 1/2, tanto en el formalismo de Dirac como en el formalismo en el que los estados se
representan como vectores columna.
EJERCICIO 25. Escriba el estado más general de una partı́cula de dos espines 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan como
vectores columna.
EJERCICIO 26. Escriba un estado de dos partı́culas cuánticas tridimensionales. ¿Qué re-
quisitos deberı́a cumplir esta función para poder describir un estado cuántico? La función que
escribió ¿puede escribir un estado cuántico? Justifique su respuesta.
EJERCICIO 27. ¿Cómo se puede saber si un sistema está en un estado particular?
EJERCICIO 28. ¿Se puede medir el estado de un sistema?
EJERCICIO 29. ¿El estado cuántico describe un único sistema?

Observables En mecánica clásica, un observable es una variable dinámica (alguna función

del momento y la posición) que se puede medir. La medición del observable A es un proce-
dimiento fı́sico bien definido que, cuando se ejecuta sobre el sistema, da como resultado un
número real que es el valor del observable.

Postulado 2. A cada observable fı́sico A le corresponde un operador lineal autoadjunto

(hermı́tico) A
b y a todo operador lineal autoadjunto le corresponde algún observable fı́sico. El
operador A posee un conjunto completo de autovectores ortonormales α1 (x), α2 (x), · · · que
b
satisfacen
Aα
b i (x) = ai αi (x), i = 1, 2 · · ·
18 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
en donde los números reales ai son los únicos resultados posibles en la medición del observable
A.

Se argumenta que los observables se escogen autoadjuntos para asegurar autovalores reales,
los cuales son los únicos que se obtienen en un experimento. Además, porque cualquier estado
de un sistema puede escribirse como una combinación lineal de los autovectores de cualquier
operador autoadjunto del sistema. La tercera razón en favor de los operadores autoadjuntos
tiene que ver con dos postulados posteriores. Para cada sistema fı́sico existe un operador lineal
que aparece en la ecuación de evolución temporal; si este operador es autoadjunto, entonces
la evolución es unitaria y hay conservación de la probabilidad.
[artı́culo con 2 ruidos RWA]
Aunque son buenos argumentos, podrı́a haber alternativas. Por ejemplo, un operador
podrı́a representar dos observables, de manera que la parte real de los autovalores complejos
de este operador correspondiese a un observable, y la imaginaria al otro.
Hace algunos años se encontró que existen operadores no autoadjuntos, con simetrı́a P T
(reflexión sobre un eje e inversión de movimiento), cuyos autovalores puramente reales [34].
Sin embargo, dado que estos operadores son autoadjuntos en espacios con producto escalar
indefinido (espacios de Krein), es posible relacionarlos con otros operadores, generalmente no
locales, que son autoadjuntos en un espacio de Hilbert [35].
Muchos operadores autoadjuntos presentan tanto espectro discreto como continuo. La pre-
sencia del primero es interesante porque, a diferencia de la teorı́a clásica, en la formulación
cuántica no todos los valores de un observable serı́an posibles.

Ya que los estados pueden representarse mediante vectores, es natural pensar que los
operadores lineales puedan representarse mediante matrices. Cuando se aplica un operador
lineal a un vector se obtiene otro vector, Oψ(x)
b = χ(x). Tanto ψ cuanto χ puede escribirse
en una base ortonormal, compuesta, por ejemplo, por las funciones α1 (x), α2 (x), · · ·
X X
ψ(x) = (αi , ψ)αi (x), χ(x) = (αi , χ)αi (x).
i i

Substituyendo estas expresiones en Oψ(x)

b = χ(x), se obtiene
X X
(αi , ψ)Oα
b i (x) = (αi , χ)αi (x).
i i

Tomando el producto interno con αj (x), un elemento particular de la base, tenemos

X X
(αj (x), Oα
b i (x))(αi , ψ) = (αi , χ)(αj (x), αi (x)) = (αi , χ).
i i

Este resultado, que puede interpretarse como un producto de una matriz por un vector
    
(α1 , Oαb 1 ) (α1 , Oαb 2) · · · (α1 , ψ) (α1 , χ)
(α2 , Oα b 1 ) (α2 , Oαb 2 ) · · · (α2 , ψ) = (α2 , χ) ,
.. ..
    
.. .. ..
. . . . .

muestra que el operador O

b se representa por una matriz en la base ortonormal de funciones
α1 (x), α2 (x), · · ·

La descripción de operadores a través de matrices (que pueden ser infinitas), es la base de

la formulación de Heisenberg de la mecánica cuántica. Puede encontrar más información en las
referencias [28, 29, 30]; la primera para un enfoque moderno, la segunda contiene traducciones
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 19
de los artı́culos originales y la última rescata un artı́culo original sobre el átomo de hidrógeno
que emplean la formulación de Heisenberg de la mecánica cuántica (conocida como mecánica
matricial). La segunda referencia debe examinarse con precaución, puesto que su objetivo
es mostrar que la mecánica cuántica surge como un recorrido a tientas, pero guiado por el
principio de correspondencia.
Postulado 6. Los operadores de posición X b y de momento Pb correspondientes a un sistema
fı́sico unidimensional actúan de la siguiente forma sobre las vectores de estado ψ,

b → xψ(x),
Xψ
dψ(x)
Pbψ → −i~ ,
dx
h
en donde ~ es la constante de Planck (reducida), definida como ~ = 2π , siendo h la constante
de Planck.

Este postulado permite relacionar las variables clásicas con las cuánticas. Por ejemplo, el
Hamiltoniano cuántico de los sistemas unidimensionales se puede obtener a partir de la versión
clásica, haciendo uso de las reglas anteriores. Idem para la versión cuántica del momento
angular. cuando se tienen productos de potencias de la posición con potencias del momento,
surge el problema del ordenamiento de los operadores en la descripción cuántica. Por ejemplo,
xp podrı́a representarse
por
X P o por P X. Como el operador debe ser hermı́tico, se escoge
bb bb
el operador 12 X b . Para x2 p no se puede emplear el mismo truco, pues se tienen
b Pb + PbX

las alternativas independientes O b1 = 1 X b2 y O
b 2 Pb + PbX b2 = X b PbX;
b ası́ podemos usar
2
c1 O
b1 + c2 Ob2 , en donde los números reales c1 y c2 deben sumar uno.
Hay dos postulados que relacionan la teorı́a con los resultados de los experimentos.

Postulado 3. Si se mide el observable A, los únicos resultados posibles son ai , los auto-
valores del operador A. b Si antes de la medición el sistema se encuentra en el estado ψ, la
mejor predicción que puede hacerse es que la probabilidad de que se obtenga el resultado ai
es p(a0 , a1 ) = |(αi , ψ)|2 , en donde αi es el autovector asociado a ese autovalor.

Estas predicciones guardan cierta semejanza con aquellas provenientes de la mecánica

estadı́stica. ¿Qué deberı́amos hacer para comprobar que, efectivamente, el resultado a1 tiene
probabilidad p1 ? Deberı́amos tomar un montón de sistemas idénticos, todos ellos descritos
por la misma función de onda, y someterlos a la medición del observable A. Por simplicidad,
vamos a suponer que no hay error experimental, de modo que obtenemos los resultados ai
de manera conclusiva y sin ninguna incertidumbre del valor obtenido. Deberı́amos obtener la
frecuencia con que se obtuvo el resultado a1 , es decir, la razón entre el número de veces que
se obtuvo dicho resultado y el número de veces que se efectuó la medición. Esa frecuencia se
compara con la predicción teórica, pero no se espera que sean exactamente iguales. Entonces
se deberı́a hacer una prueba que nos dé un intervalo de confianza de que el resultado obtenido
concuerde con la predicción teórica.
Vemos que, dado que las predicciones de la teorı́a cuántica son de carácter probabilista, es
necesario tener colectivos (ensembles), conjuntos de sistemas idénticos descritos por el mismo
estado cuántico. La necesidad de sistemas idénticos se extiende al caso particular de sistemas
preparados en un autoestado del observable a medir. Es verdad que debemos obtener con
probabilidad uno el autovalor asociado al autoestado. Sin embargo, para confirmar que la
probabilidad es uno han de medirse muchos sistemas idénticos.
Visto de otra manera, la mecánica cuántica predice las distribuciones de probabilidad;
por lo tanto, también predice todos los momentos de la distribución. Los momentos más
importantes son ,por supuesto, el valor esperador (la media) y la varianza (el error cuadrático
20 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
medio). Consideremos la medición del observable A. Digamos que el valor a1 se obtuvo n1
veces, a2 se obtuvo n2 veces, etc. El valor medio del observable A, proveniente del experimento
es
n1 a1 + n2 a2 + · · ·
Ā = = f1 a1 + f2 a2 + · · · ,
n1 + n2 + · · ·
en donde la i-ésima frecuencia es Pn1ni . Como las probabilidades teóricas deben ser iguales a
i
las frecuencias experimentales, la predicción teórica ara el mismo observable es

Ā = p1 a1 + p2 a2 + · · · = (ψ, α1 )a1 (α1 , ψ) + (ψ, α2 )a2 (α2 , ψ) + · · ·

en donde usamos el hecho de que p1 = |(α1 , ψ)|2 = (ψ, α1 )(α1 , ψ). Como αi es autovector de
A on autovalor ai , tenemos

Ā = (ψ, α1 )(Aα b 2 , ψ) + · · · .
b 1 , ψ) + (ψ, α2 )(Aα

Dado que el operador A

b es autoadjunto, es decir, satisface (Aφ,
b ψ) = (φ, Aψ),
b también pode-
mos escribir

Ā = (ψ, α1 )(α1 , Aψ) b + · · · = (ψ, Aψ).

b + (ψ, α2 )(α2 , Aψ) b (2.8)

Para P
convencernos de la última igualdad, examinemos el producto escalar (ψ1 , ψ2 ). Como
ψ1 = i (αi , ψ1 )αi , (y se tiene una expresión similar para ψ2 ) el producto escalar queda
X X XX
(ψ1 , ψ2 ) = ( (αi , ψ1 )αi , (αj , ψ2 )αj ) = ((αi , ψ1 )αi , (αj , ψ2 )αj )
i j i j
XX XX
= (αi , ψ1 )∗ (αj , ψ2 )(αi , αj ) = (ψ1 , αi )(αj , ψ2 )δi,j
i j i j
X
= (ψ1 , αj )(αj , ψ2 ).
j

Comparando este resultado con la ecuación (2.8), vemos que el valor esperado del observables
A se puede escribir de la forma siguiente
Z ∞
Ā = (ψ, Aψ)
b = dx ψ ∗ (x) Aψ(x)
b . (2.9)
−∞

Recordando el postulado 6, vemos que el valor esperado del momento se puede escribir como
Z ∞
dψ(x)
P̄ = (ψ, Pbψ) = −i~ dx ψ ∗ (x) .
−∞ dx

EJERCICIO 30. Emplear el mismo procedimiento empleado aquı́, para encontrar σA , la

varianza de un observable A, a partir de la expresión
X n1 (a1 − Ā)2 + n2 (a2 − Ā)2
2
σA =
i
n1 + n2 + · · ·

Hemos supuesto autovalores discretos no degenerados. ¿Qué pasa si hay degeneración? En

este caso habrá más de un autovector asociado con el mismo autovalor. Si utilizamos un rótulo
adicional, j en este caso, para distinguir diferentes autovectores (y escogemos autovectores
ortogonales) de manera que se cumple que Aαij = ai αij , la probabilidad de obtener el auto-
valor ai será pi = j |(αij , ψt )|2 . El número de autovectores correspondientes a un autovalor
P
ai , digamos a1 generalmente difiere del número correspondiente a otro autovalor, digamos a2 .
2.4. FORMULACIÓN AXIOMÁTICA DE LA TEORÍA CUÁNTICA 21
¿Qué pasa si los autovalores hacen parte del continuo? No se espera obtener un único valor
sino un intervalo de valores, digamos [a0 , a1 ].R Si no hay degeneración, la probabilidad de ob-
a
tener un autovalor en el intervalo anterior es a01 da |(α(a), ψt )|2 . En particular, si se hace una
medición de posición a un sistema caracterizado por la función de onda ψ(x), la probabilidad
de obtener como resultado el intervalo [x0 , x1 ] es
Z x1
p(x0 , x1 ) = dx |ψ(x)|2 .
x0

Postulado 4. El estado del sistema inmediatamente después de una medición es el autovector

correspondiente al autovalor obtenido.

Este postulado se refiere a un tipo particular de mediciones, las cuales se caracterizan en

la literatura moderna como medidas proyectivas no destructivas. En muchos casos, cuando se
mide el sistema, por ejemplo, cuando se detecta un fotón, este se absorbe; de manera que no
hay un estado que el sistema, puesto que no tenemos fotón al final de la medición. Ejemplo
de la medición del espı́n en el experimento de Stern-Gerlach.
¿Qué pasa si hay degeneración? El sistema queda en una superposición de los estados
que comparten el autovalor obtenido. Si el estado antes de la medición era ψ, los estados αij
satisfacen Aαij = ai αij , y en la medición se obtiene el autovalor ai , entonces el estado final
será,
1 X
√ (αij , ψ)αij ,
pi j

en donde la probabilidad pi de obtener el valor ai es la que da el postulado anterior. ¿Qué pasa

si los autovalores hacen parte del continuo? Si la medición da el intervalo [a0 , a1 ], entonces el
estado final será
Z a1
1
p da (α(a), ψ)α(a),
p(a0 , a1 ) a0
en donde, de nuevo, la probabilidad p(a0 , a1 ) es la que se calcula empleando el postulado
anterior. En particular, después de una medición de posición que arrojó como resultado el
intervalo [x0 , x1 ], el estado después de la medición es
1
p ψ(x)W (x0 , x1 ),
p(x0 , x1 )
en donde ψ(x) era el estado antes de la medición y W (a, b) es una función que es cero en
todas partes, excepto en el intervalo [x0 , x1 ], en el cual vale 1.
Relación con la regla de Lüder.

Mediciones de alguna manera indefinidas. Hay mediciones destructivas y otras que no lo

son. Aquellas del espectro en que hay transiciones son como mediciones no destructivas de
(cambios de) energı́a. En otros casos se absorbe un fotón por ejemplo.
Existe, finalmente, un postulado que habla de la evolución temporal de un sistema aislado.

Postulado 5. La evolución temporal del estado de un sistema aislado está dada por la
ecuación de Schrödinger
∂Ψ(x, t)
i~ = HΨ(x, t),
∂t
en donde H un operador hermı́tico lineal caracterı́stico del sistema, conocido como el Hamil-
toniano del sistema, y Ψ(x, t) es otra notación para ψt (x). .
22 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
2.5. Lectura del postulado de Estado
Schrödinger [36] interpreta el estado cuántico como un catálogo de posibles resultados.
Hay un debate actual: ¿el estado es óntico o es ontológico?
¿El estado cuántico describe un sistema único?
Sergei Winitzki anota que las teorı́as fı́sicas pueden suponer un conocimiento completo
o incompleto del estado de los sistemas fı́sicos. En el último caso, las teorı́as se denominan
estadı́sticas. La concepción usual de la mecánica cuántica supone que el estado del sistema
contiene la información completa del mismo. Albert Einstein, por ejemplo, tenı́a una concep-
ción de que la mecánica cuántica era una teorı́a efectiva. La teorı́a de Bohm-de Broglie de la
mecánica cuántica tiene presupuestos similares. Existen trayectorias, pero no son accesibles.
Además, dichas trayectorias dependen del estado cuántico del sistema.
Continúa Winitzki recordando que las teorı́as fı́sicas pueden ser deterministas o probabilis-
tas. Esta es una de las rupturas más importantes de la mecánica cuántica con respecto a otras
teorı́as, pues es probabilista. Este aspecto de la mecánica cuántica también fue duramente
criticado por Einstein, quien acuño la famosa frase “Dios no juega a los dados”.

1. Haga una lista (puede ser vacı́a) de palabras cuyo significado no conoce.
Entre las expresiones anotadas están: sharp distinction (distinción marcado), y ψ is
defined up to an overal phase (ψ se define hasta una fase general).

2. Haga una lista (puede ser vacı́a) de las oraciones que no entendió completamente y de
las dificultades que tuvo con cada una de ellas.
ψ(x, t) is properly defined as a function of x alone, and the parameter t serves merely
to label different vectors in H.
Olvidé decir que uno puede imaginarse una serie de vectores, uno por cada instante de
tiempo.

3. Haga una lista (puede ser vacı́a) de conceptos con los cuales no se encuentra familiari-
zado, o que no recuerda bien, y escriba cuales aspectos no recuerda bien.
No se recuerda bien el concepto de espacio de Hilbert.

4. Haga una lista (puede ser vacı́a) de notación matemática con la cual no se encuentra
familiarizado.

5. Sin apoyarse en el texto, escriba el postulado de estados en su propias palabras.

6. Sin apoyarse en el texto, escriba un resumen del texto en su propias palabras.

7. Identifique porciones del texto que le parezcan vagas o equivocadas. Escriba de manera
clara por qué tiene esa impresión.

8. Identifique porciones del texto para las cuales tenga evidencia o aportes no contenidos
en el texto, que apoyen el texto.
Se hace una discusión del papel de la teorı́a en la fı́sica, teniendo en cuenta que es una
ciencia que se basa en mediciones. Cuando medimos, comparamos con respecto a un
patrón. Ası́, las mediciones arrojan como resultado una serie de números con unidades.
Desde un punto de vista utilitario, el papel de la teorı́a es el de organizar los datos que se
obtienen de las observaciones, el de condensar la información referente a las mediciones.
Se procede a través de la modelación matemática de los sistemas fı́sicos. Se espera que
tal modelación sirva para predecir y manipular.
La teorı́a crea una contrapartida a los sistemas fı́sicos, que le asigna un sı́mbolo ma-
temático a cada “cosa” del sistema fı́sico, a través de unas reglas de traducción. Estas
2.5. LECTURA DEL POSTULADO DE ESTADO 23
reglas deben funcionar en los sentidos. Con frecuencia se modela un sistema fı́sico, se
manipulan los sı́mbolos siguiendo las reglas de la matemática y se obtienen nuevos enun-
ciados matemáticos, los cuales se traducen de vuelta a los sistemas fı́sicos, en donde se
convierte en enunciados sobre los sistemas mismos y no sobre sus sı́mbolos.

9. Haga el ejercicio 25. (Si ψ(x) tiene norma uno y |c|2 = 1, muestre que cψ(x) tiene norma
1).
2 2
10. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = e−x /x0 puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Basta normalizar la función de onda. La función de onda tiende a cero cuando x → ±∞.
¿Este requisito es necesario? Se muestra un ejemplo de función de onda de cuadrado
integrable que no tiende a cero cuando x → ±∞ (de hecho, estos lı́mites no existen para
esa función).

11. Considere una partı́cula cuántica unidimensional. ¿La función ψ(x) = δ(x − x0 ) puede
describir un estado de este sistema? En caso de que la respuesta sea negativa, i) encuentre
una forma de “arreglar” la función para que la nueva función sı́ pueda describir un estado
de la partı́cula unidimensional, o ii) muestre que no se puede arreglar.
Razones a considera de por qué podrı́a ser una función de onda. Supongamos que se
mide la posición de la partı́cula y se encuentra en la posición x0 . La función δ(x − x0 )
¿describirı́a el nuevo estado del sistema? Objeción: cuando se mide nos quedarı́amos sin
sistema. Sin sistema, no hay estado. Tesis: existen mediciones no destructivas. Ejemplo:
suponga que se tiene un átomo de Hidrógeno en el estado |nmli = |210i en el vacı́o
electromagnético. Ası́, el estado total es |210i ⊗ |0i. Por evolución temporal, el sistema
quedará en una superposición de estados |Ψ(t)i = c1 |210i⊗|0i+c2 |100i⊗|1i , en donde
ci son coeficientes dependientes del tiempo. Si en un instante de tiempo se detecta un
fotón, entonces sabremos que el átomo se encuentra en el estado |100i. Este es un ejemplo
de medición no destructiva.
Esta función no puede normalizarse.
Objeción: Cuando se hacen mediciones de posición, lo que se obtiene es el valor espera-
do.
Réplica: No. Cuando se hacen muchas mediciones, se pueden obtener no solo los momen-
tos estadı́sticos, sino también la distribución de probabilidad. Sin embargo, basta una
medición para hacer una preparación. Según Gillespie [37], tenemos que ((Postulate 4.
A measurement of an observable generally causes a drastic, uncontrollable alteration in
the state vector of the system; specifically, regardless of the form of the state vector just
before the measurement, immediately after the measurement it will coincide with the
eigenvector corresponding to the eigenvalue obtained in the measurement.))
Objeción: Esta función no describe un estado porque viola el principio de incertidumbre
de Heisenberg.
Réplica: No puede decirse que haya violación del principio de incertidumbre, porque el
producto de desviación estándar nula (en posición) por una desviación estándar infi-
nita (en momento) no está bien definido. Por otra parte, dentro del formalismo de la
mecánica cuántica, el principio de incertidumbre es una consecuencia de los postulados.
¿Cuáles son las suposiciones que llevan al principio de incertidumbre? Hay funciones de
onda normalizables que no tengan desviación estándar bien definida? (Lorentziana)
Algunas de las alternativas que podemos considerar son las siguientes.

a) El postulado 4 es falso.
24 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
b) El postulado 1 no es necesario, en el sentido de que se podrı́an tener funciones
de ondas no normalizables. En este caso, tal vez sea necesario inventar o usar
otras matemáticas. Según Gillespie [37] ((Postulate 1. Every possible physical
state of a given system corresponds to some normed Hilbert space vector ψ(x),
and conversely, every normed Hilbert space vector ψ(x) corresponds to a possible
physical state of the system. This correspondence between physical states and
normed vectors in H is one-to-one, except that two normed H-vectors that differ
only by an overall scalar factor of modulus unity correspond to thesame physical
state. The particular H-vector to which the state of the system corresponds at time
t is denoted by Ψt (x) and is called the state vector of the system; the system is
said to “be in the state Ψt (x).” The state of a system is completely described by
the state vector in the sense that anything which is in principle knowable about
the system at time t can be learned from the function Ψt (x).))
c) Una medición no puede dar como resultado x = x0 .

Como insumos para la discusión se sugiere considerar cómo se miden posiciones en

mecánica cuántica. También se sugiere recordar el experimento mental del microscopio
de Heisenberg.
Tarea: Haga una descripción mecano-cuántica del decaimiento 137 Cs → β + + 137 Ba +ν.
¿Este decaimiento se podrı́a usar para hacer mediciones no destructivas?
Tarea: Describa matemáticamente la luz de un láser verde mostrado en clase.
Continuous measurements.

12. Considere una partı́cula cuántica unidimensional. Cuando estudió ondas se encontró con
el concepto de ondas planas. ¿Es posible escribir funciones que describan ondas planas
unidimensionales? ¿Tales funciones pueden describir un estado de este sistema? En caso
de que la respuesta sea negativa, i) encuentre una forma de “arreglar” la función para
que la nueva función sı́ pueda describir un estado de la partı́cula unidimensional, o ii)
muestre que no se puede arreglar.
La función eikx es una autofunción no normalizable de la partı́cula libre. Se usa en la
teorı́a de scattering. Se puede definir en una caja, de manera que ahora está normalizada
(esto se hace en estado sólido).

13. Escriba una función que describa el estado cuántico de una partı́cula tridimensional.
Muestre que dicha función puede escribir un estado cuántico.

14. En la discusión de partı́culas de espı́n 1/2, es común oı́r que se tiene espı́n hacia arriba
y espı́n hacia abajo. Escriba el estado más general de una partı́cula de espı́n 1/2, tanto
en el formalismo de Dirac como en el formalismo en el que los estados se representan
como vectores columna.
Considere los estados

1 1 1 1
|ψ1 i = cos φ ,
+ sin φ , −
2 2 2 2

1 1 iθ
1 1
|ψ2 i = cos φ ,
+ e sin φ , − .
2 2 2 2

¿Uno de ellos es más general que el otro? ¿La fase θ es una fase total? Si no lo es,
¿qué información fı́sica contiene?, ¿en qué experimento aparece esa información?

15. Escriba el estado más general de dos partı́culas de espı́n 1/2, tanto en el formalismo de
Dirac como en el formalismo en el que los estados se representan como vectores columna.
2.5. LECTURA DEL POSTULADO DE ESTADO 25
16. Escriba un estado de dos partı́culas cuánticas tridimensionales. Muestre que dicha fun-
ción puede escribir un estado cuántico.
17. Escriba un estado posible de un electrón. Muestre que dicha función puede escribir un
estado cuántico.
18. ¿Cómo se puede saber si un sistema está en un estado particular?
19. ¿Se puede medir el estado de un sistema? En este sentido, ¿qué es el estado de un
sistema? ¿Qué es la tomografı́a cuántica?

20. ¿El estado cuántico describe un único sistema?

21. En mecánica (estadı́stica) clásica se pueden tener estados canónicos. Y, ¿en la cuántica?
22. Considere un gas de átomos de plata a una temperatura de unos 1000 ◦C, como en el
experimento de Stern-Gerlach. Escriba el estado de espı́n de los átomos de plata. Escriba
el estado espacial de los átomos de plata. Explique cómo interpretó el enunciado. Haga
un análisis del lı́mite clásico.
23. Considere un sistema compuesto por dos espines con s = 12 . El estado del sistema es

|ψi = sin α |++i + cos α |−−i , (2.10)

en donde |+i y |−i son los autovectores de σz con autovalores 1 y -1, respectivamente.
Suponga que quiere calcular los valores esperados correspondientes a σx , σy y σz del
primer espı́n. Manipule las expresiones hasta que pueda escribirlas como

hσi i = Tr (σi a) , i = x, y, z. (2.11)

Encuentre a. Desde el punto de vista matemático, ¿qué tipo de objeto es a? ¿Existe

algún valor de α para el cual los valores esperados hσi i sean todos iguales a cero?
26 CAPÍTULO 2. UN ATISBO A LOS CIMIENTOS DE LA MECÁNICA CUÁNTICA
Capı́tulo 3

Polarización: descripción clásica

En este capı́tulo, después de introducir la noción de polarización para cuerdas vibrantes,

vamos a generalizarla para campos electromagnéticos clásicos. Comenzamos haciendo una
revisión tanto de la ecuación de ondas para las cuerdas vibrantes como de algunas de sus
soluciones. Enseguida introducimos la noción de polarización para ondas en cuerdas vibran-
tes. Después de deducir la ecuación de ondas para los campos electromagnéticos, vamos a
emplear la aproximación paraxial con el fin de hallar una solución particular de esta ecuación.
La luz emitida por un láser se puede describir razonablemente bien mediante la solución ha-
llada. Además de describir como se puede evidenciar la polarización desde un punto de vista
fenomenológico, discutimos algunoes estados especiales de polarización.
Desde el punto de vista de las matemáticas empleadas, vamos a hallar algunas soluciones
de una ecuación diferencial parcial y a introducir un espacio vectorial complejo. Se emplearán
algunas identidades vectoriales y la regla de la cadena. El cálculo vectorial puede omitirse
en una primera aproximación al tema. Necesitaremos otros conceptos como la segunda ley
de Newton para partı́culas puntuales, expansiones en parámetros pequeños y expansión de
Taylor.
Presentar la cuerda vibrante es interesante porque recuerda métodos matemáticos que se
van a usar más adelante en el curso, presenta la polarización en un marco en el cual esta es
visible.

3.1. La cuerda vibrante

Definimos una cuerda como un objeto unidimensional en el cual no existen interacciones a
distancia, sino únicamente una interacción de contacto. Las cuerdas reales, por supuesto, no
satisfacen estas suposiciones simplificadoras, entre otras cosas porque en escala nanoscópica
aparecen efectos atómicos. Además, las fuerzas interatómicas son principalmente de origen
electromagnético, las cuales son de largo alcance. A pesar de todo, podemos usar como hipóte-
sis de trabajo, que las suposiciones simplificadoras enunciadas arriba son tan razonables, que
el comportamiento predicho por este modelo se aproxima bastante bien al de algunas cuerdas
delgadas reales. Una cuerda es delgada si todas sus secciones transversales son tales que la
distancia entre dos puntos cualesquiera de cada sección es mucho menor que su longitud.
En la referencia [48] se revisan dos derivaciones de las ecuaciones de movimiento de una
cuerda y las suposiciones asociadas. Para una derivación más rigurosa puede leer el artı́culo
[49] o la sección 2.4 del libro [50]. En reposo, pero templada, la cuerda se extiende sobre el
eje x, de x = 0 a x = L, y estos dos puntos permanecen fijos. Aunque vamos a considerar
vibraciones a lo largo de los ejes x, y y z, inicialmente supondremos que la cuerda no hace
excursiones en y. Esta es una suposición importante ya que, en general, la excursiones de
la cuerda tendrán una componente longitudinal. De hecho, a través de videos, por ejemplo,

27
28 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
podrı́a verificarse la validez de esta suposición en el montaje clásico de ondas estacionarias
en cuerdas (experimento de Melde). Es razonable tener en cuenta únicamente la tensión y no
el peso (total de la cuerda), si la magnitud del último es mucho menor que la magnitud de
la primera. También vamos a suponer que las excursiones de la cuerda son pequeñas, en un
sentido que se precisará en la derivación.
Usamos un método elemental para encontrar la ecuación de movimiento de la cuerda.
Tomemos un segmento de cuerda genérico, conforme se muestra en la figura 3.1. Las coorde-
nadas de los extremos izquierdo y derecho de dicho segmento son, respectivamente, (x, y(x))
y (x + ∆x, y(x + ∆x)). La tensión que ejerce el segmento de cuerda inmediatamente anterior
(posterior) sobre el segmento analizado es T 1 (T 2 ). En la figura se ha tenido en cuenta que la
cuerda es perfectamente flexible y, por lo tanto, la fuerza de contacto entre partes adyacentes
de la cuerda es tangente a la curva que describe la cuerda.

Figura 3.1: Cuerda con extremos fijos. En el detalle, fuerzas que actúan sobre un segmento in-
finitesimal de cuerda. Nicoguaro [CC BY 4.0 ([Link]
from Wikimedia Commons.

La segunda ley de Newton para un cuerpo puntual es F = ma, donde F es la fuerza

externa neta que actúa sobre él, m su masa y a su aceleración. Vamos a suponer que toda
la masa se encuentra concentrada en el punto (x + ∆x ∆x
2 , y(x + 2 )). La tensión T 1 (T 2 ) es la
fuerza de contacto que le ejerce el segmento de curva inmediatamente anterior (posterior). A
partir de la figura vemos que F es igual a
F = T 1 + T 2 = −T1 cos αex + T1 sin αey + T2 cos βex − T2 sin βey . (3.1)
Para determinar la masa vamos a tener en cuenta que supusimos que las vibraciones son
transversales. En reposo, el segmento de cuerda de cuerda analizado estarı́a sobre el eje x,
entre x y x + ∆x. Si ∆x es suficientemente pequeño, la densidad en reposo de ese segmento
puede considerarse uniforme e igual a ρ(x + ∆x
2 ); por lo tanto, la masa del segmento es igual
a
∆x
m=ρ x+ ∆x. (3.2)
2
Vale la pena insistir en que ρ(x + ∆x
2 ), de la ecuación (3.1) es la densidad en reposo de la
cuerda; por lo tanto, no cambia en el tiempo. Finalmente, calculemos la aceleración a del
3.1. LA CUERDA VIBRANTE 29
segmento. Como hemos supuesto vibraciones transversales, a solamente puede estar dirigida
a lo largo del eje y. Como y(x+ ∆x
2 ) es la posición del (centro de masa del) segmento de cuerda,
su segunda derivada temporal es su aceleración. Esto quiere decir que debemos escribir y(x, t)
(y(x, t) si hablamos del centro de masa del segmento), puesto que la excursión del segmento
a lo largo del eje y no depende únicamente de su posición a lo largo del eje x, sino también
del tiempo. Ası́, tenemos que
∂ 2 y(x + ∆x
2 , t)
a= ey . (3.3)
∂t2
Sustituyendo las tres cantidades en la segunda ley de Newton tenemos

∂ 2 y(x + ∆x

∆x 2 , t)
−T1 cos αex +T1 sin αey +T2 cos βex −T2 sin βey = ρ x + ∆x ey . (3.4)
2 ∂t2
La suposición de que las vibraciones son pequeñas se expresa matemáticamente como
α, β 1, de manera que cos α ≈ cos β ≈ 1, y por tanto, T1 = T2 = T. Empleando esta
igualdad en la ecuación de movimiento a lo largo del eje y,

∂ 2 y(x + ∆x

∆x 2 , t)
T sin α − T sin β = ρ x + ∆x . (3.5)
2 ∂t2
vemos que el lado derecho es de orden ∆. Por otro lado, el lado izquierdo también es de
ese orden, como se ve un poco más adelante. Teniendo en cuenta que α es ángulos pequeño,
sin α ≈ tan α. Esta última cantidad es la tangente a la curva y(x, t), es decir,

∂y(x, t)
tan α = . (3.6)
∂x
De manera semejante,
∂y(x + ∆x, t)
sin β ≈ tan β = , (3.7)
∂x
en donde tuvimos en cuenta que tan β es la tangente a la curva en el punto x + ∆x. Expan-
diendo a primer orden en ∆x tenemos

∂y(x, t) ∂ 2 y(x, t)
sin β ≈ + ∆x . (3.8)
∂x ∂x2
Usando este resultado en la ecuación (3.5), tenemos

∂ 2 y(x, t) ∂ 2 y(x + ∆x

∆x 2 , t)
∆xT 2
= ρ x + ∆x 2
. (3.9)
∂x 2 ∂t
Finalmente, expandiendo el lado derecho a primer orden en ∆x y cancelando el factor común,
obtenemos la ecuación de ondas
∂ 2 y(x, t) ∂ 2 y(x, t)
T = ρ (x) . (3.10)
∂x2 ∂t2
Recapitulando, si se suponen vibraciones puramente transversales en una única dirección,
tangentes a la cuerda pequeñas y se toma en cuenta únicamente la tensión, las vibraciones
satisfacen la ecuación de ondas (3.10).
Para vibraciones también a lo largo de z, bajo las mismas suposiciones encontramos eq-
cuciones de onda análogas, como se muestra en la derivación que hacemos enseguida.
Para extender este resultado, vamos a usar un marco más general. Describimos la cuerda
en un tiempo t mediante la ecuación paramétrica

r(ξ, t) = x(ξ, t)ex + y(ξ, t)ey + z(ξ, t)ez , (3.11)

30 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
en donde ξ es un parámetro tal que la cuerda templada en reposo se describe por ξex , 0 ≤
ξ ≤ L. Veamos a llamar T (ξ, t) a la fuerza de contacto que el segmento de cuerda a la derecha
de ξ le ejerce al segmento a la izquierda de ξ. La tercera ley de Newton nos dice, entonces,
que −T (ξ, t) es la fuerza de contacto que el segmento de cuerda a la izquierda de ξ le ejerce
al segmento a la derecha de ξ. Teniendo en cuenta que la masa de un segmento de cuerda que
2
en reposo se extiende de ξ a ξ + ∆ξ es ρ(ξ + ∆ξ/2)∆ξ y que su aceleración es ∂ r(ξ+∆ξ/2,t)
∂t2 ,
vemos que la segunda Ley de Newton es

∂ 2 r(ξ + ∆ξ/2, t)
ρ(ξ + ∆ξ/2)∆ξ = −T (ξ, t) + T (ξ + ∆ξ, t), (3.12)
∂t2
en donde hemos supuesto que si existen fuerzas diferentes a la tensión, son pequeñas con
relación a esta. Expandiendo a primer orden en ∆ξ y cancelando el factor común, encontramos
la ecuación de ondas
∂ 2 r(ξ, t) ∂T (ξ, t)
ρ(ξ) = . (3.13)
∂t2 ∂ξ
Hasta ahora no hemos tenido en cuenta que, como la cuerda es perfectamente flexible (no
ofrece resistencia a que se doble), la fuerza de contacto T (ξ, t) debe estar dirigida en la
dirección de la tangente a la curva, es decir,
∂r(ξ,t)
∂ξ
∂r(ξ,t) .
T (ξ, t) = T (ξ, t) (3.14)
∂ξ

Si las vibraciones son puramente transversales, entonces la cuerda se puede describir por la
curva ξex +y(ξ, t)ey +z(ξ, t)ez y su tangente será ex + ∂y(ξ,t) ∂z(ξ,t)
∂ξ ey + ∂ξ ez . Por otro lado, si las
vibraciones son pequeñas, se cumple que ∂y(ξ,t)
∂ξ 1 y ∂z(ξ,t)
∂ξ 1. Ası́, podemos aproximar
la tensión por
∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T (ξ, t) ex + ey + ez . (3.15)
∂ξ ∂ξ
Con estas consideraciones, la componente x de la ecuación de la cuerda es

∂T (ξ, t)
0= , (3.16)
∂ξ

cuya solución es T (ξ, t) = T (t). Suponiendo que esta tensión no se cambia (como en el caso
del experimento de Melde), tenemos que T (ξ, t) = T. Ası́, la fuerza de tensión es

∂y(ξ, t) ∂z(ξ, t)
T (ξ, t) ≈ T ex + ey + ez , (3.17)
∂ξ ∂ξ

y la ecuación de ondas toma la forma

∂ 2 r(ξ, t) ∂ 2 y(ξ, t) ∂ 2 z(ξ, t)

ρ(ξ) =T ey + ez . (3.18)
∂t2 ∂ξ 2 ∂ξ 2

La ecuación de ondas en z es de la misma forma de la ecuación de ondas en y. Como no

consideramos ondas longitudinales (a lo largo de x), podemos cambiar la notación y emplear
x en vez de ξ.

3.1.1. Controversia sobre la solución

La descripción de la cuerda vibrante, durante el siglo XVIII, fue una fuente de grandes
controversias entre diferentes puntos de vista, los cuales se pueden caracterizar, según Wheeler
3.1. LA CUERDA VIBRANTE 31
y Crummett [51], como correspondientes al matemático (Jean le Rond d’Alembert), al fı́sico
(Daniel Bernoulli) y al fı́sico-matemático (Leonard Euler). El punto de partida de esta discu-
sión era la ecuación de ondas (3.10) en
p el caso que la densidad lineal de masa ρ(x) es constante
y la velocidad de las ondas es c = T /ρ.. El problema era el concepto de función y su re-
lación con la forma de una cuerda vibrante. [52] Mientras d’Alembert consideraba solamente
funciones diferenciables, Euler proponı́a funciones con esquinas como aquella que se obtiene
al pulsar una cuerda. Por su parte, Bernoulli, atendiendo a la observación de que las cuerdas
se pueden escuchar, abogaba por funciones definidas por series trigonométricas. d’Alembert
se oponı́a a la solución de Euler porque su primera derivada es discontinua y, por lo tanto,
no se puede definir la segunda derivada. Ası́, la ecuación diferencial pierde sentido, al menos
en los puntos de discontinuidad de la primera derivada. Euler adujo que las funciones con
esquinas pueden aproximarse por funciones infinitamente diferenciables, tan próximas como
se quiera. d’Alembert y Euler criticaron la solución de Bernoulli porque habı́an encontrado
una enorme riqueza en la forma de las soluciones, que creı́an que no era posible de capturar en
una serie trigonométrica, aún si dicha serie fuese infinita. [53] La intuición fı́sica de Bernoulli
ganó reconocimiento matemático después de los trabajos de Joseph Fourier, sobre la ecuación
del calor [54] y de Dirichlet sobre la convergencia de las series de Fourier. [55] Por otro lado, el
cálculo diferencial se extendió a funciones como la que Euler propuso y a otras más singulares,
conocidas como funciones generalizadas o distribuciones temperadas [52].

3.1.2. Solución de d’Alembert

En 1747 d’Alembert publicó, además de la derivación de la ecuación de ondas, su solución,
[56, 57] la cual presentamos enseguida en lenguaje moderno. Suponiendo que la densidad
lineal de masa ρ(x) es constante, la ecuación de ondas toma la forma usual

∂ 2 y(x, t) 1 ∂ 2 y(x, t)
2
= 2 , (3.19)
∂x c ∂t2
p
en donde definimos c = T /ρ..
Hagamos un cambio de variables.
1 1
ξ = x + ct, η = x − ct; x= (ξ + η) t = (ξ − η) (3.20)
2 2c
Usando la regla de la cadena tenemos
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = + , (3.21)
∂ξ ∂ξ ∂x ∂ξ ∂t 2 ∂x 2c ∂t
∂ ∂x ∂ ∂t ∂ 1 ∂ 1 ∂
= + = − . (3.22)
∂η ∂η ∂x ∂η ∂t 2 ∂x 2c ∂t
Ahora, si calculamos

∂2 1 ∂2

∂ ∂ ∂ 1 ∂ ∂ 1 ∂
4 = + − = − , (3.23)
∂ξ ∂η ∂x c ∂t ∂x c ∂t ∂x2 c2 ∂t2
vemos que la ecuación de ondas, en las nuevas variables se escribe

∂ 2 y(ξ, η)
4 = 0. (3.24)
∂ξ∂η
Integrando con respecto a ξ obtenemos
∂y(ξ, η)
= g1 (η). (3.25)
∂η
32 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Ahora, integrando con respecto a ξ tenemos
Z
y(ξ, η) = dη g1 (η) + f (ξ) = f (ξ) + g(η). (3.26)

Volviendo a las variables originales, encontramos la solución general

y(x, t) = f (x + ct) + g(x − ct). (3.27)

Veamos la naturaleza de ls funciones f y g. Tomemos f (x + ct) en un instante de tiempo

t > 0 y comparémosla con f (x), la función en el instante inicial t = 0. Si tomamos un punto
arbitrario x0 , el valor de la función será f (x0 ). Este mismo valor se obtendrá en el punto
x0 − ct < x0 , desigualdad válida para tiempo positivos. Esto quiere decir que la función
está viajando hacia valores negativos de x, hacia la izquierda con rapidez c. De manera
semejante, podemos ver que g(x − ct) describe ondas que viajan a la derecha con rapidez c.
A las funciones f (x + ct) y g(x − ct) se les denomina ondas viajeras.
Hasta ahora no hemos tenido en cuenta la suposición de extremos fijos de la cuerda y(0, t) =
0 = y(L, t). Primero vamos a usar el hecho de que una función de una variable siempre
puede escroibirse como la suma de una función par y de otra impar. Ası́, podemos escribir
y(x, t) = fP (x + ct) + fI (x + ct) + gP (x − ct) + gI (x − ct), en donde fP (−z) = fP (z),
gP (−z) = gP (z), fI (−z) = fI (z), y gI (−z) = −gI (z). En x = 0 deberı́an cumplirse las
condiciones

fP (ct) + gP (−ct) = fP (ct) + gP (ct), gP (ct) = −fP (ct), (3.28)

fI (ct) + gI (−ct) = fI (ct) − gP (ct), gI (ct) = fI (ct). (3.29)

Ası́, la solución general se puede escribir como

y(x, t) = fP (x + ct) − fP (x − ct) + fI (x + ct) − fI (x − ct). (3.30)

También deben cumplirse las condiciones en x = L. Como la solución debe cumplirse en el

intevalo [0, L], podemos extender la función fuera de ese intervalo a conveniencia. Por ejemplo,
podemos exigir que la función extendida sea periódica. Dado que la función tiene una parte
impar, y que y(0, t) = y(L, t), el periodo mı́nimo es 2L. Recapitulando, la solución general es
de la forma (3.30) en donde las funciones f son periódicas de periodo 2L, tales que fI (L) = 0.
Jean le Rond d’Alembert, el mismo del principio de d’Alembert y los equinoccios, quien
ocupa la silla de “el matemático”, derivó la ecuación de ondas (3.10) en el caso ρ(x) = T y
mostró que la solución general es y(x, t) = f (x + ct) + g(x − ct). D’Alembert exigı́a que f
fuese periódica, impar y diferenciable en todas partes.
EJERCICIO 31. Demostrar que, en el caso de un cuerda con condiciones periódicas
y(0, t) = y(L, t), la solución de D’Alembert se reduce a y(x, t) = f (x + ct) + f (x − ct) =
f (ct + x) − f (ct − x).

3.1.3. Solución de Euler

Leonard Euler, uno de los matemáticos más prolı́ficos, mostró que la solución puede escri-
birse en términos de la posición inicial de la cuerda, Y (x, y de su velocidad, V (x). En efecto,
si hacemos t = 0 en la expresión y(x, t) = f (x + ct) + g(x − ct),

Y (x) = f (x) + g(x). (3.31)

Por otro lado, derivando cada término de y(x, t) = f (x + ct) + g(x − ct) con respecto a su
argumento, y tomando t = 0, encontramos la identidad

df (z) dg(z)
V (x) = c −c . (3.32)
dz z=x dz z=x
3.1. LA CUERDA VIBRANTE 33
Cambiando x por ξ e integrando (3.32) sobre ξ en el intervalo de 0 a x, la ecuación corres-
pondiente puede escribirse como

1 x
Z
f (x) − g(x) = dξ V (ξ). (3.33)
c 0

Sumando y restando (3.31) y (3.33) podemos hallar f y g como

1 x 1 x
Z Z
1 1
f (x) = Y (x) + dξ V (ξ) , g(x) = Y (x) − dξ V (ξ) . (3.34)
2 c 0 2 c 0

Finalmente, recordando que la primera función tiene como argumento x + ct, y que la segunda
como argumento x − ct, la solución general será

y(x, t) = f (x + ct) + g(x − ct) (3.35)

1 x+ct 1 x−ct
Z Z
1 1
= Y (x + ct) + dξ V (ξ) + Y (x − ct) − dξ V (ξ)
2 c 0 2 c 0
1 x+ct
Z
1
= Y (x + ct) + Y (x − ct) + dξ V (ξ) .
2 c x−ct

La controversia aludida en la sección 3.1.1 se inició cuando Euler permitió que Y y V no fuesen
funciones en el sentido ordinario, sino curvas que se pueden dibujar a mano, en particular,
curvas con esquinas, tales como la cuerda pulsada.

3.1.4. Solución de Bernoulli-Fourier

La solución intuida por Bernoulli demoró en ser formalizada, a pesar de que investigadores
como Lagrange estuvieron muy cerca de obtenerla. Este método, el de separación de variables,
se basa en la siguiente observación. Sean y1 (x, t) y y2 (x, t) dos soluciones de la ecuación de
ondas, entonces la combinación lineal de las soluciones, c1 y1 (x, t) + c2 y2 (x, t), en donde c1 y c2
son coeficientes, también es una solución de la ecuación de ondas. Esta condición es verdadera,
no solo para la ecuación de ondas, sino para todas las ecuaciones diferenciales lineales. Las
condiciones de frontera también deben ser lineales: si dos soluciones diferentes satisfacen las
condiciones de frontera, la combinación lineal de las mismas también debe satisfacerla.
Debemos encontrar todas las soluciones que sean un producto de funciones

y(x, t) = X(x)T (t). (3.36)

La solución general es la combinación lineal de las soluciones. Las condiciones de frontera

deben aplicarse; este paso implica ciertas relaciones entre coeficientes. Sustituyendo en la
ecuación de ondas (3.19) y dividiendo por X(x)T (t) obtenemos

1 d2 X(x) 1 d2 T (t)
= . (3.37)
X(x) dx2 c2 T (t) dt2

Como un lado es función solo de x y el otro solo de t, la igualdad se cumple cuando cada lado
es igual a una constante:

d2 X(x) d2 T (t)
= λX(x). = c2 λT (t). (3.38)
dx2 dt2
Las soluciones a la ecuación de X(x) se pueden buscar haciendo el Ansatz X(x) = eax ,

dX(x) d2 X(x)
= aeax , = a2 eax = λX(x) = λeax . (3.39)
dx dx2
34 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
√ √
Se debe cumplir la igualdad a2 = λ, por lo cual se tiene a = λ o√a = − √λ. Las soluciones
independientes a la ecuación
√
diferencial
√
de X(x) son, por lo tanto, e λx y e− λx , y su solución
general es X(x) = Ae λx + Be− λx Notemos, sin embargo que, si λ = 0 ambas soluciones
2
colapsan en una, X(x) = 1. En ese caso, es mejor volver a la ecuación original d dx X(x)
2 =0e
integrarla dos veces,
dX(x)
= A, X(x) = Ax + B, (3.40)
dx
siendo A y B constantes. Ası́, las dos soluciones independientes son X(x) = 1 y X(x) = x.
Otro
√ hecho
p que debemos notar es que λ puede ser positivo o negativo. En ese último caso,
λ = i |λ|.
Las soluciones a la ecuación diferencial para T (t) son completamente análogas a aquellas
para X(x), es decir, T (t) = Ct + D, C y D constantes, si λ = 0 y
√ √
T (t) = Cec λt
+ De−c λt
, (3.41)

si λ 6= 0. Hemos encontrado las soluciones cuando λ = 0,

y(x, t) = (Ax + B)(Ct + D), (3.42)

y cuando λ 6= 0, √ √ √ √
y(x, t) = (Ae λx
+ Be− λx
)(Cec λt
+ De−c λt
), (3.43)
El siguiente paso es escontrar vı́nculos entre las constantes de la solución general, que
aparecen cuando se aplican las condiciones de frontera y(0, t) = 0 = y(L, t). Vemos que las
condiciones restringen las funciones de x. En efecto, deben cumplirse las igualdades

y(0, t) = B(Ct + D) = 0, y(L, t) = (LA + B)(Ct + D) = 0, (3.44)

si λ = 0 y
√ √
y(0, t) = (A + B)(Ce λt
+ De− λt
) = 0, (3.45)
√ √ √ √
y(L, t) = (Ae λL
+ Be− λL
)(Cec λt
+ De−c λt
) = 0, (3.46)

si λ 6= 0. Como se notó previamente, podemos concentrarnos únicamente en la partes espacial

(es decir, podrı́amos haber escrito las condiciones de frontera como X(0) = 0 = X(L).)
Ahora, de la primera igualdad de (3.44) encontramos B = 0. Usando este valor en la
segunda igualdad, se tiene AL = 0, es decir, A = 0. En estas condiciones, la solución es trivial
y(x, t) = 0. Decimos que no hay soluciones (no triviales) si λ = 0.
Enseguida consideramos λ 6= 0. La solución a la ecuación (3.45) es B = −A. La ecuación
(3.46) se convierte en √ √ √
A(e λL − e− λL ) = 0 = 2A sinh( λL). (3.47)
Como el único cero (real) de la función seno hiperbólico es cero (sinh 0 = 0,) parecerı́a que la
ecuación (3.47) tampoco tiene soluciones no triviales. Sin embargo, recordemos que λ puede
ser negativo. En ese caso podemos escribir
√ √ √
A(ei −λL − e−i −λL ) = 0 = 2iA sin( −λL), (3.48)

en donde hicimos uso de la identidad de de Moivre, eix = cos x + i sin x. Esta ecuación
claramente tiene soluciones no triviales, pues la función sin x tiene cero en x = nπ, siendo n un
entero positivo (n = 0 da la solución trivial y, como la función seno es impar, las soluciones con
√ 2 2
n y −n no son independientes). Ası́, las soluciones corresponden a −λL = nπ, λn = − nLπ2 ,
en donde se le ha agregado a λ una etiqueta (n).
3.1. LA CUERDA VIBRANTE 35
Las soluciones no triviales completas tienen en cuenta la parte temporal y se escriben
como nπx nπc nπc
yn (x, t) = 2iA sin (Cei L t + De−i L t ). (3.49)
L
Tanto la parte real como la parte imaginaria de (3.49) son soluciones; es decir,
nπx nπc
yn1 (x, t) = sin cos t (3.50)
L L
como nπx nπc
yn2 (x, t) = sin sin t (3.51)
L L
son las soluciones buscadas. Cada una de esta soluciones corresponde a una onda estacionaria,
ya que la onda no avanza sino que permanece en el mismo lugar (sin embargo, su amplitud
instantánea sı́ cambia). Las funciones sin(nπx/L) describen los llamados modos normales; el
primero se conoce como el modo fundamental, y los demás como modos excitados (también
conocidos como armónicos del modo fundamental).
Ahora, la solución general de la ecuación de ondas es la combinación lineal de todas las
soluciones encontradas, es decir,
∞
X
y(x, t) = (An yn1 (x, t) + Bn yn2 (x, t)) . (3.52)
n=1

De manera más explı́cita, la solución general de la cuerda vibrante (para vibraciones trans-
versales a lo largo de y) es
∞
X nπx nπc nπx nπc
y(x, t) = An sin cos t + Bn sin sin t , (3.53)
n=1
L L L L

en donde las constantes An y Bn deben determinarse. Bernoulli intuyó esta solución, pero
no consideró los términos asociados a Bn (corresponde a velocidad inicial nula). Además, no
mostró cómo podrı́an encontrarse los coeficientes An .
Para completar la solución de Bernoulli, debemos mostrar como hallar los coeficientes An
y Bn , suponiendo que conocemos la posición inicial de la cuerda Y (x) y su velocidad V (x).
Haciendo t = 0 en la solución, encontramos
∞
X nπx
y(0, t) = An sin = Y (x). (3.54)
n=1
L

Vamos a usar las integrales

Z L nπx Z π
Ldu
sin2 dx = sin2 (nu) (3.55)
0 L 0 π
L π
Z
L
= (1 − cos(2nu)) du = ,
2π 0 2
Z L nπx mπx Z π
Ldu
sin sin dx = sin(nu) sin(mu) (3.56)
0 L L 0 π
L π
Z
= (cos((m − n)u) − cos((m + n)u)) du = 0.
2π 0
En la ecuación (3.56) se supuso m 6= n. Las integrales de los cosenos son cero porque se
hace un promedio sobre un número entero de periodos. Multiplicando la ecuación (3.54) por
sin mπx

L e integrando sobre x tenemos
Z L mπx X∞ nπx Z L mπx
dx sin An sin = dx sin Y (x). (3.57)
0 L n=1
L 0 L
36 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Suponiendo que podemos intercambiar la suma y la integral, y teniendo en cuenta las dos
integrales de arriba, vemos que casi todas las integrales del lado izquierdo de la ecuación son
cero, excepto aquella para la cual n = m.
Z L
L mπx
Am = dx sin Y (x). (3.58)
2 0 L

Ası́, tenemos la expresión para los coeficientes An . Para encontrar los coeficientes Bn , se
procede de forma similar. Se deriva la solución con respecto al tiempo, se hace t = 0, y se
iguala a la velocidad inicia conocidal. Luego se multiplica por sin nπx

L y se usan las integrales
(3.55) y (3.56). El resultado final es

∞
!
Z L
X 2 mπξ nπx nπc
y(x, t) = dξ sin y(ξ, 0) sin cos t (3.59)
n=1
L 0 L L L
∞ Z L !
X 2 mπξ ∂y nπx nπc
+ dξ sin (ξ, 0) sin sin t ,
n=1
nπc 0 L ∂t L L

EJERCICIO 32. Encontrar los coeficientes Bn de la soliución de Bernoulli-Fourier. Ve-

rificar la solución de Bernoulli-Fourier (3.59) y corregirla si fuese necesario.

3.2. Polarización en cuerdas

En la sección anterior estudiamos la cuerda vibrante haciendo algunas aproximaciones y
encontramos varias formas de la solución. Aunque no desarrollamos explı́citamente las solu-
ciones de la cuerda vibrante tensada a lo largo del eje x que hace pequeñas excursiones tanto
en el eje y como en el eje z, no es difı́cil ver que son del tipo
∞
X nπx nπc ∞
X mπx mπc
r(x, t) = An sin cos t + φn e y + Bm sin cos t + χm ez ,
n=1
L L m=1
L L

en donde An , Bm , φn y χm son constantes (notar que An y Bm no son iguales a aquellas de

la sección anterior).

Figura 3.2: Figuras de Lissajou para ondas de igual amplitud, una de ellas con frecuencia
igual al doble de la otra.
3.2. POLARIZACIÓN EN CUERDAS 37
Para analizar una situación más sencilla que la solución general, consideremos solo un
término de cada suma,
nπx nπc mπx mπc
r(x, t) = An sin cos t + φn ey + Bm sin cos t + χm ez .
L L L L
Si tomamos un punto particular x = x0 , podemos escribir

e0 cos nπc t + φn ey + Be0 cos mπc t + χm ez .

r(x0 , t) = A
L L
Hemos agregado el subı́ndice 0 para recordar que la amplitud relativa de las dos ondas depen-
den del punto x0 . Haciendo una traslación temporal podemos presentar la ecuación anterior
en la forma
e0 cos nπc t̃ ey + Be0 cos mπc t + δ ez .

r(x0 , t̃) = A
L L
Estas son las ecuaciones que estudiaron Nathaniel Bowditch en 1815 y Jules Antoine Lissajous
en 1857 y que producen las llamadas curvas de Bowditch o figuras de Lissajous. En la figura
3.2 se ven dos ejemplos correspondientes a amplitudes A0 y B0 iguales y una de las frecuencias
igual al doble de la otra. Estos ejemplos, sin embargo, no son los que más nos interesan. Nos
concentraremos en el caso en el cual ambas frecuencias son iguales,

e cos nπc t + δ ez .
e cos nπc t̃ ey + B

r(x0 , t̃) = A
L L
El lector atento habrá notado que hemos omitido el subı́ndice de las constantes A y B. Esta
omisión se debe a que la amplitud relativa de las dos ondas no depende del punto particular
x0 (siempre y cuando la onda no se anule en el punto escogido), aunque las amplitudes
absolutas sı́. Esto se debe a que, si multiplicamos ambas amplitudes por el mismo factor, la
curva obtenida es la misma, ampliada o reducida. Con el fin de crean un patrón, vamos a
considerar casos en los cuales A e2 + B
e > 0, eb > 0 y A e 2 = 1. Una manera de parametrizar es
A e = sin α, 0 ≤ α ≤ π, de modo que
e = cos α, B

r(t) = cos α cos (ωt) ey + sin α cos (ωt + δ) ez ,

en donde hemos definido ω = nπc L . Comencemos analizando el caso δ = 0.

Vemos que todas las figuras de Lissajous son lı́neas rectas de longitud 1, las cuales forman
un ángulo θ con el eje horizontal positivo. Hemos incluido un caso con θ > π/2, para ilustrar la
rotación de la lı́nea recta como función del ángulo θ. En realidad, las otras figuras de Lissajous
lineales se pueden obtener con 0 ≤ θ ≤ π/2 y δ = π, como se ilustra en la figura 3.4.
En general, para frecuencias iguales, las figuras de Lissajous son elipses, como se ilustra
en el caso de amplitudes iguales (θ = π/4) con desfase variable (figura 3.5). En el lenguaje de
polarización, que aún no hemos definido, estas figuras de Lissajous, para frecuencias iguales, se
conocen como elipses de polarización. Si la elipse degenera en una lı́nea, tenemos polarización
lineal; si degenera en un cı́rculo, polarización circular. En los demás casos, se tiene polarización
elı́ptica.
EJERCICIO 33. En la figura 3.6 se muestran varias situaciones de una cuerda vibrante.
Describa matemáticamente las ondas correspondientes a los literales a), b) y c). ¿Cuál es la
figura de Lissajous de cada una de estas situaciones? ¿Cómo cambian las figuras de Lissajous
en los casos d) y e)?
Aún no hemos definido el vector de polarización. Es común definirlo para ondas viajeras.
Si tenemos una cuerda infinitamente larga, las ondas de frecuencia bien definida ω, podemos
escribir las vibraciones en la forma

r(x, t) = A0x cos(kx − kct)ey + A0y cos(kx − kct + φ)ez (3.60)

= Re A0x ei(kx−kct) ey + A0y ei(kx−kct+φ) ez , (3.61)
38 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA

Figura 3.3: Figuras de Lissajous lineales. Frecuencias iguales, en fase (δ = 0), con amplitudes
diferentes (cos(θ), sin(θ) para θ = 0 (arriba a la izquierda), π/4 (arriba a la derecha), π/2
(abajo izquierda) y 3π/4 (abajo a la derecha)).

donde ω = kc. Para una cuerda infinitamente larga, todos los valores de k son posibles. Vamos
a utilizar la forma compleja de la ecuación, es decir, vamos a describir las vibraciones de la
cuerda mediante la ecuación

r(x, t) = A0y ei(kx−kct) ey + A0z ei(kx−kct+φ) ez (3.62)

A0y A0z iφ
= A0 ei(kx−kct) = A0 ei(kx−kct) ey + e ey . (3.63)
A0 A0

q
Aquı́ hemos definido la amplitud A0 = A20y + A20z y el vector de polarización = y ey +z ez .
Tanto las figuras de Lissajous como el vector de polarización tienen en cuenta dos elementos
importantes: el ángulo de desfase entre las componentes ortogonales de la polarización y la
amplitud relativa de las mismas.
Notemos que el vector de polarización es un vector bidimensional que tiene entradas com-
plejas en general. De manera implı́cita estamos diciendo que cuando estos vectores se multipli-
can por un número complejo (un escalar) o cuando se suman vectores con entradas complejas
se obtiene otro vector del mismo tipo. (Existen varias propiedades que satisfacen estas opera-
ciones: la adición de vectores es asociativa y conmutativa, existen el cero y el inverso aditivo;
la multiplicación por escalar es compatible con la multiplicación entre escalares, existe la uni-
dad, la multiplicación por escalar es distributiva con respecto a la suma de vectores y con
respecto a la suma de escalares).
3.2. POLARIZACIÓN EN CUERDAS 39

Figura 3.4: Figuras de Lissajous lineales 2. Frecuencias iguales, en contrafase (δ = π), con
amplitudes diferentes (cos(θ), sin(θ) para θ = 0 (izquierda), π/4 y π/2 (derecha)).

Figura 3.5: Elipses de Lissajous. Amplitudes iguales θ = π/4, con desfases iguales a δ =
0, π/6, π/3, π/2.

Espacios vectoriales sobre el campo de los escalares

Se denomina espacio vectorial V a cualquier conjunto de objetos matemáticos en el cual
las operaciones de suma de vectores y multiplicación por escalar estén definidas. La operación
de suma de vectores es un mapa de V × V en V mientras que la multiplicación por un escalar
es otro mapa, de F × V en V,en donde F es un campo de escalares. Estos mapas satisfacen
las siguientes propiedades:
Suma de vectores:

|Ψi + |χi = |zi ∈ V es clausurativa (3.64a)

|Ψi + |χi = |χi + |Ψi es conmutativa (3.64b)
|Ψi + (|χi + |ξi) = (|Ψi + |χi) + |ξi es asociativa (3.64c)
|Ψi + 0 = 0 + |Ψi = |Ψi existe el vector cero (3.64d)

Los elementos de un espacio vectorial pueden escribirse usando una convención conveniente.
Dos formas usuales de describir vectores son usar una flecha encima del sı́mbolo que designa
el vector y escribir el sı́mbolo en negrita. Aquı́, a los elementos del espacio vectorial V, los
vectores, los hemos denotado por |Ψi , |χi , etc.
Multiplicación por escalar:

c |Ψi = |zi ∈ V es clausurativa (3.65a)

c(|Ψi + |χi) = c |Ψi + c |χi es distributiva respecto a suma de vectores (3.65b)
(a + b) |Ψi = a |Ψi + b |Ψi es distributiva respecto a suma de escalares (3.65c)
(ab) |Ψi = a(b |Ψi) es compatible con la multiplicación de escalares (3.65d)
1 |Ψi = |Ψi 1 es la identidad del campo escalar (3.65e)

A los escalares, los elementos de campo F los hemos escrito como a, b, c. Como escalares vamos
a emplear los números complejos.
40 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA

Figura 3.6: Cuerda vibrante. Ondas con polarizaciones diferentes.

3.2. POLARIZACIÓN EN CUERDAS 41
Existe un único vector inverso aditivo − |Ψi tal que al sumarlo con el vector |Ψi da el
vector cero.

|Ψi + (− |Ψi) = 0. (3.66)

Un conjunto de vectores {|φi1 , |φi2 , · · · , |φiN } es linealmente independiente si no existe

ninguna combinación lineal de los mismos
X
ci |φii (3.67)

que dé como resultado el vector cero, a no ser aquella en que todos los escalares son cero.
El espacio vectorial V es de dimensión n (n < ∞) si existe al menos un conjunto de n
vectores linealmente independientes, tal que cualquier vector pueda expresarse como
X
f= ci f i (3.68)

y los escalares ci están determinados de manera unı́voca por f .

Ocasionalmente vamos a usar la noción de span: si todos los vectores de V son combi-
naciones de numero finito de vectores de S, entonces span(S) = V. Si los vectores de S son
linealmente independientes entonces S es una base de V.
Tradicionalmente se representa por un vector columna

.
= y . (3.69)
z

Es importante darse cuenta de que en la representación de arriba se definió una base de la

siguiente manera:
. 1 . 0
ey = , ez = . (3.70)
0 1
Claramente, si se cambia la base, las componentes del vector en esa nueva base (los elementos
del vector columna) son otras. La determinación de las componentes de un vector en una
base dada puede realizarse usando el llamado producto escalar o producto interno entre dos
vectores. Esta es una operación matemática que a cada par ordenado de vectores, a, b les
asigna un número complejo (a, b) definido de la siguiente manera

(a, b) = a∗y by + a∗z bz . (3.71)

Vale la pena notar que los elementos del primer vector se conjugan (conjugación compleja).
Parecerı́a que el valor del producto interno dependiese de la base, pero no es ası́. El pro-
ducto
p interno induce una métrica, es decir, una noción de distancia. En efecto, d(a, b) =
(a − b, a − b) satisface los requerimientos de una distancia: la distancia entre dos vectores
es no negativa, y es cero únicamente cuando los dos vectores son iguales, la distancia entre dos
vectores es menor o igual a la suma de las distancias entre ellos y un tercer vector arbitrario
(desigualdad triangular).
El producto interno permite introducir la noción de ortogonalidad: dos vectores son or-
togonales si su producto interno se anula. Por ejemplo, si a = ey + iez y b = ey − iez , el
producto interno (a, b) es igual a

(a, b) = 1 × 1 + (−i)∗ × (i) = 1 + i × i = 1 − 1 = 0.

El producto interno también nos permite hallar la norma de un vector, k(ak,

kak = (a, a).

42 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Para los vectores del ejemplo,
p √ p √
kak = 1 + (−i) × (i) = 2, kbk = 1 + (i) × (−) = 2.

Se dice que un conjunto de vectores es ortonormal si los vectores son ortogonales entre sı́,
y si la norma de cada uno de ellos es uno. Se dice que un conjunto de vectores es completo si
cualquier vector se puede escribir como una combinación lineal de estos vectores. Un conjunto
de vectores es una base ortonormal si es ortonormal y completo. En el ejemplo, los vectores
1 1
√ (ey + iez ) y √ (ey − iez ),
2 2
es una base ortonormal para vectores complejos en el plano y-z.
Supongamos que a1 y a2 forman una base ortonormal, y que d es un vector arbitrario
(del mismo espacio vectorial). Por definición, podemos expresar el vector arbitrario como
combinación lineal de los vectores de la base:

d = d1 a1 + d2 a2 .

Hacemos el producto escalar del vector a1 con cada lado de la ecuación anterior.

(a1 , d) = (a1 , d1 a1 + d2 a2 ) = (a1 , d1 a1 ) + (a1 , d2 a2 ) = d1 (a1 , a1 ) + d2 (a1 , a2 ),

en donde hemos empleado la propiedades del producto escalar. Explı́citamente estas propie-
dades son la simetrı́a de conjugación (a1 , a2 ) = (a2 , a1 )∗ , linealidad en el segundo argumento
(a1 , c2 a2 + c3 a3 ) = c2 (a1 , a2 ) + c3 (a1 , a3 ) y positividad ((a, a) ≥ 0, en donde la igualdad
solo ocurre para el vector cero). Como el vector a1 tiene norma uno (a1 , a1 ) = 1 y como es
perpendicular a a2 , entonces (a1 , a2 ) = 0. Ası́, obtenemos,

(a1 , d) = d1 . (3.72)

De la misma forma, podemos encontrar una expresión para d2 . Entonces, cualquier vector
arbitrario d puede escribirse como

d = (a1 , d)a1 + (a2 , d)a2 . (3.73)

EJERCICIO 34. En la figura 3.6 se muestran varias situaciones de una cuerda vibrante.
A partir de la descripción matemática de las ondas correspondientes a los literales a), b) y c),
encuentre los correspondientes vectores de polarización.
Consideremos el caso de una cuerda vibrante tendida a lo largo de x, en cuyo camino se
pone una rendija angosta a lo largo de y (figura 3.6). Si representamos el vector de polarización
e la base {ey , ez }, la acción de la rendija angosta puede representarse por la siguiente matriz

. 1 0
Rendija = . (3.74)
0 0

En efecto, si la polarización antes de la rendija se representa por (y , z )T , la polarización

después es
1 0 y
= y . (3.75)
0 0 z 0

3.3. Polarización de ondas electromagnéticas

Cuenta la leyenda que los vikingos descubrieron la polarización de la luz usando los cristales
de Islandia y que la usaron para la navegación, aprovechando que la luz se polariza al pasar
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 43
por la atmósfera. Erasmi Bartholini fue el primero que describió la doble refracción de la luz
usando los cristales de Islandia en su libro Experimenta crystalli Islandici publicado en 1669.
En esta sección mostramos algunos aspectos de la polarización de ondas electromagnéticas.
Las ecuaciones de Maxwell en el vacı́o, las cuales describen los fenómenos electromagnéticos
de manera condensada, expresadas en forma diferencial, son
1 1 ∂E(r, t)
∇ × B(r, t) = 2
j(r, t) + 2 , (3.76a)
0 c c ∂t
∇ · B(r, t) = 0, (3.76b)
∂B(r, t)
∇ × E(r, t) = − , (3.76c)
∂t
1
∇ · E(r, t) = ρ(r, t). (3.76d)
0
Las ecuaciones de Maxwell relacionan los campos eléctrico E(r, t) y magnético B(r, t) con
la densidad de cargas libres ρ(r, t) y la densidad de corrientes libres j(r, t). Estas ecuaciones
están escritas en el sistema internacional de unidades SI, en donde 0 es la constante dieléctri-
ca del vacı́o y c la rapidez de propagación de las ondas electromagnéticas en el vacı́o. La
ecuación (3.76a) es conocida como la ley de Ampère–Maxwell y describe entre otras cosas que
las corrientes producen campos magnéticos; la ecuación (3.76b), la ley de Gauss para campos
magnéticos, prohibe la existencia de monopolos magnéticos; la ecuación (3.76c) conocida co-
mo ley de inducción de Faraday, predice la producción de una fuerza electromotriz debido a
la variación del campo magnético; y la ecuación (3.76d), la ley de Gauss (para campos eléctri-
cos), muestra que las fuentes y sumideros de los campos eléctricos son las cargas eléctricas.

Una de las consecuencias de las ecuaciones de Maxwell es la existencia de ondas electro-

magnéticas, como se muestra a continuación. Tomando el rotacional de la ecuación (3.76c)
tenemos

∂B(r, t)
∇ × (∇ × E(r, t)) = −∇ × .
∂t

Usando la identidad vectorial

∇ × (∇×) = ∇ (∇·) − ∇2 ,

e intercambiando las derivadas espaciales con las temporales, esta ecuación queda ası́

∂
∇ (∇ · E(r, t)) − ∇2 E(r, t) = − (∇ × B(r, t)) . (3.77)
∂t
Si usamos las ecuaciones de Maxwell (3.76a) y (3.76c) en (3.77) obtenemos la ecuación de
ondas con fuentes
1 ∂ 2 E(r, t) 1 1 ∂j(r, t)
∇2 E(r, t) − 2 2
= ∇ρ(r, t) + ,
c ∂t 0 0 c2 ∂t
que en ausencia de cargas y corrientes libres se reduce a
1 ∂ 2 E(r, t)
∇2 E(r, t) − = 0. (3.78)
c2 ∂t2
La ecuación (3.78) es una ecuación de ondas tı́pica que muestra que c es la rapidez de pro-
pagación de las ondas electromagnéticas en el vacı́o. Ası́, es posible identificar la luz como
ondas electromagnéticas que pertenecen a una región espectral particular, aquella en la que
las longitudes de onda son del orden de cientos de nanómetros.
44 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Soluciones particulares
Algunas soluciones de la ecuación de onda, correspondientes a ondas viajeras, tienen la forma

E(r, t) = E0 f (k · r − ωt) = E0 f (u). (3.79)

En efecto, la segunda derivada parcial del campo eléctrico con respecto a la coordenada
x puede expresarse en términos de la segunda derivada de la función f con respecto a su
argumento,

∂ 2 f (u)

∂E(r, t) ∂ ∂f (u) ∂u ∂ ∂f (u) ∂u 2
= E 0 = kx E 0 = kx E 0 . (3.80)
∂x2 ∂x ∂u ∂x ∂u ∂u ∂x ∂u2

La ecuación (3.80) se puede generalizar de la siguiente manera

∂ 2 f (u) ∂ 2 E(r, t) ∂ 2 f (u)

2 2
∇ E(r, t) = k · kE0 , = ω E0 .
∂u2 u=k·r−ωt ∂t2 ∂u2 u=k·r−ωt

Empleando estos resultados, percibimos que la ecuación (3.78) se satisface si se cumple la

igualdad
ω 2 = c2 k · k = c2 k 2 . (3.81)
La ecuación (3.81) se conoce como relación de dispersión, y las soluciones de la forma (3.79)
como ondas viajeras.
Otra familia importante de soluciones es la de ondas monocromáticas. Ellas son tales que el
campo eléctrico se puede descomponer en una parte temporal y una parte espacial

E(r, t) = E(r)e−i(ωt+φ) . (3.82)

Aquı́ se sobreentiende que se debe tomar ya sea la parte real o la parte imaginaria de la
expresión a la derecha de la igualdad, E(r, t) = Re(E(r)e−i(ωt+φ) ). Si la parte espacial del
campo electromagnético también fuese compleja serı́a posible describir, entre otras, ondas
viajeras monocromáticas. Substituyendo (3.82) en la ecuación de ondas (3.78) encontramos
que
ω2

∇ E(r) + 2 E(r) e−i(ωt+φ) = 0.
2
c
Ya que esta solución debe valer para todo tiempo, la parte que está entre paréntesis se debe
anular, de modo que la parte espacial del campo eléctrico debe satisfacer la ecuación de
Helmholtz
ω2
∇2 E(r) + 2 E(r) = 0. (3.83)
c
Las soluciones de ondas planas son un caso particular de la soluciones (3.79) y (3.82), que
tienen la forma
E(r, t) = E 0 eik·r e−iωt = E 0 ei(k·r−ωt+φe ) ,
(3.84)
B(r, t) = B 0 eik·r e−iωt = B 0 ei(k·r−ωt+φb ) .

De nuevo, se supone que los campos magnéticos y eléctricos reales se obtienen tomando ya
sea la parte real o la parte imaginaria de las expresiones (3.84).

EJERCICIO 35. Muestre que B(r, t) también satisface una ecuación de ondas.

EJERCICIO 36. Muestre que, en el caso de ondas planas, E(r, t) y B(r, t) son perpendi-
culares al vector de onda k y son perpendiculares entre sı́.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 45
Solución. Usando las expresiones (3.84) para los campos eléctrico E(r, t) y magnético B(r, t)
en las leyes de Gauss magnética (3.76b) y eléctrica (3.76d), en ausencia de cargas, obtenemos

∇ · B(r, t) = ik · B0 ei(k·r−ωt−φe ) = 0, ∇ · E(r, t) = ik · E0 ei(k·r−ωt−φe ) = 0.

Como k es la dirección de propagación de las ondas, las ecuaciones anteriores muestran que
los campos eléctrico y magnético de las ondas planas son perpendiculares a la dirección de
propagación. Si ahora reemplazamos en la ley de inducción de Faraday (3.76b) obtenemos

ik × E(r, t) = iωB(r, t).

Esta ecuación muestra de un lado que los campos eléctrico y magnético son perpendiculares
y de otro, teniendo en cuenta la relación de dispersión (3.81), que la magnitud del campo
eléctrico de una onda plana es c veces la magnitud el campo magnético para la misma onda
plana.
Las ondas planas son soluciones interesantes, pero muy idealizadas, puesto que cargan una
potencia infinita. En efecto, dado un único plano transversal a la dirección de propagación,
como la densidad de potencia es homogénea, la potencia total es infinita. Con el advenimiento
de los láseres tenemos fuentes de luz muy direccionales, que pueden modelarse a partir de una
aproximación paraxial a la ecuación de ondas, con longitud de onda bastante bien definida,
que puede aproximarse por una fuente monocromática. Recordemos que las soluciones mo-
nocromáticas son de la forma E(r, t) = E(r)e−i(ωt+φ) en donde E(r) satisface la ecuación
de Helmholtz (3.83). Vamos a buscar soluciones de la forma E(r) = u(x, y, z)eikz ex , para las
∂2 ∂2
cuales se cumple ∂z 2 ∂x2 .

Figura 3.7: Haces paraxial y no paraxial. En azul la variación transversal y en naranja la

variación logitudinal de la función u. En los haces en los que se puede hace la aproximación
paraxial la segunda derivada longitudinal varı́a mucho más lentamente que la segunda derivada
transversal.

Cuando se inserta el Ansatz en la ecuación de Helmholtz se tiene

2
∂ u ∂2u ∂2u

ikz ∂u 2 2
e ex + 2 + 2 + 2ik − k u + k u = 0. (3.85)
∂x2 ∂y ∂z ∂z
Teniendo en cuenta que la variación longitudinal de u es lenta, la función u aproximadamente
cumple la ecuación
∂2u ∂2u ∂u
2
+ 2 + 2ik = 0. (3.86)
∂x ∂y ∂z
Esta ecuación se conoce como la ecuación de ondas paraxiales.
Existen muchas maneras de resolver esta ecuación. Como sospechamos que una solución
que podrı́a describir los haces láser serı́a una función gaussiana con simetrı́a cilı́ndrica, hacemos
el Ansatz
k(x2 +y 2 )
i P (z)+ 2q(z)
u(x, y, z) = e . (3.87)
46 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Vamos a suponer que en z = 0 la onda se reduce a
k(x2 +y 2 )
u(x, y, z) = e− 2a , (3.88)

de manera que P (z = 0) = 0 y q(0) = −ia. Las derivadas transversales son

∂u(x, y, z) ikx
= u(x, y, z), (3.89)
∂x q(z)
2
∂ u(x, y, z) ik k 2 x2
= u(x, y, z) − u(x, y, z), (3.90)
∂x2 q(z) q 2 (z)
2
∂ u(x, y, z) ik k2 y2
= u(x, y, z) − u(x, y, z). (3.91)
∂y 2 q(z) q 2 (z)

La derivada longitudinal por su parte es

k(x2 + y 2 )q 0 (z)

∂u(x, y, z) dP
= i −i u(x, y, z), (3.92)
∂z dz 2q 2 (z)
dq
donde q 0 (z) = dz . Substituyendo en la ecuación paraxial de ondas se obtiene

k 2 (x2 + y 2 ) k(x2 + y 2 )q 0 (z)

ik dP
2 u(x, y, z) − u(x, y, z) + (2ik) i − i u(x, y, z). (3.93)
q(z) q 2 (z) dz 2q 2 (z)

Comparando términos encontramos

ik dP
2 = 2k (3.94a)
q(z) dz
dq
−k 2 = −k 2 . (3.94b)
dz
Integrado (3.94b) tenemos q(z) = q(0) + z= −ia + z, de manera que
1 1 z a 1 1 1 2
= = 2 +i 2 = 2 + i z2 = +i 2 . (3.95)
q(z) −ia + z z + a2 z + a2 z + az a + a R(z) kw (z)

Antes de resolver la ecuación de P (z), veamos que la solución que tenemos es del tipo
k(x2 +y 2 ) k(x2 +y 2 ) (x2 +y 2 )
−
u = eiP (z) ei 2q(z) = eiP (z) ei 2R(z) e w2 (z) . (3.96)
2
Aquı́, R(z) = z + az es conocido como el radio de curvatura del frente de ondas. Por otro
lado,
k 1 1 1 1 1
z 2 = 2 = 2a 2z2 = 2a z 2 =
, (3.97)
2 a +a w (z) k + ka k 1 + a2 w2 1 + z2
2 2 0 (kw0 /2)
p
en donde hemos identificado a w0 = 2a/k como la cintura del haz (a = kw02 /2).
La forma de la soluciónqdice que el spot del haz no es constante, sino que varı́a de acuerdo
2
con la ecuación w(z) = w0 1 + (kwz2 /2)2 . Para valores grandes de z, el spot del haz se compor-
0
1
ta como w(z) ∼ 2z/(kw0 ) = γz (ver figura 3.8) El radio de curvatura del haz, R(z) = 2
z+ az
es infinito para valores de z pequeños(z LR = kw02 /2 = a), comportamiento de una onda
plana, y es proporcional a z para valores grandes de la coordenada longitudinal, comporta-
miento de una onda esférica. El criterio para decidir si una onda Gaussiana es plana o esférica
hace uso de LR , la longitud de onda de Rayleigh.
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 47

Figura 3.8: Spot y frente de ondas de haz guassiano, mostrando el comportamiento asintótico.

La función P (z) es la solución de la ecuación (3.94a)

dP i i i
= = = . (3.98)
dz q(z) z − ia z − ikw02 /2

Integrando tenemos

P (z) − P (0) = i log (z − ia) − i log(−ia)

r !
z z 2 i arctan(z/a)
P (z) = i log 1 + i = i log 1 + 2e
a a

w(z)
= i log − arctan(z/LR ). (3.99)
w0

Substituyendo la solución de P (z) en el Ansatz para la u, encontramos la forma de la onda

gaussiana como función de la coordenada longitudinal (y de las coordenadas transversales)
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
u(x, y, z) = e e e w2 (z) , (3.100)
w(0)
q
z2 1 w(z)
en donde w(z) = w0 1+ (kw02 /2)2
, L2
y kw02 /2. Aquı́, el término w(0) asegura la conser-
z+ R
z
vación de energı́a, mientras arctan(z/LR ) es un corrimiento de fase con respecto a la onda
plana, conocido como fase de Gouy. 1 En los experimentos con láseres, generalmente se cumple
la desigualdad λ w0 LR . Por ejemplo, si el haz de un láser de HeNe se enfoca en una
cintura de 0.5 mm, tenemos

kw02 πw02
λ = 632,8nm, w0 = 0,5mm, LR = = = 1,2m.
2 λ

Volviendo a la expresión para el campo eléctrico E(r, t) = E(r)e−i(ωt+φ) con E(r) =

u(x, y, z)eikz ex , podemos decir que hemos encontrado soluciones de la forma
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
E(r, t) = Ex ei(kz−ωt−φx ) e e e w2 (z) ex . (3.101)
w(0)
1 Ver [Link] en donde se

muestra como tener los haces de Hermite-Gauss. [Link]

98c178dc-7e5b-4a04-b0a1-a73abf7f13d5/imagegallery/[Link]
48 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
De forma semejante podrı́amos haber encontrado una solución gaussiana en la cual el campo
eléctrico estuviese apuntando en la dirección ey . Ası́, podrı́amos tener campos eléctricos de
la forma
2 +y 2 ) (x2 +y 2 )
w(z) −i arctan(z/LR ) i k(x2R(z) −
E(r, t) = ei(kz−ωt e w2 (z) Ex e−iφx ex + Ey e−iφy ey . (3.102)

e e
w(0)

El término entre paréntesis es proporcional a la polarización. En este caso, la polarización

pertenece al plano x-y, a diferencia del caso de la cuerda, en la que la polarización era un
vector en el plano y-z. Naturalmente, no hay nada fundamental en que la dirección de pro-
pagación sea ez , como en nuestro ejemplo de los campos eléctricos, o en la dirección de ez ,
como en nuestro ejemplo de la cuerda. En ambos ejemplos, sin embargo, la polarización es
perpendicular a la dirección de propagación (esta es una caracterı́stica de las ondas transver-
sales). Una descripción simplificada puede hacer uso de ondas planas, en el entendimiento de
que la parte espacial que limita la región de validez de la descripción ha sido omitida.

3.3.1. Polarizadores lineales

Como los seres humanos no somos sensibles a la polarización de ls luz y gran parte de
nuestras fuentes de luz no son polarizadas, tendemos a pensar que la polarización no ocurre
naturalmente. Sin embargo, esto no es ası́. La luz que proviene del sol se polariza en la
atmósfera y muchos insectos utilizan la polarización para orientarse. Los pulpos pigmeos
pueden modificar su piel de manera que reflejan luz con patrones cambiantes de luz polarizada.
Una demostración común muestra que el efecto de un polarizador lineal de rejilla (fig. 3.9.
La demostración se describe a continuación.

Figura 3.9: Izquierda:Polarizador de rejilla de alambres metálicos. Derecha: esquema de un

emisor y receptor de microndas. El emisor produce onds electromagnéticas en la región de
las microondas en las que la longitud de onda es el orden de unos pocos centı́metros. El
campo eléctrico emitido está polarizado verticalmente. El receptor produce una señal audible
proporcional la intensidad detectada. Cuando se gira noventa grados, la señal cae a cero.

Se tienen un emisor de microondas y el receptor correspondiente. El emisor produce ondas

de microondas con longitud de onda tı́pica de 3 cm, polarizadas verticalmente (el campo
eléctrico apunta hacia arriba o hacia abajo). El receptor detecta microondas polarizadas
verticalmente y emite un sonido cuya intensidad es proporcional a la señal detectada. Cuando
el receptor se gira 90◦ , el sonido cesa de producirse. Se tiene además un polizador lineal de
rejilla de alambre, que consta de un marco y de una serie de alambres metálicos paralelos. Los
alambres están separados por una distancia mucho menor que la longitud de onda del campo
eléctrico, y su diámetro es mucho menor que la separación. El receptor se orienta de manera
que la señal detectada sea máxima. Después se interpone el polarizador de rejilla entre el
emisor y el receptor. Si los alambres están orientados horizontalmente, ¿qué espera el lector
que ocurra?
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 49
Como los alambres son metálicos, los electrones son libres para moverse, esencialmente
en la dirección del alambre. Ası́, los campos elécricos en la dirección de los alambres inducen
el movimiento de los electrones a lo largo de los alambres, de modo que el campo se refleja.
Por supuesto, una parte de la energı́a transportada por el campo se pierde por efecto Joule,
por el calentamiento de los alambres. Ası́, si el polarizador está orientado horizontalmente,
no hay cambio apreciable de la señal detectada por el receptor. Sin embargo, si los alambres
se orientan verticalmente, no hay campo eléctrico transmitido y la señal detectada por el
receptor es nula.
Para campos electromagnéticos en la región visible, cuyas longitudes de onda son del orden
de cientos de nanómetros, existen los polarizadores hechos en plástico de alcohol polivinı́lico
(PVA, por sus siglas en inglés, polyvinyl alcohol ) dopado con yodo. El proceso de fabricación
incluye una etapa de estiramiento que alinea las moléculas de PVA en una cierta dirección, a
lo largo de la cual la luz no se transmite. Ası́, podemos imaginarnos un polarizador Polaroid
como un polarizador de rejilla con “alambres” de dimensiones nanométricas. De hecho, es
posible construir un polarizador de rejilla hecho con alambres metálicos, cuando menos para
el infrarrojo cercano. Bird y Parrish construyeron uno en 1960, que tenı́a 2160 alambres por
milı́metro [58].
Supongamos que un campo eléctrico de la forma

E(r, t) = ei(kz−ωt FG (x, y, z) Ex e−iφx ex + Ey e−iφy ey ,

(3.103)

donde FG (x, y, z) corresponde a una función Gaussiana que cumple la ecuación de ondas
paraxial. Supongamos que frente al haz se pone un polarizador lı́nea que deja pasar la po-
larización a lo largo de y. En la base {ex , ey } la polarización después del polarizador lineal
puede escribirse como
. 0 0 0x 0
f = = . (3.104)
0 1 0y 0y
En realidad, la matriz anterior describe un polarizador lineal ideal. En general, el polari-
zador va a introducir una diferencia de fase, por lo cual podrı́amos representarlo por

. 0 0
PL = . (3.105)
0 eiδ

Además, podrı́amos tener pérdidas, es decir, el polarizador podrı́a absorber parcialmente el

campo polarizado verticalmente. Ası́, podemos representarlo por

. 0 0
PL = . (3.106)
0 (1 − η)eiδ

Además, es posible que quede un remanente de campo a lo largo del eje que, en el caso ideal,
no se transmitirı́a,
. η1 eiδ1

0
PL = , (3.107)
0 (1 − η2 )eiδ2
en donde se espera que η1 y η2 sean muy pequeños comparados con la unidad.
Mencionamos anteriormente que los vectores de polarización se escogen de forma que
tengan norma 1. Sin embargo, si el vector de polarización estaba normalizado a 1 antes de
pasar por el polarizador, después de este no lo estará más (a menos que inicialmente ya fuera
la polarización que deja pasar el polarizador). ¿Cómo podemos interpretar este hecho?

3.3.2. Teorema de Poynting

Para responder esta pregunta vamos a revisar la estructura de una ley de conservación, a
partir de ejemplo sencillo. Tomemos un volumen fijo, digamos una parte de una ciudad, en la
50 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
cual, en un momento dado hay n automóviles. El número de autos puede variar porque hay
autos que entran en ese voliumen y otros que salen de él, no necesariamente por las calles
(podrı́a ser izado por un helicópeto o un avión, salir por un subterráneo, etc). Existe otra
forma en que el número de autos puede variar. Puede haber una fábrica de automóviles. Por
otro lado, puede que haya un derby de demolición, que haya accidentes que dejen los carros
inservibles, o que se chatarricen los autos viejos.
De modo más formal, podemos escribir la ley de conservación en un volumen fijo Ω con
frontera ∂Ω como Z Z Z
d
U dx + F (U ) · dS = S(U, t) dx, (3.108)
dt Ω ∂Ω Ω

en donde U es la cantidad conservada, F (U ) su flujo, S el elemento de superficie que apunta

en la dirección hacia afuera de Ω y S(U, t) es el término de fuentes y sumideros. El primer
término de la ecuación a la diferencia en corresponde a la variación del número de autos en
cierto volumen de una ciudad, el segundo a la diferencia entre los autos que salen y los que
entran, y el último entre los autos fabricados y los destruidos.
R De la ecaciónR que se obtiene
al aplicar el teorema de la divergencia al segundo término ∂Ω F (U ) · dS = lΩ ∇ · F (U )dx,
intercambiarla derivada temporal con la integral espacial y pasar todos los términos al lado
izquierdo, Z
∂
U + ∇ · F (U ) − S(U, t) dx, (3.109)
Ω ∂t
válida para un volumen Ω fijo pero arbitrario, se obtiene la forma diferencial de la ley de
conservación,
∂
U + ∇ · F (U ) = S(U, t). (3.110)
∂t
Enseguida derivamos una ley de conservación para la energı́a almacenda en un campo
electromagnético. La fuerza que este le ejerce a una carga,

F = q(E + v × B). (3.111)

se conoce como fuerza de Lorentz. La potencia que el campo le transfiere a la carga es

∂W
= q(E + v × B) · v = qv · E.
∂t
La energı́a que el campo le transfiere a la carga puede aparecer como energı́a cinética, poten-
cial, calor, etc. El producto de la velocidad por la carga es la corriente, j, aparece en la ley de
Ampère-Maxwell (3.76a), ∇ × B = c12 j + c12 ∂E ∂t . La potencia transferida adquiere la forma

2 1 ∂E
j · E = c ∇ × B − 2 · E.
c ∂t

Teniendo en cuenta la identidad vectorial ∇ · (E × B) = B · ∇ × E − E · ∇ × B podemos

escribir
∂E
j · E = c2 (−∇ · (E × B) + B · ∇ × E) − · E.
∂t
Hacemos una transformación adicional, empleando la ley de Faraday (3.76c), ∇ × E(r, t) =
− ∂B(r,t)
∂t
∂ 1 B·B B
+ E · E + ∇ E × = −j · E, (3.112)
∂t 2 µ0 µ0
en donde tuvimos en cuenta que µ0 0 c2 = 1, y

∂E 1 ∂(E · E) ∂B 1 ∂(B · B)
·E = , ·B = .
∂t 2 ∂t ∂t 2 ∂t
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 51
La ecuación (3.112) se conoce como teorema de Poynting, ya que fue derivado por primera
vez por John Henry Pynting [59]. Tiene la estructura
de una ley de conservación, en donde la
1 B·B
densidad de energı́a electromagnética es u = 2 µ0 + E · E , el vector de Poynting, que
B
da el flujo de energı́a es S = E × µ0 , y el término de fuentes corresponde a menos el trabajo
hecho por el campo sobre las cargas. El teorema se puede extender a medios macroscópicos
que tengan pocas pérdidas [60, 61]. Esta derivación no es completamente limpia, pues no se
hizo una distinción entre los campos propios (producidos por las mismas cargas) y los campo
externos. Si se hace esta distinción, no se llega al teorema de Poynting, conforme lo muestran
Campos y Jiménez [62]. De hecho, en un punto de la derivación es necesario aproximar los
campo totales por los externos, pero de este modo se está ignorando la transferencia de energı́a
de los campos externos a los campos propios. Existen referencias posteriores que analizan este
problema. En particular, ver la referencia [63]. Sin embargo, al parecer algunos problemas
profundos de la fı́sica no se resuelven nunca, se olvidan cuando aparece otra teorı́a.
Ahora, para determinar qué tan iluminada está una superficie vamos a seguir a Hetch [64].
Para tanto vamos a usar un detector que colecte toda la potencia de la onda electromagnética
que llega a la superficie, que está dada por el vector de Poynting. Aunque el detector tiene un
área A fija, que permite la entrada de la energı́a radiante, dado que otros detectores pueden
tener otras áreas, la cantidad interesante es la energı́a total por unidad de área. Suponemos que
la superficie es perpendicular a la dirección de incidencia de la radiación. Otro tanto puede ser
dicho acerca del perı́odo de recolección, T , de la energı́a por unidad de área: para independizar
la medición de este tiempo de recolección, dividimos por T . Ası́, la cantidad interesante es la
energı́a promedio por unidad de área por unidad de tiempo. Estamos hablando, entonces, del
promedio temporal de la magnitud del vector de Poynting,
Z t+T
1
I= kSkdτ, (3.113)
T t

promedio temporal conocido como la irradiancia (anteriormente conocida como intensidad,

un nombre que es usado de manera diferente en áreas diferentes a la fı́sica).
Debido a la aproximación paraxial que hicimos, la forma del campo magnético es parecida
a la del campo eléctrico, con una amplitud 1/c de la del campo eléctrico, perpendicular a la
dirección de propagación, pero a noventa grados del campo eléctrico. Las expresiones para el
campo electromagnético es la siguiente

= ei(kz−ωt FG (x, y, z) Ex e−iφx ex + Ey e−iφy ey ,

E(r, t) (3.114a)
1
= ei(kz−ωt FG (x, y, z) Ex e−iφx ey − Ey e−iφy ex ,

B(r, t) (3.114b)
c

en donde FG (x, y, z) es una función gaussiana que satisface la ecuación paraxial de ondas,
como antes. Las expresiones que tenemos son complejas, pero los campos corresponden a la
parte real o a la parte imaginaria de esas expresiones. En un tratamiento aproximado podemos
ignorar la fase del frente de ondas (z toma un valor fijo y se vuelve una constante). Tenemos
el valor medio de un coseno al cuadrado sobre un número n de periodos Tω = 2π/ω, no
necesariamente entero. Sin embargo, si T es sificientmente grande con respecto al periodo de
la onda, T Tω , el promedio estel cuadrado del coseno será, con muy buena precisión igual a
1/2. La irradiancia en el plano z = z0 , alrededor del punto (x0 , y0 ) es aproximadamente igual
a
1 c
I= kfG (x0 , y0 , z0 )k2 (Ex2 + Ey2 ) = kfG (x0 , y0 , z0 )k2 E02 , (3.115)
2µ0 c 2
en donde E02 = Ex2 +Ey2 . Si el vector de polarización se normaliza a la entrada de un polarizador
lineal que deja pasar la componente y, = Ex e−iφx ex + Ey e−iφy ey /E0 , entonces a la salida

52 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
no está normalizado, f = Ex /E0 e−iφx ex . Además, la irradiancia de salida es

c E2 E2
Iout = kfG (x0 , y0 , z0 )k2 E02 x2 = x2 Iin . (3.116)
2 E0 E0

Esto quiere decir que, al menos en este caso, el cuadrado del vector de polarización de
salida es igual a la razón entre la irradiancia de salida y la de entrada.

3.3.3. Ley de Malus

Recientemente se describió un procedimiento para verificar la Ley de Malus usando un
teléfono inteligente [65]. Para esto se necesita la app Physics Toolbox, la cual accede a los
sensores de los teléfonos inteligentes. En este experimento se usa la opción Multi report de
los sensores de luz y orientación. Además de teléfono inteligente, se necesitan una fuente de
luz polarizada (un monitor plano de computador o un televisor LCD) y un polarizador lineal
de 1 cm por 1 cm (de un viejo display de calculadora, o de Polaroid ). Aunque el sensor mide
iluminancia y no exitancia (irradiancia de fuentes de luz), es decir, pesa las contribuciones
espectrales de la fuente de acuerdo con la respuesta tipica del ojo humano, como la fuente no
varı́a en el experimento, la iluminancia es proporcional a la exitancia.
El sensor de luz usualmente se encuentra al lado de la cámara frontal. Con el teléfono
en posición vertical se rota el polarizador hasta obtener un mı́nimo, de tal manera que el
polarizador está a noventa grados de la polarización de la fuente de luz. Después se gira el
teléfono un cuarto de vuelta y se analizan los datos. Después de hacer un ajuste de los datos
se obtiene I(θ) = I(0) cosd (θ), donde d es cercano a 2 y θ es el ángulo entre la polarización
permitida por el polarizador y la polarización de la fuente.
Merecen su lectura y tal vez su reproducción otros artı́culos que tienen que ver con la ley
de Malus o con el uso de teléfono inteligentes para hacer mediciones usando los sensores de
luz o de orientación [66, 67, 68, 69, 70, 71, 72, 73, 74, 75].
Ahora, el modelo vectorial de la polarización da cuenta de este comportamiento. Supon-
gamos que tenemos una fuente de luz polarizada que emite luz que se propaga a lo largo del
eje x, de tal manera que su vector de polarización apunta hacia arriba, en la dirección de z
positivo. Supongamos, además, que tenemos un polarizador lineal que rotamos, de tal manera
que deja pasar luz con polarización a lo largo de cos θez + sin θey . La intensidad de la luz que
2
pasa es Iout = Iin (ey · (cos θez + sin θey )) = Iin cos2 θ.
Merece la pena recordar que la polarización es lineal si no hay diferencia de fase entre sus
componentes, es decir, si = cos θeiφ ex + sin θeiφ ey .
Supongamos que tenemos luz con polarización lineal y queremos girar la polarización. El
cálculo que hicimos anteriormente muestra que podemos girar la polarización por un ángulo
θ poniendo un polarizador lineal cuyo eje de transmisión forme ese ángulo con la dirección
orginal de polarización. Esto se logra con un costo: que la intensidad transmitida sea Iout =
Iin cos2 θ. Es decir que, no podemos girar la polarización por noventa grados . . . a menos
que tengamos dos polarizadores: los ejes de transmisión de los polarizadores se ponen ası́:
el primero a 45 grados de la dirección original de polarización y el segundo a 45 grados del
primer eje, a noventa grados del segundo.
EJERCICIO 37. Suponga que va a girar noventa grados el eje de polarización de un haz
de luz polarizado linealmente y que tiene N polarizadores lineales a disposición. ¿Cómo debe
disponerlos para que la luz transmitida sea máxima?
Suponga que tiene dos polarizadores lineales y que pone uno encima de otro de manera
que el eje de transmisión de uno forma noventa grado con el del otro. Ahora, suponga que
pone una pelı́cula de celofán, más pequeña que los polarizadores, entre ambos. Si comienza a
rotar el celofán, a un determinado ángulo la región del celofán se ve clara, mientras el resto
es oscuro. Describa matemáticamente el celofán (desde el punto de vista de su efecto sobre la
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 53
polarización). Puede tener en cuenta que el celofán es un material anisotrópico, birrefringente,
es decir, posee dos ı́ndices de refracción.
Si una pelı́cula transparente tiene dos ı́ndices de refracción, n1 y n2 , tiene dos velocidades
de propagación, c/n1 y c/n2 , y dos longitudes de onda λ1 = nλ01 y λ2 = nλ02 . Si el ancho de
la pelı́cula es δ el campo eléctrico gana una fase kδ, es decir, una componente gana una fase
2πδn1
2πδ
λ1 = λ0 y la otra una fase 2πδn
λ0 . Es decir, un material birrefringente produce un desfase
2

entre su dos componentes.

Primero, vamos a escribir el vector de polarización en la base de las componentes rápida
(la que gana una fase menor) y lenta (la que gana una fase mayor) del medio birrefringente.

. cos φ
in = . (3.117)
sin φ

Enseguida, tenemos en cuenta que el medio produce un desfase entre las dos componentes,

. cos φ 1 0 cos φ
out = iα = . (3.118)
e sin φ 0 eiα sin φ

La matriz describe el efecto de la pelicula de celofán sobre la polarización. Sabemos, a partir

del resultado observado, que la polarización se rota noventa grados, es decir,

. cos(φ + π2 )

− sin φ
˜out = = . (3.119)
sin(φ + π2 ) cos φ

Como podemos tener una fase global, sin que se cambie la polarización, escribimos la polari-
zación de salida como
. iβ − sin φ
˜out = e . (3.120)
cos φ
Las dos descripciones, que hemos hallado a partir de consideraciones diferentes, deben ser
iguales,
cos φ iβ − sin φ
=e . (3.121)
eiα sin φ cos φ
De la primera componente tenemos que, para que el lado derecho sea real, como el lado
izquierdo, δ = 0 o δ = π. Consideremos el primer caso, el cual implica la igualdad cos φ =
− sin φ, cuyas soluciones son θ = −π/4 y θ = 3π/4 (en el intervalo [−π, π]). Escojamos
la primera solución. Substituyendo en la segunda componente, vemos que se debe cumplir
δ = π + 2pπ, siendo p un entero. De nuevo escogemos la primera solución, la cual muestra
que el celofán debe acumular un desfase de π entre las dos componentes. Como ese desfase
corresponde a media longitud de onda, los elementos que producen ese desfase se llaman
placas de media onda. Dicho de otra manera, la pelı́cula de celofán debe actuar como una
placa de media onda. Por otro lado, el eje lento del celofán debe ponerse a -45◦ con respecto
al eje de transmisión del primer polarizador lineal.
EJERCICIO 38. Considere las soluciones que descartamos. Discuta si son soluciones
diferentes y a qué corresponden.
Vemos que tenemos un elemento que cambia la polarización, una placa de media onda, la
cual se representa, en la base (eje rápido, eje lento), por

. 1 0
MO = . (3.122)
0 −1

Veamos el efecto sobre una polarización lineal arbitraria.

. 1 0 cos φ cos φ
out = = . (3.123)
0 −1 sin φ − sin φ
54 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
Tenemos una reflexión sobre el eje lento. Visto de otra manera, corresponde a una rotación
por un ángulo 2φ en el sentido antihorario.
EJERCICIO 39. Aunque siempre podemos cambiar la base de polarización, con frecuen-
cia es conveniente trabajar en una base fija (por ejemplo, la base {ex , ey }). ¿Qué matriz
representa una placa de media onda cuyo eje rápido forma un ángulo θ con ex ?
Como un vector de polarización a lo largo del eje rápido no gana una fase (de hecho sı́ lo
hace, pero lo importante es la diferencia de la fase ganada entre el eje rápido y el eje lento),
se cumple lo siguiente
a11 a12 cos θ cos θ
= . (3.124)
a21 a22 sin θ sin θ
El eje lento, por su parte, gana una fase de π,

a11 a12 − sin θ − sin θ
=− . (3.125)
a21 a22 cos θ cos θ

Las dos ecuaciones pueden escribirse en una sola

a11 a12 cos θ − sin θ cos θ − sin θ 1 0
= . (3.126)
a21 a22 sin θ cos θ sin θ cos θ 0 −1

cos θ − sin θ
Multiplicando a la derecha por la inversa de la matriz encontramos la matriz
sin θ cos θ
que representa una placa de media onda cuyo eje rápido forma un ángulo θ con ex

a11 a12 cos θ − sin θ 1 0 cos θ sin θ cos(2θ) sin(2θ)
= = .
a21 a22 sin θ cos θ 0 −1 − sin θ cos θ sin(2θ) − cos(2θ)
(3.127)
EJERCICIO 40. Si se hace pasar luz con polarización lineal arbitraria por una placa de
media onda tal que su eje rápido forma un ángulo θ con la polarización horizontal ex , ¿cuál
es la polarización de salida? Haga una interpretación geométrica del resultado.
Un detalle que no hemos discutido es que las placas de media onda dependen de la longitud
de onda. En el experimento descrito se usa luz natural, que contiene todo el visible. Podemos
considerar que las longitudes de onda involucradas van de los 400 a los 800 nanómetros. Si
tomamos una longitud de onda de referencia de 600 nm, vemos que la diferencia de fase
corresponde a 300 nm, es decir, (nlento − nrapido )× espesor= 300 nm.
EJERCICIO 41. Estime los vectores de polarización de salida correspondientes a 400 nm
y 800 nm, suponiendo una pelı́cula de celofán que funciona como una placa de media onda a
600 nm.
En la referencia [76] se midieron los ı́ndices de refracción de celofán a 632.8 nm, nl =
1,4721 ± 0,0002, y nr = 1,4680 ± 0,0002. La diferencia de los ı́ndices es de unos 4 × 10−3 . Ası́,
suponiendo que esta diferencia es aproximadamente igual en todo el espectro visible, tenemos
que el espesor de la pelı́cula, δ, es de aproximadamente, d ≈ 300nm/(4 × 10−3 ) = 75µm,
menos de un décima de milı́metro.
En realidad estos datos no son necesarios si se supone que la diferencia de ı́ndices de
λ0r
refracción es igual en todo el espectro visible. Tenemos 2πδ∆n λ0r = π, es decir, δ = 2∆n , en
donde λ0r es la longitud de onda, en el vacı́o, de la luz para la cual la pelı́cula se comporta
como una placa de media onda. Esto quiere decir que el desfase para luz de otra longitud de
onda será α(λ0 ) = 2πδ∆n
λ0 = π λλ0r0 . Ası́, para 400 nm tenemos un desfase de 3π/2 y para 800 nm
de 3π/4. La componente de luz solar en el violeta (400 nm) es relativamente pequeña. Además
la respuesta del ojo humano es pequeña para longitudes de onda del orden y menores a la del
azul, y para aquellas del orden o mayores que la rojo (800 nm). Además, la desviación angular
para el rojo es relativamente pequeña, mientras que para el azul, es más significativa. Esto
quiere decir que, después de pasar por el segundo polarizador linear, habrá mayores pérdida
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 55
hacia el azul y el rojo de longitudes de onda mayores. Sin ambargo, como esa longitudes de
onda no pesan mucho en el conjunto del espectro de la luz solar conforme lo ve un ojo humano,
no se espera una coloración apreciable.

3.3.4. Polarización circular

Volvamos a considerar un haz gaussiano. Esta vez supongamos que que el campo eléctrico
puede escribirse como

E(r, t) = E0 f˜G (x, y, z) (cos(kz − ωt + φ)ex + sin(kz − ωt + φ)ex ) , (3.128)

en donde el moño sobre la función gaussiana señala que todas las fases han sido incluı́das en φ,
y que, por lo tanto, f˜G (x, y, z) es puramente real. Sin pérdida de generalidad podemos suponer
que φ = 0, t = 0 y z = 0. El campo empieza apuntando en la dirección de x. Nos quedamos en
z = 0 y miramos hacia la onda que viene propagándose hacia nosotros. Después de un tiempo
∆t nos llega una parte de la onda que tenı́a z negativo en el tiempo inicial t = 0. Como z
es negativo (y relativamente pequeño, |kz| 1), el vector (cos(kz)ex + sin(kz)ex ) forma un
ángulo negativo pequeño con respecto al eje x. Un tiempo después, esta parte de la onda
coincide con el eje x. Esto quiere decir que, mirando hacia la dirección de propagación de la
onda, parados en un punto fijo, vemos que la onda gira en dirección antihoraria. Decimos que
esta onda tiene una polarización circular derecha. Si, hubiéramos tenido un campo eléctrico

E(r, t) = E0 f˜G (x, y, z) (cos(kz − ωt + φ)ex − sin(kz − ωt + φ)ex ) , (3.129)

al realizar el mismo análisis, verı́amos a la onda girando en la dirección horario. Habrı́amos

tenido un campo electromagnético con polarización circular izquierda. Teniendo en cuenta
que Re(eiu ) = cos u y Re−ieiu = sin u, vemos que la polarización derecha corresponde a un
vector que apunta en la dirección de ex − iey . Después de normalizar este vector vemos que,
en la base {ex , ey } se representa mediante

. 1 1
R = √ . (3.130)
2 −i

De manera semejante, vemos que la polarización circular izquierda, en la misma base, se

representa mediante el vector
. 1 1
L = √ . (3.131)
2 i
Supongamos que tenemos luz polarizada linealmente y la pasamos a través de un elemento
birrefringente cuya acción es (únicamente) retardar una de las componentes con respecto a la
otra por una fase de π/2.

3.3.5. Elipse de polarización

Como mencionamos anteriormente, las figuras de Lissajous de dos osciladores de la misma
frecuencia son las elipses de polarización. Aquı́ hacemos una derivación de dichas elipses,
a partir de las expresiones para el campo eléctrico. Para una derivación diferente, vea la
referencia [77].
En un punto r particular, las componentes del campo eléctrico de una onda electromagnéti-
ca que se propaga en la dirección de z son

Ex = Ex0 cos(−ωt + δx ) = (3.132)

Ey = Ey0 cos(−ωt + δy ) = Ey0 cos(−ωt + δx − (δx − δy )). (3.133)
56 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
El vector de polarización correspondiente es

Ex0 Ey0 e−iδ

= q ex + q ey , (3.134)
2 + E2
Ex0 E 2 + E2
y0 x0 y0

en donde hemos definido δ = δx − δy . Definiendo además τ = −ωt + δx podemos escribir la

componente y reescalada como

Ey
= cos(τ − δ) = cos(τ ) cos(δ) − sin(τ ) sin(δ).
Ey0
r
Ex
√
Ex
2
De la ecuación (3.132) encontramos cos θ = Ex0 y sin θ = ± 1 − cos2 θ =± 1− Ex0 ,
las cuales substituı́mos en la ecuación anterior,
s 2
Ey Ex Ex
= cos(δ) − (±) 1 − sin(δ).
Ey0 Ex0 Ex0

Pasando el primer término de la derecha al lado izquierdo, y elevando ambos lados al cuadrado,
tenemos
2 2 !
Ey Ex Ex
− cos(δ) = 1 − sin2 (δ). (3.135)
Ey0 Ex0 Ex0

Una forma más conveniente de escribir esta igualdad es

2 2
Ex Ey Ey Ex
+ −2 cos(δ) = sin2 (δ). (3.136)
Ex0 Ey0 Ey0 Ex0

Enseguida vamos a demostrar que esta es la ecuación de una elipse centrada en el origen. Con
este fin reescribimos el lado izquierdo como

1
− Ecos(2δ)
! !
2
Ex0 x0 Ey0 Ex 1 1 Ex
Ex Ey cos(2δ) 1 = 2 + 2 Ex Ey M . (3.137)
− Ex0 Ey0 2
Ey0
Ey Ex0 Ey0 Ey

La matriz M
 2 
Ey0 Ex0 Ey0 cos(δ)
1
− Ecos(δ)
!
1 2
Ex0 x0 Ey0 E 2 +E 2 − 2 +E 2
Ex0
= x0 y0 y0 , (3.138)
− Ecos(δ)
 2
1 1 1 E Ey0 cos(δ) Ex0
2
Ex0
+ 2
Ey0 x0 Ey0
2
Ey0 − x0 2 2 2 2
Ex0 +Ey0 Ex0 +Ey0

puede escribirse como una combinación lineal de las matrices

1 0 0 1 1 0
I= , σx = , σz = . (3.139)
0 1 1 0 0 −1

En efecto, esta matriz se puede escribir como

!
2 2
1 2Ex0 Ey0 cos(δ) Ey0 − Ex0 1
M= I− 2 + E2 σ x + 2 + E 2 σz = (I + sx σx + sz σz ) . (3.140)
2 Ex0 y0 Ex0 y0 2

Es conveniente usar la parametrización sx = s sin(2θ), sz = s cos(2θ), para verificar que los

vectores (cos θ, sin θ)T y (− sin θ, cos θ) son los autovectores de M con autovalores 21 (1 + s) y
3.3. POLARIZACIÓN DE ONDAS ELECTROMAGNÉTICAS 57
1
2 (1 − s), respectivamente,

cos θ 1 1 + s cos(2θ) s sin(2θ) cos θ
M = (3.141)
sin θ 2 s sin(2θ) 1 − s cos(2θ) sin θ

1 cos θ
= (1 + s) , (3.142)
2 sin θ

− sin θ 1 1 + s cos(2θ) s sin(2θ) − sin θ
M = (3.143)
cos θ 2 s sin(2θ) 1 − s cos(2θ) cos θ

1 − sin θ
= (1 − s) . (3.144)
2 cos θ

Una simple comparación entre (3.140) y nuestra parametrización nos permiter determinar el
ángulo θ !
1 −2Ex0 Ey0 cos(δ)
θ = arctan 2 − E2 , (3.145)
2 Ey0 x0

y el parámetro s
v !2 !2
u
2 − E2
Ey0
q u 2Ex0 Ey0 cos(δ) x0
s= s2x + s2y = t − 2 + E2 + 2 + E2 . (3.146)
Ex0 y0 Ex0 y0

Teniendo en cuenta
2 2 2
2 2 2 2
cos2 (δ) = Ey0
2 2 2
(1 − sin2 (δ))

Ey0 − Ex0 +4Ex0 Ey0 − Ex0 + 4Ex0 Ey0
2 2
2 2 2
sin2 (δ),

= Ey0 + Ex0 − 4Ex0 Ey0 (3.147)

podemos simplificar s v
u !2
u 2Ex0 Ey0 sin(δ)
s = t1 − 2 + E2 . (3.148)
Ex0 y0

Observando que la matriz M admite la descomposición

−1 1 1 + s 0 cos θ sin θ
M=R R, R= , (3.149)
2 0 1 − s − sin θ cos θ

permite escribir la ecuación (3.136), escrita en términos de θ

!
1 1 + s cos(2θ) s sin(2θ) Ex 1 1
Ex Ey = 2 + E2 sin2 (δ).
2 s sin(2θ) 1 − s cos(2θ) Ey Ex0 y0

en la forma alternativa
0 !
1 1+s 0 Ex 1 1
Ex0 Ey0 = 2 + E2 sin2 (δ), (3.150)
2 0 1−s Ey0 Ex0 y0

en donde Ex0 = cos θEx + sin θEy , y Ey0 = − sin θEx + cos θEy . Merece la pena que escribamos
la ecuación de la elipse en una forma más evidente
2 2 2 2
(Ex0 + Ey0 )(1 + s) 2 (Ex0 + Ey0 )(1 − s) 2
2 E 2 sin2 δ
(cos θEx + sin θEy ) + 2 E 2 sin2 δ
(− sin θEx + cos θEy ) = 1,
2Ex0 y0 2Ex0 y0
(3.151)
58 CAPÍTULO 3. POLARIZACIÓN: DESCRIPCIÓN CLÁSICA
o mejor aún
 2
2 2 2
(Ex0 + Ey0 ) (1 + s) cos θEx + sin θE y
 q  + (3.152)
2 E 2 sin2 δ
2Ex0 2 + E2
y0 Ex0 y0
 2
2 2 2
(Ex0 + Ey0 ) (1 − s) − sin θEx + cos θEy
  = 1.
2 E 2 sin2 δ
q
2Ex0 y0 2 + E2
Ex0 y0

Como de la ecuación (3.148) se desprende que

2
4Ex0 2
Ey0 sin2 δ 2
2 + E 2 )2 = 1 − s ,
(Ex0
(3.153)
y0

podemos escribir la ecuación de la elipse ası́

 2  2
2(1 + s)  cos θEx + sin θEy  2(1 − s)  − sin θEx + cos θEy 
+ = 1. (3.154)
1 − s2 1 − s2
q q
E2 + E2
x0 y0 E2 + E2
x0 y0

Los semiejes a y b satisfacen las ecuaciones

1 − s2 1 − s2 1
a2 + b2 = + = (1 + s + 1 − s) = 1, (3.155)
2(1 + s) 2(1 − s) 2
s s
2 E 2 sin2 δ
r
1 − s2 1 − s2 1 − s2 Ex0 y0
ab = = = 2 + E 2 )2
2(1 + s) 2(1 − s) 4 (Ex0 y0
E E | sin δ|
= p x0 y0 (3.156)
2 + E 2 )2
(Ex0 y0

Figura 3.10: Elipse de polarización mostrando los parámetros de Stokes: el ángulo θ y los semi-
ejes mayor a y menor b. De izquierda a derecha, ejemplos correspondientes a δ = 0, π, π2 , − π2 .
Capı́tulo 4

Polarización: descripción
cuántica

En el capı́tulo anterior, después de hacer la deducción de la ecuación de ondas para una

cuerda vibrante, discutimos las soluciones de D’Alembert, de Euler y de Bernoulli y Fourier. La
vibración bidimensional de las ondas transversales permite definir el concepto de polarización,
el cual se puede ilustrar usando, por ejemplo, figuras de Lissajous. A partir de las ecuaciones de
Maxwell en el vacı́o dedujimos la ecuación de ondas para el campo eléctrico (la deducción para
el campo magnético es similar). Las soluciones de ondas planas y gaussianas que dedujimos son
transversales (campos perpendiculares a la dirección de propagación), de modo que también
podemos definir el vector de polarización. Elementos tales como polarizadores lineales, y
placas de cuarto de onda y de media onda, permiten manipular la polarización. En contraste
con el tratamiento del capı́tulo anterior, el cual fue puramente clásico, en este haremos una
descripción cuántica de la polarización de ondas electromagnéticas. Esta manera de introducir
la noción de estado cuántico es conveniente, puesto que el tratamiento matemático es igual al
caso clásico. La interpretación, sin embargo, es muy diferente. La descripción cuántica tiene
su origen en la observación de Planck de que la transferencia de energı́a entre radiación y
materia se da en cuantos o paquetes de energı́a. A tales paquetes de energı́a se les dió, muchos
años después, el nombre de fotones. En este capı́tulo abordamos experimentos de un fotón,
los cuales no solo se describen muy bien empleando la mecánica cuántica no relativista, sino
que son pasibles de exploración experimental usando equipo de costo relativamente bajo.

4.1. Los fotones existen

Introduzcamos un elemento del que no hablamos en el capı́tulo anterior. Se trata de un
divisor de haz: si se tiene un haz incidente, se tienen un haz reflejado y otro transmitido. Un
pedazo de vidrio con una fina pelı́cula de plata, insuficiente para tener un espejo, es un divisor
de haz. La suma de la energı́a de los haces secundarios (los dos últimos) es igual a la energı́a
del haz primario (el incidente). Un caso particular de este elemento ocurre cuando la energı́a se
reparte por igual, en cuyo caso tendremos un divisor de haz 50/50. Supongamos que tenemos
una fuente de un fotón. Si bien existen varias formas de producir fotones únicos, aquella que
ha resultado conveniente para los laboratorios de enseñanza es la que emplea la conversión
paramétrica descendente para producir pares de fotones. En esta técnica se dirige un haz de
luz láser hacia un cristal no lineal (como un KDP o un BBO) cuyo tensor de susceptibilidad
eléctrica sea no lineal (tensor de tercer orden χ(2) no nulo.) Ası́, tenemos tres haces de salida,
uno de la misma frecuencia del haz de entrada y otros dos haces, mucho menos intensos,
cuyas frecuencias son tales que las suma de ellas es igual a la frecuencia del haz de entrada.

59
60 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA

Figura 4.1: Experimento de Grangier: un fotón no se puede dividir.

Usando menos jerga cientı́fica, y en términos de fotones, estos cristales convierten, con una
pequeña probabilidad, un fotón del haz incidente de luz, en dos fotones cuyas direcciones
están correlacionadas. Cuando uno de estos fotones es detectado en una dirección, se sabe
que hay otro fotón en la dirección correlacionada. Ese fotón se usa para los experimentos de
un fotón [82].
Sin interponer el divisor de haz, ponemos un detector de fotones ideal. Cada vez que
enviamos un fotón, este es detectado. Ahora ponemos el divisor de haz. Siempre que enviamos
un fotón, este se detecta en D1 , pero no en D2 , o al contrario; pero nunca tenemos detección
simultánea. Este experimento clave, que lleva el nombre de Grangier, [83] nos permite hablar
del fotón como si se tratase de una partı́cula, al menos en el proceso de detección.
No existe un patrón discernible en la secuencia de qué detector hace click; si un fotón es
detectado en D1 , el siguiente puede ser detectado en D1 o en D2 . La secuencia parece aleatoria.
De hecho, este esquema es usado para producir números aleatorios. Si quiere comprar uno de
estos sistemas puede consultar las siguientes páginas de internet: [Link]
com/ o [Link] Lo que sı́ podemos decir es que, después de enviar un
número grande de fotones, alrededor de la mitad se detectan en D1 y el resto en D2 , con
una desviación aproximadamente igual a la raı́z cuadrada de la mitad del número de fotones
enviados.
Clásicamente la conservación de energı́a se daba porque cada haz secundario era responsa-
ble por la mitad de la energı́a del haz primario. En el caso cuántico, toda la energı́a se la lleva
uno de los haces secundarios; en cuál de ellos se detecta la energı́a, es un proceso aleatorio.
Interpongamos una lámina de un dieléctrico ideal (sin pérdidas) entre el divisor de haz
y uno de los detectores, de manera que, en ese camino, se gane una fase eiδ . En la práctica
se puede emplear un pedazo de cristal. Nuevamente, alrededor de la mitad de los fotones se
detectan en D1 y el resto en D2 .
El lector puede considerar una variación de este experimento, correspondiente a la parte
derecha de la figura 4.1. ¿Cómo será la distribución de clicks? ¿Cuántos detectores harán click
de manera simultánea? ¿Cómo será la secuencia temporal de los detectores de hacen click?
Como el lector seguramente habrá pensado, i) la secuencia de clicks es aleatoria, ii) hay
uno y solo un click por cada fotón que se envı́e, y iii) después de enviar muchos fotones, cada
detector será responsable por aproximadamente un cuarto de los clicks totales.
Mientras la mayorı́a de los sistemas que vamos a considerar en este capı́tulo se pueden
describir usando fı́sica no relativista, la descripción de las ondas electromagnéticas es intrin-
sicamente relativista (las ecuaciones de Maxwell son invariantes ante el grupo de Lorentz).
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 61
Este hecho implica que el concepto de estado cuántico de un fotón (y no solo de su polariza-
ción) sea, cuando menos, problemático [78]. En efecto, no existen estados localizados de fotón
[79, 80]. De cualquier modo, es posible tomar una posición pragmática de usar los estados de
fotón, en particular el formalismo de Riemann-Silberstein,1 siempre que sea útil [81].

4.2. Estados cuánticos de polarización

Supongamos que existen los fotones, que tenemos un fuente de un solo fotón y que tenemos
una situación en la cual un fotón atraviesa un polarizador lineal. Supongamos, además, que
en la descripción clásica el vector de polarización del haz transmitido sea diferente al de
entrada, es decir, una situación en la cual la energı́a del haz transmitido es menor que la
energı́a del incidente. Vamos a poner un detector ideal de fotones: si el fotón atraviesa el
polarizador, el detector hará un click.(?) Solamente hay dos opciones: que haya o que no
haya click. ¿cómo conciliar este hecho con la pérdida de energı́a del campo electromagnético
que atraviesa el polarizador en la imagen clásica? Podemos pasar un segundo fotón por el
polarizador. ¿Qué pasa?
Los vectores de polarización que introdujimos anteriormente son bidimensionales, porque
pertenecen al plano perpendicular a la dirección de propagación. Además, son complejos
porque, fuera de guardar información sobre la amplitud del campo eléctrico a lo largo de cada
dirección, codifican información acerca de la fase relativa de los campos. El estado cuántico
de los fotones también es un vector, pero en un espacio abstracto llamado espacio de Hilbert.
Tenemos una correspondencia entre vectores de polarización y estados cuánticos. Por ejemplo,
tenemos campos clásicos polarizados a lo largo de ex , y tenemos fotones en el estado horizontal
|Hi. La notación |i (ket) fue ideada por Dirac, como una manera elegante de eludir y a veces de
ocultar las dificultades matemáticas del análisis funcional, el lenguaje en el que von Neumann
escribió la teorı́a cuántica. Los estados caracterizan propiedades: cuando un polarizador lineal
ideal (transmisión 100 %) cuyo eje de transmisión es el horizontal se interpone en el camino
de un fotón |Hi, el fotón es transmitido. A la polarización ey , le corresponden los fotones
en el estado |V i , (vertical). Cuando un polarizador lineal ideal cuyo eje de transmisión es el
vertical se interpone en el camino de un fotón |V i, el fotón es transmitido. Ahora, los vectores
ex y ey son ortogonales. De la misma manera, los kets |Hi y |V i son ortogonales; en esta
caso porque corresponden a propiedades excluyentes. Cuando un polarizador lineal ideal cuyo
eje de transmisión es el vertical (respectivamente horizontal) se interpone en el camino de un
fotón |Hi (respectivamente |V i), el fotón no es transmitido.
Los argumentos que hemos usado hasta el momento pueden verse como procedimientos ex-
perimentales. Por ejemplo, supongamos que tenemos una fuente de un solo fotón, que produce
fotones polarizados verticalmente. Si interponemos un polarizador vertical (eje transmitido
en esta dirección) en el camino del fotón, y después un detector, cada fotón que se produce,
se detecta.
Podemos hacer una variación de este experimento. Supongamos que tenemos una fuente de
fotones, pero estos no se encuentran verticalmente polarizados. Podemos utilizar un polariza-
dor divisor de haz que es un dispositivo tal que, por ejemplo, el haz reflejado tiene polarización
horizontal y el transmitido polarización vertical. Interponemos un polarizador horizontal en
el haz reflejado y uno vertical en el transmitido. Todos los fotones que se producen son detec-
tados en Dh , el detector situado después del polarizador horizontal o en Dv (situado después
del polarizador vertical). El conjunto de aparatos hasta el polarizador divisor de haz puede
considerarse como una preparación, y el resto del experimento como una medición. Si consi-
deramos solo el haz transmitido (respectivamente reflejado) estamos preparando fotones con
polarización vertical (respectivamente horizontal). Todos los estados preparados con polariza-
ción vertical pasan por un polarizador vertical. Una forma de interpretar este experimento es
1 En este formalismo se usa el vector complejo E(r, t) + icB(r, t) como estado del campo electromagnético.
62 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
decir que se han producido fotones con la propiedad de que atraviesan polarizadores verticales
y que, por supuesto, si se pone un polarizador vertical en su camino, estos son transmitidos.
Antes de seguir adelante, hagamos un resumen de la notación. Tenemos una base de los
estados, compuesta por los kets |Hi y |V i,

. 1 . 0
|Hi = , |V i = . (4.1)
0 1

Cualquier estado de polarización se puede escribir en esa base

. 1 0 c
|ψi = cH |Hi + cV |V i , |ψi = cH + cV = H . (4.2)
0 1 cV

Vamos a usar la nueva notación hψ| ψ2 i para el producto escalar entre |ψ1 i y |ψ2 i (que no es
igual al producto escalar entre |ψ2 i y |ψ1 i). Las condiciones para que la base {|Hi , |V i} sea
ortonormal son las siguientes

hH|Hi = 1, hV |V i = 1, hH|V i = 0. (4.3)

Si tenemos dos estados arbitrarios |ψ1 i = cH |Hi + cV |V i y |ψ2 i = dH |Hi + dV |V i , el

producto escalar del primero con el segundo es igual al que definimos para vectores clásicos
de polarización,
∗ ∗ ∗ ∗
dH
hψ1 |ψ2 i = cH dH + cV dV = cH cV . (4.4)
dV
Observando esta expresión es natural definir un objeto matemático, relacionado con el |ψ1 i .
A este objeto matemático lo llamaremos bra y lo notaremos hψ1 | . Si el ket |ψ1 i se representa
por el vector
. c
|ψ1 i = H , (4.5)
cV
en la base {|Hi , |V i}, entonces el bra hψ1 | , se representa por
.
hψ1 | = c∗H c∗V = c∗H 1 0 + c∗V 0

1 . (4.6)

Esta ecuación también nos dice que la base de los objetos matemáticos que llamamos bras
está conformada por {hH| , hV |}, los cuales tienen la siguiente representación:
. .
hH| = 1 0 , hV | = 0 1 . (4.7)

El nombre de los kets y los bras fue acuñado por Dirac, de tal manera que el producto escalar
se puede escribir como bra·c·ket, que es paréntesis en inglés. Tanto el espacio de los kets como
el de los bras son espacios vectoriales cuyos escalares son los números complejos.
Los bras son, de hecho, funcionales lineales, objetos matemáticos que actúan sobre vectores
y dan como resultado un escalar (en este caso un número complejo). El hecho de que sean
lineales significa que, cuando se aplican sobre una suma de vectores, el resultado es la suma de
la aplicación del funcional a cada vector. Del párrafo anterior se desprende que los funcionales
lineales forman un espacio vectorial.
Supongamos que tenemos un haz gaussiano con polarización vertical y que interponemos
un polarizador cuyo eje de transmisión forma 45◦ con respecto a las direcciones vertical y √ ho-
rizontal, de tal manera que el vector de polarización del campo transmitido es (ex + ey ) / 2.
Si por este arreglo experimental hacemos pasar un único fotón con polarización vertical, este
pasará, será transmitido, alrededor de la mitad de las veces que hagamos el intento (con una
dispersión igual a la raı́z de ese número). Si ponemos un segundo polarizador con el mismo
eje de transmisión que el primero (45◦ con respecto a las direcciones vertical y horizontal), el
fotón será transmitido por este polarizador. Por otro lado, si el eje del segundo polarizador
4.2. ESTADOS CUÁNTICOS DE POLARIZACIÓN 63
√
apunta en la dirección de (−ex + ey ) / 2, ningún será transmitido. Merece la pena poner
nombres: diremos que el estado √ de un fotón que sea transmitido por un polarizador con eje de
transmisión eD = (ex + ey ) / 2, es |Di (diagonal), y que el estado √ de un fotón que sea trans-
mitido por un polarizador con eje de transmisión eA = (ex − ey ) / 2, es |Ai (antidiagonal).
Si un fotón se prepara en el estado |Ai , entonces nunca será transmitido por un polarizador
lineal con eje de transmisión eD . Podemos pensar, entonces, que las propiedades asociadas
con los estados |Di y |Ai son excluyentes. Ası́, los respectivos kets deben ser ortogonales,
hD|Ai = 0.
Por medio de estos experimentos hemos clasificado los fotones verticales en diagonales y
antidiagonales. Podemos pensar, por lo tanto, que los estados correspondientes serán |V, Di y
|V, Ai , respectivamente. Para terminar de convencernos de que esto es ası́, vamos a pasar los
fotones |V, Di por un polarizador vertical. Esperamos que todos los fotones sean transmitidos
por un polarizador vertical (con eje de transmisión vertical). Cuando se hace el experimento,
sin embargo, solamente alrededor de los fotones que pasaron por el polarizador diagonal
son transmitidos por el polarizador vertical. Una alternativa es pensar que el estado vertical
se puede escribir en términos de los estados diagonal y antidiagonal, como discutimos más
adelante. Veamos sin embargo porqué esta es una alternativa inquietante.
En vez de pensar en fotones, pensemos en cubos lógicos. Supongamos que una caracterı́tica
de los cubos lógicos es su forma, pero que existen solamente dos formas posibles: cuadrado
|cuadradoi y rombo |romboi. Supongamos que otra de las caracterı́sticas de los cubos lógicos
es su color y que solamente se presentan en dos colores: azul |azuli y rojo |rojoi. Entonces
la situación que analizamos en el párrafo anterior es análoga a la siguiente. De una caja de
cubo lógicos sacamos únicamente los cuadrados. Después los clasificamos por color, por lo cual
tenemos azules y rojos. Lo sorprendente es que cuando volvamos a mirar su forma no tengamos
únicamente cuadrados, ¡sino que aproximadamente la mitad son rombos! Es más. Debemos
poder escribir |cuadradoi como una combinación de |azuli y |rojoi. Tal vez el problema es que
esta formulación solamente vale para polarización. Esta discusión la hacemos más adelante.
En el caso de la polarización, no nos espanta que el estado |V i pueda escribirse en términos
de |Di y |Ai . De hecho, sabemos que eV puede escribirse en términos de eD y eA , eV =
cD eD + cA eA . Los coeficientes cD y cA pueden ser interpretados. En el capı́tulo anterior
vimos que el cuadrado del valor absoluto de dichos coeficientes corresponden a la razón entre
la irradiancia (energı́a por unidad de área por unidad de tiempo) de salida y la de entrada.
Vamos a escribir el estado |V i como |V i = c̃D |Di+c̃A |Ai. Note que no hemos asumido que los
coeficientes son exactamente los mismos. Si consideramos la existencia de paquetes de energı́a
del campo electromagnético, el cuadrado de c̃D y c̃A deberı́a corresponder a la razón entre el
número de fotones de salida y el de entrada. 2 Dado que los fotones se detectan aleatoriamente,
ese cuadrado se puede interpretar como una probabilidad: |c̃D |2 serı́a la probabilidad de que un
fotón vertical pase por un polarizador lineal con eje de transmisión diagonal y sea detectado.
En el ejemplo, las √ probabilidades son iguales a 1/2 y por lo tanto, el valor absoluto de los
coeficientes es 1/ 2. Es decir, dabemos que c̃D = √12 eiφ1 y c̃A = √12 eiφ2 . Podemos escribir

1
|V i = √ |Di + eiφ |Ai ,

(4.8)
2

en donde escogimos φ1 = 0 y φ2 = φ, teniendo en cuenta que, en el caso de campos electro-

magnéticos macroscópicos, el vector de polarización está bien definido hasta una fase global
eiα (los vectores y eiα definen la misma polarización).
El tipo de argumentación que empleamos para fotones con polarización vertical, puede
aplicarse a fotones con polarización horizontal (atravesando polarizadores diagonales y anti-
2 Merece la pena ver que estamos usando un argumento de una especie de continuidad en la interpretación

cuando vamos de campos electromagnéticos macroscópicos a campos muy débiles, correspondientes a un único
paquete de energı́a. No hay razón, sin embargo, para que los campos débiles tengan que comportarse ası́.
64 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
diagonales antes de ser detectados). El resultado final es que podemos escribir

1
|Hi = √ |Di + eiϕ |Ai .

(4.9)
2

Como |Hi y |V i corresponden a alternativas excluyentes, son ortogonales

1
0= 1 + ei(φ−ϕ) , ei(φ−ϕ) = −1, φ = ϕ + (2n + 1)π, n ∈ Z. (4.13)
2
Es común escoger ϕ = 0, n = 0 de manera que φ = π. Las expresiones para los estados
de polarización horizontal y vertical, en términos de los estados de polarización diagonal y
antidiagonal, son
1
|Hi = √ (|Di + |Ai) (4.14a)
2
1
|V i = √ (|Di − |Ai) . (4.14b)
2

EJERCICIO 42. Escriba los estados |Di y |Ai en términos de |Hi y |V i. Escriba los
vectores columna en la base de |Hi y |V i. Describa el montaje experimental correspondiente.
A partir de la ecuación (4.14) podemos encontrar

1 . 1 1
|Di = √ (|Hi + |V i) = √ , (4.15a)
2 2 1

1 . 1 1
|Ai = √ (|Hi − |V i) = √ . (4.15b)
2 2 −1
Si preparamos un fotón en el estado de polarización diagonal y lo hacemos pasar por un
polarizador con eje de transmisión horizontal (respectivamente vertical) y por un detector,
aproximadamente la mitad de las veces que lo hagamos tendremos una detección. Algo similar
ocurre con fotones con polarización antidiagonal. Las igualdades entre estados de polarización
se escogen de tal manera que sean completamente análogas a las igualdades entre vectores de
polarización.
Ası́ como es existen los polarizadores lineales, que solamente transmiten una polarización
lineal, existen los polarizadores circulares que solamente transmiten la polarización derecha,
por ejemplo.
EJERCICIO 43. Demuestre que la combinación de una placa de cuarto de onda con su
eje rápido en la dirección diagonal seguida de un polarizador horizontal y de otra placa de
cuarto de onda con su eje rápido en la dirección antidiagonal, produce un polarizador que
solamente transmite luz con polarización circular izquierda, al cual llamaremos polarizador
izquierdo. Demuestre que si cambia el polarizador horizontal por uno vertical, solamente se
trasmitirá luz con polarización circular derecha, y tendremos un polarizador derecho.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 65
Supongamos que producimos fotones con polarización derecha, |Ri , e interponemos un
polarizador derecho y un detector. Todos los fotones se detectan. En cambio, si interponemos
un polarizador izquierdo, ninguno sera detectado. Si interponemos un polarizador horizontal,
vertical, diagonal o antidiagonal, alrededor de la mitad de los fotones será detectado. Algo
similar ocurre con los fotones con polarización circular izquierda. A partir de la discusión
que tuvimos con los fotones con polarización diagonal y antidiagonal, y los polarizadores
horizontal y vertical, podemos escribir
1
√ |Hi + eiα |V i

|Ri = (4.16a)
2
1
√ |Hi + eiβ |V i ,

|Li = (4.16b)
2
en donde α = β + (2n + 1)π, en donde n es un número entero. Si escribimos |Ri y |Li en
términos de |Di y |Ai,

|Ri = a1 |Di + a2 |Ai (4.17a)

|Li = a3 |Di + a4 |Ai , (4.17b)

el cuadrado del valor absoluto de todos los coeficientes ai , i = 1, 2, 3, 4 debe ser 1/2. Tomando
el producto escalar de las igualdades (4.17) con |Di encontramos
1 1 1
a1 = hD|Ri = √ (|Hi + |V i) √ |Hi + eiα |V i = (1 + eiα ), (4.18)
2 2 2
1 1 1
= hD|Li = √ (|Hi − |V i) √ |Hi − eiβ |V i = (1 − eiβ ).

a3 (4.19)
2 2 2
Los cuadrados de los valores absolutos de estos coeficientes son
1 1 1
= |a1 |2 = ((1 + cos α)2 + sin2 α) = (2 + 2 cos α) , (4.20)
2 22 4
1 1 1
= |a3 |2 = ((1 − cos β)2 + sin2 β) = (2 − 2 cos β) . (4.21)
2 22 4
Los valores posibles, tanto de α como de β son ± π2 hasta múltiplos de 2π. Ası́, uno de los dos
ángulos debe ser −π/2 y el otro π/2. Para que las igualdades entre estados correspondan a
las igualdades entre polarizaciones, escogemos

1 . 1 1
|Ri = √ (|Hi − i |V i) = √ (4.22a)
2 2 −i

1 . 1 1
|Li = √ (|Hi + i |V i) = √ , (4.22b)
2 2 i

4.2.1. Efecto Zenón cuántico

4.3. Interferómetro de Mach-Zehnder

Volvamos a los experimentos descritos al comienzo del capı́tulo. El lector atento se pre-
guntará ¿cuál es el estado de los fotones en esos dos experimentos? Podemos ignorar todos los
detalles y decir que uno de los estados corresponde al camino izquierdo |ii, mientras el otro al
derecho |di . Teniendo en cuenta que si un fotón está, con seguridad, en el camino izquierdo, no
está en el derecho y viceversa, los estados |ii y |di deben ser ortogonales.3 Podemos imponer
3 Es posible afinar esta discusión, teniendo en cuenta que los caminos no corresponden a una lı́nea. Los

estados que estudiamos en el capı́tulo anterior, por ejemplo, corresponden a gaussianas con ancho finito.
66 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
que estos estados tengan norma uno. En este caso, es posible tener otros estados, como se ve
en el segundo experimento, en donde existen cuatro alternativas excluyentes. Sin embargo,
para los propósitos de estudiar el primer experimento, podemos pensar que el espacio de ca-
minos es bidimensional. Esta estrategia, de ignorar estados, se aplica en muchas situaciones,
aquellas en las cuales, de manera efectiva, el sistema se encuentra solamente en los estados
escogidos.

Figura 4.2: Mach-Zehnder interferómetro simétrico a la izquierda y asimétrico a la derecha.

Analicemos el montaje de la figura 4.2, conocido como interferómetro de Mach-Zehnder

[84, 85]. La parte inferior de este montaje es igual al primero que consideramos en este capı́tulo,
en donde un divisor de haz 50/50 se interpone en el camino de un haz de luz. En vez de poner
los detectores directamente a las salidas del divisor de haz, interponemos espejos en cada
uno de los haces secundarios de modo que los haces vuelven a encontrarse. En ese punto de
encuentro ponemos otro divisor de haz 50/50 y finalmente, en las salidas del divisor de haz,
ponemos los detectores. Aprovechando que en todo el montaje los estados de camino izquierdo
y camino derecho son claros, vamos a escribir el estado en esa base,

|ψi = α |ii + β |di . (4.23)

Como paso inicial, vamos a modelar los divisores balanceados de haz (50/50). El estado a
la salida del divisor depende linealmente del estado a la entrada

αout d11 d12 αin
= . (4.24)
βout d21 d22 βin

Como el divisor es balanceado, el cuadrado de los valores absolutos de los coeficientes d debe
ser 1/2. Es decir, podemos escribir

αout 1 exp(iφ11 ) exp(iφ12 ) αin
=√ . (4.25)
βout 2 exp(iφ21 ) exp(iφ22 ) βin

A partir de los análisis de ondas reflejadas y transmitidas sabemos que las ondas transmitidas
no ganan fase, mientras que las ondas reflejadas ganan una fase de π solamente cuando la
luz pasa de un material de ı́ndice de refracción bajo a uno alto, por ejemplo, cuando pasa de
aire a dieléctrico reflectivo. Vamos a suponer que los diferentes espesores de los divisores son
tales que contienen un número entero de longitudes de onda, de tal manera que no agregan
fases. Vamos a suponer que los recubrimientos dieléctricos se encuentran al lado derecho de
los divisores en la figura 4.2. Cuando pasa de aire al dieléctrico reflectivo, se gana una fase de
π; por el contrario, cuando pasa del aire al reflector, el haz reflejado no gana fase de π porque
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 67
el ı́ndice de refracción del vidrio es mayor que el del reflector. Ası́, la acción del divisor se
puede modelar mediante la siguiente igualdad

αout 1 1 1 αin
=√ . (4.26)
βout 2 1 −1 βin

Esta no es la forma más general de describir un divisor balanceado de haz, pero es la más
simple. En este caso hemos descrito un divisor balanceado pero asimétrico. En caso de te-
ner divisores simétricos, hay una diferencia de fase de π/2 entre el haz reflejado y el haz
transmitido [86, 87]. El lector puede encontrar una discusión de este tema en las referencias
[88, 89, 90, 91].
EJERCICIO 44. Haga una revisión del modelamiento de divisores de haz. Haga una pre-
sentación enfatizando tanto en que sea fácil de entender, como en su generalidad. Caracterice
un divisor de haz en el laboratorio, o al menos discuta como se podrı́a hacer.
Ahora podemos analizar el estado de la luz en este experimento. Supongamos que el
inicialmente está descrito por el ket |ψ0 i. Después, atraviesa el primer divisor balanceado. En
la base {|ii , |di} el divisor está caracterizado por la matriz que aparece en la ecuación (4.26).
De manera más abstracta, hablaremos de un operador lineal, O, que es un objeto matemático
que transforma un vector (ket) en otro vector, de manera que cumple la ecuación

O (c |ψi + d |χi) = cO(|ψi) + dO(|χi). (4.27)

En el caso del divisor de haz, emplearemos la notación Udb este operador, en donde las letras
db corresponden a divisor balanceado. El estado de la luz, después del divisor de haz, es
Udb |ψ0 i. Después del divisor tenemos unos espejos, descritos por el operador Ue ,

. −1 0
Ue = , (4.28)
0 −1

en donde hemos empleado la base {|ii , |di}. El estado, después de los espejos es Ue Udb |ψ0 i ,
y después del segundo divisor de haz

|ψf i = Udb Ue Udb |ψ0 i . (4.29)

Los operadores están ordenados de derecha a izquierda. En la base {|ii , |di} esta ecuación se
escribe ası́
αf 1 1 1 −1 0 1 1 1 α0
=√ √ . (4.30)
βf 2 1 −1 0 −1 2 1 −1 β0
Efectuando la multiplicación de las matrices, obtenemos el sorprendente resultado

αf −α0
= , (4.31)
βf −β0

es decir, el estado únicamente adquirión una fase de π. Si inicialmente el fotón estaba en el

camino izquierdo, α0 = 1, β0 = 0, tendremos que el detector izquierdo (D1 ) detecta todos los
fotones, en cuenta el derecho (D2 ) no detecta ninguno.
Otro detalle sorprendente es que el estado después del primer divisor balanceado es

1 1 1 1 1 1
√ =√ . (4.32)
2 1 −1 0 2 1
¿Cómo entendemos un estado en el que el fotón está simultáneamente en el camino izquierdo
y en el derecho?
Para que el experimento funcione como se ha descrito es muy importante que la longitud
de los brazos del interferómetro de Mach-Zehnder sean iguales hasta una pequeña fracción
68 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
de una longitud de onda, o que la diferencia entre las longitudes sea un número entero de
longitudes de onda (de nuevo, con un error que sea una pequeña fracción de una longitud
de onda). También es importante que no haya vibración de ninguno de los elementos que
conforman el divisor de haz. La parte derecha de la figura 4.2 ejemplifica una diferencia de
caminos, una fase que se introduce en el camino izquierdo, después de los espejos simétricos
(uno en el camino izquierdo y otro en el derecho). Esa fase se describe por el operador Uφ , la
cual se representa mediante la matriz
iφ
e 0
Uφ = . (4.33)
0 1
En este caso, el estado antes de los detectores es, en términos de kets y operadores, igual a

|ψf i = Udb Uφ Ue Udb |ψ0 i . (4.34)

En la base de caminos izquierdo y derecho,

iφ
αf 1 1 1 −1 0 e 0 1 1 1 1
= √ √ (4.35)
βf 2 1 −1 0 −1 0 1 2 1 −1 0
iφ iφ
! iφ
!
− 21 − e2 1
2 − 2
e
1 − 21 − e2
= eiφ iφ = eiφ
. (4.36)
1
− 12 − e2 0 1
2 − 2 2 − 2

La probabilidad de detectar un fotón en D1 es igual a la norma al cuadrado del primer

coeficiente, 12 (1 + cos φ), y la de detectar un fotón en D1 es 21 (1 − cos φ).

Figura 4.3: Interferencia en un Mach-Zehnder. Fotones detectado en cada uno de los detecto-
res.
La figura 4.3 muestra los conteos en los detectores D1 (MZ1) y D2 (MZ2). Cada canal
corresponde a una diferencia de fase de λ/250. Se ve la dependencia del número de fotones
detectados en cada detector con la diferencia de la lontidud de los brazos.
A partir de la ecuación (4.35), donde φ = 2π∆l λ , parece que no importa si la diferencia de
caminos es grande. En la práctica, especialmente, en experimentos de un fotón, esto no es ası́.
Las probabilidades de detección se convierten en 12 (1 ± V cos φ), en donde V es un número no
negativo menor que uno, que disminuye a medida que se aumenta la diferencia entre caminos.
El parámetro V se conoce como la visibilidad del patrón de interferencia, y puede obtenerse
mediante la ecuación
pmax − pmin
V = = pmax − pmin . (4.37)
pmax + pmin
Para diferencias de longitud suficientemente grandes, la probabilidad de detección en cada
detector es del 50 %. El origen fı́sico de la disminución de visibilidad es que la fase de la fuente
de fotones tiene fluctuaciones aleatorias. Si los caminos son iguales, estas fluctuaciones afectan
ambos brazos de manera idéntica; si no lo son, hay una componente aleatoria en la fase φ. En
diferentes corridas del experimento, estas fases son diferentes. Si la diferencia de caminos es
suficientemente grande, todas las fases son igualmente probables, por lo cual el valor medio
de cos φ es cero.
4.3. INTERFERÓMETRO DE MACH-ZEHNDER 69
Un problema del lenguaje empleado aquı́ es qué interfiere con qué. Un campo electro-
magnético interfiere con otro. Pero, si tenemos un único fotón no es claro qué objetos o
campos interfieren.

4.3.1. El experimento de Elitzur-Vaidman

Figura 4.4: l

En 1993 Elitzur y Vaidman [92] propusieron un experimento, realizado un par de años

después [93], para hacer una medición sin interacción. La idea de medir sin que haya interac-
ción no es nueva. Por ejemplo, si tenemos dos cajas, una de ellas con un objeto. Si abrimos
una de las cajas, sin encontrar dicho objeto, sabemos que está en la otra caja.
Supongamos que un fabricante produce bombas que se activan con la absorción de un
único fotón. Debido a problemas de manufactura, el gatillo activado por el sensor de luz (de
un fotón) no funciona en una fracción de las bombas. Los fotones atraviesan el sensor sin
ser detectados. Se quieren encontrar las bombas que funcionan. Sin embargo, si se prueban
y explotan, nos quedamos sin bombas funcionales. Como un único fotón harı́a explotar las
bombas reales, esta parece una misión imposible.
Se propone, sin embargo, el esquema de la figura 4.4, en donde la bomba se sitúa en uno
de los brazos de un interferómetro. Si la bomba es real, hay un 50 % de probabilidad de que
sea detectada por el sensor y haga explotar la bomba. En el 50 % de los casos en los que
no explota, el fotón se detecta en D1 o en D2 , más precisamente, en (cerca de) 25 % de los
casos se detecta en D1 y en los otros 25 %, en D2 . Si la bomba no funciona, hay interferencia
y la bomba se detecta en D1 únicamente. Es decir, si hay detección en D2 , sabemos que
la bomba es funcional, sin explotarla. Si hay detección en D1 no sabemos si la bomba es
funcional. Pasando otro fotón tendremos un 25 % del 25 % de probabilidad de verificar que
es una bomba funcional y 25 % del 25 % de continuar sin saber. Repitiendo este proceso,
tendremos una probabilidad de encontrar bombas funcionales sin explotarlas de
2 3
1 1 1 1/4 1
p= + + + ··· = 1 = 3. (4.38)
4 4 4 1− 4

En el artı́culo [93] se muestra que la fracción de bombas que se pueden verificar, sin explotarlas,
se puede aproximar al 100 %, usando el efecto Zenón cuántico.

4.3.2. Experimento de elección postergada

Wheeler [94] propuso un experimento (una serie de experimentos) que es una variante del
interferómetro de Mach-Zehnder, en el cual la decisión de poner o quitar el segundo divisor
70 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
de haz se toma después de que el fotón ya ha pasado por el primer divisor. La detección en
D1 o D2 ocurre según la decisión que se tomó, como si se hubiese tomado al comienzo del
experimento.
Descrito de la manera en la que aparece en el párrafo anterior, no lo encontramos ex-
traordinario. El experimento se vuelve sorprendente solamente después de que introducimos
una interpretación clásica diferente para el interferómetro completo de la que tenemos para el
experimento con un único divisor de haz. La retórica consiste en decir que en el primer caso el
fotón se comporta como una onda en el primer caso porque exhibe interferencia, mientras que
en el segundo caso se comporta como una partı́cula, y que esa decisión debe tomarse cuando
se atraviesa el primer divisor de haz. Para aumentar el dramatismo podemos pensar que los
brazos del interferómetro son muy largos; incluso más que la dimensión lineal tı́pica de una
galaxia (en un experimento que usa lentes gravitacionales). Usando ese lenguaje llegamos a la
conclusión de que cuando el fotón llega al lugar en donde hay (o no) segundo divisor de haz,
el cual se puso después de que el fotón atravesara el primero, manda una señal hacia atrás en
el tiempo para corregir la elección, en caso de que esta no hubiese sido la “correcta”. Incluso
existe una formulación de la mecánica cuántica que tiene una propagación hacia el futuro y
otra hacia el pasado.
Los resultados de este experimento en un interferómetro de Mach-Zehnder se reportan en
la referencia [95].

4.4. Borrador cuántico

Figura 4.5: l

El denominado borrador cuántico, originalmente debido a Scully y Drühl[96], es una de

las variaciones más sorprendentes del interferómetro de Mach-Zehnder. En el experimento
ilustrado en la figura 4.5 [97] se aprovechan tanto el camino del fotón, como la polarización.
Empleamos la lı́nea formada al unir los divisores de haz para caracterizar los estados de
4.4. BORRADOR CUÁNTICO 71
camino: el superior |si, por encima y el inferior |ii, por debajo de dicha lı́nea. El montaje
comienza con un polarizador cuyo eje de transmisión es el diagonal, de manera que el estado de
los fotones que entran al primer divisor de haz corresponde al camino superior y polarización
diagonal, |s, Di . Como tenemos esas dos caracterı́sticas, debemos ver qué pasa con cada una
en cada paso del experimento. En el primer divisor de haz solamente se altera el estado de
camino. Como el lado del dieléctrico es el del camino superior, este gan una fase de π; es decir,
el estado después del primer divisor es
1
√ (− |s, Di + |i, Di) . (4.39)
2
Enseguida, el camino inferior encuentra un polarizador lineal vertical. Teniendo en cuenta que
|Di = √12 (|Hi + |V i) , el estado después del polarizador es

1 1
√ − |s, Di + √ |i, V i . (4.40)
2 2
Luego, los dos espejos producen una fase de π en cada uno de los caminos,

1 1
√ |s, Di − √ |i, V i . (4.41)
2 2
El siguiente elemento es un polarizador lineal en el camino superior. De nuevo, teniendo en
cuenta que |Di = √12 (|Hi + |V i) , podemos escribir el estado como

1 1 1 1
√ √ |s, Hi − √ |i, V i = (|s, Hi − |i, V i) . (4.42)
2 2 2 2

La norma al cuadrado de este estado es (1/2)2 + (1/2)2 = 1/2, porque las propiedades de
camino superior y camino inferior son excluyentes (también puede verse desde el punto de
vista de que polarización horizontal y vertical son excluyentes). Esto significa que hemos
perdido la mitad de los fotones. Volvamos a normalizar el estado,
1
√ (|s, Hi − |i, V i) . (4.43)
2
En el segundo divisor balanceado se debe tenr en cuenta que el haz reflejado por el camino
inferior gana una fase de π,
1
|ii → √ (− |ii + |si) . (4.44)
2
Por su parte, el estado superior se transforma ası́:
1
|si → √ (|si + |ii) . (4.45)
2
Si tenemos en cuenta la polarización, vemos que el efecto del segundo polarizador se describe
mediante las ecuaciones
1 1
|s, Hi → √ (|s, Hi + |i, Hi) , |i, V i → √ (− |i, V i + |s, V i) . (4.46)
2 2
El estado de los fotones, después del segundo divisor es, entonces

1 1 1 1
√ √ (|s, Hi + |i, Hi) − √ (− |i, V i + |s, V i) = (|s, Hi − |s, V i + |i, Hi + |i, V i) .
2 2 2 2
(4.47)
72 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Vamos a suponer que después del segundo divisor de haz tenemos los detectores. Ds detecta
si los fotones del camino superior, independientemente de que tengan polarización horizontal
o vertical. La probabilidad de que un fotón sea detectado en Ds es (1/2)2 + (1/2)2 = 1/2.
De manera análoga se puede ver que la probabilidad de que se detecte un fotón en el camino
inferior es 1/2.
Hasta ahora no tuvimos en cuenta el piezoeléctrico. Este elemento permite ajustes submi-
crométricos de la posición del espejo correspondiente y produce una diferencia de la longitud
del brazo superior del interferómetro con respecto al brazo inferior. Es decir, podemos pensar
que el espejo no produce una fase de π sino una fase −eiφ .
EJERCICIO 45. Demuestre que teniendo en cuenta esa fase el estado después del segundo
divisor de haz es
1 iφ
e |s, Hi − |s, V i + eiφ |i, Hi + |i, V i

2
y que las probabilidades de detección siguen siendo iguales a 1/2.
¿Porqué la probabilidad no varı́a con la diferencia de fase φ cómo en el interferómetro de
Mach-Zehnder original?
En este caso sabemos que las componentes con polarización horizontal vienen del camino
superior y aquellas con polarización vertical, del inferior. Como podemos distinguir cuál fue
el camino empleado por los fotones, no hay interferencia. Se dice que la polarización marca
los caminos. ¿Podemos borrar la información de los caminos y ver un patrón de interferencia?
Antes del detector Di pongamos un polarizador diagonal. Teniendo en cuenta nuevamente
que |Di = √12 (|Hi + |V i) , vemos que el estado después del polarizador es

1 iφ 1 iφ

e |s, Hi − |s, V i + √ e |i, Di + |i, Di .
2 2
La probabilidad de detección en Di es, por lo tanto,
2
1 1
√ ((eiφ + 1) = 1 (1 + cos φ).

2 2 (4.48)
4
Vemos que se recupera el patrón de interferencia, pero con una amplitud menor.

4.5. Ejercicios de taller

1. Suponga que un haz de luz polarizado circularmente a izquierda incide sobre un po-
larizador lineal cuyo eje de transmisión forma un ángulo θ con la horizontal. ¿Cuál es
la probabilidad de que un fotón de dicho haz sea absorbido por el polarizador? ¿Su
respuesta depende del ángulo θ?
2. Cuando un campo eléctrico atraviesa una placa de un cuarto de onda, la componente
lenta gana una fase de π/2 con respecto a la componente rápida. Cuando el campo
atraviesa una placa de media onda, la componente lenta gana una fase de π con respecto
a la componente rápida. Suponga un aparato que consiste de una placa de media onda
con su eje rápido a +22.5◦ de la horizontal, una placa de un cuarto de onda con su eje
rápido en la dirección de la vertical, y una placa de cuarto de onda con su eje rápido
a +45◦ de la horizontal. Encuentre la matriz que representa este aparato. Si un haz de
luz polarizada horizontalmente incide en este aparato, ¿cuál es la polarización del haz
saliente? ¿Cuál es la probabilidad de que un fotón polarizado horizontalmente atraviese
el aparato? ¿Cuál es su polarización final?
3. Demuestre que si un fotón con polarización circular derecha pasa por una placa de
media onda su nueva polarización es circular izquierda, independientemente de cual es
la dirección del eje rápido de la placa.
4.5. EJERCICIOS DE TALLER 73
4. Un aparato consiste de una placa de media onda cuyo eje rápido forma un ángulo θ1
con la horizontal, un polarizador vertical, y una placa de media onda cuyo eje rápido
forma un ángulo θ2 con la horizontal. ¿En qué condiciones este aparato es indistinguible
de un polarizador lineal cuyo eje de transmisión forma un ángulo θ con la horizontal?
¿Cómo cambiarı́an sus respuestas si el polarizador intermedio fuese horizontal?
5. Suponga que tiene un (PBD) Polarizing Beam Displacer que separa la componente
vertical de la horizontal. ¿Cómo puede convertir este aparato en uno que separe la
componente diagonal de la antidiagonal?

6. Diseñe un experimento, o conjunto de experimentos que permitan medir la polarización

de un haz de luz.
7. Demuestre que no existe un vector de polarización que se pueda asociar con luz polari-
zada aleatoriamente.

from wikipedia ([Link] solutions using

rigorous coupled-wave analysis for wire grid polarizers have shown that for electric field com-
ponents perpendicular to the wires, the medium behaves like a dielectric, and for electric
field components parallel to the wires, the medium behaves like a metal (reflective). Yu, X.
J.; Kwok, H. S. (2003). “Optical wire-grid polarizers at oblique angles of incidence”. Journal
of Applied Physics. 93 (8): 4407. Bibcode:2003JAP....93.4407Y. doi:10.1063/1.1559937. ISSN
0021-8979.
74 CAPÍTULO 4. POLARIZACIÓN: DESCRIPCIÓN CUÁNTICA
Capı́tulo 5

Teorı́a del momento angular

5.1. Introducción
Durante el desarrollo del curso hemos pasado de la polarización, en la cual se puede
usar un formalismo matemático bastante parecido tanto en el dominio clásico como en el
cuántico, al estudio de otros sistemas de dos niveles y a sistemas caracterizados por un grado
de libertad con espectro continuo (sistemas en una dimensión), incluyendo la partı́cula libre,
un pozo cuadrado infinito y el oscilador armónico. A pesar de que se podrı́an estudiar sistemas
de dos grados espaciales de libertad, lo usual es pasar a dimensión 3. De hecho, cuando
estudiamos el pozo infinito de potencial, estudiamos un sistema tridimensional. Entre los
sistemas tridimensionales arquetı́picos se encuentran aquelos problemas con fuerzas centrales.
Para hacer ese estudio es conveniente haber estudiado el momento angular. Ese es el propósito
de este capı́tulo.
Existen dos puntos de partida comunes para estudiar el momento angular: aquél propuesto
por la cuantización canónica y aquél que tiene que ver con las simetrı́as. En el primer abor-
daje, los operadores de posición y momento se substituyen por sus contrapartidas cuánticas.
En el segundo, se identifican los generadores de las simetrı́as espacio-temporales y se les dan
los mismos nombres a los generadores de las mismas simetrı́as. Es claro que los generadores
cuánticos actúan en un espacio diferente, el espacio de Hilbert, a aquél en que actúan los
genradores clásicos (en nuestro curso, el espacio euclı́deo tridimensional más el tiempo, supo-
niendo que el grupo de simetrı́as es el de Galileo). Las simetrı́as del grupo de Galileo incluyen
las rotaciones y las traslaciones espaciales y temporales, además de los cambios de un sistema
de referencia inercial a otro. En la siguiente sección examinamos las rotaciones e identificamos
los generadores de las mismas. Estos generadores son las componentes del momento angular.

5.2. Rotaciones
Una rotación ocurre cuando giramos algún objeto por un ángulo alrededor de un eje. Es fácil
de descubrir que las rotaciones finitas no son conmutativas. Tome un objeto que no posea ni
simetrı́a cúbica ni simetrı́a esférica; por ejemplo, el libro de la figura 5.1. Como se muestra
en la figura, el eje y apunta hacia arriba y ele eje z hacia la derecha, el eje x apunta entrando
a la figura. La posición final del objeto si lo hacemos girar primero por un ángulo de π/2
alrededor del eje x y luego por un ángulo de π/2 alrededor del eje y es diferente de la posición
final del objeto si lo hacemos girar primero por un ángulo de π/2 alrededor del eje y y luego
por un ángulo de π/2 alrededor del eje x.
Cuando rotamos un objeto estamos haciendo transformaciones activas. También podemos
hacer transformaciones pasivas si rotamos los ejes que describen la posición del objeto, pero

75
76 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR

Figura 5.1: Rotación de un libro alrededor de los ejes x e y, o alrededor de los ejes y y x.

dejando que el objeto mismo permanezca fijo.

Si un punto genérico de un cuerpo rı́gido tiene coordenadas (x, y, z) y sufre una rotación
por un ángulo φ alrededor del eje z, mostramos enseguida que las nuevas coordenadas de tal
punto genérico (x0 , y 0 , z 0 ) son
 0    
x x cos φ sin φ 0
y 0  = Rz (φ) y  , ⇒ − sin φ cos φ 0 = Rz (φ). (5.1)
z0 z 0 0 1

Designamos la rotación por un ángulo φ alrededor del eje z por Rz (φ) y a su representación
en el espacio tridimensional por Rz (φ). Enseguida mostramos como obtener la matriz de
rotación Rz (φ), empleando la figura 5.2.

Figura 5.2: Rotación de un punto alrededor del eje z por un ángulo ϕ.

Como la coordenada z no cambia nos concentraremos en la coordenadas (x, y). Si las

coordenadas iniciales del punto eran (x, y) = r(cos θ, sin θ), después de la rotación serán

(x0 , y 0 ) = r(cos(θ + ϕ), sin(θ + ϕ))

= r(cos θ cos ϕ − sin θ sin ϕ, sin θ cos ϕ + cos θ sin ϕ)
= (x cos ϕ − y sin ϕ, y cos ϕ + x sin ϕ).

Si juntamos la ecuación z 0 = z y escribimos el sistema de ecuaciones en forma matricial

llegaremos a la ecuación (5.1). Para describir las rotaciones sobre el eje x y el eje y tenemos
5.3. TEORÍA DEL MOMENTO ANGULAR 77
0 0 0
expresiones similares a la señalada en (5.1), reordenando x, y, z y x , y , z en forma cı́clica, a
saber    
cos φ 0 sin φ 1 0 0
Ry (φ) =  0 1 0 , Rx (φ) = 0 cos φ − sin φ . (5.2)
− sin φ 0 cos φ 0 sin φ cos φ
Para un ángulo infinitesimal y empleando expansiones hasta segundo orden tenemos que
la matriz correspondiente a una rotación infinitesimal alrededor del eje y seguida por una
rotación infinitesimal alrededor del eje x es

1 − 2 /2 0
  
1 0 0
Rx () Ry () = 0 1 − 2 /2 −   0 1 0 
2 2
0 1 − /2 − 0 1 − /2
2 2
 
1 − /2
= 0 1 − 2 /2 −  ,
− 1 − 2

De manera semejante, la matriz correspondiente a las misma rotaciones infinitesimales, en el

orden contrario es
1 − 2 /2 0
  
1 0 0
Rx () Ry () =  0 1 0  0 1 − 2 /2 − 
2
− 0 1 − /2 0 1 − 2 /2
1 − 2 /2
 
0
=  2 1 − 2 /2 −  .
− 1 − 2

De esta manera se tiene que la diferencia entre las matrices correspondientes a las rotaciones
es
−2 0 1 −2 0
     
0 1 0 0
Rx () Ry () − Ry () Rx () = −2 0 0 = 2 1 0 − 0 1 0 . (5.3)
0 0 0 0 0 1 0 0 1

Ahora, una rotación infinitesimal por un ángulo 2 alrededor del eje z, hasta segundo orden
en está representada por la matriz

−2 0
 
1
Rz (2 ) = −2 1 0 . (5.4)
0 0 1

Finalmente, sustituyendo (5.4) en (5.3), obtenemos la relación de conmutación para las rota-
ciones infinitesimales
[Rx (), Ry ()] = Rz (2 ) − I. (5.5)

5.3. Teorı́a del momento angular

Las rotaciones son operaciones fı́sicas. A cada operación fı́sica le asignamos un sı́mbolo, una
representación matemática. En el caso del espacio tridimensional real la representación se
realiza empleando matrices de rotación R, tal y como lo hemos hecho en la sección anterior.
En el caso del espacio de Hilbert podemos definir un operador asociado a la rotación D(R), b
tal que aplicado sobre un ket represente una transformación de este tipo. Es decir, si el estado
del sistema antes de realizar la rotación es |ψi, en tanto que el estado del sistema después de
realizar la rotación es |ψ 0 i, entonces |ψ 0 i = D(R)
b |ψi . Si, en particular, la rotación es de un
78 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
ángulo φ alrededor del eje z, |ψi el estado antes de la rotación está relacionado con |ψ 0 i el
estado después de la rotación, mediante la igualdad

|ψ 0 i = D(R
b z (φ)) |ψi . (5.6)

Para hacer una rotación por un ángulo φ alrededor del eje z podemos hacer N rotaciones por
un ángulo de φ/N alrededor del eje z. Si el ángulo es suficientemente pequeño el operador de
la rotación debe ser cercano al operador identidad I. b La desviación del operador identidad
debe ser proporcional al ángulo recorrido, en este caso φ/N y a un operador, Jbz en este caso.
En sı́mbolos tenemos
N N
D(R
b z (φ)) = D b Rz φ ∼ i
= Ib − Jbz
φ
. (5.7)
N ~ N
Hemos introducido una constante con unidades de momento angular: la constante de Planck
~. Su valor solamente puede determinarse experimentalmente. Esta constante es la misma
constante que aparece en la relación de conmutación canónica de posición y momento [x̂, p̂x ] =
i~. Al operador Jbz lo identificamos como el generador de las rotaciones en torno al eje z. La
igualdad entre las partes izquierda y derecha de la ecuación (5.7) se obtiene en el lı́mite en
que se tienen “infinitas rotaciones infinitesimales”,
N
i b φ i b
D(Rz (φ)) = lı́m I − Jz
b b = exp − Jz φ .
N →∞ ~ N ~

Para que el operador D(R

b z (φ)) sea unitario, es necesario que el operador Jbz sea hermı́tico.
EJERCICIO 46. Demuestre la afirmación anterior. Sugerencia: puede ser más fácil hacer
la demostración para transformaciones infinitesimales.
En el caso de una rotación por un ángulo φ alrededor del eje n obtenemos

b n (φ)) = exp − i J
D(R b · nφ , (5.8)
~

en donde J
b = Jbx i + Jby j + Jbz k y n es un vector de longitud 1.
Una condición importante que se exige de los operadores que representan las rotaciones es
que deben satisfacer las mismas relaciones que las matrices de rotación. En particular, estos
operadores deben satisfacer la relación de conmutación
h i
D(R
b x ()), D(R b z (2 )) − D(I).
b y ()) = D(R b

Si empleamos la forma infinitesimal de los operadores de rotación, (5.7), y tenemos en cuenta

hasta los términos cuadráticos en , sigue

i b 1 b2 2 b i b 1 b2 2 i
I − Jx − 2 Jx , I − Jy − 2 Jx = Ib − Jbz 2 − Ib
b
~ 2~ ~ 2~ ~
2 h i i
i
− Jbx , Jby = − Jbz .
~ ~
De esta forma se tiene la relación de conmutación
h i
Jbx , Jby = i~Jbz . (5.9)

Haciendo permutaciones cı́clicas de los ı́ndices (x → y → z → x ) también se cumplen las

relaciones de conmutación
h i h i
Jby , Jbz = i~Jbx , Jbz , Jbx = i~Jby . (5.10)
5.3. TEORÍA DEL MOMENTO ANGULAR 79
Podemos juntar las relaciones de conmutación (5.9) y (5.10) en la forma compacta,
h i
Jbi , Jbj = i~ijk Jbk . (5.11)

En la ecuación (5.11) empleamos

h i la Pconvención de suma sobre ı́ndices repetidos (es decir,
podrı́amos haber escrito Ji , Jj = i~
b b ijk Jbk ) y el tensor totalmente antisimétrico de Levi-
k
Civita, 
1
 si ijk es una permutación cı́clica de 123,
ijk = −1 si ijk es una permutación cı́clica de 321,

0 en otro caso.


5.3.1. Representaciones irreducibles (Irreps)

Existen muchas maneras de cumplir las relaciones de conmutación para los generadores del
momento angular. Por ejemplo, usando matrices 2×2, matrices 3×3, etc. Para caracterizar una
manera particular de cumplir las relaciones de conmutación (por ejemplo de las rotaciones)
suelen emplearse operadores de Casimir, que son no lineales en los generadores del grupo. En
el caso de las rotaciones tenemos solamente un operador de Casimir, a saber

Jb2 = Jbx2 + Jby2 + Jbz2 .

Veamos que el operador J 2 conmuta con el operador Jz .

h i h i h i h i h i
Jb2 , Jbz = Jbx Jbx , Jbz + Jbx , Jbz Jbx + Jby Jby , Jbz + Jby , Jbz Jby

= −i~Jbx Jby − i~Jby Jbx + i~Jby Jbx + i~Jbx Jby = b

0. (5.12)

EJERCICIO 47. Demuestre que J 2 conmuta con los generadores de las rotaciones alre-
dedor de los ejes coordenados x e y.
De manera semejante a lo que hicimos en el caso del oscilador armónico, definimos los
siguientes operadores escalera
†
Jb± = Jbx ± iJby = Jb∓ . (5.13)
Debido a que los operadores escalera en la ecuación anterior son combinaciones lineales de los
generadores de las rotaciones, ellos conmutan con el operador de Casimir:
h i
Jb2 , Jb± = b
0. (5.14)

Por otro lado, los operadores escalera no conmutan con el operador Jbz ,
h i h i h i
Jbz , Jb± = Jbz , Jbx ± i Jbz , Jby = i~Jby ± i(−i~Jbx )

= i~Jby ± ~Jbx = ±~(Jbx ± iJby ) = ±~Jb± . (5.15)

Los signos superior e inferior de la ecuación (5.15) son independientes, y ası́, deben leerse dos
ecuaciones independientes de conmutación.
Es importante recordar que operadores que conmutan tienen un conjunto completo de
autovectores comunes.
EJERCICIO 48. Demostrar la afirmación anterior.
EJERCICIO 49. Demostrar que si dos operadores no conmutan, entonces no poseen un
conjunto completo de autoestados comunes. Sugerencia: Pruebe por contradicción. Demuestre
dos operadores que tienen un conjunto completo de autoestados comunes deben conmutar.
Se dice que los operadores Jb2 y Jbz son compatibles porque conmutan entre sı́. Teniendo
en cuenta que J 2 y Jz son compatibles, sabemos que existen estados que son autoestados de
80 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
ambos operadores. Podemos escribir las ecuaciones de autovalores de los operadores cuadrado
del momento angular,J 2 , y de proyección del momento angular alrededor del eje z, Jz , en la
forma

Jb2 |j2 , jz i = j2 |j2 , jz i

Jbz |j2 , jz i = jz |j2 , jz i . (5.16)

Hemos supuesto que el autovalor de J 2 es j2 y que el autovalor de Jz es jz . En el caso del

oscilador armónico, demostramos que si el estado |ni es autoestado del operador número â† â
con autovalor n, entonces el estado â |ni también es autoestado del operador número â† â pero
que su autovalor es n−1. Para entender la acción de los operadores escalera los hacemos actuar
sobre un vector propio del cuadrado del momento angular y de la proyección del momento
angular sobre el eje z. Por ejemplo, calculemos

En la secuencia de igualdades hemos utilizado varias propiedades matemáticas, tales como

que aplicar un operador Jb2 al vector definido por la aplicación del operador Jb+ al vector
|j2 , jz i es equivalente a aplicar el operador producto Jb2 Jb+ al vector |j2 , jz i. Una importante
propiedad que se utilizó es que, como el operador de Casimir Jb2 conmuta con cada una de
las componentes del momento angular, también conmutan con las combinaciones lineales de
las mismas; en particular, con Jb+ . Veamos que definiendo el vector |χi = Jb+ |j2 , jz i , podemos
escribir la ecuación anterior como

Jb2 |χi = j2 |χi . (5.18)

Esta igualdad nos deja claro que el vector |χi es autovector de Jb2 con autovalor j2 ; es decir,
tanto Jb+ |j2 , jz i como |j2 , jz i poseen el mismo autovalores del cuadrado del momento angular.
La demostración de que el operador de bajada Jb− tampoco altera el autovalor de Jb2 es
cmpletamente análoga.
Cuando se aplica un operador arbitrario a un autoestado de la tercera componente del
momento angular, Jbz , el resultado debe ser, en general, una combinación lineal de todos
los autoestados de Jbz . Los operadores escalera, sin embargo, se definen de manera que su
aplicación sobre un autoestado de Jbz conduzca a otro autoestado del mismo operador. En
efecto, veamos las siguientes igualdades

Jbz (Jb± |j2 , jz i) = (Jbz Jb± ) |j2 , jz i = Jbz Jb± − Jb± Jbz + Jb± Jbz |j2 , jz i
h i
= Jbz , Jb± + Jb± Jbz |j2 , jz i = ±~Jb± ± jz Jb± |j2 , jz i

= (jz ± ~)(Jb± |j2 , jz i). (5.19)

La ecuación (5.19) indica que si aplicamos el operador escalera Jb+ a un autovector de Jbz se
obtiene un nuevo vector, Jb+ |j2 , jz i, que también es autovector de Jbz , con un autovalor que es
~ mayor que el autovalor del vector original. Por esta razón, al operador Jb+ se le denomina
operador de subida. De manera completamente análoga, la aplicación del operador Jb− sobre
un autovector de Jbz produce un nuevo autovector de que Jbz con un autovalor ~ menor que
el vector original. Por esta razón, al operador J− se le conoce como operador de bajada.
Merece la pena mencionar que, si el autoestado original |j2 , jz i está normalizado a la unidad,
k |j2 , jz i k2 = 1, el nuevo autovector Jb+ |j2 , jz i tendrá una norma que, en general, será diferente
de la unidad.
5.3. TEORÍA DEL MOMENTO ANGULAR 81
Ahora veamos que el valor esperado de J − Jz en uno de los autoestados comunes de Jb2
b2 b2

y de Jbz ,
hj2 , jz | (Jb2 − Jbz2 ) |j2 , jz i = hj2 , jz | (j2 − j2z ) |j2 , jz i = (j2 − j2z ), (5.20)
también puede escribirse como

muestra que existe un valor máximo de jz , al cual designaremos por jzmax , y un valor mı́nimo
de jz , al cual designaremos por jzmin . Para los autovectores correspondientes a los valores
mı́nimo y máximo de Jbz , la proyección del momento angular alrededor del eje z, se deben
cumplir las igualdades

Jb+ |j2 , jzmax i = 0, y Jb− |j2 , jzmin i = 0, (5.23)

ya que no pueden existir autovectores con autovalor de Jbz mayor que jzmax , ni autovectores
con autovalor de Jbz menor que jzmin .
Vamos a ver que jzmax y jzmin pueden relacionarse con j2 . Para tanto calculamos los
productos de los operadores escalera

Jb± Jb∓ = (Jbx ± iJby )(Jbx ∓ iJby ) = Jbx2 + Jby2 ± i Jby Jbx − Jbx Jby
h i
= Jbx2 + Jby2 + Jbz2 − Jbz2 ± i Jby , Jbx = Jb2 − Jbz2 ± ~Jbz , (5.24)

en donde se ha tenido en cuenta que [Jby , Jbx ] = −i~Jbz .

Si le aplicamos el operador de subida a la ecuación del lado izquierdo de (5.23)

Jb− Jb+ |j2 , jzmax i = 0, (5.25)

y empleamos la identidad (5.24), llegamos a

(Jb2 − Jbz2 − ~Jbz ) |j2 , jzmax i = (j2 − j2zmax − ~jzmax ) |j2 , jzmax i = 0

De aquı́ encontramos la relación deseada entre j2 y jzmax , a saber,

j2 = jzmax (jzmax + ~).

Por otro lado, si le aplicamos el operador de subida a la ecuación del lado derecho de (5.23)

Jb+ Jb− |j2 , jzmin i = 0, (5.26)

y empleamos la identidad (5.24), llegamos a

(Jb2 − Jbz2 + ~Jbz ) |j2 , jzmin i = (j2 − j2zmin + ~jzmin ) |j2 , jzmin i = 0

De aquı́ encontramos que

j2 = jzmin (jzmin − ~).
82 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR

Figura 5.3: Entre jzmin y jzmax hay un número entero de pasos, cada uno correspondiente al
aumentar el autovalor en ~.

Si multiplicamos cada uno de los factores del lado derecho por −1, esta ecuación se puede
escribir como
j2 = −jzmin (−jzmin + ~).
Comparando j2 = jzmax (jzmax + ~) con j2 = −jzmin (−jzmin + ~) vemos que jzmin = −jzmax .
De hecho, existe otra solución: jzmax = jzmin − ~. Esta segunda solución es inválida, porque
implica que jzmax < jzmin , contrariamente a la suposición que se hizo.
Si comenzamos con el vector cuyo valor de momento angular alrededor de z es mı́nimo,
después de aplicar el operador de subida un número entero de veces, digamos n, finalmente
obtenemos el ket cuyo momento angular alrededor de z es máximo, de tal suerte que
n
jzmax = (−jzmax ) + n~ ⇒ jzmax = ~. (5.27)
2

Concluimos que el valor máximo de Jbz corresponde a un múltiplo entero de la mitad de la

constante de Planck.
En general, los autovalores del cuadrado del momento angular y de la componente del
momento angular en la dirección del eje z no se usan para rotular los autovectores comunes
entre ellos. En vez de estos se usan dos rótulos adimensionales, j = n/2 y jz = −j, −j +
1, ..., j − 1, j. Las ecuaciones de autovalores, en términos de j y jz quedan

Jb2 |j, jz i = ~2 j(j + 1) |j, jz i , (5.28)

Jbz |j, jz i = ~jz |j, jz i . (5.29)

La ecuación (5.19), en términos de los nuevos rótulos, muestra que el vector Jb+ |j, jz i es un
autovector de los operadores Jb2 y Jbz con autovalores ~2 j(j + 1) y ~(jz + 1) respectivamente.
De manera similar, el vector Jb+ |j, jz i tiene autovalores ~2 j(j + 1) y ~(jz − 1).

Figura 5.4: Modelo vectorial de los autoestados de Jb2 y Jbz .

En la figura 5.4 se ilustra elpmodelo vectorial de los autoestados comunes de Jb2 y Jbz .
Tenemos una esfera de radio ~ j(j + 1) y planos correspondientes a jz = n~, con n =
5.3. TEORÍA DEL MOMENTO ANGULAR 83
−2, · · · , 2. De esta manera, cada estado corresponderı́a a un cı́rculo, tal como se muestra en
la figura. Los valores de las componentes x e y del momento angular no estarı́an, por lo tanto,
bien definidos.
Si suponemos que los estados |j, jz i están normalizados a la unidad, los vectores Jb± |j, jz i
no lo estarán. Ası́, podemos escribir

hj, jz | Jb− = N ∗ hj, jz + 1| ,

D.C.
Jb+ |j, jz i = N |j, jz + 1i −→

en donde N es una constante de normalización. La letras D.C. se refieren al dual conjugado,

o hermitiano conjugado. Para determinar el valor de N multiplicamos ambas expresiones y
obtenemos

hj, jz | Jb− Jb+ |j, jz i = N N ∗ hj, jz + 1 | j, jz + 1i = |N |2

= hj, jz | Jb2 − Jbz2 − ~Jbz |j, jz i
= ~2 j(j + 1) − ~2 jz2 − ~2 jz
= ~2 j(j + 1) − jz2 − jz

= ~2 (j(j + 1) − jz (jz + 1)).

En la derivación anterior empleamos la ecuación (5.24). Si definimos N como la raı́z real

positiva de ~2 (j(j + 1) − jz (jz + 1)) tendremos
p
Jb+ |j, jz i = ~ (j(j + 1) − jz (jz + 1)) |j, jz + 1i . (5.30)

EJERCICIO 50. Mostrar que

p
Jb− |j, jz i = ~ (j(j + 1) + jz (jz − 1)) |j, jz − 1i . (5.31)

Teniendo en cuenta que j 2 + j − jz2 − jz = (j − jz )(j + jz + 1), podemos escribir la acción

de los operadores escalera sobre un autovector de Jb2 y de Jbz como
p
Jb± |j, jz i = ~ (j ∓ jz )(j + ±jz + 1) |j, jz ± 1i . (5.32)

Ejemplo
Si suponemos que j = 1/2, los valores posibles de Jbz serán jz = −1/2 y jz = 1/2. Ası́, los
autoestados simultáneos de Jb2 y de Jbz son dos: |1/2, 1/2i y |−1/2, 1/2i.
Podemos encontrar una representación del operador Jbz haciéndolo actuar sobre un operator
identidad, ası́:

1 1 1 1 1 1 1 1
Jz I = Jz , −
b b b ,− + , ,
2 2 2 2 2 2 2 2

~ 1 1 1 1 ~ 1 1 1 1
= − ,− ,− + , , .
2 2 2 2 2 22 2 2 2

La forma matricial del operador Jbz , en la base de sus autovectores, se consigue escribiendo el
resultado anterior como

1 1 
2, 2
~
1 1 1 1 0
Jbz = , ,− 2  
2 2 2 2 0 ~2
1 1
2 , − 2

Para encontrar la representación del operador Jbz , recordamos que es una combinación
lineal de los operadores de subida y de bajada Jbz = 1/2(Jb+ + Jb− ) y lo aplicamos a un operador
84 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
identidad

1 1 1 1 1 1 1 1
Jbx = Jb+ , − ,− + , ,
2 2 2 2 2 2 2 2

1 1 1 1 1 1
1 1
+Jb− , − ,− + , ,
2 2 2 2 2 2 2 2
s
~ 1 1 1 1 1 1 1 1
= − − + − + 1 , − + 1 ,−
2 2 2 2 2 2 2 2 2
s
1 1 1 1 1 1 1 1
+~ + − + 1 , −1 ,
2 2 2 2 2 2 2 2

~ 1 1 1 1 ~ 1 1 1 1
= , , − + , − , .
22 2 2 2 22 2 2 2

Los dos términos que no se escribieron explı́citamente son ambos cero: uno porque corresponde
al operador de subida actuando sobre el estado con máximo valor de proyección de momento
angular; el otro porque corresponde al operador de bajada actuando sobre el estado con
mı́nimo valor de proyección de momento angular.
EJERCICIO 51. Usando la misma técnica que empleamos para hallar la representación
matricial de Jbz en la base de sus autovectores, encuentre las representaciones matriciales de
Jbx y de Jby en la base de los autovectores de Jbz .

. ~ 1 0 . ~ 0 1 . ~ 0 −i
Jbz = Jbx = Jby = . (5.33)
2 0 −1 2 1 0 2 i 0

EJERCICIO 52. De manera semejante al ejemplo, construya las representaciones ma-

triciales de los operadores Jbx , Jby y Jbz para j = 3/2. También encuentre la representación
matricial de Jb2 .

5.4. Momento angular orbital

Mencionamos, en la introducción, que un punto de partida común para el estudio del momen-
to angular en el formalismo cuántico es la cuantixación canónica. Teniendo en cuenta que el
momento angular en mecánica clásica se define como L = r × p, la cuantización canónica pro-
pone definir el operador de momento angular orbital como L b =b r×p
b . La i-ésima componente
del operador de momento angular orbital será
X
L bm pbn ≡
b i = imn x imn x
bm pbn , (5.34)
mn

en donde en la expresión intermedia hemos empleado la convención de suma sobre ı́ndices

repetidos. Los ı́ndices i, m, n toman los valores 1, 2 y 3. Una alternativa más simple para
definir el momento angular es usar el determinante

ex ey ez

L
b =rb×p b = x
b yb zb . (5.35)
pbx pby pbz

Cada una de las componentes del operador de momento angular orbital es formalmente
hermı́tica L̂†i = L̂i . En efecto,
†
L̂†i = (imn x
bm pbn ) = imn pb†n x
b†m = imn pbn x
bm = imn x
bm pbn = L̂i .
5.4. MOMENTO ANGULAR ORBITAL 85
En la secuencia de la deducción anterior hemos tenido en cuenta que el hermı́tico conjugado
de un producto de operadores es el producto de los hermı́ticos conjugados en orden inverso y
que los operadores de posición y momento son hermı́ticos. Finalmente, tuvimos en cuenta que,
a causa del tensor antisimétrico nunca se tienen productos de una componente de posición por
su correspondiente momento. Dicho de manera diferente, siempre se tienen productos de una
componente de posición por una componente diferente del momento; como estos operadores
conmutan podemos escribirlos en el orden contrario y recuperar la definición de la i-ésima
componente del momento angular orbital. Regresemos a la forma más explı́cita de las com-
ponentes del momento angular. Si tomamos una componente del momento angular, digamos
L
bz = xbpby − ybpbx , es fácil ver que corresponde a un operador autoadjunto

b †z = (b †
L xpby − ybpbx ) = pb†y x
b† − pb†x yb† = pby x
b − pbx yb = x
bpby − ybpbx = L
bz . (5.36)

Calculemos enseguida el conmutador entre la i-ésima componente del momento angular

orbital, (5.34), con la j-ésima componente,

L
b j = jrs x
br pbs , (5.37)

en donde, nuevamente se empleó la convención de suma sobre ı́ndices repetidos. Recordemos

que cada componente del operador momento pbi (posición x bi ) conmuta con cualquiera otra
componente del operador de momento pbi0 (posición x bi0 ). El conmutador entre las componentes
i y j del momento angular orbital es
h i
Lbi , L
b j = imn jrs [b
xm pbn , x
br pbs ]
= imn jrs {b
xm [b
pn , x
br pbs ] + [b br pbs ] pbn }
xm , x
= imn jrs {b
xm [b
pn , x
br ] pbs + x xm , pbs ] pbn }
br [b
= imn jrs {b
xm (−i~δn,r )b
ps + x pn } .
br (i~δm,s )b (5.38)

En este punto es conveniente reinsertar las sumas implı́citas.

h i X X
L b j = −i~
bi , L imn jrs δn,r x
bm pbs + i~ imn jrs δm,s x
br pbn
mnrs mnrs
X X
= −i~ imn jns x
bm pbs + i~ imn jrm x
br pbn
mns mnr
= −i~ {imn jns x
bm pbs − imn jrm x
br pbn } . (5.39)

En el último paso de la ecuación anterior volvimos a emplear la convención de suma. Ob-

servemos que los ı́ndices sobre los cuales se hacen las dos sumas son diferentes. Comparando
(5.38) con (5.39) vemos que es suficiente eliminar uno de los dos ı́ndices que aparecen en la
delta de Kronecker. Teniendo en cuenta que el tensor totalmente antisimétrico de Levi-Civita
satisface ijk = kij = jki , podemos reordenar los ı́ndices de modo que
h i
L b j = −i~ {nim nsj x
bi , L bm pbs − mni mjr x
br pbn } . (5.40)

Si permutamos dos ı́ndices el signo cambia (ijk = −jik ). Ası́,

h i
L b j = i~ {nim njs x
bi , L bm pbs − mni mrj x
br pbn } . (5.41)

Por otro lado el tensor de Levi-Civita tiene la siguiente propiedad de contracción de ı́ndices
X
abc aef = δbe δcf − δbf δce , abc aef = δbe δcf − δbf δce . (5.42)
a
86 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
En (5.42) hemos escrito la versión sin convención de suma antes de la versión con esta con-
vención, para recordarle al lector que se trata de una suma.
h i
L b j = i~ {nim njs x
bi , L bm pbs − mni mrj x
br pbn }
= i~ {(δij δms − δis δmj )b
xm pbs − (δnr δij − δnj δir )b
xr pbn }
= i~ {δij (b
xm pbm − x
bn pbn ) − δis δmj x br pbn }
bm pbs + δnj δir x

Claramente el primer término, que sin la convención de suma implı́cita se expresa como
X X X X
i~δij ( bm pbm −
x x
bn pbn ) = i~δij ( bn pbn −
x x
bn pbn ), (5.43)
m n n n

es cero.
h i
L b j = −i~ {δis δmj x
bi , L bm pbs − δir δnj x
br pbn }
= −i~ {δis δmj x
bm pbs − δim δsj x
bm pbs }
= −i~(δis δjm − δim δjs )b
xm pbs

En la serie de igualdades anteriores tuvimos en cuenta que los ı́ndices de suma son mudos, y
se les puede cambiar de nombre. Empleando la identidad (5.42), y luego la antisimetrı́a del
tensor de Levi-Civita ante el intercambio de dos de sus ı́ndices, podemos escribir
h i
L b j = −i~kij ksm x
bi , L bm pbs = i~ijk kms x
bm pbs = i~ijk L
bk .

Se tiene entonces que el momento angular orbital satisface las mismas reglas de conmutación
que los generadores de momento angular, a saber,

[L
bi , L
b j ] = i~ijk L
bk . (5.44)

Para obtener este mismo resultado podemos partir de las expresiones explı́citas para dos
de las componentes de momento angular. Calculemos la relación de conmutación [L bx , L
b y ].

[Lx , Ly ] = [ypz − zpy , −xpz + zpx ] = y[pz , z]px + x[z, pz ]py

= i~(xpy − ypx ) = i~Lz (5.45)

Los demás conmutadores se obtienen haciendo permutaciones (Lx → Ly → Lz → Lx ), o

teniendo en cuenta que [A, B] = −[B, A] y haciendo permutaciones, o teniendo encuenta que
un operador conmuta consigo mismo.
EJERCICIO 53. Mostrar directamente, sin emplear el resultado general dado por la
ecuación (5.44), el siguiente conmutador

[L
bx , L
b z ]. (5.46)

Veamos que
iφ b φ b φ
exp − Jz = cos I − i sin σ
bz .
~ j=1/2 2 2
Si hacemos una rotación de 2π no regresamos al operador identidad. Esta es una señal de que
este caso NO corresponde al momento angular orbital. De hecho, si intentáramos hallar las au-
tofunciones correspondientes, suponiendo que se trata de momento angular orbital llegarı́amos
a algunas contradicciones1 . Las representaciones correspondientes a j = 32 , 52 , ..., 2n+1
2 tam-
poco son representaciones de momento angular orbital. Si j es par puede corresponder a
momento angular intrı́nseco o a momento angular orbital.
1 ver Sakurai[39]
5.4. MOMENTO ANGULAR ORBITAL 87
Consideremos la representación en coordenadas de las componentes cartesianas del mo-
mento angular,

5.4.1. Coordenadas curvilı́neas

Una manera alternativa de encontrar los operadores diferenciales consiste en el uso de
los resultados del cálculo vectorial en coordenadas curvilineas ortogonales. Tomando tres
dimensiones espaciales y coordenadas u1 , u2 , u3 , podemos escribir el vector de posición como

r = x(u1 , u2 , u3 )ex + y(u1 , u2 , u3 )ey + z(u1 , u2 , u3 )ez . (5.48)

Podemos definir las superficies u1 = c1 , u2 = c2 , u3 = c3 , donde c1 , c2 , c3 son constantes.

La intersección entre dos de estas superficies constituye una curva coordenada; existen tres
curvas coordenadas. En cada punto, por lo tanto, se pueden construir tres lı́neas tangentes.
En un sistema coordenado ortogonal estas lı́neas tangentes son ortogonales. Si hacemos un
incremento infinitesimal de las coordenadas, la posición también varı́a de forma infinitesimal,
∂r ∂r ∂r
dr = du1 + du2 + du3 . (5.49)
∂u1 ∂u2 ∂u3
|{z} |{z} |{z}
=h1 e1 =h2 e2 =h3 e3

∂r
El vector ∂u i
, i = 1, 2, 3 es tangente a la curva a lo largo de ui en el punto r. Como la norma
de este vector no es, en general, unitaria, podemos definir el vector unitario
∂r
∂r
ei = ∂ui , hi = ∂ui ,

hi
de forma que el incremento infinitesimal puede escribirse
3
X
dr = hi ei dui . (5.50)
i=1

Para encontrar el gradiente en coordenadas curvilı́neas, empleamos las dos expresiones

siguientes
X ∂f
df = ∇f · dr = dui . (5.51)
i
∂ui

A partir de (5.50), encontramos que ei · dr = hi dui . Empleando esta identidad en la ecuación

de arriba enconteamos que
X ∂f 1
∇f · dr = ei · dr, (5.52)
i
∂ui hi
88 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
de modo que la expresión para el gradiente es
X 1 ∂
∇= ei . (5.53)
i
hi ∂ui

Figura 5.5: Elemento de volumen en coordenadas curvilı́neas ortogonales

La divergencia de un campo vectorial g en un punto r se define como

I
1
lı́m g · ndS, (5.54)
∆V →0 ∆V S

en donde S es la superficie cerrada que circunda el punto r,el cual es el punto central del cubo
de la figura 5.5. Calculamos primero la contribución a la integral de superficie lo largo de u1 .
Mientras la normal de la cara de atrás apunta en la dirección de −e1 , la de adelante apunta
hacia e1 . El área de la primera cara es h2 (u1 − du2 1 , u2 , u3 )h3 (u1 − du2 1 , u2 , u3 )du2 du3 ; el área
de la segunda es h2 (u1 + du2 1 , u2 , u3 )h3 (u1 + du2 1 , u2 , u3 )du2 du3 . En la cara posterior, el campo
es g(u1 − du2 1 , u2 , u3 ); en la anterior, es g(u1 + du2 1 , u2 , u3 ). En consecuencia, la contribución
de estas dos caras a la integral de superficie es
du1 du1 du1
−h2 (u1 − , u2 , u3 )h3 (u1 − , u2 , u3 )du2 du3 e1 · g(u1 − , u2 , u3 )
2 2 2
du1 du1 du1
+h2 (u1 + , u2 , u3 )h3 (u1 + , u2 , u3 )du2 du3 e1 · g(u1 + , u2 , u3 )
2 2 2
∂
≈ (h2 (u1 , u2 , u3 )h3 (u1 , u2 , u3 )e1 · g(u1 , u2 , u3 )) du1 du2 du3 .
∂u1
EJERCICIO 54. Muestre que, calculando las contribuciones de las otras caras, la integral
de superficie es
I
∂ ∂ ∂
g · ndS ≈ (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) du1 du2 du3 ,
S ∂u1 ∂u2 ∂u3
en donde gi = ei · g.
Como el volumen infinitesimal es h1 h2 h3 du1 du2 du3 , la divergencia de g es

1 ∂ ∂ ∂
∇·g = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) . (5.55)
h1 h2 h3 ∂u1 ∂u2 ∂u3
Si hacemos g = ∇f vemos que el laplaciano de una función f es

2 1 ∂ ∂ ∂
∇ f = ∇ · (∇f ) = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 )
h1 h2 h3 ∂u1 ∂u2 ∂u3

1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + . (5.56)
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3

5.4.2. Coordenadas esféricas

Consideremos las coordenadas esféricas ilustradas en la figura 6.1. Las coordenadas cartesianas
pueden ser escritas en términos de las coordenadas esféricas, y viceversa.

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ, (5.57)

p z y
r = x2 + y 2 + z 2 , cos θ = , tan φ = . (5.58)
r x
5.4. MOMENTO ANGULAR ORBITAL 89

Figura 5.6: Coordenadas esféricas.

Las coordenadas cartesianas están definidas en todo el eje real −∞ < x, y, z < ∞, en
tanto que r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π]. Un punto en coordenadas esféricas puede
escribirse como

r = r sin θ cos φ ex + r sin θ sin φ ey + r cos θ ez . (5.59)

Vamos a adoptar la convención u1 = r, u2 = θ y u3 = φ. Si derivamos con respecto a r

tenemos
∂r
= sin θ cos φ ex + sin θ sin φ ey + cos θ ez = h1 er . (5.60)
∂r
Teniendo en cuenta que
2 2 2
(sin θ cos φ) + (sin θ sin φ) + (cos θ) = 1, (5.61)

encontramos que h1 = 1 y, por lo tanto, er = ∂r

∂r .
EJERCICIO 55. Mostrar que h2 = r, h3 = r sin θ y que los vectores unitarios están dados
por
    
er sin θ cos φ sin θ sin φ cos θ ex
 eθ  = cos θ cos φ cos θ sin φ − sin θ ey  . (5.62)
eφ − sin φ cos φ 0 ez

5.4.3. Momento angular en coordenadas esféricas

Teniendo en cuenta los resultados de la sección anterior podemos escribir el gradiente de
una función en coordenadas esféricas como
∂ 1 ∂ 1 ∂
∇ = er + eθ + eφ . (5.63)
∂r r ∂θ r sin θ ∂φ
Teniendo en cuenta que el vector posición es r = er r en coordenadas esféricas y que los
vectores er , eθ , eφ constituyen un conjunto de vectores ortonormales asociados a un sistemas
de ejes derecho (er × eθ = eφ y permutaciones cı́clicas), el momento angular orbital es

∂ 1 ∂
L = er r × (−i~∇) = −i~ eφ − eθ . (5.64)
∂θ sin θ ∂φ

Recordemos que en la discusión de la teorı́a del momento angular, las componentes car-
tesianas jugaron un papel importante. Las expresiones para los operadores diferenciales que
90 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
representan las componentes del momento angular son las siguientes:

∂ 1 ∂
Lx = ex · L = −i~ ex · eφ − ex · eθ
∂θ sin θ ∂φ

∂ cos θ cos φ ∂
= −i~ − sin φ − (5.65)
∂θ sin θ ∂φ

∂ 1 ∂
Ly = ey · L = −i~ ey · eφ − ey · eθ
∂θ sin θ ∂φ

∂ cos θ sin φ ∂
= −i~ cos φ − (5.66)
∂θ sin θ ∂φ

∂ 1 ∂
Lz = ez · L = −i~ ez · eφ − ez · eθ
∂θ sin θ ∂φ
sin θ ∂ ∂
= −i~ = −i~ (5.67)
sin θ ∂φ ∂φ

Usando las expresiones arriba podemos encontrar los operadores diferenciales asocuiados
a los operadores de subida y de bajada.

iφ ∂ ∂
L+ = Lx + iLy = ~e + i cot θ (5.68)
∂θ ∂φ

∂ ∂
L− = Lx − iLy = ~e−iφ − i cot θ (5.69)
∂θ ∂φ

Enseguida, vamos a calcular el operador diferencial correspondiente al cuadrado del mo-

mento angular.

L·L ∂ 1 ∂ ∂ 1 ∂
= − eφ − e θ · e φ − e θ
~2 ∂θ sin θ ∂φ ∂θ sin θ ∂φ

∂ ∂ 1 ∂ 1 ∂ ∂ 1 ∂
= −eφ · eφ − eθ + eθ · eφ − eθ
∂θ ∂θ sin θ ∂φ sin θ ∂φ ∂θ sin θ ∂φ

Dado que el vector unitario eφ no depende de θ, el cuadrado del momento angular se simplifica
a
∂2

L·L ∂ 1 ∂ 1 ∂ ∂ 1 ∂
= − 2 + eφ · eθ + eθ · eφ − eθ
~2 ∂θ ∂θ sin θ ∂φ sin θ ∂φ ∂θ sin θ ∂φ

Como ∂e
∂θ = (− sin θ cos φ, − sin θ sin φ, − cos θ) = −er , el producto escalar con eφ es cero, y
θ

como eφ y eθ son ortogonales, el segundo término de arriba es cero

∂ 1 ∂ ∂eθ 1 ∂ ∂ 1 ∂
eφ · eθ = eφ · + eφ · eθ = 0,
∂θ sin θ ∂φ ∂θ sin θ ∂φ ∂θ sin θ ∂φ

y la expresión para el cuadrado del momento angular sufre una simplificación adicional

∂2

L·L 1 ∂ ∂ 1 ∂
= − 2 + eθ · eφ − eθ .
~2 ∂θ sin θ ∂φ ∂θ sin θ ∂φ
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 91
Teniendo en cuenta que eφ y eθ son ortogonales y que θ y φ son independientes, tenemos

∂2

L·L ∂eφ 1 ∂ 1 ∂ ∂
= − + eθ · − e θ · e θ .
~2 ∂θ2 ∂φ sin θ ∂θ sin2 θ ∂φ ∂φ

El segundo término de la derecha es

∂eφ
eθ · = (cos θ cos φ, cos θ sin φ, − sin θ) · (− cos φ, − sin φ, 0)
∂φ
= − cos θ cos2 φ − cos θ sin2 φ = − cos θ.

Esta igualdad nos permite escribir el cuadrado del momento angular en la forma

∂2

L·L cos θ ∂ 1 ∂ ∂
= − − − eθ · eθ
~2 ∂θ2 sin θ ∂θ sin2 θ ∂φ ∂φ
∂2 cos θ ∂ ∂eθ 1 ∂ 1 ∂2
=− 2 − − eθ · 2 − eθ · eθ 2 .
∂θ sin θ ∂θ ∂φ sin θ ∂φ sin θ ∂φ2

Teniendo en cuenta que ∂e ∂φ = (− cos θ sin φ, cos θ cos φ, 0) = cos θeφ vemos que el tercer
θ

término de la derecha es cero. Por lo tanto,

∂2 1 ∂2 1 ∂2

L·L cos θ ∂ 1 ∂ ∂
= − − − 2 = − sin θ − .
~ 2 ∂θ 2 sin θ ∂θ sin θ ∂φ 2 sin θ ∂θ ∂θ sin2 θ ∂φ2
Finalmente, el operador diferencial asociado al cuadrado del momento angular es

1 ∂2

2 1 ∂ ∂
L · L = −~ sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2

5.5. Autoestados simultáneos de L b2

bz y L
Aprovechando las expresiones obtenidas en la sección anterior, las ecuaciones de autova-
lores y autovectores simultáneos de L b2 ,
bz y L

b z |l, mi = ~m |l, mi ,
L b 2 |l, mi = ~2 l(l + 1) |l, mi ,
L

pueden escribirse en coordenadas

∂
−i~ Yl,m (θ, φ) = ~mYl,m (θ, φ), (5.70)
∂φ
1 ∂2

1 ∂ ∂
−~2 sin θ + Yl,m (θ, φ) = ~2 l(l + 1)Yl,m (θ, φ). (5.71)
sin θ ∂θ ∂θ sin2 θ ∂φ2

En las ecuaciones anteriores empleamos la notación Yl,m (θ, φ) = hθ, φ|l, mi. La solución de la
ecuación diferencial (5.70) es

Yl,m (θ, φ) = Nl,m eimφ Θm

l (θ), (5.72)

donde Nl,m es una constante de normalización y Θm l (θ) es una función de θ. Para que la
función de onda sea univaluada, es necesario que m sea entero. Este argumento, sin embargo,
es relativamente débil, puesto que solo las cantidades fı́sicas medibles, como la densidad de
probabilidad, deben ser univaluadas. Un argumento interesant es el usado en la referencia
[40] en el capı́tulo 7, p 169. Entre las refrencias que tratan este asunto, mencionamos a
Whippman [42], quien discute varios métodos para probar que los valores semienteros del
92 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
momento angular orbital no ocurren; Gray [43] quien argumenta que se debe tener componente
z del momento angular igual a cero, y Gatland [44] quien usa un argumento basado en la
paridad de los autoestados y los cambios de paridad producidos por los operadores escalera.
Para determinar Nl,m de la ecuación (5.72), vamos a suponer que Θm
l (θ) está normalizada
adecuadamente, de manera que
Z 2π Z π Z π
dφ dθ sin θ|Nl,m |2 e−imφ Θ∗l,m (θ)eimφ Θm
l (θ) = 2π|Nl,m |
2
dθ sin θ|Θm
l (θ)|
2
0 0 0
2
= 2π|Nl,m | = 1.
√
Suponiendo que Nl,m es un número real positivo, encontramos que Nl,m = 1/ 2π , de manera
que la solución de la ecuación diferencial (5.70) queda ası́

1
Yl,m (θ, φ) = √ eimφ Θm
l (θ), (5.73)
2π
Ahora vamos a insertar esta función de onda en la ecuación de autovalores y autofunciones
del cuadrado del momento angular, (5.71), para obtener la ecuación diferencial

m2
imφ
eimφ m

1 ∂ ∂ e m
− sin θ − √ Θ l (θ) = l(l + 1) √ Θl (θ),
sin θ ∂θ ∂θ sin2 θ 2π 2π
∂ 2 imφ
√
en donde usamos ∂φ2 e = −m2 eimφ . Después de multiplicar por 2πe−iφ sin2 θ, encontra-
mos la ecuación

d d
sin θ sin θ + l(l + 1) sin2 θ − m2 Θm
l (θ) = 0. (5.74)
dθ dθ

Tomando en cuenta que

d ∂ d cos θ d
= = sin θ ,
dθ d cos θ dθ d cos θ
podemos transformar la ecuación para Θm m
l (θ) = Pl (cos θ),

d d
sin2 θ sin2 θ + l(l + 1) sin2 θ − m2 Plm (cos θ) = 0.
d cos θ d cos θ

Haciendo x = cos θ, recordando que sin2 θ = 1 − cos2 θ = 1 − x2 y dividiendo por 1 − x2 ,

encontramos la ecuación diferencial
m2

d d
(1 − x2 ) + l(l + 1) − Plm (x) = 0, (5.75)
dx dx 1 − x2

la cual define los polinomios asociados de Legendre. Ası́, las funciones Yl,m (θ, φ) sin normalizar,
conocidas como armónicos esféricos, son de la forma

Yl,m (θ, φ) = eimφ Plm (cos θ).

5.5.1. Polinomios de Legendre

Si hacemos m=0 en la ecuación (5.75) recibimos

d 2 dPl (x)
(1 − x ) + l(l + 1)Pl (x) = 0, (5.76)
dx dx
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 93
ecuación que también se puede escribir como
d2 Pl (x)

d 2 dPl (x)
− x + l(l + 1)Pl (x) = 0. (5.77)
dx2 dx dx
La fórmula de Rodrigues define los polinomios de Legendre Pl (x), soluciones de (5.76),
como
1 dl 2
Pl (x) = l (x − 1)l . (5.78)
2 l! dxl
Enseguida mostramos que los polinomios definidos en la ecuación anterior satisfacen la ecua-
ción diferencial (5.77). Teniendo en cuenta que
l
2 l
X l
(x − 1) = (x2 )(l−k) (−1)k , (5.79)
k
k=0

en donde
l k!
= ,
k l!(k − l)!
podemos escribir el l-ésimo polinomio de Legendre, no normalizado, Pel (x), en la forma
[l/2]
dl 2

l
X l (2l − 2k)! l−2k
Pl (x) = l (x − 1) =
e x (−1)k . (5.80)
dx k (l − 2k)!
k=0

El ı́ndice superior de la suma se obtiene sabiendo que se debe satisfacer que l − 2k ≥ 0, y por
lo tanto k ≤ l/2 o k ≤ [l/2], con [x] denotando la función parte entera. De esta forma,
[l−1/2]
dPel X l (2l − 2k)!
= (−1)k (l − 2k)xl−2k−1
dx k (l − 2k)!
k=0
[l−1/2]
X
k l (2l − 2k)! l−2k−1
= (−1) x . (5.81)
k (l − 2k − 1)!
k=0

De manera análoga la segunda derivada posee la expansión

[(l−2)/2]
d2 Pel

X
k l (2l − 2k)!
= (−1) xl−2k−2 ,
dx 2 k (l − 2(k + 1))!
k=0

en donde el lı́mite superior de la suma se determinó como en la ecuación anterior, exigiendo

que las potencias de x sean positivas, l − 2k − 2 ≥ 0. Haciendo el cambio de ı́ndice n = k + 1
(k = n − 1) resulta
[l/2]
d2 Pel

X
n−1 l (2l − 2(n − 1))! l−2n
= (−1) x . (5.82)
dx2 n−1 (l − 2n)!
n=1

Recordemos las relaciones entre coeficientes binomiales

l l!n n l
= = , (5.83)
n−1 (n − 1)!(l − (n − 1))!n l−n−1 n
en donde hemos empleado (l − n + 1)! = (l − n)!(l − n + 1). Reemplazando (5.83) en la segunda
derivada dada en (5.82) resulta
[l/2]
d2 Pel

X
n n l (2l − 2n + 2)(2l − 2n + 1)(2l − 2n)! l−2k
=− (−1) x ,
dx2 l − n + 1 n (l − 2n)!
n=0
[l/2]
X
l l (2l − 2k)! l−2k
=− 2k(2l − 2k + 1)(−1 ) x , (5.84)
k (l − 2k)!
k=0
94 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
en donde se ha cambiado n por k. Multiplicando por x2 a la ecuación (5.81) se tiene
[(l−1)/2]
2 dPl
e X
k l (2l − 2k)! l−2k+1
x = (−1) x .
dx k (l − 2k − 1)!
k=0

El resultado de derivar este producto con respecto a x es

! [(l−1)/2]
d 2 dPl
e X l (2l − 2k)! (l − 2k + 1) l−2k
x = (−1)k x (l − 2k)
dx dx k (l − 2k − 1)! (l − 2k)
k=0
[(l−1)/2]
X
k l (2l − 2k)!
= (−1) (l − 2k)(l − 2k + 1)xl−2k . (5.85)
k (l − 2k)!
k=0

Substituyendo (5.84), (5.85) y (5.80) en (5.77) se recibe

[l/2]
X
l l (2l − 2k)! l−2k
− 2k(2l − 2k + 1)(−1 ) x
k (l − 2k)!
k=0
[(l−1)/2]
X
k l (2l − 2k)!
− (−1) (l − 2k)(l − 2k + 1)xl−2k
k (l − 2k)!
k=0
[l/2]
X l (2l − 2k)! l−2k
+ l(l + 1) x (−1)k . (5.86)
k (l − 2k)!
k=0

Analizamos los lı́mites superiores de las sumas, pues al parecer son diferentes. Suponiendo l
impar, digamos l = 2m + 1 resulta que

l−1 2m + 1 − 1 l 2m + 1 1
= = m, = = m+ = m.
2 2 2 2 2
Por su parte, si l es par, digamos l = 2m resulta que

l 2m l−1 2m − 1 1
[ ]= = m, = = m−1+ = m − 1.
2 2 2 2 2
Esto significa que si l es par la segunda suma de (5.86) va únicamente hasta m − 1. Sin
embargo, es posible extender la suma hasta m porque, debido al factor (l − 2k), dicho término
es idénticamente igual a cero. Ası́, podemos escribir la ecuación (5.86) de modo simplificado
m
X l (2l − 2k)! l−2k
− 2k(2l − 2k + 1)(−1l ) x
k (l − 2k)!
k=0
m
X
k l (2l − 2k)!
− (−1) (l − 2k)(l − 2k + 1)xl−2k
k (l − 2k)!
k=0
m
X l (2l − 2k)! l−2k
+ l(l + 1) x (−1)k . (5.87)
k (l − 2k)!
k=0

Sacando el factor común en las tres sumas llegamos a

m
X
(−2k(2l − 2k + 1) − (l − 2k)(l − 2k + 1) + l(l + 1)) ×
k=0

l l (2l − 2k)! l−2k
× (−1) x .
k (l − 2k)!
5.5. AUTOESTADOS SIMULTÁNEOS DE L b2
bZ Y L 95
Para que esta suma sea idénticamente cero es necesario y suficiente que los coeficientes de
cada una de las potencias de x que están presentes en la suma sean cero. Los coeficientes son
realmente cero como se ve enseguida:

l(l + 1) − 2k(2l − 2k + 1) − (l − 2k)(l − 2k + 1)

= l2 + l − 4kl + 4k 2 − 2k − (l2 − 4kl + 4k 2 ) − (l − 2k) = 0.

Pongamos de nuevo el factor de normalización definido en la fórmula de Rodrigues (5.78)

[l/2]
1 X k l (2l − 2k)! l−2k
Pl (x) = (−1) x . (5.88)
l
2 l! k (l − 2k)!
k=0

Es fácil verificar que los primeros polinomios de Legendre están entonces dados por

P0 (x) = 1, (5.89a)
P1 (x) = x, (5.89b)
3 1
P2 (x) = x2 − , (5.89c)
2 2
5 3
P3 (x) = x3 − x. (5.89d)
2 2
La normalización introducida es tal que Pl (1) = 1. Los polinomios de Legendre son pares o
impares como puede verse fácilmente,
[l/2]
1 X k l (2l − 2k)!
Pl (−x) = l (−1) (−x)l−2k
2 l! k (l − 2k)!
k=0
[l/2]
1 Xl k l (2l − 2k)! l−2k
= (−1) l (−1) (x)
2 l! k (l − 2k)!
k=0
= (−1)l Pl (x). (5.90)

EJERCICIO 56. Determinar los Pl (cos θ) hasta l = 3.

5.5.2. Polinomios asociados de Legendre

Pasamos a encontrar las soluciones a la ecuación (5.75). Si escribimos la ecuación (5.76)
en la forma
d2 Pl (x) dPl (x)
(1 − x2 ) 2
− 2x l(l + 1)Pl (x) = 0,
dx dx
y la derivamos m veces con respecto a x, tenemos

dm 2

2 d Pl dPl
(1 − x ) − 2x + l(l + 1)P l = 0. (5.91)
dxm dx2 dx

Para realizar las derivadas usamos la Regla de Leibniz, a saber,

n
dn

X n
(f (x)g(x)) = (f g)(n) = f (n−k) g (k) . (5.92)
dx n k
k=0

Esta fórmula puede probarse por inducción. Es claro que la ecuación (5.92) se cumple para
n = 1. Si suponemos que la regla de Leibniz se cumple para n entonces se puede mostrar que
96 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
también se cumple para n + 1. Aplicando la regla de Leibniz se tiene entonces
m
d2 Pl dm−1 d2 Pl

m 2 d m
(1 − x ) m + (−2x)
0 dx dx2 1 dxm−1 dx2
m−2 2

m d d Pl
+ (−2) m−2 (5.93)
2 dx dx2
m
m−1
dm Pl

m d dPl m d dPl
−2 x m + + l(l + 1) = 0,
0 dx dx 1 dxm−1 dx dxm

en donde los coeficientes combinatorios son

m m m m(m − 1)
= 1, = m, = .
0 1 2 2

Substituyendo los valores de los coeficientes tenemos

dm d2 Pl dm−1 d2 Pl dm−2 d2 Pl
(1 − x2 ) m + (−2mx) − m(m − 1)
dx dx2 dxm−1 dx2 dxm−2 dx2
dm dPl dm−1 dPl dm Pl

−2 x m + m m−1 + l(l + 1) m = 0.
dx dx dx dx dx

Reorganizando las derivadas escribimos

2
m
d d m Pl
m
d dm P l

2 d d Pl d Pl
(1 − x ) 2 − 2mx − m(m − 1) − 2x
dx dxm dx dxm dxm dx dxm
m m
d Pl d Pl
− 2m + l(l + 1) m = 0.
dxm dx

Sumando los coeficientes correspondientes a las derivadas del mismo orden llegamos a

d2 dm Pl d dm Pl

(1 − x2 ) 2 − 2(m + 1)x (5.94)
dx dxm dx dxm
m
d Pl
+ [l(l + 1) − m(m + 1)] = 0.
dxm

Definimos las funciones Plm (x) a través de

dm Pl dm Pl
Plm (x) = (1 − x2 )m/2 , → = (1 − x2 )−m/2 Plm (x). (5.95)
dxm dxm
Derivando (5.95) con respecto a x hallamos

d d m Pl dP m (x)

m
m
= − (1 − x2 )−m/2−1 (−2x)Plm (x) + (1 − x2 )−m/2 l
dx dx 2 dx
m
dP (x)
= mx(1 − x2 )−m/2−1 Plm (x) + (1 − x2 )−m/2 l . (5.96)
dx
Empleamos la regla de Leibniz para encontrar la segunda derivada de (5.95) con respecto a
x,

d2 dm Pl

= m(1 − x2 )−m/2−1 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−2 Plm (x)
dx2 dxm
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2−1 l + (1 − x2 )−m/2 . (5.97)
dx dx2
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 97
Usando (5.95–5.97) en la ecuación diferencial (5.94) se recibe
m(1 − x2 )−m/2 Plm (x) + m(m + 2)x2 (1 − x2 )−m/2−1 Plm (x)
dP m (x) d2 Plm (x)
+ 2mx(1 − x2 )−m/2 l + (1 − x2 )−m/2+1
dx dx2
m

2 −m/2−1 m 2 −m/2 dPl (x)
− 2(m + 1)x mx(1 − x ) Pl (x) + (1 − x )
dx
+ [l(l + 1) − m(m + 1)](1 − x2 )−m/2 Plm (x) = 0.

Multiplicando ahora por (1 − x2 )m/2 produce

dP m (x) d2 Plm (x)
mPlm (x) + m(m + 2)x2 (1 − x2 )−1 Plm (x) + 2mx l + (1 − x2 )
dx dx2
m

dPl (x)
− 2(m + 1)x mx(1 − x2 )−1 Plm (x) +
dx
+ [l(l + 1) − m(m + 1)]Plm (x) = 0.
Juntamos los coeficientes de la función P y sus derivadas,
(m + m(m + 2)x2 (1 − x2 )−1 − 2(m + 1)mx2 (1 − x2 )−1 + l(l + 1) − m(m + 1))Plm (x)
dPlm (x) d2 Plm (x)
+ (2mx − 2(m + 1)x) + (1 − x2 ) = 0.
dx dx2
Simplificando arribamos a
1 − x2 x2 dP m (x) d2 Plm (x)
(l(l + 1) − m2 2
− m2 2
)Plm (x) − 2x l + (1 − x2 ) = 0.
1−x 1−x dx dx2
d2 Plm (x) dPlm (x)

1
(1 − x2 ) 2
− 2x + l(l + 1) − m2 Plm (x) = 0. (5.98)
dx dx 1 − x2
Comparando (5.98) con (5.75) percibimos que son idénticas. Es decir, hemos encontrado las
soluciones a dicha ecuación. Recordando la definición de Plm (x), (5.75), y la de los polinomios
de Legendre, (5.78), podemos escribir los polinomios asociados de Legendre en la forma

d|m| 1 2 |m|/2 d
|m|+l
Plm (x) = (1 − x2 )|m|/2 P l (x) = (1 − x ) (x2 − 1)l . (5.99)
dx|m| 2l l! dx|m|+l
Las autofunciones comunes de Lbz y Lb 2 , teniendo en cuenta la normalización, son
1
m+|m| (2l + 1)(l − |m|)! 2 imφ |m|
Ylm (θ, φ) = (−1) 2 e Pl (cos θ). (5.100)
4π(l + |m|)

5.6. Autoestados usando los operadores escalera

Recordemos que una manera de obtener los autoestados normalizados del oscilador armóni-
co simple es haciendo actuar el operador de subida sobre la función de onda normalizada del
estado base.
Para determinar los armónicos esféricos se puede comenzar escribendo en coordenadas
L+ |l, li = 0, (5.101)
y luego empleando el operador de bajada. La ecuación en coordenadas

iφ ∂ ∂
hθ, φ| L+ |l, li = ~e + i cot θ Ylm (θ, φ) = 0,
∂θ ∂φ
98 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
imφ
e√
puede resolverse recordando que Ylm (θ, φ) = Θm (θ).
2π l
La ecuación resultante

dPll
= l cot θPll ,
dθ
admite la solución ln Pll = l ln sin θ + C, en donde C es una constante. Despejando P tenemos
Pll (cos θ) = C̃ sinl (θ), siendo Pll (cos θ) = C̃ otra constante, cuya norma se puede determinar
mediante la condición de normalización de la función de onda
Z π √
πΓ(l + 1)
sin θdθ|C̃|2 sin2l θ = |C̃|2 = 1.
0 Γ(l + 23 )

EJERCICIO 57. Obtener Yll−1 (θ, φ) y Yll−2 (θ, φ) con la normalización apropiada, usando
el operador de bajada.
El desarrollo de los armónicos esféricos empleando los operadores de subida y de bajada
se puede encontrar en [41], p 320.
EJERCICIO 58. Demuestre que en la representación de coordenadas
2
1 ∂2

. ∂ ∂ ∂
L+ L− = −~2 + cot θ + + i .
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ
y
∂2 1 ∂2

. ∂ ∂
L+ L− = −~2 + cot θ + −i .
∂θ 2 ∂θ sin2 θ ∂φ2 ∂φ
Finalmente encontramos que las componentes cartesianas del momento angular se escriben
ası́

. ∂ ∂
Lx = −i~ − sin φ − cot θ cos φ , (5.102a)
∂θ ∂φ

. ∂ ∂
Ly = −i~ cos φ − cot θ sin φ , (5.102b)
∂θ ∂φ
. ∂
Lz = −i~ , (5.102c)
∂φ
en la representación de coordenadas. En el caso de los operadores de subida y bajada tenemos

. ∂ ∂
L± = ~ exp (±iφ) ± + i cot θ , (5.103)
∂θ ∂φ
y para el cuadrado del operador del momento angular
2
1 ∂2

2 . 2 ∂ ∂
L = −~ + cot θ + . (5.104)
∂θ2 ∂θ sin2 θ ∂φ2

b2 = 1 L

L b+ L
b− + L b− L
b+ + L b 2z (5.105)
2

2 iφ ∂ ∂ −iφ ∂ ∂
L+ L− = −~ e
b b − + i cot θ e + i cot θ (5.106)
∂φ ∂φ ∂φ ∂φ
Empleando la relación
∂ −iφ −iφ ∂
e =e −i + , (5.107)
∂φ ∂φ
y la relación
∂ 1 ∂
cot θ = − 2 + cot θ (5.108)
∂θ sin θ ∂θ
5.6. AUTOESTADOS USANDO LOS OPERADORES ESCALERA 99
arribamos a
∂2 1 ∂2

. ∂ ∂
L+ L− = −~2 2
+ cot θ + 2 2
+i . (5.109)
∂θ ∂θ sin θ ∂φ ∂φ
EJERCICIO 59. De manera semejante a la presentada en el texto demostrar que en la
representación de coordenadas
2
1 ∂2

. 2 ∂ ∂ ∂
L+ L− = −~ + cot θ + −i . (5.110)
∂θ2 ∂θ sin2 θ ∂φ2 ∂φ

El momento angular orbital no puede tomar valores semienteros porque al realizar una
rotación por 2π la función de onda adquirirı́a un signo negativo. Sin embargo, la función
de onda debe ser univaluada para que la expansión de un vector de estado en términos de
autoestados de posición sea única. Si consideramos posible la existencia de estados de momento
angular correspondientes a valores semienteros, tendremos que la función de onda
1 1
hr, θ, φ | , − i = 0, (5.111)
2 2
es diferente de aquella obtenida de
1 1
hr, θ, φ| L− | , i , (5.112)
2 2
en donde
1 1
L+ | , i = 0. (5.113)
2 2
Ejemplos de autoestados de Lz y L2 en coordenadas esféricas.
100 CAPÍTULO 5. TEORÍA DEL MOMENTO ANGULAR
Capı́tulo 6

Potenciales Centrales

6.1. Introducción
El estudio de los sistemas cuánticos se vuelve muy complicado rápidamente, no solo por-
que los potenciales de sistemas fı́sicos reales son tridimensionales, sino porque la ecuación de
Schrödinger no se escribe en el espacio fı́sico de tres dimensiones, sino en el de configuración;
es decir, si tenemos dos partı́culas que se mueven en el espacio, la ecuación de Schrödinger
depende de seis parámetros, tres coordenadas para la primera partı́cula y otras tres coordena-
das para la segunda. Aún en el caso de una sola partı́cula, en general no es posible ni resolver
la ecuación de movimiento ni encontrar las autofunciones y los autovalores de manera analı́ti-
ca. Dentro de los casos completamente solubles, o que se pueden simplificar enormemente,
tenemos los casos de una sola partı́cula que se mueve en un potencial tridimensional central,
o de dos partı́culas cuyo potencial de interacción depende de la distancia entre ellas (y que
no están expuestas a ningún potencial externo). En este capı́tulo hacemos algunas conside-
raciones generales sobre los potenciales centrales y estudiamos en más detalle el átomo de
hidrógeno.
Comenzamos con un ejemplo para motivar el tema.

6.1.1. El oscilador armónico tridimensional isotrópico

Supongamos que tenemos un oscilador armónico tridimensional isotrópico, cuyo Hamilto-
niano es
p2x + p2y + p2z mω 2 2
H= + (x + y 2 + z 2 ). (6.1)
2m 2
La solución general de la ecuación de Schrödinger correspondiente,
~2
2
∂2 ∂2 mω 2 2

∂Ψ(x, y, z, t) ∂ 2 2
i~ = − + + + (x + y + z ) Ψ(x, y, z, t),
∂t 2m ∂x2 ∂y 2 ∂z 2 2
que puede encontrarse utilizando el método de separación de variables, es la combinación
lineal de todas las soluciones de la forma
Ψ(x, y, z, t) = X(x)Y (y)Z(z)e−iEt/~ . (6.2)
Substituyendo la función de onda de prueba (6.2) en la ecuación de Schrödinger, obtenemos
iEt
EXY Ze− ~ =
~2 d2 X d2 Y d2 Z mω 2 2

iEt
− Y Z 2 + XZ 2 + XY + (x + y + z )XY Z e− ~ .
2 2
2m dx dy ∂z 2 2

101
102 CAPÍTULO 6. POTENCIALES CENTRALES
− iEt
Dividiendo por XY Ze encontramos
~

~2 1 d2 X 1 d2 Y 1 d2 Z mω 2 2

2 2
E= − + + + (x + y + z )
2m X dx2 Y dy 2 Z ∂z 2 2
2 2 2 2 2 2
mω 2 y 2

~ d X mω x ~ d Y
= − + + − +
2mX dx2 2 2mY dy 2 2
| {z } | {z }
=EX =EY

~2 d2 Z mω 2 z 2

+ − + .
2mZ dz 2 2
| {z }
=EZ

De este modo hemos encontrado las tres ecuaciones

~2 d2 X mω 2 x2
− + X = EX X,
2m dx2 2
~2 d2 Y mω 2 y 2
− 2
+ Y = EY Y,
2m dy 2
~2 d2 Z mω 2 z 2
− 2
+ X = EZ Z,
2m dz 2
que son las ecuaciones de Schrödinger, independientes del tiempo, para osciladores unidi-
mensionales de frecuencia ω, en las coordenadas x, y y z, respectivamente. Las autoenergı́as
totales son la suma de las autoenergı́as de cada uno de los problemas unidimensionales. Las
autoenergı́as y autofunciones del oscilador armónico cuántico unidimensional, que estudiamos
anteriormente, son
1 Hk ( xb ) − x22
φk (x) = √
4
√ e 2b , k = 0, 1, 2 · · ·
πb2 2k k!
p
en donde b = ~/(mω). Los primeros polinomios de Hermite, Hn (x), son

H0 (x) = 1, H1 (x) = 2x, H2 (x) = 4x2 − 2.

Las autoenergı́as, por su parte, son En = ~ω(n + 21 ). Si tenemos un oscilador armónico

tridimensional, sus autofunciones

Φkmn (r) = φk (x)φm (y)φn (z),

con autoenergı́as

3
Ekmn = ~ω k + m + n + ,
2
dependen de tres enteros no negativos k, m y n.
Dado que el Hamiltoniano del oscilador armónico tridimensional (6.1) puede escribirse
como

b =p b mω 2 r
b·p b·r
b
H + ,
2m 2
parece claro que es invariante ante rotaciones. Este argumento puede escribirse de manera
más formal.
La fórmula de Rodrigues nos dice que cuando rotamos un vector r del espacio tridimen-
sional por un ángulo θ alrededor de la dirección n̂, se obtiene un nuevo vector r0

r0 = r cos θ + (n̂ × r) sin θ + n̂ (n̂ · r)(1 − cos θ).

6.1. INTRODUCCIÓN 103
Si el ángulo es infinitesimal, la fórmula de Rodrigues se reduce a

r0 = r + (n̂ × r) θ + O(θ2 ),
r = r0 − (n̂ × r0 ) θ + O(θ2 ).

Es importante ver que estamos ante una transformación activa: tenı́amos un vector y lo
rotamos para obtener un nuevo vector (o podrı́amos tomar un cuerpo y rotarlo). Podrı́amos
haber tenido una transformación pasiva, en la que un sistema de referencia se obtiene a
partir de otro mediante una rotación por un cierto ángulo alrededor de alguna dirección. La
representación matemática de una transformación activa es la inversa de la transformación
pasiva correspondiente.
Si ψ(r) es la función de onda de un sistema cuántico y ψ 0 (r) es la función correspondiente,
después de que se ha rotado el sistema, entonces el valor de ψ 0 en el punto rotado debe ser
igual a la función de onda original en el punto sin rotar,

dψ
ψ 0 (r0 ) = ψ(r) = ψ(r0 − (n̂ × r0 ) θ) = ψ|θ=0 + θ + O(θ2 )
dθ θ=0
X ∂ψ ∂(r0 − (n̂ × r0 ) θ)i
= ψ(r0 ) + θ 0
+ O(θ2 ) (6.3)
i
∂r i ∂θ
θ=0

El segundo término de la derecha puede evaluarse usando el siguiente resultado

X ∂ψ ∂(r0 − (n̂ × r0 ) θ)i X ∂ψ ∂(r0 − ijk nj r0 θ)
i k
0
= 0

i
∂ri ∂θ
θ=0 i
∂ri ∂θ
θ=0
 
X X ∂ψ X ∂ψ
=−  ijk nj rk0  0 = − jki nj rk0 0
i
∂ri ∂ri
jk ijk
!
X X ∂ψ
=− nj jki rk0 0 = −n · r0 × ∇0 ψ(r0 ),
j
∂r i
ki

en donde usamos
P el hecho de que la i-ésima componente del producto vectorial a × b es
(a × b)i = jk ijk aj bk , siendo ijk el tensor totalmente antisimétrico de Levi-Citiva, que
vale 1 si ijk es una permutación cı́clica de 123, -1 si es una permutación cı́clica de
P321, y
0 en los demás casos. También tuviemos en cuenta que ijk = jki y que a · b = j aj bj .
Empleando el resultado anterior en la ecuación (6.3) obtenemos

ψ 0 (r0 ) = ψ(r0 ) − θn · r0 × ∇0 ψ(r0 ) + O(θ2 ).

Teniendo en cuenta que r0 es un punto genérico, podemos sustituirlo por r,

i
ψ 0 (r) = ψ(r) − θn · r × ∇ψ(r) + O(θ2 ) = ψ(r) − θn · r × (−i~∇ψ(r)) + O(θ2 ).
~
Ahora es posible identificar el vector de momento angular. Ası́, hasta primer orden en θ (es
decir, suponiendo que θ es infinitesimal)
i
hr|ψ 0 i = hr| I − θn · L̂ |ψi .
~
Si θ es finito, se puede alcanzar haciendo N rotaciones sucesivas por un ángulo de θ/N,
N
0 i
|ψ i = lı́m I − θn · L̂ |ψi = e−iθn·L̂/~ |ψi .
N →∞ ~
104 CAPÍTULO 6. POTENCIALES CENTRALES
Hemos concluido que el operador unitario Un (θ) = e−iθn·L̂/~ representa una rotación
por un ángulo θ alrededor de la dirección n. Si O es un operador de un sistema cuántico, el
operador correspondiente después de rotar el sistema por un ángulo θ alrededor de la dirección
n es
∞ m
0 −iθn·L̂/~ iθn·L̂/~
X 1 −iθ
O =e Oe = [n · L̂, •]m O, (6.4)
m=0
m! ~

en donde

[A, •]O = [A, O], [A, •]2 O = [A, •][A, •]O = [A, •][A, O] = [A, [A, O]],
[A, •]3 O = [A, •][A, •]2 O = [A, •][A, [A, O]] = [A, [A, [A, O]]].

Las demás potencias se pueden encontrar de manera semejante.

EJERCICIO 60. Empleando la ecuación (6.4) encontrar e−iθn·L̂/~ Oeiθn·L̂/~ , en donde O
corresponde a cada una de las componentes de la posición y a cada una de las componentes
del momento.
EJERCICIO 61. Teniendo en cuenta que H 0 = e−iθn·L̂/~ Heiθn·L̂/~ , en donde H está dado
por la ecuación (6.1), se puede escribir como

b0 · p
p b0 b0 · r
mω 2 r b0
H0 = + ,
2m 2

en donde p b0 y r
b0 son los que usted encontró en el ejercicio anterior.
El ejercicio anterior muestra que la forma del Hamiltoniano es la misma, antes y después
de la rotación. Es posible concluir, por lo tanto, que las autofunciones del oscilador armónico
tridimensional isotrópico deben tener alguna relación con el momento angular. Para develar
esta relación escribimos explı́citamente las funciones de onda del estado base, con energı́a
3~ω
E000 = 3 × ~ω 2 y de los tres estados degenerados con energı́a 2 × 2 + 2 = 5 × 2 ,
~ω ~ω

√
1 r2
− 2b 2z − r22
Φ000 (r) = √
4
e ,2
Φ001 (r) = √
4
e 2b ,
π 3 b6 π 3 b6
√ √
2x − r22 2y − r22
Φ100 (r) = √
4
e 2b , Φ010 (r) = √
4
e 2b .
π 3 b6 π 3 b6
Vamos a analizar el efecto de aplicar las componentes del momento angular sobre funciones
que dependen únicamente de r2 . Comenzamos calculando las derivadas parciales.

∂ dF ∂r2 dF ∂ dF ∂ dF
F (u = r2 ) = = 2x , F (u) = 2y , F (u) = 2z .
∂x du ∂x du ∂y du ∂z du

Ası́, al aplicar la componente z del momento angular sobre F obtenemos

b z F (r2 ) = −i~ x ∂ − y ∂ F (u = r2 ) = −i~ (x × 2y − y × 2x) dF = 0.
L
∂y ∂x du

También tenemos L b 2 F (r2 ) = L bz L b z F (r2 ) = L b z 0 = 0. Debido a la simetrı́a vemos que tam-
z

bién valen las relaciones L b 2x F (r2 ) = 0 = L b 2y F (r2 ). Finalmente, sumando estos tres resultados
2 2
encontramos L b F (r ) = 0.
Como la función de onda Φ000 (r) depende solamente de r2 , podemos concluir que

b z |000i = 0 = 0~ |000i ,
L b 2 |000i = 0 = 0(0 + 1)~2 |000i .
L
6.2. POTENCIALES CENTRALES 105
Hemos escrito estas ecuaciones de modo que quede claro que el estado |000i es autoestado de
L b 2 también con autovalor 0, es decir, corresponde a l = 0 y m = 0.
b z con autovalor 0 y de L
EJERCICIO 62. Mostrar que
b z |001i = 0~ |001i ,
L b 2 |001i = 1(1 + 1)~2 |001i
L
b z |+i = ~ |+i ,
L b 2 |+i = 1(1 + 1)~2 |+i
L
b z |−i = −~ |−i ,
L b 2 |−i = 1(1 + 1)~2 |−i
L

donde
|100i + i |010i |100i − i |010i
|+i = √ , |−i = √ .
2 2
Notar que pasamos de l = 0 a l = 1. No encontramos l = 1/2. Para el momento angular no
encontramos valores semienteros para l. Encontrar las funciones de onda correspondientes a
los estados |+i y |−i.

6.2. Potenciales Centrales

Como fue mencionado al comienzo del capı́tulo, uno de los problemas importantes, tanto
en la mecánica clásica, como en la mecánica cuántica es el de los potenciales centrales, aquellos
que dependen únicamente de la distancia a un punto central. Ellos surgen tı́picamente de las
interacciones entre dos cuerpos, tales como la atracción gravitacional o la electrostática o la
interacción de Yukawa, por mencionar algunas, que dependen solamente de la distancia entre
los dos cuerpos. Todos los potenciales centrales tienen algunas caracterı́sticas comunes, que
provienen de la invariancia ante rotaciones. En la siguiente sección hacemos una deducción
rápida de la forma de las autofunciones de los potenciales centrales.

6.2.1. Coordenadas esféricas

Consideremos las coordenadas esféricas ilustradas en la figura 6.1. Se tiene que

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ, (6.5)

p z y
r = x2 + y 2 + z 2 , cos θ = , tan φ = . (6.6)
r x
Las coordenadas cartesianas están definidas en todo el eje real −∞ < x, y, z < ∞, en tanto

Figura 6.1: Coordenadas esféricas.

que r ∈ [0, ∞), θ ∈ [0, π], φ ∈ [0, 2π].

106 CAPÍTULO 6. POTENCIALES CENTRALES
6.2.2. Momento angular y energı́a cinética
Aquı́ encontraremos una relación entre el cuadrado del momento angular y el laplaciano
(básicamente la energı́a cinética). Dado que la i-ésima componente del momento angular
b i = P abi rba pbb , en donde todos los ı́ndices corren sobre 1, 2 y 3, el cuadrado
está dada por L ab
del momento angular es
XX X X
b2 =
L abi rba pbb jki rba pbb = abi jki rba pbb rbj pbk .
i ab jk abijk

Empleando la siguiente propiedad de contracción del tensor de Levi-Civita

X
abi jki = δaj δbk − δak δbj ,
i

encontramos que el cuadrado del momento angular es

X X X
b2 =
L (δaj δbk − δak δbj) rba pbb rbj pbk = rba pbb rba pbb − rba pbb rbb pba . (6.7)
abjk ab ab

Podemos escribir el primer término de la derecha como

X X X X
rba pbb rba pbb = pb rba − rba pbb + rba pbb ) pbb =
rba (b rba [b
pb , rba ]b
pb + rba rba pbb pbb
ab ab ab ab
X X X X
rba pba + rb2 pb2

= rba −i~1̂δab pbb + rba rba pbb pbb = −i~
ab a b a

= −i~b b + rb2 pb2 .

r·p

El último término de la ecuación (6.7), por su parte, puede ponerse en la siguiente forma
X X X X
rba pbb rbb pba = rb pba − pba rbb + pba rbb ) =
rba pbb (b rba pbb [b
rb , pba ] + rba pbb pba rbb
ab ab ab ab
X X
= rba pbb i~1̂δab + pb rbb − rbb pbb + rbb pbb )
rba pba (b
ab ab
X X X X
= i~ rba pba + rba pba [b
pb , rbb ] + rba pba rbb pbb
a a b ab
X
r·p
= i~b b·p
b+r b −i~1̂ + r
b·p
brb·p
b
b
2 2
r·p
= i~b b − 3i~b
r·p r·p
b + (b b) = −2i~b
r·p r·p
b + (b b) .

Juntando estos dos resultados vemos que el cuadrado del momento angular es

b 2 = −i~b
L r·p b + rb2 pb2 − −2i~b
r·p b)2 = rb2 pb2 + i~b
r·p
b + (b r·p
b − (b b)2 .
r·p

b 2 a una función de onda tenemos

Si aplicamos el operador L
b 2 |ψi = −~2 r2 ∇2 ψ(r) + ~2 r · ∇ψ(r) + ~2 (r · ∇) ψ(r). 2
hr|L

Teniendo en cuenta que

X 1 ∂
∇= ei (6.8)
i
hi ∂ui
6.2. POTENCIALES CENTRALES 107
y que en el caso de coordenadas esféricas h1 = 1, h2 = r, y h3 = r sin θ, el gradiente en
coordenadas esféricas es
∂ 1 ∂ 1 ∂
∇ = er + eθ + eφ . (6.9)
∂r r ∂θ r sin θ ∂φ

Además, como el vector posición es r = er r, el cuadrado del momento angular puede expre-
sarse como
2
2 2 2 2 2 ∂ 2 ∂
hr|L |ψi = −~ r ∇ ψ(r) + ~ r ψ(r) + ~ r
b ψ(r),
∂r ∂r
∂
en donde hemos tenido en cuenta que r · ∇ = ∂r . Si dividimos por 2mr2 , hallamos
2
~2 2 2 2

1 b 2 |ψi − ~ ∂ ψ(r) − ~ ∂
− ∇ ψ(r) = 2
hr|L r ψ(r), (6.10)
2m 2mr 2mr ∂r 2mr2 ∂r

después de rearreglar términos. Esta es la ecuación que relaciona la energı́a cinética (el Lapla-
ciano) con el momento angular. La ventaja de el camino empleado aquı́ es que no es necesario
tener una expresión previa para el Laplaciano en coordenadas esféricas, aunque se hace amplio
uso de la contracción de tensores de Levi-Civita.
Otro camino para encontrar esta relación es el uso de los resultados en el capı́tulo anterior:
por un lado del Laplaciano y por otro del cuadrado del momento angular. En coordenadas
curvilı́neas ortogonales, el laplaciano de una función f es

1 ∂ ∂ ∂
∇2 f = (g1 h2 h3 ) + (h1 g2 h3 ) + (h1 h2 g3 ) (6.11)
h1 h2 h3 ∂u1 ∂u2 ∂u3

1 ∂ h2 h3 ∂f ∂ h1 h3 ∂f ∂ h1 h2 ∂f
= + + .
h1 h2 h3 ∂u1 h1 ∂u1 ∂u2 h2 ∂u2 ∂u3 h3 ∂u3

En coordenadas esféricas
2
1 ∂ r sin θ ∂f ∂ r sin θ ∂f ∂ r ∂f
∇2 f = 2 + +
r sin θ ∂r 1 ∂r ∂θ r ∂θ ∂φ r sin θ ∂φ
∂2f

1 ∂ ∂f 1 ∂ ∂f 1
= 2 r2 + 2 sin θ + 2 ,
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2

de manera que, para el operador de energı́a cinética tenemos

p2 ~2 1 ∂ 1 ∂2ψ

2 ∂ψ 1 ∂ ∂ψ
hr| |ψi = − r + 2 sin θ + 2
2m 2m r2 ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2

Por su parte, el operador diferencial asociado al cuadrado del momento angular es

1 ∂2

. 1 ∂ ∂
L · L = −~2 sin θ + .
sin θ ∂θ ∂θ sin2 θ ∂φ2

Ası́, podemos escribir una relación entre la energı́a cinética y el cuadrado del momento angular

p2 ~2 1 ∂

2 ∂ψ 1
hr| |ψi = − r + hr|L2 |ψi . (6.12)
2m 2m r2 ∂r ∂r 2mr2

EJERCICIO 63. Muestre que (6.10) y (6.12) son equivalentes.

108 CAPÍTULO 6. POTENCIALES CENTRALES
6.2.3. Momento angular y potenciales centrales
La ecuación de Schrödinger para una partı́cula en un potencial central independiente del
tiempo
∂Ψ(r, t) ~2 2
i~ =− ∇ Ψ(r, t) + V (r)Ψ(r, t),
∂t 2m
se puede simplificar empleando el Ansatz Ψ(r, t) = ψE (r)e−iEt/~ . Después de dividir a ambos
lados por e−iEt/~ se obtiene la ecuación de Schrödinger independiente del tiempo
~2 2
− ∇ ψE (r) + V (r)ψE (r) = EψE (r).
2m
Empleando (6.12) escribimos la ecuación anterior como
2

1 b 2 |ψE i − ~ ∂ 2 ∂ψE (r)
hr|L r + V (r)ψE (r) = EψE (r). (6.13)
2mr2 2mr2 ∂r ∂r
Con excepción del primer término, los siguientes términos dependen únicamente de r. Por
otro lado, sabemos que existen autofunciones de Lb 2 y de L
b z , que satisfacen

b 2 |l, mi = ~2 l(l + 1) hr|l, mi ,

hr|L l = 0, 1, . . .
hr|L
b z |l, mi = ~m hr|l, mi , m = −l, −l + 1, . . . , l.

Si pasamos a coordenadas esféricas vemos que las funciones hr|l, mi no tienen una dependencia
definida de r. Podemos, por lo tanto, identificar los autoestados comunes de L b 2 y de L
b z con
los llamados armónicos esféricos

Ylm (θ, φ) = hθ, φ|l, mi .

Tales funciones nos ayudan a resolver la ecuación de Schrödinger independiente del tiempo
(6.13) empleando la factorización ψE (r) = RElm (r)Ylm (θ, φ). La ecuación resultante, para la
parte radial de la función de onda es
~2 d

2 dRElm (r) l(l + 1)
− r + V (r) + RElm (r) = ERElm (r).
2mr2 dr dr 2mr2
Ya que en la ecuación radial no hay dependencia explı́cita de m podemos ignorar el subı́ndice
m.
EJERCICIO 64. Encuentre la ecuación dinámica que satisface la función uEl (r) =
rREl (r).

6.3. Átomos hidrogenoides

Los átomo hidrogenoides se modelan como dos partı́culas puntuales: un núcleo de carga Ze
y un electrón de carga −e. La función de energı́a (Hamiltoniano) es

p2n p2 Ze2
H(pn , pe , rn , r e ) = + e − (6.14)
2mn 2me 4π0 |r n − r e |
en donde pn y pe son los momentos del núcleo y del electrón y r n y r e sus posiciones.
EJERCICIO 65. Muestre que el hamiltoniano (6.14), en términos de la posición del
centro de masa, r CM y de la posición relativa, r rel , es
1 mn + me 2 Ze2
H(pCM , prel , r CM , r rel ) = p2CM + prel − . (6.15)
2(mn + me ) 2mn me 4π0 rrel
6.3. ÁTOMOS HIDROGENOIDES 109
Vemos que la dinámica del centro de masas se desacopla de la dinámica de la posición relativa.
El centro de masas se comporta como una partı́cula libre, en tanto que tenemos un problema
de potencial central para la coordenada relativa. Es usual denotar por M = mn + me a la
masa total y por µ a la masa reducida, siendo 1/µ = 1/mn + 1/me . Como la masa del núcleo
es mucho mayor que la masa del electrón, la masas total y reducida son muy parecidas a la
masa del núcleo y la del electrón, respectivamente; la posición del centro de masa casi coincide
con la del núcleo.
La ecuación de Schrödinger correspondiente al hamiltoniano (6.14) es la siguiente

~2 2 ~2 2 Ze2

i~∂t Ψ(r n , r e , t) = − ∇ − ∇ − Ψ(r n , r e , t). (6.16)
2mn n 2me e 4π0 |r n r e |
Vemos que, en el caso de dos partı́culas tenemos una función de onda que depende de las
coordenadas de ambas partı́culas. La interpretación probabilı́stica en este caso es como se
consigna a continuación. La probabilidad de hallar el núcleo en un volumen infinitesimal dVn
alrededor del punto r n y de hallar, simultáneamente al electrón en un volumen infinitesimal
dVe alrededor del punto r e , en el instante t, si en dicho instante el estado del sistema compuesto
por el núcleo y por el electrón se describe mediante la función de onda Ψ(r n , r e , t), es

|Ψ(r n , r e , t)|2 dVn dVe . (6.17)

Bajo las mismas circunstancias la densidad de probabilidad de hallar al núcleo en el punto

r n y al electrón en el punto r e es
|Ψ(r n , r e , t)|2 (6.18)
y la de hallar al núcleo en r n , independiente de la posición del electrón es
Z
|Ψ(r n , r e , t)|2 dVe , (6.19)

en donde la integral se extiende sobre todas las posiciones posibles para el electrón.
Resaltamos que la función de onda describe al sistema núcleo más electrón, y que las propie-
dades de uno, por ejemplo su posición, dependen de las propiedades del otro. Este hecho tiene
consecuencias profundas que, en particular, niegan la idea de la identidad individual de cada
uno de los subsistemas de un sistema dado. El artı́culo de Einstein, Podolsky y Rosen de 1935
[107] muestra que esta falta de individualidad no es compatible con la localidad (eta es una
lectura moderna del artı́culo, cuyo propósito inicial era demostrar que la mecánica cuántica es
incompleta), mientras que las ideas modernas del procesamiento de la información cuántica
se aprovechan de esta circunstancia.
EJERCICIO 66. Escriba la ecuación de Schrödinger (6.16) en términos de las coorde-
nadas de centro de masa y relativa, y muestre que la ecuación de Schrödinger resultante es
precisamente la correspondiente al hamiltoniano (6.15), a saber

~2 2 ~2 2 Ze2

i~∂t Ψ(r CM , r rel , t) = − ∇CM − ∇rel − Ψ(r CM , rrel , t). (6.20)
2M 2µ 4π0 rrel
EJERCICIO 67. ¿Existe alguna transformación unitaria que lleve de (6.14) a un Hamil-
toniano que tenga la misma forma de (6.15)? Esta pregunta puede ser difı́cil de contestar (al
momento de escribir creo que la respuesta es sı́, pero no sé cómo serı́a la transformación).
Una pregunta relacionada, pero más simple es la siguiente. Considere transformaciones de la
forma

U = ei(a1 ·re +a2 ·rn +b1 ·pe +b2 ·pn ) ,

en donde ai y bi , i = 1, 2, son vectores. ¿Cómo se transforma (6.14) bajo transformaciones

de este tipo?
110 CAPÍTULO 6. POTENCIALES CENTRALES
La ecuación de Schrödinger (6.20) admite la separación de las variables correspondientes
al centro de masa de aquellas de la coordenada relativa,

Ψ(r CM , r rel , t) = ΨCM (r CM , t)Ψrel (r rel , t). (6.21)

Sustituyendo (6.21) en (6.20) y dividiendo por (6.21) obtenemos

~2 ∇2CM ΨCM
2 2
Ze2

∂t ΨCM ∂t Ψrel ~ ∇rel Ψrel
i~ + i~ =− + − − ,
ΨCM Ψrel 2M ΨCM 2µ Ψrel 4π0 rrel

que puede reordenarse en la forma

~2 ∇2CM ΨCM ~2 ∇2rel Ψrel Ze2

∂t ΨCM ∂t Ψrel
i~ + = − i~ + + . (6.22)
ΨCM 2M ΨCM Ψrel 2µ Ψrel 4π0 rrel

Haciendo cada uno de los lados igual a cero obtenemos sendas ecuaciones de Schrödinger

~2 2
i~∂t ΨCM = − ∇CM ΨCM , (6.23a)
2M2
Ze2

~
i~∂t Ψrel = − ∇2rel − Ψrel . (6.23b)
2µ 4π0 rrel

La primera ecuación corresponde a la de una partı́cula libre, en tanto que la segunda corres-
ponde a un potencial central.

EJERCICIO 68. ¿Cómo cambian las ecuaciones (6.23) y sus soluciones, si la constante
de separación no se escoge igual a cero?
Podemos concentrarnos en (6.23b) y dejar de escribir el subı́ndice rel. La solución general de
(6.23b) es una superposición de funciones de onda del tipo

ΨElm (r, θ, φ) = REl (r)Ylm (θ, φ), (6.24)

en donde Ylm (θ, φ) designa los armónicos esféricos. Las funciones radiales satisfacen la ecuación

~2 1 d Ze2 ~2 l(l + 1)

2 d
− r − + REl (r) = EREl (r),
2m r2 dr dr 4π0 r 2mr2

en donde hemos empleado m para la masa reducida, en vez de µ. Pasando el término de la

derecha al lado izquierdo y multiplicando por −2m/~2 recibimos

Ze2

1 d 2 d 2m l(l + 1)
r + E + − REl (r) = 0.
r2 dr dr ~2 4π0 r r2

Esta ecuación no tiene la forma de una ecuación de Schrödinger unidimensional.

En un ejercicio anterior se pidió encontrar la siguiente ecuación dinámica (uEl (r) =
rREl (r)) 2
Ze2

d 2m l(l + 1)
+ E+ − (rREl (r)) = 0. (6.25)
dr2 ~2 4π0 r r2
La anterior tiene la forma de una ecuación de Schrödinger unidimensional con un potencial
2
Ze2 l(l+1)
efectivo igual a Vef (r) = − 4π 0r
+ ~ 2mr 2 , en donde el segundo término se conoce como el

potencial centrı́fugo o la barrera centrı́fuga, porque tiende a alejar la partı́cula del origen
de coordenadas. Como la coordenada r no puede tomar valores positivos, pero uEl (r) debe
anularse en el origen, podemos pensar que el potencial es infinito para valores negativos de la
coordenada y es igual al potencial efectivo para valores positivos.
6.3. ÁTOMOS HIDROGENOIDES 111
Dado que es conveniente emplear cantidades adimensionales, introducimos ρ y mediante las
d2 1 d2
ecuaciones r = a0 ρ y E = E0 . Empleando estas definiciones hallamos dr 2 = a2 dρ2 y
0

2 2

1 d 2mE0 2mZe 1 l(l + 1)
+ + − 2 2 (a0 ρREl (a0 ρ)) = 0.
a20 dρ2 ~2 4π0 a0 ~2 ρ a0 ρ
Esta ecuación también se puede expresar en la forma
2
2mE0 a20 2mZe2 a0 1 l(l + 1)

d
+ + − (ρREl (a0 ρ)) = 0.
dρ2 ~2 4π0 ~2 ρ ρ2
mZe2 a0 2mE0 a20 4π0 ~2
Haciendo 4π0 =1y ~2 = 1, obtenemos a0 = mZe2 y

~2 ~2 m2 Z 2 e4 mZ 2 e4
E0 = = = . (6.26)
2ma20 2m (4π0 )2 ~4 32π 2 ~2 20
Con estos valores para a0 y para E0 , la ecuación radial se simplifica,
2
d 2 l(l + 1)
+ + − (ρREl (a0 ρ)) = 0. (6.27)
dρ2 ρ ρ2
Es importante darse cuenta de que, como esta ecuación no depende de ml , ı́ndice que toma
valores entre −l y l, tenemos una degeneración. Una vez encontremos un autoestado con algún
valor de energı́a para un dado valor de l, sabemos que existe un subespacio del espacio de
Hilbert de dimensión 2l + 1 tiene la misma energı́a.

Figura 6.2: Subespacios del espacio de Hilbert para potenciales centrales, caracterizados por
sus autovalores del Hamiltoniano H y del cuadrado del momento angular L2 . En general, el
Hamiltoniano puede tener un espectro puntual (valores discretos de energı́a) y un espectro
continuo (ilustrado en la parte derecha de la figura). Los autovalores de energı́a correspondien-
te a un autovalor de L2 , digamos Eql , usualmente son diferentes a los autovalores de energı́a
correspondientes a otro autovalor de L2 , digamos Eq̃l̃ ,; es decir, Eql 6= Eq̃l̃ a menos que l = ˜l (y
q̃ = q). Los subespacios con autovalores fijos de energı́a y del cuadrado del momento angular,
son mayores cuanto mayor es este último autovalor.

6.3.1. Solución de la ecuación radial

Esta sección está basada en el apéndice C del capı́tulo VII de la referencia [108]. Con el fin de
solucionar la ecuación radial, hallamos primero su comportamiento asintótico para grandes
distancias. Cuando ρ → ∞ podemos ignorar los términos tercero y cuarto de (6.27) para
obtener 2
d
+ (ρREl (a0 ρ)) = 0, ρ → ∞,
dρ2
112 CAPÍTULO 6. POTENCIALES CENTRALES
cuyas soluciones son
1 ±√−ρ
REl (a0 ρ) ∼ (e ).
ρ
Si la energı́a es positiva (todos los valores positivos son posibles) tendremos ondas esféricas.
Estas soluciones no son normalizables. En caso de que la energı́a sea negativa < 0 la solución
que puede tener interpretación probabilı́stica es aquella con el signo negativo. De esta forma,
escogemos la función radial en la forma
√
ρREl (a0 ρ) = e− −ρ
ηEl (ρ)

de suerte que, empleando la regla de Leibniz

n
dn

X n
(f (x)g(x)) = (f g)(n) = f (n−k) g (k) , (6.28)
dx n k
k=0

obtenemos

d2 d2 −√−ρ d √ dηEl √ d2 ηEl

(ρREl (a0 ρ)) = (e )ηEl (ρ) + 2 (e− −ρ ) + e− −ρ
dρ2 dρ 2 dρ dρ dρ2
√ √ √ dηEl √ d2 ηEl
= −e− −ρ ηEl (ρ) − 2 −e− −ρ + e− −ρ
dρ dρ2
√ 2 √ dηEl

d ηEl
= e− −ρ 2
− 2 − − ηEl (ρ) .
dρ dρ

De esta forma, a partir de la ecuación (6.27) encontramos la ecuación diferencial que satisface
ηEl (ρ)
2 √ dηEl

dηEl 2 l(l + 1)
− 2 − + − ηEl = 0, (6.29)
dρ2 dρ ρ ρ2
√
en donde hemos omitido el factor común e− −ρ . A pesar de que se ha aislado el comporta-
miento deseado, una exponencial decreciente a medida que ρ aumenta, la segunda solución,
que crece exponencialmente, todavı́a está ahı́. Es necesario identificar esa solución y recha-
zarla cuando aparezca.
La ecuación (6.29) se puede resolver usando el método de Frobenius, una generalización de
las series de potencias en donde el primer término es ρs . Esta expansión también nos permite
examinar enseguida el comportamiento de la solución para valores pequeños de ρ, ρ → 0.
El método de Frobenius supone que la solución es de la forma
∞
(El) s+k
X
ηEl (ρ) = ck ρ ,
k=0

(El)
en donde el primer coeficiente, c0 , es diferente de cero. Por simplicidad, no vamos a ignorar
(El)
el superı́ndice (El) de los coeficientes ck ; es decir, vamos a usar la notación más simple ck .
Las expresiones para las dos primeras derivadas son
∞
dηEl (ρ) X
= (s + k)ck ρs+k−1 ,
dρ
k=0
2 ∞
d ηEl (ρ) X
= (s + k)(s + k − 1)ck ρs+k−2 .
dρ2
k=0
6.3. ÁTOMOS HIDROGENOIDES 113
Reemplazando estas dos expresiones en la ecuación diferencial (6.29) encontramos
∞ ∞
X √ X
(s + k)(s + k − 1)ck ρs+k−2 − 2 − (s + k)ck ρs+k−1
k=0 k=0
∞
X ∞
X
− l(l + 1) ck ρs+k−2 + 2 ck ρs+k−1 = 0.
k=0 k=0

Juntando las suma que tienen la misma potencia de ρ quedamos únicamente con dos sumas,
∞ ∞
X X √
[(s + k)(s + k − 1) − l(l + 1)] ck ρs+k−2 + 2 (1 − (s + k) −)ck ρs+k−1 = 0.
k=0 k=0

El primer término de la serie, el de más baja potencia, es el correspondiente a s − 2. El

coeficiente de este término viene únicamente de la primera suma y es

[(s − 1)s − l(l + 1)] c0 = [(s − 1)s − (−l − 1)(−l)] c0 = 0.

Dado que el coeficiente c0 no puede ser cero, las dos soluciones posibles son s = l + 1 y s = −l.
Escogemos la primera solución. La segunda solución produce contribuciones proporcionales a
la delta de Dirac o de sus derivadas (recuerde que es necesario tomar el Laplaciano).
Ahora, sustituı́mos el valor de s en la ecuación de sumas de potencias,
∞ ∞
X X √
[(l + 1 + k)(l + k) − l(l + 1)] ck ρl+k−1 + 2 (1 − (l + 1 + k) −)ck ρl+k = 0.
k=0 k=0

Teniendo en cuenta que (l + 1 + k)(l + k) = (l + 1)l + (l + 1)k + kl + k 2 = (l + 1)l + k(2l + 1 + k),

podemos simplificar la ecuación anterior
∞ ∞
X X √
k(2l + 1 + k)ck ρl+k−1 + 2 (1 − (l + 1 + k) −)ck ρl+k = 0.
k=0 k=0

Dado que el primer término de la primera suma es cero, podemos empezar la suma desde
k = 1. En cuanto a la segunda suma, hacemos k = k̃ − 1. Haciendo estos cambios, la igualdad
anterior se convierte en
∞ ∞
X X √
k(2l + 1 + k)ck ρl+k−1 + 2 (1 − (l + k̃) −)ck̃−1 ρl+k̃−1 = 0.
k=1 k̃=1

Ahora tenemos en cuenta que podemos cambiar el nombre de los ı́ndices de las sumas. Por
ejemplo, podemos hacer k̃ = k en la segunda suma. Este cambio de nombre permite juntar
las dos suma en una,
∞
X √
k(2l + 1 + k)ck − 2((l + k) − − 1)ck−1 ρl+k−1 = 0.

k=1

Para que esta suma sea cero es necesario que cada uno de los coeficientes sea cero, es decir,
√
k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 . (6.30)

Esta recurrencia nos permite escribir todos los coeficientes de la suma infinita
√
en términos del
ck 2 −
primer coeficiente c0 . Además, como el lı́mite lı́mk→∞ ck−1 = lı́mk→∞ k = 0, el criterio de
la razón nos garantiza que la serie es convergente. De hecho la serie converge para cualquier
valor de ρ, porque lı́mk→∞ cck−1
kρ
= 0, para cualquier valor (finito) de ρ.
114 CAPÍTULO 6. POTENCIALES CENTRALES
Nos gustarı́a saber como se comporta la serie que soluciona la ecuación diferencial (6.29).
P∞ k ck λk (k−1)!
Sabiendo que eλρ = k=0 λk! ρk , vemos que la razón ck−1 se comporta como k(k−1)! λk−1
= λk .
Comparando con el comportamiento √
de la serie que soluciona la ecuación (6.29), vemos
√
que
dicha serie se comporta como √e2 −t para valores grandes de ρ, de manera que e− −t por
esta serie se comporta como e2 −t . Ası́, concluı́mos que la solución divergente que querı́amos
evitar se ha vuelto a presentar. Para evitar este comportamiento asintótico es necesario, por lo
tanto, que la serie no sea infinita, sino que se reduzca a un polinomio. A partir de la ecuación
de recurrencia (6.30), vemos que la condición para que esto suceda es que la√energı́a no
pueda tomar valores arbitrarios. De hecho, vemos que debe satisfacer (l + k) − = 1 para
algún entero no negativo k. Ya que hemos usado la letra k para rotular los coeficientes, es
necesario que empleemos una letra diferente para designar un valor arbitrario, pero √ fijo de k.
Usando la letra q, vemos que la condición que debe satisfacer la energı́a es (l + q) − = 1, es
1
decir, q,l = − (q+l)2 , en donde hemos hecho alusión directa a que la energı́a depende de dos

(El) (ql)
enteros, l y q. Podemos restaurar los rótulos en la notación de los coeficientes ck = ck , de
modo que las relaciones de recurrencia pueden escribirse como
(ql) √ (ql) 1 (ql)
k(2l + 1 + k)ck = 2((l + k) − − 1)ck−1 = 2((l + k) − 1)ck−1
q+l
l + k − l − q (ql) q − k (ql)
=2 ck−1 = −2 c .
q+l q + l k−1
P∞ (ql)
Teniendo en cuenta la definición original de la función eta ηEl (ρ) = ηql (ρ) = k=0 ck ρk+l+1 ,
en donde hemos usado el valor de s = l + 1 obtenido con el método de Frobenius, podemos
cortar la suma para no incluir términos cuyos coeficientes sean exactamente iguales a cero,
Pq−1 (ql)
ηql (ρ) = k=0 ck ρk+l+1 . Vemos que la funciones η son polinomios cuyo orden más bajo es
l + 1 y cuyo orden más alto es k + l.
EJERCICIO 69. Muestre que
k
(ql) k 2 (q − 1)! (2l + 1)! (ql)
ck = (−1) c .
q+l (q − k − 1)! k!(k + 2l + 1)! 0
EJERCICIO 70. Volviendo a las variables originales, muestre que
2
Rq=1,l=0 (r) = 3/2
e−r/a0 ,
a0

2 r
Rq=2,l=0 (r) = 1 − e−r/2a0 ,
(2a0 )3/2 2a0
1 r
Rq=1,l=1 (r) = 3/2
√ e−r/2a0 .
(2a0 ) 3a0
EJERCICIO 71. ¿Cómo están normalizadas las funciones de onda radiales del ejercicio
precendente?

6.3.2. Órdenes de magnitud

2
En la subsección anterior empleamos a0 como escala de longitud, a0 = 4π 0~
µZe2 . Recordemos
que las masas del protón del protón y del electrón son mp = 1,7 × 10−27 kg y 0,91 × 10−30 kg,
respectivamente. La magnitud de las cargas de estas partı́culas es 1,6×10−19 C, siendo positiva
la del protón y negativa la del electrón. Mientras la permitividad el vacı́o, 0 , es 8,854 × 10−12
Fm−1 , la fracción 4π
1
0
tiene el valor aproximado de 9×109 N m2 C−2 . Finalmente, ~ = 1,055×
−34
10 Js. Empleando estos valores, recordando que la masa reducida µ es aproximadamente
igual a la masa del electrón y haciendo Z = 1 obtenemos a0 ≈ 0,52 Å.
6.3. ÁTOMOS HIDROGENOIDES 115
~2
Además de la escala de longitud, también hemos usado una escala de energı́a E0 = 2µa 2.
0
−19
Usando los valores de las constantes citados arriba, y recordando que 1 eV = 1,6 × 10 J,
encontramos E0 ≈ 13,6 eV. Una forma alternativa de escribir la escala de energı́a, introdu-
µZ 2 e4 Z2 e4 2
ciendo la rapidez de la luz en el vacı́o,c, es E0 = 32π 2 ~2 2 = 2 16π 2 2 ~2 c2 µc
2
= Z2 α2 µc2 , en
0 0
2
1
donde α = 4πe0 ~c ≈ 137 es la llamada constante de estructura fina. Como la escala de energı́a
es mucho menor que la energı́a de reposo del electrón (más precisamente, de la masa asociada
a la coordenada relativa), E0 µc2 , entonces se justifica usar la versión no relativista de la
mecánica cuántica, en donde los efectos relativistas se pueden calcular como perturbaciones.

6.3.3. Degeneración accidental

Figura 6.3: Subespacios de Hilbert para potencial atractivo 1r .

En la figura 6.2 dibujamos la estructura del espacio del Hilbert para potenciales centrales,
en la cual resaltamos dos hechos. El primero es que los autovalores de energı́a para valores
diferentes del cuadrado del momento angular son, en general, diferentes. El segundo es que
existe una degeneración esencial debido a que la ecuación de Schrödinger radial independiente
del tiempo, no involucra el valor del momento angular alrededor del eje z; es decir, no depende
del valor de m. Como existen 2l + 1 valor de m, existe una degeneración esencial de orden
2l + 1. En el caso del potencial 1r , sin embargo, existe una degeneración accidental, pues
los autovalores de energı́a no dependen de los número q y l, de manera independiente, sino
solamente de su suma. En la figura 6.3 se muestra la estructura del espacio de Hilbert para
el potencial de Coulomb. La primera autoenergı́a E1 , solamente se presenta cuando l = 0; la
segunda cuando l = 0 y l = 1; la n-ésima energı́a, En se presenta cuando l = 0, 1, · · · , n − 1.
Para la parte continua del espectro, dibujada en la parte derecha de la figura 6.3, se puede
tener cualquier valor de momento angular.
La degeneración del subespacio de Hilbert con un valor dado de energı́a, dn , puede calcu-
larse empleando la degeneración conocida, dl , de los subespacios con cuadrado del momento
116 CAPÍTULO 6. POTENCIALES CENTRALES
angular dado:

n−1 n−1 n−1 n−1

X X X X (n − 1)n
dn = dl = (2l + 1) = 2 l+ 1=2 + n = n2 .
2
l=0 l=0 l=0 l=0

Los subespacios de energı́a constante positiva, por su parte, tienen dimensión infinita (conta-
ble).
Dada la degeneración accidental, se define el número cuántico principal n = q + l. Los
autoestados del átomo de hidrógeno se caracterizan por tres números cuánticos: el número
cuántico principal n que está relacionado con los autovalores de energı́a, el número cuántico
azimutal l que indica la magnitud del cuadrado del momento angular, y el número cuántico
magnético m asociado con la componente z del momento angular. 1 En sı́mbolos, escribimos

µe4 1
H |nlmi = − 2 |nlmi , L2 |nlmi = ~2 l(l + 1) |nlmi ,
32π 0 ~ n2
2 2

Lz |nlmi = ~m |nlmi .

Por razones históricas, existe una notación para los diferentes subespacios de cuadrado del
momento angular constante: s (sharp) para l = 0, p (principal) para l = 1, d (diffuse) para
l = 2 y f (fundamental) para l = 3. 2 Los siguientes valores de cuadrado del momento angular
se caracterizan por letras en orden alfabético: g para l = 4, h para l = 5, etc.
Los niveles de energı́a también recibieron nombre por razones históricas: n = 1 es K, n = 2
es L, etc. Esta notación es la misma que se ha usado en el área de rayos X. Las transiciones
entre diferentes niveles de energı́a constituye uno de los principales hechos experimentales que
se descubrieron antes de tener una teorı́a que los explicase. La luz emitida cuando un átomo
de hidrógeno pasa de un nivel de energı́a n al primer nivel de energı́a (estado fundamental)
tiene frecuencia e inverso de la longitud de onda iguales a

µe4 µe4

1 1 1 1
ω1n = 1− 2 y = 1 − 2 = RH 1 − 2 ,
64π 3 20 ~3 n λ1n 64π 3 20 ~3 c n n

respectivamente, en donde supusimos que n ≥ 2. Johannes Rydberg introdujo en 1988 la

constante RH , que ahora lleva su nombre, como un parámetro para ajustar las series espec-
trales del hidrógeno. La lı́neas de emisión predichas por la ecuación anterior corresponden a
la llamada serie de Lyman y caen en el ultravioleta (ver Figura 6.4). Las series de Balmer
y de Paschen, dadas por λ2n (n ≥ 3) y λ3n (n ≥ 3), caen parcialmente en el visible y en el
infrarrojo, respectivamente (ver Figura 6.4), y están dadas por la fórmula general

1 1 1
= RH − 2 , n2 > n1 .
λn1 ,n2 n21 n2

Cada serie tiene una longitud de onda mı́nima y una máxima; es decir, cada serie ocupa una
región bien definida del espectro.
EJERCICIO 72. Escriba todas las funciones de onda correspondientes al número cuántico
principal n igual a 1 y a 2, destacando los valores de l y m y relacionándolos con la notación
q, l empleada anteriormente.
1 Vale la pena mencionar que, en general, para potenciales centrales, la energı́a depende tanto de l como de

otro número cuántico.

2 De hecho, se argumenta que estas letras no deben venir del inglés, sino del alemán, pues en la época en

que se acuñaron estos términos, esa era la lengua de la ciencia. De hecho, en el libro de Sommerfeld (referencia
[109], p.230) se habla de Prinzipalserie (p), diffuse Nebenserie (d), scharfe Nebenserie (s) y Bergmannserie
(d). Solamente a la última serie se le asocia una letra diferente a aquella empleada en este libro.
6.3. ÁTOMOS HIDROGENOIDES 117

Figura 6.4: Espectro parcial del Hidrógeno, desde n = 1 hasta n = 3. La escala de longitud
de ondas, en nanómetros, es logarı́tmica. [Caitlin Jo Ramsay, CreativeCommons]

6.3.4. Autofunciones de ondas radiales como polinomios asociados

de Laguerre
Las autofunciones radiales que escribimos anteriormente pueden escribirse en términos
de polinomios asociados de Laguerre (antes conocidos como polinomios de Sonine, debido a
su inventor Nikolay Yakovlevich Sonin [118]), como vamos a mostrar. Algunos cálculos se
facilitan cuando las autofunciones se escriben de esta
√
manera. Recordemos que la función
− −ρ
de onda radial puede escribirse como REl (a0 ρ) = e ρ ηEl (ρ), en donde la función ηnl (ρ)
satisface la ecuación diferencial
d2 ηEl √ dηEl

2 l(l + 1)
− 2 − + − ηEl = 0.
dρ2 dρ ρ ρ2
Aquı́, hemos retornado a la notación que empleamos antes de encontrar los autovalores de
energı́a. Dado que ya sabemos que = n = − n12 , en donde n es el número cuántico principal,
reescribimos la ecuación anterior en la forma
d2 ηnl

2 dηnl 2 l(l + 1)
− + − ηnl = 0.
dρ2 n dρ ρ ρ2
Aislamos el comportamiento que debe tener la función de onda para distancias cortas,
ηnl (ρ) = ρl+1 σnl (ρ), y encontramos la ecuación diferencial correspondiente a σnl (ρ). Em-
pleamos nuevamente la regla de Leibniz (6.28), para calcular las dos primeras derivadas de
ηnl (ρ),
d2 ηnl d2 d dσnl d2 σnl
2
= 2 (ρl+1 )σ + 2 (ρl+1 ) + ρl+1
dρ dρ dρ dρ dρ2
dσnl d2 σnl
= l(l + 1)ρl−1 σ + 2(l + 1)ρl + ρl+1 ,
dρ dρ2
dηnl d(ρl+1 ) dσnl dσnl
= σnl + ρl+1 = (l + 1)ρl σnl + ρl+1 .
dρ dρ dρ dρ
Sustituyendo estos resultados en la ecuación de autovalores y autovectores de ηnl (ρ), encon-
tramos la ecuación correspondiente para σnl (ρ)
d2 σnl dσnl
ρl+1 + 2(l + 1)ρl + l(l + 1)ρl−1 σnl
dρ2 dρ
2 dσnl 2
− ρl+1 − (l + 1)ρl σnl + 2ρl σnl − l(l + 1)ρl−1 σnl = 0.
n dρ n
118 CAPÍTULO 6. POTENCIALES CENTRALES
Juntando términos simplificamos esta ecuación

d2 σnl

1 dσnl 1
ρ +2 l+1− ρ + 2 1 − (l + 1) σnl = 0.
dρ2 n dρ n

Hacemos un cambio de escala adicional, ρ = nx/2, de modo que la ecuación queda ası́

n 4d2 σnl x 2 dσnl 1

x 2 2 +2 l+1− + (2 − 2 (l + 1))σnl = 0.
2 n dx 2 ndx n
Después de multiplicar por n/2 y simplificar, encontramos la ecuación diferencial satisfecha
por σnl (x),
d2 σnl dσnl
x 2
+ (2(l + 1) − x) + (n − (l + 1))σnl = 0. (6.31)
dx dx
Recordemos que, en la notación de las referencias [111, 112, 110, 113], la ecuación satisfecha
por los polinomios asociados de Laguerre es

d2 p d
x L (x) + (p + 1 − x) Lpm (x) + (m − p)Lpm (x) = 0. (6.32)
dx2 m dx
Si comparamos (6.31) con (6.32) encontramos p = 2l + 1, y m = p + n − l − 1 = n + l. Ası́, la
solución regular de (6.31) es σnl (x) = Lpm (x) = L2l+1
n+l (x). La notación empleada aquı́ no es,
sin embargo, única. Por ejemplo, Mathematica R
y las referencias [116, 117, 114, 115], notan
la solución regular de la ecuación (6.32) como (−1)p L̄pm−p (x); por lo tanto, en esas referencias,
la solución regular de (6.31) es −L̄2l+1 3
n−l−1 (x). Es necesario, por lo tanto, tener mucho cuidado
con la notación empleada, especialmente si se mezclan las referencias. En cualquiera de las
dos notaciones, la escala de longitud cambia con n, el número cuántico principal.

En términos de los polinomios asociados de Laguerre las funciones de onda radiales son de la
forma
1 √
Rnl (ρ) = N e− −n ρ ηnl (ρ),
ρ
(6.33)
1 −√−n ρ l+1 2l+1 1 −√−n ρ l+1 2l+1 2ρ

=N e ρ Ln+l (x) = N e ρ Ln+l
ρ ρ n

En las ecuaciones (6.33) N es una constante de normalización.

6.3.5. Polinomios de Laguerre y asociados

p
d
Los polinomios asociados de Laguerre están definidos como Lpm (x) = dx p Lm (x), en donde

Lm (x), el m-ésimo polinomio de Laguerre, satisface la ecuación diferencial

d2 Lm (x) dLm
x 2
+ (1 − x) + mLm (x) = 0.
dx dx
Como primer paso vamos a demostrar que si Lm (x) es el m-ésimo polinomio de Laguerre,
entonces su p-ésima derivada satisface la ecuación diferencial (6.32). En efecto, derivando la
ecuación anterior p veces, y empleando la regla de Leibniz (6.28) sigue
2 p
d dp Lm d dp Lm dp Lm

d d Lm
x 2 +p + (1 − x) −p
dx dxp dx dxp dx dxp dxp
p
d Lm
+m = 0.
dxp
3 Aquı́, hemos usado L̄ en vez de L para acentuar la diferencia.
6.3. ÁTOMOS HIDROGENOIDES 119
Después de simplificar, encontramos la ecuación (6.32)

d2 dp Lm d dp Lm
p
d Lm
x 2 + (p + 1 − x) + (m − p) = 0.
dx dxp dx dxp dxp
Anteriormente, hallamos una expansión en serie de potencias para las funciones de onda
radiales (aparte del factor que decrece con la distancia de manera exponencial). Vamos a
encontrar esa expansión usando el método de la referencia [119] (p.220) esta vez, y empleando
el número cuántico principal n, en vez del parámetro q. Usamos el Ansatz,
I
p
Lm (x) = f (t)e−xt dt, (6.34)
C

en donde la curva de integración, C, no se ha definido todavı́a. Empleando este Ansatz en la

ecuación diferencial (6.31) obtenemos
I
f (t) xt2 − (p + 1 − x)t + m − p e−xt dt,

0=
IC
d d
= f (t) −t2 − t p + 1 + + m − p e−xt dt,
dt dt
I C I
d d
f (t) t2 + t e−xt dt = f (t) (−t (p + 1) + m − p) e−xt dt.
C dt dt C

Transformamos el lado izquierdo teniendo en cuenta que

d de−xt df
(t2 + t)e−xt f (t) = (2t + 1)e−xt f (t) + (t2 + t) f (t) + (t2 + t)e−xt .

dt dt dt
Las nuevas integrales sobre el plano complejo son
I I
d 2 −xt
−xt 2 df
(t + t)e f (t) dt − e (2t + 1)f (t) + (t + t) dt
C dt C dt
I
= f (t) (−t (p + 1) + m − p) e−xt dt.
C

Escogiendo un camino cerrado C, la primera integral es cero. Si pasamos la segunda integral

al lado derecho encontramos
I
df −xt
0= f (t) (−t (p − 1) + m − p + 1) + t(t + 1) e dt.
C dt
Esta integral es cero si el integrando es cero,
df −t (p − 1) + m − p + 1 m−p+1 m
=− dt = − dt + dt.
f t(t + 1) t t+1
Al integrar encontramos

ln(f ) = −(m − p + 1) ln t + m ln(t + 1) + ln A,

(t + 1)m
f (t) = A ,
tm−p+1
en donde A es una constante. Substituimos en el Ansatz (6.34) para obtener una representación
integral de los polinomios de Laguerre (todavı́a sin normalización definida)
(t + 1)m −xt
I
p
Lm (x) = A m−p+1
e dt, (6.35)
C t
120 CAPÍTULO 6. POTENCIALES CENTRALES
en donde podemos escoger C como una curva cerrada que incluye el origen, porque la función
(t+1)m
tm−p+1 no tiene puntos de ramificación a lo largo de esa curva (tanto m como m − p + 1 son
números enteros).
Teniendo en cuenta la integral en el plano complejo C ta dt = 2πiδa,−1 , en donde C es una
H

curva horaria4 cerrada que encierra el origen y a es un entero, vemos que solamente el polo
simple en el origen contribuye a la integral (6.35). Expandimos (t + 1)m y e−xt como series
de potencias alrededor de t = 0,
m ∞
(−1)n xn n
I X
m! X
Lpm (x) =A tr t−m+p−1 t dt,
C r=0 r!(m − r)! n=0
n!
∞ X m
(−1)n xn
I
X m! dt
=A tn+r+p−m ,
n=0 r=0
n! r!(m − r)! C t
m
X (−1)m−p−r xm−r−p m!
= 2πiA ,
r=0
(m − p − r)! r!(m − r)!

en donde los términos que contribuyen son tales que m − r − p ≥ 0. Debido a la presencia
del factorial (m − p − r) en el denominador, los términos en que esta desigualdad se incumple
son, efectivamente, cero. Podemos, sin embargo, quitarlos explı́citamente: el máximo valor
que puede tomar r es m − p. Ası́,
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = 2πiA , (6.36)
r=0
(m − p − r)! r!(m − r)!

La constante de normalización se escoge de manera que L0m (0) = Lm (0) = m!, es decir,
m!
A = 2πi y

(t + 1)m −xt
I
m!
Lm (x) = e dt. (6.37)
2πi C tm+1

En Fı́sica, la constante de normalización es m! más grande que en otras convenciones utilizadas

para los polinomios de Laguerre.
Teniendo en cuenta que

dm −x(t+1)
e = (−1)m (t + 1)m e−x(t+1) ,
dxm
dm
(t + 1)m e−xt = (−1)m ex m e−x(t+1) ,
dx
escribimos el m-ésimo polinomio de Laguerre como

(−1)m m!ex dm e−x(t+1)

I
Lm (x) = dt.
2πi dxm C tm+1
P∞ n
(−xt)
Usando nuevamente e−x(t+1) = e −x
ta dt = 2πiδa,−1 podemos evaluar la
H
n=0 n! y C
integral,

(−1)m m!ex dm (−x)m −x dm

= ex m xm e−x .

Lm (x) = 2πi e (6.38)
2πi dxm m! dx

La ecuación (6.38) es la fórmula de Rodrigues para los polinomios de Laguerre.

4 Una curva que se recorre en el sentido horario en el plano complejo
6.3. ÁTOMOS HIDROGENOIDES 121
A partir de la representación integral (6.37) podemos hallar la fórmula siguiente para los
polinomios asociados de Laguerre
m! dp (t + 1)m −xt (−1)p m! (t + 1)m −xt
I I
Lpm (x) = p m+1
e dt = m−p+1
e dt.
2πi dx C t 2πi C t

Merece la pena mencionar, una vez más, que en la notación alternativa la fase se escoge de
manera diferente (note la ausencia del factor (−1)p )
(t + 1)m −xt
I
p m!
L̄m−p (x) = e dt.
2πi C tm−p+1
Volvamos a la ecuación (6.36)
m−p
X (−1)m−p−r xm−p−r m!
Lpm (x) = m! ,
r=0
(m − p − r)! r!(m − r)!

Vamos a escribir los términos de la serie anterior, comenzando por el término r = m − p y

finalizando en el término r = 0.
x0 m! x m! x2 m!
Lpm (x) = m! − m! + m!
0! (m − p)!p! 1! (m − p − 1)!(p + 1)! 2! (m − p − 2)!(p + 2)!
(−1)m−p xm−p m!
+ · · · + m! .
(m − p)! (m − p − (m − p))!(p + m − p)!
El patrón es evidente; el polinomio asociado de Legendre, Lpm (x), como una serie ascendente
de potencias de x es
m−p
X (−1)n xn m!
Lpm (x) = m! . (6.39)
n=0
n! (m − p − n)!(p + n)!

Consideremos la función
t ∞ l ∞
e−x 1−t (−1)l xl t l
X 1 1
xt X
= − = . (6.40)
1−t 1 − t l! 1−t l! (1 − t)l+1
l=0 l=0

El término del denominador puede ser expandido, empleando el teorema del binomio, en el
caso |t| < 1.
1 (l + 1)t (l + 1)(l + 2)t2 (l + 1)(l + 2)(l + 3)t3
l+1
=1+ + + + ···
(1 − t) 1! 2! 3!
(l + 1)! (l + 1)! (l + 2)! 2 (l + 3)! 3
= + t+ t + t + ···
(l + 1)!0! l!1! l!2! l!3!
∞
X (l + k)! k
= t .
l!k!
k=0

Insertando esta expansión en la ecuación (6.40) se tiene

t ∞ ∞
ex 1−t X X (−1)l (l + k)!tk
= xl t l .
1−t l! l!k!
l=0 k=0

Después de hacer el cambio de ı́ndice m = l + k, la expansión queda

t ∞ X m ∞
e−x 1−t X (−1)n m!xn tm X
0 tm
= m! = L (x) , (6.41)
1−t m=0 n=0
(n!)2 (m − n)! m! m=0 m m!
122 CAPÍTULO 6. POTENCIALES CENTRALES
en donde, a partir de haber reconocido explı́citamente que n va desde cero hasta m, hemos
−x t
1−t
verificado que la función e 1−t genera los polinomios de Laguerre.
Si derivamos (6.41) p veces con respecto a x, encontramos las funciones generadoras de los
polinomios asociados de Laguerre
p −x t t ∞ ∞
(−1)p tp e−x 1−t dp Ln (x) tn tn

t e 1−t X X
p
− = = = Ln (x) . (6.42)
1−t 1−t (1 − t)p+1 n=0
dxp n! n=0 n!

Si multiplicamos las dos expresiones de la forma (6.42) y multiplicamos por e−x xp+q obtene-
mos
∞ X ∞
tp up xp+q e−x[ 1−t + 1−u +1]
t u
X
p+q −x p p tn um
p+1 = x e Ln (x)Lm (x) . (6.43)
[(1 − t)(1 − u)] n=0 m=0
n!m!

Si integramos
h i respecto a x en el intervalo [0, ∞) y hacemos el cambio de variable
(6.43) con
t u
z = x 1−t + 1−u + 1 , encontramos

∞
tp up
Z
xp+q e−x[ 1−t + 1−u +1]
t u

p+1 dx
0 [(1 − t)(1 − u)]
∞ −(p+q+1)
tp up
Z
t u
= + +1 z p+q+1−1 e−zp+1 dz
0 1−t 1−u [(1 − t)(1 − u)]
−(p+q+1)
tp up

t u
= + +1 Γ(p + q + 1) p+1 ,
1−t 1−u [(1 − t)(1 − u)]

en
R ∞donde pudimos relizar la integral empleando la definición de la función Γ(z), Γ(z) =
−t z−1
0
e t dt. Teniendo en cuenta que
−(p+q+1) −(p+q+1)
t u (1 − u)t + u(1 − t) + (1 − t)(1 − u)
+ +1 =
1−t 1−u (1 − t)(1 − u)
(p+q+1)
(1 − t)(1 − u)
= .
1 − ut

recibimos
∞
tp up
Z
−x[ 1−t
t u
+ 1−u +1]
xp+q p+1 e dx
0 [(1 − t)(1 − u)]
p+q+1
tp up

(1 − u)(1 − t)
= p+1 Γ(p + q + 1) (6.44)
[(1 − t)(1 − u)] 1 − ut
tp up (1 − u)q (1 − t)q
= p+q+1 (p + q)!,
[1 − ut]

en donde hicimos uso de la identidad Γ(x + 1) = x!. Empleando las expansiones binomiales
de (1 − tu)−(p+q+1) , (1 − u)q y (1 − t)q , el resultado de la integral es
∞ q q
X (p + q + k)! X (−)a q! a X (−)b q! b
= (p + q)! (ut)p+k u t
(p + q)!k! (q − a)!a! (q − b)!b!
k=0 l=0 b=0
q X
∞ X q
X (p + q + k)! q! q!
= (−)a+b up+k+a tp+k+b .
k! (q − a)!a! (q − b)!b!
k=0 a=0 b=0
6.3. ÁTOMOS HIDROGENOIDES 123
Empleando (6.43) hallamos el resultado
∞ Z ∞
X tn um
xp+q e−x Lpn (x)Lpm (x) dx = (6.45)
m,n=0 0 n!m!
q X
∞ X q
X (p + q + k)!q!q!
(−)a+b up+k+a tp+k+b .
k!(q − a)!a!(q − b)!b!
k=0 a=0 b=0

Finalmente comparando los coeficientes de tn um hallamos una familia de integrales. Por ejem-
plo, si hacemos q = 0 hallamos
∞ Z ∞ ∞
X tn um X (p + k)!
xp e−x Lpn (x)Lpm (x) dx = up+k tp+k .
m,n=0 0 n!m! k!
k=0

Comparando los coeficientes del polinomio en las variables u y t encontramos

Z ∞
n!
xp e−x Lpn (x)Lpm (x)dx = n!m! δm,n n ≥ p, (6.46)
0 (n − p)!

relación que con ı́ndices ligeramente diferentes se puede expresar como

Z ∞
(n + l)!
x2l+1 e−x L2l+1 2l+1
n+l (x)Ln0 +l (x)dx = δn,n0 (6.47)
0 (n + l − (2l + 1))!
(n + l)!
= δn,n0 l ≤ n − 1.
(n − l − 1)!

Las relaciones (6.46) y (6.47) corresponden a la relación de ortogonalidad de los polinomios

de Laguerre.
EJERCICIO 73. Usando como ejemplos las funciones de onda correspondientes a n=0,
1 y 2, escriba explı́citamente los polinomios y verifique las integrales del tipo (6.47).
EJERCICIO 74. Vuelva a las variables originales y escriba las autofunciones normalizadas
del átomo de Hidrógeno con autovalores negativos.
EJERCICIO 75. Calcule el valor esperado de la distancia relativa entre el electrón y el
protón en un átomo de Hidrógeno que se encuentra en uno de sus autoestados de energı́a y
tiene un valor bien definido del cuadrado del momento angular.
EJERCICIO 76. Calcule el valor esperado de la energı́a potencial en un átomo de
Hidrógeno que se encuentra en uno de sus autoestados de energı́a y tiene un valor bien
definido del cuadrado del momento angular.
124 CAPÍTULO 6. POTENCIALES CENTRALES
Alfabeto griego

alfa α A
beta β B
gamma γ Γ
delta δ ∆
épsilon , ε E
dseda ζ Z
eta η E
zeta θ, ϑ Θ
iota ι I
kappa κ K
lambda λ Λ
mi µ M
ni ν N
xi ξ Ξ
ómicron o O
pi π, $ Π
ro ρ, % R
sigma σ, ς Σ
tau τ T
ı́psilon υ Υ
fi φ, ϕ Φ
ji chi X
psi ψ Ψ
omega ω Ω

125
126 ALFABETO GRIEGO
Bibliografı́a

[1] Barus, Carl. “The Progress of Physics in the Nineteenth Century”, Science 22, no. 560
(1905): 353-69. Accessed February 19, 2020. [Link]/stable/1631845.

[2] L. B. Spinney, “The ether concept in modern physics”, Science 72, Issue 1865, pp. 303-310
(1930).

[3] Thomas Young, “Experimental demonstration of the General Law of the Interferene of
Light, ” Philosophical Transactions of the Royal Society of London 94 (1804).

[4] Young, Thomas (1807), A Course of Lectures on Natural Philosophy and the Mechanical
Arts, London: Joseph Johnson

[5] Henry Crew, “Thomas Young’s Place in the History of the Wave Theory of Light”, J.
Opt. Soc. Am. 20, 3-10 (1930)

[6] Roberto Torretti, “Getting rid of the ether. Could Physics have achieved it sooner, with
better assistance from Philosophy?”, THEORIA. An International Journal for Theory,
History and Foundations of Science, [S.l.] 22, n. 3, 353-374, (2009).

[7] Arago (1819). “Rapport fait par M. Arago à lÁcadémie des Sciences, au nom de la
Commission qui avait été chargée déxaminer les Mémoires envoyés au concours pour le
prix de la diffraction”. Annales de Chimie et de Physique. 2nd series (in French). 11:
5–30

[8] Delisle, J.-N. (1715). “Sur léxpérience que jái rapportée à lÁcademie dún anneau lumi-
neux semblable à celui que lón apperçoit autour de la lune dans les eclipses totales du
soleil”[On the experience that I reported to the Academy about a luminous ring similar to
that which one sees around the moon during a total solar eclipse]. Histoire de lÁcadémie
Royale des Sciences ... Avec les Mémoires de Mathématique & de Physique (in French):
166–169.

[9] Maraldi, G.F. (1723). “Diverses expèriences dóptique”. Histoire de lÁcadémie Royale des
Sciences ... Avec les Mémoires de Mathématique & de Physique (in French): 111–143.

[10] Valéria Silva Dias, Roberto de Andrade Martins, “Michael Faraday: o caminho da livraria
à descoberta da indução eletromagnética”, Ciência & Educação (Bauru) 10, No. 3, 517–
530 (2004)

[11] Cibelle Celestino Silva, Roberto de Andrade Martı́ns, “William Thomson eo Uso de
Analogias e Modelos no Eletromagnetismo”, Epistemologıá e Historia de la Ciencia, Se-
lección de trabajos de las XIII Jornadas, Vol 9, No. 9, 401–409 (2003).

[12] James Clerk Maxwell VIII. A dynamical theory of the electromagnetic field Phil. Trans.
R. Soc. 155459–512 (1864)

127
128 BIBLIOGRAFÍA
[13] Maxwell, James Clerk (1878), “Ether”, Encyclopædia Britannica Ninth Edition 8: 568 -
572

[14] Badash, Lawrence. “The Completeness of Nineteenth-Century Science”, Isis 63, no. 1
(1972): 48-58. Accessed February 17, 2020. [Link]/stable/229193.

[15] Francisco Caruso, “Proceso e Transformação para além da Ciência”, Revista Brasileira
de Ensino de Fı́sica, 20 251 (1998).

[16] Renato Álvarez Nodarse (5 de junio de 2018), “El triunfo de la Razón:

El Programa de Newton”, Blog del Instituto de Matemáticas de la universi-
dad de Sevilla. Recuperado de [Link]
el-triunfo-de-la-razon-el-programa-de-newton/ el 17 de febrero de 2020.

[17] Schulz, Peter A. (2007). Duas nuvens ainda fazem sombra na reputação de Lorde Kelvin.
Revista Brasileira de Ensino de Fı́sica, 29(4), 509-512. [Link]
11172007000400006

[18] Lord Kelvin, “Nineteenth century clouds over the dynamical theory of heat and light”,
The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science
Series 6, 2, 1-40 (1901).

[19] José Manuel Sánchez Ron. Historia de la fı́sica cuántica I. El perı́odo fundacional (1860
- 1926). (Editorial Crı́tica, 2001).

[20] Agassi, Joseph. “The Kirchhoff-Planck Radiation Law”, Science 156, no. 3771 (1967):
30-37. Accessed February 19, 2020. [Link]/stable/1720913.

[21] Siegel, Daniel M. “Balfour Stewart and Gustav Robert Kirchhoff: Two Independent Ap-
proaches to ‘Kirchhoff’s Radiation Law’”, Isis 67, no. 4 (1976): 565-600. Accessed Fe-
bruary 19, 2020. [Link]/stable/230562.

[22] Schirrmacher, Arne. “Experimenting Theory: The Proofs of Kirchhoff’s Radiation Law
before and after Planck”, Historical Studies in the Physical and Biological Sciences 33,
no. 2 (2003): 299-335. Accessed February 19, 2020. doi:10.1525/hsps.2003.33.2.299.

[23] Vorobyev AY1, Makin VS, Guo C Brighter light sources from black metal: significant
increase in emission efficiency of incandescent light sources. Phys Rev Lett. 2009 Jun
12;102(23):234301.

[24] Joseph B. Dence, Heat capacity and the equipartition theorem, . Chem. Educ. 49, 12,
798–804 (1972).

[25] KM Fonseca, F Torres-Ardila. On the difference between hermitian operators and self-
adjoint operators. MOMENTO-Revista de Fı́sica; núm. 47 (2013); 15-31 0121-4470

[26] J. von Neumann, Mathematische Grundlagen der Quantenmechanik. (Mathematical Fou-

dations of Quantum Mechanics), traducido del alemán por Robert T. Beyer, Princeton
University Press (1955).

[27] A. Galindo, P. Pascual. Mecánica Cuántica (I). (Alhambra, Madrid, 1978).

[28] Mohsen Razavy, Heisenberg’s Quantum Mechanics, (World Scientific, 2011)

[29] Bartel Leendert van der Waerden, Sources of Quantum Mechanics, (North Holland, 1967)

[30] Galliano Valent, The hydrogen atom in electric and magnetic fields: Pauli’s 1926 article,
Am. J. Phys. 71:2, 171–175 (2003).
BIBLIOGRAFÍA 129
[31] W. Rudin, Functional Analysis, McGraw-Hill, New York, 1973.

[32] A. Pankov. Introduction to Spectral Theory of Schrödinger operators, preimpreso de Ap-

plied Mathematics E-Notes, 2001-12-07. [Link]/~amen/posters/pankov.
pdf

[33] AY Gordon, S Jitomirskaya, Y Last, B Simon. Duality and singular continuous spectrum
in the almost Methieu equation, Acta Math. 178, 169-183 (1997).

[34] C. M. Bender, S. Boettcher, Real spectra in non-Hermitian Hamiltonians having PT

symmetry, Phys. Rev. Lett. 80 (1998), no. 24, 5243-5246.

[35] A. Mostafazadeh, Pseudo-Hermitian Representation of Quantum Mechanics, Internatio-

nal Journal of Geometric Methods in Modern Physics Vol. 07, No. 07, pp. 1191-1306
(2010).

[36] Schrödinger, E. (1935). Die gegenwartige Situation in der Quanten-mechanik, Naturwis-

senschaften 23, pp. 807–812; 823–828; 844–849.

[37] Daniel T. Gillespie. A quantum mechanics primer. (John Wiley & Sons, 1970).

[38] Adam Becker. What is real? The unfinish quest for the meaning of quantum physics.
Basic books, New Yok, 2018.

[39] J J Sakurai. Modern quantum mechanics. (Addison-Wesley 1994).

[40] L. Ballentine. Quantum mechanics, a modern development. 1998.

[41] D. Bohm. Quantum theory. (Dover, 1989).

[42] ML Whippman, Orbital angular momentum in quantum mechanics, American Journal

of Physics 34, 656 (1966)

[43] C. G. Gray Remark on Integral Orbital Angular Momentum, American Journal of Physics
37, 559 (1969)

[44] Ian R. Gatland, Integer versus half-integer angular momentum, American Journal of
Physics 74, 191 (2006)

[45] Robert Eisberg, Robert Resnick. Quantum Physics of Atoms, Molecules, Solids, Nuclei,
and Particles. (John Wiley & Sons, 2nd edition,1985)

[46] R Feynman, R Leighton, M Sands. The Feynman Lectures on Physics. (Addison-WEsley,

1966)

[47] DF Styer. The strange world of quantum mechanics. (Cambridge University Press, 2000)

[48] Jeanne N Clelland, Peter J Vassiliou. arXiv:1302.6672v3. Strings attached: New light on
an old problem.

[49] Darryl Yong, SIAM Review 48, p 771, Strings, Chains, and Ropes (2006).

[50] MA Pinsky, Partial Differential Equations and Boundary-Value Problems with Applica-
tions, 3rd ed., Waveland Press, Prospect Heights, IL, 2003.

[51] GF Wheeler, WP Crummett Am. J. Phys. 55, 33. The vibrating string controversy (1986)

[52] A Torchinsky. The Fourier transform and the wave equation. arXiv:0904.3252v2 (2010).
130 BIBLIOGRAFÍA
[53] EC Zeeman (1993). Controversy in Science: on the Ideas of Daniel Bernoulli and
René Thom. Nieuw Arch. Wisk. (4), 11(3), pp. 257- 282.

[54] JB Fourier (1819). Théorie du Mouvement de la Chaleur Dans les Corps Solides. Mém.
de l’Acad. Roy. des Sci. de l’Inst. de France, 4, pp.185-556.

[55] PG Dirichlet (1829). Sur la Convergence des Séries Trigonométriques Qui Servent À
Représenter Une Fonction Arbitraire Entre des Limites Données. J. für Math., 4, 157-
169. Retrieved from arXiv:0806.1294v1.

[56] JL D’Alembert (1747). Recherches Sur la Courbe Que Forme Une Corde Tenduë Mise
en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 214-219.

[57] JL D’Alembert (1747). Suite des Recherches Sur la Courbe Que Forme Une Cor de
Tenduë Mise en Vibration. Hist. de l’Acad. Roy. de Berlin, 3, pp. 220-249.

[58] GR Bird, M Parrish, The wire grid as a near-infrared polarizer. J. Opt. Soc. Am. 50, 886
(1960).

[59] JH Poynting. On the Transfer of Energy in the Electromagnetic Field. Philo-

sophical Transactions of the Royal Society of London, 175: 343–361 (1884).
[Link]
Electromagnetic_Field.

[60] MG Silveirinha (2010). Poynting vector, heating rate, and stored energy in structured
materials: a first principles derivation. Phys. Rev. B. 82: 037104.

[61] JT Costa, MG Silveirinha, A Alù (2011). Poynting Vector in Negative-Index Metamate-

rials. Phys. Rev. B. 83: 165120.

[62] I Campos, JL Jimenez. Eur. J. Phys. 13, 117. About Poynting’s theorem. (1991)

[63] E Richter, M Florian, K Henneberger (2008). Poynting’s theorem and energy conserva-
tion in the propagation of light in bounded media. Europhysics Letters. 81 (6): 67005.
arXiv:0710.0515.

[64] E Hetch. Optics. 4a ed. (Addison Wesley, 2002)

[65] M Monteiro, C Stari, C Cabeza, A C Martı́, The Polarization of Light and Malus’ Law
Using Smartphones. Phys. Teach. 55, 264 (2017)

[66] JA Sans, FJ Manjón, ALJ Pereira, JA Gómez-Tejedor, and JA Monsoriu, Oscillations

studied with the smartphone ambient light sensor, Eur. J. Phys. 34 (6), 1349 (2013).

[67] Sanford C Gladden, An experiment on Malus’ law for the elementary laboratory, Am. J.
Phys. 18, 395 (June 1950).

[68] Thomas M Ciferno, Renate J Ondris-Crawford, Gregory P. Crawford. Inexpensive elec-

trooptic experiments on liquid crystal displays, Phys. Teach. 33, 104–110 (Feb. 1995).

[69] H Fakhruddin, Some activities with polarized light from a laptop LCD screen, Phys.
Teach. 46, 229–231 (April 2008).

[70] Larissa Vertchenko, Lev Vertchenko, Verification of Malus’s law using a LCD monitor
and digital photography, Revista Brasileira de Ensino de Fı́sica 38 (3), e3311 (2016).

[71] H Gottlieb, The law of Malus using polaroid polarizers, Phys. Teach. 18, 612–614 (Nov.
1980).
BIBLIOGRAFÍA 131
[72] MA Dias Tavares Jr, LP Sosman, RJM da Fonseca, LACP da Mota, M Muramatsu.
Using a photo-resistor to verify irradiance inverse square and Malus’ laws, AIP Conf.
Proc. 992, 193–198 (2008).

[73] M Kutzner, R Wright, E Kutzner, An inexpensive LED light sensor, Phys. Teach. 48,
341 (May 2010).

[74] M Monteiro, P Vogt, C Stari, C Cabeza, AC Martı́, Exploring the atmosphere using
smartphones, Phys. Teach. 54, 308 (May 2016).

[75] P Velasquez, M del Mar Sánchez-López, I Moreno, D Puerto, F Mateos, Interference

birefringent filters fabricated with low cost commercial polymers, Am. J. Phys. 73, 357
(April 2005).

[76] D Kinyua, G Rurimo, P Karimi, S Maina, C Ominde. Interpherometric analysis of ce-

llophane birefringence. Optics and Photonics Jounral, 3, 337 (2013)

[77] A Kumar, A Ghatak. Polarization of Light with Applications in Optical Fibers. SPIE,
2011.

[78] M Scully, O Zubairy. Quantum optics, 1997.

[79] Theodore Duddell Newton, EP Wigner. Localized states for elementary systems. Reviews
of Modern Physics, 21(3):400, 1949.

[80] Arthur S Wightman. On the localizability of quantum mechanical systems. Reviews of

Modern Physics, 34(4):845, 1962.

[81] Brian J Smith and MG Raymer. Photon wave functions, wave-packet quantization of
light, and coherence theory. New Journal of Physics, 9(11):414, 2007.

[82] CK Hong, L Mandel, (1986), Experimental Realization of a Localized One-Photon State,

Physical Review Letters 56, 58

[83] P Grangier, G Roger, A Aspect. Experimental evidence for a photon anti-correlation

effect on a beamsplitter: A new light on single photon inteferences, Europhys. Lett. 1,
173 (1986).

[84] Ludwig Zehnder (1891). Ein neuer Interferenzrefraktor. Zeitschrift für Instrumentenkun-
de. 11: 275–285.

[85] Ludwig Mach (1892). Über einen Interferenzrefraktor. Zeitschrift für Instrumentenkunde.
12: 89–93.

[86] V Degiorgio, Phase shift between the transmitted and reflected optical field of a semire-
flecting lossless mirror is π/2, Am. J. Phys. 48 (1980) 81–82.

[87] A Zeilinger. General properties of lossless beam splitters in interferometry. American

Journal of Physics 49, 882 (1981)

[88] A Luis, LL Sanchez-Soto, A quantum description of the beam splitter, Quant. Semiclass.
Opt. 7 (1995) 153–160.

[89] MW Hamilton, Phase shifts in multilayer dielectric beam splitters, Am. J. Phys. 68 (2000)
186–191.

[90] CH Holbrow, E Galvez, ME Parks, Photon quantum mechanics and beam splitters, Am.
J. Phys. 70 (2002) 260–265.
132 BIBLIOGRAFÍA
[91] H Hénault. Quantum physics an the beam splitter mystery. Proc. SPIE 9570, VI, 95700Q
(2015). ArXiv:1509.00393
[92] AC Elitzur, L Vaidman, Quantum mechanical interaction-free measurements. Found.
Phys. 23, 987 (1993)
[93] P Kwiat, H Weinfurter, T Herzog, A Zeilinger, MA Kasevich, Interaction-free measure-
ment. Phys. Rev. Lett. 74, 4763 (1995)
[94] JA Wheeler, pp. 9-48 in Mathematical Foundations of Quantum Mechanics, editado por
AR Marlow (Academic, New-York, 1978).
[95] T Hellmuth, H Walther, A Zajonc, W Schleich (1987), Delayed-Choice Experiments in
Quantum Interference, Physical Review A 35, 2532-41.
[96] MO Scully, K Drühl (1982). Quantum eraser: A proposed photon correlation experiment
concerning observation and “delayed choice” in quantum mechanics. Physical Review A,
25(4), 2208–2213.
[97] TL Dimitrova, A Weis, Single photon quantum erasing: a demonstration experiment.
European Journal of Physics 31(3): 625, 2010
[98] Bretislav Friedrich and Dudley Herschbach. Stern and Gerlach: How a Bad Cigar Helped
Reorient Atomic Physics. Physics Today 2003 56:12, 53-59
[99] Phiwe. Stern-Gerlach experiment.
[100] E. Schrödinger, Discussion of Probability Relations Between Separated Systems, Procee-
dings of the Cambridge Philosophical Society. 31, 555 (1935).
[101] W. Wootters, Entanglement of Formation of an Arbitrary State of Two Qubits, Phys.
Rev. Lett. 80, 2245 (1998).
[102] C. Bennett, G. Brassard, C. Crépeau, R. Jozsa, A. Peres, and W. Wootters, Telepor-
ting an unknown quantum state via dual classical and Einstein-Podolsky-Rosen channels.
Phys. Rev. Lett. 70, 1895(1993).
[103] Charles Fort, Lo!, Cosimo, Inc., 2004
[104] J. Bell, Speakeable and Unspeakable in Quantum Mechanics, Cambridge University
Press, 1987.
[105] D. Boschi, S. Branca, F. De Martini, L. Hardy, S. Popescu. Experimental Realization of
Teleporting an Unknown Pure Quantum State via Dual Classical and Einstein-Podolski-
Rosen Channels. arXiv:quant=ph/9710013.
[106] By taking a uniform distribution of states over the Poincare sphere, a lower upper bound
is obtained in S. Massar and S. Popescu, Phys. Rev. Lett. 74, 1259 (1995).
[107] A Einstein, B Podolsky, N Rosen. Can quantum-mechanical description of physical
reality be considered complete?, Physical Review 47, 777 (1935).
[108] Claude Cohen-Tannoudji, Bernard Diu, Frank Laloe. Quantum Mechanics, volumen 1.
(Wiley, 1991).
[109] Arnold Sommerfeld, Atombau un Spektralinien, (Friedr. Vieweg und Sohn, Braunsch-
weig, 1921)
[110] Leonard S. Schiff. Quantum Mechanics, (McGraw-Hill, 1965).
BIBLIOGRAFÍA 133
[111] Wolfgang Pauli, Wave mechanics (Dover, Nueva York, 2000).
[112] L. Pauling, E. B. Wilson. Introduction to Quantum Mechanics, McGraw-Hill, New York,
1935.

[113] S. Tomonaga. Quantum Mechanics, North-Holland, Amsterdam, 1966.

[114] E. Merzbacher. Quantum mechanics, 2da edición, Wiley, New York, 1970.
[115] A. Messiah, Quantum mechanics, Wiley, New York, 1966.

[116] M. Beck. Quantum mechanics. Theory and experiment, Oxford University Press, New
York, 2012.
[117] R. L. Liboff. Introductory quantum mechanics. Introductory quantum mechanics,
Addison-Wesley Longman, 1980.
[118] N. J. Sonine Sur les fonctions cylindriques et le développement des fonctions continues
en séries. Math. Ann. 16, 1-80, 1880.
[119] A. N. Capri, Nonrelativistic Quantum Mechanics, 3a. edición, World Scientific, 2002.

También podría gustarte

Apunts Salvat
Aún no hay calificaciones
Apunts Salvat
547 páginas
Salvat Notes de Mecanica Quantica
100% (1)
Salvat Notes de Mecanica Quantica
258 páginas
Introducción a la Mecánica Cuántica
Aún no hay calificaciones
Introducción a la Mecánica Cuántica
198 páginas
IUCCI - 2024 - Mecanica Cuantica II
Aún no hay calificaciones
IUCCI - 2024 - Mecanica Cuantica II
246 páginas
Apuntes Mecanica Cuantica H Arellano
Aún no hay calificaciones
Apuntes Mecanica Cuantica H Arellano
211 páginas
Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025
Aún no hay calificaciones
Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025
251 páginas
Mecánica Cuántica. (Ponce)
Aún no hay calificaciones
Mecánica Cuántica. (Ponce)
196 páginas
Apuntes de Física Fundamental
Aún no hay calificaciones
Apuntes de Física Fundamental
240 páginas
Física Fundamental Avanzada
Aún no hay calificaciones
Física Fundamental Avanzada
322 páginas
A Punt Es Fi Sica Fundamental
Aún no hay calificaciones
A Punt Es Fi Sica Fundamental
299 páginas
Cur So Mcu Antica
Aún no hay calificaciones
Cur So Mcu Antica
136 páginas
Cuantica 1 y 2
100% (1)
Cuantica 1 y 2
106 páginas
Mecánica Cuántica
Aún no hay calificaciones
Mecánica Cuántica
263 páginas
Una Introduccion A La Mecanica Cuantica
Aún no hay calificaciones
Una Introduccion A La Mecanica Cuantica
146 páginas
Mecanica Cuantica para No Iniciados
Aún no hay calificaciones
Mecanica Cuantica para No Iniciados
146 páginas
A Punt Es Fi Sica Fundamental
Aún no hay calificaciones
A Punt Es Fi Sica Fundamental
343 páginas
Curso de Física Cuántica: Notas y Temario
Aún no hay calificaciones
Curso de Física Cuántica: Notas y Temario
79 páginas
Teoría Cuántica de Campos: Fundamentos
Aún no hay calificaciones
Teoría Cuántica de Campos: Fundamentos
148 páginas
Teoría Cuántica de Campos: Fundamentos
Aún no hay calificaciones
Teoría Cuántica de Campos: Fundamentos
148 páginas
Métodos de Formulación Hamiltoniana. Óptica Clásica y Cuántica
100% (1)
Métodos de Formulación Hamiltoniana. Óptica Clásica y Cuántica
134 páginas
Teoría Cuántica de Campos
Aún no hay calificaciones
Teoría Cuántica de Campos
148 páginas
Apuntes de Mecánica Cuántica 2015
Aún no hay calificaciones
Apuntes de Mecánica Cuántica 2015
211 páginas
Apuntes de Mecánica Cuántica
Aún no hay calificaciones
Apuntes de Mecánica Cuántica
156 páginas
QPhys Notas
Aún no hay calificaciones
QPhys Notas
102 páginas
Apunte de Mecanica Clasica
Aún no hay calificaciones
Apunte de Mecanica Clasica
205 páginas
Teoria Cuántica de Campos-Universidad de Granda PDF
Aún no hay calificaciones
Teoria Cuántica de Campos-Universidad de Granda PDF
150 páginas
Teoria Cauntica de Campos
Aún no hay calificaciones
Teoria Cauntica de Campos
152 páginas
Janssen Mecánica Análitica
Aún no hay calificaciones
Janssen Mecánica Análitica
102 páginas
Física Moderna para Ingenieros
Aún no hay calificaciones
Física Moderna para Ingenieros
38 páginas
Notas Cap 1
Aún no hay calificaciones
Notas Cap 1
24 páginas
Curso Abreviado de Física Teórica
100% (2)
Curso Abreviado de Física Teórica
157 páginas
Mecánica Cuántica: Principios y Aplicaciones
Aún no hay calificaciones
Mecánica Cuántica: Principios y Aplicaciones
128 páginas
Mecánica Sin Aplicaciones Prácticas
Aún no hay calificaciones
Mecánica Sin Aplicaciones Prácticas
271 páginas
Apuntes
Aún no hay calificaciones
Apuntes
96 páginas
Geser GeneralPhysics 2018
Aún no hay calificaciones
Geser GeneralPhysics 2018
77 páginas
Notas de Mecánica Clásica de Ferraro
Aún no hay calificaciones
Notas de Mecánica Clásica de Ferraro
205 páginas
Mecanica y Ondas II PDF
Aún no hay calificaciones
Mecanica y Ondas II PDF
147 páginas
FFIII24
Aún no hay calificaciones
FFIII24
146 páginas
Cuestiones y Problemas de PDF
Aún no hay calificaciones
Cuestiones y Problemas de PDF
77 páginas
Notas Famc
Aún no hay calificaciones
Notas Famc
113 páginas
Mecánica Clásica Avanzada: Guía Completa
100% (1)
Mecánica Clásica Avanzada: Guía Completa
616 páginas
Qce PDF
Aún no hay calificaciones
Qce PDF
221 páginas
Mecánica Cuántica Conceptual - Propagación de Feynman
100% (3)
Mecánica Cuántica Conceptual - Propagación de Feynman
179 páginas
Formulario de Física
100% (1)
Formulario de Física
123 páginas
Bernardo Adeva - Mecánica Cuántica Conceptual
100% (1)
Bernardo Adeva - Mecánica Cuántica Conceptual
181 páginas
Fisica 2 Bachiller
Aún no hay calificaciones
Fisica 2 Bachiller
104 páginas
Depine f3
Aún no hay calificaciones
Depine f3
190 páginas
Electrodinamica Clasica
Aún no hay calificaciones
Electrodinamica Clasica
152 páginas
Electro II21
Aún no hay calificaciones
Electro II21
247 páginas
Libro Con Problemas Resueltos PDF
100% (2)
Libro Con Problemas Resueltos PDF
225 páginas
Notas de Fisica Atomica y Materia Condensa
Aún no hay calificaciones
Notas de Fisica Atomica y Materia Condensa
100 páginas
Álgebra Lineal: Matrices y Operaciones
Aún no hay calificaciones
Álgebra Lineal: Matrices y Operaciones
39 páginas
Aplicaciones del Álgebra Lineal
Aún no hay calificaciones
Aplicaciones del Álgebra Lineal
101 páginas
Definición y Propiedades de Vectores
Aún no hay calificaciones
Definición y Propiedades de Vectores
40 páginas
Magnitud y Dirección de Vectores
Aún no hay calificaciones
Magnitud y Dirección de Vectores
6 páginas
Prueba Coordenadas Tema 1
Aún no hay calificaciones
Prueba Coordenadas Tema 1
1 página
Análisis de Vectores en Física
Aún no hay calificaciones
Análisis de Vectores en Física
11 páginas
4° Ses Mier 7 Mate Localizacion en Plano Cartesiano 933623393
Aún no hay calificaciones
4° Ses Mier 7 Mate Localizacion en Plano Cartesiano 933623393
8 páginas
Desagregacion de Destrezas Del Area de Matematicas en Bachillerato
80% (5)
Desagregacion de Destrezas Del Area de Matematicas en Bachillerato
17 páginas
Mat Ubica Puntos en El Plano Cartesiano
Aún no hay calificaciones
Mat Ubica Puntos en El Plano Cartesiano
8 páginas
MAT1203 Ayudant A Final
Aún no hay calificaciones
MAT1203 Ayudant A Final
6 páginas
Algebra
Aún no hay calificaciones
Algebra
7 páginas
Proalg
Aún no hay calificaciones
Proalg
4 páginas
Expansión de Espacios Vectoriales Euclidianos
Aún no hay calificaciones
Expansión de Espacios Vectoriales Euclidianos
14 páginas
Análisis de Fourier en Comunicación
Aún no hay calificaciones
Análisis de Fourier en Comunicación
162 páginas
Densidad Espectral
Aún no hay calificaciones
Densidad Espectral
9 páginas
Algebra Lineal Dario Sanchez
Aún no hay calificaciones
Algebra Lineal Dario Sanchez
86 páginas
2024 - Unidad 7 - VAP-VEP
Aún no hay calificaciones
2024 - Unidad 7 - VAP-VEP
24 páginas
MB165 PDF
Aún no hay calificaciones
MB165 PDF
5 páginas
Cinemática Vectorial
Aún no hay calificaciones
Cinemática Vectorial
8 páginas
Teoria #01
Aún no hay calificaciones
Teoria #01
19 páginas
Traduccion Digital Communications by Bernard Sklar
100% (1)
Traduccion Digital Communications by Bernard Sklar
10 páginas
Conceptos de Paralelismo y Perpendicularidad
Aún no hay calificaciones
Conceptos de Paralelismo y Perpendicularidad
12 páginas
Bases Ortogonales en Ingeniería
Aún no hay calificaciones
Bases Ortogonales en Ingeniería
11 páginas
Cálculo en Varias Variables: Guía Completa
Aún no hay calificaciones
Cálculo en Varias Variables: Guía Completa
430 páginas
Proyecciones de Un Vector
Aún no hay calificaciones
Proyecciones de Un Vector
23 páginas
Silabo Espe Vigente Primer Nivel
Aún no hay calificaciones
Silabo Espe Vigente Primer Nivel
6 páginas
Ejercicios de Vectores y Operaciones
Aún no hay calificaciones
Ejercicios de Vectores y Operaciones
4 páginas
Sillabus Algebra Lineal Espol Al 2018
Aún no hay calificaciones
Sillabus Algebra Lineal Espol Al 2018
7 páginas
Finales Isfd 21
Aún no hay calificaciones
Finales Isfd 21
2 páginas
Ejercicios4 EspaciosVectoriales
Aún no hay calificaciones
Ejercicios4 EspaciosVectoriales
9 páginas