0% encontró este documento útil (0 votos)
188 vistas160 páginas

Notas de Relatividad Avanzada

Este documento presenta notas de clase sobre relatividad. Introduce la relatividad galileana y cómo su aplicación al electromagnetismo de Maxwell revela la necesidad de nuevas nociones de espacio y tiempo. Luego cubre los principios de la teoría especial de relatividad, incluyendo la relatividad de la simultaneidad, la contracción de la longitud y la dilatación del tiempo. Finalmente, discute las transformaciones de Lorentz, la cinemática y dinámica relativistas, y la electrodinámica relativista. El documento asume conocimientos avanzados de fís

Cargado por

Yesireth Morales
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
188 vistas160 páginas

Notas de Relatividad Avanzada

Este documento presenta notas de clase sobre relatividad. Introduce la relatividad galileana y cómo su aplicación al electromagnetismo de Maxwell revela la necesidad de nuevas nociones de espacio y tiempo. Luego cubre los principios de la teoría especial de relatividad, incluyendo la relatividad de la simultaneidad, la contracción de la longitud y la dilatación del tiempo. Finalmente, discute las transformaciones de Lorentz, la cinemática y dinámica relativistas, y la electrodinámica relativista. El documento asume conocimientos avanzados de fís

Cargado por

Yesireth Morales
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Relatividad

Notas de Clase

Eduardo Rodríguez

Departamento de Física
Universidad Nacional de Colombia

21 de agosto de 2020
2
Índice general

Introducción 5

1. Relatividad galileana 7
1.1. Transformación de Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2. Electromagnetismo y Relatividad de Galileo . . . . . . . . . . . . . . . . . . 11
1.3. El éter y el experimento de Michelson–Morley . . . . . . . . . . . . . . . . 14
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2. Principios de la teoría especial de la relatividad 21


2.1. Relatividad de la simultaneidad . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2. Contracción de la longitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Dilatación del tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4. El espacio-tiempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.5. Paradoja de los gemelos y viaje al futuro . . . . . . . . . . . . . . . . . . . . 30

3. Transformaciones de Lorentz 33
3.1. Rotación en el plano x y . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2. Rotación en el plano t x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3. Suma relativista de velocidades paralelas . . . . . . . . . . . . . . . . . . . 45
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4. Boost en una dirección arbitraria . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5. El grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4. Introducción al cálculo tensorial 65


4.1. La notación tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2. Tensores en el espacio euclidiano tridimensional . . . . . . . . . . . . . . . 68
4.3. Transformaciones generales de coordenadas . . . . . . . . . . . . . . . . . 79
4.4. Tensores en el espacio-tiempo de Minkowski . . . . . . . . . . . . . . . . . 85
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5. Cinemática relativista 95
5.1. Líneas de mundo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2. 4-Velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.3. 4-Aceleración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

3
Índice general

5.4. Movimiento hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101


5.5. Transformación de la velocidad . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.6. Transformación de la aceleración . . . . . . . . . . . . . . . . . . . . . . . . 107
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6. Dinámica relativista 113


6.1. 4-Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.2. Fotones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.3. Conservación del 4-momentum . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.4. Sistemas de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.5. 4-Fuerza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

7. Electrodinámica relativista 133


7.1. La ecuación de Klein–Gordon . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.2. El campo electromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.3. Invariancia de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
7.4. Conservación de la carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.5. Fuerza de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
7.6. Transformaciones de Lorentz para los campos eléctrico y magnético . . . 143
7.7. Invariantes de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.8. Tensor momentum-energía . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.9. Potenciales de Liénard–Wiechert . . . . . . . . . . . . . . . . . . . . . . . . . 150
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

Bibliografía 159

4
Introducción

Estas son las notas de clase que escribí para el curso de Relatividad que he dictado en
varias ocasiones desde 2016 en el Departamento de Física en la Universidad Nacional
de Colombia.
Si bien los fundamentos de la teoría especial de la relatividad pueden entenderse
sin más requisitos matemáticos que un poco de álgebra preuniversitaria, estas notas de
clase son más exigentes. En particular, asumimos que el lector tiene una buena base
en la mecánica de Newton, los fundamentos teóricos del electromagnetismo, el cálcu-
lo diferencial e integral en varias variables, elementos de álgebra lineal y conceptos
básicos de ecuaciones diferenciales.
Las referencias principales son el libro de Rindler [1], que tiene un nivel matemático
similar al nuestro, y el de Taylor y Wheeler [2], que tiene un nivel literario muy superior.
La mayoría de los problemas propuestos vienen de estos dos libros, unos pocos son
originales y el resto pueden ser encontrados en las referencias [3, 4].
Paradójicamente, el impulso final para acabar estas notas de clase lo encontré en
las circunstancias extraordinarias que nos impuso a todos la pandemia del Covid-19.
Quiero agradecer a mis estudiantes presentes y pasados por su interés, su dedicación
y sus excelentes preguntas, que, espero, han contribuido a mejorar estas notas. Por
supuesto, cualquier error que aún permanezca en el texto es de mi exclusiva respon-
sabilidad. Si quiere reportar un error, o hacer un comentario o sugerencia, por favor
escríbame al email eduarodriguezsal@[Link].
Estas notas de clase nunca hubiesen visto la luz del día sin la paciencia y el apoyo
de mi esposa, Adela, a quien va mi más profundo agradecimiento.

Eduardo Rodríguez
Bogotá, agosto de 2020

5
Introducción

6
Capítulo 1

Relatividad galileana

En este capítulo estudiamos el principio de la relatividad de Galileo y mostramos


cómo su aplicación a la electrodinámica de Maxwell revela la necesidad de nuevas
nociones de espacio y tiempo, diferentes a las asumidas por Newton.

1.1. Transformación de Galileo


En su obra maestra Philosophiæ Naturalis Principia Mathematica, publicada por pri-
mera vez en 1687, Isaac Newton asume la existencia de un espacio y un tiempo abso-
lutos, que existen sin referencia a nada externo.
El espacio absoluto newtoniano es, sin embargo, inobservable: no existe ningún
experimento mecánico que pueda distinguir entre el reposo y el movimiento en línea
recta con velocidad constante.
Unos cincuenta años antes de Newton, Galileo Galilei había articulado esta idea,
que hoy llamamos Principio de la Relatividad, en su libro Dialogo sopra i due massimi
sistemi del mondo:

Encerraos con un amigo en la cabina principal bajo la cubierta de un


barco grande, y llevad con vosotros moscas, mariposas y otros pequeños
animales voladores [. . . ] Colgad una botella que se vacíe gota a gota en
un recipiente amplio colocado por debajo de la misma [. . . ] Haced que
el barco vaya con la velocidad que queráis, siempre que el movimiento
sea uniforme y no haya fluctuaciones en un sentido u otro. [. . . ] Las gotas
caerán [. . . ] en el recipiente inferior sin desviarse hacia la popa, aunque el
barco haya avanzado mientras las gotas están en el aire [. . . ] Las mariposas
y las moscas seguirán su vuelo por igual hacia cada lado, y no sucederá que
se concentren en la popa, como si se cansaran de seguir el curso del barco.
Galileo Galilei, 1632 [5].

Siguiendo a Galileo, aunque de manera un poco menos vívida, consideremos dos


observadores, K y K 0 , en movimiento relativo. Denotamos por V~ la velocidad constante

7
Capítulo 1. Relatividad galileana

Figura 1.1: Portadas de Dialogo sopra i due massimi sistemi del mondo (Galileo Galilei,
1632) y Philosophiæ Naturalis Principia Mathematica (Isaac Newton, 1687).

de K 0 respecto de K. (La velocidad de K respecto de K 0 es, por supuesto, −V~ ). Para


simplificar, y sin pérdida de generalidad, asumimos que K y K 0 coinciden espacialmen-
te en el instante t = 0. Ambos observadores desean describir el movimiento de una
partícula, P. Como se sugiere en la figura 1.2, los vectores posición ~r y ~r 0 que K y K 0
asignan respectivamente a P están relacionados mediante la ecuación

~r 0 = ~r − V~ t. (1.1)

En la ec. (1.1) está implícita la hipótesis newtoniana de un tiempo absoluto: hemos


asumido, de la manera más natural e intuitiva posible, que el tiempo transcurre de
idéntica forma para K y K 0 . La transformación de Galileo queda definida por la ec. (1.1)
y la relación (a menudo omitida) t 0 = t.

~r 0
~r

K0
V~ t
K

Figura 1.2: Dos observadores en movimiento relativo registran la posición de una par-
tícula.

8
1.1. Transformación de Galileo

θ v0
~
v
~

V~

v 0 respecto del
Figura 1.3: Para cruzar un río, el botero debe navegar con velocidad ~
río, que corresponde a una velocidad ~v respecto de la orilla.

Las velocidades que K y K 0 asignan a P son, respectivamente,

d~r d~r 0
v=
~ , v0 =
~ . (1.2)
dt dt
Derivando la ec. (1.1) obtenemos inmediatamente una relación entre estas velocidades,
llamada suma galileana de velocidades:

v0 = ~
~ v − V~ . (1.3)

Transformación inversa. Note que las transformaciones inversas pueden obtenerse


a partir de las transformaciones directas intercambiando cantidades primadas y no
primadas y reemplazando V~ por −V~ . En efecto,

~r = ~r 0 + V~ t, v 0 + V~ .
v=~
~ (1.4)

Ejemplo 1.1. ¿Con qué velocidad (magnitud y dirección) debemos dirigir un bote para
cruzar un río que tiene una corriente apreciable?
Sea K el marco de referencia anclado al suelo, en el cual el suelo está en reposo,
y sea K 0 el marco de referencia que se mueve junto con el agua del río, en el cual
el agua está en reposo. Sabemos cómo queremos que sea la velocidad del bote en K:
perpendicular al lecho del río. Su velocidad en el marco K 0 está dada por la ec. (1.3) y
se ilustra en la figura 1.3. Para el botero, los datos relevantes son v 0 y θ , el ángulo de
desviación de ~ v 0 respecto de la perpendicular al río.

Las aceleraciones que K y K 0 asignan a P son, respectivamente,

d~
v v0
d~
a~ = , a~0 = . (1.5)
dt dt
Derivando la ec. (1.3), encontramos que la aceleración es invariante bajo la transfor-
mación de Galileo:
a~0 = a~. (1.6)

9
Capítulo 1. Relatividad galileana

De acuerdo a la segunda ley de Newton, la aceleración experimentada por una partícula


es directamente proporcional a la fuerza total ejercida sobre ella por agentes externos
e inversamente proporcional a su masa, a~ = F~/m. Asumiendo que la masa es una
propiedad intrínseca de la partícula, independiente del observador que la mida (i.e.,
m0 = m), la ec. (1.6) implica que ambos observadores deben medir la misma fuerza
total:
F~0 = F~. (1.7)

En particular, esto quiere decir que la segunda ley de Newton es invariante de forma,
o covariante, bajo la transformación de Galileo. Esta covariancia implica que, puestos
a realizar experimentos, ambos observadores, K y K 0 , descubrirán las mismas leyes
dinámicas (la segunda ley de Newton). Más aún, ambos miden la misma aceleración,
la misma masa y, por lo tanto, la misma fuerza.

Alice y Bob. Alice y Bob son dos personajes usados a menudo en los campos de
la criptografía y la computación cuántica para representar dos personas que desean
intercambiar información. Siguiendo a N. David Mermin [6], vamos a invitar a Alice y
Bob para que protagonicen nuestros Gedankenexperimente1 en Relatividad.
Nuestra Alice es una aventurera. A menudo la encontraremos a bordo de trenes
o naves espaciales. Bob, en cambio, es un home lover. Bob a menudo observa a Alice
desde el andén, o simplemente se queda en la Tierra mientras ella viaja por el espacio.

Ejemplo 1.2. A bordo de un tren, Alice juega a lanzar una pelota verticalmente ha-
cia arriba. En el marco de Alice (K 0 , donde el tren está en reposo), las ecuaciones de
movimiento de la pelota son

1 2
x 0 = 0, y 0 = v00 t − gt , (1.8)
2
vx0 = 0, v 0y = v00 − g t, (1.9)
a0x = 0, a0y = −g, (1.10)

donde g es la aceleración de caída libre y v00 es la velocidad inicial que Alice le imprime
a la pelota. Bob observa el juego de Alice desde el andén. En el marco de Bob (K,
donde el andén está en reposo y el tren se mueve hacia la derecha con velocidad V ),
las ecuaciones de movimiento de la pelota se obtienen a partir de la transformación

1
Un Gedankenexperiment es un experimento mental, i.e., una situación hipotética cuyas consecuen-
cias examinamos basándonos en ciertos principios asumidos como válidos, sin que sea necesario o in-
cluso posible llevar a cabo el experimento en la realidad. Un par de ejemplos famosos de Gedankenex-
perimente en física son el gato de Schrödinger, en mećanica cuántica, y el demonio de Maxwell, en
termodinámica.

10
1.2. Electromagnetismo y Relatividad de Galileo

(inversa) de Galileo [cf. ecs. (1.1), (1.3) y (1.6)]:

1 2
x = V t, y = v00 t − gt , (1.11)
2
vx = V, v y = v00 − g t, (1.12)
a x = 0, a y = −g. (1.13)

Para Alice, la pelota realiza un movimiento unidimensional. Para Bob, en cambio, la


pelota se mueve en una parábola. ¿Cuál de los dos tiene la razón? ¿Cuál es la verdadera
trayectoria de la pelota?

1.2. Electromagnetismo y Relatividad de Galileo


El Principio de la Relatividad de Galileo plantea la imposibilidad de distinguir entre
el reposo absoluto y un movimiento en línea recta con velocidad constante mediante
ningún experimento mecánico. La mecánica, sin embargo, no es toda la física. ¿Es
posible distinguir entre ambos marcos de referencia por medio de un experimento
electromagnético?
Si pensamos en analizar el movimiento de una partícula sujeta a fuerzas electro-
magnéticas, la respuesta tiene que ser no: cualquier fuerza compatible con la segunda
ley de Newton debe satisfacer F~0 = F~. Usando este principio podemos establecer, sin
embargo, que K y K 0 sí miden campos distintos.
Los campos eléctrico y magnético se definen formalmente a través de la ecuación
de la fuerza de Lorentz,
F~ = q E~ + q~
v×B
~, (1.14)
donde q es la carga de la partícula y ~v es su velocidad. Como K y K 0 miden velocidades
distintas, la única manera de preservar la igualdad de las fuerzas es que ambos midan
campos distintos. Asumiendo que la carga, al igual que la masa, es una propiedad
intrínseca de la partícula, y por lo tanto independiente del observador (i.e., q0 = q), la
condición F~0 = F~ se reduce a

E~0 + ~
v0 × B
~ 0 = E~ + ~
v×B
~. (1.15)

Usando la suma de velocidades (1.3) y reordenando, podemos escribir

E~0 − E~ − V~ × B
~0 + ~ ~0 − B
v× B ~ = 0. (1.16)
 

v , los dos términos entre


Como esta ecuación debe ser válida para cualquier velocidad ~
paréntesis deben anularse independientemente2 . Obtenemos de esta manera las leyes
de transformación galileanas para los campos eléctrico y magnético:

E~0 = E~ + V~ × B
~, ~0 = B
B ~. (1.17)
2
Si a + b x = 0 para cualquier valor de x, entonces a = b = 0.

11
Capítulo 1. Relatividad galileana

× × × × × ×
B
~
× × × × × ×

× × × × × ×
F~
× × × × × ×

× × × × × ×
v
~
× × × × × ×

Figura 1.4: Bajo la influencia de un campo magnético uniforme (dirigido hacia dentro
de la página), una partícula cargada realiza un movimiento circular.

Ejemplo 1.3. En un marco K, una partícula de masa m y carga q realiza un movimien-


to circular uniforme bajo la influencia de un campo magnético constante B ~ , como se
muestra en la figura 1.4. El campo eléctrico es cero, de manera que a fuerza electro-
magnética sobre la partícula es simplemente F~ = q~ v×B ~.
0 3
Sea K el marco que se mueve con velocidad constante igual a la velocidad de la
partícula en el instante que estamos considerando, V~ = ~ v . En este marco, la velocidad
v 0 = 0. ¿Cómo puede un campo magnético ejercer una fuerza no
de la partícula es cero, ~
nula sobre una partícula en reposo? La respuesta es que, en efecto, la fuerza magnética
se anula en K 0 . La relación F~ = F~0 es preservada, sin embargo, gracias a la existencia
de un campo eléctrico en K 0 , E~0 = ~
v×B ~ . La fuerza eléctrica que este campo ejerce sobre
0 ~0 0
la partícula en K , F = q E = q~
~ v × B = F~, coincide con la fuerza magnética medida
~
en K, evitando la contradicción.

Las leyes que gobiernan el comportamiento de los campos eléctrico y magnético


son las ecuaciones de Maxwell:

ρ 1 ∂ E~
∇ · E~ = , ∇×B~ − ε0 = ~, (1.18)
ε0 µ0 ∂t
∂B ~
∇·B
~ = 0, ∇ × E~ + = 0. (1.19)
∂t

Aquí, ρ y ~ son, respectivamente, densidad de carga y densidad de corriente eléctrica.


Incluso midiendo campos distintos, si las mismas ecuaciones de Maxwell son válidas
para K y K 0 (reemplazando cantidades no primadas por cantidades primadas), enton-
ces será imposible distinguir entre reposo absoluto y movimiento en línea recta con
velocidad constante mediante ningún experimento electromagnético concebible. Para
3
Este es el marco comóvil instantáneo de la partícula. Vea la definición 5.3.

12
1.2. Electromagnetismo y Relatividad de Galileo

determinar la forma que las ecuaciones de Maxwell adoptan en el marco K 0 , necesi-


tamos primero establecer cómo cambian las densidades de carga y corriente bajo la
transformación de Galileo.
La cantidad de carga contenida en un elemento de volumen infinitesimal en un
instante de tiempo determinado está dada por dq = ρdV . Para un t fijo, la trans-
formación de Galileo produce d~r 0 = d~r , de donde hallamos dV 0 = dV . Dado que
dq0 = dq, obtenemos inmediatamente ρ 0 = ρ. Escribiendo ~ = ρ~ v , resulta claro que
~0 = ρ 0 ~
v0 = ρ ~
v − V~ = ~ − ρ V~ . Resumiendo, hemos encontrado las siguientes leyes
de transformación:

ρ 0 = ρ, ~0 = ~ − ρ V~ . (1.20)

Tenemos ahora todos los elementos necesarios para determinar la forma de las
ecuaciones de Maxwell en el marco K 0 . Obtenemos [7]

1 1 0 ∂ E~0
∇0 · E~0 = ρ 0 + ρinercial
0
, ∇ ×B~ 0 − ε0 0
, (1.21)

= ~ + ~inercial
ε0 µ0 ∂t 0

∂B ~0
∇0 · B
~ 0 = 0, ∇0 × E~0 + = 0, (1.22)
∂ t0
0 0
donde las “fuentes inerciales” ρinercial y ~inercial están dadas por

0
= −ε0 V~ · ∇0 × B
~0 , (1.23)

ρinercial
 0
∂B~

0 0~ 0
 0 0
 0
~inercial = ρ V − ε0 V~ · ∇ E~ − ε0 V~ × − V~ · ∇ B ~ . (1.24)
∂ t0

Este es un resultado del mayor interés. Las ecuaciones de Maxwell no son covariantes
bajo la transformación de Galileo. Si las reglas del electromagnetismo son distintas para
K y K 0 , entonces eso significa que, en principio, es posible concebir alguna clase de
experimento electromagnético que permita distinguir entre ambos marcos.
¿Cómo podría ser este experimento crucial? Ya vimos que estudiar el movimiento
de una partícula sometida a fuerzas electromagnéticas no será suficiente. Una mane-
ra alternativa de detectar los efectos de los campos eléctrico y magnético consiste en
analizar las ondas electromagnéticas permitidas por las ecuaciones de Maxwell. En K,
estas ondas se propagan con velocidad c = (ε0 µ0 )−1/2 = 299 792 458 m/s. Un análisis
detallado de las ecuaciones de onda para E~0 y B ~ 0 muestra que la velocidad de grupo
0 0
de las ondas electromagnéticas en K está dada por ~ vgrupo = c k̂ − V~ , donde k̂ indica la
dirección de propagación de la onda en K. Esto significa que, en K 0 , la velocidad de
propagación de las ondas puede determinarse usando la suma de velocidades galilea-
na (1.3), como si la luz estuviese compuesta de partículas. La figura 1.5 muestra las
velocidades de fase y de grupo de las ondas electromagnéticas en K 0 .

13
Capítulo 1. Relatividad galileana

0
V~ vgrupo
~

0
Vk vfase

c k̂

Figura 1.5: Velocidades de fase y de grupo de las ondas electromagnéticas en K 0 . Aquí,


Vk denota la componente de V~ paralela al vector de onda ~k (horizontal en la figura).

1.3. El éter y el experimento de Michelson–Morley


Las ecuaciones de Maxwell cambian su forma bajo la transformación de Galileo.
Esto significa que las ecuaciones originales [cf. (1.18)–(1.19)] son en realidad válidas
solo en un marco privilegiado, donde V~ = 0, que puede identificarse con el estado de
reposo absoluto. Esta es una conclusión radical pero inevitable dadas nuestras hipótesis,
que incluyen la existencia de un tiempo absoluto.
Un elemento que no está presente en las ecuaciones de Maxwell, pero que resultaba
indispensable desde el punto de vista de la física del siglo 19, es el éter luminífero, un
medio material que soporta la propagación de las ondas electromagnéticas. Natural-
mente, el marco privilegiado donde son válidas las ecuaciones de Maxwell originales
es identificado con el marco donde el éter está en reposo.
La idea de un marco privilegiado donde el medio de propagación de las ondas está
en reposo es perfectamente consistente con lo que sabemos sobre ondas mecánicas,
como el sonido. Por ejemplo, la velocidad de propagación del sonido está dada en
términos generales por la ecuación de Newton–Laplace,

t Ks
v
cs = , (1.25)
ρ

donde Ks es un coeficiente de rigidez, el módulo de compresibilidad adiabático, y ρ es


la densidad del medio. Esta ecuación es válida, por supuesto, solo en el marco donde el
medio está en reposo. La velocidad del sonido en otros marcos está dada por la suma
galileana de velocidades (1.3). Esto coincide con nuestra experiencia cotidiana, que
sugiere, por ejemplo, que el viento influye en la propagación del sonido.
El éter, sin embargo, debía ser un medio muy especial. Como la luz se propaga sin
problemas a través del espacio “vacío” que hay entre la Tierra y el Sol, el éter debe es-
tar en todas partes, llenando el espacio. También debe ser transparente, porque no lo
vemos, y con una densidad y viscosidad muy pequeñas, para no afectar apreciablemen-
te las órbitas de los planetas, que se explican adecuadamente a través de las leyes de
Newton con una fuerza exclusivamente gravitacional. Para cumplir con la ec. (1.25),
el éter debe ser también muy rígido.
Debido a su movimiento alrededor del Sol, resulta claro que la Tierra no está en
reposo en el marco del éter. Esto significa que la velocidad de un rayo de luz en el marco

14
1.3. El éter y el experimento de Michelson–Morley

−V~
“viento de éter”

c+V c−V

Figura 1.6: De acuerdo a la suma galileana de velocidades (1.3), la velocidad de un


rayo de luz en el marco de la Tierra varía desde c − V hasta c + V , dependiendo de
la dirección de propagación. En esta figura, la Tierra se mueve hacia la derecha en el
marco del éter, con velocidad V = 0,28c.

de la Tierra depende de su dirección respecto de la velocidad de la Tierra a través del


éter, V~ , como se sugiere en la figura 1.6. Equivalentemente, uno puede imaginar que
existe un “viento de éter” con velocidad −V~ , de manera que los rayos de luz que viajan
en contra o a favor del viento tienen velocidades respectivamente menores o mayores
que c.
En la realidad, el efecto esperado es muy pequeño. Asumiendo que la velocidad
de la Tierra respecto del éter es del orden de su velocidad orbital alrededor del Sol,
tenemos V /c ≈ 10−4 . Por lo tanto, para detectar estas diferencias se necesita un expe-
rimento muy sensible.
En 1887, Albert A. Michelson y Edward W. Morley publicaron los resultados de un
experimento llevado a cabo ese mismo año en el cual compararon la velocidad de la luz
a lo largo de dos trayectorias perpendiculares entre sí. El ahora famoso experimento de
Michelson–Morley [8] utilizó un interferómetro como el que se sugiere en la figura 1.7.
Un rayo de luz impacta desde la izquierda un divisor de haz S, de manera que una
parte del rayo se refleja en su superficie semiplateada y otra parte se refracta a través
del material del que está hecho. La parte refractada del rayo sigue viajando hacia la
derecha hasta que se refleja en un espejo E2 , mientras que la parte reflejada se hace
pasar por una placa compensatoria C antes de reflejarse en un espejo E2 . Los dos rayos
se reúnen nuevamente en S y su superposición es observada en un telescopio T . El
diseño del interferómetro asegura que los caminos ópticos seguidos por ambos rayos
tienen la misma longitud, de manera que cualquier desfase que se observe entre ellos
en T debe atribuirse a una diferencia en sus velocidades.
El resultado del experimento de Michelson–Morley fue nulo. A pesar de contar con
precisión más que suficiente para detectar las variaciones en la velocidad que se es-
peraban, no se midió ninguna. El experimento se repitió muchas veces, en distintas

15
Capítulo 1. Relatividad galileana

E1

S
E2

Figura 1.7: Esquema del “interferómetro de Michelson” usado en el experimento de


Michelson–Morley.

épocas del año, y el resultado siempre fue el mismo.


La importancia del experimento de Michelson–Morley es hoy en día solo histórica:
fue la primera vez que se demostró convincentemente la imposibilidad de detectar
variaciones en la velocidad de la luz medida por un observador en movimiento respecto
del éter.
Esta contradicción entre la predicción teórica fruto de la aplicación de la transfor-
mación de Galileo a las ecuaciones de Maxwell y el resultado nulo del experimento
de Michelson–Morley muestra que alguna de nuestras hipótesis es errónea, y debe por
lo tanto ser reemplazada. La teoría especial de la relatividad, cuyos principios comen-
zamos a analizar en el capítulo 2, asume la constancia de la velocidad de la luz en
todos los marcos, haciendo superflua la existencia de un éter luminífero, al precio de
abandonar la hipótesis newtoniana de un tiempo absoluto.
Las consecuencias de la teoría especial de la relatividad son puestas a prueba literal-
mente todos los días en los diversos aceleradores de partículas alrededor del mundo.
A pesar que la precisión de estos experimentos modernos supera en mucho a la del
experimento de Michelson–Morley, hasta ahora nunca se ha detectado una violación
de la relatividad especial.
Como veremos en el capítulo 3, la invariancia de la velocidad de la luz se entiende
hoy en día como una consecuencia de la simetría de Lorentz que todas las teorías físicas
deben respetar. En los últimos años, la invariancia de Lorentz ha sido puesta a prue-
ba en diversos experimentos. El más preciso de ellos hasta ahora fue realizado en el
observatorio de neutrinos IceCube, ubicado en la base Amundsen–Scott en el polo sur.
El observatorio cuenta con miles de sensores ubicados bajo el hielo antártico, distri-
buidos sobre un kilómetro cúbico. En 2018, la Colaboración IceCube reportó un límite

16
Problemas

superior de unas pocas partes en 1028 para diferentes clases de violación a la simetría
de Lorentz [9, 10], convirtiéndola así en uno de los principios con base experimental
más sólida de toda la física.

Problemas
1. Encuentre la matriz jacobiana (de 4×4), en coordenadas cartesianas, de la trans-
formación de Galileo,

~r 0 = ~r − V~ t, t 0 = t, (1.26)

donde V~ es la velocidad (constante) entre dos marcos de referencia inerciales K


y K 0 . Halle también la transformación inversa y la matriz jacobiana de la trans-
formación inversa. ¿Es la matriz jacobiana de la transformación inversa igual a
la inversa de la matriz jacobiana de la transformación directa?

2. Halle las reglas de transformación para los operadores diferenciales ∇ y ∂ /∂ t


bajo la transformación (1.26). Ayuda: Use la regla de la cadena,

∂ ∂t ∂ ∂x ∂ ∂y ∂ ∂z ∂
= + 0 + 0 + 0 , (1.27)
∂t 0 ∂ t ∂ t ∂ t ∂ x ∂ t ∂ y ∂ t ∂z
0

∂ ∂t ∂ ∂x ∂ ∂y ∂ ∂z ∂
= + + + , (1.28)
∂x 0 ∂ x ∂ t ∂ x ∂ x ∂ x ∂ y ∂ x0 ∂ z
0 0 0

y similarmente para ∂ /∂ y 0 y ∂ /∂ z 0 . Si su resultado le parece sorprendente, revise


la sección 10.3 del libro de R. Penrose [11]. Ud. podría estar siendo víctima de
la segunda confusión fundamental del cálculo infinitesimal.

3. Si las ecuaciones de Maxwell usuales son válidas solo en cierto marco de referen-
cia privilegiado K, demuestre que en un marco K 0 que se mueve con velocidad
constante V~ respecto de K, las ecuaciones toman la forma (1.21)–(1.22), donde
0 0
las “fuentes inerciales” ρinercial y ~inercial están dadas por las ecs. (1.23)–(1.24).
Ayuda: Use las leyes de transformación para los campos (1.17) y para las densi-
dades de carga y corriente (1.20). Las siguientes identidades del cálculo vectorial
podrían ser de utilidad:

∇ · a~ × ~b = ~b · ∇ × a~ − a~ · ∇ × ~b, (1.29)


∇ × a~ × ~b = a~∇ · ~b − ~b∇ · a~ + ~b · ∇ a~ − (~
a · ∇) ~b. (1.30)
 

4. A partir de las ecuaciones de Maxwell modificadas (1.21)–(1.22), determine si


es posible definir un potencial escalar eléctrico φ 0 y un potencial vectorial mag-
nético A~0 en el marco K 0 . Si su respuesta es afirmativa, encuentre cómo cambian
los potenciales bajo la transformación de Galileo (1.26).

17
Capítulo 1. Relatividad galileana

Ayuda: La identidad

∇ V~ · a~ = V~ × (∇ × a~) + V~ · ∇ a~, (1.31)


 

válida para V~ constante, podría ser de utilidad.

5. Demuestre que, en el marco K 0 , el campo eléctrico y el campo magnético satisfa-


cen ecuaciones de onda inhomogéneas en el vacío (i.e., en ausencia de cargas y
corrientes, cuando ρ = 0, ~ = 0).
Ayuda: La identidad

∇ × ∇ × F~ = ∇ ∇ · F~ − ∇2 F~ (1.32)
 

podría ser de utilidad. Como V~ es constante, el operador diferencial escalar V~ · ∇


conmuta con ∇.

6. Asuma una solución de onda plana monocromática,

E~0 = E~00 sin ~k0 · ~r 0 − ω0 t 0 , ~0 = B


B ~ 0 sin ~k0 · ~r 0 − ω0 t 0 , (1.33)
 
0

sustituya en una de las ecuaciones de onda inhomogéneas que encontró en el


problema 5 (escoja la que le parezca más simple), y muestre que debe satisfacerse
la relación de dispersión
2
ω0 + ~k0 · V~ = c 2 k02 , (1.34)

donde c = (ε0 µ0 )−1/2 .

7. Use las leyes de transformación para los campos eléctrico y magnético (1.17)
para encontrar cómo cambian la frecuencia ω y el vector de onda ~k. Interprete
su resultado.

8. A partir de la relación de dispersión (1.34), encuentre las velocidades de fase y


de grupo,

0 ω0 0 ∂ ω0
vfase = , vgrupo
~ = , (1.35)
k0 ∂ ~k0

de las ondas electromagnéticas en K 0 . Compruebe que la figura 1.5 representa


0
correctamente las relaciones entre vfase 0
vgrupo
,~ y ~k.
Ayuda: Por definición, la velocidad de fase va siempre en la dirección del vector
de onda. La definición de la velocidad de grupo debe entenderse en el sentido
que la derivada parcial de ω0 respecto de la componente x del vector ~k0 es igual
0
a la componente x de la velocidad de grupo, vgrupo, x
= ∂ ω0 /∂ k0x , y similarmente
para las componentes y y z.

18
Problemas

? ? ? ? ? ?
? ? ? ?
? ? ?
? ?
? ?
? ?
? ? ?
? ? ? ?

Figura 1.8: Aberración de la luz, predicción no relativista. En la segunda figura, el


observador se mueve hacia la derecha con velocidad V = 0,28c.

9. Debido al movimiento de la Tierra alrededor del Sol, las estrellas cambian su


posición aparente en el cielo durante el año, en un efecto conocido como abe-
rración de la luz4 . Use la suma galileana de velocidades (1.3) para reproducir la
figura 1.8.

4
La aberración de la luz fue descubierta por el astrónomo James Bradley en el siglo 18 [12].

19
Capítulo 1. Relatividad galileana

20
Capítulo 2

Principios de la teoría especial de la


relatividad

En 1905, en un artículo titulado Sobre la electrodinámica de los cuerpos en movimien-


to, Albert Einstein [13] propuso dos principios sobre los cuales basar su nueva teoría
especial de la relatividad:

Las leyes de la física tienen la misma forma en todos los marcos de referencia
inerciales.

La velocidad de la luz es la misma para todos los observadores, sin importar su


estado de movimiento o el movimiento de la fuente.

El primer principio es una extensión directa del principio de la relatividad de Gali-


leo, abarcando ahora toda la física en lugar de solo la mecánica. Esta extensión parece,
a simple vista, natural: después de todo, la distinción entre, por ejemplo, “mecánica”
y “electromagnetismo” es probablemente solo relevante para nosotros, seres humanos
que buscamos entender el Universo, y no representa una división inherente al fun-
cionamiento de la naturaleza. ¿Es posible acaso imaginar un experimento puramente
mecánico, donde el electromagnetismo no juegue ningún rol? Si su experimento invo-
lucra el acto de mirar, entonces ya no es puramente mecánico!
El segundo principio puede entenderse como una generalización del resultado del
experimento de Michelson–Morley, aunque no es claro que este haya sido una inspira-
ción directa para Einstein [14].
Hay, por supuesto, una violenta tensión entre estos dos principios: si la transfor-
mación de Galileo (1.1) es cierta, entonces los principios son incompatibles. En efecto,
como vimos en la sección 1.2, la transformación de Galileo aplicada a las ecuaciones de
Maxwell predice que observadores en movimiento relativo medirán distintas velocida-
des para la luz, de la misma manera como medirán distintas velocidades para cualquier
partícula en movimiento. Esto es una consecuencia directa del hecho que, de acuerdo
a la transformación de Galileo, las leyes del electromagnetismo no son las mismas para

21
Capítulo 2. Principios de la teoría especial de la relatividad

estos dos observadores. La única manera de compatibilizar los dos principios de Eins-
tein consiste en abandonar la transformación de Galileo. Crucialmente, es necesario
abandonar la idea del tiempo absoluto implícita en esta transformación.
En este capítulo analizamos las consecuencias más importantes de estos principios.

2.1. Relatividad de la simultaneidad


Dos rayos impactan los extremos de un tren y emiten destellos de luz, dejando
marcas tanto en el tren como en los rieles. Bob recibe los destellos provenientes de
ambos extremos del tren al mismo tiempo. Una vez que el tren ha pasado, Bob mide
la distancia entre su posición inicial y las marcas dejadas por los destellos en los rieles,
y descubre que son iguales. Esto quiere decir que Bob estaba justo frente al punto
medio del tren (donde, coincidentemente, también estaba Alice) cuando los destellos
fueron emitidos. Como los destellos de luz recorrieron la misma distancia para llegar
simultáneamente donde Bob, él concluye que ambos fueron emitidos simultáneamente.
Alice, que viaja a bordo del tren, no está de acuerdo.
Como se ilustra en la figura 2.1, Alice recibe primero el destello de luz proveniente
del extremo delantero del tren. Para Alice Newton, que cree en la veracidad de la
suma galileana de velocidades, la interpretación de este hecho es clara: el rayo de luz
proveniente del extremo delantero del tren viaja con velocidad c + V , donde V es la
velocidad del tren, mientras que el rayo de luz proveniente del extremo trasero del
tren viaja con velocidad c − V . El rayo de luz delantero llega primero porque viaja más
rápido. Midiendo el intervalo de tiempo entre la llegada de ambos rayos, Alice Newton
concluye que fueron emitidos simultáneamente. Para Alice Einstein, que cree en la
veracidad del principio de constancia de la velocidad de la luz, esta interpretación no es
válida. Como ambos rayos viajan a la misma velocidad y recorren la misma distancia, la
única explicación posible es que el rayo delantero fue emitido antes que el rayo trasero.
La evidencia experimental, como hemos visto, respalda a Alice Einstein: en el marco
del tren, los destellos de luz no son simultáneos.
Este análisis es simple pero demoledor: Bob afirma que los dos eventos son simultá-
neos, y Alice no está de acuerdo. La aparente paradoja no tiene solución; simplemente,
debemos aceptar que los principios de Einstein implican que el concepto de simulta-
neidad es relativo, es decir, dependiente del observador.

2.2. Contracción de la longitud


Contracción de Lorentz–Fitzgerald. Bob mide la distancia entre las marcas dejadas
por los rayos en los rieles y determina la longitud del tren. Esta medición le parece
válida a Bob, pues, según él, los rayos impactaron ambos extremos del tren simultá-
neamente. Alice, por supuesto, no está de acuerdo: según ella, el impacto delantero
ocurrió antes que el impacto trasero. Como el tren se mueve entre ambos impactos,

22
2.2. Contracción de la longitud

B
? A ?

A
B

Figura 2.1: Bob, mirando desde el andén, recibe simultáneamente destellos provenien-
tes de los extremos del tren. Alice, en cambio, recibe primero el destello del extremo
delantero. En la figura, el tren se mueve hacia la derecha con velocidad V = 2c/3.

23
Capítulo 2. Principios de la teoría especial de la relatividad

Alice concluye que Bob está midiendo una longitud menor que la longitud verdadera
del tren.
Esta contracción de la longitud es un efecto relativista directamente relacionado con
la relatividad de la simultaneidad. Para medir la longitud de un objeto en movimiento,
debe determinarse la posición de sus extremos en un mismo instante de tiempo, es
decir, simultáneamente. Como dos eventos simultáneos para Bob no lo son necesaria-
mente para Alice, las mediciones de la longitud diferirán entre ambos observadores.
Alice, en reposo con respecto del tren, mide su longitud propia, que es siempre
mayor a la longitud medida por cualquier otro observador en movimiento relativo.
Definición 2.1 (Longitud propia). Llamamos longitud propia o longitud en reposo a la
longitud de un objeto medida en su marco comóvil instantáneo.

Invariancia de la dimensión transversal. La contracción de Lorentz–Fitzgerald ocu-


rre solo en la dirección del movimiento; las dimensiones transversales no se ven afec-
tadas. Para establecer este hecho, asumamos por un momento que las longitudes per-
pendiculares a la velocidad del tren también se contraen.
Bob observa el tren en el que viaja Alice a medida que este se acerca a la entrada
de un túnel. El túnel, por supuesto, ha sido diseñado de manera que su entrada es un
poco más ancha que el tren, permitiéndole entrar holgadamente. Bob no tiene motivos
para preocuparse; según él, el tren en movimiento es aún más angosto y más bajo que
el tren en reposo, por lo que entrará en el túnel sin problemas. Alice, en cambio, mira
la entrada del túnel con angustia. Según ella, el tren está en reposo y la entrada del
túnel se les acerca a gran velocidad, haciéndose más angosta y más baja mientras más
rápido vaya el tren. Si la velocidad del tren es lo suficientemente alta, la entrada del
túnel será demasiado pequeña como para permitirle pasar, y se producirá un accidente
de proporciones.
La situación planteada en el párrafo anterior es una contradicción lógica: no es po-
sible que el tren entre al túnel, según Bob, y choque contra la entrada, según Alice.
Como ambos puntos de vista deberían ser válidos si la dimensión transversal al movi-
miento también se contrae, concluimos que esto no ocurre: la contracción de Lorentz–
Fitzgerald solo afecta las longitudes paralelas, no las perpendiculares, a la dirección
del movimiento. En otras palabras: el tren en movimiento se hace más corto, pero no
más angosto o más bajo.

2.3. Dilatación del tiempo


La velocidad de la luz. Un reloj de luz es, conceptualmente al menos, el más simple
de los relojes. Consiste en dos espejos paralelos, separados por una distancia fija, entre
los cuales rebota un rayo de luz. Cada impacto del rayo de luz en uno de los espejos
corresponde a un “tic” o un “tac” del reloj.
Supongamos, para fijar ideas, que la distancia entre los espejos que forman el reloj
de luz es igual a 3 metros. Esto significa que el tiempo que tarda un rayo de luz en ir de

24
2.3. Dilatación del tiempo

un espejo al otro es de, aproximadamente, 10 ns. De acuerdo al principio de constancia


de la velocidad de la luz, c ≈ 3 × 108 m/s es una constante fundamental, la misma para
todos los observadores. Podemos por lo tanto, sin ambigüedad, afirmar que la distancia
entre los dos espejos es de 10 ns. Esta afirmación tiene una sola interpretación posible:
el tiempo que tarda un rayo de luz en ir de un espejo a otro es igual a 10 ns, y esta
información nos permite calcular la distancia entre los espejos (en metros, por ejemplo)
de manera inequívoca.
Medir la distancia en unidades de tiempo (e.g., nanosegundos) no es algo ajeno a
nuestra experiencia. Es común, por ejemplo, decir “vivo a 45 minutos de la Universi-
dad”, o “la casa de mis padres queda a dos horas de Bogotá”. En ambos casos existe
una velocidad implícita que permite traducir tiempo a distancia (en estos ejemplos, la
velocidad promedio de un bus, seguramente). La velocidad de la luz, al ser la misma
para todos los observadores, provee de un factor de conversión universal entre tiempo
y distancia.
Este rol de factor de conversión de unidades para la velocidad de la luz está reco-
nocido explícitamente en la definición moderna de metro [15]:
El metro, símbolo m, es la unidad SI de longitud. Se define tomando el valor
numérico exacto de la velocidad de la luz en el vacío c como 299 792 458
cuando se expresa en la unidad m s−1 , donde el segundo está definido en
términos de la frecuencia del cesio ∆νCs .
Esto quiere decir que, por definición, 1 metro es la distancia recorrida por un rayo de
luz en el vacío en un intervalo de tiempo de 1/299 792 458 segundos.
Por completitud, la definición moderna de segundo es [15]:
El segundo, símbolo s, es la unidad SI de tiempo. Se define tomando el valor
numérico exacto de la frecuencia del cesio ∆νCs , la frecuencia de transición
hiperfina del estado fundamental no perturbado del átomo de cesio-133,
como 9 192 631 770 cuando se expresa en la unidad Hz, que es igual a s−1 .
De estas definiciones resulta que la velocidad de la luz en el vacío es igual a 299 792 458
metros por segundo exactamente, i.e., c = 299 792 458 m/s.
Nosotros vamos a llevar esta equivalencia a su conclusión lógica, definiendo un
“segundo de distancia” como la distancia recorrida en el vacío por la luz durante un
intervalo de tiempo de un segundo. Similarmente, definimos un “metro de tiempo”
como el tiempo necesario para que la luz recorra una distancia de un metro en el
vacío. Con estas definiciones, podemos escoger la misma unidad (metro o segundo)
para medir tiempos y distancias. Una consecuencia inmediata es que la velocidad de
la luz resulta ser igual a 1 (adimensional):
1 metro (espacio) 1 segundo (espacio)
c= = = 1. (2.1)
1 metro (tiempo) 1 segundo (tiempo)
Dicho de otra manera, 1 s = 299 792 458 m, y 1 m = 1/299 792 458 s. Usando las mis-
mas unidades para tiempo y espacio, todas las velocidades resultan ser adimensionales,
debiendo ser interpretadas como fracciones de la velocidad de la luz.

25
Capítulo 2. Principios de la teoría especial de la relatividad

4m 4m

5m 5m ∆t
3m ∆t 0

E R ∆x

Figura 2.2: Izquierda: Bob, observando el reloj de luz de Alice desde el andén, percibe
que el rayo de luz sigue la trayectoria que se muestra en la figura. Derecha: triángulo
equivalente usado para cuantificar la dilatación del tiempo.

Volviendo a nuestro reloj de luz, podemos decir que el tiempo que tarda el rayo de
luz en ir de un espejo a otro es de 3 metros.
∗ ∗ ∗

Montada en un tren muy rápido, Alice estudia el reloj de luz ubicado sobre la mesita
frente a su asiento. Definimos E como el evento donde el rayo de luz es emitido desde
el espejo inferior, y R como el evento donde el rayo de luz es recibido en el mismo
espejo inferior, luego de haber sido reflejado una vez en el espejo superior. Para Alice,
ambos eventos ocurren en el mismo punto en el espacio (el reloj de luz está en reposo
respecto de Alice), y el tiempo que transcurre entre uno y otro es de 6 metros:

∆x 0 = 0, ∆t 0 = 6 m. (2.2)

Usamos variables primadas para denotar las cantidades medidas por Alice (en el marco
K 0 ) y variables no primadas para denotar aquellas medidas por Bob (en el marco K),
quien, por supuesto, está observando toda la escena desde el andén. En la figura 2.2
se muestra la trayectoria seguida por el rayo de luz entre los eventos E y R de acuerdo
a Bob. Para Bob, la separación espacial entre E y R es igual a la distancia recorrida
por el tren entre ambos eventos. Esta distancia debe ser mayor que seis metros, puesto
que, según Bob, el rayo de luz recorre una distancia mayor que los seis metros medidos
por Alice. Fijemos la velocidad del tren de modo tal que su desplazamiento entre los
eventos E y R, medido por Bob, sea de 8 metros. Entonces, el teorema de Pitágoras nos
permite calcular que el tiempo transcurrido entre ambos eventos, de acuerdo a Bob, es
de 10 metros:

∆x = 8 m, ∆t = 10 m. (2.3)

En particular, esto significa que la velocidad del tren (medida por Bob) es v = ∆x/∆t =
0,8, i.e., el 80 % de la velocidad de la luz.
Decimos que el intervalo de tiempo entre los eventos E y R medido por Alice es un
intervalo de tiempo propio, pues, para Alice, ambos eventos ocurren en un mismo punto

26
2.4. El espacio-tiempo de Minkowski

del espacio (∆x 0 = 0). Bob, en cambio, mide un intervalo de tiempo mayor. Esta es la
dilatación del tiempo, un efecto relativista inseparable de la contracción de la longitud,
y, al igual que esta, una consecuencia inevitable de la relatividad de la simultaneidad.
Definición 2.2 (Tiempo propio). Decimos que un observador K mide un intervalo de
tiempo propio ∆τ entre dos eventos si para él los eventos ocurren en el mismo punto
del espacio, i.e., si ∆x = 0 en el marco K.
En general, la relación entre los intervalos de tiempo medidos por Bob y Alice, ∆t
y ∆t 0 , puede calcularse a partir del triángulo rectángulo a la derecha de la figura 2.2.
Poniendo ∆x = v∆t, hallamos
2
(v∆t)2 + ∆t 0 = (∆t)2 . (2.4)
Despejando ∆t, podemos escribir
∆t = γ∆t 0 , (2.5)
donde el factor de Lorentz γ está definido por
1
γ= p . (2.6)
1 − v2
Como γ ≥ 1 (ver figura 2.3), encontramos que ∆t ≥ ∆t 0 .
Note que γ diverge cuando la velocidad del tren tiende a la velocidad de la luz.
Para velocidades mayores que la velocidad de la luz, γ pasa a ser imaginario, lo cual
es inaceptable para una cantidad que representa un cociente de intervalos temporales
(ambos reales). Luego, hemos encontrado un resultado fundamental: la velocidad de la
luz constituye un límite máximo para la velocidad de cualquier partícula.
El valor de γ puede interpretarse como una medida de la magnitud de los efectos
relativistas que ocurren a una velocidad v dada, i.e., de la divergencia entre las pre-
dicciones relativista y no relativista para un mismo fenómeno. Esta diferencia alcanza
un 1 % recién cuando v ≈ 1/7. Esto quiere decir que si tomamos como referencia este
valor para decidir cuándo se hace necesario reemplazar la mecánica de Newton con la
mecánica relativista, el umbral de velocidad está en torno a un 14 % de la velocidad
de la luz.

2.4. El espacio-tiempo de Minkowski


La relación entre las separaciones espaciales y temporales medidas por Alice y Bob
en el ejemplo de la sección 2.3 puede resumirse en la forma
−∆t 2 + ∆x 2 = −∆t 02 + ∆x 02 (2.7)
(recuerde que ∆x 0 = 0 en este caso). Esto significa que existe una cantidad invariante,
que tanto Alice como Bob pueden calcular a partir de las mediciones hechas en sus
marcos de referencia correspondientes, y en cuyo valor ambos están de acuerdo.

27
Capítulo 2. Principios de la teoría especial de la relatividad

10
1
γ= p
1 − v2

Factor de Lorentz, γ
5

1
0 0,2 0,4 0,6 0,8 1
Magnitud de la velocidad, v

Figura 2.3: El factor de Lorentz es siempre mayor o igual a 1 y diverge cuando |~ v | → 1.


Cuando |~ v |  1, puede usarse la aproximación γ ≈ 1 + 12 v 2 (línea punteada). Note que
el eje vertical está en escala logarítmica.

Definición 2.3 (Intervalo espacio-temporal). Sean ∆t y ∆x las separaciones temporal


y espacial, respectivamente, entre dos eventos medidas en un marco de referencia K. El
intervalo espacio-temporal ∆s2 entre ambos eventos está definido mediante la ecuación

∆s2 = −∆t 2 + ∆x 2 . (2.8)

Un observador K 0 en movimiento respecto de K medirá, en general, separaciones tem-


poral y espacial ∆t 0 y ∆x 0 distintas de ∆t y ∆x. Sin embargo, ambos están de acuerdo
en el valor de ∆s2 :

∆s02 = −∆t 02 + ∆x 02 = −∆t 2 + ∆x 2 = ∆s2 . (2.9)

Note que, a pesar de la notación utilizada, ∆s2 puede ser positivo, negativo, o cero,
incluso para eventos no coincidentes.

En 1908, Hermann Minkowski descubrió que la recién formulada teoría especial


de la relatividad de Einstein podía entenderse como la física en lo que hoy llamamos
el espacio-tiempo de Minkowski: un espacio de cuatro dimensiones, donde cada pun-
to, llamado “evento”, es determinado por las coordenadas (t, x, y, z), y la distancia, o
intervalo espacio-temporal, entre dos eventos infinitesimalmente cercanos puede cal-
cularse a partir de la expresión

ds2 = −d t 2 + d x 2 + d y 2 + dz 2 . (2.10)

28
2.4. El espacio-tiempo de Minkowski

La presencia del signo menos delante de d t 2 en la ec. (2.10) hace que el espacio-
tiempo de Minkowski difiera de maneras importantes de R4 , donde este signo menos
no aparece. Minkowski mismo no escatimó palabras para resaltar la importancia de su
descubrimiento (mi traducción):

Las opiniones sobre el espacio y el tiempo que deseo exponerles han creci-
do en el suelo de la física experimental. En ella yace su fortaleza. Son de
tendencia radical. De ahora en adelante, el espacio por sí mismo y el tiempo
por sí mismo deben reducirse completamente a sombras, y solo una especie
de unión entre ambos habrá de conservar independencia.
Hermann Minkowski, 1908 [16].

A menudo representamos el espacio-tiempo en un plano bidimensional, donde tra-


dicionalmente el tiempo t apunta hacia arriba y escogemos una dimensión espacial,
por ejemplo, x, apuntando hacia la derecha. En esta representación, que llamamos un
diagrama espacio-temporal, se ignoran siempre dos direcciones espaciales.
En el diagrama espacio-temporal de la figura 2.4, el origen del sistema coordenado,
O, de coordenadas t = 0, x = 0, sirve como evento de referencia. Un rayo de luz que
pase por O sigue una de las líneas punteadas, según vaya hacia la izquierda o hacia la
derecha. En general, el lugar geométrico de todos los rayos de luz que pasan por O es
llamado el cono de luz de O. La denominación “cono” proviene de la imagen mental de
estos rayos de luz cuando incluimos una dimensión espacial extra en el diagrama.
El cono de luz define la estructura causal del espacio-tiempo. El evento A, por ejem-
plo, queda en el futuro de O, porque es posible llegar desde O a A viajando a una
velocidad menor que la de la luz. Esto significa que es posible que exista una relación
causal entre O y A, vale decir, que lo que ocurra en O sea la causa de lo que ocurra
en A. Similarmente, el evento C queda en el pasado de O. En cambio, no es posible
para O tener influencia alguna sobre lo que ocurra en B, porque no hay manera de
transferir información entre ambos a una velocidad menor que la de la luz. Tampoco
puede existir conexión causal entre D y O.

Definición 2.4 (Separación tipo tiempo). Decimos que dos eventos tienen una sepa-
ración tipo tiempo si su separación espacial, ∆~r , tiene una magnitud menor que su
separación temporal, ∆t. En este caso, |∆~r | < |∆t|, o, equivalentemente, ∆s2 < 0.

Definición 2.5 (Separación tipo espacio). Decimos que dos eventos tienen una sepa-
ración tipo espacio si su separación espacial, ∆~r , tiene una magnitud mayor que su
separación temporal, ∆t. En este caso, |∆~r | > |∆t|, o, equivalentemente, ∆s2 > 0.

Definición 2.6 (Separación nula o tipo luz). Decimos que dos eventos tienen una se-
paración nula o tipo luz si su separación espacial, ∆~r , tiene la misma magnitud que
su separación temporal, ∆t. En este caso, |∆~r | = |∆t|, o, equivalentemente, ∆s2 = 0.
Note que dos eventos distintos pueden tener una separación nula o tipo luz.

29
Capítulo 2. Principios de la teoría especial de la relatividad

A
B

Figura 2.4: Espacio-tiempo de Minkowski, con varios eventos y el cono de luz asociado
al origen.

Dos eventos cuya separación sea tipo tiempo pueden tener una conexión causal.
En cambio, dos eventos cuya separación es tipo espacio siempre están desconectados
causalmente. Como las definiciones 2.4–2.6 hacen referencia al signo del intervalo
espacio-temporal entre dos eventos, ellas permanecen válidas en todos los marcos de
referencia inerciales. Esto significa que si dos eventos tienen una separación tipo tiempo
en un marco K dado, entonces tienen también una separación tipo tiempo en cualquier
marco K 0 que se mueva con velocidad constante respecto de K, y similarmente para
los casos de separaciones tipo espacio y nulas o tipo luz.
Cuando dos eventos tienen una separación tipo tiempo, el intervalo espacio-tempo-
ral entre ellos es esencialmente equivalente a un intervalo de tiempo propio, ∆s2 =
−∆τ2 (ver definición 2.2). En efecto, cuando ∆s2 < 0 siempre es posible encontrar un
marco K 0 donde los dos eventos ocurren en el mismo punto del espacio, de manera
2
que ∆s02 = −∆t 02 + |∆~r 0 | = −∆t 02 .

2.5. Paradoja de los gemelos y viaje al futuro


El límite impuesto por la velocidad de la luz parece, a primera vista, cerrarnos la
posibilidad de explorar el Universo. ¿Cómo vamos a llegar en el transcurso de una vida
humana, pensaríamos ingenuamente, a una estrella que diste más de 100 años-luz de
la Tierra, si no podemos viajar más rápido que la luz? Esta pregunta ignora los efectos
de la dilatación temporal y la contracción de la longitud, como veremos a continuación.
La estrella más próxima al Sol es Proxima Centauri, ubicada a una distancia de
aproximadamente ∆x = 4,244 años (usamos años para medir distancias!). Esta dis-
tancia está medida en el marco K donde la Tierra está instantáneamente en reposo.
(Como las velocidades relativas entre la Tierra, el Sol y Proxima son mucho menores
que la velocidad de la luz, no cometemos ningún gran error si asumimos que los tres

30
2.5. Paradoja de los gemelos y viaje al futuro

B ?

Figura 2.5: Diagrama espacio-temporal del viaje de ida y vuelta de Alice a Proxima
Centauri. Bob, quien se queda en la Tierra, es representado por una línea vertical.

están en reposo en K). Para simplificar, vamos a imaginar que Alice viaja desde la Tie-
rra a Proxima a velocidad constante v = 3/5. Esto significa que el tiempo que tarda en
llegar está dado por ∆t = ∆x/v = 7,07 años. Este es el tiempo medido por Bob (mar-
co K), quien se queda en la Tierra. ¿Cuánto dura el viaje de acuerdo a Alice? Según
Alice (marco K 0 ), la separación espacial entre los eventos salida de la Tierra y llegada
a Proxima es ∆x 0 = 0: ella no se ha movido de su nave en todo el viaje. Esto significa
que Alice mide un intervalo de tiempo propio ∆t 0 entre ambos eventos. Con γ = 5/4,
hallamos ∆t 0 = ∆t/γ = 5,66 años. Esto es 1,41 años menos que el tiempo medido por
Bob. ¿Adónde se han ido esos 515 días?
Si Alice decide retornar a la Tierra tan pronto como llega a Proxima, la situación no
hace más que empeorar: cuando se reencuentra con Bob, este ha envejecido 14,1 años,
mientras que, para Alice, solo han transcurrido 11,3 años. Esta es la famosa paradoja
de los gemelos. Si Alice y Bob son hermanos gemelos, entonces tienen exactamente la
misma edad cuando Alice comienza su viaje, pero 2,82 años de diferencia cuando Alice
vuelve a la Tierra. Al igual como sucede con otras “paradojas” relativistas, no hay aquí
ninguna contradicción. Los intervalos de tiempo medidos por Alice y Bob son distintos
porque el tiempo no es una variable externa y absoluta, como creía Newton, sino una
más de las direcciones en el espacio-tiempo. Dos observadores en movimiento relativo
medirán, en general, intervalos de tiempo distintos entre dos eventos. Es importante
notar que la situación entre Alice y Bob no es perfectamente simétrica, porque Alice
debe cambiar su velocidad, es decir, acelerar, para poder volver a la Tierra. Por este
motivo es siempre Bob quien más envejece, nunca Alice. Bob mide un intervalo de
tiempo dilatado con respecto al intervalo de tiempo propio medido por Alice.
¿Qué pasa si Alice viaja en una nave muy rápida, con una velocidad muy cercana a
la de la luz? La magnitud de la dilatación temporal está dada por el factor de Lorentz,
γ, y este crece sin límite a medida que la velocidad se acerca a la de la luz. Esto significa
que, yendo lo suficientemente rápido, sin nunca ir más rápido que la luz, Alice puede
demorarse tan poco como quiera en su viaje. Las limitaciones aquí son tecnológicas, no
fundamentales. Por ejemplo, cuando v = 0,999 95, γ = 100, y hallamos ∆t 0 = 15,5 días
para el viaje de ida. En vez de cerrarnos el acceso al Universo, la Relatividad pone todo

31
Capítulo 2. Principios de la teoría especial de la relatividad

el universo a nuestra disposición: solo tenemos que encontrar un medio para viajar a
velocidades muy cercanas a la de la luz, y podemos llegar tan lejos como queramos en
un tiempo tan corto como deseemos.
¿No es necesario viajar más rápido que la luz para recorrer una distancia de 4,244
años en apenas 15,5 días? La respuesta es no: en el marco de Alice, la distancia entre
la Tierra y Proxima está reducida en el mismo factor γ.
Con γ = 100, el viaje de ida y vuelta de Alice dura aproximadamente un mes. Para
Bob, han transcurrido 8,5 años. ¿Cómo interpreta Alice lo que ve cuando llega a la
Tierra? Luego de un viaje de un mes, ella retorna a una Tierra donde han transcurrido
ocho años y medio. Alice ha efectivamente viajado al futuro, ocho años y cinco meses
hacia el futuro. Si Alice desear viajar cien años hacia el futuro, también puede hacerlo.
Para ello, debe dirigirse a una estrella ubicada a 50 años-luz de distancia y viajar muy
rápido, a una velocidad muy cercana a la de la luz. Por ejemplo, con v = 0,999 999 5,
el factor de Lorentz llega a γ = 1000. Esto significa que el viaje de ida y vuelta tarda
36,5 días para Alice, un mes largo, y cuando regresa, en la Tierra han transcurrido cien
años. Puede ser que Bob ya no esté presente para darle la bienvenida.

32
Capítulo 3

Transformaciones de Lorentz

Sea P un evento en el espacio-tiempo de Minkowski (“un rayo de luz impacta el


extremo delantero de un tren”). En un marco dado K (“Bob, observando el tren desde
el andén”) este evento tiene las coordenadas (t, x, y, z). Un observador en un marco K 0
(“Alice, montada en el tren”) asigna coordenadas distintas, (t 0 , x 0 , y 0 , z 0 ), a este mismo
evento. ¿Cómo podemos establecer una relación entre las coordenadas asignadas a P
por ambos observadores?
La relación que buscamos está sujeta a dos restricciones. En primer lugar, la relación
debe ser lineal. Esta restricción está relacionada con la hipótesis de homogeneidad e
isotropía del espacio-tiempo, que nos permite escoger arbitrariamente el evento de
referencia, u origen, O. En segundo lugar, la transformación debe dejar invariante la
forma cuadrática
ds2 = −d t 2 + d x 2 + d y 2 + dz 2 , (3.1)
que corresponde al intervalo espacio-temporal (“distancia”) entre dos eventos infini-
tesimalmente próximos en el espacio-tiempo. Como la relación es lineal, basta con
asegurar la invariancia de
s2 = −t 2 + x 2 + y 2 + z 2 , (3.2)
que corresponde al intervalo espacio-temporal entre los eventos P y O, de coordenadas
(t, x, y, z) y (0, 0, 0, 0), respectivamente.
Aunque no corresponde a la imagen mental de Alice y Bob en movimiento relativo,
una rotación espacial, descrita por una matriz ortogonal R de 3 × 3, suplementada por
la ecuación t 0 = t, satisface todos nuestros requerimientos. En efecto, una rotación es-
pacial puede entenderse como la transformación lineal más general que deja invariante
la distancia al origen s, con s2 = x 2 + y 2 + z 2 . En R3 , distinguimos tres rotaciones inde-
pendientes, cada una de ellas confinada a los planos x y, yz, y z x (o, equivalentemente,
respecto de los ejes z, x, y y). En el espacio-tiempo de Minkowski, debemos añadir “ro-
taciones” confinadas a los planos t x, t y, y tz, entendidas como las transformaciones
lineales más generales que dejan invariante el intervalo espacio-temporal (3.2). La si-
militud entre ambos conjuntos de transformaciones no es solo formal. En las próximas
secciones vamos a usar esta similitud para deducir la forma explícita de las rotaciones
en los planos t x, t y, y tz, llamadas boosts.

33
Capítulo 3. Transformaciones de Lorentz

~r ~r
y y

~r 0
y0
y0

θ
x0 θ

θ
x x x0

Figura 3.1: Las ecuaciones de transformación (3.3)–(3.4) pueden interpretarse de ma-


nera “pasiva” (izquierda) o de manera “activa” (derecha).

3.1. Rotación en el plano x y


Una rotación en el plano x y puede describirse por el par de ecuaciones

x 0 = x cos θ + y sin θ , (3.3)


0
y = −x sin θ + y cos θ , (3.4)

donde θ corresponde al ángulo de rotación. Como se sugiere en la figura 3.1, estas


ecuaciones tienen dos interpretaciones posibles. En la primera de ellas, a menudo co-
nocida como punto de vista pasivo, (x, y) y (x 0 , y 0 ) corresponden a las coordenadas de
un mismo punto P en dos sistemas distintos, K y K 0 , rotados uno respecto del otro en
un ángulo θ . En la segunda interpretación, a menudo conocida como punto de vista
activo, (x, y) y (x 0 , y 0 ) corresponden a las coordenadas de dos puntos distintos, P y Q,
en un mismo sistema coordenado. En el punto de vista pasivo, la rotación afecta solo a
los ejes coordenados, dejando inalterados los puntos. En el punto de vista activo, la ro-
tación actúa sobre los puntos, dejando inalterados los ejes coordenados. Es importante
distinguir entre ambos puntos de vista cuando se estudian ejemplos concretos.
Al ser lineal, la transformación (3.3)–(3.4) puede escribirse en la forma matricial
• 0 ˜ •
x cos θ sin θ x
˜• ˜
= , (3.5)
y0 − sin θ cos θ y

donde la matriz de rotación,

cos θ sin θ
• ˜
R (θ ) = , (3.6)
− sin θ cos θ

34
3.1. Rotación en el plano x y

es ortogonal, R T R = 1, y tiene determinante uno, det (R) = +1. El conjunto de todas


las matrices de 2 × 2 con estas propiedades forma el grupo SO(2).

Definición 3.1 (Grupo). Un grupo es un conjunto, G, dotado de una operación binaria,


·, a menudo llamada la “multiplicación” del grupo, que combina dos elementos cuales-
quiera a y b para producir otro elemento, denotado por a · b o simplemente ab. Para
calificar como grupo, el conjunto y la operación deben satisfacer cuatro condiciones,
conocidas como los axiomas de un grupo:

Clausura. Si a, b ∈ G, entonces a · b ∈ G.

Asociatividad. Si a, b, c ∈ G, entonces (a · b) · c = a · (b · c).

Existencia de unidad. Existe e ∈ G tal que, para todo a ∈ G, se tiene que a · e = e · a =


a. Este elemento es único y se conoce como identidad.

Existencia de inverso. Si a ∈ G, entonces existe un elemento a−1 ∈ G tal que a · a−1 =


a−1 · a = e.

Existen grupos discretos, con un número típicamente finito de elementos, y grupos


continuos, con un número infinito de elementos. Decimos que un grupo (discreto o
continuo) es abeliano si a · b = b · a para todo a, b ∈ G. En física, los grupos a menudo
representan transformaciones, donde la operación del grupo corresponde a la composi-
ción de dos transformaciones.
Para verificar que las rotaciones en el plano x y forman un grupo, comprobamos que
se satisfagan los axiomas. La propiedad de clausura se satisface porque dos rotaciones
sucesivas en el plano x y pueden siempre ser interpretadas como una única rotación
en el mismo plano. Equivalentemente, el producto de dos matrices ortogonales con
determinante uno produce siempre otra matriz ortogonal con determinante uno. La
propiedad de asociatividad se hereda directamente de la asociatividad del producto
matricial. La rotación en un ángulo θ = 0, representada como la matriz identidad,
corresponde al elemento identidad del grupo. Finalmente, toda rotación en un ángulo
θ puede deshacerse a través de una rotación en un ángulo −θ ; en efecto, [R (θ )]−1 =
R (−θ ).
El grupo SO(2), con infinitos elementos (tantos como ángulos θ existen entre 0
y 2π), es uno de los ejemplos más simples de un grupo de Lie. La propiedad clave
de un grupo de Lie es que sus elementos (matrices de rotación R, en este caso) son
funciones analíticas de un número finito de parámetros reales (solo uno en este caso, el
ángulo θ ). Muchas de las propiedades de un grupo de Lie pueden deducirse estudiando
elementos ubicados infinitesimalmente cerca de la identidad, lo cual corresponde, en
nuestro caso, a rotaciones infinitesimales.
Si el ángulo de rotación es pequeño, |θ |  1, podemos escribir, a primer orden en
θ,
1 θ 1 0 0 1
• ˜ • ˜ • ˜
R (θ ) = = +θ = 1 + θ J, (3.7)
−θ 1 0 1 −1 0

35
Capítulo 3. Transformaciones de Lorentz

donde hemos definido


0 1
• ˜
J= . (3.8)
−1 0
Interpretando la ec. (3.7) como los dos primeros términos de una expansión en serie,
podemos construir la rotación finita a partir de la rotación infinitesimal simplemente
completando la serie, mediante un proceso llamado exponenciación.

Definición 3.2 (Exponencial matricial). Sea M una matriz cuadrada cuyos elementos
son números reales o complejos. La exponencial matricial de M , denotada por exp (M )
o, a veces, e M , se define mediante la serie

X Mn 1 2 1 3
exp (M ) = =1+M + M + M + ··· . (3.9)
n=0
n! 2! 3!

Esta serie no solo converge siempre, para cualquier matriz M , sino que exp (M ) resulta
ser una matriz invertible, con [exp (M )]−1 = exp (−M ).

La siguiente identidad es una propiedad clave de la exponencial matricial:

det [exp (M )] = eTr(M ) . (3.10)

En particular, la ec. (3.10) implica que det [exp (M )] 6= 0, mostrando que exp (M ) es
una matriz invertible.
Note que, en general, exp (A) exp (B) 6= exp (A + B). La igualdad solo se cumple si A
y B conmutan.

∗ ∗ ∗

Para verificar que la aproximación a primer orden (3.7) corresponde en efecto a los
primeros términos en la serie de una exponencial matricial, calculamos explícitamente
exp (θ J) siguiendo la definición general (3.9):

X θn θ2 2 θ3 3
exp (θ J) = Jn = 1 + θJ + J + J + ··· . (3.11)
n=0
n! 2! 3!

Es claro que para continuar necesitamos las potencias de J. Afortunadamente, esta es


una tarea sencilla, ya que

0 1 0 1 −1 0
• ˜• ˜ • ˜
2
J = = = −1. (3.12)
−1 0 −1 0 0 −1

De aquí obtenemos inmediatamente todas las potencias, las que resulta conveniente
separar en pares e impares:

J 2n = (−1)n 1, J 2n+1 = (−1)n J, (3.13)

36
3.1. Rotación en el plano x y

para n = 0, 1, 2, . . .. Separando también la expansión en serie en potencias pares e


impares, hallamos

∞ ∞
X θ 2n 2n X θ 2n+1
exp (θ J) = J + J 2n+1
n=0
(2n)! n=0
(2n + 1)!
∞ n 2n ∞
X (−1) θ X (−1)n θ 2n+1
=1 +J
n=0
(2n)! n=0
(2n + 1)!
θ2 θ4 θ3 θ5
 ‹  ‹
=1 1− + + ··· + J θ − + + ··· .
2! 4! 3! 5!

Reconociendo en estas expresiones las series de Taylor para cos θ y sin θ , podemos
escribir1
cos θ sin θ
• ˜
exp (θ J) = 1 cos θ + J sin θ = = R (θ ) . (3.14)
− sin θ cos θ

La matriz J recibe el nombre de generador de rotaciones en el plano x y, pues ella


genera rotaciones infinitesimales a través de R = 1 + θ J, cuando |θ |  1, y rotaciones
finitas a través de la exponencial matricial R = exp (θ J).
La forma explícita de una rotación infinitesimal es [cf. ec. (3.7)]:

x 0 = x + θ y, (3.15)
0
y = y − θ x. (3.16)

Esta transformación infinitesimal preserva la distancia al cuadrado s2 = x 2 + y 2 a primer


orden en θ :

x 02 + y 02 = (x + θ y)2 + ( y − θ x)2
= x 2 + 2θ x y + y 2 − 2θ x y + O θ 2


= x2 + y2 + O θ 2 .


(Note cómo los dos términos lineales en θ se cancelan entre sí).


¿Qué hemos aprendido con este ejercicio? Partimos de una transformación conoci-
da, la rotación en el plano x y por un ángulo θ , y mostramos que la matriz J que genera
rotaciones infinitesimales puede usarse también para construir las rotaciones finitas a
través de la exponenciación matricial. El poder de este enfoque yace en el caso cuando
no conocemos la transformación finita, pero sí podemos construir una transformación
infinitesimal que sea correcta a primer orden. En este caso, la exponenciación matricial
se convierte en un método poderoso para construir la transformación finita a partir de
la versión infinitesimal.
1
Note la similitud entre la ec. (3.14) y la identidad de Euler e iθ = cos θ + i sin θ . ¿Cuál es la relación
entre ambas?

37
Capítulo 3. Transformaciones de Lorentz

3.2. Rotación en el plano t x


Una “rotación” en el plano t x debe ser una transformación lineal que preserve el
intervalo espacio-temporal s2 = −t 2 + x 2 . Por analogía con la rotación en el plano x y
[cf. ecs. (3.15)–(3.16)], vamos a probar la transformación infinitesimal

t 0 = t + φ x, (3.17)
0
x = x − φ t, (3.18)

donde φ es un parámetro similar al ángulo de rotación θ . Verificamos ahora si es-


ta transformación infinitesimal deja invariante el intervalo espacio-temporal a primer
orden en φ:

−t 02 + x 02 = − (t + φ x)2 + (x − φ t)2
= −t 2 − 2φ t x + x 2 − 2φ t x + O φ 2


= −t 2 + x 2 − 4φ t x + O φ 2 .


Este primer intento falla, pero nos sugiere cómo modificar la transformación. Como
segundo intento, probamos

t 0 = t − φ x, (3.19)
0
x = x − φ t, (3.20)

y verificamos que esta transformación sí deja invariante el intervalo espacio-temporal


a primer orden en φ:

−t 02 + x 02 = − (t − φ x)2 + (x − φ t)2
= −t 2 + 2φ t x + x 2 − 2φ t x + O φ 2


= −t 2 + x 2 + O φ 2 .


La transformación infinitesimal (3.19)–(3.20) puede escribirse matricialmente en


la forma • 0 ˜ •
t 1 −φ t
˜• ˜
= , (3.21)
x0 −φ 1 x
donde la matriz que media la transformación es

1 −φ 1 0 0 −1
• ˜ • ˜ • ˜
B (φ) = = +φ = 1 + φK, (3.22)
−φ 1 0 1 −1 0

con
0 −1
• ˜
K= . (3.23)
−1 0
La matriz K es el generador de rotaciones en el plano t x.

38
3.2. Rotación en el plano t x

Calculamos ahora la exponencial matricial exp (φK), que debería entregarnos la


transformación finita. Usando la definición (3.9), escribimos

X φn φ2 2 φ3 3
exp (φK) = K n = 1 + φK + K + K + ··· . (3.24)
n=0
n! 2! 3!

Para determinar las potencias de K, notamos que

0 −1 0 −1 1 0
• ˜• ˜ • ˜
2
K = = = 1, (3.25)
−1 0 −1 0 0 1
de donde hallamos

K 2n = 1, K 2n+1 = K, (3.26)

con n = 0, 1, 2, . . .. Separando también la expansión en serie en potencias pares e im-


pares, encontramos
∞ ∞
X φ 2n 2n X φ 2n+1
exp (φK) = K + K 2n+1
n=0
(2n)! n=0
(2n + 1)!
∞ 2n ∞
X φ X φ 2n+1
=1 +K
n=0
(2n)! n=0
(2n + 1)!
φ2 φ4 φ3 φ5
   
=1 1+ + + ··· + K φ + + + ··· .
2! 4! 3! 5!
Reconociendo en estas expresiones las series de Taylor para cosh φ y sinh φ, podemos
escribir
cosh φ − sinh φ
• ˜
exp (φK) = 1 cosh φ + K sinh φ = = B (φ) . (3.27)
− sinh φ cosh φ

Esta es la matriz para una rotación finita con parámetro φ en el plano t x, que llamamos
un “boost” en dirección x. Para comprobar que esta transformación en efecto deja
invariante el intervalo espacio-temporal, tomamos la transformación explícita,

t 0 = t cosh φ − x sinh φ, (3.28)


0
x = −t sinh φ + x cosh φ, (3.29)

y reemplazamos en s2 = −t 2 + x 2 :

−t 02 + x 02 = − (t cosh φ − x sinh φ)2 + (−t sinh φ + x cosh φ)2


= −t 2 cosh2 φ + 2t x sinh φ cosh φ − x 2 sinh2 φ+
+ t 2 sinh2 φ − 2t x sinh φ cosh φ + x 2 cosh2 φ
= −t 2 + x 2 cosh2 φ − sinh2 φ
 

= −t 2 + x 2 .

39
Capítulo 3. Transformaciones de Lorentz

Esto concluye nuestra búsqueda. Hemos hallado una transformación lineal en el plano
t x que depende de un parámetro φ y que preserva el intervalo espacio-temporal entre
eventos. Pero, ¿qué significa?
Para poder interpretar el boost (3.28)–(3.29), necesitamos partir recordando qué
se supone que debe representar. Aunque dedujimos la transformación por analogía con
las rotaciones en el plano x y, la interpretación física que estamos buscando es la de dos
sistemas inerciales, K y K 0 , que se mueven con velocidad relativa constante V~ . Como
nuestra transformación solo involucra t y x, es claro que V~ debe ser paralela al eje x.
Poniendo x 0 = 0 en la ec. (3.29), hallamos la ecuación de movimiento para el origen
del sistema K 0 : x = t tanh φ. Esta ecuación describe un movimiento en línea recta con
velocidad constante dada por2 (ver figura 3.2)
V = tanh φ. (3.30)
Llamando3 [cf. ec. (2.6)]
1
Γ = cosh φ = p , (3.31)
1 − V2
podemos reescribir las ecs. (3.28)–(3.29) en la forma
t 0 = Γ (t − V x) , (3.32)
0
x = Γ (x − V t) . (3.33)
Escrita de esta forma, es claro que el boost reemplaza a la transformación de Galileo,
por lo menos en el caso cuando la velocidad entre los marcos es paralela al eje x. Para
hacer más fácil la comparación, reintroducimos c:
Vx
 ‹
0
t =Γ t− 2 , (3.34)
c
x 0 = Γ (x − V t) . (3.35)
Cuando |V |  c, recuperamos la transformación de Galileo [cf. ec. (1.1)],
t 0 = t, (3.36)
0
x = x − V t. (3.37)
En el extremo opuesto, note que la parametrización V = tanh φ asegura que |V | <
1. La transformación con V = 1 es singular o, dicho de otra manera, no está definida.
Definición 3.3 (Configuración estándar). Decimos que dos marcos K y K 0 están en
configuración estándar cuando sus orígenes coinciden en t = t 0 = 0, sus ejes espaciales
respectivos son paralelos, y el movimiento relativo ocurre en la dirección del eje x
(o x 0 ) con rapidez constante V . El boost (3.32)–(3.33) relaciona las coordenadas de
un evento P en dos marcos que están en configuración estándar.
2
En inglés, φ es a menudo llamado “rapidity”. No conozco un término equivalente en español que
sea de uso generalizado.
3
Usamos una letra Γ mayúscula para distinguir el factor de Lorentz asociado a la velocidad constante
entre dos marcos, V , del factor de Lorentz γ asociado a la velocidad (en general, variable) de una
partícula, v.

40
3.2. Rotación en el plano t x

0,5

V 0

−0,5

−1
−3 −2 −1 0 1 2 3
φ

Figura 3.2: La velocidad relativa entre dos marcos K y K 0 puede escribirse en la forma
V = tanh φ, donde φ es un parámetro real (“rapidity”). Note que sin importar el valor
de φ, siempre se tiene |V | < 1.

Relatividad de la simultaneidad. Como la transformación (3.32)–(3.33) es lineal,


también es válida para las separaciones espacial y temporal entre dos eventos P y Q,
∆t = t Q − t P , ∆x = x Q − x P :
∆t 0 = Γ (∆t − V ∆x) , (3.38)
0
∆x = Γ (∆x − V ∆t) , (3.39)
donde ∆t 0 = t Q0 − t 0P , ∆x 0 = x Q0 − x P0 . La relatividad de la simultaneidad está incorpo-
rada en estas ecuaciones: poniendo ∆t = 0 (i.e., los eventos son simultáneos en K),
hallamos ∆t 0 = −Γ V ∆x, que es distinto de cero si ∆x 6= 0 (i.e., los eventos no son
simultáneos en K 0 ).

Contracción de la longitud. Bob mide la longitud del tren determinando la separa-


ción espacial ∆x entre dos eventos simultáneos, ∆t = 0. Alice no está de acuerdo, pues
para ella los eventos no son simultáneos: ∆t 0 = −Γ V ∆x 6= 0. La separación espacial
medida por Alice es [cf. ec. (3.39)] ∆x 0 = Γ ∆x. Luego, la longitud medida por Bob es
menor que la medida por Alice: ∆x = ∆x 0 /Γ .

Dilatación del tiempo. Alice mide el tiempo ∆t 0 transcurrido entre dos tics sucesivos
del reloj de luz, que para ella ocurren en el mismo lugar, ∆x 0 = 0. Bob no está de
acuerdo. Él mide una separación espacial ∆x = V ∆t entre los eventos. Reemplazando
en la ec. (3.38), hallamos ∆t 0 = Γ 1 − V 2 ∆t = ∆t/Γ . Esto quiere decir que el tiempo
medido por Bob es mayor que el medido por Alice: ∆t = Γ ∆t 0 .

41
Capítulo 3. Transformaciones de Lorentz

Interpretación gráfica del boost en dirección x. De acuerdo al punto de vista pasi-


vo, las ecs. (3.32)–(3.33) relacionan las coordenadas espacio-temporales de un único
evento P en dos marcos inerciales K y K 0 que se mueven con velocidad relativa cons-
tante V paralela al eje x. Para encontrar las coordenadas de P en el marco K 0 , usamos
las líneas t 0 = const. y x 0 = const. que se muestran en la figura 3.3:

t0
t 0 = const. ⇒ t= + V x, (3.40)
Γ
x0 x
x 0 = const. ⇒ t =− + . (3.41)
ΓV V

En esta “rotación hiperbólica”, los ejes t 0 y x 0 se acercan el uno al otro, cerrándose


como las hojas de una tijera, a medida que aumenta la velocidad V entre los marcos.
Cuando V → 1, los ejes primados tienden ambos a la línea diagonal t = x. Note
que es incorrecto interpretar φ como el ángulo (euclidiano) entre ejes primados y no
primados.
De acuerdo al punto de vista activo, las ecs. (3.32)–(3.33) relacionan las coorde-
nadas espacio-temporales de dos eventos P y Q en un mismo marco inercial K. Para
encontrar las coordenadas de Q, usamos las hipérbolas invariantes que se muestran en
la figura 3.4:
− t 02 + x 02 = −t 2 + x 2 = const. (3.42)

La invariancia del intervalo espacio-temporal nos garantiza que ambos eventos pueden
ser hallados sobre la misma hipérbola invariante.

El presente extendido. En su libro El orden del tiempo [17], Carlo Rovelli enfatiza
cómo la Relatividad modifica nuestro concepto del presente.
¿Qué significa que algo está ocurriendo ahora mismo en la galaxia de Andrómeda?
Dos eventos que parecen simultáneos para un observador K no lo son para un obser-
vador K 0 que se mueve respecto de K. Con ∆x = 2,5 × 106 años (la distancia entre la
Vía Láctea y Andrómeda), incluso una velocidad mucho menor que la de la luz como
V = 10−4 (e.g., la velocidad de la Tierra en su órbita alrededor del Sol) produce una
diferencia temporal ∆t 0 = 250 años de acuerdo a K 0 para dos eventos que son simul-
táneos según K. Hay una diferencia de 250 años entre lo que los observadores K y K 0
llaman ahora en la galaxia de Andrómeda.
Sean P y Q dos eventos con una separación tipo espacio. En este caso, siempre po-
demos encontrar observadores para los que P ocurre antes, después o al mismo tiempo
que Q. Esto quiere decir que no existe ningún instante particular que pueda ser iden-
tificado como “ahora” para un evento que ocurre lejos de nosotros. El presente no es
un instante sino un conjunto de instantes; este presente extendido corresponde a todos
los eventos que tienen una separación tipo espacio con nuestro evento de referencia.
Aquí y ahora podemos definir; allá y ahora no tiene un significado unívoco, sino que
depende del observador.

42
3.2. Rotación en el plano t x

t0
t

x0

Figura 3.3: Líneas t 0 = const. y x 0 = const. en un boost en dirección x (punto de vista


pasivo).

43
Capítulo 3. Transformaciones de Lorentz

t, t 0

x, x 0

Figura 3.4: Hipérbolas invariantes en un boost en dirección x (punto de vista activo).

44
3.3. Suma relativista de velocidades paralelas

3.3. Suma relativista de velocidades paralelas


En la sección 3.2 derivamos la forma de un boost en dirección x y encontramos
que no es posible que la velocidad relativa entre los marcos K y K 0 alcance o exceda la
velocidad de la luz. ¿Es posible alcanzar o exceder la velocidad de la luz componiendo
dos o más boosts? En la transformación de Galileo [cf. ec. (1.3)], las velocidades se
suman vectorialmente y no hay un límite máximo para su magnitud. ¿Cuál es la manera
relativista de sumar velocidades?
Para componer dos boosts en dirección x, consideramos tres marcos de referencia,
K, K 0 y K 00 . La velocidad de K 0 respecto de K es V1 = tanh φ1 , mientras que la velocidad
de K 00 respecto de K 0 es V2 = tanh φ2 . La pregunta que queremos responder es cuál es
la velocidad de K 00 respecto de K. Las transformaciones de K a K 0 y de K 0 a K 00 son
• 0 ˜ •
t cosh φ1 − sinh φ1 t
˜• ˜
= , (3.43)
x0 − sinh φ1 cosh φ1 x
• 00 ˜ • ˜• 0 ˜
t cosh φ2 − sinh φ2 t
00 = . (3.44)
x − sinh φ2 cosh φ2 x0

La transformación compuesta, que nos lleva directamente de K a K 00 , se obtiene mul-


tiplicando las matrices:
• 00 ˜ •
t cosh φ2 − sinh φ2 cosh φ1 − sinh φ1 t
˜• ˜• ˜
=
x 00 − sinh φ2 cosh φ2 − sinh φ1 cosh φ1 x
cosh (φ1 + φ2 ) − sinh (φ1 + φ2 ) t
• ˜• ˜
= .
− sinh (φ1 + φ2 ) cosh (φ1 + φ2 ) x

Este cálculo nos muestra que la matriz que media la transformación compuesta co-
rresponde también a un boost, con parámetro φ3 = φ1 + φ2 . Esto quiere decir que la
velocidad de K 00 respecto de K es
tanh φ1 + tanh φ2 V1 + V2
V3 = tanh φ3 = tanh (φ1 + φ2 ) = = . (3.45)
1 + tanh φ1 tanh φ2 1 + V1 V2
Esta es la suma relativista de velocidades paralelas.

Ejemplo 3.4. Alice se aleja de la Tierra a bordo de una nave espacial que se mueve
con velocidad V1 = 0,8 respecto de Bob, quien ha decidido quedarse en la Tierra.
La hermana menor de Alice, Carmen, quien va también en la nave, se monta en una
pequeña sonda que se mueve en la misma dirección que la nave mayor. La velocidad de
Carmen respecto de Alice es V2 = 0,7. Para calcular la velocidad de Carmen respecto
de Bob, usamos la ec. (3.45):
V1 + V2 1,50
V3 = = = 0,961 54. (3.46)
1 + V1 V2 1,56
Carmen se mueve respecto de Bob a una velocidad menor que la de la luz.

45
Capítulo 3. Transformaciones de Lorentz

En el caso extremo, con V2 = 1, encontramos V3 = 1, sin importar el valor de V1 . Esto


significa que es imposible sobrepasar la velocidad de la luz componiendo velocidades.4
El factor de Lorentz para la transformación compuesta es
Γ3 = cosh φ3
= cosh (φ1 + φ2 )
= cosh φ1 cosh φ2 + sinh φ1 sinh φ2
= cosh φ1 cosh φ2 (1 + tanh φ1 tanh φ2 )
= Γ1 Γ2 (1 + V1 V2 ) .

Velocidad de una partícula en dos marcos distintos. Vamos a reinterpretar las


ecuaciones que hemos obtenido en esta sección identificando K 00 con el marco comóvil
instantáneo de una partícula cuyo movimiento es descrito tanto por K como por K 0 .
Este reinterpretación motiva el siguiente cambio de notación:
V1 = V, V2 = v 0 , V3 = v, (3.47)
0
Γ1 = Γ , Γ2 = γ , Γ3 = γ. (3.48)
Aquí, usamos una v minúscula para la velocidad de la partícula (v en K y v 0 en K 0 ) y
una V mayúscula para la velocidad entre los marcos, y similarmente para los factores
de Lorentz asociados. Con esta nueva notación, podemos escribir
v0 + V
v= , (3.49)
1 + V v0
γ = Γ γ0 1 + V v 0 . (3.50)


Reconocemos este par de ecuaciones como la transformación de velocidades inversa,


i.e., la que nos da la velocidad (y el factor de Lorentz) en K a partir de las cantidades
relevantes en K 0 . Para obtener la transformación directa, simplemente reemplazamos
V por −V e intercambiamos cantidades primadas con cantidades no primadas:
v−V
v0 = , (3.51)
1−Vv
γ0 = Γ γ (1 − V v) . (3.52)
Note que estas ecuaciones son válidas para una partícula que se mueve en la dirección
x y para un boost en la misma dirección. Si el movimiento de la partícula abarca dos o
tres dimensiones, manteniendo el boost en dirección x, entonces las ecuaciones siguen
siendo válidas, con las siguientes modificaciones:
vx − V
vx0 = , (3.53)
1 − V vx
γ0 = Γ γ (1 − V vx ) . (3.54)
4
La ec. (3.45) sigue siendo válida incluso si una de las velocidades es igual a la de la luz, en contraste
con las ecuaciones del boost, que se vuelven singulares cuando V = 1.

46
Problemas

La ley de transformación para las componentes y y z de la velocidad de la partícula


es distinta de aquella para la componente x, y será estudiada en el capítulo 5, donde
también deducimos formalmente las ecs. (3.53)–(3.54).
Cuando todas las velocidades involucradas son mucho menores que la de la luz,
entonces la suma de velocidades relativista (3.53) y las relaciones correspondientes
para las componentes y y z se reducen a la suma de velocidades galileana, ~ v0 = ~
v − V~
[cf. ec. (1.3)].

Problemas
1. Usando vcrit = 1/7 como un límite máximo aproximado para la validez de la
mecánica newtoniana, determine si esta es adecuada para analizar el movimiento
en cada uno de los siguientes casos:

a) La Tierra orbitando el Sol a una velocidad de 30 km/s.


b) Un electrón rondando un protón en la órbita de radio más pequeño en un
átomo de hidrógeno. Nota: La velocidad clásica del electrón en un átomo
con Z protones en el núcleo está dada por v = Z/137 (para velocidades
bajas). Para el hidrógeno, Z = 1.
c) Un electrón en la órbita más interna de un átomo de oro, para el cual Z = 79.
d) Un electrón luego de haber sido acelerado desde el reposo a través de una
diferencia de potencial de 5000 voltios. Nota: Decimos que este electrón
tiene una energía cinética K = 5000 eV. Use la expresión newtoniana para
K.
e) Un electrón luego de haber sido acelerado desde el reposo a través de una
diferencia de potencial de 25 000 V.
f ) Un protón moviéndose con una energía cinética de 10 MeV en un núcleo
atómico.

2. En este problema se pide explorar la relación entre la velocidad, v, y el factor de


Lorentz, γ.

a) Demuestre que la parametrización


α2 − 1 α2 + 1
v= 2 , γ= , (3.55)
α +1 2α
con α > 0, preserva la relación entre v y γ. Tabule los valores de v y γ para
α = 1, 2, 5, 10, 20, 50, 100.
b) Muestre que si α 7→ 1/α, entonces v 7→ −v y γ 7→ γ.
c) Deduzca las siguientes aproximaciones, válidas cuando α  1:
2 α
v ≈1− , γ≈ . (3.56)
α2 2

47
Capítulo 3. Transformaciones de Lorentz

600

500

400

300
N

200

100

0
0 1 2 3 4 5 6 7
t/µs

Figura 3.5: Decaimiento del muon. El número de muones en un instante t está dado
por N (t) = N0 e−t/τ , donde N0 = 563 es el número de muones en t = 0 y τ = 2,2 µs es
la vida media de un muon en reposo.

d) Muestre que cuando v = 0,99 . . . 995 (2n nueves), γ ≈ 10n . Verifique numé-
ricamente para n = 1, . . . , 7.

3. Cuando los rayos cósmicos que impactan la Tierra interactúan con las partículas
de las capas más altas de la atmósfera, se producen muones, un tipo de partícula
elemental inestable. Los muones decaen espontáneamente en otras partículas,
de manera que si comenzamos con N0 muones en t = 0, el número de muones
en un instante t posterior está dado por la ley estadística
N (t) = N0 e−t/τ , (3.57)
donde el parámetro τ es conocido como vida media (ver figura 3.5). La vida me-
dia de un muon en reposo es τ = 2,2 µs. En un experimento [18], se detectaron
563 muones por hora en la cima de una montaña a 1907 m de altura. Cuando
se repitió la medición a nivel del mar, se detectaron solo 408 muones por ho-
ra. La diferencia se explica por los muones que se desintegran espontáneamente
mientras bajan la montaña.
a) Haga un tratamiento relativista, en el marco de la Tierra, de los resultados
del experimento. ¿A qué velocidad viajan los muones? Calcule el factor de
Lorentz asociado.
b) Use la velocidad que encontró en el inciso anterior para calcular el número
de muones que cabría esperar a nivel del mar, si no se tienen en cuenta los
efectos relativistas.

48
Problemas

c) Interprete ahora los resultados del experimento, siempre de manera relati-


vista, en el marco donde los muones están en reposo.

4. Ayude a Alice a planificar un viaje. La distancia al destino, medida en el marco de


Bob (en reposo en la Tierra), es ∆x. Alice desea invertir un tiempo ∆τ (medido
en el marco de la nave, y, por lo tanto, tiempo propio) en el viaje (one way).

a) Determine la velocidad v que debe tener la nave (respecto de Bob) para


cumplir con los requerimiento de Alice. Exprese su resultado en términos
de u = ∆x/∆τ.
b) Demuestre que, sin importar cuán exigente sea Alice (i.e., para cualquier
valor de u), el problema siempre tiene solución v < 1.
c) Grafique v como función de u. Incluya en su gráfico la predicción no relati-
vista para v.
d) ¿Cuánto tiempo dura el viaje de acuerdo a Bob?
e) Escoja su destino favorito y el tiempo que desea demorarse en el viaje, y
determine la velocidad que debe tener su nave. Bon voyage!

5. Una bomba gigante explota en el espacio vacío. ¿Cómo se mueve uno de los frag-
mentos respecto de otro? ¿Y cómo puede ser detectado este movimiento relativo?

a) Imagine que cada fragmento está equipado con un faro que emite pulsos de
luz a intervalos de tiempo propio ∆τ regulares y conocidos. Bob, montado
sobre uno de los fragmentos, mide el intervalo de tiempo ∆t rec transcurrido
entre la recepción de dos pulsos consecutivos provenientes del fragmento
donde va montada Alice. ¿Cómo puede Bob determinar la velocidad v del
fragmento de Alice a partir de ∆τ y ∆t rec ? ¿Cómo depende esta velocidad
v de la distancia a la que se encuentra Alice? Ayuda: Note que ∆t rec no es
igual a ∆t, el tiempo que mide Bob entre la emisión de dos pulsos de luz
provenientes del fragmento de Alice (ver figura 3.6).
b) Si el universo comenzó en una explosión gigante, ¿qué relación deberíamos
observar entre la distancia a una estrella y la velocidad con que se aleja de
la Tierra?
c) Un cuásar es un núcleo galáctico activo extremadamente luminoso. Al 2017,
el cuásar más lejano observado tiene un “redshift” ∆t rec /∆τ = 7,54. ¿A qué
velocidad se aleja de nosotros este cuásar?

6. Un cubo en reposo en el marco del cohete tiene una arista de 1 metro de longitud
en ese marco. En el marco del laboratorio, el cubo experimenta una contracción
en la dirección del movimiento, como se muestra en la figura 3.7. Ubíquese en
el marco del laboratorio y observe pasar el cubo con un solo ojo. Lo que uno ve
en un instante dado es luz que entra al ojo en ese instante, incluso si ha salido

49
Capítulo 3. Transformaciones de Lorentz

luz
v∆t

v∆t
E
∆t rec

∆t

A
B

Figura 3.6: Ayúdese de esta figura para calcular ∆t rec , como se explica en el problema 5.

E F E G H

1 v 1

G 1/γ H x 1/γ

E
H
θ
G θ
O x 1/γ

Figura 3.7: ¿Contracción o rotación? Ver problema 6. Todas las distancias están en
metros. Asuma que las distancias GO y HO son mucho mayores que 1 metro.

50
Problemas

de esquinas distintas del cubo en instantes distintos. Luego, lo que uno percibe
visualmente puede no coincidir con lo que uno calcula que está ocurriendo en
un instante dado. Si el cubo es observado desde abajo, entonces la distancia GO
es igual a la distancia HO, de modo que luz que sale al mismo tiempo de G y H
llegará simultáneamente a O. Por lo tanto, cuando uno ve el cubo directamente
encima uno verá la contracción de la arista inferior.

a) Luz de E que llega a O simultáneamente con luz de G tendrá que haber sa-
lido de E antes que de G. ¿Cuánto antes? ¿Cuánto se ha desplazado el cubo
durante este tiempo? ¿Cuál es el valor de la distancia x en la figura 3.7?
b) Suponga que el ojo interpreta la proyección en las figuras como una rota-
ción de un cubo no contraído. Encuentre una expresión para el ángulo de
rotación aparente θ . Interprete esta expresión para los casos límite v → 0 y
v → 1.

7. Julio César fue asesinado el 15 de marzo del año 44 a. C. ¿Existe alguna manera
de usar las leyes de la Relatividad para salvar su vida? Defina la muerte de César
como el evento de referencia, C, de coordenadas x C = 0, t C = 0 en el marco
de la Tierra. El evento A es usted leyendo este problema. Simultáneamente con
el evento A en el marco de la Tierra, la Enterprise, viajando por la galaxia de
Andrómeda, lanza un petardo: evento B. Andrómeda está a una distancia de
2,5 millones de años de nosotros. La muerte de César también es el evento de
referencia en el marco de la Enterprise (i.e., x C0 = 0, t C0 = 0).

a) ¿A qué velocidad está viajando la Enterprise respecto de la Tierra si la muerte


de César esté ocurriendo ahora (i.e., los eventos B y C son simultáneos) en
el marco de la nave?
b) Confeccione un diagrama de espacio-tiempo que incluya los eventos A, B
y C, junto con dos líneas que indiquen el “ahora” en el marco de la Tierra y
en el marco de la Enterprise. No es necesario que el diagrama esté a escala.
c) Tabule las coordenadas de los eventos A, B y C en el marco de la Tierra y
en el marco de la Enterprise.
d) ¿Es posible que la explosión del petardo advierta a César a tiempo del inten-
to de asesinato, cambiando así el curso de la historia en la Tierra? Justifique
su respuesta.

Ayuda: La distancia entre Roma y Bogotá, o entre la Tierra y el Sol, es insignifi-


cante en comparación con la distancia entre la Tierra y Andrómeda.

8. Bob, en reposo en el marco del laboratorio, estudia un reloj de luz cuyos espejos
se encuentran a 2 metros de distancia entre sí. El tic-tac del reloj le parece a Bob
perfectamente regular. Alice, que pasa junto a Bob en un cohete cuya velocidad
es paralela al movimiento de los rayos de luz del reloj, no está de acuerdo. La
situación se ilustra en la figura 3.8.

51
Capítulo 3. Transformaciones de Lorentz

Figura 3.8: Trayectoria de un rayo de luz rebotando entre dos espejos, según Bob (iz-
quierda) y según Alice (derecha). Ver problema 8.

a) Use las ecuaciones de la transformación de Lorentz para justificar la afirma-


ción de Alice, i.e., para mostrar que el tic-tac del reloj no es regular cuando
se observa desde un marco en movimiento.
b) ¿Cómo podría usar Alice los tic-tacs irregulares del reloj para definir un reloj
que marche regularmente?
c) Explique por qué el problema desaparece si el cohete se mueve en una di-
rección perpendicular al movimiento de los rayos de luz del reloj.

9. El diagrama de espacio-tiempo en el marco del laboratorio que se muestra en la


figura 3.9 contiene dos líneas de mundo. Una, la línea vertical rotulada con B, es
la línea de mundo de un objeto que está en reposo en este marco. La otra línea,
que conecta los eventos 0, 1, 2, y 3 con segmentos rectos, es la línea de mundo
de un objeto que se mueve con diferentes velocidades en distintos instantes en
este marco. En cada segmento se ha anotado el intervalo de tiempo propio co-
rrespondiente y se han dibujado hipérbolas invariantes que pasan por los eventos
1, 2, y 3. La tabla 3.1 muestra las coordenadas espaciales y temporales de todos
los eventos en este marco.

a) Tabule las coordenadas espaciales y temporales de cada uno de los eventos


en el marco del cohete, donde la partícula en la línea de mundo quebrada
tiene velocidad cero entre los eventos 1 y 2.
b) ¿Cuál es la velocidad, en el marco del cohete, de la partícula que se mueve
a lo largo de la línea de mundo B?
c) Confeccione un diagrama de espacio-tiempo que muestre el mismo par de
líneas de mundo observadas desde el marco del cohete.

52
Problemas

tiempo 3

2,3318

2,7272

B
2,6458

espacio
0

Figura 3.9: Dos líneas de mundo observadas desde el marco del laboratorio. Ver pro-
blema 9.

Evento x t x0 t0
0 0,00 0,00
1 3,00 4,00
2 1,75 7,00
3 5,00 11,00

Tabla 3.1: Coordenadas espacio-temporales de los eventos en el marco del laboratorio.


Ver problema 9.

53
Capítulo 3. Transformaciones de Lorentz

Figura 3.10: Paradoja de la barra y el granero [2]. Ver problema 10.

10. Un estudiante preocupado escribe: “La Relatividad debe estar equivocada. Con-
sidere una barra de 20 metros de largo que es llevada tan rápido en la dirección
de su longitud que parece ser de solo 10 metros de largo en el marco de referen-
cia del laboratorio. Supongamos que el corredor que la lleva entra a un granero
de 10 metros de largo, como se muestra en la figura 3.10. En cierto instante, el
granjero puede cerrar la puerta frontal y la barra estará completamente conte-
nida en el granero. Sin embargo, contemple la misma situación desde el marco
de referencia del corredor. Para él, el granero parece estar contraído a la mitad
de su longitud. ¿Cómo puede una barra de 20 metros caber en un granero de
5 metros? ¿No muestra esta conclusión increíble que la Relatividad contiene en
algún lado una inconsistencia lógica fundamental?” Escriba una respuesta para
el estudiante preocupado explicando clara y cuidadosamente cómo se tratan la
barra y el granero en relatividad, sin contradicción interna.
Ayuda: Haga dos diagramas de espacio-tiempo, uno en el marco del granero y
otro en el marco del corredor, donde se muestren las líneas de mundo de las
puertas del granero (A y B en la figura 3.10) y los extremos de la barra (P y Q en
la figura 3.10).

11. Si dos eventos tienen una separación tipo espacio, muestre que:

a) Existe un marco de referencia en el que son simultáneos.


b) En ningún marco de referencia ocurren en el mismo lugar.

Si dos eventos tienen una separación tipo tiempo, muestre que:

c) Existe un marco de referencia en el que ocurren en el mismo lugar.

54
Problemas

d) En ningún marco de referencia son simultáneos.

12. En un instante dado existe un único plano donde coinciden los relojes del labo-
ratorio y del cohete.

a) A través de un argumento de simetría, muestre que este plano yace per-


pendicular a la dirección de movimiento relativo. Usando las ecuaciones de
la transformación de Lorentz, muestre que la velocidad de este plano en el
marco del laboratorio es igual a
1€ p Š
vt=t 0 = 1− 1−V , 2 (3.58)
V
donde V es la velocidad del cohete respecto del laboratorio.
b) ¿Le parece extraña la expresión para vt=t 0 ? De nuestra experiencia cotidiana
podríamos esperar, por simetría, que el “plano de los tiempos iguales” se
moviese en el marco del laboratorio con la mitad de la velocidad del cohete.
Verifique que esto es de hecho correcto para velocidades bajas, i.e., muestre
que si V  1, entonces vt=t 0 ≈ V /2.
c) ¿Cuánto vale vt=t 0 en el límite ultrarrelativista, V → 1? Muestre que en este
caso vt=t 0 es completamente distinta de V /2.
d) Suponga que queremos pasar del marco del laboratorio al marco del cohete
en dos saltos con velocidades iguales. Intente un primer salto al plano de
los tiempos iguales. Ahora la simetría sí funciona: Vistos desde este plano,
los marcos del laboratorio y del cohete se mueven con velocidades iguales
y opuestas, cuya magnitud está dada por (3.58). Un segundo salto debería
llevarnos ahora al marco del cohete. Verifique esto usando la ley de suma
relativista de velocidades, i.e., muestre que
2vt=t 0
V= 2
. (3.59)
1 + vt=t 0

13. Un carrito rueda sobre una mesa larga con velocidad v. Un carrito más pequeño
rueda sobre el primero en la misma dirección con velocidad v relativa al pri-
mer carrito. Un tercer carrito rueda sobre el segundo en la misma dirección con
velocidad relativa v, y así hasta n carritos.

a) ¿Cuál es la velocidad vn del n-ésimo carrito en el marco de referencia de la


mesa? Escriba su respuesta como una función de v.
b) ¿A cuánto tiende esta velocidad cuando n → ∞?

Ayuda: Use la relación


eφ − e−φ
v = tanh φ = . (3.60)
eφ + e−φ
En términos de φ, la ley de composición de dos boosts en la misma dirección es
φ3 = φ 1 + φ 2 .

55
Capítulo 3. Transformaciones de Lorentz

14. Alice y Bob están equipados con pistolas taquiónicas, que disparan partículas con
una velocidad propia (i.e., relativa a la pistola) u > 1.
a) Mientras están en reposo relativo, Bob dispara un taquión en dirección a
Alice, quien se encuentra a una distancia L de él. Apenas el taquión alcanza
a Alice, ella devuelve el disparo. ¿Cuánto tiempo transcurre desde que Bob
dispara hasta que recibe el taquión de Alice?
b) Suponga ahora que Alice se aleja de Bob con velocidad v < 1. En el instante
en que la distancia entre ambos es L, Bob dispara un taquión en dirección
a Alice. Nuevamente, Alice devuelve el disparo apenas recibe el taquión de
Bob. ¿Cuánto tiempo transcurre ahora entre el disparo de Bob y la llegada
del taquión de Alice?
c) Muestre que si u > 1/v, entonces el taquión de Alice retrocede en el tiempo
en su viaje hacia Bob.
d) Muestre que existe una velocidad crítica ucrit tal que, si u > ucrit , entonces
Bob recibe el taquión de Alice antes de haber disparado el propio.
e) Determine el tiempo total de vuelo (negativo!) del taquión en el límite cuan-
do u → ∞.
f ) Confeccione un diagrama de espacio-tiempo donde se muestre a Alice ale-
jándose de Bob y varios taquiones disparados entre ellos con distintas velo-
cidades.

3.4. Boost en una dirección arbitraria


El boost en dirección x que dedujimos en la sección 3.2 afecta solo las coordena-
das (t, x), dejando ( y, z) inalteradas. Escribiéndolo explícitamente como una transfor-
mación de coordenadas en las cuatro dimensiones del espacio-tiempo de Minkowksi,
encontramos  0  
t cosh φ − sinh φ 0 0 t
 
 x 0   − sinh φ cosh φ 0 0   x 
 y0  =  . (3.61)
0 0 1 0  y 
z0 0 0 0 1 z
La matriz que media esta transformación, llamémosla B x (φ) para resaltar que co-
rresponde a un boost en dirección x con parámetro φ, puede escribirse en la forma
B x (φ) = exp (φK x ), donde el generador de boosts en dirección x está dado por5
0 −1 0 0
 
 −1 0 0 0 
Kx =  . (3.62)
0 0 0 0 
0 0 0 0
5
La demostración de esta afirmación, que es esencialmente idéntica a la que dimos en la sección 3.2,
se deja como ejercicio al lector.

56
3.4. Boost en una dirección arbitraria

La receta para construir la matriz de un boost en dirección y o z debería ahora ser


clara: definiendo los generadores de boosts en direcciones y y z como

0 0 −1 0 0 0 0 −1
   
 0 0 0 0   0 0 0 0 
Ky =  , Kz =  , (3.63)
−1 0 0 0  0 0 0 0 
0 0 0 0 −1 0 0 0

las matrices de transformación son, respectivamente,

cosh φ 0 − sinh φ 0
 
0 1 0 0 
B y (φ) = exp φK y =  , (3.64)
 
− sinh φ 0 cosh φ 0 
0 0 0 1
cosh φ 0 0 − sinh φ
 
0 1 0 0
Bz (φ) = exp (φKz ) =  . (3.65)
 
0 0 1 0
− sinh φ 0 0 cosh φ

Para determinar la matriz de transformación correspondiente a un boost en una


dirección arbitraria, construimos a partir de K x , K y y Kz una matriz Kn que actúe como
generador de boosts en dirección n̂, donde n̂ es un vector unitario:

Kn = n x K x + n y K y + nz Kz = n̂ · K
~, (3.66)

con n2x + n2y + n2z = 1. La notación K ~ = K x , K y , Kz hace referencia a un vector de




matrices, de manera que la matriz Kn = n̂ · K ~ resulta ser igual a

0 −n x −n y −nz
 
−n x 0 0 0 
n̂ · K
~ = . (3.67)
 −n
y 0 0 0 
−nz 0 0 0

Para comprobar que esta matriz genera boosts infinitesimales que dejan invariante
el intervalo espacio-temporal a primer orden en φ, escribimos la transformación de
manera explícita,

t 0 = t − φ n̂ · ~r , (3.68)
0
~r = ~r − φ t n̂, (3.69)

y reemplazamos en s2 = −t 2 + |~r |2 :
2
−t 02 + ~r 0 = − (t − φ n̂ · ~r )2 + |~r − φ t n̂|2
= −t 2 + 2φ t n̂ · ~r + |~r |2 − 2φ t n̂ · ~r + O φ 2


= −t 2 + |~r |2 + O φ 2 .


57
Capítulo 3. Transformaciones de Lorentz

Por lo tanto, la matriz que media un boost en dirección n̂ con parámetro φ debe
poder obtenerse exponenciando la transformación infinitesimal, Bn (φ) = exp (φKn ) =
exp φ n̂ · K .
~


Para determinar explícitamente  la forma de la matriz Bn (φ) debemos calcular la


exponencial matricial exp φ n̂ · K
~ [cf. ec. (3.9)]:

φp p φ2
~ 2 + ··· .
X
exp φ n̂ · K
~ = n̂ · K
~ = 1 + φ n̂ · K
~+ n̂ · K (3.70)
 

p=0
p! 2!

Vamos a necesitar las potencias de n̂ · K


~ . Con p = 2, hallamos

1 0 0 0
 
0 n2x n x n y n x nz 
~ 2=
n̂ · K . (3.71)

 0 n n
y x n2y n y nz 
0 nz n x nz n y n2z

Para p = 3, encontramos n̂ · K ~ 3 = n̂ · K
~ . Las potencias superiores pueden resumirse


en la forma
~ 2p+1 = n̂ · K
n̂ · K ~, ~ 2p+2 = n̂ · K
n̂ · K ~ 2, (3.72)
  

con p = 0, 1, 2, . . ..
Para calcular la exponencial matricial, separamos la identidad, las potencias impa-
res y las potencias pares:
∞ ∞
φ 2p+1 2p+1 X φ 2p+2
~ 2p+2
X
exp φ n̂ · K = 1 +
~ n̂ · K
~ n̂ · K
 
+
n=0
(2p + 1)! p=0
(2p + 2)!
∞ ∞
φ 2p+1 φ 2p+2
~ 2.
X  X
n̂ · K +
~ n̂ · K

=1+
p=0
(2p + 1)! p=0
(2p + 2)!

Explícitamente,

φ3 φ5 φ2 φ4 φ6
   
2
exp φ n̂ · K
~ =1+ φ+ n̂ · K
~ + n̂ · K
~ .
 
+ + ··· + + + ···
3! 5! 2! 4! 6!
(3.73)
Reconociendo en estas expresiones las series de Taylor para sinh φ y cosh φ − 1, pode-
mos escribir

Bn (φ) = exp φ n̂ · K
~ = 1 + sinh φ n̂ · K ~ 2.
~ + (cosh φ − 1) n̂ · K (3.74)
  

Esta es la forma general para la matriz de un boost en dirección n̂ con parámetro φ.


Algebraicamente, Bn (φ) es una combinación lineal de las matrices 1, n̂ · K ~ 2,
~ y n̂ · K


donde los coeficientes son funciones del parámetro φ. Como estas tres matrices son
simétricas, Bn (φ) también lo es.

58
3.5. El grupo de Lorentz

Cuando n̂ = (1, 0, 0), recuperamos el boost en dirección x:

B x (φ) = 1 + K x sinh φ + (cosh φ − 1) K x2 = 1 cosh φ + K x sinh φ, (3.75)

porque K x2 = 1. Usando V = tanh φ y Γ = cosh φ, podemos escribir esta matriz en la


forma
Γ −Γ V 0 0
 
−Γ V Γ 0 0 
B x (V ) =  . (3.76)

0 0 1 0 
0 0 0 1
Reparametrizando del mismo modo la ec. (3.74), hallamos

Bn (V ) = 1 + Γ V n̂ · K ~ 2.
~ + (Γ − 1) n̂ · K (3.77)
 

Explícitamente,

Γ −Γ Vx −Γ Vy −Γ Vz
 
2
 −Γ Vx 1 + (Γ − 1) n x (Γ − 1) n x n y (Γ − 1) n x nz 
Bn (V ) =  2 , (3.78)
−Γ Vy (Γ − 1) n y n x 1 + (Γ − 1) n y (Γ − 1) n y nz 
−Γ Vz (Γ − 1) nz n x (Γ − 1) nz n y 1 + (Γ − 1) n2z

donde hemos identificado Vx = V n x , y similarmente para y y z.

3.5. El grupo de Lorentz


En la sección 3.3 determinamos que la composición de dos boosts en dirección x
con parámetros φ1 y φ2 es equivalente a un único boost, también en dirección x, con
parámetro φ1 +φ2 . En esta sección estudiamos el problema de la composición de boosts
en direcciones distintas.
Si hacemos un boost en dirección x con parámetro φ1 seguido por un boost en
dirección y con parámetro φ2 , obtenemos la siguiente matriz:

cosh φ1 cosh φ2 − sinh φ1 cosh φ2 − sinh φ2 0


 
− sinh φ1 cosh φ1 0 0 
B y (φ2 ) B x (φ1 ) =  . (3.79)

− cosh φ1 sinh φ2 sinh φ1 sinh φ2 cosh φ2 0 
0 0 0 1

Al no ser simétrica, esta matriz no puede interpretarse como un boost, i.e., no existe
ninguna combinación de dirección n̂ y parámetro φ que reduzca el boost general (3.74)
a esta forma. En pocas palabras: la composición de dos boosts en direcciones distintas no
es un boost.
Para entender qué está pasando, comencemos recordando que cada boost puede ser
escrito como una exponencial matricial, B x (φ1 ) = exp (φ1 K x ) y B y (φ2 ) = exp φ2 K y .


59
Capítulo 3. Transformaciones de Lorentz

En general, la multiplicación de exponenciales matriciales produce la serie infinita

1 2 1 2
 ‹ ‹
exp (A) exp (B) = 1 + A + A + · · · 1 + B + B + ···
2! 2!
1 2
= 1 + (A + B) + A + 2AB + B 2 + · · · ,

2
donde hemos conservado términos hasta de segundo orden. A pesar de las apariencias,
el término cuadrático del lado derecho no puede ser interpretado como (A + B)2 . En
efecto,
(A + B)2 = (A + B) (A + B) = A2 + AB + BA + B 2 , (3.80)
y esta expresión difiere de A2 + 2AB + B 2 si BA 6= AB. La siguiente definición resulta útil
en este contexto (y en otros).

Definición 3.5 (Conmutador de dos matrices). Sean A y B dos matrices cuadradas. El


conmutador [A, B] es la matriz definida por

[A, B] = AB − BA. (3.81)

Decimos que A y B conmutan si [A, B] = 0.

Usando la definición 3.5, podemos escribir

1 1
exp (A) exp (B) = 1 + (A + B) + (A + B)2 + [A, B] + · · · . (3.82)
2 2
La expresión completa está dada por la fórmula de Baker–Campbell–Hausdorff :

exp (A) exp (B) = exp (C) , (3.83)

donde
1 1
C = A+ B + [A, B] + ([A, [A, B]] + [B, [B, A]]) + · · · . (3.84)
2 12
Más allá de la forma detallada de los términos de orden superior omitidos, lo crucial
de esta expresión es que C puede determinarse completamente en términos de A, B y
conmutadores anidados entre ellos.
Esto significa que para interpretar el producto B y B x necesitamos calcular el con-
mutador entre K x y K y . Encontramos

K x , K y = Jz , (3.85)
 

donde [cf. ec. (3.8)]


0 0 0 0
 
 0 0 1 0 
Jz =  . (3.86)
0 −1 0 0 
0 0 0 0

60
3.5. El grupo de Lorentz

es el generador de rotaciones en el plano x y (en lenguaje tridimensional, en torno al


eje z), escrito esta vez como una matriz de 4 × 4. Similarmente, los generadores de
rotaciones en los planos yz (eje x) y z x (eje y) son
0 0 0 0 0 0 0 0
   
 0 0 0 0   0 0 0 −1 
Jx =  , Jy =  . (3.87)
0 0 0 1  0 0 0 0 
0 0 −1 0 0 1 0 0
Luego, el producto B y B x no es un boost puro, sino una combinación de un boost y
una rotación espacial. El conmutador (3.85) muestra que los boosts por sí mismos no
forman un conjunto cerrado; es necesario incluir las rotaciones espaciales para obtener
un grupo de transformaciones.
El grupo generado por los tres generadores de rotaciones espaciales, J~ = J x , J y , Jz ,


más los tres generadores de boosts, K ~ = K x , K y , Kz , es llamado grupo de Lorentz res-




tringido y denotado por SO+ (3, 1). Un elemento arbitrario del grupo de Lorentz res-
tringido, Λ ∈ SO+ (3, 1), puede ser escrito en la forma
Λ = exp θ ê · J~ + φ n̂ · K
~ , (3.88)


que es una combinación de una rotación por un ángulo θ alrededor del eje ê y un boost
con parámetro φ en la dirección n̂. En principio, la combinación de dos boosts arbi-
trarios puede ser determinada a través de la fórmula de Baker–Campbell–Hausdorff,
aunque el cálculo puede ser difícil en la práctica [19]. Todo lo que necesitamos conocer
para la aplicación de la fórmula es el álgebra de Lie del grupo de Lorentz restringido,
consistente en todos los conmutadores entre los seis generadores. Calculando uno por
uno, hallamos (solo se listan las combinaciones no nulas)
J x , J y = −Jz , J y , Jz = −J x , [Jz , J x ] = −J y , (3.89)
   

J x , K y = −Kz , J y , Kz = −K x , [Jz , K x ] = −K y , (3.90)


   

K x , J y = −Kz , K y , Jz = −K x , [Kz , J x ] = −K y , (3.91)


   

K x , K y = Jz , K y , Kz = J x , [Kz , K x ] = J y . (3.92)
   

Las ecuaciones (3.89) muestran que las rotaciones espaciales forman un grupo por sí
mismas, denotado por SO(3). La misma afirmación no es cierta para los boosts; como se
desprende de las ecuaciones (3.92), el conmutador entre dos boosts produce siempre
una rotación espacial.
Es posible demostrar que toda transformación Λ ∈ SO+ (3, 1) puede ser escrita co-
mo el producto de un boost B y una rotación espacial R, conocida como rotación de
Wigner: Λ = BR. Hallar esta factorización es un problema algebraico no trivial, que
no abordaremos aquí. En particular, esto significa que la componente t t de Λ (en la
esquina superior izquierda de la matriz), que denotamos por Γ , cumple siempre con
Γ ≥ +1, i.e., puede ser siempre interpretada como el factor de Lorentz de un boost.
La nomenclatura SO+ (3, 1) se explica entonces por cuatro características de la
transformación:

61
Capítulo 3. Transformaciones de Lorentz

1. La “S” es de special, que se refiere a la propiedad det (Λ) = +1. Esta puedees-
tablecerse directamente a partir de la identidad (3.10), notando que Tr J~ =
Tr K~ = 0.


2. Λ es una matriz “cuasi-ortogonal”, en el sentido que deja invariante una forma


cuadrática (que incluye un signo menos, por lo que la transpuesta no coincide
exactamente con la inversa). La “O” viene de orthogonal.

3. El exponente “+” viene del hecho que Γ ≥ +1.

4. Los números (3, 1) se refieren a los tres signos positivos y al único signo negativo
en la forma cuadrática ds2 = −d t 2 + d x 2 + d y 2 + dz 2 .

¿Hemos conseguido aquí el objetivo que nos planteamos al comienzo de este capí-
tulo? ¿Son estas todas las transformaciones lineales que dejan invariante el intervalo
espacio-temporal? La respuesta, como veremos enseguida, es “casi”.

Inversión temporal. La transformación dada por la matriz

−1 0 0 0
 
 0 1 0 0 
T = , (3.93)
0 0 1 0 
0 0 0 1

que representa una inversión en el flujo del tiempo, también preserva el intervalo
espacio-temporal (ya que d t 0 = −d t, y d t 02 = d t 2 ), pero no puede escribirse en la
forma (3.88). En efecto, tenemos det (T ) = −1 y Γ = −1 (donde Γ denota la compo-
nente t t de la matriz T ).

Paridad (reflexión espacial). La transformación dada por la matriz

1 0 0 0
 
 0 −1 0 0 
P = , (3.94)
0 0 −1 0 
0 0 0 −1

que representa una reflexión simultánea en las tres direcciones espaciales, también
preserva el intervalo espacio-temporal ds2 , pero, al igual que la inversión temporal T ,
tampoco puede escribirse en la forma (3.88). (Note que P = −T ).

∗ ∗ ∗

Las transformaciones T y P son ejemplos de transformaciones de Lorentz impropias,


llamadas así porque det (T ) = det (P) = −1.

62
3.5. El grupo de Lorentz

det (Λ) = +1 det (Λ) = −1


Γ ≥ +1 PO IO
Γ ≤ −1 PA IA

Tabla 3.2: Clasificación de las transformaciones de Lorentz Λ. Decimos que la trans-


formación es “propia” (P) si det (Λ) = +1 e “impropia” (I) si det (Λ) = −1. Denotando
por Γ el elemento t t de la matriz Λ, llamamos “ortocrona” (O) a una transformación
con Γ ≥ +1 y “anticrona” (A) a una transformación con Γ ≤ −1.

En general, las transformaciones de Lorentz pueden clasificarse en cuatro catego-


rías, dependiendo del signo del determinante (“propia” si es positivo e “impropia” si
es negativo) y de si el elemento t t de la matriz de transformación, denotado por Γ ,
cumple con Γ ≥ 1 (“ortocrona”) o con Γ ≤ −1 (“anticrona”). La tabla 3.2 muestra las
cuatro posibilidades.
Las matrices que pueden escribirse en la forma exponencial dada en la ec. (3.88)
pertenecen todas al sector PO en la tabla 3.2: transformaciones propias y ortocronas.
Este sector es el único que es un grupo por sí mismo, el grupo de Lorentz restringido, o
SO+ (3, 1). Si Λ ∈ SO+ (3, 1), entonces las transformaciones de los sectores IA, IO, y PA
pueden escribirse siempre en la forma T Λ, PΛ, y P T Λ, respectivamente.
Distinguimos los siguientes grupos:

SO+ (3, 1) = PO, (3.95)


SO (3, 1) = PO ∪ PA, (3.96)
O (3, 1) = PO ∪ IO,
+
(3.97)
O (3, 1) = PO ∪ PA ∪ IO ∪ IA, (3.98)

a los que llamamos grupo de Lorentz restringido, grupo de Lorentz propio, grupo de Lo-
rentz ortocrono, y grupo de Lorentz (a secas), respectivamente. Note que esta nomen-
clatura está lejos de ser universal, por lo que siempre conviene aclarar qué se entiende
cuando se habla del “grupo de Lorentz”. El grupo de Lorentz O (3, 1) consiste entonces
de cuatro “islas” desconectadas entre sí, donde solo el grupo restringido SO+ (3, 1) co-
rresponde a un grupo de Lie. Las transformaciones impropias de paridad P e inversión
temporal T actúan como “botes” que nos permiten pasar de una isla a otra, como se
sugiere en la figura 3.11.
El grupo de Lorentz es el grupo de rotaciones en el espacio-tiempo de Minkowski, y
sus elementos, llamados transformaciones de Lorentz, son las transformaciones lineales
más generales que dejan invariante el intervalo espacio-temporal ds2 = −d t 2 + d x 2 +
d y 2 + dz 2 .

Traslaciones. La transformación

t 0 = t + a, x 0 = x + b, y 0 = y + c, z 0 = z + d, (3.99)

63
Capítulo 3. Transformaciones de Lorentz

T
PO IA

P P

IO PA
T

Figura 3.11: El grupo de Lorentz O (3, 1) está compuesto de cuatro “islas” desco-
nectadas entre sí. Las transformaciones propias y ortocronas (PO) forman el gru-
po de Lie SO+ (3, 1), cuyos elementos pueden escribirse en la forma [cf. ec. (3.88)]
Λ = exp θ ê · J + φ n̂ · K . Si Λ ∈ SO+ (3, 1), entonces las transformaciones impropias y
~ ~


anticronas (IA), impropias y ortocronas (IO) y propias y anticronas (PA) pueden escri-
birse en la forma T Λ, PΛ y P T Λ, respectivamente. En este sentido, P y T actúan como
“botes” que nos permiten pasar de una isla a otra. Note que P T = −1.

donde a, b, c, y d son constantes, también deja invariante el intervalo espacio-temporal


ds2 (trivialmente, ya que d t 0 = d t, d x 0 = d x, etc.). Las traslaciones no están incluidas
en el grupo de Lorentz, ya que no pueden ser escritas como una matriz de 4×4 actuando
sobre (t, x, y, z). (Es decir, no son transformaciones lineales, a pesar de las apariencias).
Es fácil ver que ellas forman un grupo abeliano  (i.e., conmutativo). El álgebra de Lie
del grupo de traslaciones es trivial: llamando Pt , Px , P y , Pz a los cuatro generadores,
hallamos [Pt , Px ] = Px , P y = · · · = 0.
 

El conjunto formado por las transformaciones del grupo de Lorentz más las trasla-
ciones espacio-temporales es llamado grupo de Poincaré.

64
Capítulo 4

Introducción al cálculo tensorial

El Principio de la Relatividad que introdujimos en el capítulo 2 nos obliga a buscar


leyes de la física que sean válidas para todos los observadores inerciales. Si K y K 0
son dos observadores inerciales, entonces las mediciones que ambos realizan están
relacionadas entre sí a través de las transformaciones de Lorentz que estudiamos en
el capítulo 3. En particular, si K 0 se mueve con velocidad constante V~ respecto de K,
entonces la transformación relevante es el boost Bn (φ) = exp φ n̂ · K
~ , donde V~ = V n̂,
con V = tanh φ [cf. ec. (3.74)].
Juntando ambas ideas, encontramos que las leyes de la física deben ser invariantes
bajo transformaciones de Lorentz. Más concretamente, todas las ecuaciones de la física
debe conservar su forma, i.e., ser covariantes bajo transformaciones de Lorentz.
En este capítulo desarrollamos los elementos esenciales de un lenguaje, el formalis-
mo tensorial, que nos permite asegurar de manera automática la covariancia de Lorentz
de nuestras ecuaciones. Comenzamos en la sección 4.1 con una introducción a la no-
tación tensorial, seguida por las definiciones de escalares, vectores y tensores para el
grupo de rotaciones en tres dimensiones O (3), en la sección 4.2. Los conceptos y téc-
nicas que desarrollamos son luego extendidos y refinados en las secciones 4.3, sobre
transformaciones generales de coordenadas, y 4.4, que trata sobre escalares, vectores
y tensores del grupo de Lorentz O (3, 1).
Los libros de Synge y Schild [20], Lovelock y Rund [21] y Kay [22] son buenas
referencias para profundizar en los temas de este capítulo.

4.1. La notación tensorial


En su nivel más elemental, el cálculo tensorial no es más que una notación compu-
tacional eficiente para tratar con “objetos con índices”: escalares (0 índices), vectores
(1 índice) y tensores (2 o más índices). Usamos letras del alfabeto latino (típicamente,
i, j, k, . . .) para denotar índices en el conjunto {1, 2, 3}. Así, x i representa una coorde-
nada génerica de entre (x, y, z), con x 1 = x, x 2 = y y x 3 = z.
Vectores y matrices son representados a través de sus componentes; por ejemplo,

65
Capítulo 4. Introducción al cálculo tensorial

escribimos Ai en lugar de A~ y Mi j en lugar de la matriz M . A menudo decimos “el


vector Ai ” o “la matriz Mi j ” en lugar de las expresiones más precisas “el vector cuyas
componentes son Ai , con i = 1, 2, 3” o “la matriz de componentes Mi j ”. Cuando sea im-
portante marcar la diferencia entre el objeto y sus componentes, sobre todo en el caso
de matrices, vamos a usar la notación Mi j para denotar la matriz cuyas componentes
son Mi j :
 
M 11 M12 M 13
Mi j =  M21 M22 M23  . (4.1)
 

M31 M32 M33

Convención de la suma de Einstein. Cuando repetimos índices en un mismo tér-


mino de una expresión, entendemos que hay una suma sobre ellos, sin que resulte
necesario escribir explícitamente el símbolo de sumatoria.
Por ejemplo, en la ecuación x i0 = R i j x j debe entenderse que hay una suma sobre el
índice j en el lado derecho, mientras que en Ci = Ai +Bi no hay ninguna suma indicada.
Esta convención de la suma es parte del Cálculo de Ricci, el conjunto de reglas para
la manipulación de tensores, y fue introducida a la física por Einstein en 1916 [23].
Actualmente es utilizada de manera universal en la física relativista.

Índices libres e índices mudos. Distinguimos entre índices libres e índices mudos o
de suma. Un índice libre puede tomar cualquier valor dentro de su rango permitido,
mientras que un índice mudo debe sumarse sobre todos los valores posibles. Por ejem-
plo, en la ecuación x i0 = R i j x j el índice i es libre y el índice j es mudo. Los índices
libres deben coincidir a ambos lados de una ecuación para que esta sea consistente.
Por ejemplo, para expresar la igualdad entre dos vectores A~ y B ~ escribimos Ai = Bi ,
entendiendo que esta ecuación es equivalente a las tres ecuaciones A1 = B1 , A2 = B2 y
A3 = B3 . Es incorrecto en este contexto escribir, e.g., Ai = B j . Note, sin embargo, que
las ecuaciones Ai = Bi y A j = B j expresan exactamente lo mismo. Esto quiere decir que
podemos cambiar el nombre de un índice libre a voluntad, siempre que este cambio
afecte todas las ocurrencias del índice en la ecuación. Similarmente, un índice mudo
puede cambiar de nombre sin afectar el significado de una expresión; por ejemplo,
R i j x j expresa exactamente lo mismo que R ik x k . (Como los índices son mudos, pode-
mos cambiarles de nombre y no gritan). La regla fundamental que debe respetarse al
hacer estas manipulaciones está contenida en el mantra 4.1.

Mantra 4.1. No repetirás índices más de dos veces en un mismo término.

Contracción de índices. La operación Ai B j 7→ Ai Bi , donde dos índices se hacen igua-


les y se procede por lo tanto a sumar sobre ellos, es llamada contracción. Como veremos
más adelante, la contracción de índices es una de las operaciones básicas del cálculo
tensorial.

66
4.1. La notación tensorial

Ejemplo 4.2 (Producto punto entre dos vectores). Sean A~ y B~ dos vectores. Usando la
notación tensorial, podemos escribir su producto punto en la forma

A~ · B
~ = Ai Bi . (4.2)

Ejemplo 4.3 (Operaciones matriciales). Sean P y Q dos matrices cuadradas. Las ope-
raciones de transpuesta, traza y producto matricial se escriben de la siguiente manera:

PiTj = P ji

Tr (P) = P j j

PQ = Pik Q k j
 

La última de estas ecuaciones contiene la regla computacional para calcular el producto


entre dos matrices, donde la componente i j del producto PQ corresponde al producto
punto de la i-ésima fila de P con la j-ésima columna de Q. Como regla mnemotécnica,
la interpretación del producto de dos tensores como producto matricial requiere que el
segundo índice de la primera matriz este contraído con el primer índice de la segunda
matriz, de manera que la expresión final contiene dos índices libres y un par de índices
mudos.

Ejemplo 4.4 (Propiedad cíclica de la traza). La traza del producto de tres matrices
satisface la siguiente propiedad cíclica:

Tr (ABC) = Tr (BCA) = Tr (CAB) . (4.3)

Resulta sencillo demostrar esta propiedad usando la notación tensorial. Escribimos

Tr (ABC) = Ai j B jk Cki (4.4)

y notamos que las componentes de las matrices, al ser números reales o complejos,
conmutan entre sí: esto quiere decir que podemos escribir

Ai j B jk Cki = Ai j Cki B jk = B jk Cki Ai j = B jk Ai j Cki = Cki Ai j B jk = Cki B jk Ai j . (4.5)

De estas seis expresiones equivalentes, solo tres, correspondientes a las permutaciones


cíclicas ABC, BCA y CAB, pueden interpretarse como traza de un producto matricial,
demostrando así la propiedad cíclica.

¿Dónde está la base? Algunos autores prefieren incluir en su tratamiento del cálculo
tensorial una base vectorial êi , en términos de la cual es posible escribir, e.g., A~ = Ai êi .
En mi experiencia, la introducción de esta base vectorial es superflua en este nivel.
Todos nuestros cálculos asumen una base ortonormal y pueden realizarse por lo tanto
exclusivamente en términos de las componentes de vectores y tensores.

67
Capítulo 4. Introducción al cálculo tensorial

4.2. Tensores en el espacio euclidiano tridimensional


Formalmente, la definición de un tensor hace referencia a sus propiedades de trans-
formación bajo un grupo dado. En el caso del grupo de rotaciones en tres dimensiones
O (3), estas transformaciones están dadas por matrices ortogonales R i j . En general, un
tensor es un campo que transforma de manera multilineal (i.e., lineal en cada uno de
sus índices) bajo el grupo.

Definición 4.5 (Campo escalar). Decimos que φ (x) es un campo escalar si se mantiene
inalterado bajo una rotación x i0 = R i j x j :

φ 0 x 0 = φ (x) . (4.6)


Usamos la notación abreviada φ (x) para denotar φ (x, y, z).

En el cálculo tensorial, la palabra “escalar” se usa en un sentido más restrictivo


que en el resto de la física, donde es básicamente un sinónimo de “número”. Decimos
que una cantidad es un escalar solo si se mantiene invariante bajo rotaciones. Como
muestra la siguiente definición, las componentes de un vector no son, en este sentido,
escalares.

Definición 4.6 (Campo vectorial). Decimos que Ai (x) es un campo vectorial si bajo
una rotación x i0 = R i j x j sus componentes cambian de acuerdo a la regla

A0i x 0 = R i j A j (x) . (4.7)




Ejemplo 4.7. Como veremos en el capítulo 7, el campo eléctrico E~ es, en efecto, un


campo vectorial de O (3).

Definición 4.8 (Campo tensorial de orden 2). Decimos que Ti j (x) es un campo tenso-
rial de orden 2 si bajo una rotación x i0 = R i j x j sus componentes cambian de acuerdo a
la regla
Ti0j x 0 = R ik R jl Tkl (x) . (4.8)


Ejemplo 4.9. Si Ai y Bi son dos vectores, entonces el producto Ai B j es un tensor de


orden 2. Explícitamente,
 
A1 B1 A1 B 2 A1 B 3
Ai B j =  A2 B1 A2 B2 A2 B3  . (4.9)
 

A3 B1 A3 B2 A3 B3

Definición 4.10 (Delta de Kronecker). El delta de Kronecker δi j está definido como


¨
1 si i = j,
δi j = (4.10)
0 si i 6= j.

68
4.2. Tensores en el espacio euclidiano tridimensional

El delta de Kronecker es un tensor inusual en el sentido que esta definición vale en


todos los marcos relacionados entre sí por rotaciones ortogonales, es decir, el delta
de Kronecker tiene el mismo valor en todos los marcos: δi0 j = δi j . En la sección 4.3
mostraremos cómo esta definición es consistente con los requisitos de transformación
para un tensor de orden 2.
Resulta tentador imaginar el delta de Kronecker como la matriz identidad,
 
1 0 0
δi j = 1 =  0 1 0  . (4.11)
 

0 0 1

No es, por supuesto, incorrecto caer en esta tentación, pero probablemente una imagen
mental más útil proviene de la comparación entre el delta de Kronecker y su pariente
“continuo”, la delta de Dirac δ (x). La propiedad fundamental de la delta de Dirac está
expresada en la ecuación
Z∞
δ (x − y) f ( y) d y = f (x) . (4.12)
−∞

Similarmente, el delta de Kronecker satisface

δi j f j = f i . (4.13)

Las variables x y y en la ec. (4.12) son análogas a índices continuos i y j, mientras


que la integración sobre y es análoga a la contracción sobre el índice j. Decimos que el
delta de Kronecker δi j actúa sobre el vector f j y le cambia el nombre a su índice, que
pasa de j a i.
Ejemplo 4.11. Explique por qué δii = 3.
Ejemplo 4.12 (Matriz inversa). Decimos que Mi−1
j
es la matriz inversa de Mi j si

Mik−1 Mk j = Mik Mk−1


j
= δi j . (4.14)

Aquí, por supuesto, Mi−1j


denota la componente i j de la matriz M −1 , no el inverso
multiplicativo de la componente i j de la matriz M .
Ejemplo 4.13 (Matriz ortogonal). Decimos que R i j es una matriz ortogonal si R−1
ij
=
T
R i j , i.e., si R ki R k j = R ik R jk = δi j .

Ejemplo 4.14 (Invariancia de A~ · B ~ ). Si Ai y Bi son dos vectores, entonces su producto


punto, Ai Bi , es un escalar, i.e., es invariante bajo rotaciones de O (3). En efecto,

A0i Bi0 = R i j A j (R ik Bk ) = R i j R ik A j Bk = δ jk A j Bk = Ai Bi . (4.15)




Note cómo se manejan los índices mudos para evitar repetir cualquiera de ellos más
de dos veces.

69
Capítulo 4. Introducción al cálculo tensorial

Ejemplo 4.15. La ley de transformación para untensor de orden 2 puede escribirse
en la forma matricial T 0 = RT R−1 , donde T = Ti j y R = R i j .


Ejemplo 4.16 (Proyectores). Sea ni un vector unitario. Los tensores


k
Pi j = ni n j , Pi⊥j = δi j − ni n j , (4.16)
actúan como proyectores en las direcciones paralela y perpendicular a ni . Esto quiere
k
decir que cualquier vector Ai puede descomponerse en la forma Ai = Ai + A⊥i , con
k k
Ai = Pi j A j , A⊥i = Pi⊥j A j . (4.17)
Estos vectores son, respectivamente, paralelo y perpendicular a ni .
Definición 4.17 (Campo tensorial de orden n). Decimos que Ti1 ···in (x) es un campo ten-
sorial de orden n si bajo una rotación x i0 = R i j x j sus componentes cambian de acuerdo
a la regla
Ti01 ···in x 0 = R i1 j1 · · · R in jn T j1 ··· jn (x) . (4.18)


La definición de tensor como un objeto que transforma multilinealmente bajo ro-


taciones nos permite asegurar que si todas las componentes de un tensor se anulan en
un marco dado, entonces el tensor es cero en todos los marcos: Ti1 ···in = 0 ⇒ Ti01 ···in = 0.
Equivalentemente, si dos tensores son iguales en un marco dado, entonces son iguales
en todos los marcos relacionados con el primero a través de rotaciones ortogonales.
Esto quiere decir que las ecuaciones tensoriales conservan su forma, i.e., son covarian-
tes bajo las transformaciones del grupo en cuestión. Una vez definamos tensores de
Lorentz en la sección 4.4, el formalismo nos permitirá escribir ecuaciones que son au-
tomáticamente covariantes de Lorentz. Este es el poder del cálculo tensorial, y la razón
por la que constituye el lenguaje matemático natural para la Relatividad.

Simetrías tensoriales. Resulta crucial reconocer la existencia de distintas clases de


simetrías tensoriales.
Definición 4.18 (Tensor simétrico de orden 2). Decimos que el tensor Si j es simétrico
si S ji = Si j .
Definición 4.19 (Tensor antisimétrico de orden 2). Decimos que el tensor Ai j es anti-
simétrico si A ji = −Ai j .
Un tensor Ti j no tiene por qué tener una simetría definida, i.e., no tiene por qué ser
simétrico o antisimétrico. En el caso más general posible, sus 3 × 3 = 9 componentes
son todas independientes entre sí. Un tensor simétrico Si j , en cambio, tiene solo 6
componentes independientes, mientras que uno antisimétrico Ai j tiene apenas 3, que
pueden representarse de la siguiente manera:
   
S11 S12 S 31 0 A12 −A 31
Si j =  S12 S22 S23  , Ai j =  −A12 0 A23  . (4.19)
   

S31 S23 S33 A31 −A23 0

70
4.2. Tensores en el espacio euclidiano tridimensional

Permutación Paridad
i jk par i
ik j impar
jki par +
jik impar k j
ki j par
k ji impar

Tabla 4.1: Permutaciones pares e impares de tres índices. Con tres índices, pero no
con cuatro o más, las permutaciones pares coinciden con las permutaciones cíclicas,
representadas en el dibujo de la derecha.

Como 6 + 3 = 9, esto sugiere que podemos descomponer un tensor general Ti j en una


parte simétrica y una parte antisimétrica. En efecto, llamando
1 1
T(i j) = Ti j + T ji , T[i j] = Ti j − T ji , (4.20)
 
2 2
podemos escribir Ti j = T(i j) + T[i j] , donde T(i j) es simétrico y T[i j] es antisimétrico.

Ejemplo 4.20. Sean Si j un tensor simétrico y Ai j un tensor antisimétrico. Entonces,

Si j Ai j = −S ji A ji = −Si j Ai j = 0. (4.21)

Con dos índices, la única permutación posible consiste en intercambiarlos, i j 7→ ji.


Con tres índices, existen seis permutaciones posibles (incluyendo la permutación tri-
vial), como se lista en la tabla 4.1. Es posible asignar una paridad a cada permutación
teniendo en cuenta el número de intercambios de un par de índices que es necesario
efectuar para llegar desde el orden inicial i jk a la permutación en cuestión. Por ejem-
plo, la permutación ik j es impar porque basta con un intercambio de un par de índices
para alcanzarla a partir de i jk: i jk 7→ ik j, donde hemos intercambiado j y k. La per-
mutación ki j, en cambio, es par, porque se necesitan dos intercambios para alcanzarla
a partir de i jk: i jk 7→ jik 7→ jki. La figura 4.1 muestra que la paridad de una permu-
tación está bien definida en el sentido que, por ejemplo, es imposible pasar de i jk a jki
con un número impar de intercambios.
Con tres índices, las permutaciones pares coinciden con las permutaciones cíclicas,
pero esta coincidencia no ocurre para cuatro o más índices.

Definición 4.21 (Tensor totalmente simétrico de orden 3). Decimos que el tensor Si jk
es totalmente simétrico si Si jk = Sik j = S jki = S jik = Ski j = Sk ji , i.e., si su valor no cambia
al hacer cualquier permutación en sus índices.

Definición 4.22 (Tensor totalmente antisimétrico de orden 3). Decimos que el tensor
Ai jk es totalmente antisimétrico si Ai jk = −Aik j = A jki = −A jik = Aki j = −Ak ji , i.e., si
cambia de signo cuando intercambiamos dos índices cualesquiera.

71
Capítulo 4. Introducción al cálculo tensorial

ik j i jk ik j ···

i jk jik jki jik ···

k ji ki j k ji ···

0 1 2 3 ···

Figura 4.1: Partiendo de i jk y realizando un intercambio de índices, podemos obtener


ik j, jik o k ji, dependiendo de cuáles índices intercambiemos. Tomando una de estas
tres permutaciones como punto de partida y realizando otro intercambio de índices,
llegamos a i jk, jki o ki j. Iterando el proceso, encontramos que, comenzando con i jk,
solo es posible alcanzar las permutaciones ik j, jik y k ji a través de un número impar
de intercambios, mientras que siempre se necesita un número par de intercambios para
obtener i jk, jki o ki j.

Contando cuidadosamente1 , podemos concluir que un tensor totalmente simétrico


de orden 3 tiene 10 componentes independientes, las que podemos escoger como S111 ,
S222 , S333 , S112 , S113 , S221 , S223 , S331 , S332 y S123 . Todas las otras componentes pueden
obtenerse a partir de estas diez usando la simetría en los índices. Un tensor totalmen-
te antisimétrico de orden 3, en cambio, tiene solo una componente independiente,
que puede escogerse como A123 . La diferencia entre ambos ocurre porque Ai jk es au-
tomáticamente cero siempre que se repitan dos o más índices. Por ejemplo, A112 = 0,
porque la antisimetría exige que, al intercambiar los dos primeros índices, se cumpla
A112 = −A112 .
Estas 10 + 1 = 11 componentes son por supuesto insuficientes para generar las
3
3 = 27 componentes independientes de un tensor de orden 3 genérico. A diferencia
del caso con dos índices, con tres o más índices es posible tener simetrías parciales,
e.g., T jik = Ti jk , que involucra solo los dos primeros índices. Son estos tensores con
simetrías parciales los que hacen falta para completar las 27 componentes del tensor
genérico.

Tensores totalmente antisimétricos. En tres dimensiones, un tensor totalmente an-


tisimétrico con dos índices tienes tres componentes independientes, mientras que uno
con tres índices tiene solo una. No hay tensores totalmente antisimétricos con cuatro
o más indices en tres dimensiones; debido a la antisimetría, todas sus componentes
1 d+n−1 (d+n−1)!
En d dimensiones, un tensor totalmente simétrico de orden n tiene componentes

n = n!(d−1)!
independientes.

72
4.2. Tensores en el espacio euclidiano tridimensional

Orden del Orden del Componentes


Dimensión
tensor tensor dual independientes
3 0 3 1
3 1 2 3
3 2 1 3
3 3 0 1
4 0 4 1
4 1 3 4
4 2 2 6
4 3 1 4
4 4 0 1

Tabla 4.2: Dualidades entre tensores totalmente antisimétricos en tres y cuatro dimen-
siones.

serían cero. Esto significa que un tensor totalmente antisimétrico con dos índices tiene
tantas componentes independientes como un vector, Ai j ∼ Vi , mientras que uno con
tres índices tiene tantas como un escalar, Ai jk ∼ φ.
En un espacio de d dimensiones, un tensor totalmente antisimétrico con n índices
tiene
d d!
 ‹
= (4.22)
n n! (d − n)!
componentes independientes. Dado que
d d
 ‹  ‹
= , (4.23)
n d−n
existe siempre una dualidad entre tensores totalmente antisimétricos con n índices y
tensores totalmente antisimétricos con d −n índices en d dimensiones. No hay tensores
totalmente antisimétricos con más de d índices en d dimensiones. La tabla 4.2 muestra
un resumen de las dualidades entre tensores totalmente antisimétricos en tres y cuatro
dimensiones.
Definición 4.23 (Símbolo de Levi-Civita). El símbolo de Levi-Civita εi jk está definido
como
 0 si se repiten dos o más indices,

εi jk = +1 si i jk es una permutación par de 123, (4.24)


−1 si i jk es una permutación impar de 123.

Explícitamente, las únicas componentes no nulas son ε123 = ε231 = ε312 = +1 y ε132 =
ε213 = ε321 = −1. Esta definición es válida en todos los marcos relacionados entre sí a
través de rotaciones ortogonales; en otras palabras, ε0i jk = εi jk .
Ejemplo 4.24. Sea Ai jk un tensor totalmente antisimétrico. Como Ai jk tiene solo una
componente independiente, podemos escribir Ai jk = A123 εi jk .

73
Capítulo 4. Introducción al cálculo tensorial

Propiedades del símbolo de Levi-Civita. Llamemos

δil δim δin


i jk
δl mn = δ jl δ jm δ jn , (4.25)
δkl δkm δkn

donde las barras verticales denotan el determinante de la matriz de 3 × 3, de manera


i jk
que δl mn es un tensor de orden 6 definido como una combinación lineal de productos
de deltas de Kronecker. La posición de los índices está adelantando los refinamientos
que introduciremos en la sección 4.3; por ahora, es solo una manera práctica de distin-
guir entre los índices que corresponden a filas y los que corresponden a columnas. Este
tensor es antisimétrico en los tres índices superiores; en efecto, los intercambios i ↔ j,
j ↔ k y k ↔ i son equivalentes a intercambiar dos filas en la matriz, lo que produce
un cambio de signo en el determinante. Similarmente, los intercambios l ↔ m, m ↔ n
y n ↔ l son equivalentes a intercambiar dos columnas de la matriz, lo cual también
produce un cambio de signo en el determinante. Al ser antisimétrico en i jk y en lmn,
i jk 123
este tensor puede escribirse en la forma δlmn = δ123 εi jk εlmn (ver ejemplo 4.24). No-
123
tando que δ123 = det (1) = 1, encontramos un primer resultado importante sobre el
símbolo de Levi-Civita:
δil δim δin
εi jk εl mn = δ jl δ jm δ jn . (4.26)
δkl δkm δkn
Desarrollando el determinante, esta identidad adopta la forma más explícita pero me-
nos memorable

εi jk εl mn = δil δ jm δkn − δ jn δkm −δim δ jl δkn − δ jn δkl +δin δ jl δkm − δ jm δkl . (4.27)
  

Contrayendo n = k y simplificando, hallamos

εi jk εlmk = δil δ jm − δim δ jl , (4.28)

que debe ser una de las pocas ecuaciones que vale la pena memorizar en este curso.
Hay varias reglas mnemotécnicas para recordar la posición de los índices; busque una
que le funcione a usted y adóptela como propia.
Contrayendo dos índices entre ambos símbolos de Levi-Civita, encontramos la iden-
tidad
εikl ε jkl = 2δi j . (4.29)
Finalmente, cuando todos los índices están contraídos, obtenemos

εi jk εi jk = 6. (4.30)

Sea Mi j una matriz invertible. En analogía con (4.25), definimos

Mil Mim Min


i jk
Ml mn = M jl M jm M jn . (4.31)
Mkl Mkm Mkm

74
4.2. Tensores en el espacio euclidiano tridimensional

i jk i jk
Al igual que δl mn , el tensor Ml mn es antisimétrico en i jk y en lmn, por lo que puede
i jk 123 123
escribirse en la forma Ml mn = M123 εi jk εlmn . Notando que M123 = det (M ), encontramos
i jk
que Ml mn = det (M ) εi jk εl mn . Por otro lado, las propiedades del delta de Kronecker y de
los determinantes nos permiten escribir

Mil Mim Min


det (M ) εi jk εlmn = M jl M jm M jn
Mkl Mkm Mkn
Mip δ pl Mip δ pm Mip δ pn
= M jq δql M jq δqm M jq δqn
Mkr δ r l Mkr δ r m Mkr δ r n
δ pl δ pm δ pn
= Mip M jq Mkr δql δqm δqn
δr l δr m δr n
= Mip M jq Mkr ε pqr εlmn .

Poniendo lmn = 123, obtenemos la identidad

det (M ) εi jk = Mip M jq Mkr ε pqr . (4.32)

Esta es una fórmula explícita para calcular el determinante de una matriz de 3 × 3


usando el símbolo de Levi-Civita.
Sea R una matriz ortogonal. Tomando determinante en la ecuación R T R = 1 y
recordando que det M T = det (M ) para cualquier matriz M , hallamos [det (R)]2 = 1,


i.e., det (R) = ±1. Las matrices R con determinante positivo corresponden a rotaciones
propias, mientras que aquellas con determinante negativo corresponden a rotaciones
impropias, que pueden descomponerse como el producto de una rotación propia y una
reflexión. Aplicando la identidad (4.32) a la matriz R i j y multiplicando a ambos lados
por det (R), encontramos

ε0i jk = det (R) R il R jm R kn εlmn , (4.33)

donde hemos usado la relación (cf. def. 4.23) ε0i jk = εi jk . Esta ecuación expresa la
ley de transformación del símbolo de Levi-Civita bajo rotaciones, que cambia para no
cambiar. Un objeto con una ley de transformación como esta, que difiere de la regla
tensorial por la presencia del determinante de la matriz de rotación en el lado derecho,
es llamado un pseudotensor. Un pseudotensor transforma de la misma manera que un
tensor cuando la transformación es propia, pero cambia en un signo adicional cuando
la transformación es impropia. Note que, como [det (R)]2 = 1, el producto de dos
pseudotensores es otra vez un tensor.
Ejemplo 4.25 (Producto cruz). Si A~ y B ~ son dos vectores, entonces las componentes
de su producto cruz, C~ = A~ × B
~ , pueden calcularse en la forma

Ci = εi jk A j Bk . (4.34)

75
Capítulo 4. Introducción al cálculo tensorial

y y
E~ E~0 B
~

x x

~0
B

Figura 4.2: Bajo una reflexión en un espejo perpendicular al eje x, un vector E~ y un


pseudovector B~ transforman de maneras distintas. Note que esta figura muestra el
punto de vista activo de la reflexión (ver sección 3.1).

La presencia del símbolo de Levi-Civita en la ec. (4.34) implica que Ci transforma como
un pseudovector bajo rotaciones, i.e., Ci0 = det (R) R i j C j .

Ejemplo 4.26 (Vectores y pseudovectores). La diferencia entre un vector E~ y un pseu-


dovector B
~ se manifiesta en cómo transforman bajo rotaciones impropias. Por ejemplo,
bajo una reflexión dada por la matriz
 
−1 0 0
R =  0 1 0 , (4.35)
0 0 1

encontramos [con Ei0 = R i j E j , Bi0 = det (R) R i j B j ]

E x0
      
−1 0 0 Ex −E x
 E 0y  =  0 1 0   Ey  =  Ey  , (4.36)
Ez0 0 0 1 Ez Ez
B 0x
      
−1 0 0 Bx Bx
 B 0y  = −  0 1 0   B y  =  −B y  , (4.37)
Bz0 0 0 1 Bz −Bz

como se sugiere en la figura 4.2. Mientras que el vector E~ es reflejado en un espejo que
yace sobre el plano yz (i.e., perpendicular al eje x), el pseudovector B ~ es reflejado e
invertido por el espejo.

Ejemplo 4.27 (Campo magnético). Como veremos en el capítulo 7, el campo magné-


tico B
~ transforma como un pseudovector bajo rotaciones de O (3). Para entender esta
propiedad del campo magnético de manera más intuitiva, considere la situación que se
ilustra en la figura 4.3. De acuerdo a la ley de Ampère, una corriente estacionaria I en
un circuito cerrado genera un campo magnético B ~ que atraviesa el plano definido por

76
4.2. Tensores en el espacio euclidiano tridimensional

B
~ B
~

I I

Figura 4.3: Cuando reflejamos un circuito cerrado de corriente en un espejo, el campo


magnético generado sufre una reflexión y una inversión, es decir, se comporta como
un pseudovector. Los colores de las líneas de campo son solo una ayuda visual para
distinguir más fácilmente la reflexión de una rotación.

el circuito. Para determinar la dirección del campo magnético puede utilizarse la regla
de la mano derecha, con el pulgar en la dirección de la corriente y los dedos indicando
la dirección del campo magnético. Cuando reflejamos el circuito en un espejo, indicado
por la línea punteada vertical, las líneas de campo magnético sufren una reflexión y
una inversión, es decir, se comportan como un pseudovector.

Cálculo tensorial. Usamos la notación abreviada ∂i para denotar el operador de de-


rivada parcial respecto de x i :

∂i = . (4.38)
∂ xi
Como sugiere la notación, ∂i transforma como un vector bajo rotaciones de O(3). Para
comprobar esta propiedad, partimos usando la regla de la cadena para obtener

∂ ∂ xj ∂ ∂ xj
∂i0 = 0
= 0
= ∂j. (4.39)
∂ xi ∂ xi ∂ x j ∂ x i0

La matriz jacobiana correspondiente a una rotación x i0 = R i j x j es

∂ x i0 ∂ ∂ xk
= (R ik x k ) = R ik = R ik δk j = R i j . (4.40)
∂ xj ∂ xj ∂ xj

Similarmente, la matriz jacobiana inversa es


∂ xi
= R−1
ij
. (4.41)
∂ x 0j

77
Capítulo 4. Introducción al cálculo tensorial

Esto significa que la ley de transformación para ∂i tiene la forma

∂i0 = R−1 ∂.
ji j
(4.42)

Como R es una matriz ortogonal, R−1


ji
= R Tji = R i j , y obtenemos finalmente

∂i0 = R i j ∂ j . (4.43)

En la sección 4.4 consideraremos tensores en el espacio-tiempo de Minkowski, donde


las transformaciones relevantes —las transformaciones de Lorentz— son representadas
por medio de matrices que no cumplen esta propiedad de ortogonalidad.

Ejemplo 4.28 (Gradiente). Si φ es un campo escalar, entonces ∂i φ es un campo vec-


torial, llamado gradiente de φ. En efecto,

∂i φ 7→ (∂i φ)0 = ∂i0 φ 0 = R i j ∂ j φ. (4.44)

Ejemplo 4.29 (Divergencia). Si Ai es un campo vectorial, entonces ∂i Ai es un campo


escalar, llamado divergencia de Ai . Explícitamente,

∂ A x ∂ A y ∂ Az
∂i Ai = + + . (4.45)
∂x ∂y ∂z

En general, si Ai es un campo vectorial, entonces ∂i A j es un campo tensorial de


orden 2. En efecto,
0
∂i A j 7→ ∂i A j = ∂i0 A0j = R ik ∂k R jl Al = R ik R jl ∂k Al . (4.46)


La divergencia corresponde a la traza de este tensor. De interés resulta ser también su


parte antisimétrica, como muestra el siguiente ejemplo.

Ejemplo 4.30 (Rotacional). Si Ai es un campo vectorial, entonces εi jk ∂ j Ak es un campo


pseudovectorial, llamado rotacional (o rotor) de Ai . Las componentes del rotacional
pueden calcularse en la forma

ı̂ ̂ k̂
εi jk ∂ j Ak = ∇ × A~ = ∂ x ∂ y ∂z . (4.47)
 

A x A y Az

El rotacional εi jk ∂ j Ak organiza de manera vectorial las tres componentes indepen-


dientes de la parte antisimétrica del tensor ∂i A j (ver tabla 4.2):
 
 1 0 ∂ A
x y − ∂ A
y x ∂ A
x z − ∂ A
z x
∂[i A j] =  ∂ y A x − ∂ x A y 0 ∂ y Az − ∂z A y  . (4.48)

2 ∂z A x − ∂ x Az ∂z A y − ∂ y Az 0

78
4.3. Transformaciones generales de coordenadas

Ejemplo 4.31 (Laplaciano). El laplaciano es un operador diferencial escalar definido


como
∂2 ∂2 ∂2
∇2 = ∂i ∂i = + + . (4.49)
∂ x 2 ∂ y 2 ∂ z2
Al ser un operador escalar, el laplaciano no cambia el orden de un campo tensorial,
pudiendo ser aplicado a campos escalares, vectoriales o tensoriales.

La notación tensorial resulta útil para manipular expresiones complicadas del cálcu-
lo vectorial; en particular, a menudo es la mejor herramienta para demostrar las múl-
tiples identidades que existen en el cálculo vectorial.

Ejemplo 4.32. Las identidades del cálculo vectorial

∇ · ∇ × A~ = 0, ∇ × ∇φ = 0, (4.50)


pueden demostrarse fácilmente transcribiéndolas a notación tensorial:

∇ · ∇ × A~ = εi jk ∂i ∂ j Ak , ∇ × ∇φ = εi jk ∂ j ∂k φ , (4.51)
  

donde hemos usado el hecho que εi jk = const. La conmutatividad de las derivadas par-
ciales implica que el operador diferencial tensorial ∂i ∂ j es simétrico: ∂ j ∂i = ∂i ∂ j . Como
notamos en el ejemplo 4.20, la contracción de un tensor simétrico con uno antisimé-
trico siempre es cero; luego, εi jk ∂i ∂ j = 0 y obtenemos ambos resultados.

Ejemplo 4.33 (Ecuaciones de Maxwell). Las ecuaciones de Maxwell en notación ten-


sorial toman la forma
ρ 1 ∂ Ei
∂i Ei = , εi jk ∂ j Bk − ε0 = ji , (4.52)
ε0 µ0 ∂t
∂ Bi
∂i Bi = 0, εi jk ∂ j Ek + = 0. (4.53)
∂t
En el capítulo 7 aprenderemos cómo escribir las ecuaciones de Maxwell de manera aún
más compacta y, más crucialmente, de manera explícitamente covariante bajo trans-
formaciones de Lorentz.

4.3. Transformaciones generales de coordenadas


Un evento en el espacio-tiempo de Minkowski es descrito por un conjunto de cuatro
coordenadas, (t, x, y, z). Vamos a usar la notación compacta x µ para referirnos a una
cualquiera de ellas, donde µ es un superíndice (¡no un exponente!) que toma valores
de 0 a 3:

x 0 = t, x 1 = x, x 2 = y, x 3 = z. (4.54)

79
Capítulo 4. Introducción al cálculo tensorial

Equivalentemente, a veces escribimos también x µ = t, x i = (t, ~r ). En general, reser-




vamos los índices latinos i, j, k, . . . para el conjunto {1, 2, 3} (solo la parte espacial) y
los índices griegos λ, µ, ν, . . . para el conjunto {0, 1, 2, 3} (incluyendo el tiempo).
El lenguaje tensorial nos permitirá escribir ecuaciones que conserven su forma (i.e.,
que sean covariantes) en todos los marcos de referencia relacionados entre sí a través
de transformaciones de Lorentz.
Como las transformaciones de Lorentz son rotaciones que dejan invariante una
forma cuadrática que incluye un signo negativo, ds2 = −d t 2 + d x 2 + d y 2 + dz 2 , las
matrices que describen estan transformaciones no son estrictamente ortogonales, en
el sentido que Λ−1 6= Λ T (ver sección 3.5). En particular, esto significa que debemos
ser más cuidadosos en el desarrollo de un cálculo tensorial de lo que hemos sido hasta
ahora.
Para ilustrar la clase de generalización que necesitamos, vamos a recurrir al ejemplo
del paso de coordenadas polares a coordenadas cartesianas en el plano. Esta transfor-
mación es no lineal y, por lo tanto, no está cubierta dentro de las rotaciones ortogonales
que fueron el tema de la sección 4.2.
Ejemplo 4.34 (Transformación no lineal de coordenadas). En un plano, la transfor-
mación de coordenadas polares (r, θ ) a coordenadas cartesianas (x, y) se escribe en la
forma

x = r cos θ , y = r sin θ . (4.55)

Note que x y y son funciones lineales en r y no lineales en θ . La no linealidad de la


transformación se refleja también en el hecho que no existe una matriz que nos lleve
del “vector” (r, θ ) al “vector” (x, y).
A pesar de esta no linealidad, es posible identificar dos objetos que sí transforman
linealmente bajo el cambio de coordenadas (4.55).
El primero de ellos es el vector compuesto por los diferenciales, (d r, dθ ) y (d x, d y).
En efecto, tenemos
∂x ∂x ∂y ∂y
dx = dr + dθ , dy = dr + dθ , (4.56)
∂r ∂θ ∂r ∂θ
o bien
dx ∂ x/∂ r ∂ x/∂ θ dr
• ˜ • ˜• ˜
= . (4.57)
dy ∂ y/∂ r ∂ y/∂ θ dθ
La matriz que media esta transformación es la matriz jacobiana de la transformación
de coordenadas polares a coordenadas cartesianas, (r, θ ) 7→ (x, y). Calculando las de-
rivadas, hallamos
∂ x/∂ r ∂ x/∂ θ cos θ −r sin θ
• ˜ • ˜
J= = . (4.58)
∂ y/∂ r ∂ y/∂ θ sin θ r cos θ

El segundo objeto que transforma linealmente es el vector compuesto de las deriva-


das parciales, (∂ /∂ r, ∂ /∂ θ ) y (∂ /∂ x, ∂ /∂ y). En efecto, usando la regla de la cadena

80
4.3. Transformaciones generales de coordenadas

encontramos

∂ ∂r ∂ ∂θ ∂ ∂ ∂r ∂ ∂θ ∂
= + , = + , (4.59)
∂x ∂ x ∂r ∂ x ∂θ ∂y ∂ y ∂r ∂ y ∂θ

o bien
∂ /∂ x ∂ r/∂ x ∂ θ /∂ x ∂ /∂ r
• ˜ • ˜• ˜
= . (4.60)
∂ /∂ y ∂ r/∂ y ∂ θ /∂ y ∂ /∂ θ

La matriz que media esta transformación es la transpuesta de la matriz jacobiana de


la transformación de coordenadas cartesianas a coordenadas polares, (x, y) 7→ (r, θ ).
Esta matriz es la inversa transpuesta de la matriz jacobiana (4.58). Calculando las
derivadas (o tomando la inversa), hallamos

∂ r/∂ x ∂ θ /∂ x cos θ − 1r sin θ


• ˜  
−1 T
J . (4.61)

= =
∂ r/∂ y ∂ θ /∂ y sin θ 1r cos θ

Resumiendo: si bien la transformación de coordenadas (4.55) es no lineal, tanto los


diferenciales como las derivadas parciales transforman linealmente. Los diferenciales
transforman con la matriz jacobiana J y las derivadas parciales transforman con la
T
matriz jacobiana inversa transpuesta J −1 .

Como el ejemplo 4.34 muestra, incluso si la transformación de coordenadas es no


lineal, siempre es posible identificar cantidades que transforman linealmente: los dife-
renciales y las derivadas parciales.
Escribimos una transformación general de coordenadas en la forma x µ 7→ x 0µ (x),
indicando así que cada una de las nuevas coordenadas (primadas) es, en principio, una
función de todas las coordenadas originales (no primadas).
Bajo una transformación general de coordenadas x µ 7→ x 0µ (x), los diferenciales d x µ
transforman de acuerdo a
∂ x 0µ ν
d x µ 7→ d x 0µ = dx , (4.62)
∂ xν
donde ∂ x 0µ /∂ x ν son las componentes de la matriz jacobiana de la transformación.
Similarmente, bajo x µ 7→ x 0µ (x), las derivadas parciales ∂ /∂ x µ transforman de
acuerdo a
∂ ∂ ∂ xν ∂
7→ = , (4.63)
∂ xµ ∂ x 0µ ∂ x 0µ ∂ x ν
donde ∂ x ν /∂ x 0µ son las componentes de la matriz jacobiana de la transformación
inversa, que es la inversa de la matriz jacobiana de la transformación directa. Aunque
no es evidente en esta ecuación, la posición de los índices garantiza que las derivadas
parciales transforman con la matriz jacobiana inversa transpuesta.
A diferencia de lo que ocurren con las rotaciones tridimensionales, donde J = R y
T T
se cumple que R−1 = R, en el caso general tenemos que J −1 6= J. Esta diferencia

81
Capítulo 4. Introducción al cálculo tensorial

nos fuerza a distinguir entre dos clases de vectores, que llamamos contravariantes y
covariantes2 .
Definición 4.35 (Campo vectorial contravariante). Decimos que Aµ (x) es un cam-
po vectorial contravariante si, bajo una transformación general de coordenadas x µ 7→
x 0µ (x), sus componentes cambian de acuerdo a la regla
 ∂ x 0µ ν
A0µ x 0 = A (x) . (4.64)
∂ xν
Definición 4.36 (Campo vectorial covariante). Decimos que Aµ (x) es un campo vec-
7 x 0µ (x), sus
torial covariante si, bajo una transformación general de coordenadas x µ →
componentes cambian de acuerdo a la regla
 ∂ xν
A0µ x 0 = Aν (x) . (4.65)
∂ x 0µ
En palabras: los vectores contravariantes (denotados con un superíndice) transfor-
man con la matriz jacobiana directa, mientras que los vectores covariantes (denotados
con un subíndice) transforman con la matriz jacobiana inversa transpuesta.
Solo en el caso de rotaciones representadas a través de matrices ortogonales te-
nemos que estos dos tipos de vectores coinciden y la diferencia entre superíndices y
subíndices puede ser ignorada.
Definición 4.37 (Campo escalar). Decimos que φ (x) es un campo escalar si, bajo una
transformación general de coordenadas x µ 7→ x 0µ (x), cambia de acuerdo a la regla

φ 0 x 0 = φ (x) . (4.66)


Previsiblemente, un campo escalar es aquel que permanece invariante bajo trans-


formaciones generales de coordenadas.
Definición 4.38 (Campo tensorial). Decimos que T µ1 ···µmν1 ···νn (x) es un campo tensorial
de tipo (o valencia) (m, n) si, bajo una transformación general de coordenadas x µ 7→
x 0µ (x), sus componentes cambian de acuerdo a la regla
 ∂ x 0µ1 ∂ x 0µm ∂ x σ1 ∂ x σn ρ1 ···ρm
T 0µ1 ···µmν1 ···νn x 0 = · · · · · · T σ1 ···σn
(x) . (4.67)
∂ x ρ1 ∂ x ρm ∂ x 0ν1 ∂ x 0νn
El orden (también llamado grado o rango) del tensor es m + n.
Ejemplo 4.39 (Delta de Kronecker). El delta de Kronecker es un tensor de tipo (1, 1),
definido (en todos los sistemas de coordenadas) como
¨
1 si µ = ν,
µ
δν = (4.68)
0 si µ 6= ν.
2
Usamos la palabra “covariante” con dos significados distintos: el que acabamos de utilizar, opuesto
a “contravariante”, y el que introdujimos en el capítulo 1, que puede resumirse en la idea de “invariancia
de forma” de una ecuación, y que es el más importante de los dos.

82
4.3. Transformaciones generales de coordenadas

Para comprobar la valencia (1, 1) del delta de Kronecker, notamos que


∂ xµ ∂ x 0µ
δνµ = = = δν0µ . (4.69)
∂ xν ∂ x 0ν
Esto significa que, usando la regla de la cadena, podemos escribir
∂ x 0µ ∂ x 0µ ∂ x ρ ∂ x 0µ ∂ x σ ρ
δν0µ = = = δ , (4.70)
∂ x 0ν ∂ x ρ ∂ x 0ν ∂ x ρ ∂ x 0ν σ
que corresponde a la ley de transformación general (4.67) cuando m = n = 1.
Ejemplo 4.40 (Producto punto). Si Aµ es un vector contravariante y Bµ es un vector
covariante, entonces el producto Aµ Bµ es un escalar. Comprobación:

∂ x 0µ ∂ x σ ρ ∂ xσ ρ
A0µ Bµ0 = A B σ = A Bσ = δρσ Aρ Bσ = Aσ Bσ . (4.71)
∂ x ρ ∂ x 0µ ∂ xρ

Operaciones con tensores.


El producto de un escalar con un tensor produce un tensor del mismo tipo que
el tensor original.

Dos tensores del mismo tipo pueden sumarse y producir un nuevo tensor, que
tiene el mismo tipo que los tensores originales.
Estas dos operaciones permiten identificar el espacio de los tensores de tipo (m, n)
con un espacio vectorial de dimensión d m+n , donde d es el rango de los índices (e.g.,
d = 3 para el espacio euclidiano tridimensional y d = 4 para el espacio-tiempo de
Minkowski).
El producto de dos tensores (de cualquier tipo) es un tensor. Si los tensores ori-
ginales son de tipo (m, n) y (p, q), respectivamente, entonces el tensor producto
es de tipo (m + p, n + q).

La contracción de un índice contravariante (superíndice) con un índice covariante


(subíndice) en un tensor de tipo (m, n) produce un tensor de tipo (m − 1, n − 1).
La contracción de índices debe realizarse siempre entre índices de tipos distintos, uno
covariante y uno contravariante (i.e., un subíndice con un superíndice). Esta es la única
manera de garantizar que el resultado de la contracción sea tensorial. Repita conmigo
el mantra 4.41.
Mantra 4.41. Solo contraerás índices de tipos distintos.
Ejemplo 4.42 (Contracción de índices). En Relatividad General, la curvatura del espa-
cio-tiempo se cuantifica por medio de un tensor de tipo (1, 3), llamado tensor de Rie-
mann y denotado por Rρ σµν . A partir del tensor de Riemann se construye el tensor de
Ricci, de tipo (0, 2), mediante la contracción de dos índices: Rµν = Rσ µσν . (El uso de la
misma letra para ambos tensores es un abuso de notación ampliamente tolerado).

83
Capítulo 4. Introducción al cálculo tensorial

Cálculo tensorial. Como vimos al comienzo de esta sección [cf. ec. (4.63)], el ope-
rador de derivada parcial,

∂µ = , (4.72)
∂ xµ
transforma como un vector covariante y es denotado consecuentemente con un sub-
índice. Esto significa, por ejemplo, que el gradiente de un campo escalar φ resulta ser
un vector covariante, ∂µ φ. Sin embargo, la situación se complica cuando se toman
derivadas de tensores de orden superior.
Sea Aµ un campo vectorial covariante. A pesar de las apariencias, ∂µ Aν no es un
campo tensorial de tipo (0, 2). Para entender el motivo, analicemos su ley de transfor-
mación bajo x µ 7→ x 0µ (x). Usando la ley de transformación para un vector covariante
y la regla de Leibniz para la derivada de un producto, obtenemos

∂ ∂ xσ ∂ 2xσ ∂ x σ ∂ Aσ
 ‹
∂µ0 A0ν = A σ = A σ + . (4.73)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν ∂ x 0ν ∂ x 0µ

Utilizamos ahora la regla de la cadena para reescribir el segundo término del lado
derecho en la forma

∂ 2xσ ∂ xρ ∂ xσ
∂µ0 A0ν = Aσ + ∂ρ Aσ (4.74)
∂ x 0µ ∂ x 0ν ∂ x 0µ ∂ x 0ν

¡Esta no es la ley de transformación de un tensor! Existen varias posibilidades para


lidiar con este problema:

1. Restringir las transformaciones de coordenadas a transformaciones lineales. En


este caso, el término inhomogéneo al lado derecho de la ec. (4.74) se anula, y
recuperamos la ley de transformación tensorial.

2. Tomar la parte antisimétrica de ∂µ Aν . Es posible demostrar que ∂µ Aν −∂ν Aµ trans-


forma como un tensor de tipo (0, 2) incluso bajo transformaciones no lineales.

3. Definir una “derivada covariante” ∇µ y exigir que ∇µ Aν transforme tensorial-


mente.

En este curso, escogeremos la opción 1, es decir, restringiremos nuestra atención a


transformaciones lineales de coordenadas. Esta es la opción más sencilla, aunque, si
bien es suficiente para nuestros propósitos, nos limita a trabajar con coordenadas carte-
sianas. La opción 2 es especialmente interesante, y puede ser generalizada para tenso-
res de orden superior. Esta es la base para la teoría de las formas diferenciales, introdu-
cida por Élie Cartan en 1899 (para una introducción moderna, consulte la Ref. [24]).
La opción 3 es la utilizada en relatividad general, donde es físicamente inadmisible
restringirse a transformaciones lineales.

84
4.4. Tensores en el espacio-tiempo de Minkowski

4.4. Tensores en el espacio-tiempo de Minkowski


En relatividad especial, las transformaciones de coordenadas que nos interesan son
aquellas transformaciones lineales que dejan invariante el intervalo espacio-temporal,
ds2 = −d t 2 + d x 2 + d y 2 + dz 2 . Escribiendo

x 0µ = Λµν x ν , (4.75)
” —
encontramos que las matrices Λ = Λµν deben pertenecer al grupo de Lorentz, como
se detalló en el capítulo 3. Note que, por consistencia notacional, las componentes de
las matrices Λ se escriben con un superíndice (el primero, µ, que corresponde a la fila)
y un subíndice (el segundo, ν, que corresponde a la columna), Λµν . A pesar de que
las transformaciones de Lorentz son lineales, la presencia de un signo negativo en ds2
implica que las matrices Λ no son ortogonales en el sentido estricto de la palabra, i.e.,
Λ−1 6= Λ T . (La inversa difiere en este caso de la transpuesta por algunos signos en la
primera fila y la primera columna). Esto significa que debemos distinguir entre índices
covariantes y contravariantes cuando usemos el cálculo tensorial en el espacio-tiempo
de Minkowski.
Derivando la ec. (4.75), encontramos que las componentes de la matriz jacobiana
de la transformación son
∂ x 0µ
= Λµν . (4.76)
∂ xν
Las componentes de la matriz jacobiana inversa son, por supuesto,

∂ xµ µ
= Λ−1 ν . (4.77)
∂x 0ν

Definición 4.43 (Vectores de Lorentz). Decimos que Aµ (x) es un vector contravariante


de Lorentz y que Bµ (x) es un vector covariante de Lorentz si, bajo una transformación
de Lorentz x 0µ = Λµν x ν , sus componentes cambian de acuerdo a la regla

A0µ x 0 = Λµν Aν (x) , (4.78)




Bµ0 x 0 = Λ−1 µ Bν (x) . (4.79)


Para distinguirlos de los vectores en tres dimensiones, los vectores de Lorentz son lla-
mados a veces 4-vectores (“cuadrivectores”).

La ley de transformación para un tensor de Lorentz de tipo (m, n) sigue la lógica


de la definición 4.38, con m matrices Λ y n matrices Λ−1 .

Definición 4.44 (Métrica de Minkowski). La métrica de Minkowski ηµν es un tensor


de Lorentz de tipo (0, 2), cuyas componentes (en todos los marcos relacionados entre

85
Capítulo 4. Introducción al cálculo tensorial

sí mediante transformaciones de Lorentz) están dadas por η00 = −1, η0 j = 0, ηi0 = 0,


ηi j = δi j . Escribiéndola como una matriz de 4 × 4, hallamos
−1 0 0 0
 
  0 1 0 0 
. (4.80)

ηµν = 
0 0 1 0 
0 0 0 1
En términos de la métrica de Minkowski, el intervalo espacio-temporal puede es-
cribirse en la forma compacta
ds2 = ηµν d x µ d x ν = −d t 2 + d x 2 + d y 2 + dz 2 . (4.81)
A partir de la ec. (4.81), y usando el hecho que ηµν tiene el mismo valor en todos los
marcos (i.e., η0µν = ηµν ), podemos escribir la condición de que Λ sea una transforma-
ción de Lorentz en términos de la métrica de Minkowski. Exigiendo que ds2 permanezca
invariante bajo la transformación x µ 7→ x 0µ = Λµν x ν , encontramos

ds02 = ηρσ d x 0ρ d x 0σ = ηρσ Λρµ Λσν d x µ d x ν = ηµν d x µ d x ν = ds2 , (4.82)


de donde obtenemos la condición
Λρµ Λσν ηρσ = ηµν . (4.83)
El grupo de Lorentz puede definirse entonces como el conjunto de todas las matrices
Λ cuyas componentes satisfacen la ec. (4.83). Esta ecuación es la versión minkows-
kiana de la condición de ortogonalidad R T R = 1 para las matrices de rotación en tres
dimensiones, que puede escribirse en la forma equivalente R ik R jl δkl = δi j .
Definición 4.45 (Métrica de Minkowski inversa). Denotamos por ηµν las componen-
tes de la métrica de Minkowski inversa. Por definición, estas componentes satisfacen
−1 
ηµσ ησν = δνµ . Matricialmente, [ηµν ] = ηµν = ηµν . Note, sin embargo, que ηµν
 

define un tensor de Lorentz de tipo (2, 0), como sugiere la notación.

Subiendo y bajando índices. La métrica de Minkowski nos provee de un mapeo entre


vectores de Lorentz covariantes y contravariantes.
Sea Aµ un 4-vector contravariante de Lorentz. Entonces, las cantidades
Aµ = ηµν Aν (4.84)
definen un 4-vector covariante de Lorentz.
Sea Aµ un 4-vector covariante de Lorentz. Entonces, las cantidades
Aµ = ηµν Aν (4.85)
definen un 4-vector contravariante de Lorentz.
Estas operaciones funcionan también para tensores de orden mayor. Decimos que
ηµν nos permite “bajar el índice” de un tensor, de la misma manera que ηµν nos permite
“subir el índice”.

86
4.4. Tensores en el espacio-tiempo de Minkowski

Condición Tipo
A2 < 0 Tiempo
A2 = 0 Nulo o Luz
A2 > 0 Espacio

Tabla 4.3: Tipos de 4-vectores.

Ejemplo 4.46. Sean Aµ = A0 , Ai las componentes contravariantes de un 4-vector. Sus




componentes covariantes, obtenidas por medio de la ec. (4.84), son


A0 = −A0 , Ai = Ai . (4.86)
Ejemplo 4.47. Sean Aµ = (A0 , Ai ) las componentes covariantes de un 4-vector. Sus
componentes contravariantes, obtenidas por medio de la ec. (4.85), son
A0 = −A0 , Ai = Ai . (4.87)
La regla general es la siguiente: subir o bajar un índice temporal produce un cambio
de signo, mientras que los índices espaciales pueden subirse o bajarse con abandono.
Como muestran de manera explícita las ecs. (4.86)–(4.87), y como exige la consistencia
matemática, las operaciones de subir y bajar índices son inversas la una de la otra.
La relación que existe entre Aµ y Aµ es análoga a la que existe en Mecánica Cuántica
entre el ket |ψ〉 y el bra 〈ψ|. Ambas son representaciones matemáticas duales de un
único objeto físico.
Definición 4.48 (Magnitud de un 4-vector). La magnitud al cuadrado de un 4-vector
(ya sea contravariante, Aµ , o covariante, Aµ ) es definida como
A2 = Aµ Aµ . (4.88)
Equivalentemente, podemos escribir
2
A2 = ηµν Aµ Aν = − A0 + Ai Ai , (4.89)
2 2
A = η Aµ Aν = − (A0 ) + Ai Ai .
µν
(4.90)
Note que, sin importar lo que pueda sugerir la notación, A2 puede ser positivo, negativo
o cero, incluso para un 4-vector no nulo.
Definición 4.49 (Tipos de 4-vectores). Decimos que un 4-vector no nulo es tipo tiempo,
tipo luz (o nulo) o tipo espacio, según su magnitud al cuadrado sea negativa, cero, o
positiva. La tabla 4.3 resume la situación.

Ejemplo 4.50. Los 4-vectores constantes


Aµ = (5, 4, 0, 0) , B µ = (4, 5, 0, 0) , C µ = (1, 1, 0, 0) , (4.91)
son, respectivamente, tipo tiempo, tipo espacio y nulo o tipo luz, ya que Aµ Aµ = −9,
Bµ B µ = 9 y Cµ C µ = 0.

87
Capítulo 4. Introducción al cálculo tensorial

Ejemplo 4.51. El intervalo espacio-temporal entre dos eventos infinitesimalmente pró-


ximos, ds2 = ηµν d x µ d x ν , puede entenderse como la magnitud al cuadrado del 4-vector
d x µ . La clasificación de separaciones entre eventos como tipo tiempo, tipo espacio y
nula o tipo luz que dimos en la sección 2.4 (ver definiciones 2.4, 2.5 y 2.6) se corres-
ponde exactamente con la clasificación de tipos de 4-vectores que hemos introducido
en la definición 4.49.

Matrices y tensores de orden 2. Hay cuatro configuraciones posibles para los índices
de un tensor de orden 2; Aµν , B µν , Cµ ν y Dµν , y todos ellas pueden representarse como
matrices. La convención que usamos es la siguiente: el primer índice del tensor (µ,
en todos estos casos) corresponde siempre a la fila, sin importar si es un superíndice
o un subíndice. Similarmente, el segundo índice del tensor (ν, en todos estos casos)
corresponde siempre a la columna, sin importar si es un superíndice o un subíndice.
Cuando representamos un tensor de orden 2 como una matriz, a menudo distinguimos
entre índices temporal y espaciales. Por ejemplo, escribimos
 0
M 0 M 0j

” —
M ν =
µ
. (4.92)
M i0 M ij
µν
La matriz transpuesta corresponde a intercambiar filas con columnas: AT = Aνµ ,
ν µ
B T µ = B νµ , C T ν = Cν µ y DµνT
= Dνµ . Por ejemplo,
 

 
T
0 T
 j – 0 j
M M M M
™
ν 0 0
” —
MT µ =  0 0  = . (4.93)

T 0 T j 0 j
M i M i M i
M i

Para representar matricialmente un producto como Aµ σ B σν es necesario ser extrema-


damente cuidadoso con los índices, como muestra la siguiente ecuación:
 0
B 0 B0j
 0
A 0 A0 k

” —
A σB ν =
µ σ
. (4.94)
Ai 0 Ai k B k0 B k j
Ejemplo 4.52. Llamando
” — ”  ν—
η = ηµν , Λ = Λµν , ΛT = ΛT , (4.95)
 
µ

es posible escribir la condición [cf. ec. (4.83)] Λρµ Λσν ηρσ = ηµν en la forma matricial
Λ T ηΛ = η (compare con R T 1R = 1 para rotaciones ortogonales).
Ejemplo 4.53 (Rotación espacial). Las componentes matriciales de la transformación
de Lorentz correspondiente a una rotación espacial son
Λ00 = 1, Λ0 j = 0, (4.96)
Λi 0 = 0, Λi j = R i j , (4.97)
donde R i j son las componentes de la matriz de rotación tridimensional, que satisfacen
R ik R jk = δi j .

88
4.4. Tensores en el espacio-tiempo de Minkowski

Ejemplo 4.54 (Boost en una dirección arbitraria). Las componentes matriciales de la


transformación de Lorentz correspondiente a un boost con velocidad V~ = V n̂ son (ver
sección 3.4)

Λ00 = Γ , Λ0 j = −Γ Vj , (4.98)
i i
Λ 0 = −Γ Vi , Λ j = δi j + (Γ − 1) ni n j , (4.99)
−1/2
donde Γ = 1 − V 2 es el factor de Lorentz. En términos de los proyectores para-
lelo y perpendicular a n̂ (ver ejemplo 4.16), las componentes espaciales de Λ pueden
escribirse en la forma
k
Λi j = Pi⊥j + Γ Pi j . (4.100)
Esta ecuación muestra directamente que no existe contracción de la longitud en la
dirección perpendicular al boost.

Definición 4.55 (D’Alembertiano). El operador de D’Alembert, también llamado ope-


rador de onda o D’Alembertiano, es un operador diferencial escalar definido como

∂2
ƒ = −∂ µ ∂µ = −ηµν ∂µ ∂ν = − ∇2 . (4.101)
∂t 2

Al ser un operador escalar, el D’Alembertiano no cambia el orden de un campo tensorial,


pudiendo ser aplicado a campos escalares, vectoriales o tensoriales.

Estando definido como una contracción tensorial de derivadas parciales, el D’Alem-


bertiano es automáticamente invariante bajo transformaciones de Lorentz. En particu-
lar, esto significa que la ecuación de onda para ondas que se propagan con la velocidad
de la luz,
∂ 2φ
ƒφ = − ∇2 φ = 0, (4.102)
∂ t2
tiene la misma forma en todos los marcos de referencia inerciales relacionados entre sí
a través de transformaciones de Lorentz (asumiendo que φ es una cantidad tensorial).
Dicho de otra manera, las ondas que se propagan a la velocidad de la luz en un marco
se propagan a la velocidad de la luz en todos los marcos.

Ejemplo 4.56 (Gravitación newtoniana). La fuerza de Coulomb F E entre dos cargas


puntuales q1 y q2 y la fuerza de gravedad newtoniana FG entre dos masas puntuales
m1 y m2 separadas una distancia r tienen exactamente la misma forma matemática:

1 q1 q2 m1 m2
FE = , FG = G , (4.103)
4πε0 r 2 r2

donde G = 6,674 × 10−11 N m2 /kg2 es la constante de Newton. La única diferencia


importante entre ambas fuerzas es que las cargas pueden ser positivas o negativas, ge-
nerando fuerzas eléctricas de atracción o repulsión, mientras que las masas son siempre

89
Capítulo 4. Introducción al cálculo tensorial

positivas, con una fuerza gravitacional que es siempre de atracción. En electrodinámi-


ca, interpretamos la fuerza eléctrica como la acción de un campo eléctrico E~ sobre una
carga de prueba q, con F~E = q E~. En la teoría newtoniana de la gravitación, podemos
también interpretar la fuerza gravitacional como la acción de un campo gravitacional
g~ sobre una masa de prueba m, con F~G = m~ g . Al igual como derivamos la fuerza de
Coulomb a partir de la ley de Gauss, podemos escribir una “ley de Gauss gravitacional”
a partir de la cual derivamos la ley de gravitación universal de Newton,

∇ · g~ = −4πGρ, (4.104)

donde ρ es la densidad de masa y el signo negativo del lado derecho corresponde a la


naturaleza siempre atractiva de la interacción gravitacional. Como la fuerza gravitacio-
nal es conservativa, podemos definir un potencial gravitacional φ, análogo al potencial
electrostático, tal que g~ = −∇φ. La ley de Gauss gravitacional (4.104) resulta entonces
ser equivalente a la ecuación de Poisson,

∇2 φ = 4πGρ. (4.105)

Al no incluir derivadas temporales, la ecuación de Poisson (4.105) no es covariante bajo


transformaciones de Lorentz, y es por lo tanto incompatible con la teoría especial de
la relatividad. En términos más físicos, la ecuación de Poisson predice la propagación
instantánea de los efectos gravitacionales, contradiciendo el resultado relativista que
nada puede viajar más rápido que la luz. Los esfuerzos de Einstein por incorporar la
gravedad en un contexto relativista culminaron en 1915 con la formulación de la Teoría
General de la Relatividad. El capítulo 7 de la Ref. [25] tiene una discusión interesante
sobre los intentos fallidos por incorporar la gravitación en relatividad especial.

Problemas
1. Use los generadores de rotaciones espaciales (representados como matrices de
3 × 3),
     
0 0 0 0 0 −1 0 1 0
Jx =  0 0 1  , Jy =  0 0 0  , Jz =  −1 0 0  , (4.106)
0 −1 0 1 0 0 0 0 0

para demostrar la fórmula de rotación de Rodrigues,


2
R = exp θ ê · J~ = 1 + sin θ ê · J~ + (1 − cos θ ) ê · J~ , (4.107)
 

donde ê es un vector unitario que representa el eje respecto del cual se realiza la
rotación, y θ es el ángulo de rotación.

90
Problemas

2. Los generadores del grupo de Lorentz, representados (por ejemplo) como matri-
ces de 4 × 4, sirven como base para un espacio vectorial 6-dimensional, llamado
álgebra de Lie del grupo de Lorentz y denotado por L. Defina el producto interno
entre elementos de este espacio vectorial en la forma

1
〈A, B〉 = Tr (AB) . (4.108)
2

a) Calcule las componentes de la métrica de Killing

Kab = 〈Ga , G b 〉 , (4.109)

donde Ga denota un generador cualquiera del grupo, con a, b = 1, . . . , 6.


Escriba su resultado como una matriz de 6 × 6.
b) Determine las componentes de la métrica de Killing inversa, K ab . Por defi-
nición, estas satisfacen K ac Kc b = δ ab .
c) Muestre que si escribimos A = Aa Ga para A ∈ L, entonces las componentes
Aa están dadas por
Aa = K ab 〈G b , A〉 . (4.110)

3. Calcule los conmutadores [A, B] = AB − BA entre todos los generadores del grupo
de Lorentz. Escriba su resultado como una combinación lineal de elementos del
álgebra de Lie L (ver problema 2).

4. Muestre explícitamente cómo a partir de una matriz del grupo de Lorentz restrin-
gido, Λ0 ∈ SO+ (3, 1), junto con las transformaciones de paridad P e inversión
temporal T ,

1 0 0 0 −1 0 0 0
   
 0 −1 0 0   0 1 0 0 
P = , T = , (4.111)
0 0 −1 0  0 0 1 0 
0 0 0 −1 0 0 0 1

es posible generar una matriz cualquiera del grupo de Lorentz, Λ ∈ O (3, 1).

5. El grupo cociente O (3, 1) /SO+ (3, 1) = {1, P, T, P T }, donde P y T son las transfor-
maciones de paridad e inversión temporal, representadas respectivamente por las
matrices (4.111), se obtiene identificando elementos de O (3, 1) que pueden ob-
tenerse unos a partir de otros a través de transformaciones de SO+ (3, 1). Muestre
que:

a) {1, P, T, P T } es, en efecto, un grupo.


b) {1, P, T, P T } es isomorfo al grupo de Klein, o Vierergruppe.

91
Capítulo 4. Introducción al cálculo tensorial

Ayuda: La tabla de multiplicación del grupo de Klein, V = {e, a, b, c}, es


e a b c
e e a b c
a a e c b (4.112)
b b c e a
c c b a e

6. Demuestre las siguientes identidades vectoriales:

a) a~ d~ · ~b × ~c + ~b d~ · ~c × a~ + ~c d~ · a~ × ~b = d~ a~ · ~b × ~c
   

a~ · ~e a~ · f~ a~ · g~
b) a~ · ~b × ~c ~e · f~ × g~ = ~b · ~e ~b · f~ ~b · g~
 

~c · ~e ~c · f~ ~c · g~
2
c) a~ × ~b, ~b × ~c , ~c × a~ = a~, ~b, ~c
d) d~ × a~ × ~b · (~ a × ~c ) = a~, ~b, ~c a~ · d~
 

donde
a~, ~b, ~c = a~ · ~b × ~c = a~ × ~b · ~c . (4.113)
 

7. Demuestre las siguientes identidades del cálculo vectorial:

a) ∇ · a~ × ~b = ~b · ∇ × a~ − a~ · ∇ × ~b


b) ∇ × a~ × ~b = a~∇ · ~b − ~b∇ · a~ + ~b · ∇ a~ − (~ a · ∇) ~b
 

a · ∇) ~c − a~ · ~b · ∇ ~c
c) a~ × ~b · (∇ × ~c ) = ~b · (~
 

d) ∇ × (∇ × a~) = ∇ (∇ · a~) − ∇2 a~

8. Si A~ y B
~ son vectores, muestre que C~ = A~ × B
~ es un pseudovector, i.e., muestre
que su ley de transformación bajo rotaciones es

Ci0 = det (R) R i j C j . (4.114)

9. Use notación tensorial para escribir las relaciones de conmutación del álgebra
del grupo de Lorentz que determinó en el problema 3 de manera más compacta.

10. Decimos que un operador lineal P es un proyector si satisface la relación P 2 = P.

a) Si P es un proyector, demuestre que 1− P, donde 1 es el operador identidad,


también lo es.
b) Muestre que P (1 − P) = (1 − P) P = 0.
k
c) Si n̂ es un vector unitario, muestre que el tensor Pi j = ni n j , entendido como
k k
un operador que mapea vectores en vectores de acuerdo a Ai = Pi j A j , es un
proyector.

92
Problemas

k k
d) Dé una interpretación geométrica a Pi j y a Pi⊥j = δi j − Pi j .

11. Sea Aµ un 4-vector contravariante. Use un contraejemplo para mostrar que la con-
tracción Aµ Aµ (con ambos índices arriba) no es invariante bajo transformaciones
de Lorentz.

12. Demuestre que si Aµ es un vector y Fµν es un tensor antisimétrico, entonces

Bµν = ∂µ Aν − ∂ν Aµ , (4.115)
Gλµν = ∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ (4.116)

son tensores, incluso bajo transformaciones no lineales.

13. ”Una transformación


— de Lorentz puede representarse a través de una matriz Λ =
Λ ν que satisface
µ

ηρσ Λρµ Λσν = ηµν . (4.117)


2
a) Muestre que Λ00 ≥ 1.
 ν
b) Defina Λ T µ = Λνµ y reescriba la ec. (4.117) en forma matricial.

c) Demuestre que [det (Λ)]2 = 1.

14. Visualice una transformación de Lorentz Λ como una matriz de 4 × 4,


– 0
Λ 0 Λ0 j
™
” —
µ
Λ= Λ ν = . (4.118)
Λi 0 Λi j

Demuestre que la matriz inversa puede escribirse en la forma


 0 0  – j ™
Λ−1 0 Λ−1 j Λ00 −Λ 0
Λ−1 =  i i  = j
. (4.119)
Λ−1 Λ−1 −Λ0i Λ i
0 j

15. Considere el grupo de rotaciones ordinarias en el espacio euclidiano tridimen-


sional, O(3). Suplementadas con la ecuación t 0 = t, estas rotaciones forman un
subgrupo del grupo de Lorentz. Muestre que:

a) Si aplicamos una rotación al vector V µ , V 0 transforma como un escalar, y


V i transforma como un vector de O(3).
b) Si aplicamos una rotación al tensor T µν , T 00 transforma como un escalar, T 0i
y T i0 transforman como vectores, T i j transforma como un tensor, y εi jk T jk
transforma como un pseudovector de O(3).

93
Capítulo 4. Introducción al cálculo tensorial

94
Capítulo 5

Cinemática relativista

En este capítulo establecemos las bases de la descripción matemática del movimien-


to en la teoría especial de la relatividad.

5.1. Líneas de mundo


Como se sugiere en la figura 5.1, cualquier partícula, sin importar su estado de
movimiento (o si está en reposo) describe una trayectoria en el espacio-tiempo.

Definición 5.1 (Línea de mundo). La línea de mundo (“worldline”) de una partícula


es la trayectoria seguida por la partícula en el espacio-tiempo. Usamos el tiempo pro-
pio del observador montado en esta línea de mundo como parámetro para describir
matemáticamente esta trayectoria a través de las cuatro funciones

t = t (τ)


 x = x (τ)

x µ = x µ (τ) ⇔ (5.1)

 y = y (τ)
z = z (τ)

El intervalo espacio-temporal entre dos eventos infinitesimalmente cercanos sobre


la línea de mundo, con coordenadas x µ (τ) y x µ (τ + dτ) = x µ (τ) + d x µ , respectiva-
mente, está dado por

ds2 = −d t 2 + d x 2 + d y 2 + dz 2 = ηµν d x µ d x ν = −dτ2 . (5.2)

En particular, esta ecuación muestra explícitamente que el intervalo de tiempo propio


dτ medido por el observador montado sobre la línea de mundo es invariante bajo
transformaciones de Lorentz.

95
Capítulo 5. Cinemática relativista

(a) (b) (c)


Figura 5.1: Líneas de mundo de (a) una partícula en reposo, (b) una partícula con
velocidad constante, y (c) una partícula con velocidad variable.

5.2. 4-Velocidad
Definición 5.2 (4-velocidad). Sea x µ (τ) una parametrización de la línea de mundo
de una partícula, con τ su tiempo propio. La 4-velocidad de la partícula está definida
por
d xµ
uµ = . (5.3)

Dado que d x µ es un 4-vector y dτ es un escalar de Lorentz, la 4-velocidad así definida
resulta ser un 4-vector. De manera análoga al caso tridimensional, este 4-vector es
siempre tangente a la línea de mundo. Con nuestra convención de medir tiempos y
distancias en la misma unidad, la 4-velocidad es adimensional (al igual que todas las
velocidades).

Explícitamente, las componentes de la 4-velocidad son

d t d x d y dz
 ‹
u =
µ
, , , . (5.4)
dτ dτ dτ dτ

Para establecer una conexión con la velocidad ordinaria, vi = d x i /d t, escribimos


la ec. (5.2) en la forma
‹2 ‹2 ‹2 ‹2
dx dy dz dτ
   
−1+ + + =− (5.5)
dt dt dt dt

Despejando d t/dτ, hallamos


dt
= γ, (5.6)

donde γ es el factor de Lorentz calculado a partir de la velocidad ordinaria de la par-
tícula, vi = d x i /d t. Esta ecuación expresa la dilatación del tiempo, mostrando que el

96
5.2. 4-Velocidad

intervalo de tiempo coordenado d t es mayor en un factor γ que el intervalo de tiempo


propio dτ.
Como d t/dτ = γ ≥ 1 > 0, la función t (τ) es siempre creciente, y por lo tanto
es invertible. Vamos a utilizar la ec. (5.6) y la regla de la cadena para reescribir las
derivadas respecto de τ como derivadas totales respecto de t de acuerdo a la regla
d d
=γ . (5.7)
dτ dt
Aplicando la ec. (5.7) a las componentes de la 4-velocidad, hallamos
dt d x d y dz
 ‹
u = 1, , , = γ 1, vx , v y , vz . (5.8)
µ

dτ dt dt dt
A menudo escribiremos, de manera más compacta,
uµ = γ (1, vi ) = γ (1, ~
v) , (5.9)
o, equivalentemente,
u0 = γ, ui = γvi . (5.10)
A partir de la ec. (5.2) podemos establecer también que la magnitud al cuadrado
de la 4-velocidad es siempre igual a −1:
d xµ d xν
uµ uµ = ηµν = −1. (5.11)
dτ dτ
Esto quiere decir que la 4-velocidad es un 4-vector tipo tiempo. La ec. (5.11) tam-
bién puede interpretarse como un constraint1 entre las cuatro componentes de la 4-
velocidad. En particular, esto significa que la 4-velocidad solo tiene tres componentes
independientes, las cuales pueden identificarse con las tres componentes de la veloci-
dad ordinaria.
La 4-velocidad tiene implícita cierta redundancia, porque usa 4 números para des-
cribir un objeto con solo 3 grados de libertad. Este es el precio que pagamos por la
covariancia de Lorentz. En relatividad especial y general, así como también en la teoría
relativista de campos, a menudo encontramos que vale la pena usar una representación
redundante si con eso ganamos covariancia, como en este caso.
Definición 5.3 (Marco comóvil instantáneo). Consideremos una partícula P cuyo mo-
vimiento es registrado desde un marco de referencia inercial K. En cierto instante t,
la velocidad de P medida en K es ~ v . El marco de referencia inercial K 0 que se mueve
respecto de K con velocidad V~ = ~v es llamado marco comóvil instantáneo (MCI) de P
en el instante t.
Es importante notar que el MCI K 0 se mueve con velocidad constante respecto de
K, por lo que, en general, será comóvil con la partícula P solo en el instante t en que
sus velocidades coinciden.
1
Un constraint es una ligadura, i.e., una relación funcional entre variables que las hace dependientes
entre sí.

97
Capítulo 5. Cinemática relativista

Sea K 0 el MCI de una partícula. En este marco, las componentes de su 4-velocidad


v 0 = 0, γ0 = 1]
son [cf. ec. (5.9), con ~

u0µ = (1, 0, 0, 0) . (5.12)

En particular, resulta trivial establecer que, en el marco K 0 , la magnitud al cuadrado


de la 4-velocidad es
u0µ u0µ = −1. (5.13)
Como esta es una ecuación tensorial, tiene la misma forma en todos los marcos. De
aquí concluimos que uµ uµ = −1 también en K.

5.3. 4-Aceleración
Definición 5.4 (4-aceleración). La 4-aceleración de una partícula es
duµ
αµ = . (5.14)

Dado que uµ es un 4-vector y dτ es un escalar de Lorentz, la 4-aceleración así definida
resulta ser un 4-vector. Con nuestra convención de medir tiempos y distancias en la
misma unidad, por ejemplo, en segundos, la 4-aceleración se mide en s−1 .
Ejemplo 5.5 (Conversión de unidades para la aceleración). La aceleración de caída
libre cerca de la superficie de la Tierra, g = 9,81 m/s2 , es igual a

9,81 m/s2 3600 s 24 h 365 días


g= × × × = 1,03 años−1 . (5.15)
299 792 458 m/s 1h 1 día 1 año
Note cómo usamos el factor de conversión c = 299 792 458 m/s = 1 para pasar de
unidades convencionales (m/s2 ) a unidades de tiempo−1 .
Para determinar de manera explícita las componentes de la 4-aceleración, reem-
plazamos en la definición (5.14) las componentes de la 4-velocidad, uµ = γ (1, vi ), y
usamos la ec. (5.7) para cambiar las derivadas respecto de τ por derivadas respecto de
t:
d dγ dγ
 ‹
µ
α = γ (γ, γvi ) = γ , vi + γai , (5.16)
dt dt dt
donde ai = d vi /d t son las componentes de la aceleración ordinaria. Calculamos ahora
dγ/d t, teniendo presente que v 2 = vi vi :
dγ d −1/2 1 −3/2 d −3/2
= 1 − v2 = − 1 − v2 (−vi vi ) = 1 − v 2 vi ai . (5.17)
dt dt 2 dt
Este resultado puede escribirse en la forma más compacta

= γ3 vi ai = γ3 ~
v · a~. (5.18)
dt

98
5.3. 4-Aceleración

Reemplazando la ec. (5.18) en las componentes de la 4-aceleración, encontramos

αµ = γ4 v j a j , γ4 v j a j vi + γ2 ai = γ4 ~
v · a~, γ4 (~ v + γ2 a~ ,
v · a~) ~ (5.19)
  

o, equivalentemente,

α0 = γ4 v j a j , αi = γ4 v j a j vi + γ2 ai . (5.20)

Note que las componentes espaciales de la 4-aceleración son una combinación lineal de
la velocidad y aceleración ordinarias, por lo que su dirección no coincide, en general,
con la de ninguna de ellas.
Sea K 0 el marco comóvil instantáneo de una partícula. De acuerdo a la ec. (5.12),
y consistentemente con la definición 5.3, tenemos que su velocidad ordinaria en K 0
se anula. Sin embargo, como K 0 se mueve con velocidad constante respecto de K, en
general no es cierto que la aceleración ordinaria de la partícula deba ser cero en K 0 .
Reemplazando vi0 = 0, γ0 = 1 y manteniendo ai0 6= 0 en la ec. (5.19), hallamos

α0µ = 0, ai0 . (5.21)




La aceleración ai0 es llamada aceleración propia de la partícula.

Definición 5.6 (Aceleración propia). Llamamos aceleración propia de una partícula a


la aceleración medida en su marco comóvil instantáneo.

Sea a~0 la aceleración propia de una partícula. En el MCI, la magnitud al cuadrado


de la 4-aceleración es α02 = α0µ α0µ = a~0 · a~0 = a02 . Como α0µ α0µ es invariante de Lorentz,
hemos encontrado que la magnitud de la aceleración propia puede calcularse a través
de la magnitud de la 4-aceleración en cualquier marco,

a02 = αµ αµ . (5.22)

Excluyendo el caso αµ = 0, la magnitud al cuadrado de la 4-aceleración es siempre


positiva, por lo que αµ resulta ser un 4-vector tipo espacio.
Para determinar la magnitud de la aceleración propia en términos de la velocidad
y la aceleración ordinarias en un marco de referencia arbitrario, calculamos explícita-
mente la magnitud al cuadrado de αµ [cf. ec. (5.19)]:

a02 = α0 α0 + αi αi
= − γ4 vi ai γ4 v j a j + γ4 v j a j vi + γ2 ai γ4 vk ak vi + γ2 ai
   

= −γ8 vi ai v j a j + v 2 γ8 vi ai v j a j + 2γ6 vi ai v j a j + γ4 a2
= γ6 2 − 1 − v 2 γ2 (~ v · a~)2 + γ4 a2 .
  

Notando que 1 − v 2 γ2 = 1, podemos escribir




v · a~)2 .
a02 = γ4 a2 + γ2 (~ (5.23)
 

99
Capítulo 5. Cinemática relativista

Por improbable que parezca, esta expresión es invariante de Lorentz, i.e., tiene el mis-
mo valor en todos los marcos de referencia inerciales.
En el marco comóvil instantáneo, la 4-velocidad y la 4-aceleración adoptan las for-
mas simplificadas

u0µ = (1, 0) , α0µ = (0, a~0 ) , (5.24)

donde a~0 es la aceleración propia de la partícula. En este marco, resulta trivial esta-
blecer que el producto punto entre ambos 4-vectores es cero, α0µ u0µ = 0. Sin embargo,
como esta es una ecuación tensorial, su validez se extiende a todos los marcos de refe-
rencia inerciales:
αµ uµ = 0. (5.25)
Luego, la 4-velocidad y la 4-aceleración de una partícula son siempre perpendiculares
entre sí, y esta afirmación es válida en todos los marcos.
La ecuación αµ uµ = 0 puede interpretarse como un constraint entre las componen-
tes de la 4-velocidad y la 4-aceleración, de manera similar a como uµ uµ = −1 representa
una ligadura entre las componentes de la 4-velocidad. En particular, esto significa que
la 4-aceleración tiene solo tres componentes independientes, las cuales pueden identi-
ficarse con las tres componentes independientes de la aceleración ordinaria. Una vez
más, redundancia a cambio de covariancia.
Ejemplo 5.7 (Interpretación gráfica de αµ uµ = 0). La naturaleza hiperbólica del espa-
cio-tiempo de Minkowski hace que la noción de perpendicularidad entre dos 4-vectores
difiera de la idea de perpendicularidad entre dos vectores en el espacio euclidiano tri-
dimensional. Por ejemplo, para una partícula moviéndose a lo largo del eje x en un
marco K dado, la condición αµ uµ = 0 implica α0 /α1 = u1 /u0 . Esto significa que, al
dibujar los 4-vectores sobre un plano euclidiano, el ángulo entre uµ y el eje t es igual
al ángulo entre αµ y el eje x, como se ilustra en la parte izquierda de la figura 5.2. Equi-
valentemente, observamos que ambos 4-vectores hacen ángulos iguales con el borde
del cono de luz, con la 4-velocidad (tipo tiempo) dentro del cono y la 4-aceleración
(tipo espacio) fuera del cono.
Sea K 0 el marco comóvil instantáneo de esta partícula. Con u0µ = (1, 0) y α0µ =
(0, a~0 ), estos dos 4-vectores son también ortogonales en el sentido euclidiano. Inter-
pretando el boost K 7→ K 0 de manera activa (ver sección 3.2), podemos visualizar la
4-velocidad y la 4-aceleración como se muestra en la parte central de la figura 5.2.
En esta interpretación, los ejes t y x permanecen fijos y los 4-vectores cambian. En
la interpretación pasiva del boost, mantenemos fija la 4-velocidad y cambiamos la 4-
aceleración y los ejes, produciendo una rotación del cono de luz. La situación resultante
se muestra en la parte derecha de la figura 5.2. En K 0 , la 4-velocidad siempre apunta
hacia el centro del cono de luz y la 4-aceleración siempre se dirige perpendicularmente
hacia afuera.

Ejemplo 5.8 (Movimiento rectilíneo). Un movimiento es rectilíneo cuando la velocidad


v · a~ = ±va (el
y la aceleración ordinarias son paralelas o antiparalelas, de manera que ~

100
5.4. Movimiento hiperbólico

uµ u0µ u0µ

αµ

α0µ

α0µ

Figura 5.2: Izquierda: 4-velocidad y 4-aceleración de una partícula en un marco K.


Centro: Marco comóvil instantáneo, punto de vista activo. Derecha: Marco comóvil
instantáneo, punto de vista pasivo.

signo es positivo si apuntan en la misma dirección, y negativo si apuntan en direcciones


opuestas). Reemplazando en la ec. (5.23), hallamos

a02 = γ4 a2 + γ2 v 2 a2 = γ6 a2 , (5.26)


de donde obtenemos
a0 = γ3 a. (5.27)
Luego, en un movimiento rectilíneo, la magnitud de la aceleración propia es γ3 veces
la magnitud de la aceleración ordinaria.

Ejemplo 5.9 (Movimiento circular uniforme). En un movimiento circular uniforme, la


v · a~ = 0. Reemplazando
aceleración es puramente centrípeta, de manera que tenemos ~
2 4 2
en la ec. (5.23), hallamos a0 = γ a , de donde obtenemos

a0 = γ2 a. (5.28)

Luego, en un movimiento circular uniforme, la magnitud de la aceleración propia es


γ2 veces la magnitud de la aceleración ordinaria.

5.4. Movimiento hiperbólico


Uno de los movimientos más sencillos es aquel con ocurre en línea recta con ace-
leración propia constante. Es importante aclarar que es solo la aceleración propia, i.e.,
aquella medida en el marco comóvil instantáneo, la que se mantiene constante. La
afirmación sin condiciones “movimiento con aceleración constante” es ambigua en Re-
latividad, pues de inmediato surge la pregunta: ¿constante en qué marco? La elección
del MCI nos permite darle un sentido invariante a la respuesta, pues en todos los mar-
cos tendremos a02 = const.

101
Capítulo 5. Cinemática relativista

A diferencia de lo que ocurre en la física no relativista, donde una partícula con


aceleración constante realiza un movimiento parabólico, en nuestro caso el movimiento
resulta ser hiperbólico, como detallamos a continuación.
Para simplificar, escogemos el marco K donde vamos a describir el movimiento de
manera que el eje x coincida con la dirección en que viaja la partícula. Esto significa
que la 4-velocidad toma la forma [cf. ec. (5.9)]

uµ = (γ, γv, 0, 0) , (5.29)

donde v es la velocidad ordinaria de la partícula en K y γ es el factor de Lorentz


asociado. Escribiendo
γ γ γv 0 0 1
    
 γv   γv γ 0 0  0 
 0 = 0 , (5.30)
0 1 0  0 
0 0 0 0 1 0

podemos interpretar uµ como la 4-velocidad que obtenemos realizando un boost inverso


desde el MCI K 0 , donde u0µ = (1, 0, 0, 0). Poniendo v = tanh φ, la 4-velocidad adopta
la forma
uµ = [cosh φ (τ) , sinh φ (τ) , 0, 0] , (5.31)
donde hemos escrito φ (τ) para resaltar el hecho que el MCI es distinto en cada ins-
tante, de manera que el parámetro φ puede ser pensado como una función del tiempo
propio τ. La ec. (5.31) funciona como un ansatz para la 4-velocidad, que queda com-
pletamente determinada a través de la función (aún desconocida) φ (τ).
Derivando la ec. (5.31) obtenemos la 4-aceleración:

αµ = [sinh φ (τ) , cosh φ (τ) , 0, 0] . (5.32)

La magnitud al cuadrado de la aceleración propia es
‹2


a02 = αµ α =µ
, (5.33)

de donde obtenemos la ecuación

= a0 = const. (5.34)

La solución de esta ecuación es, simplemente, φ = a0 τ, donde hemos escogido la
condición inicial φ (0) = 0. Reemplazando, obtenemos la 4-velocidad y la 4-aceleración
como funciones de τ:

uµ = [cosh (a0 τ) , sinh (a0 τ) , 0, 0] , (5.35)


α = a0 [sinh (a0 τ) , cosh (a0 τ) , 0, 0] .
µ
(5.36)

102
5.4. Movimiento hiperbólico

El lector puede comprobar fácilmente que estos 4-vectores satisfacen las condiciones
uµ uµ = −1, uµ αµ = 0 y αµ αµ = a02 para todo τ. Note que nuestra elección para la
condición inicial implica que la partícula comienza su movimiento desde el reposo en
τ = 0, pues uµ (0) = (1, 0, 0, 0). Integrando la 4-velocidad, encontramos
1
xµ = [sinh (a0 τ) , cosh (a0 τ) , 0, 0] , (5.37)
a0

donde hemos escogido la condición inicial x µ (0) = (0, 1/a0 , 0, 0). Explícitamente, esta-
mos describiendo el movimiento de la partícula a través de las ecuaciones paramétricas
1 1
t= sinh (a0 τ) , x= cosh (a0 τ) . (5.38)
a0 a0

(Note que a0−1 sirve como escala espacial y temporal). Elevando al cuadrado y restando,
podemos escribir la ecuación de la trayectoria:
1
x2 − t2 = . (5.39)
a02

La ec. (5.39) muestra que la línea de mundo de la partícula es una hipérbola, como se
ilustra en la figura 5.3. Despejando x como función de t, encontramos
1q
x= 1 + (a0 t)2 . (5.40)
a0

Derivando, obtenemos la velocidad ordinaria como función del tiempo coordenado t,

dx a0 t
v= =Æ , (5.41)
dt 1 + (a0 t)2

que es claramente siempre menor que la velocidad de la luz (ver figura 5.4). Note
que |v| → 1 cuando t → ∞. A partir de la ec. (5.35) también es posible expresar la
velocidad ordinaria como función del tiempo propio τ, v = u1 /u0 = tanh (a0 τ).
El límite no relativista se obtiene cuando |a0 t|  1. En este caso, la posición y la
velocidad adoptan las formas conocidas
1 1
x= + a0 t 2 , v = a0 t. (5.42)
a0 2

Estos límites no relativistas se indican con líneas punteadas en las figuras 5.3 y 5.4.
Note que la velocidad no relativista alcanza la velocidad de la luz cuando t = 1/a0 .
Por supuesto, esta aproximación ya ha dejado de ser válida mucho antes.

Ejemplo 5.10. Imagine una nave espacial que pueda mantener una aceleración propia
constante a0 = 1 año−1 de manera indefinida. Esta aceleración les brinda a los pasaje-
ros un agradable campo gravitacional artificial de 9,5 m/s2 , muy similar al de la Tierra.

103
Capítulo 5. Cinemática relativista

1/a0 x

Figura 5.3: Línea de mundo de una partícula en movimiento hiperbólico. La línea pun-
teada curva representa el límite no relativista. Se indica también el punto donde la
partícula no relativista alcanzaría la velocidad de la luz.

0,8

0,6
v

0,4

0,2

0
0 0,5 1 1,5 2 2,5 3
a0 t

Figura 5.4: Velocidad de una partícula en movimiento hiperbólico. La línea punteada


representa el límite no relativista.

104
5.5. Transformación de la velocidad

El viaje comienza en órbita terrestre con velocidad inicial nula. A diferencia de Perse-
verance, el rover de la misión Mars 2020, que tardará siete meses en llegar a Marte,
nosotros alcanzamos la órbita marciana en apenas dos días y medio. Luego de cruzar
sin contratiempos el cinturón de asteroides (la probabilidad de chocar con un asteroide
es, por supuesto, insignificante), llegamos a la órbita de Júpiter 52 horas después. Han
transcurrido 4,7 días desde que salimos de la Tierra y nuestra velocidad es del 1,3 % de
la velocidad de la luz. Juno, la sonda actualmente en órbita a Júpiter, tardó cinco años
en llegar. El nuestro no es, en ningún caso, un viaje de contemplación; 25 días después
de haber salido de la Tierra, estamos tan lejos como el Voyager 1, una de las dos sondas
gemelas lanzadas en 1977 y que son actualmente los emisarios más lejanos enviados
por la humanidad. Vamos al 6,8 % de la velocidad de la luz. El espacio, sin embargo, es
vasto. Luego de 200 días de viaje alcanzamos el 50 % de la velocidad de la luz, pero no
llegaremos a Proxima Centauri, la estrella más cercana al Sol, hasta que hayan trans-
currido 2,3 años desde que salimos de la Tierra. Nuestra velocidad es entonces igual al
98 % de la velocidad de la luz. La Vía Láctea pasa relativamente rápido, y llegamos a la
Galaxia de Andrómeda cuando se cumplen 15 años de viaje. Hace tiempo que nuestra
velocidad, al ser tan cercana a la de la luz, dejó de ser un parámetro interesante. En
su lugar, el factor de Lorentz es γ = 2,5 × 106 , que coincide con la distancia a la Tierra
medida en años. ¿Hasta dónde podemos llegar? Centrada siempre en nosotros mis-
mos, el Universo observable forma una esfera de unos 4,6 × 1010 años de radio. Luego
de 25 años de viaje, nuestro Universo observable ya no incluye la Tierra.
La figura 5.5 muestra una ilustración a escala logarítmica del universo observable.

5.5. Transformación de la velocidad


Habiendo definido la 4-velocidad como un 4-vector [cf. ec. (5.3)], sus componentes
en dos marcos inerciales K y K 0 relacionados entre sí a través de una transformación
de Lorentz Λ están dadas por la ecuación
u0µ = Λµν uν . (5.43)
A modo de ejemplo, vamos a determinar las ecuaciones de transformación explícitas
para la velocidad ordinaria ~v y el factor de Lorentz γ de una partícula para un boost
0
con los marcos K y K en configuración estándar (cf. def. 3.3). En este caso, la matriz Λ
toma la forma [cf. ec. (3.76)]
Γ −Γ V 0 0
 
 −Γ V Γ 0 0 
Λ= , (5.44)
0 0 1 0 
0 0 0 1
donde Γ es el factor de Lorentz asociado a la velocidad V . Escribimos
uµ = γ (1, vi ) , u0µ = γ0 1, vi0 , (5.45)


105
Capítulo 5. Cinemática relativista

Figura 5.5: Ilustración a escala logarítmica del universo observable con el Sistema
Solar en el centro, los planetas interiores, el cinturón de asteroides, los planetas
exteriores, el cinturón de Kuiper, la nube de Oort, Alfa Centauri, el brazo de Per-
seus, la Via Láctea, Andrómeda y las galaxias cercanas, la telaraña cósmica de cú-
mulos galácticos, la radiación de fondo de microondas y el plasma invisible del Big
Bang en el borde. Creada especialmente para [Link] por Pablo Carlos Bu-
dassi. [Link]
logarithmic_illustration.png.

106
5.6. Transformación de la aceleración

y desarrollamos la ec. (5.43) para µ = 0, 1, 2, 3.


Con µ = 0, hallamos
u00 = Λ0ν uν = Λ00 u0 + Λ01 u1 , (5.46)
porque Λ02 = Λ03 = 0. Reemplazando ahora u00 = γ0 , u0 = γ, u1 = γvx , Λ00 = Γ ,
Λ01 = −Γ V , obtenemos [cf. ec. (3.54)]
γ0 = Γ γ (1 − V vx ) . (5.47)
Procediendo de manera análoga con µ = 1, 2, 3, hallamos
vx − V vy vz
vx0 = , v 0y = , vz0 = , (5.48)
1 − V vx Γ (1 − V vx ) Γ (1 − V vx )
donde hemos utilizado la ec. (5.47) para reemplazar γ0 en términos de cantidades no
primadas. Note que las leyes de transformación para las componentes y y z de la velo-
cidad son distintas de la ley de transformación para la componente x. El trato especial
que recibe la componente x es debido, por supuesto, a que el boost que estamos con-
siderando se realiza en esa dirección. La ley de transformación para vx ya la habíamos
deducido en el capítulo 3 a partir de la composición de dos boosts en la misma dirección
[cf. ec. (3.53)], pero las de y y z son nuevas.
En general, la componente de la velocidad paralela al boost transforma de manera
distinta a las componentes perpendiculares. Usando la notación ~ vk y ~
v⊥ para distinguir
entre componentes paralela y perpendicular a V~ (ver ejemplo 4.16), podemos escribir
vk − V~
~ v⊥
~
γ0 = Γ γ 1 − V~ · ~
vk , vk0 = , v⊥0 = . (5.49)

~ ~
1 − V~ · ~
vk Γ 1 − V~ · ~
vk
Una deducción elegante (o, por lo menos, directa) de estas ecuaciones hace uso de las
componentes de un boost en una dirección arbitraria, en particular, de la ec. (4.100).
Note que cuando todas las velocidades involucradas son mucho menores que la ve-
locidad de la luz, recuperamos la ley de suma de velocidades galileana, ~ v0 = ~v − V~
[cf. ec. (1.3)].

5.6. Transformación de la aceleración


Siguiendo el mismo procedimiento delineado en la sección 5.5, podemos establecer
la relación entre la aceleración ordinaria a~ de una partícula medida en un marco K y su
aceleración ordinaria a~0 medida en un marco K 0 que se mueve con velocidad V~ respecto
de K. Obtenemos
a~k
a~k0 = 3 , (5.50)
Γ 3 1 − V~ · ~
vk
a~⊥ a~k · V~
a~⊥0 = 2 + v⊥ ,
3 ~ (5.51)
Γ 2 1 − V~ · ~
vk Γ 2 1 − V~ · ~vk

107
Capítulo 5. Cinemática relativista

a~0
a~0⊥
a~ a~
a~⊥

θ θ0

v
~ a~k a~0
k

Figura 5.6: Para determinar la aceleración propia a~0 de una partícula a partir de su ve-
locidad ~ v y aceleración a~ ordinarias (izquierda), proceda de la siguiente manera. Des-
componga la aceleración a~ en una componente paralela a~k y una componente perpen-
dicular a~⊥ a la velocidad ~ v (centro). Luego, escale a~k por γ3 y a~⊥ por γ2 [cf. ec. (5.52)]
para obtener las componentes de la aceleración propia a~0 paralela y perpendicular a ~ v,
k k
a~0 y a~0⊥ . Use estas componentes para construir a~0 vía a~0 = a~0 + a~0⊥ (derecha). Note que
|~a0 | > |~
a| y θ0 < θ . Se ilustra el caso v = 3/5, γ = 5/4.

donde a~k y a~⊥ son las componentes de la aceleración ordinaria paralela y perpendicular
a V~ , respectivamente.
Note que la abrumadora complejidad de las ecs. (5.50)–(5.51) se obtiene directa-
mente a partir de la ley de transformación para la 4-aceleración, que está dada sim-
plemente por α0µ = Λµν αν . El contraste entre ambas sugiere que el punto de vista
cuadridimensional del espacio-tiempo de Minkowski es, en un sentido profundo, más
simple que el punto de vista tridimensional.
La transformación inversa se obtiene, como siempre, intercambiando cantidades
primadas con cantidades no primadas y reemplazando V~ por −V~ . Cuando K 0 es el
marco comóvil instantáneo de la partícula, esta transformación inversa, con ~ v 0 = 0,
0
a~ = a~0 , V~ = ~
v y Γ = γ, nos permite calcular la aceleración propia de una partícula
a partir de su velocidad y aceleración ordinarias en K (compare con los ejemplos 5.8
y 5.9):
k
a~0 = γ3 a~k , a~0⊥ = γ2 a~⊥ . (5.52)
Como se ilustra en la figura 5.6, la magnitud de la aceleración propia es siempre mayor
que la magnitud de la aceleración ordinaria,
k 2
2
a02 = a0 + a0⊥ = γ6 ak2 + γ4 a⊥2 > ak2 + a⊥2 = a2 , (5.53)


mientras que el ángulo entre la aceleración propia y la velocidad es siempre menor que
el ángulo entre la aceleración ordinaria y la velocidad,
a0⊥ a⊥ a
tan θ0 = = < ⊥ = tan θ . (5.54)
k
a0 γak ak

108
Problemas

Problemas
1. Aplicando un boost con velocidad V~ a la 4-velocidad uµ , deduzca las ecs. (5.49).

2. Aplicando un boost con velocidad V~ a la 4-aceleración αµ , deduzca las ecuacio-


nes (5.50)–(5.51).
Ayuda: Demuestre las identidades

V~ · a~k ~vk = V~ · ~
vk a~k , V~ · a~k V~ = V 2 a~k , (5.55)
  

y úselas para simplificar sus resultados.

3. Muestre que las componentes de la 4-aceleración pueden escribirse en la forma


alternativa
αµ = γ4 [~
v · a~, a~ + ~
v × (~
v × a~)] , (5.56)
donde ~v y a~ son la velocidad y la aceleración ordinarias. A partir de la ec. (5.56),
deduzca una expresión concomitante para a02 = αµ αµ .

4. Defina tensores Pk ν y (P⊥ )µν que actúen como proyectores sobre la dirección
paralela y el hiperplano perpendicular a la 4-velocidad de una partícula, respec-
tivamente.

5. Una fuente de luz omnidireccional está en reposo en un marco K 0 , el cual está


en configuración estándar con un marco K.

a) Considere un fotón en particular, cuya velocidad hace un ángulo θ 0 con el


eje x 0 . En el marco K, ¿cuánto valen las componentes x y y de la velocidad
del fotón? ¿Qué ángulo hace la velocidad del fotón con el eje x?
b) Complete la tabla 5.1 con los valores correspondientes de vx , v y y θ para
V = 3/5.
c) Grafique los vectores velocidad en K cuyas componentes ya tabuló. Compa-
re su resultado con la figura 1.6.
d) Demuestre que todos los fotones que en K 0 tenían velocidades en la di-
rección x 0 positiva están confinados en K al interior del cono definido por
cos θ = V .

6. Dos marcos de referencia, K y K 0 , se encuentran en configuración estándar. En


K 0 , una partícula está momentáneamente en reposo y tiene una aceleración a0
en la dirección y 0 . ¿Cuál es la magnitud y la dirección de su aceleración en K?
En el LHC2 , las partículas circulan con rapidez v = 0,999 999 991 alrededor de
un anillo subterráneo de 26 659 m de circunferencia. Encuentre la magnitud de
su aceleración propia.
2
El Gran Colisionador de Hadrones (Large Hadron Collider, LHC) es el mayor acelerador de partículas
del mundo.

109
Capítulo 5. Cinemática relativista

θ0 vx vy θ
0◦
15◦
30◦
..
.
345◦

Tabla 5.1: Llene esta tabla con los valores de vx , v y y θ cuando V = 3/5. Ver problema 5.

7. En un marco de referencia dado, una partícula A se mueve hiperbólicamente con


aceleración propia a0 , habiendo comenzado en reposo en t = 0. En t = 0, un
fotón B es emitido en la misma dirección, una distancia 1/a0 por detrás de A.
Muestre que, en los sucesivos marcos de referencia donde A está instantánea-
mente en reposo, la distancia AB es siempre igual a 1/a0 .

8. Sea Aµ un 4-vector tipo tiempo. En un marco K dado, las componentes de Aµ son


Aµ = A0 , Ai .


a) Demuestre que siempre es posible encontrar un marco K 0 donde A0i = 0.


¿Con qué velocidad se mueve K 0 respecto de K?
b) ¿Cuánto vale A00 ?
c) ¿Por qué es importante que Aµ sea tipo tiempo?

9. Discuta el concepto de “marco comóvil instantáneo” para un fotón.

10. Alice y Bob son una pareja de hermanos gemelos. El día de su cumpleaños núme-
ro 20, Alice comienza un viaje en una nave espacial mientras Bob se queda en la
Tierra. La nave se mueve en línea recta con aceleración propia constante durante
cinco años (según le parece a Alice); luego desacelera durante cinco años, se da
la vuelta, acelera por otros cinco años, desacelera por cinco años más, y vuelve a
la Tierra. Para mantener cómodos a sus ocupantes, la magnitud de la aceleración
es siempre igual a a0 = 1 año−1 = 9,5 m/s2 . Alice tiene ahora 40 años.

a) ¿Qué edad tiene ahora Bob?


b) ¿A qué distancia máxima de la Tierra llegó a estar Alice?
c) Use su paquete favorito de software para graficar la trayectoria de Alice.
Pruebe también con tiempos de viaje más cortos.

11. En el marco K 0 , que se mueve con velocidad ~


v relativo a K, un tensor Tµν tiene una
0
sola componente no nula, T00 = 1. ¿Cuáles son sus componentes en el sistema
K? Ayuda: Antes de hacer el cálculo, trate de adivinar el resultado.

110
Problemas

12. a) Una partícula se mueve en línea recta con aceleración propia a0 = const. Si
uµ y αµ son su 4-velocidad y 4-aceleración, y τ es el tiempo propio, muestre
que
dαµ
= a02 uµ . (5.57)

b) Recíprocamente, muestre que la ec. (5.57), sin la información que a0 es la
aceleración propia, o que es constante, implica ambas cosas.
c) Finalmente, muestre, integrando, que la ec. (5.57) resulta en movimiento
rectilíneo en un marco de referencia apropiado, i.e., movimiento hiperbóli-
co.

13. Muestre que la ec. (5.57) es equivalente a la ecuación vectorial

d
γ3 a~ = 0, (5.58)

dt
la cual es por lo tanto válida en todos los marcos de referencia inerciales si es
válida en alguno. Concluya que el movimiento hiperbólico está completamente
caracterizado por la propiedad que d a~/d t = 0 en cada marco comóvil instantá-
neo.

111
Capítulo 5. Cinemática relativista

112
Capítulo 6

Dinámica relativista

6.1. 4-Momentum
Definición 6.1 (4-momentum). Sean m la masa y uµ la 4-velocidad de una partícula.
Definimos su 4-momentum a través de la expresión

pµ = muµ . (6.1)

Para que el 4-momentum sea un 4-vector, es necesario que la masa sea un escalar, i.e.,
invariante bajo transformaciones de Lorentz.

Como veremos en la sección 6.3, el 4-momentum es la cantidad clave que perma-


nece constante durante cualquier interacción entre partículas.
Escribiendo uµ = γ (1, vi ) (ver sección 5.2), encontramos que las componentes tem-
poral y espaciales del 4-momentum son

p0 = γm, p i = γmvi . (6.2)

Las componentes espaciales del 4-momentum son la generalización relativista del


momentum lineal newtoniano, m~v:

~p = γm~
v. (6.3)

Los momenta newtoniano y relativista coinciden aproximadamente cuando la veloci-


dad de la partícula es mucho menor que la velocidad de la luz, pero difieren cada vez
más drásticamente a medida que la velocidad aumenta. El momentum lineal relativista
diverge cuando |~v | → 1, indicando que es imposible para una partícula masiva alcanzar
la velocidad de la luz.
¿Qué representa la componente temporal del 4-momentum? Para responder esta
pregunta, expandimos γ en serie de potencias en v 2 . Obtenemos

1 3
p0 = m + mv 2 + mv 4 + · · · . (6.4)
2 8

113
Capítulo 6. Dinámica relativista

0,8

0,6
K/m

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1
v

Figura 6.1: Energía cinética (por unidad de masa) como función de lapvelocidad. La
energía cinética diverge cuando v → 1. Note que K = m cuando v = 3/2 ≈ 0,866.
La línea punteada es la aproximación newtoniana. Decimos que una partícula es no
relativista si K  m y ultrarrelativista si K  m.

El segundo término del lado derecho es la energía cinética newtoniana, 12 mv 2 . Por lo


tanto, p0 debe representar la energía de la partícula:

E = γm. (6.5)

La energía así definida difiere en un aspecto crucial de la energía cinética newtoniana:


incluso cuando la partícula está en reposo, hallamos

E0 = m. (6.6)

Esta ecuación1 es clave: una partícula en reposo tiene una energía igual a su masa.
Alternativamente, podemos interpretar esta ecuación como una concepción nueva del
significado de la masa: la masa es la energía en reposo de una partícula.
La energía cinética relativista está definida como

K = E − E0 = E − m = (γ − 1) m. (6.7)

Esta definición resulta útil porque K se anula cuando ~


v = 0, de manera que corresponde
a la generalización directa de la energía cinética newtoniana. La figura 6.1 compara
las energías cinéticas relativista y newtoniana para distintas velocidades.
1
En su forma popular, E = mc 2 , esta es probablemente la ecuación más famosa de toda la física.

114
6.1. 4-Momentum

Habiendo identificado las componentes temporal y espaciales del 4-momentum con


la energía y el momentum lineal de una partícula, podemos escribir

pµ = (E, ~p) . (6.8)

Esta forma, que no involucra explícitamente la velocidad de la partícula, es a menudo


la más conveniente para resolver problemas.
Sea K 0 el marco comóvil instantáneo de una partícula de masa m. En este marco,
su 4-momentum es
p0µ = (m, 0) . (6.9)
A partir de esta ecuación, o usando pµ = muµ y recordando que uµ uµ = −1, encontra-
mos que la magnitud (al cuadrado) del 4-momentum es igual a

pµ pµ = −m2 . (6.10)

Al igual que la 4-velocidad, el 4-momentum es siempre un 4-vector tipo tiempo. Usando


la representación (6.8), podemos escribir la ec. (6.10) en la forma equivalente

E 2 = m2 + p 2 , (6.11)

donde p2 = ~p · ~p es la magnitud al cuadrado del momentum lineal tridimensional.


Tomando el cociente entre las componentes espaciales y la componente temporal
del 4-momentum, encontramos la relación
~p
v=
~ . (6.12)
E

El 4-momentum como cantidad primitiva. El 4-momentum contiene una enorme


cantidad de información sobre una partícula. En retrospectiva, resulta interesante con-
siderar el siguiente punto de vista.
Asociado a cada partícula existe un 4-vector, llamado 4-momentum y denotado por
p , tal que:
µ

La energía de la partícula es E = p0 , la parte temporal de pµ .

El momentum lineal de la partícula es ~p, la parte espacial de pµ .

La masa de la partícula está dada por m2 = −pµ pµ = E 2 − p2 .

La velocidad de la partícula es ~
v = ~p/E.

La energía cinética de la partícula es K = E − m.

De acuerdo a este punto de vista, el 4-momentum es una cantidad primitiva, sin defi-
nición, a partir de la cual surgen los conceptos derivados de energía, momentum lineal
y masa. La figura 6.2 representa gráficamente las relaciones entre momentum lineal,
energía, masa y velocidad de una partícula.

115
Capítulo 6. Dinámica relativista

E = γm E 2 = m2 + p 2

~p = E ~
v

v
~ ~p = γm~
v ~p

Figura 6.2: Ecuaciones que relacionan momentum lineal, energía, masa y velocidad de
una partícula. Adaptado de la Ref. [2].

Nota sobre el concepto de masa. En estas notas de clase, usamos el concepto de


masa abogado por Taylor y Wheeler [2]: la masa está dada por la magnitud del 4-
momentum, m2 = −pµ pµ , es independiente del estado de movimiento de la partícula,
y tiene el mismo valor en todos los marcos de referencia inerciales. (Vea, en particular,
la sección Dialog: Use and Abuse of the Concept of Mass, p. 246). La energía es la com-
ponente temporal del 4-momentum, E = p0 , depende del estado de movimiento de la
partícula, y cambia según el marco de referencia inercial donde la midamos. Masa y
energía solo coinciden en el marco comóvil instantáneo de la partícula. Esta coinciden-
cia es la que está expresada en la ecuación famosa de Einstein, E = mc 2 (E0 = m con
nuestras convenciones), que nos permite interpretar la masa de una partícula como su
energía en reposo.
Algunos autores prefieren introducir el concepto de “masa relativista”, que se co-
rresponde con nuestra noción de energía y que depende del estado de movimiento de
la partícula. En particular, Rindler [1] llama masa (relativista), denotada por m, a lo
que nosotros llamamos energía, y llama masa en reposo, denotada por m0 , a lo que
nosotros llamamos masa. Por supuesto, esto significa que debe ser extremadamente
cuidadoso con la interpretación de símbolos y conceptos cuando lea este y otros libros.
Los dos artículos de Lev B. Okun [26, 27] abogan también por el concepto de masa
como cantidad invariante y dan una reseña histórica de su evolución desde finales del
siglo 19.

116
6.2. Fotones

Unidades mecánicas. Con c = 1, masa, momentum lineal y energía se miden todos


en las mismas unidades, que pueden escogerse, e.g., como kg (masa), kg m/s (momen-
tum lineal) o J (energía), con
1 kg m
kg = 1 = 299 792 458 J. (6.13)
299 792 458 s

El electronvoltio (eV). Un electronvoltio es la energía ganada o perdida por un elec-


trón2 al moverse a través de una diferencia de potencial eléctrico de un voltio:

1 eV = 1,602 176 634 × 10−19 J. (6.14)

El electronvoltio es una unidad de energía comúnmente utilizada en física del estado


sólido, atómica, nuclear y de partículas. Aprovechando la equivalencia entre masa y
energía (6.6), las masas de las partículas elementales a menudo se dan en eV. Por
ejemplo, la masa del electrón es me = 0,511 MeV.

6.2. Fotones
La mecánica newtoniana no puede acomodar la existencia de partículas sin masa.
En efecto, si m = 0, la aceleración de una partícula sometida a la acción de una fuerza
neta F~ diverge de acuerdo a la segunda ley de Newton, a~ = F~/m.
Mirando la definición 6.1, parece que la teoría especial de la relatividad fuera tam-
bién a tener dificultades con la existencia de partículas sin masa. Sin embargo, este no
es el caso. Interpretando pµ como una cantidad primitiva (p. 115), el 4-momentum de
una partícula de masa cero puede escribirse simplemente como pµ = (E, ~p), donde E
es su energía y ~p su momentum lineal. La condición m2 = −pµ pµ = E 2 − p2 = 0 implica
que el 4-momentum de una partícula sin masa es un 4-vector nulo o tipo luz, con

E = |~p| . (6.15)

Como la velocidad de una partícula está dada por ~ v = ~p/E, la ec. (6.15) implica que
la partícula sin masa se mueve siempre a la velocidad de la luz, |~ v | = 1. En particular,
esto significa que la 4-velocidad de una partícula sin masa no está definida (porque γ
diverge cuando |~ v | = 1), haciendo inviable la definición inicial de 4-momentum.
En la teoría especial de la relatividad, una partícula sin masa se mueve siempre a la
velocidad de la luz, independientemente de su energía o su momentum lineal. ¿Cómo
distinguimos entonces dos partículas sin masa con energías distintas, si ambas viajan
a la misma velocidad?
En 1905, Albert Einstein3 introdujo el concepto de fotón como el cuanto de radiación
electromagnética, una partícula elemental sin masa. En el concepto de Einstein, una
2
A partir de mayo de 2019, la definición del amperio [15] fija el valor numérico para la carga del
electrón en e = 1,602 176 634 × 10−19 C.
3
Sí, el mismo Albert Einstein. Sí, el mismo annus mirabilis de 1905.

117
Capítulo 6. Dinámica relativista

onda electromagnética de frecuencia f puede interpretarse también como un haz de


fotones, cada uno de ellos con una energía4

E = hf, (6.16)

donde h es la constante de Planck. Usando la ec. (6.16), podemos parametrizar el 4-


momentum de un fotón en la forma

pµ = h f (1, n̂) , (6.17)

donde n̂ = ~ v es un vector (tridimensional) unitario que apunta en la dirección de


movimiento del fotón.
Todos los fotones, sin importar su energía, viajan siempre a la velocidad de la luz.
Dos fotones con energías distintas corresponden a luz de diferentes colores. La figu-
ra 6.3 muestra un esquema del espectro electromagnético.

La constante de Planck. Introducida por Max Planck en 1900, inicialmente como


parte de una “hipótesis ad-hoc” para deducir su ley de radiación de cuerpo negro, la
constante de Planck yace en la base de la descripción cuántica del mundo. Desde mayo
de 2019, la definición de kilogramo [15] está basada en el valor exacto

h = 6,626 070 15 × 10−34 J s (6.18)

para la constante de Planck, de la misma manera cómo la definición de metro fija


de manera exacta el valor para la velocidad de la luz. A menudo se utiliza también
la constante de Planck reducida, ħ
h = h/2π, en términos de la cual podemos escribir
E =ħ hω, con ω = 2π f .

El efecto Doppler relativista. Siguiendo un procedimiento similar al utilizado en la


sección 5.5, podemos relacionar las componentes del 4-momentum de una partícula
en dos marcos K y K 0 que se mueven con velocidad relativa constante V~ . El resultado
puede escribirse en la forma

E 0 = Γ E − V~ · ~pk , ~pk0 = Γ ~pk − E V~ , ~p⊥0 = ~p⊥ , (6.19)


 

donde ~pk y ~p⊥ son las componentes de ~p paralela y perpendicular a V~ , respectivamente.


Para un fotón, estas ecuaciones implican un cambio en la frecuencia de la luz perci-
bida por los observadores K y K 0 . Si la dirección de movimiento del fotón en el marco K
está dada por el vector unitario n̂, entonces las frecuencias f y f 0 están relacionadas
mediante la ecuación
f 0 = Γ f 1 − V~ · n̂ . (6.20)


4
Graham Farmelo cuenta magistralmente la historia de E = h f en su ensayo A revolution with no
revolutionaries [28].

118
6.3. Conservación del 4-momentum

λ/m
103 1 10−3 10−6 10−9 10−12

radio IR UV γ

visible
microondas rayos X
f /Hz
106 109 1012 1015 1018 1021
E/eV
10−9 10−6 10−3 1 103 106

Figura 6.3: El espectro electromagnético. Una onda electromagnética monocromática


puede caracterizarse por su longitud de onda, λ, su frecuencia, f = 1/λ, o la energía
de un fotón típico, E = h f .

Este cambio en la frecuencia de la luz es conocido como efecto Doppler. El efecto Dop-
pler es importante, entre otros, en astronomía, donde se utiliza para medir la velocidad
radial de las estrellas.
Para ondas mecánicas, el efecto Doppler es cualitativamente similar pero cuantita-
tivamente distinto al efecto Doppler electromagnético. La relación entre f y f 0 en el
caso mecánico contiene las velocidades de la fuente y del observador respecto del me-
dio de propagación de las ondas. En el caso electromagnético, solo importa la velocidad
relativa entre fuente y observador, porque la luz se propaga como ondas en el campo
electromagnético, sin necesidad de un medio material que la soporte.
Ejemplo 6.2 (Efecto Doppler relativista). Una fuente monocromática de luz está en
reposo en el marco del laboratorio. Bob, trabajando en el laboratorio, determina que
la frecuencia de los fotones emitidos por la fuente es f . Montada en un cohete rápido,
Alice no está de acuerdo con la frecuencia medida por Bob. Cuando Alice se aleja de
Bob, la frecuencia de los fotones es menor que la frecuencia medida en el laboratorio.
Cuando Alice se acerca a Bob, en cambio, la frecuencia de los fotones resulta ser mayor
que la medida en el laboratorio. Asumiendo que la velocidad de Alice es siempre pa-
ralela o antiparalela con la dirección de movimiento de los fotones, la ec. (6.20) toma
la forma v
t1 − v
f0= f, (6.21)
1+v
donde v = V~ · n̂ = ±V es positiva si Alice se aleja de Bob y negativa si Alice se acerca
a Bob. En la figura 6.4 se grafica este caso particular.

6.3. Conservación del 4-momentum


La propiedad más importante del 4-momentum es su conservación: El 4-momentum
total de un sistema aislado se mantiene constante en el tiempo. Separando componente

119
Capítulo 6. Dinámica relativista

10

2
f 0/ f
1

0,5

0,2

0,1
−1 −0,5 0 0,5 1
v

Figura 6.4: En el efecto Doppler, la frecuencia observada de un fotón depende de la


velocidad relativa entre el observador y la fuente de luz. Cuando el observador se aleja
de la fuente (v > 0), la frecuencia observada es menor que la emitida. En cambio,
cuando el observador se acerca a la fuente (v < 0), la frecuencia observada es mayor
que la emitida. Note que el eje vertical está en escala logarítmica.

temporal y componentes espaciales, obtenemos dos leyes de conservación independien-


tes:

Conservación de la energía

Conservación del momentum lineal

Consideremos una colisión descrita por a + b → c + d. La notación indica que dos


partículas, a y b, interactúan por un tiempo breve y luego de la interacción emergen
otras dos partículas, c y d, que pueden o no ser las mismas partículas originales. La
conservación del 4-momentum en esta interacción queda expresada mediante la ecua-
ción
µ µ
paµ + p b = pcµ + pd . (6.22)
En componentes, podemos escribir

Ea + E b = Ec + Ed , (6.23)
~pa + ~p b = ~pc + ~pd . (6.24)

La ec. (6.24) es la generalización relativista de la conservación del momentum lineal


newtoniano; exactamente la misma ecuación, pero con una definición nueva para el
momentum lineal, ~p = γm~ v . La ec. (6.23) es nueva; representa la conservación de la

120
6.3. Conservación del 4-momentum

energía total de una partícula, E = m + K, y es válida en cualquier colisión, no solo en


colisiones elásticas. Explícitamente, tenemos

ma + Ka + m b + K b = mc + Kc + md + Kd . (6.25)

No hay conservación de la masa en Relatividad; en su lugar, tenemos la conservación de


la suma de masa y energía cinética, ec. (6.25). Como la masa es una forma de energía,
es posible convertir masa en energía y viceversa, conduciendo a que solo se conserva
la suma de ambas, no cada una por sí sola.

Definición 6.3 (Colisión elástica). Decimos que una colisión es elástica si se conserva
la energía cinética. En la interacción a + b → c + d, esto es equivalente a

Ka + K b = Kc + Kd . (6.26)

En este caso, la ec. (6.25) implica que en una colisión elástica se conserva también la
masa:
ma + m b = mc + md . (6.27)

Ejemplo 6.4 (Colisión totalmente inelástica). Una colisión totalmente inelástica puede
escribirse como a + b → c, implicando que las partículas a y b se mueven como una
sola, c, después de la interacción. La conservación del 4-momentum en este caso toma
la forma
µ
paµ + p b = pcµ . (6.28)

Consideremos dos partículas a y b de la misma masa, ma = m b = m, que se acercan


con velocidades de igual magnitud y direcciones opuestas: ~pa = γm~ v , ~p b = −γm~
v . En
este caso, la conservación del momentum lineal produce ~pc = ~pa + ~p b = 0, es decir, la
partícula c queda en reposo después de la interacción. Si K = (γ − 1) m es la energía
cinética de a o b antes de la colisión, la conservación de la energía implica

Ec = mc = 2m + 2K = 2γm. (6.29)

La masa de la partícula c es mayor que la suma de las masas de las partículas a y b,


porque la energía cinética de a y b contribuye también a la masa de c. Esta es una
instancia concreta de transformación de energía en masa.
¿Qué pasa si observamos esta colisión desde un marco de referencia distinto? En
este caso, la partícula c no permanece en reposo, pero su masa es la misma que en el
caso simétrico. Por ejemplo, sea K 0 el marco donde b está en reposo, de manera que
E b0 = m, ~p0b = 0. En este caso, la velocidad, el factor de Lorentz y el momentum lineal
de a son [cf. ec. (5.49) con V~ = −~ v, ~
v⊥ = 0, ~
v=~ vk , Γ = γ]

v
2~
va0 = , γ0a = γ2 1 + v 2 , ~pa0 = 2γ2 m~
v. (6.30)

~
1 + v2

121
Capítulo 6. Dinámica relativista

K m m mc
a b c

K0 m m mc
a b c

Figura 6.5: Colisión totalmente inelástica. En un marco K dado, dos partículas idén-
ticas, a y b, con velocidades de igual magnitud y direcciones opuestas se fusionan en
una nueva partícula, c. La masa de c es mayor que la suma de las masas de a y b.
Cuando observamos esta colisión desde el punto de vista del marco K 0 donde b está
en reposo, la energía y el momentum lineal de c difieren de sus valores en el marco K,
pero su masa permanece invariante. Ver ejemplo 6.4.

A partir de la conservación del 4-momentum encontramos la energía y el momentum


lineal de c:

Ec0 = Ea0 + E b0 = 2γ2 m, ~pc0 = ~pa0 + ~p0b = 2γ2 m~


v, (6.31)

donde hemos usado la identidad 1 + γ2 1 + v 2 = 2γ2 . La masa de c está dada por




2
m2c = Ec02 − pc02 = 2γ2 m 1 − v 2 = (2γm)2 , (6.32)


que coincide con su masa en el marco K.

Ejemplo 6.5 (Scattering de Compton, caso más simple). Llamamos scattering de Com-
pton al impacto de un fotón sobre un electrón en reposo, que produce un electrón en
movimiento y un fotón con una energía menor que la del fotón original (i.e., con una
longitud de onda más larga).
Veamos primero un caso simple, en el cual un fotón con energía E = 2me , donde
me = 0,511 MeV es la masa del electrón, impacta un electrón en reposo y emerge
de la colisión en la dirección opuesta a la inicial, como se ilustra en la figura 6.6,
en un proceso llamado backscattering. Los 4-momenta del fotón y el electrón antes
µ
de la colisión son paµ = (2me , 2me , 0, 0) y p b = (me , 0, 0, 0). Después de la colisión,
µ
tenemos pcµ = (Ec , −Ec , 0, 0), pd = (Ed , pd , 0, 0), con m2e = Ed2 − pd2 . La conservación del
4-momentum nos entrega las ecuaciones

3me = Ec + Ed , (6.33)
2me = −Ec + pd . (6.34)

Sumando, obtenemos
5me = Ed + pd . (6.35)
Combinando esta ecuación con la relación m2e = (Ed + pd ) (Ed − pd ), encontramos
1
me = Ed − pd . (6.36)
5

122
6.3. Conservación del 4-momentum

a b c d

Figura 6.6: Backscattering de un fotón por un electrón. Izquierda: un fotón (a) de ener-
gía Ea = 2me impacta un electrón en reposo (b). Derecha: luego del impacto, el elec-
trón (d) se mueve hacia la derecha con velocidad vd = 12/13 y un fotón (c) de energía
Ec = (2/5) me sale hacia la izquierda. Ver ejemplo 6.5.

Resolviendo el sistema formado por las ecs. (6.35)–(6.36), hallamos

13 12
Ed = me , pd = me . (6.37)
5 5
La velocidad del electrón después de la colisión es vd = pd /Ed = 12/13. Reemplazando
en (6.33) ó (6.34) obtenemos finalmente

2
Ec = me . (6.38)
5
Resumiendo: un fotón de rayos gamma (Ea = 1,02 MeV, λa = 1,21 pm) impacta un
electrón en reposo, imprimiéndole una velocidad igual al 92 % de la velocidad de la luz.
El fotón emitido tiene apenas el 20 % de la energía del fotón incidente (Ec = 204 keV,
λc = 6,06 pm).

Ejemplo 6.6 (Creación de un par electrón-positrón). Si un fotón a impacta un elec-


trón b en reposo con la energía suficiente, es posible crear un par electrón-positrón5 .
Vamos a asumir que el par electrón-positrón y el electrón original se mueven como una
sola partícula, c, después de la colisión, con mc = 3me , como muestra la figura 6.7. En
este caso, la conservación del 4-momentum produce las ecuaciones

Ea + me = Ec , Ea = pc , (6.39)

con Ec2 − pc2 = m2c = 9m2e . Resolviendo, hallamos que la energía del fotón inciden-
te debe ser igual a 4 veces la masa del electrón, Ea = 4me . La velocidad de c es
vc = pc /Ec = 4/5. La conservación del momentum lineal impide que la partícula c
sea creada en reposo, por lo que parte de la energía del fotón incidente siempre se
gasta en energía cinética. Por este motivo es que se necesita un fotón con la energía
de 4 electrones en reposo para producir un solo par electrón-positrón. La presencia del
electrón b es crucial; un fotón por sí solo no puede desintegrarse espontáneamente en
un par electrón-positrón.

5
El positrón es la antipartícula del electrón. El electrón y el positrón tienen la misma masa, el mismo
spin, y cargas eléctricas de signos opuestos. La existencia del positrón fue predicha teóricamente por
P. A. M. Dirac en 1928 y confirmada experimentalmente por C. D. Anderson en 1932.

123
Capítulo 6. Dinámica relativista

a b c

Figura 6.7: Creación de un par electrón-positrón. Un fotón energético a impacta un


electrón en reposo b y produce una nueva partícula, c, compuesta del electrón original
más un par electrón-positrón, con mc = 3me . Ver ejemplo 6.6.

Ejemplo 6.7 (Scattering de Compton). El caso general del scattering de Compton se


ilustra en la figura 6.8. Los cuatro 4-momenta involucrados pueden ser escritos en la
forma
paµ = h f (1, 1, 0, 0) , (6.40)
µ
pb = me (1, 0, 0, 0) , (6.41)
0
pcµ = h f (1, cos θ , sin θ , 0) , (6.42)
µ
pd = (E, p cos ϕ, −p sin ϕ, 0) , (6.43)
donde f y f 0 son las frecuencias del fotón antes y después del scattering, y m2e = E 2 −p2 .
La conservación del 4-momentum nos entrega un sistema de cuatro ecuaciones que
puede resolverse algebraicamente.
A menudo ocurre que no estamos interesados en algún aspecto de la colisión en es-
tudio. Por ejemplo, en el scattering de Compton nos importa más saber con qué energía
emerge el fotón (i.e., en cuánto cambia su longitud de onda) luego de la interacción
que la energía y la dirección de movimiento del electrón. En estos casos, podemos utili-
zar la siguiente técnica: de la ecuación para la conservación del 4-momentum, aislamos
el 4-momentum que no nos interesa y elevamos al cuadrado:
µ µ
pµd pd = pµa + pµb − pµc paµ + p b − pcµ . (6.44)
 

En la ec. (6.44), la única información que queda sobre el electrón d es su masa. Mul-
tiplicando los paréntesis en el lado derecho, hallamos
µ µ µ
pµd pd = pµa paµ + pµb p b + pµc pcµ + 2pµa p b − 2pµb pcµ − 2pµc paµ
−m2e = −m2e − 2h f me + 2h f 0 me − 2h2 f f 0 (−1 + cos θ ) .
Esto es equivalente a
1 1 h
− = (1 − cos θ ) . (6.45)
f0 f me
1
Usando λ = 1/ f y la identidad trigonométrica sin2 (θ /2) = 2 (1 − cos θ ), podemos
escribir
2h 2 θ
 ‹
0
λ −λ= sin . (6.46)
me 2
La ec. (6.46) fue deducida por primera vez por Arthur Compton en 1923, revelando que
la luz no podía siempre ser tratada como una onda. La cantidad λc = h/me = 2,43 pm
es conocida como longitud de onda de Compton del electrón.

124
6.4. Sistemas de partículas

θ
a b ϕ
d

Figura 6.8: Scattering de Compton. Izquierda: un fotón (a) impacta un electrón en


reposo (b). Derecha: luego de la colisión, el fotón (c) y el electrón (d) salen disparados
en direcciones distintas. Ver ejemplo 6.7.

a b

Figura 6.9: Dos partículas no interactuantes que son consideradas como un sistema.

6.4. Sistemas de partículas


Consideremos dos partículas no interactuantes entre sí y dibujemos una caja ima-
ginaria que las contenga a ambas, como se muestra en la figura 6.9. Para simplificar,
asumimos que las partículas tienen la misma masa y velocidades de igual magnitud pe-
ro direcciones opuestas en el marco del laboratorio. Estas dos partículas forman ahora
un sistema que posee los mismos atributos dinámicos —energía, momentum lineal y
masa— que un único objeto.
Usando los datos numéricos de la tabla 6.1, determinamos que los 4-momenta de
µ
las partículas son paµ = (10, 6, 0, 0) y p b = (10, −6, 0, 0). A partir de estas componen-
tes podemos calcular la masa, la energía cinética y la velocidad de cada una de las
partículas.
µ
El 4-momentum del sistema de dos partículas es p̄µ = paµ +p b = (20, 0, 0, 0). A partir

E px m K vx
Partícula a 10 6 8 2 3/5
Partícula b 10 −6 8 2 −3/5
Sistema 20 0 20 0 0

Tabla 6.1: Información dinámica de dos partículas que son consideradas como un siste-
ma. Energía, momentum lineal y masa se miden en la misma unidad (e.g., kilogramos).
La velocidad es adimensional.

125
Capítulo 6. Dinámica relativista

de estas componentes calculamos la masa, la energía cinética y la velocidad del sistema


de dos partículas, con resultados sorprendentes: la masa de un sistema de partículas es
mayor que la suma de las masas individuales cuando las partículas que lo componen se
mueven unas respecto de las otras. En particular, esto significa que la energía térmica
asociada al movimiento aleatorio de las partículas de un sistema contribuye también a
su masa.
Más formalmente, consideremos una colección de partículas cuya única interacción
ocurre en la forma de colisiones y que no están sometidas a fuerzas externas. Deno-
tando por paµ al 4-momentum de la partícula a-ésima (a = 1, 2, 3, . . .), el 4-momentum
total del sistema puede escribirse en la forma
X
p̄µ = paµ , (6.47)
a

donde la suma se extiende a todas las partículas del sistema. Es posible demostrar que
p̄µ , al igual que cada uno de los 4-momenta individuales, es un 4-vector tipo tiempo [1].
En estas condiciones, el 4-momentum total del sistema, p̄µ , permanece constante
en el tiempo, i.e., se conserva.
La masa M del sistema de partículas está dada por

M 2 = −p̄µ p̄µ , (6.48)

y es en general mayor que la suma de las masas de las partículas individuales, m̄ =


a ma . De su definición, la masa del sistema es invariante de Lorentz, de manera
P

que todos los observadores inerciales coinciden en su valor. La conservación del 4-


momentum nos asegura que la masa M del sistema permanece constante siempre que
el sistema se mantenga aislado.

Definición 6.8 (Marco del centro del momentum). Como p̄µ es un 4-vector tipo tiem-
po, existe un marco K 0 , llamado marco del centro del momentum (MCM), donde sus
componentes espaciales se anulan:
p̄i0 = 0. (6.49)
Si las componentes de p̄µ en un marco K dado son p̄µ = Ē, p̄i , entonces es posible


demostrar que la velocidad de K 0 respecto de K es


p̄i
Vi = . (6.50)

En el marco del centro del momentum, las componentes del 4-momentum total son

p̄0µ = (M , 0) . (6.51)

Luego, podemos escribir


X X
M = p̄00 = pa00 = ma + Ka0 = m̄ + K̄ 0 , (6.52)


a a

126
6.5. 4-Fuerza

donde K̄ 0 es la energía cinética total medida en el MCM. Esta ecuación muestra que la
masa del sistema es siempre mayor que la suma de las masas de las partículas indivi-
duales. La diferencia entre M y m̄ puede interpretarse como la energía cinética total
medida en el marco del centro del momentum, i.e., la energía térmica del sistema.
Si las partículas de un sistema interactúan entre sí, entonces la energía potencial de
interacción contribuye también a la masa del sistema.

6.5. 4-Fuerza
La primera ley de Newton, que define un marco de referencia inercial, sigue siendo
válida en Relatividad: un objeto sobre el que no actúan fuerzas se mueve en línea recta
con velocidad constante (que podría ser cero).
La segunda ley de Newton puede escribirse en la forma
d ~p
f~ = , (6.53)
dt
donde ~p es el momentum lineal y f~ es la fuerza neta que actúa sobre una partícula. En
Relatividad, esta relación es reemplazada por
d pµ
Fµ = , (6.54)

donde pµ es el 4-momentum y F µ es la 4-fuerza total que actúa sobre una partícula.
Con pµ = (E, pi ), las componentes de la 4-fuerza total son
dE
F0 = γ , F i = γ fi , (6.55)
dt
donde P = d E/d t es la potencia desarrollada por la fuerza y
d pi d d
fi = = (γmvi ) = (E vi ) (6.56)
dt dt dt
es la fuerza tridimensional o 3-fuerza total. Esta 3-fuerza se corresponde con la fuer-
za newtoniana, aunque difiere de ella: la relación f~ = d ~p/d t se mantiene, pero la
definición del momentum lineal ~p ha pasado del m~ v newtoniano al γm~
v relativista.
Dado que las interacciones instantáneas a distancia son incompatibles con la Rela-
tividad, la tercera ley de Newton sobrevive solo para interacciones locales, como las
colisiones de las secciones anteriores.
A partir de las ecs. (6.55) podemos escribir
dE
 ‹
F =γ
µ
, fi . (6.57)
dt
Tomando el producto punto de F µ con la 4-velocidad uµ , hallamos
dE
 ‹
2
uµ F = γ −
µ
+ vi f i . (6.58)
dt

127
Capítulo 6. Dinámica relativista

Sea K 0 el marco comóvil instantáneo de la partícula. En K 0 , u0µ = (1, 0, 0, 0) y F 00 =


d m/d t 0 , de manera que obtenemos u0µ F 0µ = −dm/d t 0 . Igualando con el resultado ob-
tenido en K, encontramos
dE 1 dm
= vi f i + , (6.59)
dt γ dt
donde hemos usado la relación d/d t 0 = γd/d t.
En general, una 4-fuerza relativista puede hacer dos cosas: cambiar la masa y cam-
biar la velocidad de una partícula. Cuando una fuerza no cambia la masa de la partícula,
se cumplen uµ F µ = 0 y la relación newtoniana P = ~ v · f~.
Definición 6.9 (Fuerza tipo calor). Decimos que una fuerza es tipo calor si cambia la
masa, pero no la velocidad, de la partícula sobre la que actúa.
Ejemplo 6.10. Las fuerzas de acción y reacción en una colisión son tipo calor.
Ejemplo 6.11. Si la 4-fuerza puede derivarse a partir de un potencial escalar, Fµ = ∂µ Φ,
entonces
d xµ ∂ Φ dΦ
uµ F µ = = . (6.60)
dτ ∂ x µ dτ
Como dΦ/dτ 6= 0 en general, una fuerza de esta clase será tipo calor.
Ejemplo 6.12. La fuerza electromagnética no cambia la masa de las partículas sobre
las que actúa.
Sea F µ una 4-fuerza que no cambia la masa de una partícula. En este caso, podemos
escribir
F µ = γ v j f j , fi . (6.61)


Aplicando la regla de Leibniz a la relación f i = (d/d t) (E vi ), obtenemos


d vi d E
fi = E + vi = γmai + v j f j vi , (6.62)
dt dt
que claramente difiere de la segunda ley de Newton. Proyectando esta ecuación sobre
la dirección paralela y el plano perpendicular a la velocidad de la partícula, obtenemos

f~k = γ3 m~
ak , f~⊥ = γm~
a⊥ , (6.63)

donde hemos usado la relación ~ v · f~ ~v = v 2 f~k . En la sección 5.6 mostramos que la




aceleración propia a~0 puede descomponerse en partes paralela y perpendicular a la


velocidad en la forma
k
a~0 = γ3 a~k , a~0⊥ = γ2 a~⊥ . (6.64)
k
Esto significa que podemos escribir f~k = m~
a0 , pero f~⊥ 6= m~
a0⊥ . La única manera de
recuperar la segunda ley de Newton consiste en definir, de modo bastante ad-hoc, una
“masa longitudinal” y una “masa transversal” en la forma

mk = γ3 m, m⊥ = γm. (6.65)

128
Problemas

m
A D C

Figura 6.10: Decaimiento del positronio en vuelo. Ver problema 3.

Usando estas definiciones, conseguimos escribir

f~k = mk a~k , f~⊥ = m⊥ a~⊥ , (6.66)

pero es muy poco claro si hemos ganado algo con ello.

Problemas
1. Una partícula tiene energía E y momentum lineal ~p en un marco K dado. Muestre
que su energía y momentum lineal en un marco K 0 que se mueve con velocidad
constante V~ respecto de K están dados por las ecuaciones (6.19).

2. Un núcleo atómico de masa m, inicialmente en reposo, absorbe un rayo gamma


y es excitado a un estado energético más alto, de manera que ahora su masa es
1,01m.

a) Encuentre la energía del fotón incidente necesaria para llevar a cabo esta
excitación.
b) Explique por qué la energía requerida del fotón incidente es mayor que el
cambio de masa del núcleo.

3. Un “átomo” de positronio (un electrón y un positrón que se orbitan mutuamente),


de masa m y energía inicial EA, decae en dos rayos gamma que se mueven en
direcciones opuestas a lo largo de la línea de movimiento del átomo, como se
muestra en la figura 6.10. Encuentre la energía de cada rayo gamma, EC y E D ,
en términos de la masa m y la energía EA de la partícula inicial. Muestre que
EC = E D cuando el positronio está inicialmente en reposo.

4. Un positrón e+ de masa m y energía cinética K es aniquilado contra un objetivo


que contiene electrones e− (misma masa m) prácticamente en reposo en el marco
de referencia del laboratorio:

e+ (rápido) + e− (en reposo) → radiación. (6.67)

a) Considerando la colisión en el marco del centro del momentum, muestre


que es necesario que al menos dos rayos gamma (en lugar de uno) resulten
de la aniquilación.

129
Capítulo 6. Dinámica relativista

e+ e−
m m
A B D C

Figura 6.11: Aniquilación electrón-positrón. Ver problema 4.

e+ e− ϕC
m m
A B ϕD

Figura 6.12: Aniquilación electrón-positrón. Ver problema 5.

b) Regrese al marco del laboratorio. Los fotones resultantes escapan en direc-


ciones opuestas a lo largo de la línea de movimiento del positrón, como se
muestra en la figura 6.11. Encuentre una expresión para la energía de cada
fotón. No incluya la velocidad en su deducción.
c) Usando aproximaciones sencillas, evalúe sus respuestas en los casos límite
(i) K pequeña y (ii) K grande (¿comparada con qué?).

5. Un positrón e+ de masa m y energía cinética K es aniquilado contra un objetivo


que contiene electrones e− (misma masa m) prácticamente en reposo en el marco
de referencia del laboratorio:

e+ (rápido) + e− (en reposo) → radiación. (6.68)

Los rayos gamma resultantes emergen a ángulos diferentes con respecto a la


dirección del positrón, como se muestra en la figura 6.12.

a) Deduzca una expresión para la energía de uno de los rayos gamma en el


marco del laboratorio como función del ángulo entre la dirección de emi-
sión del rayo gamma y la dirección de movimiento del positrón antes de su
aniquilación, y la masa y la energía del positrón.
b) Muestre que para rayos gamma que se mueven hacia la izquierda y hacia la
derecha, sus resultados coinciden con los del problema 4.

6. Dos neutrones, A y B, se acercan el uno al otro a lo largo de una línea recta co-
mún. Cada uno tiene velocidad v en el marco del laboratorio (misma magnitud,
direcciones opuestas). Determine la energía total del neutrón B en el marco co-
móvil instantáneo del neutrón A, en términos de v y m (la masa del neutrón). ¿A
cuánto tiende esta energía cuando v → 1?

130
Problemas

B
θ

A
C

Figura 6.13: Decaimiento de una partícula en dos. Ver problema 7.

7. Considere la reacción A → B + C, donde las masas de las partículas son mA, mB ,


y mC , respectivamente.

a) Si A está en reposo en el marco del laboratorio, encuentre la energía de B


en este marco en términos de las tres masas.
b) Un átomo de masa M en reposo decae a un estado de masa M −δ emitiendo
un fotón de frecuencia f . ¿Cómo se comparan h f y δ?
c) Si A decae mientras se encuentra en movimiento en el marco del laboratorio,
como se muestra en la figura 6.13, halle el ángulo de scattering de B en
función de las energías de A y B (y las masas de las partículas).

8. En cierto marco de referencia, una partícula P tiene 4-momentum pµ y un obser-


µ
vador O se mueve con 4-velocidad uO . Demuestre que la energía de la partícula
µ
relativa al observador es EO = −pµ uO .

9. El motor de un cohete “perfecto” combina materia y antimateria de manera con-


trolada para producir fotones (rayos gamma de alta energía), los cuales son ex-
pulsados por la parte posterior del cohete. Suponga que comenzamos con una
nave espacial de masa M0 , inicialmente en reposo. Cuando se acaba el combus-
tible, la nave se mueve con velocidad v y conserva una fracción f de su masa
inicial (i.e., su masa final es M f = f M0 ). Para una f dada, deseamos conocer la
velocidad final del cohete, v, o, mejor aún, el factor de Lorentz correspondiente,
γ.

a) Plantee la conservación de la energía y el momentum lineal para el sistema


cohete/radiación. Llame Erad a la energía total de la radiación emitida.
b) Elimine Erad de las dos ecuaciones de conservación y obtenga una ecuación
para f .
c) Usando la definición de γ, elimine v de la ecuación anterior y obtenga una
relación entre f y γ.
d) Grafique γ como función de f . Considere usar escala logarítmica para el eje
vertical.

131
Capítulo 6. Dinámica relativista

a) m (en reposo)
energía = 3m

b)
energía = 3E energía = E

c)
energía = 3E energía = E

d)
energía = 3E
energía = E

Figura 6.14: Encuentre la masa de cada uno de estos sistemas de partículas. Ver pro-
blema 12.

e) Muestre que la energía total de la radiación emitida es menor que la masa


de combustible consumida. ¿Por qué?

10. Muestre que un fotón no puede desintegrarse espontáneamente en un par elec-


trón-positrón.

11. En un marco inercial K, dos fotones de frecuencias f1 y f2 viajan a lo largo de las


direcciones positiva y negativa del eje x, respectivamente. Encuentre la velocidad
del marco del centro del momentum de este sistema de dos fotones.

12. Encuentre la masa de cada uno de los sistemas de partículas que se muestran en
la figura 6.14.

13. Considere el scattering de dos partículas en dos partículas,

a + b → c + d, (6.69)

y defina las variables de Mandelstam

s = − (pa + p b )2 , t = − (pa − pc )2 , u = − (pa − pd )2 . (6.70)

a) Muestre que todos los productos de la forma pi · p j pueden escribirse co-


mo combinaciones lineales de las variables de Mandelstam y las masas (al
cuadrado) de las partículas.
b) Muestre que
s + t + u = m2a + m2b + m2c + m2d . (6.71)

Nota: Para simplificar la escritura, en este problema usamos la notación p · q =


pµ qµ .

132
Capítulo 7

Electrodinámica relativista

One cannot escape the feeling that


these mathematical formulae have
an independent existence and an
intelligence of their own, that they
are wiser than we are, wiser even
than their discoverers, that we get
more out of them than was
originally put into them.

Heinrich Hertz

El nombre secreto de este capítulo es “Campos relativistas”, porque ese es el espíritu


con que procedemos: estudiamos las ecuaciones relativistas más sencillas que pueden
satisfacer un campo escalar y un campo 4-vectorial, y encontramos que en ambos casos
los resultados tienen relevancia física.

7.1. La ecuación de Klein–Gordon


El caso más simple de un campo relativista es un campo escalar, φ, que permanece
invariante bajo transformaciones de Lorentz, i.e., en cuyo valor están de acuerdo dos
observadores K y K 0 que se mueven con velocidad relativa constante.
¿Qué ecuaciones diferenciales puede satisfacer un campo escalar para ser consis-
tente con la Relatividad? Las ecuaciones de Laplace o Poisson, al no incluir el tiempo,
están descartadas. La posibilidad no trivial más simple es

ƒφ = 0, (7.1)

cuyas soluciones son ondas que se propagan a la velocidad de la luz (en todos los
marcos).
Con ƒ = −∂µ ∂ µ (cf. def. 4.55), la ecuación de onda ∂µ ∂ µ φ = 0 es reminiscente
de la relación pµ pµ = 0, que describe a un fotón (ver sección 6.2). Esta reminiscencia

133
Capítulo 7. Electrodinámica relativista

motiva la equivalencia heurística

pµ 7→ −iħ
h∂µ , (7.2)

h es, desde nuestro punto de vista, puramente convencional. Explí-


donde el factor −iħ
citamente (note que E = p0 = −p0 , con ∂0 = ∂ /∂ t),

E 7→ iħ
h , ~p 7→ −iħ
h∇. (7.3)
∂t
En 1925, Erwin Schrödinger usó las equivalencias (7.3) para deducir una ecua-
ción diferencial que predice correctamente los niveles de energía para el átomo de
hidrógeno dados por el modelo de Bohr. Partiendo de la expresión newtoniana para la
energía,
p2
E= + V, (7.4)
2m
donde K = 12 mv 2 = p2 /2m es la energía cinética y V es energía potencial, y efectuando
los reemplazos (7.3), obtenemos la ecuación de Schrödinger,

∂ψ h2 2
ħ

h =− ∇ ψ + V ψ. (7.5)
∂t 2m
Aquí, ψ (~r , t) es una “función de onda”, valuada en los números complejos, cuyo módu-
lo al cuadrado da la densidad de probabilidad de encontrar una partícula en la posición
~r en el instante t. La ecuación de Schrödinger es uno de los pilares de la mecánica cuán-
tica, y la base de la física atómica y molecular. De la manera en que la hemos deducido
resulta claro que no es compatible con la Relatividad.
Aplicando la sustitución (7.2) en la expresión relativista pµ pµ = −m2 , obtenemos
la ecuación de Klein–Gordon,  m 2
ƒφ + φ = 0. (7.6)
h
ħ
Curiosamente, Schrödinger mismo dedujo esta ecuación antes de la ecuación que lleva
su nombre, pero la descartó porque no reproduce correctamente los niveles de energía
del átomo de hidrógeno. La ecuación de Klein–Gordon es una versión relativista de la
ecuación de Schrödinger válida para partículas de spin cero, como el bosón de Higgs.
Ignorando tanto la Relatividad como el spin del electrón, la ecuación de Schrödinger da
una buena aproximación a los niveles de energía del átomo de hidrógeno. La ecuación
de Dirac corrige ambas falencias de la ecuación de Schrödinger y predice correctamente
la “estructura fina” de los niveles de energía, además de la existencia del positrón, la
antipartícula del electrón.

7.2. El campo electromagnético


¿Qué ecuaciones relativistas podemos escribir para un campo 4-vectorial Aµ ? De
nuestra experiencia con el campo escalar, podríamos comenzar probando la ecuación

134
7.2. El campo electromagnético

de onda,
ƒAµ = 0. (7.7)
Aunque de apariencia relativista, esta ecuación esconde una potencial violación a la co-
variancia: con ƒ = −∂ λ ∂λ , tenemos ƒAµ = −∂ λ ∂λ Aµ . Como vimos en la sección 4.3
(p. 84), las derivadas parciales de un campo 4-vectorial solo son tensoriales bajo trans-
formaciones lineales de coordenadas. Bajo una transformación no lineal, como el paso
de coordenadas cartesianas a coordenadas esféricas, el término ∂λ Aµ es no tensorial y
no puede ser aceptado como parte de una ecuación relativista covariante. Una mane-
ra de recuperar la covariancia consiste en tomar combinaciones antisimétricas de las
derivadas de Aµ , como en
Fµν = ∂µ Aν − ∂ν Aµ . (7.8)
En términos de este tensor, podemos reemplazar la ecuación de onda por

∂ν F µν = ∂ µ (∂ν Aν ) + ƒAµ = 0. (7.9)

Para hacer la ecuación más interesante, introducimos una fuente (“source”) 4-vectorial
S µ en el lado derecho de esta ecuación homogénea y obtenemos

∂ν F µν = S µ . (7.10)

Estas son ecuaciones relativistas de segundo orden para un campo 4-vectorial Aµ con
una fuente 4-vectorial S µ .
¿Qué representan el tensor definido en (7.8) y las ecuaciones (7.10)? Un tensor
antisimétrico como F µν tiene seis componentes independientes (ver tabla 4.2), las que
pueden organizarse en dos vectores tridimensionales, F 0i y εi jk F jk . Usando la defini-
ción (7.8), encontramos
∂ Ai
F 0i = ∂ 0 Ai − ∂ i A0 = − − ∂i φ, (7.11)
∂ t
εi jk F jk = εi jk ∂ j Ak − ∂ k A j = 2εi jk ∂ j Ak , (7.12)


donde hemos llamado φ = A0 . Estas ecuaciones son idénticas a las definiciones del
campo eléctrico y el campo magnético a partir de los potenciales escalar eléctrico y
vectorial magnético,

∂ A~
E~ = − − ∇φ, B
~ = ∇ × A.
~ (7.13)
∂t
Identificamos, por lo tanto,
1
Ei = F 0i , Bi = εi jk F jk , (7.14)
2
con el campo eléctrico y el campo magnético, respectivamente. Las relaciones inversas
son

F 0i = Ei , F i j = εi jk Bk . (7.15)

135
Capítulo 7. Electrodinámica relativista

Más explícitamente,

0 Ex Ey Ez
 
 −E x 0 Bz −B y 
[F µν ] =  . (7.16)
−E y −Bz 0 Bx 
−Ez B y −B x 0

Por supuesto, esta identificación no pasaría de ser una curiosidad si las ecuaciones
satisfechas por los campos no se corresponden con las ecuaciones de Maxwell. Para
comprobar esta última equivalencia, analizamos las componentes de la ec. (7.10). Se-
parando los casos µ = 0 y µ = i, hallamos

∂ν F 0ν = ∂i F 0i = ∂i Ei = S 0 , (7.17)
∂ Ei
∂ν F iν = ∂0 F i0 + ∂ j F i j = − + εi jk ∂ j Bk = S i . (7.18)
∂t

Identificando S 0 = ρ/ε0 , S i = µ0 ji , y notando que, con c = 1, tenemos ε0 µ0 = 1, estas


ecuaciones corresponden a la ley de Gauss y la ley de Ampère–Maxwell,

ρ ∂ E~
∇ · E~ = , − +∇×B
~ = µ0 ~. (7.19)
ε0 ∂t

Definiendo la 4-corriente J µ como el 4-vector con componentes

J µ = (ρ, ~) , (7.20)

podemos escribir las ecuaciones de Maxwell inhomogéneas en la forma compacta

∂ν F µν = µ0 J µ . (7.21)

Las ecuaciones de Maxwell homogéneas (la ley de Gauss para el magnetismo y la ley
de Faraday) se satisfacen automáticamente una vez se definen los campos a partir de
potenciales, como hemos hecho. También es posible escribirlas tensorialmente en la
forma
∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ = 0. (7.22)
Resulta directo comprobar que esta ecuación se reduce a una identidad cuando reem-
plazamos la definición de Fµν dada en la ec. (7.8).

Conceptos clave de la electrodinámica relativista. Los 4-vectores Aµ y J µ son llama-


dos 4-potencial y 4-corriente, respectivamente. Sus componentes temporal y espaciales
son

Aµ = φ, A~ , J µ = (ρ, ~) . (7.23)




136
7.2. El campo electromagnético

Aquí, identificamos φ con el potencial escalar eléctrico, A~ con el potencial vectorial mag-
nético, ρ con la densidad de carga eléctrica, y ~ con la densidad de corriente eléctrica. A
partir del 4-potencial definimos el campo electromagnético como

Fµν = ∂µ Aν − ∂ν Aµ . (7.24)

Este es un tensor antisimétrico de orden 2 que a veces es llamado tensor de Faraday. El


~ corresponden a las componentes F 0i y F i j de
campo eléctrico E~ y el campo magnético B
este tensor:
1
Ei = F 0i , Bi = εi jk F jk , (7.25)
2
ij
F 0i = Ei , F = εi jk Bk . (7.26)

Más explícitamente,
0 Ex Ey Ez
 
 −E x 0 Bz −B y 
[F µν ] =  . (7.27)
−E y −Bz 0 Bx 
−Ez B y −B x 0
El campo electromagnético obedece las ecuaciones de Maxwell inhomogéneas,

∂ν F µν = µ0 J µ , (7.28)

que son equivalentes a las leyes de Gauss y de Ampère–Maxwell. Las ecuaciones de


Maxwell homogéneas, i.e., las leyes de Gauss para el magnetismo y de Faraday, se
reducen a identidades cuando los campos son definidos a partir de potenciales, como
hemos hecho aquí. Ellas pueden escribirse tensorialmente en la forma

∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ = 0, (7.29)

que a veces es llamada identidad de Bianchi.


∗ ∗ ∗

La presentación de la electrodinámica que hemos hecho en esta sección puede re-


sultar difícil de aceptar. Después de todo, las ecuaciones de Maxwell representan una
síntesis teórica formidable de un sinnúmero de resultados experimentales obtenidos
con esfuerzo y paciencia durante siglos. El malabarismo teórico que hemos usado para
obtenerlas no le hace en modo alguno justicia a este desarrollo histórico. Y, sin embar-
go, allí están, apareciendo como componentes de una ecuación tensorial que plantea-
mos de manera no muy distinta a cómo un mago saca un conejo de su sombrero.
Nuestra presentación tiene, como mínimo, una virtud: escribiendo las ecuaciones
de Maxwell tensorialmente, resulta evidente que ellas tienen la misma forma en todos
los marcos de referencia relacionados entre sí a través de transformaciones de Lorentz,
i.e., son covariantes. De hecho, las ecuaciones de Maxwell son uno de los ejemplos más
simples de ecuaciones diferenciales relativistas para un campo 4-vectorial Aµ .

137
Capítulo 7. Electrodinámica relativista

7.3. Invariancia de gauge


Aparte de la simetría de Lorentz que está presente por construcción en la presen-
tación de la electrodinámica que hemos dado en la sección 7.2, existe una segunda
simetría, que llamamos invariancia de gauge, que resulta crucial para el desarrollo de
la electrodinámica.
Definición 7.1 (Transformación de gauge). Sea λ un campo escalar arbitrario. La
transformación Aµ 7→ A0µ , con
A0µ = Aµ − ∂µ λ, (7.30)
que reemplaza el 4-potencial Aµ por un nuevo 4-potencial A0µ , es llamada transforma-
ción de gauge. Una transformación de gauge no es una transformación de coordenadas,
sino un cambio en el 4-potencial mediado por un campo escalar λ.
En términos del potencial escalar eléctrico φ y el potencial vectorial magnético A,
~
la transformación de gauge (7.30) toma la forma
∂λ
φ0 = φ + , A~0 = A~ − ∇λ. (7.31)
∂t
Bajo una transformación de gauge (7.30), el campo electromagnético Fµν permane-
0
ce invariante. En efecto, si llamamos Fµν al campo producido por el nuevo 4-potencial
0
Aµ , encontramos
0
Fµν = ∂µ A0ν − ∂ν A0µ
= ∂µ (Aν − ∂ν λ) − ∂ν Aµ − ∂µ λ


= ∂µ Aν − ∂ν Aµ − ∂µ ∂ν λ + ∂ν ∂µ λ
= Fµν .
Esto quiere decir que el campo electromagnético es insensible a cambios en el 4-
potencial de la forma (7.30). Más explícitamente, los campos eléctrico y magnético
derivados a partir de los potenciales φ y A~ son idénticos a los campos derivados a
partir de los potenciales primados (7.31),
∂ A~0 ∂ A~ ∂ ∂λ
 ‹
0 0
E~ = − − ∇φ = − − ∇φ + (∇λ) − ∇ = E~, (7.32)
∂t ∂t ∂t ∂t
B~ 0 = ∇ × A~0 = ∇ × A~ − ∇ × ∇λ = B ~. (7.33)
La invariancia de gauge tiene dos consecuencias principales. En primer lugar, la am-
bigüedad existente en el 4-potencial, en el sentido que dos 4-potenciales relacionados
entre sí por una transformación de gauge producen el mismo campo electromagné-
tico, puede utilizarse para simplificar las ecuaciones en una situación concreta. Una
“elección de gauge” consiste en una condición adicional que se le exige al 4-potencial,
eliminando así total o parcialmente la libertad de gauge (7.30). Existen muchas eleccio-
nes de gauge posibles; desde nuestro punto de vista, son particularmente interesantes
aquellas condiciones de gauge que son covariantes.

138
7.4. Conservación de la carga

Definición 7.2 (Gauge de Lorenz). La condición de gauge

∂µ Aµ = 0 (7.34)

es conocida como gauge de Lorenz1 y tiene la virtud de ser covariante, i.e., de conservar
su forma en todos los marcos de referencia inerciales.
La condición de Lorenz fija solo parcialmente el gauge; si el 4-potencial Aµ satisface
la ec. (7.34), entonces el 4-potencial A0µ = Aµ − ∂µ λ, con ƒλ = 0, que es obtenido a
partir de una transformación de gauge sobre Aµ , también la cumple.

Usando el gauge de Lorenz, las ecuaciones de Maxwell inhomogéneas adoptan la


forma simplificada
ƒAµ = µ0 J µ . (7.35)
En ausencia de cargas y corrientes, i.e., cuando J µ = 0, la ec. (7.35) muestra que todas
las componentes del 4-potencial satisfacen la ecuación de onda.
Una segunda consecuencia de la invariancia de gauge tiene que ver con posibles
modificaciones a las ecuaciones de Maxwell. Por ejemplo, la ecuación de Proca,
 m 2
∂ν F µν + Aµ = µ0 J µ , (7.36)
h
ħ
que describe un fotón de masa m, es compatible con la simetría de Lorentz pero no con
la simetría de gauge, i.e., la ec. (7.36) mantiene su forma bajo transformaciones de
Lorentz pero no bajo transformaciones de gauge. Desde un punto de vista puramente
teórico, la única razón para rechazar la ecuación de Proca es la simetría de gauge, que
se convierte así en el motivo para la masa nula del fotón.
La invariancia de gauge y la simetría de Lorentz son los principios teóricos básicos
que dan forma a la electrodinámica. Apropiadamente generalizada, la simetría de gau-
ge es el ingrediente clave para la formulación de las teorías de gauge que describen las
interacciones débil y fuerte y que, junto con la electrodinámica, conforman el modelo
estándar de la física de partículas.

7.4. Conservación de la carga


Aplicando el operador de derivada parcial ∂µ a las ecuaciones de Maxwell inhomo-
géneas (7.28), hallamos
∂µ ∂ν F µν = µ0 ∂µ J µ . (7.37)
La conmutatividad de las derivadas parciales implica que el lado izquierdo de esta
ecuación es idénticamente cero, porque corresponde a la contracción de un tensor
1
El gauge de Lorenz debe su nombre Ludvig Lorenz (1829–1891), un físico y matemático danés, no
a Hendrik A. Lorentz (1853–1928), el físico holandés al que nos referimos cuando hablamos, e.g., de
transformaciones de Lorentz. Es habitual que los textos de física confundan ambos nombres.

139
Capítulo 7. Electrodinámica relativista

S
~

Figura 7.1: Una distribución continua de carga eléctrica fluye a través de una esfera S.
La densidad de corriente es ~, que apunta siempre hacia la derecha, y el vector unitario
normal a la superficie es n̂. En el hemisferio izquierdo de la esfera hay un flujo de carga
hacia dentro, con ~ · n̂ < 0, mientras que en el hemisferio derecho la carga fluye hacia
fuera, con ~ · n̂ > 0.

simétrico, el operador ∂µ ∂ν , con un tensor antisimétrico, el campo electromagnético


F µν . Esto significa que la 4-corriente J µ satisface la ecuación de continuidad,

∂µ J µ = 0. (7.38)

Para desentrañar el significado de la ecuación de continuidad (7.38), partimos escri-


biéndola explícitamente en términos de las componentes de la 4-corriente, J µ = (ρ, ~):
∂ρ
+ ∇ · ~ = 0. (7.39)
∂t
En esta ecuación, ρ y ~ describen una distribución continua de carga eléctrica en mo-
vimiento, un “fluido eléctrico”. Consideremos un volumen tridimensional arbitrario V
a través del cual fluye carga eléctrica, como se sugiere en la figura 7.1. Si integramos
la ec. (7.39) sobre V para un instante t fijo, obtenemos

d
Z I
ρdV + ~ · n̂dA = 0, (7.40)
dt V S

donde S es la superficie cerrada que sirve de frontera para el volumen V . Como la


integración sobre V se realiza en un instante de tiempo fijo, podemos sacar la derivada
∂ /∂ t de la integral en el primer término y escribirla como una derivada total d/d t
actuando sobre la integral de volumen. En el segundo término, hemos usado el teorema
de la divergencia para reescribir la integral de volumen de la divergencia de ~ como una
integral de superficie, donde n̂ denota el vector unitario perpendicular a la superficie.
En la ec. (7.40), el primer término representa la variación temporal de la carga
encerrada dentro de V , mientras que el segundo término representa el flujo de carga a

140
7.4. Conservación de la carga

través de S. En efecto, el ángulo entre ~ y n̂ es mayor que 90◦ en el hemisferio izquierdo


de S en la figura 7.1, i.e., en aquellos puntos donde hay un flujo neto de carga hacia
dentro de V , de manera que ~ · n̂ < 0. Similarmente, el ángulo entre ~ y n̂ es menor
que 90◦ en el hemisferio derecho de S en la figura 7.1, i.e., en aquellos puntos donde
hay un flujo neto de carga hacia fuera de V , de manera que ~ · n̂ > 0. Por lo tanto, la
integral de superficie en el segundo término de la ec. (7.40) representa la carga que
sale de V menos la carga que entra a V , i.e., el flujo neto de carga a través de S. Si
hay un aumento de carga dentro de V , el primer término en la ec. (7.40) será positivo
y el segundo negativo, porque está entrando más carga de la que sale; si hay una
disminución de carga dentro de V , el primer término en la ec. (7.40) será negativo y
el segundo positivo, porque está saliendo más carga de la que sale. Ambos términos se
compensan exactamente: la carga eléctrica se conserva.
La forma diferencial de la ecuación de continuidad muestra que la conservación de
la carga es local: no es posible hacer desaparecer carga de un lugar para simultánea-
mente hacerla aparecer en otro, porque eso violaría la ec. (7.38).
Como la ec. (7.38) es tensorial, la conservación de la carga es válida en todos los
marcos de referencia inerciales.

La 4-corriente. Las componentes de la 4-corriente J µ = (ρ, ~) son la densidad de


v denota el campo de velocidades de las cargas
carga ρ y la densidad de corriente ~. Si ~
en movimiento, entonces podemos escribir ~ = ρ~ v . Reemplazando en J µ , hallamos

J µ = ρ (1, ~
v ) = ρ0 uµ , (7.41)

donde uµ = γ (1, ~
v ) es el campo de 4-velocidades de las cargas en movimiento y

ρ
ρ0 = (7.42)
γ

es la densidad propia de carga eléctrica. Para cada evento en el espacio-tiempo, ρ0


corresponde a la densidad de carga eléctrica medida por un observador comóvil con el
flujo de carga en ese evento. A diferencia de la densidad de carga ρ = J 0 , la densidad
de carga propia ρ0 es un campo escalar, en cuyo valor están de acuerdo todos los
observadores inerciales.
Podemos entender la relación (7.42) entre ρ y ρ0 notando que el elemento de
carga dq = ρdV = ρ0 dV0 es un escalar. La contracción de la longitud a lo largo de la
dirección de movimiento tiene como consecuencia que el elemento de volumen dV es
más pequeño en un factor γ que el elemento de volumen propio dV0 , dV = dV0 /γ. (El
factor es γ, no γ3 , porque la contracción ocurre solo en la dirección del movimiento,
no en las direcciones perpendiculares). Para preservar el valor de dq, la densidad de
carga ρ debe ser mayor que la densidad propia ρ0 en el mismo factor γ, ρ = γρ0 .

141
Capítulo 7. Electrodinámica relativista

7.5. Fuerza de Lorentz


En Relatividad, la fuerza ejercida por el campo electromagnético sobre una carga
de prueba se cuantifica a través de una 4-fuerza F µ , que depende del campo Fµν en el
evento donde está la carga, del valor de la carga de prueba q y de su 4-velocidad uµ .
Básicamente la única expresión tensorial que puede construirse a partir de estos ele-
mentos es
F µ = qF µν uν , (7.43)

que es, por supuesto, la relación correcta. Como uµ F µ = qF µν uµ uν = 0 (porque es la


contracción de un tensor antisimétrico, F µν , con un tensor simétrico, uµ uν ), concluimos
que la 4-fuerza (7.43) no cambia la masa de las partículas sobre las que actúa (ver
sección 6.5).
La componente µ = 0 de la ec. (7.43) es

F 0 = qF 0ν uν = qF 0i ui = qγEi vi . (7.44)

Con [[Link]. (6.55)] F 0 = γd E/d t, hallamos

dE
= q E~ · ~
v, (7.45)
dt

donde E = p0 es la energía de la partícula. Esta ecuación nos dice que solo el campo
eléctrico, y no el campo magnético, realiza trabajo sobre la carga.
Las componentes µ = i de la ec. (7.43) son

F i = qF iν uν = qF i0 u0 + qF i j u j = qγEi + qγεi jk v j Bk . (7.46)

Con [[Link]. (6.55)] F i = γ f i , encontramos

f~ = q E~ + q~
v×B
~, (7.47)

que es  la conocida expresión de Lorentz para la fuerza que un campo electromagnético


E~, B
~ ejerce sobre una carga puntual q que se mueve con velocidad ~ v.
Para estudiar la acción de un campo electromagnético sobre una distribución con-
tinua de carga descrita por una 4-corriente J µ = (ρ, ~), resulta más apropiado utilizar
la densidad de 4-fuerza
ϕ µ = F µν Jν , (7.48)

cuyas componentes están dadas por

ϕ 0 = Ei ji , ϕ i = ρEi + εi jk j j Bk . (7.49)

142
7.6. Transformaciones de Lorentz para los campos eléctrico y magnético

7.6. Transformaciones de Lorentz para los campos eléc-


trico y magnético
Hasta ahora, nuestra exploración de la electrodinámica relativista nos ha permiti-
do comprender la covariancia de Lorentz de las distintas ecuaciones electrodinámicas,
como las ecuaciones de Maxwell, las transformaciones de gauge, la ecuación de conti-
nuidad y la fuerza de Lorentz. En esta sección encontramos un resultado genuinamente
nuevo: las leyes de transformación de los campos eléctrico y magnético bajo un boost,
que reemplazan a las ecuaciones no relativistas (1.17).
La ley de transformación para el campo electromagnético F µν bajo una transforma-
ción de Lorentz descrita por la matriz Λµν corresponde a la de un tensor de orden 2,

F 0µν = Λµρ Λνσ F ρσ . (7.50)

Esta ecuación contiene toda la información que necesitamos para establecer las leyes
de transformación para los campos eléctrico y magnético.
Poniendo Ei = F 0i , Bi = 21 εi jk F jk , y similarmente para las cantidades primadas
respectivas, y desarrollando explícitamente las sumas sobre ρ y σ en la ec. (7.50),
hallamos
€ Š
Ei0 = Λ00 Λi j − Λi 0 Λ0 j E j + ε jkl Λ0 j Λi k Bl , (7.51)
j 1 j
Bi0 = εi jk Λ 0 Λk l El + εi jk εlmn Λ l Λk m Bn . (7.52)
2
Estas son las leyes de transformación generales para los campos eléctrico y magnético
bajo una transformación de Lorentz arbitraria.

Rotación espacial. En el caso de una rotación espacial, la matriz Λµν toma la forma
(ver ejemplo 4.53)

Λ00 = 1, Λ0 j = 0, (7.53)
Λi 0 = 0, Λi j = R i j , (7.54)

donde R ik R jk = δi j . En este caso, las ecs. (7.51)–(7.52) se reducen a

1
Ei0 = R i j E j , Bi0 = εi jk εlmn R jl R km Bn . (7.55)
2
Usando las propiedades del símbolo de Levi-Civita (ver sección 4.2, p. 74), podemos
simplificar la ecuación para el campo magnético, obteniendo

Ei0 = R i j E j , Bi0 = det (R) R i j B j . (7.56)

Esto significa que, bajo una rotación espacial R ∈ O (3), el campo eléctrico se comporta
como un vector y el campo magnético como un pseudovector.

143
Capítulo 7. Electrodinámica relativista

Boost. Para un boost con velocidad Vi = V ni , la matriz Λµν toma la forma (ver ejem-
plo 4.54)

Λ00 = Γ , Λ0 j = −Γ Vj , (7.57)
k
Λi 0 = −Γ Vi , Λi j = Pi⊥j + Γ Pi j , (7.58)

k
donde Pi j y Pi⊥j son los proyectores en las direcciones paralela y perpendicular a ni ,

k
Pi j = ni n j , Pi⊥j = δi j − ni n j . (7.59)

En este caso, es posible demostrar que las ecs. (7.51)–(7.52) se reducen a


k k
Ei0 = Ei + Γ Ei⊥ + εi jk Vj Bk⊥ , Bi0 = Bi + Γ Bi⊥ − εi jk Vj Ek⊥ . (7.60)
 

Separando las ecuaciones para Ei0 y Bi0 en sus partes paralela y perpendicular a la velo-
cidad del boost, podemos escribir

E~k0 = E~k , E~⊥0 = Γ E~⊥ + V~ × B


~⊥ , (7.61)


0 0
B
~ =B ~k , B
~ =Γ B ~⊥ − V~ × E~⊥ . (7.62)

k ⊥

Estas son las leyes de transformación para los campos eléctrico y magnético bajo un
boost con velocidad V~ = V n̂.
En unidades convencionales, las ecs. (7.61)–(7.62) toman la forma

E~k0 = E~k , E~⊥0 = Γ E~⊥ + V~ × B


~⊥ , (7.63)


1
 ‹
~0 = B
B ~k , ~0 = Γ B
B ~⊥ − V~ × E~⊥ , (7.64)
k ⊥
c2

donde c = 299 792 458 m/s. Cuando V~  c, recuperamos la transformación de Gali-


leo (1.17),

E~0 = E~ + V~ × B
~, ~0 = B
B ~. (7.65)

A diferencia de las leyes de transformación de Galileo, las leyes de transformación


relativistas son simétricas en los campos eléctrico y magnético. Las componentes para-
lelas a la velocidad del boost permanecen invariantes, mientras que las componentes
perpendiculares se mezclan entre sí.

Ejemplo 7.3. Bajo un boost en dirección x, las componentes cartesianas de los campos
eléctrico y magnético cambian de acuerdo a las ecuaciones

E x0 = E x , E 0y = Γ E y − V Bz , Ez0 = Γ Ez + V B y , (7.66)
 

B 0x = B x , B 0y = Γ B y + V Ez , Bz0 = Γ Bz − V E y . (7.67)
 

144
7.7. Invariantes de Lorentz

Ejemplo 7.4. En K, el campo eléctrico es cero y el campo magnético solo tiene com-
ponente z. ¿Cuánto valen los campos eléctrico y magnético en K 0 , si K y K 0 están en
configuración estándar (cf. def. 3.3)? Usando las ecs. (7.66)–(7.67), encontramos

E x0 = 0, E 0y = −Γ V Bz , Ez0 = 0, (7.68)
B 0x = 0 B 0y = 0, Bz0 = Γ Bz . (7.69)

Esto quiere decir que en K 0 , además del campo magnético existe también un campo
eléctrico.

7.7. Invariantes de Lorentz


En esta sección estudiamos cantidades construidas a partir de los campos eléctrico
y magnético que permanecen invariantes bajo una transformación de Lorentz.
Como el campo electromagnético es un tensor de orden 2, cualquier contracción
de Fµν consigo mismo que no deje ningún índice libre debe ser un escalar. Es posible
demostrar que solo existen dos invariantes algebraicamente independientes, que están
dados por

1 1
E 2 − B 2 = − Fµν F µν , E~ · B
~ = − εµνρσ Fµν Fρσ , (7.70)
2 8

donde εµνρσ es el símbolo de Levi-Civita en 4 dimensiones, con ε0123 = 1. En estricto


rigor, E~ · B
~ es un pseudoescalar, que cambia de signo bajo una transformación impropia.
La existencia de estos invariantes significa, en particular, que sin importar cuánto
cambien los campos eléctrico y magnético bajo el boost (7.61)–(7.62), los valores que
E 2 − B 2 y E~ · B
~ tengan en el marco K deben preservarse2 en el marco K 0 .

~ = 0. Con E 2 − B 2 > 0, E~ · B
Ejemplo 7.5. En un marco K dado, tenemos E~ 6= 0, B ~ = 0,
0 0
concluimos que pueden existir marcos K donde B~ 6= 0, pero siempre debe cumplirse
que E · B = 0. No existe ningún marco K donde E~0 = 0, B
~ 0 ~0 0 ~ 0 6= 0.

Ejemplo 7.6. Si E~ · B~ 6= 0 en un marco K dado, entonces no existe ningún marco K 0


donde E~0 = 0 o B
~ 0 = 0.

Ejemplo 7.7. En un marco K dado, tenemos E 2 − B 2 < 0 y E~ · B ~ = 0. Deseamos


0 0
determinar si existe un marco K donde E~ = 0.
Asumimos tentativamente que K 0 existe y denotamos por V~ su velocidad respecto
de K. Como E~ · B
~ = 0, podemos usar E~, B ~ y E~ × B
~ como una base ortogonal en la cual
expandir V~ en la forma
V~ = κ E~ + λB ~ + µ E~ × B
~, (7.71)
2
Note que un boost es una transformación de Lorentz propia, con det (Λ) = 1.

145
Capítulo 7. Electrodinámica relativista

donde κ, λ y µ son las componentes de V~ en esa base. Poniendo E~0 = 0 en la ec. (7.61),
hallamos

E~k = 0, E~⊥ + V~ × B
~⊥ = 0. (7.72)

La primera de estas ecuaciones establece que E~ no tiene ninguna componente a lo largo


de V~ , i.e., V~ · E~ = 0. Como V~ · E~ = κE 2 , concluimos que κ = 0. (Podemos asumir que
E~ 6= 0, porque si E~ = 0 el problema está trivialmente resuelto). Con E~k = 0, E~⊥ = E~ y
podemos reescribir la segunda de estas ecuaciones en la forma

E~ + V~ × B
~ = 0, (7.73)

donde hemos reemplazado B ~⊥ por B ~ apelando a que V~ × B~ = V~ × B


~k + B
~⊥ = V~ × B
~⊥ .


Usando la expansión (7.71) para V~ , obtenemos

E~ + λB ~ + µ E~ × B
~ ×B~ = 0. (7.74)


Notando que B ~ ×B
~ = 0, desarrollando el doble producto cruz y recordando que E~ · B
~ = 0,
2 ~
encontramos que esta condición es equivalente a 1 − µB E = 0, la cual se satisface


solo si escogemos
1
µ = 2. (7.75)
B
Esto significa que existe una familia de marcos K 0 , cuyas velocidades respecto de K
están dadas por
E~ × B~
V~ = λB~+ , (7.76)
B 2

con λ arbitrario, donde E~0 = 0.

7.8. Tensor momentum-energía


El campo electromagnético posee energía y momentum lineal propios, que deben
ser tomados en cuenta junto con la energía y el momentum lineal mecánicos al es-
cribir leyes de conservación para ambas cantidades. En Relatividad, estos atributos del
campo electromagnético se describen a través de un tensor simétrico de rango 2, el ten-
sor momentum-energía (en inglés, “stress-energy tensor”) del campo electromagnético,
Tµν .
En particular, el tensor momentum-energía del campo electromagnético actúa co-
mo fuente del campo gravitacional en la teoría general de la relatividad, curvando el
espacio-tiempo de manera similar a una partícula masiva.
Vamos a deducir una expresión general para Tµν a partir de la densidad de 4-fuerza,

ϕ µ = F µν Jν . (7.77)

146
7.8. Tensor momentum-energía

Usando las ecuaciones de Maxwell inhomogéneas (7.28) para reescribir la 4-corriente


en el lado derecho, encontramos

ϕ µ = ε0 F µν ∂ λ Fνλ . (7.78)

Integramos por partes3 , antisimetrizamos y reorganizamos los índices:

ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν
1
ϕ µ = ε0 ∂ λ (F µν Fνλ ) − ε0 Fνλ ∂ λ F µν − ∂ ν F µλ

2
€ Š 1
ϕ µ = ε0 ∂λ F µν F νλ − ε0 Fνλ ∂ λ F µν + ∂ ν F λµ .

2
Usando las ecuaciones de Mawell homogéneas (7.29) para reescribir el segundo tér-
mino, hallamos
€ Š 1
ϕ µ = ε0 ∂λ F µν F νλ + ε0 Fνλ ∂ µ F νλ . (7.79)
2
Integrando otra vez por partes en el segundo término y reorganizando los índices,
obtenemos
€ Š 1
ϕ µ = ε0 ∂λ F µν F νλ + ε0 ∂ µ Fνλ F νλ

4
1 µν
 ‹
µ
ϕ = ε0 ∂ν F λ F + η Fρσ F
µ λν ρσ
.
4

Esta ecuación puede reescribirse en la forma

ϕ µ + ∂ν T µν = 0, (7.80)

donde T µν es el tensor momentum-energía del campo electromagnético,

1 µν
 ‹
µ
T = −ε0 F λ F + η Fρσ F
µν λν ρσ
. (7.81)
4
µ µ
Notando que F νλ F λµ = −F µλ F νλ = −F λ F νλ = F λ F λν , hallamos que T µν es simétrico:
T νµ = T µν . Una segunda propiedad importante de T µν es que su traza es nula:

1 µ
 ‹ € Š
µ µ
T µ = −ε0 F λ F µ + δµ Fρσ F
µ λ ρσ
= −ε0 F λ F λµ − F ρσ F σρ = 0. (7.82)
4

En particular, T µµ = 0 significa que el campo electromagnético no posee escalas inva-


riantes de masa o energía, que podrían haber servido como una masa no nula para el
fotón.
3
En este contexto, “integrar por partes” quiere decir tomar una expresión de la forma A∂µ B y, usando
la regla de Leibniz, reescribirla como A∂µ B = ∂µ (AB) − B∂µ A. Cuando A = B, esta técnica nos permite
escribir A∂µ A = 12 ∂µ A2 .


147
Capítulo 7. Electrodinámica relativista

Vamos a analizar una a una las componentes del tensor que acabamos de definir.
Poniendo µ = ν = 0 en la ec. (7.81) y realizando las sumas indicadas, hallamos

1 00 1
 ‹
00 0
T = −ε0 F λ F + η Fρσ F = ε0 E 2 + B 2 = u, (7.83)
λ0 ρσ

4 2

la densidad de energía del campo electromagnético.


Con µ = 0, ν = i (o µ = i, ν = 0, ya que el tensor es simétrico), obtenemos

1 0i
 ‹
0i 0
T = −ε0 F λ F + η Fρσ F
λi ρσ
= ε0 εi jk E j Bk = Si , (7.84)
4

donde Si es conocido como vector de Poynting.


Finalmente, con µ = i, ν = j, encontramos

1 ij
 ‹
ij i λj
T = −ε0 F λ F + η Fρσ F ρσ
4
1
• ˜
i 0j i kj 2 2
= −ε0 F 0 F + F k F − δi j E − B
2
1
• ˜
2 2
= −ε0 Ei E j + εikl εk jm Bl Bm − δi j E − B .
2

Recurriendo a las propiedades del símbolo de Levi-Civita, podemos escribir

1
• ˜
ij 2 2
T = −ε0 Ei E j + Bi B j − δi j E + B = −σi j , (7.85)
2

donde σi j es llamado tensor de Maxwell.


Resumiendo, las componentes del tensor momentum-energía son

u Sj
• ˜
µν
[T ] = , (7.86)
Si −σi j

donde la densidad de energía u, el vector de Poynting Si y el tensor de Maxwell σi j


están definidos como
1
u = ε0 E 2 + B 2 , (7.87)

2
Si = ε0 εi jk E j Bk , (7.88)
σi j = ε0 Ei E j + Bi B j − uδi j . (7.89)


Estas tres cantidades nos permiten describir los flujos de energía y momentum lineal
entre el campo electromagnético y la materia, como veremos a continuación.

∗ ∗ ∗

148
7.8. Tensor momentum-energía

Nuestro desarrollo previo muestra que el tensor momentum-energía satisface


ϕ µ + ∂ν T µν = 0, (7.90)
donde ϕ µ = E~ · ~, ρ E~ + ~ × B
~ es la densidad de 4-fuerza que el campo electromagné-


tico ejerce sobre cargas y corrientes. La interpretación de las componentes del tensor
momentum-energía está basada en las componentes de esta ecuación.
La componente temporal de la ec. (7.90) puede escribirse en la forma
∂u
E~ · ~ ++ ∇ · S~ = 0. (7.91)
∂t
Consideremos un sistema de campos y cargas en movimiento confinado al interior de
un volumen V . Integrando sobre V (ver sección 7.4), encontramos
d
Z Z I
E~ · ~dV + udV + S~ · n̂dA = 0, (7.92)
V
dt V S

donde S es la superficie que limita el volumen. En el lado izquierdo de esta ecuación,


el primer término representa el trabajo realizado por el campo electromagnético sobre
las cargas en movimiento, que es igual a la variación temporal en la energía mecánica
del sistema. Luego, los dos términos siguientes deben también corresponder a varia-
ciones en la energía. Interpretando u como la densidad de energía electromagnética,
el segundo término corresponde en efecto a su variación temporal. El tercer término,
que compensa los otros dos, es el flujo de energía a través de la superficie S que limita
el sistema. Esto quiere decir que el vector de Poynting S~ representa flujo de energía
por unidad de área, i.e., la cantidad de energía electromagnética que atraviesa una
superficie por unidad de tiempo.
Las componentes espaciales de (7.80) son
∂ Si
ϕi + − ∂ j σi j = 0. (7.93)
∂t
Integrando sobre V , hallamos
d
Z Z I
ϕi dV + Si dV − σi j n j dA = 0, (7.94)
V
dt V S

donde hemos utilizado una versión tensorial del teorema de la divergencia. En el lado
izquierdo de esta ecuación, el primer término representa la fuerza electromagnética
total que actúa sobre las cargas del sistema, que es igual al cambio en su momentum
lineal mecánico. Luego, los dos términos siguientes deben también corresponder a va-
riaciones en el momentum lineal del sistema. Interpretando el vector de Poynting S~
como la densidad de momentum lineal electromagnético, el segundo término corres-
ponde en efecto a su variación temporal. El tercer término, que compensa los otros dos,
es el flujo de moméntum lineal a través de la superficie S que limita el sistema. Esto
quiere decir que la componente σi j del tensor de Maxwell puede interpretarse como la
densidad de flujo de la componente i del momentum lineal electromagnético a través
de una superficie perpendicular a x j .

149
Capítulo 7. Electrodinámica relativista

Unidades electromagnéticas. Usando las mismas unidades (metro o segundo) para


medir tiempos y distancias, tenemos cierta libertad para escoger las unidades en que
medimos las distintas cantidades electromagnéticas que introducimos en este capítulo.
La carga eléctrica q se mide siempre en coulombios, C, con 1 C = 1 A s.
Las componentes de la 4-corriente, J µ = (ρ, ~), pueden medirse en C/m3 o en A/m2 ,
con 1 C/m3 = 299 792 458 A/m2 .
Las componentes del 4-potencial, Aµ = φ, A~ , pueden medirse en voltios, V, con


1 V = 1 J/C, o en V s/m, con 1 V s/m = 299 792 458 V.


Con c = 1, el campo eléctrico y el campo magnético se miden en las mismas uni-
dades, que pueden escogerse como N/C o T, con 1 T = 299 792 458 N/C.
Las componentes del tensor momentum-energía,

u Sj
• ˜
µν
[T ] = , (7.95)
Si −σi j

se miden todas en las mismas unidades, que pueden escogerse como J/m3 (densidad
de energía), kg/(m2 s) (densidad de momentum lineal), W/m2 (densidad de flujo de
energía) o kg/(s2 m) (densidad de flujo de momentum lineal), con

1 kg kg J W
2
= 1 2 = 1 3 = 299 792 458 2 . (7.96)
299 792 458 m s s m m m

Estas diferentes elecciones hacen que, e.g., sea lícito interpretar el vector de Poynting S~
tanto como densidad de flujo de energía o como densidad de momentum lineal.

7.9. Potenciales de Liénard–Wiechert


Los potenciales de Liénard–Wiechert permiten calcular el campo electromagnético
producido por una carga puntual en movimiento arbitrario. En esta sección vamos a
deducir estos potenciales a partir de un enfoque típicamente relativista, sin resolver las
ecuaciones de Maxwell.
El campo electromagnético en el evento P de la figura 7.2 está determinado por
la velocidad y la aceleración de la carga puntual q en el evento retardado Q, que se
encuentra intersectando el cono de luz pasado de P con la línea de mundo de la carga
puntual. Esto quiere decir que la separación espacio-temporal entre Q y P es nula o
tipo luz. La relación entre los eventos P y Q es un reconocimiento a la velocidad finita,
igual a la de la luz, con que se propagan los efectos electromagnéticos.
Llamemos x µ a las coordenadas espacio-temporales de P y y µ (τ) a las coordenadas
espacio-temporales de Q, donde τ es el tiempo propio que mide un observador comóvil
con la carga puntual. El 4-vector “desplazamiento” entre Q y P es

Rµ = x µ − y µ (τ) = (t, ~r ) , (7.97)

150
7.9. Potenciales de Liénard–Wiechert

Figura 7.2: Una carga puntual en movimiento arbitrario describe una línea de mundo
curva en el espacio-tiempo. El campo electromagnético en el evento P está determinado
por la velocidad y la aceleración de la carga puntual en el evento retardado Q.

donde t es el tiempo transcurrido entre ambos eventos y ~r es su separación espacial.


Como Rµ es tipo luz, tenemos

Rµ Rµ = −t 2 + r 2 = 0. (7.98)

El principio de causalidad exige que Q ocurra antes que P, por lo que debemos tener
t > 0. Luego, t = r > 0, y podemos escribir

Rµ = r (1, n̂) , (7.99)

donde n̂ = ~r /r es un vector unitario que apunta desde Q hacia P.


Sea K 0 el marco comóvil instantáneo de la carga puntual en el evento Q. En este
marco, el 4-potencial en P es el de Coulomb, i.e., el de una carga puntual en reposo,

1 q
φ0 = , A~0 = 0, (7.100)
4πε0 r 0

donde r 0 es la distancia entre Q y P en el marco K 0 . Como φ 0 no depende explícitamente


del tiempo, este 4-potencial cumple el gauge de Lorenz (7.34). La 4-velocidad de q en
K 0 es u0µ = (1, 0, 0, 0), por lo que podemos escribir

1 q 1 q 0µ
A0µ = (1, 0, 0, 0) = u . (7.101)
4πε0 r 0 4πε0 r 0

A su vez, las componentes de Rµ en K 0 están dadas por R0µ = r 0 (1, n̂0 ). Luego, r 0 =
−u0µ R0µ , y obtenemos
0µ q u0µ
A =− . (7.102)
4πε0 u0σ R0σ

151
Capítulo 7. Electrodinámica relativista

Figura 7.3: Las superficies equipotenciales de Liénard–Wiechert son elipsoides de re-


volución de excentricidad v. En la figura se muestra la intersección de estas superficies
con un plano que contiene la velocidad de la partícula, que en este caso tiene magnitud
v = 3/5 y apunta hacia la derecha. Los círculos en línea punteada representan el caso
coulombiano, v = 0.

Siendo manifiestamente tensorial, esta ecuación conserva su forma en todos los mar-
cos4 . Luego, podemos escribir el 4-potencial en un marco arbitrario K en la forma
q uµ q uµ
Aµ = − = , (7.103)
4πε0 uσ Rσ 4πε0 D

donde hemos definido D = −uσ Rσ . Con uµ = d y µ /dτ = γ (1, ~


v ), tenemos

D = −uσ Rσ = γr (1 − n̂ · ~
v) . (7.104)

Explícitamente, los potenciales de Liénard–Wiechert en K son

1 q 1 q~
v
φ= , A~ = . (7.105)
4πε0 r (1 − n̂ · ~
v) 4πε0 r (1 − n̂ · ~
v)

Estos potenciales nos permiten calcular el campo electromagnético generado por una
carga puntual en movimiento arbitrario, sin importar cuán cercana sea su velocidad a
la de la luz. Cuando |~v |  1, recuperamos el potencial de Coulomb. Como la condición
de Lorenz es covariante, el 4-potencial (7.103) satisface también esta condición de
gauge en el marco K. En la figura 7.3 se muestran algunas curvas con φ = const.
El campo electromagnético, Fµν = ∂µ Aν − ∂ν Aµ , involucra derivadas del 4-potencial
respecto de x µ . Si bien la 4-velocidad de la carga puntual no depende explícitamente
de x µ , sí existe una dependencia implícita que es necesario considerar. Esto ocurre
porque derivar respecto de x µ implica mover ligeramente el punto P, lo cual a su vez
implica mover también el evento retardado Q a lo largo de la línea de mundo de la carga
4
Sean Aµ y B µ dos expresiones tensoriales distintas que coinciden con el 4-potencial de Coulomb en
K , A0µ = B 0µ . Como la igualdad entre dos tensores se preserva bajo transformaciones de Lorentz, estas
0

dos expresiones tensoriales deben coincidir en todos los marcos, Aµ = B µ . Esto significa que (7.102) es
la única manera tensorial de escribir el 4-potencial de Coulomb.

152
7.9. Potenciales de Liénard–Wiechert

puntual, porque la separación tipo luz entre ambos eventos debe preservarse. Esto
quiere decir que la derivada con respecto a x µ en P puede traducirse a una derivada
con respecto a τ en Q. Usando la regla de la cadena, hallamos
∂ ∂τ d d
∂µ = = = τµ , (7.106)
∂ xµ ∂ x µ dτ dτ
donde hemos llamado τµ = ∂µ τ. Para determinar τµ , calculamos las derivadas de Rµ :
d yµ
∂ν R = ∂ν [x − y (τ)] =
µ µ µ
δνµ − τν = δνµ − uµ τν . (7.107)

Recordando que Rµ Rµ = 0, encontramos

0 = ∂ν Rµ Rµ = 2Rµ ∂ν Rµ = 2Rµ δνµ − uµ τν , (7.108)


 

de donde obtenemos
Rµ Rµ
τµ = =− . (7.109)
uσ Rσ D
Luego, cuando derivemos cantidades definidas sobre la línea de mundo de la carga
puntual respecto de x µ , vamos a usar la relación
Rµ d
∂µ = − . (7.110)
D dτ
En particular, las derivadas de Rµ pueden escribirse en la forma
uµ R ν
∂ν R =µ
δνµ + . (7.111)
D
Habiendo aclarado estos preliminares, calculamos ahora ∂µ Aν :

u D − uν ∂µ D

q u  q ∂µ ν
∂µ Aν = ∂µ ν = . (7.112)
4πε0 D 4πε0 D2
Usando la ec. (7.110), encontramos que las derivadas de la 4-velocidad son
Rµ duν Rµ αν
∂µ uν = − =− , (7.113)
D dτ D
donde αµ es la 4-aceleración de la carga puntual. Para calcular las derivadas de D,
usamos (7.111) y (7.113), recordando que uσ uσ = −1:

∂µ D = −∂µ (uσ Rσ )
= − ∂µ uσ Rσ − uσ ∂µ Rσ


Rµ ασ σ uσ R µ
 
= R − uσ δµ + σ
D D

= −uµ + (1 + ασ Rσ ) .
D

153
Capítulo 7. Electrodinámica relativista

Reemplazando en ∂µ Aν , hallamos

q 1 Rµ
§ • ˜ª
∂µ Aν = −Rµ αν − uν −uµ + (1 + ασ R )
σ
4πε0 D2 D
q 1 Rµ ũν
 
= uµ uν − ,
4πε0 D2 D

donde, solo para abreviar, hemos llamado

ũµ = uµ + uµ ασ − uσ αµ Rσ . (7.114)


Antisimetrizando, encontramos el campo electromagnético Fµν :

q ũµ Rν − ũν Rµ
Fµν = . (7.115)
4πε0 D3

Aunque correcta, esta expresión no es particularmente reveladora. Evaluando las com-


ponentes temporal y espaciales de ũµ , podemos obtener formas más explícitas para el
campo eléctrico y el campo magnético.
Calculamos en primer lugar el producto ασ Rσ , con [cf. ec. (5.20)] α0 = γ4 vk ak ,
αi = γ4 vk ak vi + γ2 ai y [cf. ec. (7.99)] R0 = r, Ri = r ni :

ασ Rσ = −γ4 vk ak r + γ4 vk ak vi + γ2 ai r ni = γ2 r nk ak − γ3 vk ak D. (7.116)


Con este resultado, determinamos ahora las componentes de ũµ = uµ + αµ D + uµ ασ Rσ ,

ũ0 = −γ 1 + γ2 r nk ak , ũi = γ2 Dai − ũ0 vi . (7.117)




Reemplazando estas componentes en Ei = Fi0 , encontramos que el campo eléctrico


está dado por

q ũi R0 − ũ0 R i q 1 + γ2 r n j a j ai
 
Ei = = (ni − vi ) − . (7.118)
4πε0 D3 4πε0 γ2 r 2 (1 − nk vk )3 r (1 − nk vk )2

El campo magnético, Bi = (1/2) εi jk F jk , puede determinarse a partir de

q ũ j R k
Bi = εi jk 3 = εi jk n j Ek . (7.119)
4πε0 D

Nuestro resultado puede resumirse en las ecuaciones

q 1 + γ2 r n̂ · a~ a~
 
E~ = v) −
(n̂ − ~ , B
~ = n̂ × E~. (7.120)
4πε0 γ2 r 2 (1 − n̂ · ~ v )3 v )2
r (1 − n̂ · ~

El campo eléctrico en la ec. (7.120) tiene dos partes; una “estática”, que va en la direc-
ción de n̂ − ~
v , y una de radiación, que va en la dirección de a~. Como se sugiere en la

154
Problemas

n̂ ~r
n̂ − ~
v r (n̂ − ~
v)

v
~ Q r~
v Q0

Figura 7.4: Dos triángulos equivalentes para ilustrar la dirección del término estático
del campo eléctrico en la ec. (7.120).

figura 7.4, la parte estática del campo eléctrico apunta desde Q0 , no desde Q, hacia P,
donde Q0 es la posición que tendría la carga puntual si continuase moviéndose con
velocidad constante desde Q durante un tiempo t = r. Este término estático sobrevive
incluso si a~ = 0, en cuyo caso es inversamente proporcional al cuadrado de la distan-
cia entre Q y P. El término de radiación existe solo si la carga puntual acelera, y es
inversamente proporcional a la distancia entre Q y P. Esto significa que disminuye más
lentamente que el término estático, contribuyendo así a la emisión de radiación elec-
tromagnética. Solo una carga acelerada radía; una carga en reposo o en movimiento
con velocidad constante produce un campo que disminuye demasiado rápido con la
distancia. En cambio, el campo de radiación producido por una carga acelerada puede
detectarse arbitrariamente lejos de la carga.

Problemas
1. Sabiendo que [cf. ec. (7.27)]
0 Ex Ey Ez
 
 −E x 0 Bz −B y 
[F µν ] =  , (7.121)
−E y −Bz 0 Bx 
−Ez B y −B x 0
escriba las matrices correspondientes para F µν y Fµν .

2. Muestre que las transformaciones de gauge Aµ 7→ A0µ = Aµ − ∂µ λ, donde λ es


un campo escalar arbitrario, forman un grupo. ¿Qué operación juega el rol de la
“multiplicación” del grupo en este caso?

3. a) Muestre que la identidad de Bianchi (7.29) se satisface automáticamente


cuando reemplazamos Fµν = ∂µ Aν − ∂ν Aµ .
b) Escribiendo explícitamente sus componentes, compruebe que esta identidad
es equivalente a las ecuaciones de Maxwell homogéneas,
∂B
~
∇·B
~ = 0, ∇ × E~ + = 0. (7.122)
∂t

155
Capítulo 7. Electrodinámica relativista

4. Demuestre que el campo electromagnético satisface la ecuación

ƒFµν = µ0 ∂µ Jν − ∂ν Jµ , (7.123)


donde ƒ = −∂ σ ∂σ es el D’Alembertiano. Concluya que, en el vacío (i.e., cuando


Jµ = 0), todas las componentes de Fµν satisfacen la ecuación de onda.

5. Es usual definir un tensor electromagnético “dual” en la forma

1
F̃ µν = εµνρσ Fρσ , (7.124)
2

donde εµνρσ es el símbolo de permutaciones de Levi-Civita, con ε0123 = +1.

a) Defina Ẽi = F̃ 0i , B̃i = 12 εi jk F̃ jk . ¿Cómo pueden calcularse Ẽi y B̃i a partir de


Ei y Bi ?
b) ¿Cuánto vale el “dual del dual”?

6. Muestre que las ecuaciones de Maxwell homogéneas [cf. ec. (7.122)] pueden
escribirse también en la forma ∂ν F̃ µν = 0, donde F̃ µν es el tensor definido en
la ec. (7.124). Proponga una generalización de las ecuaciones de Maxwell que
incluya la posibilidad de monopolos y corrientes magnéticas. ¿Es posible definir
los campos a partir de potenciales en este caso?

7. Muestre que bajo un boost con velocidad V~ = V n̂, los campos eléctrico y mag-
nético transforman de acuerdo a las ecuaciones (7.61)–(7.62). Ayuda: La identi-
dad (4.26) podría ser de utilidad.

8. Determine la ley de transformación del vector complejo K ~ = E~ + i B ~ bajo un


boost en una dirección arbitraria. Considere separadamente las componentes de
~ paralela y perpendicular a la velocidad. Concluya que E 2 − B 2 y E~ · B
K ~ son los
únicos invariantes del campo electromagnético.

9. Muestre que u2 − S 2 , donde u es la densidad de energía del campo electromagné-


tico y S~ es el vector de Poynting, es invariante bajo transformaciones de Lorentz.

10. Demuestre que el tensor momentum-energía del campo electromagnético satis-


face la identidad
T µσ T σν = ε20 I 2 δνµ , (7.125)
2
~ 2.
donde I 2 = 14 E 2 − B 2 + E~ · B


11. Muestre que si E~ · B


~ 6= 0, entonces siempre existe un marco donde E~ y B ~ son
0
paralelos. Ayuda: Haga un boost a un marco K que se mueve con velocidad V~ =
α E~ × B
~ con respecto de K, y muestre que siempre es posible encontrar un α real
que hace que los campos sean paralelos en K 0 , con V~ < 1.

156
Problemas

12. Defina las cantidades

I n = Tr (F n ) = F µ1µ2 F µ2µ3 · · · F µnµ1 , (7.126)


” —
donde F = F µν . Por ejemplo, I1 = F µµ = 0 (¿por qué?).

a) Explique por qué cada I n es invariante de Lorentz.


b) Calcule explícitamente I3 e I4 en términos de E~ y B
~.
c) Describa cualitativamente qué esperaría encontrar para I n con n ≥ 5.
d) Explique por qué la existencia de estos invariantes no contradice el hecho
que E 2 − B 2 y E~ · B
~ son los únicos invariantes de Lorentz del campo electro-
magnético.

13. Una partícula de carga q y masa m se mueve en presencia de un campo elec-


tromagnético uniforme y constante, con E~ · B ~ = 0, E 2 − B 2 = 0. Determine la
4-velocidad de la partícula como función de su tiempo propio, τ, en el marco de
referencia donde la partícula está inicialmente en reposo.
Ayuda: Debe resolver la ecuación de la fuerza de Lorentz,

duµ q
= F µν uν . (7.127)
dτ m

En general, si X (τ) es un vector columna y M es una matriz independiente de


τ, entonces la solución a la ecuación dX /dτ = M X puede escribirse en la forma
X (τ) = exp (τM ) X (0), donde la exponencial matricial se define como

1 2 1 3
exp (M ) = 1 + M + M + M + ··· . (7.128)
2! 3!

14. Obtenga el campo electromagnético producido por una carga puntual q que se
v en un marco de referencia K a partir del boost
mueve con velocidad constante ~
inverso desde su marco comóvil K 0 .

15. Una onda electromagnética plana puede escribirse en la forma

Fµν (x) = Fµν


(0)
exp (ikσ x σ ) , (7.129)

donde el tensor Fµν y el 4-vector kµ = ω, ~k son constantes.


(0)


a) Reemplace el ansatz (7.129) en la ecuación de onda, ƒFµν = 0, y muestre


que el 4-vector kµ debe ser tipo luz, kµ kµ = 0. Interprete esta ecuación en
términos de la frecuencia angular ω y el vector de onda ~k.

157
Capítulo 7. Electrodinámica relativista

b) Reemplace el ansatz (7.129) en las ecuaciones de Maxwell en el vacío,

∂ν F µν = 0, ∂λ Fµν + ∂µ Fνλ + ∂ν Fλµ = 0, (7.130)

y encuentre condiciones adicionales que deben satisfacer el campo electro-


magnético y el 4-vector kµ .
c) Use las condiciones que obtuvo en el inciso anterior para determinar cuánto
valen los invariantes de Lorentz del campo electromagnético para esta onda
plana.

158
Bibliografía

[1] W. Rindler, Introduction to Special Relativity, 2.a ed. (Oxford University Press,
1991).
[2] E. F. Taylor y J. A. Wheeler, Spacetime Physics, 2.a ed. (W. H. Freeman, 1992),
[Link]
[3] A. P. Lightman, W. H. Press, R. H. Price y S. A. Teukolsky, Problem Book in Rela-
tivity and Gravitation (Princeton University Press, 1975).
[4] J. D. Jackson, Classical Electrodynamics, 3.a ed. (John Wiley & Sons, Inc., 1999).
[5] G. Galilei, Dialogue Concerning the Two Chief World Systems, ed. por S. J. Gould,
trad. por S. Drake, 2.a ed. (Modern Library, 2002).
[6] N. D. Mermin, It’s About Time, Understanding Einstein’s Relativity (Princeton Uni-
versity Press, 2005).
[7] G. Preti, F. de Felice y L. Masiero, «On the Galilean non-invariance of classical
electromagnetism», Eur. J. Phys. 30, 381-391 (2009).
[8] A. P. French, Special Relativity, The MIT Introductory Physics Series (W. W. Norton
& Company, Inc., 1968).
[9] M. G. Aartsen y col. (IceCube), «Neutrino Interferometry for High-Precision Tests
of Lorentz Symmetry with IceCube», Nature Phys. 14, 961-966 (2018), arXiv:1709.
03434 [hep-ex].
[10] M. Mewes, «Special relativity validated by neutrinos», Nature 560, 316-317
(2018).
[11] R. Penrose, The Road to Reality: A Complete Guide to the Laws of the Universe
(Alfred A. Knopf, 2006).
[12] A. B. Stewart, «The Discovery of Stellar Aberration», Scientific American 210,
100-108 (1964), [Link]
[13] H. A. Lorentz, A. Einstein, H. Minkowski y H. Weyl, The Principle of Relativity, A
collection of original memoirs on the special and general theory of relativity (Dover,
1952).
[14] A. Pais, Subtle is the Lord, The Science and the Life of Albert Einstein (Oxford
University Press, 2005).

159
Bibliografía

[15] Bureau international des poids et mesures, The International System of Units (SI),
2019, [Link]
[16] H. Minkowski, Raum und Zeit (B. G. Teubner, Leipzig, 1909), [Link]
[Link]/wiki/Raum_und_Zeit_(Minkowski).
[17] C. Rovelli, El orden del tiempo (Anagrama, 2018).
[18] D. H. Frisch y J. H. Smith, «Measurement of the Relativistic Time Dilation Using
µ-Mesons», Am. J. Phys. 31, 342-355 (1963).
[19] B. Coll y F. San José Martínez, «Composition of Lorentz Transformations in Terms
of Their Generators», Gen. Rel. Grav. 34, 1345-1356 (2002), arXiv:gr - qc /
0106052 [gr-qc].
[20] J. L. Synge y A. Schild, Tensor Calculus (Dover, 1978).
[21] D. Lovelock y H. Rund, Tensors, Differential Forms, and Variational Principles,
Dover Books on Mathematics (Dover, 1989).
[22] D. C. Kay, Tensor Calculus, Schaum’s Outlines (McGraw-Hill Education, 2011).
[23] A. Einstein, «Die Grundlage der allgemeinen Relativitätstheorie», Ann. Phys. 49,
769-822 (1916).
[24] H. Flanders, Differential Forms with Applications to the Physical Sciences (Dover,
1989).
[25] C. W. Misner, K. S. Thorne y J. A. Wheeler, Gravitation (W. H. Freeman & Com-
pany, 1973).
[26] L. B. Okun, «The Concept of Mass», Physics Today 42, 31-36 (1989).
[27] L. B. Okun, «The concept of mass (mass, energy, relativity)», Soviet Physics Us-
pekhi 32, 629-638 (1989).
[28] G. Farmelo, «A revolution with no revolutionaries, The Planck–Einstein equation
for the energy of a quantum», en It must be beautiful, Great equations of modern
science, ed. por G. Farmelo (Granta Books, 2002), págs. 1-27.

160

También podría gustarte