0% encontró este documento útil (0 votos)
124 vistas150 páginas

Rel Especial

Este documento trata sobre la teoría especial de la relatividad. Explica los principios fundamentales de esta teoría, incluyendo los postulados de la relatividad especial y las transformaciones de Lorentz. También analiza conceptos como el espacio-tiempo, cuadrivectores y las consecuencias de la teoría para la dinámica y electrodinámica.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
124 vistas150 páginas

Rel Especial

Este documento trata sobre la teoría especial de la relatividad. Explica los principios fundamentales de esta teoría, incluyendo los postulados de la relatividad especial y las transformaciones de Lorentz. También analiza conceptos como el espacio-tiempo, cuadrivectores y las consecuencias de la teoría para la dinámica y electrodinámica.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Sobre la teoría especial de la relatividad

Juan Manuel Tejeiro Sarmiento

Enero 2021
1

Universidad Nacional de Colombia


Índice general

1. Introducción 5

2. Modelo mecánico del mundo 8


2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Leyes de Newton y principio de relatividad . . . . . . . . . . . . 9
2.3. Luz y éter: El retorno al espacio absoluto . . . . . . . . . . . . . 13
2.3.1. Un experimento crucial . . . . . . . . . . . . . . . . . . . 18

3. Principios de relatividad especial 21


3.1. Postulados de la relatividad especial . . . . . . . . . . . . . . . . 21
3.2. Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . . . 25
3.3. Propiedades de las TL . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4. Consecuencias de las TL . . . . . . . . . . . . . . . . . . . . . . . 39

4. Espacio-tiempo: estructura causal 45


4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2. Rotaciones en el plano euclideano . . . . . . . . . . . . . . . . . . 45
4.3. Cuadrivectores y el grupo de Lorentz . . . . . . . . . . . . . . . . 48
4.4. Conos de luz y relaciones de causalidad . . . . . . . . . . . . . . 52
4.5. Algebra de cuadrivectores . . . . . . . . . . . . . . . . . . . . . . 55

5. Cinemática relativista 60
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.2. Cuadrivector velocidad . . . . . . . . . . . . . . . . . . . . . . . . 60
5.3. Cuadrivector aceleración . . . . . . . . . . . . . . . . . . . . . . . 64
5.3.1. Viaje interestelar . . . . . . . . . . . . . . . . . . . . . . . 65
5.4. Cuadrivector de onda . . . . . . . . . . . . . . . . . . . . . . . . 70

6. Dinámica relativista: Fundamentos 73


6.1. Ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . . . 73
6.2. Leyes de conservación . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3. Propiedades del cuadrimomento . . . . . . . . . . . . . . . . . . . 78
6.4. Sistema centro de masa . . . . . . . . . . . . . . . . . . . . . . . 81
6.5. Energía umbral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.6. Fotones y partículas de masa propia cero . . . . . . . . . . . . . . 86

2
ÍNDICE GENERAL 3

7. Dinámica relativista: Aplicaciones 90


7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2. Colisiones elásticas . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2.1. Efecto Compton . . . . . . . . . . . . . . . . . . . . . . . 91
7.2.2. Efecto Compton inverso . . . . . . . . . . . . . . . . . . . 93
7.3. Colisiones inelásticas . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.3.1. Absorción de un fotón por un átomo . . . . . . . . . . . . 96
7.3.2. Emisión de un fotón por un átomo exitado . . . . . . . . 99
7.4. Sistemas de masa variable . . . . . . . . . . . . . . . . . . . . . . 101
7.5. Creación y aniquilación de partículas . . . . . . . . . . . . . . . . 103

8. Tensores 105
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.2. Definiciones fundamentales . . . . . . . . . . . . . . . . . . . . . 106
8.2.1. Componentes covariantes . . . . . . . . . . . . . . . . . . 107
8.2.2. Algebra tensorial . . . . . . . . . . . . . . . . . . . . . . . 110
8.2.3. Propiedades de simetría de tensores . . . . . . . . . . . . 114
8.3. Transformación general de coordenadas . . . . . . . . . . . . . . 119
8.4. Operadores vectoriales . . . . . . . . . . . . . 121

9. Electrodinámica 125
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9.2. Ecuaciones de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . 126
9.3. Magnetismo: un efecto relativista . . . . . . . . . . . . . . . . . . 128
9.4. Ecuaciones de Maxwell covariantes . . . . . . . . . . . . . . . . . 135
9.5. Transformaciones Gauge . . . . . . . . . . . . . . . . . . . . . . . 143

10.Revisión bibliográfica 147


Prefacio

El presente libro es el resultado de varios años de experiencia como profesor


de la asignatura de Relatividad para los estudiantes de la carrera de Física.
Una primera versión del libro fue publicada por la Facultad de Ciencias como
Notas de Clase, la cual, en el transcursos de los últimos dos años y con las su-
gerencias y recomendaciones de muchos de los alumnos, me ha permito mejorar
sustancialmente esta primera versión.
El objetivo fundamental de este libro es presentar los principios básicos y los
resultados fundamentales de la teoría especial de la relatividad, con énfasis en
una formulación covariante, es decir una formulación que nos permite desde un
principio, exhibir en forma explícita el carácter relativista de una teoría. Para
este fin se han organizado los temas en tres partes.
La primera parte del libro la conforman los tres primeros capítulos. El primer
capítulo es una introducción general, un segundo capítulo sobre los fundamentos
de la mecánica newtoniana, con una breve discusión sobre el problema del éter,
esto con el fin de motivar los postulados básicos de la teoría especial de la
relatividad y sus principales consecuencias, desarolladas en el tercer capítulo.
La segunda parte constituye el cuerpo central del libro. Comenzando con un
capítulo dedicado a una formulación exhaustiva del concepto de cuadrivector y
la estructura causal del espacio-tiempo, se continua con el capítulo quinto en el
cual formulamos los principios y leyes de la dinámica relativista, para tratar en
el siguiente capítulo las principales aplicaciones de la dinámica relativista.
La última parte está destinada a formular la teoría electromagnética (ecua-
ciones de Maxwell) en forma explícita relativista y a mostrar como surge el
campo magnético como un efecto relativista (capítulo octavo). Para este fin es
necesario dedicar un capítulo a la formulación y álgebra de tensores sobre el
espacio de Minkowski, partiendo de la definición de cuadrivector desarrollada
en el capítuo cuarto, sin recurir a todo el formalismo matemático de las varie-
dades y la geometría diferencial, pero manteniendo la validez general, tanto en
la notación como en los resultados fundamentales.
En un breve capítulo final se lista y se comenta una bibliografia básica sobre
relatividad especial, la cual contiene libros de divulgación, textos elementales y
avanzados, y algunos libros de interés histórico.

4
Capítulo 1

Introducción

La teoría de la relatividad (especial y general) es considerada como uno de


los más grandes logros de la mente humana y forma parte, de lo que podemos
llamar la cultura del hombre del siglo XX. A pesar del estigma de incomprensi-
bilidad que siempre ha rodeado a la teoría de la relatividad, en el sentido que su
comprensión está al alcance solamente de unos pocos especialistas, esta teoría
científica ha sido la de mayor impacto y difusión a nivel de divulgación y ha
tenido influencia definitiva sobre nuestra imagen del mundo. El desarrollo de
la teoría de la relatividad ha estado marcado por circunstancias particulares
que la diferencian de otros desarrollos de la física contemporánea, a las cuales
me referiré en esta introducción, con el fin de mostrar, por una parte el estado
actual de la teoría y por otra, el papel fundamental que ha jugado y juega esta
teoría en el desarrollo de la física actual.
La formulación de la Teoría Especial de la Relatividad dada por Einstein
en 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teoría,
o de su reformulación en términos de modelos matemáticos más sofisticados,
todo los elementos básicos que hoy conocemos de la teoría especial de la re-
latividad están contenidos en los trabajos originales de Einstein. Además, el
estilo del primer trabajo publicado por Einstein sobre el tema, a diferencia de
otros trabajos en física teórica, se caracterizó por su sencillez en la exposición,
con muy poco contenido matemático y la ausencia de referencias a artículos y
trabajos anteriores. Su conclusión fundamental, la necesidad de reformular el
concepto absoluto de simultaneidad y con él, el concepto de tiempo en física,
muestra la genialidad de Einstein, no por la complejidad de sus razonamientos
ni la complejidad en los cálculos, sino por la profundidad de sus conclusiones, las
cuales modificaron de manera radical e irreversible nuestros conceptos básicos
de espacio y tiempo.
No es cierto, como sostienen algunos escritos de divulgación sobre relativi-
dad, que el trabajo de Einstein no fue comprendido en su tiempo, pues pocos
meses después de su publicación físicos de Cracovia afirmaban que había nacido
un nuevo Copernico y ya para 1909, los principales físicos de esa época tales
como Planck, von Laue y otros, reconocieron la genialidad de Einstein y la im-

5
CAPÍTULO 1. INTRODUCCIÓN 6

portancia de sus trabajos. Es importante resaltar en este punto que de hecho


todas las ecuaciones básicas de la teoría especial de la relatividad, tales como
la contracción de longitudes, aumento de la masa con la velocidad, la equiva-
lencia masa-energía, etc., ya eran conocidas en la literatura y por lo tanto, la
física si estaba preparada para entender y asimilar las ideas de Einstein. Para
comprender esto, basta con recordar que la teoría electromagnética de Maxwell
es una teoría relativista y por lo tanto era de esperar que un estudio minucio-
so de las ecuaciones de Maxwell (recordemos el excelente trabajo realizado por
Lorentz sobre el electrón, el cual fue publicado en 1904) condujera a todas es-
tas ecuaciones relativistas, aun cuando su interpretación estuviera fuertemente
influenciada por el concepto del éter.
Claramente, el impacto de la teoría especial de la relatividad de Einstein
no se podía esperar que fuera muy grande a nivel experimental y tecnológico,
pues de hecho la posibilidad de probar experimentalmente la teoría en forma
directa era muy difícil y más significativo aún, era su escasa o prácticamente
nula aplicabilidad. Esto, debido a que los fenómenos relativistas son relevantes
en situaciones que involucren velocidades comparables a la velocidad de la luz
en el vacío (aproximadamente 300,000km/s), lo cual solo vino a ser posible con
el desarrollo de los grandes aceleradores de partículas a mediados del siglo XX.
En 1916 Einstein publica la Teoría General de la Relatividad, la cual corres-
ponde a la formulación relativista de la ley de gravitación universal de Newton.
Estos trabajos, a diferencia de sus primeras publicaciones sobre la teoría especial
de la relatividad, si requirieron de una estructura matemática muy compleja:
la geometría diferencial y el cálculo tensorial. Dos predicciones fundamentales
surgen de estos trabajos, el corrimiento del perihelio de Mercurio, efecto que ya
había sido observado, más no explicado por los astrónomos y la desviación de la
luz por el sol, cuya corroboración se da en 1919, aprovechando un eclipse total
de sol que tuvo lugar el 29 de Mayo. Más significativo aún para el desarrollo de
la teoría general de la relatividad, puede ser el descubrimiento de Hubble de la
expansión del universo en 1929, si bien Einstein no había predicho este efecto,
si estaba contenido en sus ecuaciones de la relatividad general. Este punto de la
historia marca el comienzo de la cosmología actual, la cual es una de las áreas
de investigación más activas que tenemos hoy día.
Retomando de nuevo el desarrollo de la teoría especial de la relatividad, es
importante anotar en este punto, que si bien Albert Einstein recibió el Premio
Nobel de física, no por la teoría de la relatividad, sino por su trabajo sobre el
efecto foto-eléctrico, el papel fundamental que juega la teoría de la relatividad
especial en el desarrollo de la física se comienza a reconocer a finales de la segun-
da década del siglo XX y el cual va muy de la mano con el desarrollo de la teoría
cuántica. En efecto, dado que las predicciones de la teoría de la relatividad son
significativas experimentalmente para velocidades cercanas a la de la luz, es de
esperar que sus efectos se manifiesten a escalas atómicas. Un primer ejemplo que
podemos citar es el trabajo de De Broglie (Premio Nobel), en donde, utilizando
argumentos relativistas, generaliza la hipótesis de Einstein sobre la cuantización
de la radiación electromagnética a toda la materia, es decir asocia a cualquier
partícula de momento p una longitud de onda λ = h/ |p|, postulando que las
CAPÍTULO 1. INTRODUCCIÓN 7

partículas materiales se comportan de manera similar a las ondas electromagné-


ticas, por ejemplo exhibiendo efectos de interferencia. A comienzos de la década
del veinte, Schrödinger e independientemente Heisenberg, formulan los princi-
pios de la mecánica cuántica. Si bien esta teoría era por principio no relativista,
estaba claro en el ambiente la necesidad de dar una formulación relativista de
la mecánica cuántica.
Dirac en 1928 presenta el primer desarrollo de la mecánica cuántica relati-
vista en donde se amplía sustancialmente el panorama de la física. En efecto,
hasta 1928 se conocían solamente dos partículas elementales: el electrón y el
protón. Como una consecuencia fundamental de su recién desarrollada teoría
relativista del electrón, Dirac predice la existencia del spin del electrón y la
existencia de una nueva partícula, el positrón, que es una partícula fundamental
de la misma masa del electrón pero de carga opuesta. Este hecho es posterior-
mente generalizado y se establece un resultado general de la naturaleza y es
que a toda partícula fundamental le corresponde una antipartícula. Estos de-
sarrollos condujeron entonces a la teoría cuántica de campos, que constituye el
marco teórico para entender las interacciones fundamentales de la naturaleza
(electromagnética, fuerte y débil), que rigen el comportamiento de la materia a
escala microscópica.
Hoy día la teoría especial de la relatividad es reconocida como una teoría
fundamental de la física, cuyo alcance va más allá de sus posibles aplicaciones
experimentales o tecnológicas, pues élla se enmarca en el contexto de las pro-
piedades fundamentales del espacio-tiempo, independientemente de cualquier
modelo físico utilizado para describir los fenómenos. En general, las leyes físi-
cas que rigen el comportamiento de los sistemas se formulan en términos de
relaciones (ecuaciones diferenciales) entre las variables físicas necesarias para
describir un sistema. Estas variables físicas se describen por funciones del espa-
cio y el tiempo (posición, momento, energía, etc.), cuyo comportamiento está
regido por los principios de la teoría especial de la relatividad.
Capítulo 2

Modelo mecánico del mundo

2.1. Introducción
En este capítulo presentaremos en forma resumida la situación de la física a
comienzos del siglo XX, destacando los hechos más relevantes, que nos permitan
motivar y entender mejor los conceptos y postulados fundamentales, sobre los
cuales está basada la teoría especial de la relatividad, formulada en 1905 por el
físico alemán Albert Einstein.
En la primera sección revisaremos las leyes y conceptos fundamentales de
la mecánica newtoniana, dedicando el resto del capítulo a presentar una breve
descripción de algunas de las teorías del éter, con el fín de entender el problema
central que se debatía en la física en la segunda mitad del sigloXIX, en cuanto a
la aparente inconsistencia entre la mecánica newtoniana y la recién desarrollada
teoría electromagnética.
La teoría de la mecánica formulada por Newton en el siglo XVII y enriqueci-
da por la contribución de muchos físicos y matemáticos a lo largo de los dos siglos
siguientes, se constituyó en la teoría fundamental que permitía entender, expli-
car y predecir todos los fenómenos físicos conocidos. Fue en la primera mitad
del siglo XIX que aparecieron fenómenos relacionados con el electromagnetismo
y con la luz que comenzaron a complicar la imágen (explicación) mecánica del
mundo. Esta situación se tornó más crítica en la segunda mitad del siglo con el
desarrollo de la teoría de la electrodinámica de Maxwell, pues su aparente in-
compatibilidad con la mecánica Newtoniana, reflejada no sólo en consideraciones
teóricas sino también en resultados experimentales, hacían pensar que alguna
de las dos teorías, la mecánica o la electrodinámica, debería ser abandonada
o revisada, lo cual no era un problema fácil, pues ambas teorías presentaban
una enorme cantidad de pruebas experimentales y desarrollos tecnológicos que
sustentaban su validez.

8
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 9

2.2. Leyes de Newton y principio de relatividad


Para comprender mejor los problemas que se le planteaban a la física en
el siglo XIX y preparar el terreno para entender los cambios de interpretación
necesarios que se dieron con el desarrollo de la teoría especial de la relatividad,
en esta sección revisaremos brevemente algunos conceptos fundamentales de la
mecánica newtoniana, cuyo punto de partida son las tres leyes de Newton:
Ley de la inercia- Toda partícula permanece en estado de reposo o mo-
vimiento rectilíneo uniforme respecto a cualquier sistema de referencia inercial,
mientras no actúen fuerzas externas sobre él, o equivalentemente el momento
de una partícula libre de fuerzas permanece constante, en donde la cantidad
dinámica de momento se define como

p~ = m~v (2.1)

siendo m la masa inercial de la partícula y ~v su velocidad.


Ecuación de movimiento- La fuerza aplicada sobre la partícula es igual
a la rata de cambio de su momento
d~
p d~v
F~ = =m (2.2)
dt dt
en donde la última igualdad se deduce del hecho que la masa inercial de una
partícula puntual es constante e independiente de su estado de movimiento.
Interacción entre partículas- La fuerza que una partícula A ejerce sobre
otra partícula B es igual en magnitud y en sentido opuesto a la fuerza que la
partícula B ejerce sobre A.
Para la formulación de estas leyes hay toda una serie de supuestos bási-
cos necesarios, tales como la estructura geométrica del espacio, el concepto de
tiempo, observador y sistema de referencia, magnitudes físicas y el concepto de
medida. Sin embargo, no es objeto del presente libro entrar a discutir exhausti-
vamente estos conceptos, sino nos centraremos únicamente en aquellos aspectos
que son relevantes para plantear y motivar la formulación de la teoría especial
de la relatividad.
Definamos, en primer lugar, el concepto de observador como un sistema físico
(reglas o patrón de medida espacial y relojes o patrón de medida temporal), que
permite determinar la posición y el instante de tiempo respecto a un origen
arbitrario, de un fenómeno físico (que en lo sucesivo llamaremos evento). A
este conjunto de reglas y relojes lo denominaremos sistema de referencia, cuya
representación matemática se puede realizar por el espacio R × R3 , con R los
números reales que representa el tiempo y R3 el espacio euclidiano tridimensional
que representa el espacio físico. Dotar al espacio y al tiempo con esta estructura
matemática supone (como lo asumió explícitamente Newton) que el espacio
es absoluto, homogéneo e isotrópico y obedece la geometría euclideana y el
tiempo es absoluto y homogéneo y por lo tanto son conceptos independientes
del observador.
En segundo lugar, Newton asumió que sus leyes se cumplen en el espacio
absoluto, es decir que sus leyes son válidas para un observador, cuyo sistema de
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 10

coordenadas esté fijo respecto al espacio absoluto. A este observador particular


se le llama ”sistema de referencia inercial” y lo denotaremos por Σ. Elegir un
sistema de referencia inercial es, en principio, escoger una coordenada temporal
t y un sistema de coordenadas cartesianas (x, y, z) para determinar el instante
y la posición de un evento. Que el origen de la coordenada temporal es arbi-
trario, refleja el hecho que el tiempo es homogéneo, mientras que el origen y
la orientación arbitrarias de las coordenadas espaciales ponen de manifiesto la
homogeneidad e isotropía del espacio. Si la primera ley de Newton es válida en
Σ, entonces una partícula P , sobre la cual no actúan fuerzas, debe viajar en una
línea recta y a velocidad constante respecto al sistema Σ. Así por ejemplo, si
elegimos el origen del tiempo y los ejes espaciales de tal manera, que la partícula
pase por el origen espacial en el instante t = 0 y se mueva en la dirección del
eje x positivo, entonces su posición, en un instante de tiempo cualquiera t, está
dada por
x = ux t ; y = 0 ; z = 0 (2.3)
con
~u = (ux , uy , uz ) = (ux , 0, 0) (2.4)
la velocidad de la partícula.
Consideremos otro sistema de referencia Σ0 , con respecto al cual la partícula
P permanece en reposo en su origen de coordenadas espaciales, y elijamos los
ejes espaciales de Σ0 paralelos a los del sistema de referencia inercial Σ y el origen
del tiempo de tal manera los relojes comiencen a contar el tiempo, t = t0 = 0,
cuando los orígenes de los dos sistemas se cruzan. Entonces, podemos determinar
las coordenadas espaciales y el tiempo de cualquier evento físico, bien sea con
respecto al sistema inercial Σ o con respecto al sistema de referencia Σ0 . Si
llamamos (t, x, y, z) las coordenadas de un evento físico cualquiera, medidas
respecto a Σ y (t0 , x0 , y 0 , z 0 ) las correspondientes coordenadas, medidas respecto a
Σ0 , podemos encontrar la relación entre las coordenadas del evento, medidas por
los dos sistemas de referencia Σ0 y Σ. Estas relaciones son llamadas ecuaciones
de transformación de Galileo.
Es fácil encontrar las ecuaciones de transformación de Galileo (Figura 2-1),
pues teniendo encuenta que las ecuaciones (2.3) nos dan la posición, respecto al
sistema inercial Σ, del origen de coordenadas del sistema Σ0 , entonces, las coor-
denadas (t0 , x0 , y 0 , z 0 ) de cualquier evento medidas por Σ0 , están relacionadas con
las coordenadas (t, x, y, z) del mismo evento medidas por Σ, por las ecuaciones:

t0 = t x0 = x − vt y0 = y z0 = z (2.5)

en donde se ha hecho el cambio ux = v, para rescatar la notación usual utilizada


en la literatura.
Así, en lo sucesivo v denotará la velocidad del sistema de referencia Σ0 res-
pecto a Σ. La elección de los dos sistemas coordenados de Σ y Σ0 con los ejes
coordenados paralelos y la misma orientación, así como la velocidad relativa
de los dos sistemas a lo largo de los ejes x, x0 no representa pérdida alguna
de generalidad y su justificación se encuentra en la hipótesis de isotropía del
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 11

Figura 2-1: Transformaciones de Galileo

espacio, la cual implica que la física no depende de la orientación de los ejes


coordenados, o equivalentemente, que el espacio es isotrópico. Además, en las
ecuaciones de tranformación de Galileo está implícita también la hipótesis de
homogeneidad del espacio y el tiempo, pues la elección del origen del tiempo
para los dos sistemas, en el instante en que los orígenes espaciales coinciden, es
arbitraria, indicando que cualquier instante de tiempo y todos los puntos del
espacio son equivalentes para describir los fenómenos físicos. La primera ecua-
ción de transformación, t0 = t, representa el carácter absoluto del tiempo, y
significa que (salvo la elección arbitraria del origen) el instante en el cual ocurre
un evento físico es independiente del observador y además, esta ecuación lleva
también la hipótesis implícita, que existe algún mecanismo físico apropiado que
permite transmitir información instantáneamente. Otra forma de expresar este
carácter absoluto del tiempo, es a través del concepto de simultaneidad: Si dos
eventos, que ocurren en puntos diferentes del espacio para un observador, son
simultáneos, entonces estos dos eventos son también simultáneos para cualquier
otro observador, sin importar su estado de movimiento relativo respecto al pri-
mer observador. Como veremos más adelante, la simultaneidad es uno de los
conceptos fundamentales que debe ser cuestionado y se torna en un punto muy
importante para la formulación de la teoría de la relatividad.
Una primera consecuencia de las transformaciones de Galileo, es que las leyes
de la mecánica son válidas en todos los sistemas de referencia que se muevan
a velocidad constante con respecto al sistema de referencia inercial, el cual se
encuentra en reposo con respecto al espacio absoluto. La demostración de este
resultado es directa, pues, si una partícula libre posee una velocidad
dx dy dz
~u = (ux , uy , uz ) = ( , , ) (2.6)
dt dt dt
respecto al sistema de referencia inercial Σ, entonces, se obtiene de las ecuaciones
de transformación de Galileo (2.5), que las componentes de la velocidad de la
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 12

partícula, medidas en el sistema de referencia Σ0 están dadas por:

dx0
ux0 = = ux − v u y 0 = uy uz0 = uz (2.7)
dt0
Este resultado se conoce con el nombre de teorema de adición de velocidades
de Galileo. Así, puesto que la velocidad relativa v entre los sistemas de referencia
Σ y Σ0 es constante, entoces, la partícula libre también se mueve con velocidad
constante ~u0 = (u0x0 , uy0 , uz0 ) respecto al sistema Σ0 . De manera similar, se de-
duce que la segunda ley de Newton también se satisface, pues, utilizando el
resultado anterior (ecuación (2.7)), tenemos que

p0
d~ d~u0 du d~
p
F~ 0 = 0 = m =m = = F~ (2.8)
dt dt dt dt
con el resultado adicional, que no sólo la forma de la segunda ley de Newton
F~ = d~ p
dt es la misma, como queríamos probar, sino que tanto la fuerza que
actúa sobre la partícula, como su aceleración, toman el mismo valor en los dos
sistemas de referencia. Que la tercera ley de Newton también se cumple para
el sistema de referencia Σ, se obtiene de este resultado y del carácter absoluto
de la simultaneidad, pues, la igualdad de las fuerzas de acción y reacción es
instantánea, independiente de la posición relativa de los puntos de aplicación de
las fuerzas.
Esta invarianza de las leyes de la mecánica bajo transformaciones de Galileo,
constituye el Principio de Relatividad galileano. En la formulación inicial de las
leyes de Newton, se postuló que ellas eran válidas para un observador en reposo
con respecto al espacio absoluto, que lo llamamos observador inercial o sistema
de referencia inercial, y mostramos, que si este postulado se cumplía, entonces
las leyes de Newton también eran válidas en cualquier sistema de referencia que
se moviera con velocidad constante respecto al observador inercial. Esto justifica
extender el nombre de sistema de referencia inercial, para todos los observadores
con movimiento relativo constante, respecto al observador inercial inicialmente
en reposo relativo al espacio absoluto. Así, podemos dar otras formas equiva-
lentes de enunciar el principio de relatividad galileano: Las leyes de la mecánica
son las mismas en todos los sistemas de referencia inerciales, o también, no es
posible, a través de experimentos mecánicos, determinar la velocidad del sistema
de referencia inercial con respecto al espacio absoluto.
Esta última forma equivalente de enunciar el principio de relatividad Gali-
leano, le quita todo el sentido físico al espacio absoluto, pues elimina su estatus
privilegiado de ser el único sistema de referencia con respecto al cual se cumplen
las leyes de la mecánica y por lo tanto, el espacio absoluto queda como un
concepto empíricamente vacío, por lo menos en lo que a fenómenos mecánicos
se refiere.
Esta situación, reconocida desde un principio por Newton, lo condujo a bus-
car experimentos alternativos que le permitieran determinar el movimiento con
respecto al espacio absoluto. El ejemplo más conocido en la literatura lo cons-
tituye su experimento del balde rotante, en el cual, la curvatura que toma la
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 13

superficie del agua del balde, cuando éste se encuentra en rotación, se la atribuye
a su movimiento de rotación respecto al espacio absoluto, pues este fenómeno,
sostenía Newton, tenía lugar aún en el caso que el balde se encontrara solo en
el universo. Críticas a este análisis son igualmente abundantes en la literatura,
siendo la de Mach la más conocida, pues parte del análisis que llevó a Einstein a
formular los principios de la Teoría General de la Relatividad está basado sobre
los trabajos de Mach.
No es objeto de la presente sección profundizar más sobre este tema, pues
volveremos sobre el problema del espacio absoluto, cuando discutamos las teorías
del éter y los fenómenos electromagnéticos. Sin embargo, es importante dejar
claro un aspecto referente a este tema: Dada la imposibilidad de determinar el
movimiento absoluto (a velocidad constante) a través de fenómenos mecánicos,
Newton recurrió, entonces, a sistemas de referencia acelerados, para los cuales
las leyes de la mecánica ya no permanecen invariantes y claramente, los efectos
de la aceleración si son detectables (las, no bien llamadas fuerzas ficticias, tales
como la fuerza centrífuga o la fuerza de coriolis, que surgen en sistemas de refe-
rencia acelerados), pero aún, en este caso de sistemas de referencia no inerciales,
cualquier referencia al espacio absoluto sigue siendo superflua.

2.3. Luz y éter: El retorno al espacio absoluto


Hasta comienzos del siglo XIX todos los fenómenos físicos, incluidos los de
la óptica, admitían una explicación mecánica. Esto nos permite comprender, en
gran parte, por qué esta imágen mecánica del mundo se extendió hasta finales del
siglo XIX, tratando de explicar fenómenos tales como la propagación de las ondas
de luz, y todos aquellos fenómenos relacionados con la teoría electromagnética
de Maxwell. Un ejemplo, que ilustra muy bien esta concepción, lo podemos
encontrar en la siguiente cita debida a Lord Kelvin: ”No estaré contento hasta
que pueda construir un modelo mecánico del objeto que estoy estudiando. Si lo
puedo lograr significa que lo he entendido, de lo contrario no.”.
En este parágrafo describiremos brevemente dos desarrollos de la física del
siglo XIX, el carácter ondulatorio de la luz descubierto por Young y Fresnel y la
electrodinámica de Maxwell, que constituyen, en mi opinión, el punto de partida
más directo para formular los principios y conceptos de la teoría especial de la
relatividad.
El sonido es la propagación de ondas longitudinales en un medio material, en
donde la velocidad de propagación está dada por la ecuación debida a Newton:
s
Y
v= (2.9)
ρ

en donde Y es el módulo de elasticidad del medio y ρ la densidad del medio.


Además, la velocidad del sonido es independiente de la fuente, pero depende
de la velocidad del medio en el cual se transmite. De manera similar, se tra-
bajaron modelos para explicar los fenómenos de la luz, como los desarrollados
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 14

por Hooke y Huygens, en donde la luz se consideraba como alguna forma de


onda longitudinal, que se propagaba a través del espacio. Newton trabajó este
modelo por algún tiempo, pero dada la imposibilidad de explicar la polariza-
ción de la luz, desarrolló el modelo corpuscular, capaz de explicar este efecto y
de dar cuenta de otras propiedades conocidas de la luz, desplazando al modelo
ondulatorio de Huygens.
La teoría corpuscular de la luz permaneció vigente hasta comienzos del siglo
XIX, cuando Young y Fresnel explicaron los nuevos fenómenos de interferencia
y difracción, con base en la teoría ondulatoria, relegando a la teoría corpuscular
newtoniana, a un capítulo más de la historia de la física. Sin embargo, de la
misma manera que el sonido necesita de un medio para propagarse, se vió la
física avocada a postular un medio material para la propagación de las ondas de
luz. Este medio material, que optaron por llamar éter, debería ser de naturaleza
diferente a la materia conocida hasta entonces. Es importante anotar, que el éter
en la física no era una idea completamente original, pues ya había sido usado
antes para ”explicar” muchos otros fenómenos. Por ejemplo, Newton, sugiere
que el éter puede estar asociado con la gravitación, con los fenómenos eléctricos
y magnéticos, con la propagación del calor etc.. A este respecto, Young aclara,
que el éter a través del cual se propaga la luz no necesariamente es el mismo
que el éter eléctrico, y por esta razón Young propone llamarlo éter lumínico.
Una vez aceptado que la luz es un fenómeno ondulatorio, comenzaron a
desarrollarse teorías y modelos mecánicos del éter, para explicar el mecanismo
de propagación de las ondas de luz en este medio. Young y Fresnel fueron los
primeros en encontrar que las ondas de luz deben ser transversales, para poder
explicar el fenómeno de polarización. Este hecho exigía, entonces, un esfuerzo
teórico muy grande para comprender el mecanismo de transmisión de ondas
transversales en un medio elástico, dado que ésto requería que el medio de
transmisión, el éter, tuviera un coeficiente de rigidez muy grande, pues, como lo
demostró Poisson, ondas longitudinales y transversales se podían propagar en
un sólido, con
v⊥ = (η/ρ)1/2 (2.10)
la velocidad de las ondas transversales y

vk = ([k + 4η/3]/ρ)1/2 (2.11)

la velocidad de las ondas longitudinales, siendo η el módulo de rigidez, k el


módulo de elasticidad volumétrico y ρ la densidad del sólido. Una dificultad, de
este modelo mecánico del éter, era la ausencia de componente longitudinal de
las ondas de luz, lo que llevó a Cauchy a sugerir, que el éter debía tener una
compresibilidad negativa, de tal manera que el factor k + 4η/3, en la ecuación
(2.11), se anulara. Estas teorías estaban basadas sobre las propiedades conocidas
de los medios elásticos, pero la combinación tan inusual de las propiedades que
debería tener el éter, condujeron a MacCullagh a postular, que este medio era
un nuevo tipo de sustancia elástica, diferente a las conocidas y asociándole otras
propiedades desarrolló una teoría más sofisticada, con un sistema de ecuaciones,
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 15

muy parecido a las ecuaciones de Maxwell, que fue intensamente trabajado en


la segunda mitad del siglo XIX.
A diferencia de las propiedades mecánicas del éter, anteriormente discutidas,
para las cuales era difícil proponer experimentos directos que las verificaran, el
teorema de adición de velocidades de Galileo, que se cumple también para las
ondas en un medio mecánico, permitió proponer y realizar toda una serie de
experimentos para medir la velocidad de la luz, desde un sistema de referencia
móvil respecto al éter. La situación se plantea de la siguiente forma: De la teoría
de propagación de las ondas en un medio elástico, sabemos que:

~u0 = ~u − ~v (2.12)

en donde ~u es la velocidad de propagación de las ondas, medida en sistema de


referencia inercial Σ, el cual está en reposo con respecto al medio de propagación
(el éter para el caso de ondas de luz), ~u0 es la velocidad de las ondas, medida
por un observador en un sistema de referencia inercial Σ0 , que se mueve con
velocidad ~v respecto a Σ.
En 1728 Bradley descubrió el fenómeno de aberración de la luz, que consiste
en el cambio aparente de posición de las estrellas en diferentes épocas del año
(Figura 1.2). Este efecto se explica fácilmente, si se supone que el éter está
en reposo respecto al sol, pues, dado que la tierra se mueve con una velocidad
aproximada de 30km/s en su órbita alrededor del sol y, por lo tanto, si tomamos
una estrella colocada perpendicularmente al plano de translación de la tierra,
el telescopio debe inclinarse un ángulo adicional dado por vc sin θ, en donde v
es la velocidad orbital de la tierra, c la velocidad de la luz respecto al éter y
θ mide la posición angular instántanea de la estrella respecto a la tierra. Esta
interpretación fue capaz de dar el valor correcto de la aberración observada, a
primer orden en v/c.
Es de anotar, que los experimentos de aberración de la luz estelar no eran
capaces de dar el valor de la velocidad absoluta de la tierra respecto al éter, sino
solamente cambios de la velocidad relativa de la tierra respecto al éter.
Arago en 1810 propuso una modificación al experimento de aberación, que
sí permitiría medir la velocidad absoluta de la tierra respecto al éter, pues de
acuerdo con la teoría clásica, si la luz atravesaba un medio refractivo (como
el agua o un vidrio), el cual estuviera moviéndose respecto al éter, entonces la
velocidad de la luz respecto a este medio variaba, dependiendo de la dirección
relativa de movimiento del medio y el éter, es decir, el índice de refración del
medio dependería de la dirección relativa de movimiento. Arago colocó un prisma
en el telescopio y observó diferentes estrellas, esperando encontrar variaciones
del ángulo de aberración. El resultado negativo de su experimento, condujo a
Fresnel a proponer la teoría del arrastre parcial del éter por los medios materiales
en movimiento y mostró que este arrastre parcial del éter hacía inobservable el
efecto del viento de éter en medios materiales, en órdenes de magnitud de v/c.
Basados sobre este mismo principio, se realizaron toda una serie de experi-
mentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obteniéndose
también resultados negativos. Sin embargo, no se podía estar seguro que las
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 16

Figura 2-2: Aberración de la luz estelar

condiciones experimentales fueran lo suficientemente adecuadas para medir los


pequeños efectos que se estaban buscando. Además se agregaba la dificultad que
al utilizar luz blanca, el índice de refración de la luz en un medio dependía de
la frecuencia y por tanto cada color (frecuencia) sufría un arrastre diferente.
Los problemas de la teoría del éter no se centraban únicamente en la de-
terminación de la velocidad absoluta de la tierra respecto al éter, sino también
tenían que dar cuenta de los demás efectos conocidos, tales como las leyes de
reflexión, refracción, polarización, cristales ópticos, etc, lo cual conducía a com-
plicar cada vez más el modelo mecánico del éter.
Un elemento adicional que se sumaba a esta historia del éter, lo constituye el
desarrollo de las teorías de la electricidad y el magnetismo, que culminan hacia
mediados del siglo XIX con las ecuaciones de Maxwell y con el descubrimiento,
tal vez el más importante de ese siglo, que la luz son ondas electromagnéticas.
A partir de este momento el éter se asoció como el medio de propagación de los
campos eléctricos y magnéticos. Pero un punto más importante para nuestra
discusión de los orígenes de la teoría especial de la relatividad, lo constituye
el hecho de que las leyes del electromagnetismo de Maxwell no satisfacen el
principio de relatividad de Galileo. Lo que resta de esta sección lo dedicaremos
a explicar el significado de este hecho y sus implicaciones.
Que las leyes del electromagnetismo de Maxwell no satisfacen el principio de
relatividad de Galileo significa que las ecuaciones de Maxwell no permanecen
invariantes, cuando se realiza una transformación de Galileo entre dos sistemas
de referencia inerciales, o en otros términos equivalentes, si suponemos que las
ecuaciones de Maxwell son válidas en un sistema de referencia inercial Σ, en-
tonces ellas cambiarán para cualquier otro observador inercial Σ0 , que se mueva
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 17

Figura 2-3: Experimento de Truton-Noble

con respecto a Σ. Este cambio se refleja en que a las ecuaciones de Maxwell le


aparecen nuevos términos, que van a depender de la velocidad relativa de los
sistemas. Estos nuevos términos dependientes de la velocidad en las leyes de la
electrodinámica deben producir efectos observables y por tanto, deben permitir
determinar la velocidad del sistema de referencia Σ0 del observador, respecto
al único sistema de referencia inercial para el cual las ecuaciones de Maxwell
toman su forma más simple.
Esta situación de las leyes del electromagnetismo rescataba entonces el con-
cepto de espacio absoluto, identificado a su vez con el sistema de reposo del
éter, pero ahora y a diferencia del caso de la mecánica de Newton, dándole un
significado físico: Las leyes de la electrodinámica son válidas solamente en el
sistema de referencia en reposo con respecto al espacio absoluto.
Para ilustrar esta situación, consideremos dos cargas +q y −q, unidas por
una varilla rígida aislante (Figura 2-3). Si este sistema está en reposo respecto
al espacio absoluto Σ, la única fuerza entre las cargas es la eléctrica, dada por
la ley de Coulomb. Pero si estas cargas se encuentran en reposo en otro sistema
de referencia inercial Σ0 que se mueva respecto Σ a una velocidad v, entonces
aparecerá un campo magnético y así, una fuerza, adicional a la fuerza eléctrica,
debida al movimiento de las cargas, que producirá, por lo tanto, un par de
fuerzas que tenderá a hacer girar el sistema. Este experimento, con resultado
negativo, fue llevado a cabo por Trouton y Noble, esperando encontrar una
2
fuerza magnética que dependía de la relación vc2 , siendo v la velocidad de la
tierra. Es de anotar, que el diseño experimental utilizado para realizar este
experimento, permitía medir cantidades del orden de magnitud de v 2 /c2 ∼ 10−8 .
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 18

2.3.1. Un experimento crucial


El experimento más notable, y de referencia obligada en todo tratado de
relatividad, lo constituye el realizado por Michelson y Morley en 1887. Es in-
teresante notar, que Einstein no hace referencia alguna a este experimento en
sus primeros artículos, en donde desarrolla la teoría especial de la relatividad y
de hecho, varios historiadores de la ciencia afirman que ni siquiera lo conocía.
La importancia histórica de este experimento y su obligatoria referencia, la po-
demos entender por dos aspectos: primero, el diseño del experimento permitía
medir, con una precisión suficiente (corrimientos del patrón de interferencia me-
nores a 1/100 de franja), evitando así el problema que se presentaba en todos
los otros experimentos realizados hasta entonces, en cuanto a que el orden de
magnitud de los efectos esperados, eran siempre menores o del mismo orden que
el error experimental, dejando siempre un velo de duda sobre los resultados ob-
tenidos. Segundo, el resultado negativo del experimento de Michelson y Morley
generó toda una serie de trabajos teóricos, que impulsaron el desarrollo de la
física y abrieron el camino para la formulación de la teoría de la relatividad.
Tal vez, el más importante de estos trabajos fue el realizado por Lorentz,
que culminó con su libro sobre la teoría del electrón publicado en 1904. Es
interesante, mas no sorprendente, anotar cómo, en este libro, se encuentran to-
das las ecuaciones que describen los fenómenos más significativos que predice
la relatividad, como por ejemplo, las transformaciones entre sistemas de refe-
rencia inerciales (llamadas hoy transformaciones de Lorentz), las ecuaciones de
contracción de longitudes y dilatación del tiempo, la variación de la masa iner-
cial con la velocidad, etc, solamente que su interpretación, en términos de las
propiedades del éter, era incorrecta, en cuanto a que, estos efectos esperados,
siempre se compensaban con otros debidos al éter, de tal manera que ninguno
de ellos resultaba ser observable. Este trabajo teórico de Lorentz resolvía, así, la
aparente inconsistencia entre los dos grandes pilares de la física conocidos hasta
entonces, la mecánica de Newton y la electrodinámica de Maxwell, pero dejaba
el problema fundamental sin resolver: el espacio absoluto y la indetectabilidad
del éter.
Anotábamos en el parágrafo anterior, que no es una sorpresa que el trabajo
de Lorentz contenga todas las ecuaciones relativistas, pues está basado sobre
la electrodinámica de Maxwell, que como veremos en un capítulo posterior, es
una teoría relativista. Igualmente, esta anotación nos permite también entender,
por qué no era necesario que Einstein conociera el experimento de Michelson
y Morley para desarrollar la teoría de la relatividad. En efecto, basta con re-
cordar el título del primer artículo publicado por Einstein sobre el tema:“Zur
Elektrodinamik der bewegten Körper” (Sobre la electrodinámica de los cuerpos
en movimiento).
El experimento de Michelson-Morley fue realizado en 1887, utilizando como
principio físico el fenómeno de interferencia de la luz. El diseño experimental es
bosquejado en la (Figura 1.4). De la fuente S sale un haz de luz que incide sobre
un espejo semitransparente A, el cual divide al haz en dos rayos mutuamente
perpendiculares, los cuales se reflejan en los espejos planos B y C, retornando
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 19

Figura 2-4: Experimento de Michelson-Morley

al espejo A, en donde, el rayo proveniente del espejo C es desviado hacia el


objetivo O, mientras que el rayo reflejado en B atraviesa el espejo A y llega al
objetivo O, donde se observan franjas de interferencia, las cuales dependen de
la diferencia de caminos ópticos entre los dos rayos de luz.
Supongamos, sin pérdida de generalidad y para simplicar el análisis, que
los caminos AB y AC de los dos haces de luz son iguales. Sea ~v la velocidad
de la tierra respecto al éter y paralela al brazo AC del interferómetro. Así, la
velocidad del viento del éter respecto al interferómetro, fijo a la tierra, está en
la dirección de CA (ver Figura 1.4), suponiendo que no hay arrastre parcial
del éter. De acuerdo con las teorías del éter, la velocidad de la luz relativa al
laboratorio es c − v, cuando va de A hacia C y c + v cuando regresa de C hacia
1
A, mientras que la velocidad del otro rayo de luz es (c2 − v 2 ) 2 en la dirección
de A hacia B y de B hacia A.
Entonces, si la longitud de cada uno de los brazos del interferómetro es L,
la diferencia de tiempos de llegada de los dos rayos está dada por:
2Lc 2L
∆t = tACA − tABA = −√ (2.13)
c2 − v 2 c − v2
2

2L 1 1
= ( −p ) (2.14)
c 1 − v 2 /c2 1 − v 2 /c2

Utilizando la expansión en serie


1
(1 + x)r = 1 + rx + r(r − 1)x2 + · · · (2.15)
2!
CAPÍTULO 2. MODELO MECÁNICO DEL MUNDO 20

la cual es convergente para |x| < 1, se desarrolla cada fracción hasta términos
del orden de v 2 /c2 , obteniendo:

v2
∆t ' L (2.16)
c2
Si rotamos el interferómetro 90◦ , el tiempo para recorrer el camino ABA
será ahora mayor que el tiempo para el camino ACA, y la diferencia de tiempos
∆t estará dada por
v2
∆t ' −L 2 (2.17)
c
Por lo tanto, el cambio total en la diferencia de tiempos al rotar el interfe-
rómetro es igual a
v2
2L 2 (2.18)
c
Si λ es la longitud de onda de la luz utilizada, entonces la rotación del
interferómetro da lugar a un corrimiento de n franjas, dado por:

2L v 2
n= (2.19)
λ c2
Michelson y Morley utilizaron en su experimento luz de longitud de onda
de 5,9 × 10−7 m y un camino de L = 11m, logrado por múltiples reflexiones.
Tomando para la velocidad de la tierra alrededor del sol 30km/s, se esperaba
un corrimiento de aproximadamente 0,37 franjas, el cual, como ya se ha dicho
no fue observado.
Capítulo 3

Principios de relatividad
especial

En este capítulo formularemos los postulados fundamentales sobre los cuales


está basada la teoría especial de la relatividad y obtendremos las ecuaciones
de transformación entre sistemas de referencia inerciales (transformaciones de
Lorentz). Concluiremos el capítulo estudiando las propiedades de las transforma-
ciones de Lorentz y sus consecuencias sobre la medida de intervalos temporales
y espaciales.

3.1. Postulados de la relatividad especial


Como fue anotado en el capítulo anterior, la teoría desarrollada por Lorentz
solucionaba la aparente inconsistencia de la mecánica newtoniana y la electro-
dinámica de Maxwell, manteniendo inmodificados los principios y postulados
físicos sobre los cuales se basaban estas teorías. La aproximación de Einstein
a este problema es diferente, pues está basada sobre dos postulados de carác-
ter fundamental, en el sentido de que estos postulados deben ser satisfechos
por cualquier teoría física que se proponga, independientemente de las leyes y
principios que se postulen para describir esta teoría.
Postulado 1: Las leyes físicas son independientes del sistema de referencia
inercial, con respecto al cual se midan las variables que describen al sistema
físico considerado.
Postulado 2: La velocidad de la luz en el vacío es la misma para todos los
observadores inerciales, independiente de la dirección de propagación y de la
velocidad de la fuente emisora.
El primer postulado propuesto por Einstein es conocido también como el
Principio de Relatividad, el cual generaliza el principio de relatividad galileano
a todas las leyes de la física. El costo de aceptar este postulado es el de aban-
donar las transformaciones de Galileo, que relacionan las coordenadas de los
eventos medidas por diferentes observadores inerciales y de paso, se hace nece-

21
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 22

sario revisar las leyes de la mecánica newtoniana. Pues, como vimos en la parte
final del capítulo anterior, las ecuaciones de Maxwell no eran invariantes bajo
transformaciones de Galileo, indicando que las leyes del electromagnetismo no
obedecían el principio de relatividad de Galileo.
Sin embargo, los experimentos realizados para demostrar este hecho daban
todos resultados negativos y no es aventurado pensar que fue esta situación la
que llevó a Einstein a postular, que las leyes de la electrodinámica sí satisfacían
el principio de relatividad, pero entonces ésto exigía abandonar las ecuaciones de
transformación de Galileo, como la forma correcta de expresar las transformacio-
nes entre sistemas de referencia inerciales. Esto implicaba también que deberían
ser modificadas las leyes de la mecánica de Newton, las cuales sí permanecen
invariantes bajo transformaciones de Galileo.
El segundo postulado de la Teoría de la Relatividad establece que la veloci-
dad de la luz en el vacío es constante, independiente del sistema de referencia
inercial desde el cual ésta sea medida. Cómo llegó Einstein a este resultado, es un
problema que ha sido objeto permanente de debate en la historia de la ciencia.
Ninguno de los experimentos realizados en el siglo XIX se puede considerar como
evidencia directa de la constancia de la velocidad de la luz en el vacío. Es claro
a la luz de este postulado, el resultado negativo del experimento de Michelson
y Morley y podría pensarse, como lo afirma Grünbaum, que Einstein incorpora
este resultado nulo como un axioma, a través del principio de la constancia de
la velocidad de la luz. Aun cuando en una entrevista realizada por Shankland a
Einstein en 1950, le afirma que él no estaba familiarizado con el experimento de
Michelson y Morley cuando escribió su artículo en 1905, Shankland hace notar
que en este artículo Einstein hace referencia a ”intentos fallidos para detectar
cualquier movimiento de la tierra respecto al éter lumínico”, lo que indica según
Shankland, que Einstein tenía referencia de los diferentes experimentos ópticos
realizados, pero no de los detalles própios de cada experimento.
Una aproximación alternativa para buscar los orígenes de este segundo pos-
tulado, la podemos encontrar en la teoría de la electrodinámica de Maxwell,
pues si aceptamos su validez y el principio de relatividad, podemos encontrar
el principio de la constancia de la velocidad de la luz, así como también el pos-
tulado de la constancia de la carga eléctrica, el cual juega un papel igualmente
importante en física.
Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un
observador inercial Σ toman la forma
~ ·E
∇ ~ = ρ/ε0 (3.1)

~ ·B
∇ ~ =0 (3.2)
~
∇ ~ = µ0 J~ + µ0 ε0 ∂ E
~ ×B (3.3)
∂t
~
~ ×E
∇ ~ = − ∂B (3.4)
∂t
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 23

con µ0 = 4π × 10−7 N w/(amp)2 la permeabilidad magnética del vacío y ε0 =


8, 854 × 10−12 coulomb2 /N w · m2 la constante dieléctrica del vacío.
La primera ecuación de Maxwell corresponde a la ley de Gauss y establece
que las cargas son fuente del campo eléctrico, siendo ρ la densidad de carga. La
segunda ecuación afirma que no existen cargas magnéticas aisladas. El primer
término de la tercera ecuación corresponde a la ley de Ampère y significa que
las corrientes eléctricas son fuente del campo magnético, con J~ la densidad de
corriente, mientras que el último término, conocido como corriente de desplaza-
miento de Maxwell, establece que variaciones temporales del campo eléctrico son
también fuente del campo magnético. La última ecuación es la ley de inducción
de Faraday, en la cual variaciones temporales del campo magnético producen
campos eléctricos.
Las ecuaciones de campo de Maxwell se completan con una ecuación de
movimiento, la cual establece que la fuerza sobre una partícula de carga q en
presencia de un campo electromagnético está dada por :

F~ = q E
~ + q~u × B
~ (3.5)

conocida como la fuerza de Lorentz.


Si tomamos la divergencia de la tercera ecuación de Maxwell, haciendo uso de
la ley de Gauss (primera ecuación) y del hecho que la divergencia del rotacional
siempre es cero, obtenemos la ecuación de continuidad para la carga eléctrica
∂ρ ~ ~
+∇·J =0 (3.6)
∂t
Integrando en todo el espacio y aplicando el teorema de Gauss, se llega al
principio de conservación de la carga:
ˆ
d dQ
ρdV = =0 (3.7)
dt dt
Este resultado es independiente del estado de movimienento de la carga y
existe muchísima evidencia experimental que lo corrobora. Por ejemplo, si la
carga dependiera de la velocidad, el átomo de hidrógeno podría no ser eléctri-
camente neutro, ya que en promedio, la velocidad del electrón en el átomo es
mayor que la velocidad del protón.
Considerando otro sistema de referencia inercial Σ0 y asumiendo el principio
de relatividad, las ecuaciones de Maxwell en este nuevo sistema están dadas por:
~0·E
∇ ~ 0 = ρ0 /ε0 (3.8)

~0·B
∇ ~0 = 0 (3.9)
~0
∇ ~ 0 = µ0 J~0 + µ0 ε0 ∂ E
~0×B (3.10)
∂t0
~0
~0×E
∇ ~ 0 = − ∂B (3.11)
∂t0
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 24

en donde las cantidades primadas se refieren a sus valores medidos por el ob-
servador Σ0 . Siguiendo los mismos pasos anteriores, obtenemos la ecuación de
continuidad en el sistema de referencia Σ0
∂ρ0 ~ 0 ~0
+∇ ·J =0 (3.12)
∂t0
y el principio de la invarianza de la carga, que para el caso de una partícula
elemental su valor invariante corresponde al valor medido de la carga, cuando
ésta se encuentra en reposo respecto al sistema de referencia inercial Σ0 .
Una suposición fundamental que está implícita en el principio de relativi-
dad, es que parámetros tales como la carga , la masa, etc., de una partícula
fundamental, cuando son medidos respecto a un sistema de referencia Σ para
el cual la partícula está en reposo, toman el mismo valor numérico cuando se
miden con respecto a otro sistema de referencia inercial Σ0 cuando la partícula
se encuentra en reposo relativo respecto a este sistema Σ0 . Si aceptamos esta
suposición, entonces el principio de la constacia de la carga eléctrica, se obtiene
de las ecuaciones de Maxwell y del principio de relatividad.
Consideremos, ahora, las ecuaciones de Maxwell en el vacío (ρ = 0, J~ = ~0),
en un sistema de referencia inercial Σ y tomemos el rotacional de la última
ecuación de Maxwell (la ley de inducción de Faraday), entonces, teniendo en
cuenta la identidad vectorial
~ ×∇
∇ ~ ×E
~ = ∇(
~ ∇~ · E)
~ − ∇2 E
~ (3.13)

~ ·E
y la primera ecuación de Maxwell en el vacío ∇ ~ = 0, obtenemos

~
∂2E
~ − µ0 ε0
∇2 E =0 (3.14)
∂t2
Esta relación corresponde a la ecuación de ondas electromagnéticas (con una
ecuación similar para el vector campo magnético), y describe la radiación elec-
tromagnética producida por algún sistema de cargas aceleradas, y cuya velocidad
de propagación en el vacío, viene dada por:

c = 1/ µ0 ε0 (3.15)

siendo esta velocidad de propagación, independiente de la velocidad de la fuen-


te (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validez del
principio de relatividad y consideramos otro sistema de referencia inercial Σ0 ,
obtenemos, siguiendo un razonamiento similar, la ecuación de ondas en el siste-
ma de referencia Σ0 :
2 ~0
~ 0 − µ00 ε00 ∂ E = 0
∇02 E (3.16)
∂t02
Esta ecuación describe la propagación de las ondas electromanéticas con
una velocidad (µ00 ε00 )−1/2 en el vacío, la cual, como para el caso del sistema de
referencia Σ, es también independiente del movimiento de las cargas fuente.
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 25

Si definimos el amperio a través de la ley de Biot-Savart, como la corriente


que circula por dos hilos paralelos infinitos, separados por una distancia de un
metro en el vacío, para que sobre cada hilo se experimente una fuerza por unidad
de longitud de 2 × 10−7 N w, entonces el valor de la constante permeabilidad
magnética del vacío es:

µ00 = µ0 = 4π × 10−7 N w/m (3.17)

Por otra parte, si suponemos que la ley de Coulomb es válida en los dos
sistemas de referencia inerciales Σ y Σ0 , y que la fuerza de Coulomb, entre dos
partículas iguales en reposo relativo, por ejemplo dos electrones o protones, es
la misma en ambos sistemas de referencia inerciales, entonces ε00 = ε0 y por lo
tanto la velocidad de la luz es independiente del sistema de referencia inercial
desde el cual ésta sea medida e independiente del movimiento de las fuentes.
Si aceptamos ahora, que el postulado de la constancia de la velocidad de
la luz es válido, y las ecuaciones de Maxwell son correctas, entonces ε00 = ε0 y
también µ00 = µ0 .
Del postulado de relatividad también se deduce un principio general, el cual
implica que las unidades fundamentales de longitud, tiempo, masa y carga eléc-
trica deben ser definidas en la misma forma en todos los sistemas de referencia
inerciales (salvo a lo más un factor de escala), así como también las constantes
fundamentales de la física: la constante de Planck h = 6, 626 × 10−34 J · s, la
constante de gravitación universal de Newton G = 6, 670 × 10−11 N w · m2 · kg −2
y la velocidad de la luz en el vacío c = 2, 998 × 108 m · s−1 .
Como fue originalmente propuesto por Planck, estas constantes fundamenta-
les c, G y ~ = h/2π, pueden ser conbinadas para dar las unidades fundamentales
de longitud, tiempo y masa:

Lp := (G~/c3 )1/2 = 1, 616 × 10−35 m (3.18)

Tp := (G~/c5 )1/2 = 5, 39 × 10−44 s (3.19)


1/2 −8
Mp := (~c/G) = 2, 18 × 10 kg (3.20)
llamadas longitud, tiempo y masa de Planck respectivamente. Actualmente es
práctica usual en la física trabajar con unidades de c = ~ = G = 1, las cuales
son llamadas unidades fundamentales o naturales.

3.2. Transformaciones de Lorentz


De lo discutido en la sección anterior, las leyes de la electrodinámica son
físicamente compatibles con el principio de la constancia de la velocidad de la
luz, pero a diferencia de las leyes de Newton, las ecuaciones de Maxwell no per-
manecen invariantes bajo las transformaciones de Galileo. Esta situación nos
conduce al problema de encontrar un conjunto de transformaciones de coor-
denadas compatibles con los postulados de la relatividad especial. Lorentz a
finales del sigloXIX, encontró las transformaciones de coordenadas que dejaban
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 26

invariante a las ecuaciones de Maxwell, pero en ningún momento las consideró


como las ecuaciones de transformación entre sistemas de referencia inerciales,
pues ellas claramente, no eran compatibles con las leyes de la mecánica newto-
niana. Estas transformaciones se conocen hoy día como las transformaciones de
Lorentz.
En esta sección mostraremos, que las transformaciones de Lorentz, constitu-
yen el conjunto de ecuaciones de transformación de coordenadas entre sistemas
de referencia inerciales. Estas ecuaciones de transformación serán deducidas a
partir de los postulados fundamentales de la relatividad especial, junto con al-
gunas suposiciones generales sobre homogeneidad e isotropía del espacio y del
tiempo.
Antes de abordar el problema de obtener las ecuaciones de transformación
de coordenadas, es importante aclarar algunos conceptos sobre la forma como se
definen y miden las coordenadas del espacio y del tiempo y sobre los postulados
de homogeneidad e isotropía.
Al igual que en la mecánica newtoniana, asumiremos que el espacio físico
es homogéneo e isotrópico, lo cual implica que todos los puntos y todas las di-
recciones espaciales son equivalentes para describir los fenómenos físicos. Esto
significa, en términos más precisos, que las leyes fundamentales de la física no
deben depender de la posición y de la dirección espacial, lo cual también se tra-
duce en la arbitrariedad para elegir el origen y la dirección de los ejes espaciales.
Adicionalmente se postula que el espacio físico es tridimensional y obedece los
postulados de la geometría euclideana.
La homogeneidad e isotropía del tiempo, significan que las leyes de la física
no deben depender de un instante particular ni de la dirección del tiempo elegi-
da, es decir, la elección del origen y la escala para medir el tiempo es arbitraria
(homogeneidad) y que las leyes de la física son invariantes bajo una transforma-
ción de la forma t → −t (isotropía). Estas propiedades del espacio y el tiempo
deben quedar reflejadas en el sistema de coordenadas espacio-temporales elegi-
do, así como la forma en que se miden las distancias espaciales y el intervalo
temporal entre eventos físicos.
Un evento es un fenómeno físico independiente del observador (tal como la
colisión entre dos partículas, o la emisión de un fotón por un átomo), el cual
ocurre en un punto del espacio y en un instante de tiempo y puede ser medido
por instrumentos físicos adecuados.
Adicional a los postulados anteriores sobre la estructura del espacio y el
tiempo, suponemos que se puede definir una escala de medida de longitudes,
igual para todos los observadores inerciales, la cual nos permite medir intervalos
espaciales utilizando un sistema de reglas rígidas. Este procedimiento define una
métrica para el espacio, que cumple con las propiedades de homogeneidad e
isotropía y que obedece la geometría euclideana.
El sistema de coordenadas cartesianas espaciales R3 con la métrica usual,
esto es la métrica euclideana
2
~x ∈ R3 ⇒ |~x| = x21 + x22 + x23 (3.21)
nos ofrece el modelo matemático natural para describir el espacio físico.
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 27

Uno de los aspectos cruciales de la teoría de la relatividad lo constituye el


problema de la medida del tiempo. En efecto, Einstein en su primer artículo,
dedica una buena parte de él a definir la forma como se miden los intervalos
temporales entre eventos físicos. Definida ya la estructura métrica del espacio y
el proceso de medida de intervalos espaciales, podemos utilizar el postulado de
la constancia de la velocidad de la luz para definir el concepto de tiempo físico,
es decir, el método operacional para la medida del tiempo que esté de acuerdo
con los postulados fundamentales de la física y que refleje las propiedades de
homogeneidad e isotropía del tiempo.
En primer lugar se asume, que si dos eventos físicos ocurren en el mismo
punto del espacio y simultáneamente (en el mismo instante de tiempo) para un
observador inercial, entonces estos dos eventos físicos serán simultáneos para
todos los observadores inerciales y ocurirán también en el mismo punto del es-
pacio. En otras palabras, la simultáneidad de eventos en un mismo punto del
espacio es un hecho físico absoluto, i.e., independiente del observador. Supon-
gamos además, que se dispone de un conjunto de relojes ideales e idénticos,
es decir, algún dispositivo o fenómeno físico reproducible, que nos permita de-
terminar una escala de tiempo y situemos uno de estos relojes en el origen de
coordenadas espaciales escogido por un observador inercial. De acuerdo con la
suposición sobre el carácter absoluto de la simultáneidad para eventos que tie-
nen lugar en el mismo punto del espacio, el observador determinará un tiempo,
el marcado por el reloj situado en su origen, para cada evento que ocurra en el
origen de coordenadas. Este tiempo marcado por el reloj supone haber elegido
un instante inicial, t = 0, el cual es arbitrario, de acuerdo con la hipótesis de
homogeneidad del tiempo. Ahora, coloquemos en cada punto del espacio y en
reposo relativo al reloj del origen, uno de estos relojes idénticos y determinemos
que el instante de tiempo en que un evento físico sucede, es el marcado por el
reloj situado en el punto del espacio donde el evento tiene lugar.
Hasta este momento se ha definido la medida del tiempo local y falta entonces
“sincronizar” todos los relojes del observador inercial, para que este observador
asigne un único tiempo y así, una única coordenada temporal a cada evento
físico, independiente de la posición espacial en la cual suceda dicho evento. Para
sincronizar los relojes seguiremos el método expuesto por Einstein en su primer
artículo.
Para el reloj situado en el origen de coordenadas, elijamos un instante cual-
quiera como el tiempo t = 0. Consideremos un segundo reloj situado a una
distancia d del origen y enviemos, desde el origen y en la dirección de este se-
gundo reloj, un rayo de luz en en el instante en que el reloj del origen marca t1
(Figura ??). Este segundo reloj marcará un tiempo t2 cuando el rayo de luz lo
alcanza, y se define entonces que los dos relojes están sincronizados, si se cumple
que
d
t2 = t1 + (3.22)
c
Con estas definiciones de medida de la distancia y del intervalo temporal,
un observador inercial construye su sistema de coordenadas espacio-temporal.
Este procedimiento es consistente y válido para todos los observadores inerciales,
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 28

Figura 3-1: Sincronización de relojes

puesto que la distancia d para puntos en reposo relativo está bien definida y es
por su definición independiente del observador, así como la velocidad de la luz
en el vacío c es una constante universal, de acuerdo con el segundo postulado.
La coordenada temporal para un evento, se le define entonces, como la lectura
del reloj que está situado en el punto del espacio donde el evento ocurre y de
acuerdo con la hipótesis del carácter absoluto de la simultáneidad, para eventos
que suceden en el mismo punto del espacio, este procedimiento es independiente
del observador.
Habiendo definido la forma como un observador inercial construye su sistema
de coordenadas espacio-temporales, abordemos ahora, el problema de encontrar
las ecuaciones que relacionan las coordenadas de un evento, asignadas por dos
observadores inerciales.
Sea p un evento físico, y séan (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) las coordenadas del
evento, medidas por los dos observadores inerciales Σ y Σ0 . De acuerdo con
la homogeneidad e isotropía del espacio y el tiempo, supongamos sin pérdida
de generalidad, que los dos observadores eligen los ejes coordenados espaciales
paralelos, con v la velocidad del sistema Σ0 respecto a Σ, en la dirección positiva
de los ejes x, x0 , y además, define cada observador el origen de la coordenada
temporal t = t0 = 0, en el instante en que los orígenes espaciales de los sistemas
coinciden (Figura 3-2).
El conjunto de transformaciones de coordenadas, que estamos buscando, lo
podemos escribir en la forma general como:
t0 = f1 (t, x, y, z) (3.23)
0
x = f2 (t, x, y, z) (3.24)
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 29

Figura 3-2: Transformaciones de Lorentz

y 0 = f3 (t, x, y, z) (3.25)
0
z = f4 (t, x, y, z) (3.26)
con la condición que las funciones fi séan invertibles, es decir, que se pue-
dan despejar las coordenadas (t, x, y, z) en función de las coordenadas primadas
(t0 , x0 , y 0 , z 0 ).
Otra condición general sobre las funciones fi la impone la primera ley de
Newton la cual implica que una partícula libre debe moverse con velocidad
constante para todos los observadores inerciales. Esta exigencia implica que
las ecuaciones de transformación deben ser lineales en las coordenadas. Así,
el sistema de ecuaciones de transformación (3.23), (3.24), (3.25) y (3.26) lo
podemos escribir como:

t0 = a00 t + a01 x + a02 y + a03 z (3.27)


0
x = a10 t + a11 x + a12 y + a13 z (3.28)
0
y = a20 t + a21 x + a22 y + a23 z (3.29)
z0 = a30 t + a31 x + a32 y + a33 z (3.30)

en donde los coeficientes ai,j son constantes independientes de las coordenadas.


Estos coeficientes ai,j son funciones, a lo sumo, de la velocidad del sistema de
referencia Σ0 respecto a Σ, pues se supone que todos los observadores eligen las
mismas escalas para medir distancias y tiempos. La linealidad implica también
que los ejes espaciales de Σ0 permanecen siempre paralelos a sí mismos y así a
los ejes espaciales de Σ. Además, la velocidad del sistema Σ respecto a Σ0 es
igual a −v (igual en magnitud y opuesta a la velocidad de Σ0 respecto a Σ) y
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 30

por lo tanto la transformación inversa debe tener la misma forma cambiando v


por −v. Para el caso cuando v = 0, la transformación se reduce a la identidad.
La condición de existencia de la transformación inversa, por otra parte, queda
garantizada exigiendo que el determinante de los coeficientes aij sea diferente
de cero.
De la escogencia de los ejes espaciales se obtiene que los planos y = 0 y
y 0 = 0 coinciden permanentemente (todos los ejes espaciales de los dos sistemas
de referencia permanecen paralelos) y por lo tanto la ecuación de transformación
para la coordenada y 0 debe reducirse a:

y 0 = a22 y (3.31)

Si invertimos las direcciones de los ejes x y z de Σ no se debe afectar la


relación anterior, y por lo tanto la transformación inversa de Σ0 a Σ, para la
coordenada y, toma la forma

y = a022 y 0 = a22 y 0 (3.32)

Esto implica, por lo tanto que se debe cumplir que a22 = ±1. Por otra parte,
dado que para v → 0 se cumple que y 0 → y, entonces

a22 = 1 (3.33)

Un argumento similar vale para la coordenada z, entonces

y0 = y ; z0 = z (3.34)

Puesto que la transformación de coordenadas es lineal y las coordenadas del


origen del sistema de referencia Σ0 , medidas por el observador Σ, están dadas
por x = vt, entonces x0 debe ser de la forma

x0 = γ(x − vt) (3.35)

donde γ es un parámetro que, en general, depende de la velocidad. Por simetría,


la transformación inversa para la coordenada x tendrá la misma forma (con v
cambiada por −v), entonces

x = γ 0 (x0 + vt0 ) (3.36)

siendo γ 0 otra constante dependiente de v. Si invertimos las direcciones de los


ejex x y z en Σ y Σ0 , entonces las relaciones (3.35) y (3.36) se siguen cumpliendo,
es decir si cambiando x → −x y x0 → −x0 tenemos que

−x0 = γ(−x − vt) =⇒


0
x = γ(x + vt) (3.37)

−x = γ 0 (−x0 + vt0 ) =⇒
x = γ 0 (x0 − vt0 ) (3.38)
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 31

de donde se obtiene que γ = γ 0 , pues, del principio de relatividad la física


no debe depender de la dirección elegida para los ejes espaciales. Además, el
parámetro γ debe ser positivo dado que para t = 0, x0 > 0 si x > 0.
Para encontrar una expresión explícita para γ y la forma como la coordenada
temporal se transforma, apliquemos ahora el segundo postulado de la constancia
de la velocidad de la luz en el vacío.
Supongamos que en el instante t = 0 = t0 , cuando los orígenes coinciden,
se emite un pulso de luz en la dirección del eje x positivo, entonces se debe
satisfacer que al cabo de un tiempo t, medido en Σ, el pulso de luz esté en un
punto del espacio cuya coordenada x, medida en Σ, cumpla la ecuación

x = ct (3.39)

De acuerdo con el postulado de la constancia de la velocidad de la luz en el


vacío, para el observador Σ0 se debe cumplir que el pulso de luz llega al punto del
espacio de coordenada x0 , en un instante t0 , tal que x0 = ct0 . Substituyendo estas
dos relaciones, x = ct y x0 = ct0 , en las ecuaciones (3.35) y (3.36), multiplicando
las ecuaciones resultantes y eliminando el término tt0 , obtenemos
1
γ = γ(v) = p (3.40)
1 − v 2 /c2

conocido como el factor gamma de Lorentz. A partir de esta expresión y eli-


minando la coordenada x0 entre las ecuaciones (3.35) y (3.36), obtenemos la
ecuación de transformación para la coordenada temporal:

t0 = γ(t − vx/c2 ) (3.41)

Resumiendo, el conjunto de transformaciones de coordenadas, llamadas trans-


formaciones de Lorentz (TL), que relacionan las coordenadas espacio-temporales
de un evento físico medidas por dos observadores inerciales, están dadas por:

t0 = γ(t − vx/c2 )
x0 = γ(x − vt)
(3.42)
y0 = y
z0 = z

Así, el principio de relatividad exige que las leyes de la física deben ser tales
que ellas permanezcan invariantes bajo las tranformaciones de Lorentz (ecua-
ciones (3.42)) pues, como veremos en la siguiente sección donde se discutirán
algunas propiedades de las TL, ellas contienen implícitamente al postulado de
la constancia de la velocidad de la luz.
Para encontrar las transfomaciones de Lorentz inversas, es decir, las trans-
formaciones de coordenadas para pasar del sistema Σ0 al sistema Σ, basta con
invertir las ecuaciones (3.42), o en forma equivalente, cambiando v por −v en
las TL (3.42) y las coordenadas primadas por las no primadas (por la simetría
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 32

entre los sistemas Σ y Σ0 ):

t = γ(t0 + vx0 /c2 )


x = γ(x0 + vt0 )
(3.43)
y = y0
z = z0

3.3. Propiedades de las TL


Las ecuaciones de transformación de Lorentz encontradas en la sección ante-
rior, corresponden a un caso particular de un conjunto de transformaciones más
general, que constituyen la expresión matemática del principio de relatividad
y de las propiedades de homogeneidad e isotropía del espacio y el tiempo. En
efecto, el conjunto de transformaciones de coordenadas más general se puede
escribir en la forma:
3
X

x = Λνµ xν + aµ ; µ, ν = 0, 1, 2, 3 (3.44)
ν=0

con Λνµ y aµ constantes independientes de las coordenadas. Para simplificar las


expresiones hemos introducido la notación

ct ≡ x0 ; x ≡ x1 ; y ≡ x2 ; z ≡ x3 (3.45)

de tal manera que la coordenada temporal la medimos en unidades de longi-


tud, dado el carácter de constante universal de la velocidad de la luz c. Esta
redefinición de la coordenada temporal nos permite, como veremos más ade-
lante, escribir las transformaciones de Lorentz en una forma más simétrica y
resaltar en forma explícita el papel de la coordenada temporal en la teoría de
la relatividad. En lo sucesivo utilizaremos índices griegos, que recorren de 0 a
3, para describir las coordenadas de un evento y dejaremos los índices latinos
para describir solamente las coordenadas espaciales.
Las ecuaciones de transformación (3.44) constituyen un conjunto de trans-
formaciones lineales no homogéneas, en donde las cuatro constantes aµ corres-
ponden a la arbitrariedad para elegir el origen de las coordenadas espaciales
(µ = 1, 2, 3) y de la coordenada temporal (µ = 0) y así representan la homo-
geneidad del espacio-tiempo. Esta propiedad de homogeneidad del espacio y el
tiempo, en términos más formales, se traduce en el principio de invarianza de la
física bajo translaciones espaciales (ai ; i = 1, 2, 3)

xi → x´i = xi + ai (3.46)

y translaciones temporales (a0 )

x0 → x´0 = x0 + a0 (3.47)

De esta forma, la invarianza de las leyes de la física bajo translaciones


espacio-temporales, nos permiten elegir las coordenadas de los dos sistemas de
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 33

Figura 3-3: Transformación general de coordenadas

referencia inerciales de tal manera que coincidan sus orígenes espaciales para
t = t0 = 0, haciendo que el término inhomogéneo del sistema de ecuaciones
(3.44) se anula y en este caso las ecuaciones de transformación se reducen al
sistema lineal homogéneo
3
X
x0µ = Λµν xν ; µ, ν = 0, 1, 2, 3 (3.48)
ν=0

Este conjunto de transformaciones, contiene dos casos especiales: Por una


parte están las rotaciones de los ejes espaciales, las cuales reflejan la isotropía
del espacio, es decir, que la leyes físicas no deben depender de la orientación de
los ejes espaciales. Una rotación de los ejes espaciales queda determinada por
tres parámetros, por ejemplo, los tres ángulos de Euler.
Por otra parte, están las llamadas transformaciones de Lorentz puras, carac-
terizadas por las tres componentes de la velocidad relativa de los sistemas de
referencia inerciales.
Así, las transformaciones de Lorentz deducidas en la sección anterior, cons-
tituyen un caso particular del conjunto de transformaciones (3.44), en donde el
movimiento relativo entre los sistemas de referencia es a lo largo de un eje coor-
denado, con ejes espaciales paralelos (no hay rotación de ejes) y sin translación
de los orígenes espacial y temporal (Figura ??). En este caso basta con un solo
parámetro, la magnitud de la velocidad relativa, para determinar completamente
la transformación.
En el caso de general de una transformación de coordenadas que involucre
movimiento relativo, cambio de orientación de los ejes espaciales y translación
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 34

del origen de coordenadas espacial y temporal, se requieren entonces 10 pará-


metros para determinar completamente la transformación: Los tres parámetros
ai , i = 1, 2, 3 que determinan el cambio del origen espacial, un parámetro a0
para el desplazamiento del origen temporal, tres parámetros (e.g. los ángulos
de Euler) para determinar una rotación de los ejes espaciales y tres paráme-
tros (e.g. las tres componentes de la velocidad relativa) para determinar una
transformación pura de Lorentz. Para los objetivos del presente libro, salvo se
especifique lo contrario, es suficiente considerar solamente transformaciones de
Lorentz puras con los ejes xx0 en la dirección de la velocidad relativa de los
sistemas de referencia y supondremos además, que los orígenes de los sistemas
coinciden para el tiempo cero en ambos sistemas.
Antes de continuar con la discusión de algunas propiedades de las transfor-
maciones de Lorentz, reescribamos las ecuaciones de transformación (3.42) en
la notación introducida en la ecuación (3.45):
x00 = γ(x0 − βx1 )
x01 = γ(x1 − βx0 )
(3.49)
x02 = x2
x03 = x3

en donde se ha definido el parámetro adimensional β = v/c y así γ(v) = (1 −


β 2 )−1/2 .
Como se mencionó al comienzo de esta sección, las ecuaciones de transforma-
ción de Lorentz adquieren una forma simétrica en las coordenadas espaciales y
la temporal. Así, los coeficientes de la transformación de Lorentz Λνµ , llamados
también elementos de la matriz de transformación de Lorentz, en la ecuación
(3.48) están dados por:
Λ00 = Λ11 = γ
Λ 1 = Λ10 = −βγ
0
(3.50)
Λ22 = Λ33 = 1
siendo los demás coeficientes cero.
Consideremos ahora tres sistemas de referencia inerciales Σ, Σ0 y Σ00 , con ejes
paralelos, movimiento relativo a lo largo del eje espacial x1 , y orígenes espaciales
coincidentes para t = t0 = t00 = 0 (Figura ??). Sea v la velocidad del sistema
de referencia Σ0 respecto a Σ y w la velocidad del sistema Σ00 respecto a Σ0 , y
sean (x0 , x1 , x2 , x3 ), (x00 , x01 , x02 , x03 ) y (x000 , x001 , x002 , x003 ) las coordenadas de
un evento físico medidas por los tres observadores Σ, Σ0 y Σ00 , respectivamente.
La relación entre las coordenadas del evento medidas por Σ y Σ0 están dadas
por la ecuación (3.49) y la relación entre las coordenadas medidas por Σ0 y Σ00
están dadas por las ecuaciones:
x000 = γ(w)(x00 − β 0 x01 )
x001 = γ(w)(x01 − β 0 x00 )
(3.51)
x002 = x02
x003 = x03

en donde β 0 = w/c.
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 35

Figura 2-4: Composición de transformaciones de Lorentz

Las ecuaciones de transformación que relacionan las coordenadas medidas


por Σ y Σ00 se obtienen entonces, componiendo las dos transformaciones, es
decir, remplazando las coordenadas del sistema Σ0 de la ecuación (3.49), en
esta última ecuación (3.51). Despues de reagrupar términos, las ecuaciones de
transformación finales, como era de esperarse, toman la misma forma:
x000 = γ(u)(x0 − β 00 x1 )
x001 = γ(u)(x1 − β 00 x0 )
(3.52)
x002 = x2
x003 = x3
en donde β 00 = u/c y u es la velocidad relativa del sistema de referencia Σ00
respecto a Σ, la cual está dada por la ecuación
w+v
u= (3.53)
1 + wv/c2
Esta ecuación corresponde a la versión relativista del teorema de adición de
velocidades de Galileo. Notemos si v < c y w < c entonces u < c.
Notemos que las ecuaciones de transformación de Lorentz y el teorema de
adición de velocidades se reducen a las ecuaciones de transformación de Galileo
y al teorema de adición de velocidades galileano cuando c → ∞. Este límite
formal, sin embargo, carece de significado físico en la medida que la velocidad
de la luz en el vacío es una constante universal y por lo tanto este límite debe
entenderse mejor en el siguiente sentido.
Para velocidades pequeñas comparadas con la velocidad de la luz v  c,
tanto las ecuaciones de transformación de Lorentz, como el teorema de adición
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 36

de velociades, se reducen a las ecuaciones de transformación de Galileo y al


teorema de adición de velocidades galileano, respectivamente. Para ver esto, es
suficiente recordar la expansión en serie de Taylor de la función
r (r − 1) 2
(1 + xr ) = 1 + rx + x +··· (3.54)
2!
la cual converge para |x| < 1. Si aplicamos esta expansión al factor γ (v) tenemos
−1/2
v2

γ (v) = 1− 2
c
1 v2
= 1+ +··· (3.55)
2 c2
Remplazando esta expansión en las ecuaciones de transformación de Lorentz
3.42 obtenemos
1 v2
 
x´ = 1+ + · · · (x − vt)
2 c2
 2
v
= x − vt + O (3.56)
c2

1 v2
 
v 
t´ = 1+ + · · · t − x
2 c2 c2
 2
v
= t+O (3.57)
c2

en donde O v 2 /c2 representa términos del orden de v 2 /c2 , los cuales son muy
pequeños si v/c << 1 y por lo tanto las ecuaciones de transformación de Galileo
corresponden a una aproximación a vajas velocidades de las ecuaciones de Lo-
rentz. Un resultado similar se obtiene para el teorema de adición de velociades.
Este límite de bajas velocidades juega el papel de un principio de corres-
pondencia, en el sentido de que la “física newtoniana es una teoría válida” para
describir los fenómenos, cuando las velocidades típicas involucradas en los pro-
cesos bajo consideración son bajas comparadas con la velocidad de la luz y por
lo tanto, las ecuaciones de la relatividad deben reducirse a las correspondientes
relaciones clásicas, en este límite de velocidades bajas. Es importante aclarar el
significado de la frase “validez de la física newtoniana para velocidades v << c”.
Dado que toda medida experimental de una cantidad física, lleva consigo un
error experimental, entonces las predicciones de la mecánica clásica para los
diferentes observables de un sistema dado, están en concordancia con los re-
sultados experimentales, dentro del rango de error experimental. Así, el límite
clásico, o el rango de velocidades para el cual la mecánica clásica es aplicable,
depende de la precisión experimental.
El límite formal c → ∞ se puede entender fícamente en el sentido que c
representa la vélocidad máxima de propagación de señales físicas, independien-
temente que esta constante corresponda a la velocidad de la luz en el vacío y por
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 37

lo tanto si c → ∞ esto significaría que podemos enviar información a velocidad


infinita, lo que implicaría que tendríamos a disposición un mecanismo instantá-
neo para calibrar relojes, lo que implicaría a su vez que todos los observadores
inerciales medirían la misma coordenada temporal para un evento dado. Así
podemos entender la hipótesis de Newton de un tiempo universal independien-
te del observador, como la hipótesis de una velocidad infinita para transmitir
información. Notemos además que en efecto la tercera ley de Newton requiere
de esta hipótesis, pues esta ley exige que las fuerzas de acción y reacción sean
iguales en todo instante, independientemente de la posición de los cuerpos que
están en interacción.
Retomando las ecuaciones de transformación (3.52), vemos que dos trans-
formaciones de Lorentz sucesivas, conducen a una nueva transformación de Lo-
rentz, cuyo parámetro (la velocidad relativa) está dado por la ecuación (3.53).
Por otra parte, la transformación de Lorentz inversa, es decir, las ecuaciones
de transformación de coordenadas del sistema Σ0 al Σ, tienen la misma forma
(ecuación (3.49)), pero cambiando el parámetro v por −v. Además, la trans-
formación identidad, esto es, del sistema Σ sobre el mismo, corresponde a una
transformación de Lorentz con parámetro v = 0, trivialmente. Si escribimos
formalmente una transformación de Lorentz entre Σ y Σ0 , como
L(v) : Σ −→ Σ0
(3.58)
x −→ x0 = L(v)x
entonces, las propiedades encontradas, las podemos resumir formalmente de la
siguiente manera:

L(w) ◦ L(v) = L(u) (3.59)


w+v
u = (3.60)
1 + wv/c2
L(v = 0) = id ⇒ L(0) ◦ L(v) = L(v) ◦ L(0) = L(v) (3.61)
−1
L (v) = L(−v) (3.62)
L(v) ◦ L(−v) = L(−v) ◦ L(v) = id (3.63)
en donde id significa la transformación identidad, L−1 (v) la transformación
inversa, y el producto L(w) ◦ L(v) representa la composición de dos transforma-
ciones sucesivas.
Un grupo matemático es un conjunto de elementos G, con una operación
interna llamada producto, es decir, el producto de dos elementos de G es de
nuevo un elemento del conjunto y esta operación debe satisfacer las siguientes
propiedades:
i.-Existe un elemento del grupo G, llamado la identidad, tal que la identidad
por cualquier elemento del grupo es el mismo elemento del grupo.
ii.-Para todo elemento del grupo, existe otro elemento en el grupo, tal que
su producto es la identidad.
Un grupo se llama abeliano, si la operación producto es conmutativa. Las re-
laciones simbólicas representadas en las ecuaciones (3.59), (3.61), (3.62) y (3.63),
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 38

muestran que las transformaciones de Lorentz forman un grupo matemático, lla-


mado el grupo de Lorentz. Para el caso particular que estamos considerando,
esto es, de transformaciones entre sistemas de referencia con ejes paralelos y
movimiento relativo a lo largo del eje x, el grupo es claramente abeliano, y cada
elemento del grupo corresponde, o está caracterizado por el valor de la velocidad.
Puesto que la velocidad puede tomar cualquier valor entre −c < v < c, el grupo
contiene un número infinito no numerable de elementos, y así este grupo es co-
nocido en la literatura como un grupo de Lie de un parámetro o grupo continuo,
en contraposición con los grupos finitos o discretos, tales como por ejemplo, los
números enteros con la operación suma. El caso de las transformaciones gene-
rales, ecuación (3.44), también forman un grupo, llamado el grupo de Poincaré,
el cual es también un grupo de Lie pero de diez parámetros, pues como vimos,
una transformación general requiere de 10 parámetros para caracterizarla.
Otra propiedad muy importante de las TL, la cual va a jugar un papel funda-
mental en el problema de la causalidad en física, es que las TL dejan invariante
una cantidad, que la llamaremos intervalo o distancia espacio-temporal entre
eventos. Sean ℘1 y ℘2 dos eventos físicos cualesquiera y sean (x01 , x11 , x21 , x31 ) y
(x02 , x12 , x22 , x32 ) las coordenadas de los dos eventos, medidas por un observador
inercial Σ. Definamos el intervalo espacio-tiempo entre los dos eventos por:
2
∆S12 := (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (3.64)

Sea Σ0 otro observador inercial que se mueve con velocidad v respecto a Σ


y sean (x00 01 02 03 00 01 02 03
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de los dos eventos
0
℘1 y ℘2 medidas por Σ . Entonces, para este nuevo observador, el intervalo
espacio-tiempo entre los dos eventos está dado por:
02
∆S12 := (x00 00 2 01 01 2 02 02 2 03 03 2
2 − x1 ) − (x2 − x1 ) − (x2 − x1 ) − (x2 − x1 ) (3.65)

Utilizando las TL (ecuaciones (3.49)) expresemos el intervalo espacio-tiempo


medido por Σ0 (ecuación (3.65)), en términos de las coordenadas del observador
Σ:
02
∆S12 = (γ(x02 − βx12 ) − γ(x01 − βx11 ))2 − (γ(x12 − βx02 )
−γ(x11 − βx21 ))2 − (x22 − x21 )2 − (x32 − x31 )2 (3.66)

reagrupando términos obtenemos


02
∆S12 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = ∆S12
2
(3.67)

Este resultado significa que el intervalo espacio-tiempo entre dos eventos


físicos es una cantidad independiente del observador y así es un invariante físico,
lo que implica que el valor numérico del intervalo es siempre el mismo, sin
importar cual observador lo mida.
A las variables físicas que son invariantes bajo transformaciones de Lorentz
se les llama invariantes relativistas o escalares de Lorentz y claramente juegan un
papel fundamental, pues al ser independientes del observador, nos caracterizan
propiedades intrínsecas del sistema o de los fenómenos físicos.
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 39

Las implicaciones físicas, para el caso particular del intervalo espacio-tiempo,


serán discutidas en el próximo capítulo con mayor detalle. Es importante sola-
2
mente resaltar en este punto dos aspectos: en primer lugar ∆S12 puede ser
2
positivo, negativo o cero, y en segundo lugar, el último caso cuando ∆S12 es
cero, corresponde a la expresión matemática del principio de la constancia de
la velocidad de la luz, pues si desde el punto del espacio y en el instante de
tiempo donde ocurre el primer evento, por ejemplo ℘1 , se emite un rayo de
luz en dirección del evento ℘2 , entonces este rayo de luz alcanza el punto del
espacio en el instante de tiempo, en que el segundo evento ocurre. Esto se ve
fácilmente, pues de la definición del intervalo espacio-tiempo, ecuación (3.64) o
(3.65) y recordando que x0 = ct, entoces despejando c de cualquiera de estas
2 02
dos ecuaciones (∆S12 = 0 = ∆S12 ) implica que c =(distancia espacial entre los
eventos)/(intervalo temporal entre los eventos) es un invariante relativista.
Es importante resaltar que el intervalo espacio-tiempo es invariante bajo las
transformaciones generales de coordenadas (ecuación (3.44)), y no solamente
bajo las transformaciones de Lorentz puras consideradas, pues por una parte, el
término inhomogéneo de las transformaciones se cancela al tomar la diferencia
de las coordenadas, mientras que las rotaciones de los ejes espaciales dejan
invariante la distancia espacial (ver sección 4.1)

(x12 − x11 )2 + (x22 − x21 )2 + (x32 − x31 )2 (3.68)

permaneciendo la coordenada temporal inanalterada.


Otra característica importante que se deriva directamente de las TL, es que
las velocidades relativas entre sistemas de referencia inerciales, deben ser siempre
menores que la velocidad de la luz, pues el factor γ(v) diverge para v = c y se
hace imaginario si v > c, lo cual es inadmisible dado el significado físico asignado
a las coordenadas utilizadas.

3.4. Consecuencias de las TL


Para finalizar el presente capítulo, vamos a considerar dos consecuencias de
las TL que constituyen, tal vez, los dos resultados más sorprendentes de la teoría
especial de la relatividad y por esta razón los más conocidos en la literatura de
divulgación científica.
Consideremos para comenzar el problema de la dilatación temporal. En pri-
mer lugar definamos el concepto de tiempo propio, como el intervalo de tiempo
∆τ entre dos eventos ℘1 y ℘2 , medido por un mismo reloj. Esto significa, equi-
valentemente, que existe un sistema de referencia inercial, llamémolo Σ, para el
cual los dos eventos ocurren en el mismo punto del espacio. Así, las coordena-
das de estos dos eventos para el observador Σ están dadas por (x01 , x11 , x21 , x31 ) y
(x02 , x12 , x22 , x33 ), con
x02 − x01 = c∆τ (3.69)
y
xi2 = xi1 ; i = 1, 2, 3 (3.70)
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 40

Suponiendo, sin pérdida de generalidad, que el evento 2 ocurre después que el


evento 1 para el observador Σ, i.e. x02 > x01 , y como xi2 = xi1 ; i = 1, 2, 3, pues los
dos eventos por definición, tienen lugar en el mismo punto del espacio, es claro
que para cualquier otro observador inercial, por ejemplo Σ0 , los dos eventos
suceden en puntos diferentes del espacio y por lo tanto, dada la invarianza
2
del intervalo espacio-tiempo ∆S12 entre los dos eventos, el intervalo de tiempo
0
medido por Σ para estos dos eventos, debe ser mayor que el intervalo de tiempo
propio. Para probar esta afirmación, sean (x00 01 02 03 00 01 02 03
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 )
0 0
las coordenadas de estos eventos y ∆t el intervalo de tiempo medido en Σ , con

c∆t0 = x00 00
2 − x1 (3.71)

Utilizando las TL para remplazar en esta expresión las coordenadas primadas


en términos de las no primadas y aplicando la definición de tiempo propio,
obtenemos
c∆t0 = γ(x02 − βx12 ) − γ(x01 − βx11 ) (3.72)
y puesto que en sistema de referencia inercial Σ los dos eventos suceden en el
mismo punto del espacio, i.e. x12 = x11 , llegamos finalmente a la ecuación de
dilatación temporal:
∆τ
∆t0 = γ∆τ = p (3.73)
1 − v 2 /c2
pues el factor γ simpre es mayor que 1, para v 6= 0. De paso hemos demostrado,
que si dos eventos ocurren para un observador en un mismo punto del espacio,
el orden temporal de los eventos (e.g. x02 − x01 > 0) es el mismo para todos los
observadores, es decir si x02 − x01 > 0 entonces x00 00
2 − x1 > 0 y el tiempo propio es
el intervalo de tiempo más pequeño medido por algún observador. Esto justifica
el nombre de dilatación temporal y significa físicamente, que los dos eventos
están conectados causalmente, es decir que el evento posterior pudo ser causado
por el primer evento, aún cuando no necesariamente exista un proceso físico que
los ligue.
Notemos además que el intervalo de tiempo entre dos eventos puede hacerse
tan grande como se quiera, si tomamos velocidades suficientemente cercanas a
la velocidad de la luz. En efecto dado que

1≤γ<∞ (3.74)

para 0 ≤ v < c, y dado ∆τ > 0, entonces ∆t0 = γ∆τ puede hacerse tan grande
como se quiera haciendo que v −→ c.
Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. En el
sistema Σ obtenemos la expresión
2
∆S12 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (3.75)
2 2
= c ∆τ > 0 (3.76)

el cual nos indica, que para el caso que estamos considerando, el intervalo
espacio-tiempo nos mide directamente (salvo un factor constante c2 ) el intervalo
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 41

de tiempo propio. Si calculamos este mismo intervalo, ahora en el sistema de


referencia Σ0 (ver ecuación (3.65)), por su invarianza, obviamente obtenemos el
mismo resultado. Esto nos muestra, sin ulteriores cálculos, que el intervalo de
tiempo en Σ0 debe ser mayor que en Σ, pues a c2 ∆t02 le estamos restando una
cantidad positiva, que nos da la distancia espacial entre los dos eventos medidos
en el sistema Σ0 .
¿Cuándo tiene sentido hablar del intervalo de tiempo propio entre dos even-
tos?. Para responder a esta pregunta, consideremos dos eventos físicos cuales-
2
quiera ℘1 y ℘2 y calculemos el intervalo ∆S12 entre ellos en algún sistema de
referencia inercial Σ. Sean (x1 , x1 , x1 , x1 ) y (x02 , x12 , x22 , x32 ) las coordenadas de
0 1 2 3

los eventos ℘1 y ℘2 respectivamente y supongamos para simplificar los cálculos,


pero sin perder generalidad del resultado, que x22 = x21 y x32 = x31 , entonces:
2
∆S12 = (x02 − x01 )2 − (x12 − x11 )2 (3.77)

Por lo tanto, si este intervalo es mayor que cero, esto significa que siempre
es posible encontrar un sistema de referencia inercial Σ0 , para el cual los dos
eventos ocurren en el mismo punto del espacio, así
2
∆S12 = (x00 00 2 2
2 − x1 ) = c ∆τ
2
(3.78)

pues, dadas las coordenadas de los dos eventos en Σ, basta con considerar un
sistema de referencia Σ0 el cual se mueva con una velocidad v respecto a Σ dada
por
v x1 − x11
β = = 02 (3.79)
c x2 − x01
Para el caso que estamos considerando, la velocidad ν del sistema Σ0 está a
lo largo del eje de las x y su dirección depende de la posición relativa entre los
eventos (x12 − x11 > 0 o x12 − x11 < 0) en Σ, y del orden temporal entre ellos, es
decir si x02 − x01 > 0 o x02 − x01 < 0 (ver ecuación (3.79)).
Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en algún
2
sistema de referencia fuera menor o igual a cero, dada la invarianza de ∆S12 , es
obvio que no existe un sistema de referencia para el cual los dos eventos ocurran
en el mismo punto del espacio y por lo tanto, en este caso, no tiene sentido
hablar de tiempo propio entre los eventos. Además, para esta última situación
considerada, como lo veremos en seguida, el orden temporal entre los eventos
puede invertirse o ser simultáneos para algunos observadores, lo que implica
físicamente que los dos eventos no pueden estar causalmente conectados, pues
para que un evento fuera causa del otro, se necesitaría transmir información a
una velocidad mayor a la de la luz.
La segunda consecuencia importante de las TL, se relaciona con la con-
tracción de longitudes. Para entender el significado físico de este fenómeno,
definamos primero lo que se entiende por medir la longitud de un cuerpo.
Consideremos el problema de medir la longitud de una varilla rígida. Su-
pongamos que para un observador inercial Σ la varilla se encuentra en reposo
y elijamos el eje de las x a lo largo de la varilla. Por definición, la longitud de
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 42

la varilla está dada por la diferencia de las coordenadas de los extremos de la


varilla:
L0 = x12 − x11 (3.80)
en donde se ha supuesto, sin pérdida de generalidad, que x12 > x11 . Esta defi-
nición es físicamente consistente, puesto que la varilla está en reposo para el
observador Σ. De la misma manera como definimos tiempo propio, llamemos a
L0 , definido en la ecuación (3.80), longitud propia de la varilla. En términos ge-
nerales, definimos la longitud propia de un cuerpo cualquiera, como la longitud
del cuerpo medida en el sistema de referencia, en el cual el cuerpo se encuentra
en reposo. El problema surge cuando el cuerpo al cual se le quieren medir sus
dimensiones, está en movimiento. Consideremos entonces, otro sistema de refe-
rencia Σ0 el cual se mueve con velocidad v respecto a Σ y definamos la longitud
de la varilla en Σ0 , como la diferencia de las coordenadas de los extremos de la
varilla en un instante dado t0 :

L = x01 01
2 − x1 (3.81)

Esto significa, que el observador Σ0 mide simultáneamente la posición de los


extremos de la varilla y define su longitud como la diferencia de las coorde-
nadas espaciales de los dos eventos físicos, cuyas coordenadas están dadas por
(x00 01 00 01
1 , x1 , 0, 0) y (x2 , x2 , 0, 0). Para encontrar la relación entre las medidas rea-
lizadas por los dos observadores, basta con aplicar las TL, teniendo en cuenta
que en el sistema Σ0 los eventos (coordenadas espacio-tiempo de los extremos
de la varilla) deben ser simultáneos x00 00
1 = x2 . Así, de la ecuación (3.80) y de las
TL inversas (ecuaciones (3.43)), tenemos

L0 = γ(x01 0 01 0 01 01
2 + βt ) − γ(x1 + βt ) = γ(x2 − x1 ) (3.82)

y aplicando la definición (3.81) para la longitud de la barra medida por Σ0 ,


llegamos al resultado p
L = L0 1 − v 2 /c2 (3.83)
el cual establece que la longitud
pfísica en la dirección de movimiento de un sólido,
se ve contraida en un factor 1 − v 2 /c2 con respecto a la longitud propia del
sólido, en donde v es la velocidad del cuerpo respecto al observador inercial que
mide su longitud. De las TL se ve directamente que las dimensiones transversales
al movimiento de un sólido no se alteran en virtud de su movimiento.
Una consecuencia inmediata de este efecto de la contracción, es que en física
relativista los conceptos de sólido rígido y fluido incomprensible no son válidos
en general. La ecuación (3.83) la habían postulado Fitzgerald y Lorentz para
explicar el resultado negativo del experimento Michelson-Morley, pues si el bra-
zo del interferómetro a lo largo de la dirección de movimiento de la tierra se
contrayese de acuerdo a esta ecuación, entonces se puede mostrar fácilmente
que no aparecería corrimiento de las franjas de interferencia, pues los caminos
ópticos de los dos rayos de luz serían iguales. El problema con el razonamiento
de Fitzgerald y Lorentz es que los brazos del interferómetro están en reposo
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 43

respecto a la tierra y por lo tanto su longitud medida en la tierra, de acuerdo a


la relatividad, es la longitud propia y no debe aparecer contraída.
Estas dos primeras consecuencias de la teoría de la relatividad, dilatación
temporal y contracción de longitudes, a pesar de su carácter bastante extra-
ño a nuestra intuición clásica, han sido corroboradas en varios experimentos.
El primer experimento reportado, fue realizado por Rossi y Hall (Rossi, B. &
Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partículas elementales,
los muónes µ− , descubiertas en los rayos cósmicos. La gran mayoría de las partí-
culas elementales conocidas son inestables, es decir, que estas partículas después
de haber sido producidas por algún proceso, decaen espontáneamente en otras
partículas al cabo de un cierto tiempo, llamado tiempo propio o tiempo de vida
media de la partícula (este tiempo de vida es característico de cada clase de
partícula). Por ejemplo, si producimos un muón µ− en reposo en el laboratorio,
entonces pasados unos 2, 2 × 10−6 s la partícula se desintegra en un electrón y
en dos neutrinos.
Los rayos cósmicos son haces de partículas, fundamentalmente protones y
electrones de alta energía, los cuales al incidir sobre las capas superiores de la
atmósfera terrestre, producen toda una serie de partículas elementates, entre
otras los muónes, los cuales viajan hacia la tierra con velocidades muy cercanas
a la de la luz: v ≈ 0,994c. En el experimento original de Rossi y Hall en 1941
se registraron un promedio de 563 muones/hora a una altura del orden de los
2000m, y se detectaron 400 muones/hora sobre la superficie de la tierra a nivel
del mar. Clásicamente, se espera que estos muónes se desintegren antes de llegar
a la superficie terrestre, pues a la velocidad de 0,994c en un tiempo de vida
de 2, 2 × 10−6 s alcanzan a avanzar escasamente unos 656m, y por lo tanto se
esperaría que se detectaran a nivel del mar no mas de 25 muones/hora. Dado
que para un observador ligado a la tierra los dos eventos, se crea el muón y
luego se detecta, ocurren en puntos diferentes del espacio, mientras que para
un observador ligado al muón los dos eventos ocurren en el mismo punto del
espacio, y por lo tanto, el intervalo de tiempo medido por este último observador
es un tiempo propio, entonces para el observador terrestre el tiempo entre los
eventos debe estar dilatado en un factor
p
1/ 1 − v 2 /c2 ≈ 9 (3.84)

de acuerdo con la ecuación (3.73). Así, para el observador en reposo con respecto
a la tierra el muón alcanza a sobevivir un tiempo del orden de t ≈ 2 × 10−5 s
antes de desintegrarse y por lo tanto, puede recorrer un espacio aproximado de

d = vt ≈ 6,000m (3.85)

antes de desintegrarse, lo que significa que los mesones sí pueden alcanzar la


superficie terrestre antes de que ellos decaigan en otras partículas.
Dado que la llegada de los muónes a la superficie terrestre es un hecho
físico, a esta misma conclusión debe llegar cualquier otro observador inercial.
Por ejemplo, consideremos el observador ligado a la partícula. Puesto que para
él la partícula se encuentra en reposo, su vida media no se ve dilatada y por lo
CAPÍTULO 3. PRINCIPIOS DE RELATIVIDAD ESPECIAL 44

tanto el muón se desintegra al cabo de 2, 2×10−6 s. Pero ahora, es la tierra la que


se mueve hacia él, con una velocidad de v = 0,994c y la distancia a la superficie
terrestre, desde el lugar donde se producen los muónes, se ve contraida en un
factor p
1 − v 2 /c2 ≈ 0,11 (3.86)
de acuerdo con la ecuación (3.83) y por lo tanto la superficie de la tierra se
encuentra a una distancia física de

0, 11 × 2,000m = 220m (3.87)

la cual es lo suficientemente corta para que la superficie de la tierra llegue hasta


el punto en el cual se encuentra el muón, antes que este se desintegre.
Esta aparente asimetría en el análisis de un fenómeno físico, visto por dos
observadores inerciales (en un caso el efecto considerado es la dilatación tem-
poral, mientras que para el otro observador es la contracción de longitudes), no
está en contradicción con el principio de relatividad, pues este principio lo que
establece es la invarianza de las leyes físicas para observadores inerciales. En
efecto, dos observadores pueden medir diferentes trayectorias, longitudes, inter-
valos de tiempo, energías cinéticas, etc., pero las leyes que rigen la dinámica de
los sistemas si deben ser las mismas.
Es importante resaltar este aspecto, pues es frecuente caer en aparentes pa-
radojas cuando se aplica el principio de relatividad. De hecho se han construido
muchos ejemplos, llamados en física “gedanken Experimenten”, que ilustran es-
ta situación y que constituyen un buen ejercicio para comprender mejor los
fenómenos relativistas.
Un clásico ejemplo es el de un carro de longitud propia L0 y un garaje de
menor longitud propia d0 con d0 < L0 . Supongamos que el carro se dirige hacia
el garaje con una velocidad v suficiente, para que su longitud medida por un
observador en reposo con respecto al garaje sea menor que d0 , esto es
p
L0 1 − v 2 /c2 < d0 (3.88)

Entonces, un observador en reposo respecto al garage planea atrapar al carro


dentro del garaje y calcula cerrar la puerta de éste, tan pronto la trompa del
carro alcance la pared del fondo. Para el observador que viaja con el carro, es
el garaje el que aparece contraido y por lo tanto, para él es imposible que lo
atrapen dentro del garaje, pues cuando la pared toque la punta del carro, el
observador del garaje no puede cerrar la puerta. Claramente este análisis es
contradictorio, pues desde el punto de vista físico si el carro puede ser atrapado
por un observador, éste debe ser atrapado por todos, o lo contrario, es decir no
es atrapado por ninguno.
La solución a esta aparente paradoja reposa en el hecho que la simultaneidad
no es un concepto absoluto como hemos visto. Cuando el observador ligado al
garage cierra la puerta simultáneamente cuando la trompa del carro alcanza a
la pared, para el observador en el carro, primero llega la trompa a la pared y
luego se cierra la puerta.
Capítulo 4

Espacio-tiempo: estructura
causal

4.1. Introducción
En este capítulo definiremos la estructura causal del espacio-tiempo. En la
primera parte se hará una breve discusión sobre transformaciones lineales que
dejan invariante la distancia euclideana (rotaciones) con el fin de motivar la
estructura minkowskiana del espacio-tiempo y el concepto de cuadrivector. En la
parte final se deducirán las transformaciones de Lorentz a partir de la invarianza
del intervalo espacio-tiempo entre dos eventos y se discutará la estructura causal
del espacio-tiempo.

4.2. Rotaciones en el plano euclideano


Consideremos el plano euclideano

R2 := x = (x1 , x2 ) | xi ∈ R; i = 1, 2


y el conjunto de transformaciones lineales del plano euclideano sobre si mismo:

T : R2 → R2 ; x → x0 = T x (4.1)

tal que dejen invariante la norma euclideana, definida por


2
X
x2 := δij xi xj = (x1 )2 + (x2 )2 (4.2)
i,j=1

es decir,
x0 = T x =⇒ x02 = x2 (4.3)

45
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 46

En la ecuación (4.2) se ha definido el símbolo de Kronecker δij (o tensor


métrico euclideano) por:

0 si i 6= j
δij := (4.4)
1 si i = j

Dado que T es una transformación lineal de R2 en R2 la podemos escribir


como
2
X
x0j = aji xi = aji xi (4.5)
i=1

en donde los coeficientes aji son constantes. En la última igualdad hemos in-
troducido la convención de suma de Einstein, en donde se asume una suma en
todo factor en el cual aparezcan dos índices repetidos, uno como subíndice y el
otro como supraíndice y la suma se realiza sobre el rango de valores que tome
el índice. Busquemos entonces la forma más general de estos coeficientes que
representen una transformación lineal y que dejen invariante la distancia eucli-
deana. Para este fin remplacemos en la ecuación (4.3) la transformación lineal
(4.5):
δij ajk ail xk xl = δij x´i x´j = x´2 = x2 = δij xi xj (4.6)
Identificando los coeficientes de las correspondientes coordenadas, obtenemos
el siguiente conjunto de ecuaciones acopladas para los coeficientes:

a211 + a221 = 1 (4.7)

a212 + a222 = 1 (4.8)


a11 a12 + a21 a22 = 0 (4.9)
2 2
Además, dado que T es una transformación lineal de R en R , y por lo
tanto T x = 0 solo si x = 0, entonces el determinante de la transformación debe
ser diferente de cero
a11 a22 − a12 a21 6= 0 (4.10)
Como el sistema de ecuaciones tiene cuatro incognitas podemos encontrar
tres de éllas en términos de la restante, o equivalentemente podemos despejar
las cuatro incognitas en función de un parámetro. Si llamamos a este parámetro
θ y lo definimos como a11 := cos(θ), directamente se pueden despejar los demás
coeficientes para obtener:

a11 = a22 = cos(θ); a12 = −a21 = sin(θ) (4.11)

Con esto podemos escribir explícitamente las ecuaciones de transformación


en la forma:
x01 = x1 cos(θ) + x2 sin(θ) (4.12)
x02 = x2 cos(θ) − x1 sin(θ) (4.13)
Es de anotar que en el proceso de despejar los coeficientes tenemos que
escoger un signo, pues de la ecuación (4.7), al despejar a21 en términos de a11
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 47

surge una raíz. La escogencia hecha de la raíz positiva nos conduce a que el
determinante de los coeficientes tome el valor +1, que para el caso de haber
tomado la raíz negativa nos hubiera dado el valor del determinante igual a −1.
Que el determinante de los coeficientes de la transformación lineal T es ±1
se puede obtener directamente de las propiedades de las transformaciones que
dejan invariante la norma euclideana de un vector, pues si representamos los
puntos (vectores) de x ∈ R2 por matrices columna
 1 
x
x= (4.14)
x2

entonces, la norma al cuadrado (ecuación (4.2)) se puede escribir como:


  1 τ  1 
 x1

2 x x
x = x x 1 2
= = xτ x (4.15)
x2 x2 x2

donde τ significa la transpuesta de la matriz. De esta forma, la invarianza bajo


la transformación lineal T de la norma se puede escribir de la siguiente forma:

xτ x = x0τ x0 = (T x)τ (T x) = xτ T τ T x (4.16)

lo que implica que la matriz de transformación debe satisfacer la condición

TτT = 1 (4.17)

que fácilmente se ve que conduce al mismo sistema de ecuaciones para los coefi-
cientes de la matriz T . Toda transformación (o matriz) que satisfaga la ecuación
anterior (4.17) se llama ortogonal, y fácilmente se ve que bajo una tal transfor-
mación, también se preservan los ángulos entre los vectores del plano euclideano,
pues
x0 · y 0 ≡ x0τ y 0 = (T x)τ T y = xτ T τ T y = xτ y = x · y (4.18)
Tomando el determinante en la ecuación (4.17) y teniendo en cuenta que
det T = det T τ , obtenemos el resultado general que:

| det T |2 = 1 =⇒ | det T |= ±1 (4.19)

Este resultado tiene una interpretación geométrica que veremos enseguida


(ver Figura 4-1).
Si hacemos una rotación de los ejes coordenados x, y por un ángulo θ y
en sentido contrario a las agujas del reloj, las componentes de un vector de
R2 se transforman como en la ecuación (4.5) y claramente dejan la norma del
vector invariante. Este resultado muestra entonces, que la transformación lineal
que deja invariante la norma de un vector en R2 queda determinada por un
solo parámetro y puesto que es equivalente a una rotación de los ejes, podemos
escoger como parámetro el ángulo de rotación θ. De esta forma podemos escribir
T (θ) para representar esta transformación lineal. Además, si realizamos dos
transformaciones (rotaciones) sucesivas T (θ) y T (ϕ), la primera en un ángulo θ
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 48

Figura 4-1: Rotación de los ejes en el plano euclideano

y la segunda en un ángulo ϕ, entonces la transformación compuesta T (θ) ◦ T (ϕ)


es equivalente a una sola transformación en un ángulo θ + ϕ. Adicionalmente, la
transformación inversa de T (θ) es equivalente a la transformación por un ángulo
−θ y la transformación identidad corresponde a la rotación en un ángulo cero.
Resumiendo
T (θ) ◦ T (ϕ) = T (θ + ϕ) (4.20)
T −1 (θ) = T (−θ) (4.21)
T (0) = 1 (4.22)
Estas ecuaciones definen un grupo matemático, llamado el grupo de rotacio-
nes del plano. Dado que las transformaciones están determinadas por un único
parámetro θ, que varía continuamente de 0 a 2π, el grupo se llama continuo o
grupo de Lie de un parámetro.

4.3. Cuadrivectores y el grupo de Lorentz


Definamos el espacio cuadridimensional de cuadrivectores como:

M : = {x = (x0 , x1 , x2 , x3 ) ∈ R4 | x · y :=
producto interno M inkowskiano} (4.23)

en donde el producto interno minkowskiano está definido como

x · y := x0 y 0 − x1 y 1 − x2 y 2 − x3 y 3 = ηµν xµ y ν (4.24)
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 49

En la última igualdad hemos hecho uso de la convención de suma de Einstein, en


la cual los índices griegos repetidos toman los valores 0, 1, 2, 3 y como es usual en
relatividad, el índice 0 corresponde a la componente temporal del cuadrivector.
Los elementos de matriz ηµν , llamados las componentes del tensor de Minkowski
(nombre que se justificará cuando veamos tensores), están definidos por

 0 si µ 6= ν
ηµν := 1 si µ=ν=0 (4.25)
−1 si µ = ν = 1, 2, 3

El producto interno definido por la ecuación (4.24) induce entonces una


norma
x2 := x · x = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = ηµν xµ xν (4.26)
Definamos una Transformación de Lorentz (TL) como una transformación
lineal
L : M −→ M
(4.27)
x 7−→ x, = Lx
tal que deje invariante el producto interno minkowskiano x · y, esto es

x, · y , = x · y (4.28)

Para encontrar la forma general de una transformación de Lorentz, utilicemos


primero el hecho que cualquier transformación lineal la podemos escribir en la
forma
x,α = Λαβ xβ (4.29)
en donde los coeficientes Λαβ conforman la matriz de transformación de Lorentz.
Remplazando la ecuación (4.29) en (4.28) y comparando coeficientes, obtenemos
las condiciones que deben cumplir los elementos de la matriz de Lorentz:

ηδγ = ηαβ Λαδ Λβγ (4.30)

Esta ecuación la podemos escribir en forma equivalente, como el siguiente


sistemas de ecuaciones:
3
X
(Λ00 )2 − (Λi0 )2 = 1 (4.31)
i=1
3
X
(Λ0k )2 − (Λik )2 = 1; k = 1, 2, 3 (4.32)
i=1

ηρσ Λρµ Λσν = 0; µ 6= ν (4.33)


Este sistema de ecuaciones es general y contiene todas las posibles transfor-
maciones entre sistemas de coordenadas que dejan invariante el producto punto
minkowskiano. Estas transformaciones las podemos dividir en tres categorías:
La primera corresponde a las rotaciones de los ejes espaciales, dejando la coor-
denada temporal inmodificada y forman el llamado grupo de rotaciones. este
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 50

grupo representa el hecho que el espacio físico es isotrópico. Claramente una


rotación espacial queda determinada por tres parámetros, por ejemplo los tres
ángulos de Euler. La segunda categoría la constituye la operación de inversión
de los ejes espaciales y el temporal. La última categoría, que es la de interés
para nosotros, la conforman las transformaciones puras de Lorentz, que repre-
sentan el cambio entre sistemas de referencia inerciales, manteniendo tanto los
ejes espaciales paralelos (no hay rotaciones espaciales) así como el sentido de
los ejes espaciales y el temporal (sin inversión de ejes). Este grupo de transfor-
maciones es conocido en la literatura como las ”boost” de Lorentz ”, las cuales
quedan completamente determinadas por tres parámetros, que pueden ser esco-
gidos para que corresponden a las tres componentes de la velocidad relativa de
los sistemas de referencia.
Antes de continuar desarrollando este último grupo de transformaciones, es
importante aclarar que el conjunto de transformaciones que dejan invariante el
producto punto minkowskiano es más general que el dado en la ecuación (4.29),
pues es inmediato ver que bajo una translación de los ejes espacio-temporales la
invarianza del producto punto se mantiene. Estas tranformaciones representan
la homogeneidad del espacio-tiempo, o en otros términos, la arbitrariedad de
la elección del origen de coordenadas. Esta transformación queda determinada
por cuatro parámetros (las cuatro componentes del cuadrivector translación) y
podemos entonces escribir la transformación de coordenadas más general como

x,α = Λαβ xβ + aα (4.34)

llamada transformación de Lorentz inhomogénea. Estas transformaciones ge-


nerales constituyen el grupo de Poincare de diez parámetros: Tres ángulos de
rotación + tres componentes de la velocidad relativa + cuatro desplazamien-
tos. El grupo de Poincare es el grupo de simetrías fundamental de la física y
representa la expresión matemática del principio de relatividad y de las propie-
dades básicas del espacio y el tiempo, esto es, de la homogeneidad e isotropía
del espacio físico tridimensional y su estructura geométrica euclideana y de la
homogeneidad e isotropía del tiempo.
Restrinjámonos ahora solamente a las ”boost” de Lorentz y consideremos un
sistema de referencia inercial Σ0 que se mueve con velocidad constante v respecto
al sistema inercial Σ a lo largo del eje x1 y con los ejes espaciales paralelos.
Entonces, dado que en este caso x02 ≡ y , = y ≡ x2 y x03 ≡ z , = z ≡ x3 , la
matriz de transformación de Lorentz se reduce a:
 0
Λ 0 Λ01 0 0

 Λ10 Λ11 0 0 
Λαβ =  0
 (4.35)
0 1 0 
0 0 0 1

y las relaciones (4.31), (4.32) y (4.33), toman la forma:

(Λ00 )2 − (Λ10 )2 = 1 (4.36)

(Λ01 )2 − (Λ11 )2 = −1 (4.37)


CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 51

Λ00 Λ01 − Λ10 Λ11 = 0 (4.38)


que es un sistema de tres ecuaciones con cuatro incógnitas y así, los coeficientes
Λαβ por determinar, quedan dados en términos de un parámetro: la velocidad
relativa v entre los sistemas de referencia Σ y Σ0 . Teniendo en cuenta que las
coordenadas del origen del sistema Σ0 , medidas en el sistema Σ están dadas por
(x0 , vc x1 , 0, 0) y que bajo una T.L. se transforman a las coordenadas (x,0 , 0, 0, 0)
en Σ0 , obtenemos la ecuación:
v
0 = Λ10 x0 + Λ11 x1 = Λ10 x0 + Λ11 x0 =⇒
c
v
Λ10 = − Λ11 (4.39)
c
Entonces, el sistema de ecuaciones (4.36), (4.37) y (4.38) tiene solución única
y está dada por:  
γ −βγ 0 0
 −βγ γ 0 0 
Λαβ = 
 0
 (4.40)
0 1 0 
0 0 0 1
en donde
1
γ = γ(v) := q ; (4.41)
v2
1− c2
v
β = β(v) := (4.42)
c
Escribiendo explícitamente el sistema de ecuaciones de transformaciones de
Lorentz,
x,0 = γ(x0 − βx1 ) (4.43)
x,1 = γ(x1 − βx0 ) (4.44)
,2 2
x =x (4.45)
,3 3
x =x (4.46)
vemos la extrecha relación formal con la ecuación (4.13) (rotación de los ejes x1
y x2 ).
No es dificil ver que podemos interpretar formalmente una transformación de
Lorentz, como una rotación en el plano complejo de los ejes (ict, x) en un ángulo
complejo. Para este fín definamos el parámetro φ por la siguiente ecuación:
v
tanh φ := β = (4.47)
c
en donde tanh es la tangente hiperbólica. Con esta definición, y utilizando las
identidades para las funciones hiperbólicas, tenemos que:
v
cosh φ = γ(v); sinh φ = γ(v); (4.48)
c
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 52

Con esta defición (ecuación (4.47)) y las relaciones (4.48) las ecuaciones de
transformación de Lorentz se pueden escribir en la forma:

x,0 = x0 cosh φ − x1 sinh φ (4.49)

x,1 = x1 cosh φ − x0 sinh φ (4.50)


,2 2
x =x (4.51)
x,3 = x3 (4.52)
Recordando la relación cosh φ = cos(iφ), vemos la estrecha relación entre
las rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otra
ventaja que tiene expresar las transformaciones de Lorentz en términos del pa-
rámetro φ, es la expresión para el teorema de adición de las velocidades, pues
dos transformaciones de Lorentz sucesivas, con parámetros tanh φ1 = v1 /c y
tanh φ2 = v2 /c, corresponden a una transformación de Lorentz con parámetro
φ = φ1 + φ2 , pues, de la identidad trigonométrica para la tangente de la suma
de dos ángulos, tenemos:

tanh φ = tanh(φ1 + φ2 )
tanh φ1 + tanh φ2
=
1 + tanh φ1 tanh φ2
v1 /c + v2 /c
=
1 + v1 v2 /c2
v
= (4.53)
c
la cual coincide con la ecuación (3.53).

4.4. Conos de luz y relaciones de causalidad


Puesto que el cuadrado de la norma de todo cuadrivector es un invariante
relativista y esta norma no es definida positiva, podemos clasificar a los cuadri-
vectores en en tres grupos disyuntos: Dado un cuadrivector x ∈ M, definimos:

1. si x2 > 0 el cuadrivector se llama temporal


2. si x2 < 0 el cuadrivector se llama espacial
3. si x2 = 0 el cuadrivector se llama lumínico o nulo

Un cuadrivector x temporal, cuya primera componente es mayor que cero,


x0 > 0, se llama dirigido al futuro, mientras que si x0 < 0 se llama dirigido al pa-
sado. Para entender el significado físico de esta clasificación y sus consecuencias,
consideremos dos eventos físicos, por ejemplo el decaimiento de un núcleo radiac-
tivo de uranio, situado en el origen de coordenadas (x01 , x11 , x21 , x31 ) = (0, 0, 0, 0)
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 53

para un observador Σ y la fisión de otro núcleo de uranio, situado en las coor-


denadas (x02 , x12 , x22 , x32 ) ≡ (ct, x, y, z) medidas por el observador Σ. Calculemos
entonces el intervalo espacio-temporal entre estos dos eventos:
∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (4.54)
2 2 2 2 2
= c t −x −y −z
Consideremos primero el caso ∆S 2 > 0 (sin peder generalidad tomemos
t > 0), y supongamos que en el instante t = 0, en el cual ocurre el primer evento
y desde el origen de coordenadas, se envía una señal luminosa que viaja en la
dirección
p del segundo evento. Puesto que la distancia espacial entre los eventos
es x2 + y 2 + z 2 , el tiempo t0 , que tarda en llegar el rayo de luz al punto del
espacio donde el núcleo se fisiona es menor que t, pues de la relación ∆S 2 > 0
se sigue que
x2 + y 2 + z 2
t2 > = t20 (4.55)
c2
Esto significa que es posible que el primer evento, la desintegración del núcleo,
pueda ser causa del segundo evento, la fisión del otro núcleo. Si hubieramos
supuesto que t < 0 la conclusión es la misma, solo que en este caso la fisión del
núcleo pudo ser la causa de la desintegración del otro. El resultado general que
se desprende de este análisis es que eventos, cuya separación o intervalo espacio-
temporal es mayor que cero, son eventos causalmente conectados (lo que no
significa necesariamente que uno de ellos sea causa del otro), y por lo tanto, la
sucesión temporal de eventos causalmente conectados es la misma para todos
los observadores. Además, puesto que ∆S 2 > 0, notemos que siempre es posible
encontrar un sistema de referencia Σ0 para el cual los dos eventos ocurren en
el mismo punto del espacio, pues basta con elegir la velocidad de este sistema
igual a r
x2 + y 2 + z 2
v= (4.56)
t2
en la dirección apropiada (a lo largo de la línea que une a los dos eventos,
tomándola como el eje de las x) y haciendo una transformación de Lorentz,
obtenemos que las coordenadas de los dos eventos en este sistema de referencia
Σ0 son (0, 0, 0, 0) y (ct0 , 0, 0, 0), y por lo tanto
∆S 2 = c2 t2 − x2 − y 2 − z 2 = c2 t02 (4.57)
Recordando la definición de tiempo propio, como el intervalo de tiempo me-
dido en un sistema de referencia para el cual los dos eventos ocurren en el mismo
punto del espacio, vemos que el intervalo espacio-temporal para eventos nulos,
nos da una medida directa del tiempo propio entre los eventos, sin necesidad
de encontrar el sistema de referencia para el cual los dos eventos ocurren en el
mismo punto del espacio. Así podemos adoptar la siguiente definición general
de tiempo propio:
Si ∆S 2 > 0 para dos eventos, definimos ∆τ , intervalo de tiempo propio,
como: r
∆S 2
∆τ := (4.58)
c2
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 54

Figura 4-2: Estructura causal del espacio-tiempo

En el segundo caso, para eventos nulos donde ∆S 2 = 0, obtenemos una


conclusión similar al caso anterior, en cuanto a que los eventos están conectados
causalmente, solo que para este caso, el fotón que se envía desde el primer evento
en la dirección del segundo, llega en el mismo instante en que ocurre el segundo
evento y en este caso no tiene sentido hablar de tiempo propio entre los eventos,
pues no es posible encontrar un sistema de referencia para el cual los dos eventos
ocurran en el mismo punto del espacio (∆x02 + ∆y 02 + ∆z 02 = 0), sin que se viole
la invariancia de ∆S 2 = 0, salvo en el caso trivial que también fuera ∆t02 = 0,
caso en el cual los dos eventos ocurren en el mismo punto del espacio-tiempo
para todos los observadores.
Para el último caso, de eventos espaciales ∆S 2 < 0, encontramos, realizando
un análisis similar a los anteriores, que el fotón enviado desde el primer evento
hacia el segundo, siempre llega después que el evento ha tenido lugar. Así no
es posible que un evento sea causa del otro y en este caso se habla de eventos
causalmente desconectados. De la expresión para ∆S 2 se obtiene que siempre
es posible encontrar un sistema de referencia para el cual los eventos ocurren
simultáneamente, pero, lógicamente, en puntos separados del espacio. Además,
la sucesión temporal de los eventos depende del observador, es decir, si para
un observador inercia Σ dos eventos P1 y P2 causalmente desconectados (i.e.
espaciales) son tales que t1 < t2 , entonces existen observadores inerciales, e.g.
Σ´, tal que t´1 > t´2 .
Esta clasificación de eventos divide al espacio-tiempo en cinco regiones dis-
yuntas. Dado un evento p , el cual lo podemos ubicar sin pérdida de generalidad
en el origen de coordenadas de un sistema de referencia Σ, el conjunto de eventos
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 55

con coordenadas (ct, x, y, z), medidas en Σ, que satisfacen la relación

∆S 2 = c2 t2 − x2 − y 2 − z 2 = 0 (4.59)

definen el llamado cono de luz del evento p ubicado en el origen de coordenadas.


La razón de llamarse cono de luz surge cuando dibujamos estos puntos en un
gráfico tridimensional, (ct, x, y) como se ve en la (Figura 3.2). Los eventos con
coordenadas tales que:

∆S 2 = c2 t2 − x2 − y 2 − z 2 > 0 y ct > 0 (4.60)

forman el futuro causal de p y aquellos con ct < 0 el pasado causal, esto significa,
que todos los eventos situados dentro del cono de luz de p están causalmente
conectados con p y pueden ser causados por el evento p (futuro causal) o pueden
ser causa de p (pasado causal). Todos los demás eventos, es decir aquellos para
los cuales se cumple la relación

∆S 2 = c2 t2 − x2 − y 2 − z 2 < 0 (4.61)

conforman la región espacial de eventos causalmente desconectados con el evento


p.
Esta forma de representar los eventos en un gráfico espacio-tiempo, nos per-
mite visualizar fácilmente muchos procesos físicos como veremos en varios ejem-
plos a lo largo del texto. Un primer resultado que podemos obtener, sin necesidad
de recurrir a cálculos explícitos, es que la trayectoria de una partícula material
representada en un gráfico espacio-tiempo, siempre tiene que estar dentro del
cono de luz de cada uno de los puntos (eventos) de la trayectoria y la trayectoria
de un fotón (rayo de luz) siempre está sobre el cono de luz de cada uno de los
puntos de su trayectoria (ver Figura 4-3).

4.5. Algebra de cuadrivectores


En esta sección veremos algunas propiedades de carácter matemático de los
cuadrivectores, que se desprenden directamente de la definición de la métrica
minkowskiana, sin necesidad de recurrir a interpretaciones físicas, pero que van
a ser de mucha utilidad para entender algunos resultados de la teoría de la
relatividad.
El espacio cuadridimensional de cuadrivectores M, admite una estructura
de espacio vectorial con la suma de cuadrivectores y el producto de un escalar
(los reales) por un cuadrivector definidos como: para todo x, y ∈ M y todo
λ∈R

x+y = (x0 , x1 , x2 , x3 ) + (y 0 , y 1 , y 2 , y 3 ) (4.62)


= (x0 + y 0 , x1 + y 1 , x2 + y 2 , x3 + y 3 )
λx = λ(x0 , x1 , x2 , x3 ) := (λx0 , λx1 , λx2 , λx3 )
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 56

Figura 4-3: Lineas de universo de partículas físicas

o en forma equivalente, utilizando la notación con índices:

(x + y)µ = xµ + y µ (4.63)

(λx)µ = λxµ (4.64)


De la definición del producto interno invariante de Lorentz y por las propie-
dades del álgebra vectorial definida, se obtienen las siguientes propiedades del
producto interno:
Proposición 4.1 El producto interno minkowskiano satisface las siguientes
propiedades:
x·y =y·x
x · (y + z) = x · y + x · z (4.65)
x · (λy) = (λx) · y = λ(x · y) ∀x, y, z ∈ M ∀λ ∈ R
Su demostración es directa a partir de la definición del producto punto min-
kowskiano (4.24) y del álgebra de vectores definida por las ecuaciones (4.62).
Veamos, como ejemplo del método de demostración, solamente la segunda pro-
piedad. De las definiciones de producto interno y suma de cuadrivectores en
notación de componentes, tenemos:

x · (y + z) = ηµν xµ (y + z)ν
= ηµν xµ (y ν + z ν )
= ηµν xµ y ν + ηµν xµ z ν
= x·y+x·z (4.66)
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 57

como queriamos probar.


Corolario 4.2 ∀x, y ∈ M se cumplen las siguientes identidades:
(x ± y)2 = x2 + y 2 ± 2xy
(x + y)2 + (x − y)2 = 2(x2 + y 2 ) (4.67)
2 2
(x + y) · (x − y) = x − y
Estas identidades se deducen directamente de la Proposición 4.1 anterior.
Podemos extender formalmente, la definición de vectores ortogonales de es-
pacios vectoriales reales con producto interno definido positivo, al caso de cua-
drivectores por medio de la relación x · y = 0, la cual por ejemplo hace que todo
vector nulo sea ortogonal a sí mismo, pues x2 = xx = 0.
Nota 4.1 Dado un cuadrivector cualquiera x ∈ M, con x = (x0 , x1 , x2 , x3 ),
a la primera componente del cuadrivector se le llama temporal y a las otras tres
componentes espaciales, justificando de esta forma la notación x = (x0 , ~x).
Entonces, de la definición del producto interno de cuadrivectores, la norma
de un cuadrivector la podemos escribir como
x2 = (x0 )2 − | ~x |2 (4.68)
con ~x ∈ R3 y | ~x | la norma usual ( euclideana) de R3 .
Otras propiedades de interés de los cuadrivectores son las siguientes:
Proposición 4.2 Si x, y ∈ M son cuadrivectores nulos, entonces los vectores
x + y y x − y son mutuamente ortogonales y tienen normas opuestas.
Para demostrar la ortogonalidad, basta con utilizar la última de las ecuacio-
nes (4.67), pues
(x + y) · (x − y) = x2 − y 2 = 0 (4.69)
dado que los cuadrivectores x y y son nulos, i.e. x2 = 0 y y 2 = 0. De esta última
propiedad y de la primera de las ecuaciones (4.67) se obtiene también, que sus
normas son opuestas:
(x + y)2 = x2 + y 2 + 2x · y = 2x · y (4.70)
(x − y)2 = x2 + y 2 − 2x · y = −2x · y (4.71)
Proposición 4.3 Dos cuadrivectores x, y ∈ M nulos y mutuamente orto-
gonales x · y = 0 son proporcionales entre sí, i.e. x = λy.
Para la demostración basta con tener en cuenta, por hipótesis, las siguientes
relaciones,
0 = xy = x0 y 0 − ~x · ~y (4.72)
0 = x2 = (x0 )2 − | ~x |2 (4.73)
2 0 2 2
0 = y = (y ) − | ~y | (4.74)
Entonces, de las propiedades del producto interno euclideano para las compo-
nentes espaciales de cualquier cuadrivector sabemos que ~x · ~y =| ~x || ~y | cos x∧ y,
y así obtenemos de las anteriores relaciones que
~x · ~y = x0 y 0 = (| ~x |2 )1/2 (| ~y |2 )1/2 ⇒ cos x∧ y = 1 (4.75)
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 58

lo cual significa que las componentes espaciales son paralelas y así proporcio-
nales, es decir ~x = λ~y . Ahora, de la relación ~x = λ~y y remplazándola en la
ecuación (4.72) se obtiene:

0 = xy = x0 y 0 − ~x · ~y = x0 y 0 − λ | ~x |2 (4.76)

Teniendo en cuenta que (x0 )2 =| ~x |2 (relación (4.73)), entonces

0 = x0 y 0 − λ(x0 )2 = x0 (y 0 − λx0 ) (4.77)

Como el cuadrivector x es nulo se debe cumplir que x0 6= 0 y por lo tanto la


ecuación anterior implica que y 0 = λx0 , de donde se deduce que los cuadrivec-
tores x y y son proporcionales, es decir y = λx como se quería probar.
Nota 4.2 La relación

(x + y) · (x − y) = x2 − y 2 (4.78)

nos permite construir cuadrivectores ortogonales a partir de dos cuadrivectores


cualesquiera x y y de igual norma.
Proposición 4.4 Todos los cuadrivectores x ∈ M, ortogonales a un cuadri-
vector z temporal, son espaciales y forman un subespacio tridimensional espa-
cial.
Para su demostración consideremos primero que, si

xz = 0 ⇒ x0 z 0 = ~x · ~z (4.79)

entonces, como z = (z 0 , ~z) es temporal, se debe cumplir que z 0 6= 0 y (z 0 )2 >|


~z |2 y por lo tanto 0 0
x z |~x · ~z| |~x · ~z|
= < (4.80)
|z 0 | |z 0 | (~z2 )
1/2

Elevando al cuadrado ambos lados de esta desigualdad


0 0 2 2
x z |~x · ~z| ~x2 ~z2
2 = (x0 )2 < 2 ≤ x2
2 =~
0
|z | |~z| |~z|

=⇒ x2 = (x0 )2 − ~x2 < 0 (4.81)


Utilizando un argumento similar al anterior, se puede probar que todo vec-
tor ortogonal a un vector nulo es espacial, salvo el caso tratado anteriormente
(Proposición 4.3).
Nota 4.3 Claramente existen tres cuadrivectores espaciales ortogonales en-
tre sí, pero solo hay dos cuadrivectores espaciales mutuamente ortogonales,
que sean a su vez ortogonales a un cuadrivector dado nulo. Esta situación
se puede ilustrar tomando eτ = (1, 1, 0, 0), el cual es un cuadrivector nulo y
e1 = (0, 0, 1, 0) y e2 = (0, 0, 0, 1) cuadrivectores espaciales, ortogonales entre sí
y ortogonales al cuadrivector eτ . Ahora, es claro que cualquier otro cuadrivector
espacial, ortogonal a e1 y e2 , debe tener la segunda componente no nula y por lo
CAPÍTULO 4. ESPACIO-TIEMPO: ESTRUCTURA CAUSAL 59

tanto ya no sería ortogonal al cuadrivector eτ . Para probar esto por contradic-


ción, supongamos que existe un vector e3 = (x0 , x1 , x2 , x3 ) espacial y ortogonal
a los cuadrivectores eτ , e1 y e2 . Entonces, de la ortogonalidad con e1 y e2 se
obtiene que x2 = x3 = 0, y de la ortogonalidad con eτ se tiene que x0 = x1 , por
lo tanto la norma del cuadrivector e3 está dada por:

e3 · e3 = (x0 )2 − (x1 )2 = 0 (4.82)

lo cual implica que e3 sería nulo, contradiciendo la hipótesis inicial.


Nota 4.4 Análogo a la descomposición de vectores ~v ordinarios en compo-
nentes ortogonales, una de ellas a lo largo de un vector dado w,
~ con ~v = ~v⊥ +τ w,
~
en donde ~v⊥ es ortogonal a w, ~ podemos representar cualquier cuadrivector
x ∈ M como
x = y + τz (4.83)
con z un cuadrivector fijo temporal y y un único cuadrivector espacial ortogonal
a z, el cual está completamente determinado por por el cuadrivector x, siendo
τ un parámetro real.
Capítulo 5

Cinemática relativista

5.1. Introducción
En este capítulo se desarrollará la cinemática relativista como una aplicación
de los cuadrivectores. En las dos primeras partes definiremos los cuadrivecto-
res velocidad y aceleración y en la última parte introduciremos el cuadrivector
número de onda, como una consecuencia de la invarianza relativista del produc-
to punto y se discutirá el efecto Doppler y la aberración de la luz como una
consecuencia de las leyes de transformación de los cuadrivectores.

5.2. Cuadrivector velocidad


Definamos el cuadrivector posición x como un elemento del espacio M el
cual describe el instante de tiempo y posición espacial de un evento físico
cualquiera, cuyas coordenadas para un observador inercial Σ están dadas por
xα = (x0 , x1 , x2 , x3 ).
Por ejemplo, la trayectoria de una partícula elemental, es decir, su posición
espacial en cada instante de tiempo, la podemos describir por un cuadrivector
posición x(s) como función de algún parámetro s y a esta función x(s) se le
llama la línea de universo de la partícula. En física no relativista es usual utilizar
como parámetro s la coordenada temporal t. Sin embargo es claro que en el caso
relativista este no es el parámetro más adecuado, aún cuando se puede usar, pues
él depende del observador. Para describir la línea de universo de una partícula
material es usual, dada su interpretación física directa, utilizar como parámetro
s al tiempo propio de la partícula, es decir, el tiempo medido por un reloj que
”viaja con la partícula”, el cual es un invariante relativista y así es un parámetro
independiente del observador. De lo discutido en el parágrafo anterior, si xα 1 y
xα2 son las coordenadas de dos eventos medidos por un observador Σ, entonces
el intervalo espacio-temporal entre los dos eventos está dado por la expresión:

∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (5.1)

60
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 61

Si las coordenadas xα α
1 y x2 representan dos posiciones sucesivas de una partícula
2
material, entonces ∆S es mayor que cero y nos mide el tiempo propio ∆τ entre
los dos eventos (ecuación (4.58)). De esta manera x(τ ) nos describe la posición
espacio-temporal de una partícula en función del tiempo propio τ , transcurrido
desde un instante inicial arbitrario, es decir x(0) nos representa la posición
espacio-temporal de la partícula en τ = 0. Notemos que esta descripción del
cuadrivector posición en función de τ solo es posible para partículas que se
mueven a una velocidad menor que la de la luz, pues para el caso de fotones (u
otras partículas con masa en reposo nula), dado que ellas solo se pueden mover
a la velocidad de la luz, el intervalo ∆s2 entre dos puntos de su línea de universo
siempre es cero.
La velocidad física de una partícula se define como
d~r
~u = (5.2)
dt
en donde ~r son las coordenadas de posición y t el tiempo medido por algún
observador inercial Σ. Podemos generalizar el concepto de velocidad al caso
de cuadrivectores de una manera independiente del observador, definiendo el
cuadrivector velocidad (cuadrivelocidad) por:
dx
U := (5.3)

en donde x(τ ) es el cuadrivector posición que describe la línea de universo de una
partícula material y τ el parámetro tiempo propio. Para encontrar la relación
entre las componentes de la cuadrivelocidad y la velocidad física medida en un
sistema de referencia inercial Σ, basta tener en cuenta la ecuación (4.58). Es
decir, con la notación
x = (x0 , x1 , x2 , x3 ) = (x0 , ~r) = (ct, ~r) (5.4)
tenemos que para una partícula material el tiempo propio transcurrido entre
dos posiciones sucecivas
x = (x0 , x1 , x2 , x3 ) = (x0 , ~r) (5.5)
y
x + dx = (x0 + dx0 , x1 + dx1 , x2 + dx2 , x3 + dx3 )
= (x0 + dx0 , ~r + d~r) (5.6)
está dado por la expresión:
p
cdτ = (dx0 )2 − (d~r)2 (5.7)
y por lo tanto, derivando con respecto a la coordenada temporal, tenemos
r
dτ d~r
= 1 − ( )2 ⇒
dt dt
dt 1
= γ(~u) := p (5.8)
dτ 1 − ~u2 /c2
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 62

en donde ~u = d~r/dt es la velocidad física de la partícula medida en el sistema


de referencia Σ. De esta última ecuación es fácil obtener la relación entre las
componentes de la cuadrivelocidad

U α = (U 0 , U 1 , U 2 , U 3 ) (5.9)

y la velocidad física ~u en Σ, pues aplicando la regla de la cadena para las


derivadas se obtiene
d α d 0
Uα = x = (x , ~x)
dτ dτ
dt d
= (ct, ~r) = γ(~u)(c, ~u) (5.10)
dτ dt
Entonces

U 0 = γ(~u)c; U 1 = γ(~u)ux ; U 2 = γ(~u)uy ; U 3 = γ(~u)uz (5.11)

Por ejemplo, para una partícula en reposo ~u = 0 tenemos que el cuadrivector


velocidad está dado por
U α = (c, 0) (5.12)
Puesto que para determinar unívocamente la velocidad de una partícula se
requieren tres parámetros, por ejemplo, las tres componentes de la velocidad
respecto a algún sistema de referencia y la cuadrivelocidad tiene cuatro compo-
nentes, entonces estas componentes no pueden ser todas independientes y debe
existir una relación entre ellas. Esta relación se puede obtener teniendo en cuen-
ta el hecho de que la norma al cuadrado de todo cuadrivector es un invariante
relativista, así
U 2 = ηαβ U α U β = γ 2 (~u)(c2 − ~u2 ) = c2 (5.13)
Esta relación indica que todo cuadrivector velocidad es temporal y geomé-
tricamente representa el cuadrivector tangente a la línea de universo de una
partícula material, generalizando de esta forma los conceptos usuales de curva
y su vector tangente (velocidad).
Notemos que el valor de la norma al cuadrado del cuadrivector velocidad
se hubiera podido obtener directamente, sin realizar ningún cálculo, pues, da-
do que esta norma es un invariante, siempre podemos escoger un sistema de
referencia inercial particular, por ejemplo, aquel para el cual la partícula está
momentáneamente en reposo, en donde U α = (c, 0), y asi directamente se ob-
tiene que U 2 = c2 . Este ejemplo ilustra uno de los hechos que hacen del cálculo
con cuadrivectores una herramienta muy poderosa y en general más simple.
Otra propiedad muy importante de los cuadrivectores es que todos se trans-
forman, por definición, de la misma forma bajo una transformación de Lorentz,
lo cual nos permite obtener de una manera más simple, pero más general, las
leyes de transformación entre sistemas de referencia inerciales de las variables
físicas. Por ejemplo, el teorema de adición de velocidades se sigue directamen-
te del hecho que siendo U un cuadrivector, entonces sus componentes medidas
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 63

en dos sistemas de referencia Σ y Σ0 están relacionadas por las ecuaciones de


transformación de Lorentz (ecuaciones (4.43), (4.44), (4.45) y (4.46)):

U ,0 = γ(v)(U 0 − βU 1 ) (5.14)

U ,1 = γ(v)(U 1 − βU 0 ) (5.15)
,2 2
U =U (5.16)
,3 3
U =U (5.17)
En donde v es la velocidad del sistema de referencia Σ0 respecto al sistema
Σ y β = v/c. Hemos colocado explícitamente el argumento del factor γ, para
distinguirlo del γ asociado a la velocidad física ~u de la partícula. Teniendo en
cuenta la relación entre las componentes de la cuadrivelocidad y la velocidad
física (ecuación (5.11)), válidas en cualquier sistema de referencia, la ecuación
(5.14) nos da directamente la ley de transformación del factor γ de la partícula:
vux
γ(~u, ) = γ(v)γ(~u)(1 − ) (5.18)
c2
y teniendo en cuenta esta relación, se obtiene, de las otras tres ecuaciones (5.15),
(5.16) y (5.17), el teorema de adición de velocidades o equivalentemente la ley
de transformación de las componentes de la velocidad física entre dos sistemas
de referencia inerciales:

ux0 γ(~u, ) = γ(v)(γ(~u)ux − βcγ(~u)) (5.19)

entonces
ux − v
ux0 = (5.20)
(1 − vu
c2 )
x

y similarmente
p
uy 1 − v 2 /c2
uy0 = (5.21)
(1 − vu
c2 )
x

p
uz 1 − v 2 /c2
uz0 = (5.22)
(1 − vu
c2 )
x

Para finalizar esta sección, daremos dos resultados importantes, que serán
de utilidad en la dinámica relativista.
Proposición 5.1 Cualquier cuadrivector w = (w0 , w) ~ temporal (w2 > 0),
0
y dirigido al futuro (w > 0), puede ser expresado como un múltiplo de una
cuadrivelocidad U .
Para esto basta tomar √
w2
w= U (5.23)
c
Proposición 5.2 Dado un cuadrivector w temporal, siempre es posible en-
contrar un sistema de referencia para el cual las componentes del cuadrivector
sean (w0 , ~0).
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 64

Teniendo en cuenta la Proposición 5.1, basta con probar que se cumple


para una cuadrivelocidad. Sea U = γ(~u)(c, ~u) en un sistema de referencia Σ y
consideremos un segundo sistema de referencia Σ0 cuya cuadrivelocidad respecto
al sistema Σ sea ~u, entonces claramente las componentes de la cuadrivelocidad U
respecto a Σ0 son (c, ~0). La velocidad física del sistema es entonces ~u. En efecto, si
escogemos el eje temporal de Σ0 paralelo a ~u, podemos eliminar sus componentes
espaciales; en caso que el cuadrivector U esté dirigido al pasado podemos aplicar
los mismos argumentos a la velocidad −~u. Esta situación de elección de los ejes
nos permite, en muchas situaciones simplificar cálculos, pues por ejemplo si
W es un cuadrivector cualquiera no nulo, siempre podemos absorber dos de
sus componentes espaciales (digamos W 2 y W 3 ) rotando los ejes espaciales
del sistema de referencia Σ y escoger el eje t0 o x0 a lo largo del vector W ~ y
1
eliminar una componente más, bien sea W (como en el caso anterior) si W es
un cuadrivector temporal, o W 0 si W es un cuadrivector espacial.

5.3. Cuadrivector aceleración


De manera similar a la cuadrivelocidad, definimos el cuadrivector aceleración
(cuadriaceleración) como la derivada de la cuadrivelocidad respecto al tiempo
propio
dU
A = (A0 , A1 , A2 , A3 ) := (5.24)

Para encontrarar la relación de las componentes de la cuadriaceleración con
la aceleración física, i.e., con la derivada de la velocidad respecto al tiempo

~a = d~u/dt (5.25)

medida en un sistema de referencia, basta con utilizar la relación (5.8) en la


ecuación que relaciona las componentes de la cuadrivelocidad con ~u (ecuación
(5.11)) medidas en algún sistema de referencia Σ:

dU α dt d
Aα = = γ(~u)(c, ~u) (5.26)
dτ dτ dt
dγ(~u) dγ(~u)
= γ(~u)( , ~u + γ(~u)~a) (5.27)
dt dt
Consideremos un sistema de referencia inercial para el cual la partícula se
encuentra momentáneamente en reposo, i.e., ~u = 0, entonces para este sistema
las componentes de la cuadriaceleración toman la forma

Aα = (0, ~a) (5.28)

A esta aceleración física ~a se le llama aceleración propia y es un invariante


relativista, pues la norma al cuadrado del cuadrivector aceleración está dada
por
A2 = − | ~a |2 (5.29)
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 65

Esta relación indica también que la cuadriaceleración es un cuadrivector es-


pacial. Además, los cuadrivectores velocidad y aceleración son ortogonales pues,
en el sistema de referencia propio de la partícula el cuadrivector velocidad tiene
componentes (c, ~0) y por lo tanto el producto interno entre los cuadrivectores
velocidad y aceleración, que es también un invariante, está dado por:

U · A = ηαβ U α Aβ = 0 (5.30)

Este resultado se puede obtener directamente, sin hacer uso de un sistema


particular de referencia, pues dado que U 2 = c2 , se tiene entonces que
d 2 d
0= U = 2U · U = 2U · A (5.31)
dτ dτ
Podemos proceder de manera similar como se hizo para obtener las leyes de
transformación de las componentes de la velocidad entre sistemas de referencia
inerciales y calcular las ecuaciones de transformación para la aceleración. Sin
embargo, dado que estas expresiones no son de mucha utilidad, pospondremos la
interpretación física de la aceleración para el siguiente capítulo sobre dinámica
relativista y nos limitaremos en este punto a dar un ejemplo sobre la cinemática
de un sistema con aceleración propia constante.

5.3.1. Viaje interestelar


Este ejemplo ilustra uno de los resultados más sorprendentes de la teoría
especial de la relatividad, conocido históricamente como la paradoja de los me-
llizos de Langevin. Como veremos, este resultado no es de ninguna manera una
paradoja, pero sí es ilustrativo plantearlo en estos términos, pues nos permite
entender de manera más precisa el principio de relatividad y evitar un error
muy común que se presenta cuando se analizan situaciones o fenómenos desde
el punto de vista de diferentes observadores inerciales.
Supongamos que un mellizo parte en un viaje espacial mientras que el otro
permanece en la tierra, entonces como veremos en el siguiente ejemplo numérico
que vamos a tratar, el mellizo viajero regresa a la tierra al cabo de unos cuantos
años medidos por relojes de la nave espacial, mientras que para el mellizo que
permaneció en la tierra habrían transcurrido miles de años medidos por relojes
del sistema de referencia de la tierra. Claramente no hay simetría en el análisis
de la situación vista por los dos mellizos, pues el mellizo viajero no constituye
un sistema de referencia inercial y por lo tanto no es válido (como se plantea
en la paradoja) suponer que visto desde la tierra, es el mellizo de la nave a
quien le transcurren miles de años. Esta situación asimétrica se mantiene aún
en el caso extremo donde el viaje se realice a velocidad constante, pues si el
mellizo viajero regresa a la tierra, éste tiene que frenarse e invertir la velocidad
en algún momento, lo cual implica que el sistema de referencia cohete no puede
considerarse como un sistema inercial.
Consideremos un cohete que parte del reposo en la tierra con una aceleración
propia constante igual a g (la aceleración de la gravedad sobre la superficie de la
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 66

tierra) y viaja hacia el centro de la galaxia. Supongamos que la mitad del viaje
lo realiza acelerando y la otra mitad frenando, también con aceleración propia
g. Tomaremos como sistema de referencia inercial la tierra, con su origen de
coordenadas en la tierra, el origen del tiempo en el instante en que la nave parte
y como eje x la dirección del movimiento de la nave. Entonces las componentes
de la cuadrivelocidad y cuadriaceleración de la nave con respecto al sistema
tierra están dadas por:

U = ~ ) = (U 0 , Ux , 0, 0)
(U 0 , U (5.32)
A = ~ = (A0 , Ax , 0, 0)
(A0 , A) (5.33)

las cuales satisfacen las siguientes relaciones:

U 2 = c2 = (U 0 )2 − Ux2 (5.34)

U · A = 0 = U 0 A0 − U x Ax (5.35)
2 2 0 2
A = −g = (A ) − A2x (5.36)
De la ecuación (5.35) despejamos A0

A0 = Ax Ux /U 0 (5.37)

y reemplazamos en la ecuación (5.36), entonces


 2
2 Ux
g = A2x [1 − ] (5.38)
U0

Utilizando la ecuación (5.34) obtenemos


g 0
Ax = U (5.39)
c
y de esta ecuación y la (5.37) se llega a la relación:
g
A0 = Ux (5.40)
c
Diferenciando con respecto al tiempo propio la ecuación (5.39) y haciendo
uso de la ecuación (5.40), obtenemos una ecuación diferencial para Ux :

d2 Ux g dU 0 g g2
2
= = A0 = 2 Ux (5.41)
dτ c dτ c c
entonces
d2 Ux g2
2
− 2 Ux = 0 (5.42)
dτ c
cuya solución está dada en términos de funciones hiperbólicas, como se puede
probar por sustitución directa,
g g
Ux = C1 sinh( τ ) + C2 cosh( τ ) (5.43)
c c
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 67

con C1 y C2 constantes de integración, las cuales se pueden determinar utilizando


las condiciones iniciales: la nave parte del reposo con aceleración propia g, i.e.,

Ux (τ = 0) = 0 (5.44)
dUx
| τ =0 =g (5.45)

Entonces, de la primera condición se obtiene que C2 = 0 y de la segunda
condición
g
g = C1 cosh(0) ⇒ C1 = c (5.46)
c
Así, obtenemos las siguientes ecuaciones diferenciales para las coordenadas
(x0 , x) de la nave, medidas desde el sistema tierra:

dx g
Ux = = c sinh( τ ) (5.47)
dτ c
dx0 g
U0 = = c cosh( τ ) (5.48)
dτ c
en donde la segunda ecuación se obtiene de la ecuación (5.34).
Integrando estas ecuaciones tenemos

c2 g
x0 = sinh( τ ) + D1 (5.49)
g c
c2 g
x1 = cosh( τ ) + D2 (5.50)
g c
en donde D1 y D2 son constantes de integración. Aplicando las condiciones
iniciales x1 = x0 = 0 para τ = 0 determinamos las constantes de integración
y obtenemos la ecuación para la trayectoria o línea de universo de la nave, en
términos del parámetro τ (tiempo propio de la nave):
g
x0 = c2 g −1 sinh( τ ) (5.51)
c
g
x = c2 g −1 (cosh( τ ) − 1) (5.52)
c
En la Figura 5-1 se muestra un gráfico de la línea de universo de la nave,
en el sistema de referencia tierra. En este diagrama la línea de universo de la
tierra es el eje ct y también se ha dibujado allí, el cono futuro del evento P, es
decir, del evento: partida de la nave en la tierra. La línea de universo del cohete
siempre tiene que estar dentro del cono de luz del evento P y en todo punto la
tangente a la línea de universo es menor de 45o , con respecto al eje ct, indicando
que la velocidad del cohete siempre es menor que c, como lo exige la relatividad.
Notemos además, que la línea de universo del cohete intercepta a la línea de
universo de la tierra en dos puntos: en el instante del lanzamiento de cohete y
luego en el instante en que éste regresa a la tierra.
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 68

Figura 5-1: Línea de universo del cohete

A partir de estas ecuaciones podemos obtener toda la información que se


quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual se en-
cuentra el cohete de la tierra y su velocidad al cabo de 40 años medidos en la
tierra. Para este fin es más conveniente trabajar en unidades de c = 1, y medir
las distancias en años-luz, es decir la unidad de longitud corresponde a la dis-
tancia que recorre la luz en un año. En esta unidades el valor de la aceleración
de la gravedad es
g ' 1al−1 (al ≡ año luz) (5.53)
Como estamos trabajando con unidades de c = 1 tenemos que x0 = t =
40años, entonces, despejando τ de la ecuación (5.51)

τ = sinh−1 (gx0 ) = sinh−1 (40) ' 4, 38años (5.54)

y remplazando este valor del tiempo transcurrido en la nave (tiempo propio) en


la ecuación (5.52), obtenemos la distancia a la cual se encuentra la nave de la
tierra:
x = [cosh(4,38) − 1]años − luz = 39,01años − luz (5.55)
La velocidad de la nave en cualquier instante la podemos obtener derivando
las ecuaciones (5.51) y (5.52), y de la relación entre las componentes de su
cuadrivelocidad y su velocidad física tenemos que:

Uα = ~ ) = γ(~u)(1, ~u)
(U 0 , U (5.56)
α
U = (cosh(gτ ), sinh(gτ ), 0, 0) (5.57)
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 69

por lo tanto, despejando la velocidad ~u = (ux , 0, 0) de esta relación, tenemos


que la velocidad de la nave en ese punto de la trayectoria es:

ux = tanh(gτ ) = tanh(4,38) = 0,9997 (5.58)

El centro de la galaxia se encuentra aproximadamente a unos 30000 años-luz


de la tierra, puesto que la mitad del viaje se hace acelerando y la otra mitad
desacelerando, entonces por simetría, el tiempo propio para que la nave llegue al
centro de la galaxia es el doble del tiempo necesario para recorrer los primeros
15000al. Despejando τ de la ecuación (5.52) tenemos:

τ = cosh−1 (15000 + 1) = 10,309años (5.59)

y por tanto el tiempo medido en la nave para realizar este viaje es de 20,618años,
tiempo perfectamente razonable para un viaje interestelar. Ahora, si este viajero
regresa a la tierra siguiendo el mismo plan de vuelo, entonces el viaje completo
le llevaría un tiempo de 41,236años, mientras que el tiempo transcurrido en la
tierra sería de
x0 = 4 sinh(10,3) = 60003,9años (5.60)
Este ejemplo muestra la famosa paradoja de los mellizos de Langevin, pero
ilustra también claramente la asimetría de la situación.
En el relato de la paradoja se afirma que dada la relatividad de los sistemas
de referencia, esto es, la equivalencia de todos los sistemas de referencia inercia-
les para describir los fenómenos físicos, podemos considerar el viaje visto desde
la nave espacial y ver que es la tierra la que se aleja de la nave y por lo tanto
se espera, que cuando la tierra regrese a la nave, entonces sea el mellizo que
permanecio en la nave al que le han transcurrido 60003,9años, mientras que
al viajero de la tierra tan solo le habrían pasado 41,2años. La falsedad de este
último razonamiento radica en el hecho que la nave espacial está acelerada y por
lo tanto no es un sistema de referencia inercial, a diferencia del sistema tierra,
lo que hace inválido aplicar el principio de relatividad restringida.
Este efecto de retraso temporal de relojes, que se encuentran sometidos a
una aceleración, se ha probado experimentalmente utilizando relojes atómicos
(de alta precisión), uno de los cuales permanece en la tierra y el otro viaja en
un avión alrededor de la tierra. Si bien, el efecto del retardo temporal del reloj
viajero es muy pequeño, del orden de millonésimas de segundo, este tipo de
relojes ha permitido hacer estas medidas con la suficiente precisión, mostrando
este espectacular efecto relativista.
Es de anotar que para el cálculo del retardo temporal en este experimento
terrestre, es necesario tener en cuenta los efectos asociados al campo gravitacio-
nal, es decir hay que trabajar en el contexto de la teoría general de la relatividad,
sin que se invalide de ninguna manera las predicciones de la teoría especial de
la relatividad.
Una última conclusión que se desprende de este ejemplo, es que los viajes
interestelares son físicamente posibles, pues basta con lograr aceleraciones sufi-
cientes durante un tiempo adecuado, para que un viajero en un tiempo razonable
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 70

atraviese nuestra galaxia, o incluso viaje a otras galaxias, pero definitivamente


no pretenda regresar a la tierra, pues en la tierra podrían haber transcurrido
varios millones de años.

5.4. Cuadrivector de onda


Una de las contribuciones más importantes de las ecuaciones de Maxwell
lo constituye la propagación de las ondas electromagnéticas. Debido a que la
ecuación de ondas en el vacío (ver por ejemplo la ecuación (3.14)) es lineal, vale
el principio de superposición y así cualquier onda electromagnética se puede
escribir como una suma o superposición de ondas planas de la forma
~
ψ(t, ~r) = Ae±i(ωt−k·~r) (5.61)

en donde A es la amplitud del campo ψ (por ejemplo el campo eléctrico, mag-


nético, potencial vectorial o potencial escalar), ω la frecuencia de la onda, ~k el
vector de onda y el signo ± indica el sentido de propagación de la onda. La
cantidad
ϕ = ωt − ~k · ~r (5.62)
se llama la fase de la onda y debe ser un invariante relativista, esto es, debe ser
la misma para todos los observadores inerciales. Si definimos el cuadrivector de
onda k como
k := (ω/c, ~k) (5.63)
entonces la fase de la onda se puede escribir como el producto interno minkows-
kiano entre el cuadrivector de onda y el cuadrivector posición

x = (ct, ~r) (5.64)

pues
ω
k·x= ct − ~k · ~r = ϕ (5.65)
c
el cual es un invariante relativista. De las propiedades de transformación de los
cuadrivectores se tiene que las componentes del cuadrivector de onda, medidas
por dos observadores inerciales Σ y Σ0 están relacionadas por las ecuaciones de
transformación:
ω 0 = γ(v)(ω − vkx ) (5.66)
v
kx0 = γ(v)(kx − 2 ω) (5.67)
c
ky0 = ky (5.68)
kz0 = kz (5.69)
De las propiedades de los cuadrivectores sabemos que la norma minkowskiana
de todo cuadrivector es un invariante relativista y por lo tanto se espera que
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 71

ésta tenga un significado físico. Si tomamos la norma del cuadrivector de onda


obtenemos
ω 2 2
k 2 = 2 − ~k = 0 (5.70)
c
pues, si tenemos en cuenta la relación de dispersión para las ondas electromag-
néticas en el vacío
ω
c = (5.71)
~k
vemos que el cuadrivector de onda es un cuadrivector nulo, y cuya norma nos
da la relación de dispersión para ondas electromagnéticas en el vacío.
Consideremos como ejemplo una onda electromagnética plana de frecuencia
ω, que se propaga respecto al sistema Σ a lo largo del eje y, i.e.,
~k = (o, ky , 0) (5.72)

Entonces, para un observador Σ0 que se mueve respecto a Σ con velocidad v a


lo largo de los ejes paralelos xx0 , tenemos
v
ω 0 = γ(v)ω kx0 = − γ(v)ω ky0 = ky (5.73)
c2
En primer lugar, la dirección de propagación de la onda para el observador
Σ0 está dada por la relación
v ω v
kx0 /ky0 = − 2
γ(v) = − γ(v) (5.74)
c ky c
en donde la última igualdad se obtuvo utilizando la relación de dispersión para la
onda en el sistema Σ. En el límite de bajas velocidades, es decir, para velocidades
del observador Σ0 tales que v  c, podemos aproximar el factor γ(v) ∼ 1, y
obtenemos el fenómeno clásico de la aberración de la luz estelar, discutida en el
capítulo segundo.
El efecto Doppler es un fenómeno asociado a las ondas en general y corres-
ponde al cambio en la frecuencia medida por un observador con respecto a la
frecuencia emitida por la fuente, debido a los movimientos relativos del observa-
dor y/o de la fuente y en el caso particular de ondas que requieran un medio para
propagarse, tales como las sonoras o elásticas, también depende de la velocidad
del medio.
En física no relativista el efecto Doppler se puede entender fácilmente si tene-
mos encuenta que, por ejemplo, cuando la fuente se está moviendo en dirección
del observador, el tiempo entre dos pulsos recibidos es menor que el tiempo entre
la emisión de estos dos pulsos, dando lugar así a una frecuencia detectada mayor
a la frecuencia emitida, fenómeno llamado corrimiento hacia el azul. La misma
situación se presenta si es el observador el que se acerca a la fuente. Cuando la
fuente se aleja del observador, la frecuencia detectada es menor que la emitida
y el efecto se llama corrimiento al rojo.
En el caso relativista se presenta una situación similar, pero el factor de
corrimiento se ve corregido debido al comportamiento del tiempo para diferentes
CAPÍTULO 5. CINEMÁTICA RELATIVISTA 72

observadores. En las ecuaciones de transformación para el cuadrivector de onda


( (5.66) a la (5.69)), está contenido el efecto Doppler relativista para la situación
más general posible. Para encontrar las relaciones estandar del efecto Doppler
relativista que se tratan usualmente en los textos de relatividad especial, vamos
a considerar casos particulares de las ecuaciones de transformación (5.66) a la
(5.69).
Supongamos que la fuente está en reposo respecto al observador Σ y que
emite un frente de ondas de frecuencia ω a lo largo del eje x, entonces las
componentes del cuadrivector de onda son (ω/c, kx , 0, 0). De la ecuación (5.66),
y teniendo en cuenta que kx = ω/c, para el observador Σ0 tenemos
v
ω 0 = γ(v)(ω − vkx ) = ωγ(v)(1 − ) (5.75)
c
en donde el signo de la velocidad v es positivo si el observador se aleja de la fuente
y negativo si se acerca. Para el caso de movimiento del observador transversal a
la dirección de propagación, consideremos que el observador Σ emite un frente
de ondas de frecuencia ω en la dirección y, entonces el cuadrivector de onda
toma la forma
k = (ω/c, 0, ky , 0) (5.76)
A partir de la ecuación (5.66) la frecuencia medida por el observador Σ0 es

ω 0 = γ(v)ω (5.77)

Una situación más general de interés se presenta cuando el tren de ondas


emitido por la fuente viaja en el plano xy formando un ángulo α con respecto
al eje de las x, entonces el cuadrivector de onda es

k = (ω/c, kx , ky , 0) (5.78)

con q
~ ~
tan α = ky /kx ; k = kx2 + ky2 ; k = ω/c (5.79)

Entonces para el observador Σ0 se tiene que


v
ω 0 = γ(v)(ω − vkx ) = γ(v)ω(1 − cos α) (5.80)
c
Claramente esta última relación contiene, como casos particulares, las situa-
ciones descritas anteriormente. Cuando α = 0 obtenemos la ecuación (5.75) y
para α = 90◦ se reduce a la ecuación (5.77).
Notemos que el efecto Doppler transversal, ecuación (5.77), es de origen es-
trictamente relativista puesto que es una consecuencia de la dilatación temporal,
situación que obviamente no se presenta en el tratamiento clásico.
Capítulo 6

Dinámica relativista:
Fundamentos

En este capítulo se desarrollarán las leyes de la dinámica relativista utilizan-


do desde un principio, la formulación de cuadrivectores, la cual permite formular
las leyes de la dinámica relativista como una generalización de las leyes funda-
mentales de la mecánica newtoniana.

6.1. Ecuaciones de movimiento


Definamos el cuadrivector momento (cuadrimomento) por
dx
p := m0 U = m0 (6.1)

en donde m0 es la masa inercial propia de la partícula, es decir, la masa inercial
medida en el sistema de referencia en reposo de la partícula. m0 también es
llamada masa en reposo y U es su cuadrivelocidad. Por definición, la masa en
reposo de una partícula es un invariante relativista que caracteriza a la partícula,
pues si tomamos la norma del cuadrivector momento, ecuación (6.1), obtenemos:
p2 = m20 c2 (6.2)
dado que la norma al cuadrado del cuadrivector velocidad es c2 .
A partir de esta definición del cuadrimomento de una partícula, podemos
mantener la misma definición de la segunda ley de Newton, pero formulada
para las cantidades cuadrivectoriales. Así, la ecuación de movimiento relativista
está dada por
dp
f= = m0 A (6.3)

en donde A es la cuadriaceleración y f es el cuadrivector fuerza (cuadrifuerza).
Para interpretar las componentes del cuadrimomento y cuadrifuerza en térmi-
nos de variables dinámicas físicas, específicamente, en términos de su cantidad

73
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 74

de movimiento lineal (momento), de su energía y de la fuerza, consideremos en


primer lugar el cuadrimomento (ecuación (6.1)) y hagamos uso del hecho que a
bajas velocidades comparadas con la velocidad de la luz, i.e. v  c, las ecuacio-
nes de la relatividad deben reducirse a las ecuaciones de la mecánica newtoniana.
Teniendo en cuenta que las componentes de la cuadrivelocidad están relaciona-
das con la velocidad de la partícula a través de la ecuación U α = γ(~u)(c, ~u),
entonces (ver capítulo anterior) las componentes del cuadrimomento serán

pα = (m0 γ(~u)c, m0 γ(~u)~u) =: (E/c, p~) (6.4)

En esta última ecuación hemos definido las cantidades E (con unidades de


energía) y p~ (con unidades de momento) por

E = mc2 (6.5)

p~ = m~u (6.6)
con
m0
m := m0 γ(~u) = p (6.7)
1 − ~u2 /c2
llamada masa inercial relativista de la partícula, nombre que será justificado en
el siguiente análisis. Teniendo en cuenta que en el límite de bajas velocidades el
factor γ(~u) lo podemos expandir en una serie en potencias de (u/c), reteniendo
términos hasta orden (u/c)2 ,

1 ~u2
γ(~u) = 1 + + O(~u4 /c4 ) (6.8)
2 c2
entonces, las componentes espaciales del cuadrimomento toman la forma

1 ~u2
p~ = m0 ~u(1 + + O(~u4 /c4 )) ≈ m0 ~u (6.9)
2 c2
la cual, en el límite de bajas velocidades se reduce a la definición del momento
clásico. Así, la definición del momento relativista de una partícula por la ecua-
ción (6.6), nos conduce a interpretar la masa relativista (ecuación (6.7)) como
la inercia de una partícula, la cual depende de su velocidad.
Para interpretar la componente temporal del cuadrimomento, consideremos
de nuevo el límite de bajas velocidades de la ecuación (6.5). Remplazando la
expansión (6.8) en la definición (6.7) tenemos

1 ~u2 1
E = m0 c20 (1 + 2
+ O(~u4 /c4 )) ≈ m0 c2 + m0 ~u2 (6.10)
2c 2
la cual, salvo el término constante m0 c2 , corresponde a la definición newtoniana
de energía cinética. Así, este resultado nos conduce a definir la cantidad

K := mc2 − m0 c2 (6.11)
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 75

como la energía cinética relativista de una partícula. Esta definición tiene sentido
en cuanto que la función K depende de la velocidad de la partícula, se anula
para ~u = 0 y en el límite de bajas velocidades se reduce a la energía cinética
clásica. La cantidad E = mc2 se define como la energía total de la partícula y a
la cantidad dinámica
E0 := m0 c2 (6.12)
la definimos como su energía en reposo. Esta cantidad E0 adquiere el sentido
físico de una energía, solamente si es posible transformar esta forma de energía
(asociada a la masa y no a su estado de movimiento) en otras formas de energía.
Einstein, en su segundo artículo de 1905 sobre relatividad, titulado ”Depende
la inercia de un cuerpo de su contenido de energía” postula que esta forma de
energía, asociada a la masa en reposo de una partícula, es posible transformarla
en otras formas de energía, dándole así sentido físico a esta definición y sugiere
que esta transformación de masa en energía se puede medir en el decaimiento
radioactivo de las sales de radio. Este postulado le valió a Einstein el ganarse el
dudoso honor de ser ”el padre de la bomba atómica”.
Otro resultado que apoya las definiciones anteriores, nos lo da la interpre-
tación física de las componentes de la cuadrifuerza, definida por la ecuación de
movimiento (6.3). Haciendo uso de la relación d/dτ = γ(~u)d/dt y de la definición
(6.4) de las componentes del cuadrimomento, tenemos

dpα dpα
fα = = γ(~u)
dτ dt
dm d~ p dm ~
= γ(~u)(c, ) = γ(~u)(c , f) (6.13)
dt dt dt
En la última igualdad hemos definido la cantidad

d~
p
f~ = (6.14)
dt
la cual identificamos como la fuerza física que actúa sobre la partícula, produ-
ciendo, de acuerdo con la definición newtoniana de fuerza, un cambio por unidad
de tiempo en el momento de la partícula. Para sustentar aún más esta definición
de fuerza y de paso la definición de energía total E dada, consideremos la rela-
ción de ortogonalidad entre la cuadrivelocidad y la cuadriaceleración (ecuación
(5.30)) U · A = 0, entonces

f · U = ηαβ f α U β = 0 (6.15)

y de esta ecuación y de la definición de las componentes de la cuadrivelocidad,


obtenemos la relación
dm
γ 2 (~u)c2 − γ 2 (~u)f~ · ~u = 0
dt
dE
⇐⇒ = f~ · ~u (6.16)
dt
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 76

Esto implica que si adoptamos la definición clásica de trabajo

dW = f~ · d~r (6.17)

entonces se obtiene que


dW = f~ · ~udt = dE (6.18)
esto significa, que si el trabajo realizado por una fuerza sobre una partícula es
diferente de cero, entonces la partícula cambia su energía total, de acuerdo con
la ecuación (6.18).
Esta última relación nos permite escribir las componentes de la cuadrifuerza,
definidas en la ecuación (6.13), en la forma
1
f α = γ(~u)( f~ · ~u, f~) (6.19)
c
la cual nos da una interpretación directa de las componentes de la cuadrifuerza;
la componente temporal representa el trabajo por unidad de tiempo que realiza
la fuerza física f~ sobre la partícula, mientras que las componentes espaciales
forman el vector fuerza.

6.2. Leyes de conservación


La dinámica newtoniana está basada sobre tres postulados fundamentales:
La primera ley de Newton o el princio de inercia, la cual también se puede for-
mular de manera equivalente, como el principio de relatividad galileano, siendo
el primer postulado de la teoría especial de la relatividad la generalización de
esta primera ley. La segunda ley, que postula la ecuación de movimiento para
una partícula sometida a una fuerza (F~ = m~a), se extiende al caso relativista
a través de la ecuación (6.3). La tercera ley llamada de acción y reacción, que
postula el comportamiento de la interacción entre sistemas, esto es, que la fuerza
ejercida sobre una partícula es el resultado de la interacción de esta partícula con
algún sistema y por tanto, sobre este sistema también interacciona la partícula,
efectuando sobre él una fuerza de la misma magnitud pero de sentido contrario
a la ejercida por el sistema sobre la partícula. Claramente esta ley implica que la
acción y la reacción son eventos simultaneos y por lo tanto no puede ser válida
para el caso relativista en general. Sin embargo, para el caso particular en que
coincidan los puntos de aplicación de las fuerzas de acción y reacción, sí se cum-
ple la tercera ley de Newton, una situación que se puede presentar cuando los
sistemas que interactúan son partículas puntuales y la interacción entre ellas se
pueda aproximar por una interacción de contacto. Puesto que las interacciones
fundamentales (gravitacional, electromagnética, fuerte o nuclear y débil) que
rigen todos los procesos físicos son interacciones a distancia, y por lo tanto en
sentido riguroso, ninguna de estas interacciones fundamentales puede satisfacer
la tercera ley de Newton, es claro que el postulado de Newton sobre la acción y
la reacción, deja de ser una ley fundamental en la naturaleza y su validez queda
restringida a sistemas cuyas velocidades típicas séan pequeñas comparadas con
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 77

la velocidad de la luz, o para interaciones puntuales de contacto. Es importante


anotar en este punto que, en el marco de la mecánica Newtoniana, la terce-
ra ley de Newton juega un papel fundamental para establecer los teoremas de
conservación del momento y de la energía mecánica.
Esto nos conduce entonces, a postular un principio de conservación para la
energía y el momento de un sistema relativista, el cual como veremos, generaliza
las leyes de conservación de la mecánica newtoniana y adiciona una nueva forma
de energía, llamada energía en reposo, que está asociada a toda partícula ma-
terial y que constituye uno de los aportes más importantes de la teoría especial
de la relatividad.
Para un sistema aislado de partículas, con cuadrimomentos pi , i = 1, 2, ...,
el cuadrimomento total del sistema p , defido como
X
p := pi (6.20)
i=1

es una constante de movimiento. Dado que la componente temporal del cuadri-


momento representa la energía total del sistema y las componentes espaciales
corresponden a las componentes del vector momento, entonces el postulado de la
conservación del cuadrimomento asegura que la energía total y el momento total
de un sistema aislado son constantes del movimiento. Esto es, si expresamos la
ecuación (6.20) en componentes, con pi = (Ei /c, p~i ) y p = (E/c, p~), obtenemos
que la energía total del sistema E, definida como la suma de las energías de las
partículas individuales X
E := Ei (6.21)
i=1

y el momento total del sistema, definido como la suma vectorial de los momentos
individuales de las partículas X
p~ := p~i (6.22)
i=1

se conservan. Notemos que la ley de conservación de la energía (ecuación (6.21))


se puede reformular como el postulado de la conservación de la masa inercial,
pues de la definición de energía total de una partícula E = mc2 , tenemos que
X
mi = cte. (6.23)
i=1

Existe toda una serie de consecuencias interesantes de los postulados de la


dinámica relativista, que las vamos a exponer a través de ejemplos sobre proce-
sos que se presentan al nivel de las partículas elementales. Es importante en este
punto de la discusión hacer algunas anotaciones respecto a la diferencia, tanto
en las aplicaciones como en la metodología de trabajo, entre la dinámica new-
toniana y la relativista. En mecánica newtoniana, por lo general se conocen las
fuerzas (su forma funcional), por ejemplo la fuerza de la gravedad, de Coulomb,
del tipo oscilador armónico, de rozamiento, etc., y a partir de ellas , utilizando la
segunda ley de Newton se encuentran las trayectorias de las partículas y las leyes
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 78

de conservación permiten determinar constantes de movimiento, simplificando


así el problema dinámico.
En el caso de la relatividad la situación se modifica un poco, pues, salvo el
caso de la fuerza de Lorentz, que describe la fuerza que actúa sobre una partícu-
la cargada inmersa en un campo electromanético, la cual nos permite describir
el movimiento de la carga solucionando la ecuación dinámica de movimiento,
las otras interacciones fundamentales no admiten, por una parte, una descrip-
ción clásica funcional de la fuerza que esté de acuerdo con los principios de la
relatividad y por otra parte, es conocido que el tratamiento de las interacciones
fundamentales (incluyendo la electromagnética) debe hacerse en en marco de la
teoría cuántica de campos. El caso de la electrodinámica es especial, pues esta
interacción fundamental admite una descripción clásica dada por las ecuaciones
de Maxwell, las cuales son ecuaciones relativistas que describen correctamen-
te los fenómenos electromagnéticos a nivel macroscópico. La diferencia de la
electrodinámica clásica con la ley de gravitación universal de Newton, la cual
también describe correctamente los fenómenos gravitacionales a escalas macros-
cópicas, radica en el hecho que esta última no es una teoría relativista, pues la
fuerza gravitacional newtoniana es una interacción a distancia e independiente
del tiempo. Esta situación fue precisamente la que condujo a Einstein a buscar
una teoría de la gravitación que estuviera de acuerdo con los principios de la
relatividad y que en el límite de bajas velocidades se redujera a la teoría new-
toniana de la gravedad, logrando su objetivo en 1915, cuando formuló la Teoría
General de la Relatividad.
Si bien, las aplicaciones fundamentales de la teoría especial de la relatividad
de dan en el marco de las partículas elementales y como fue enfatizado en el
parágrafo anterior, para su descripción dinámica se requiere de una teoría cuán-
tica de campos, es posible como veremos, obtener toda una serie de resultados
importantes de la dinámica relativista a partir de los principios de conserva-
ción, sin necesidad de recurrir a una descripción completa de las interacciones
que rigen estos procesos.
Antes de entrar a estudiar las principales consecuencias de los postulados de
la dinámica relativista, a través de fenómenos y procesos físicos, daremos algunas
definiciones y propiedades y unos resultados generales que serán de utilidad más
adelante.

6.3. Propiedades del cuadrimomento


Un primer resultado general que se deriva de la formulación cuadrivectorial
de la relatividad surge debido al hecho de que la norma de cualquier cuadrivector
en un invariante relativista y por lo tanto las cuatro componentes que conforman
un cuadrivector no son independientes. Así por ejemplo, esta restricción sobre las
componentes del cuadrimomento de una partícula, nos conduce a una relación
entre su energía total y la magnitud de su momento, pues dado p = (E/c, p~)
tenemos
p2 = E 2 /c2 − | p~ |2 = Invariante (6.24)
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 79

Para calcular el valor de este invariente, basta con determinar el cuadrimo-


mento de la partícula en un sistema de referencia particular, por ejemplo, en
el sistema de reposo instantaneo de la partícula, para el cual el cuadrimomento
toma la forma
p = (E0 /c, ~0) (6.25)
y por lo tanto su norma al cuadrado se reduce a

p2 = E02 /c2 = m20 c2 (6.26)

Esto significa que para una partícula de masa en reposo m0 , energía total E
y momento p~ medidas en un sistema de referencia Σ, se cumple la relación

E 2 /c2 − | p~ |2 = m20 c2 (6.27)

o en forma equivalente
E 2 = E02 + | p~ |2 c2 (6.28)
Dos conclusiones importantes se desprenden de este análisis: La primera
tiene que ver con el hecho de que el cuadrivector-momento de una partícula
física debe ser temporal, pues m20 c2 > 0 y la segunda conclusión es que su
norma nos caracteriza a la partícula, pues está dada por la masa en reposo de
dicha partícula, que es un invariante relativista por definición. Más adelante
cuando discutamos el concepto de fotón o partículas de masa en reposo nula,
volveremos sobre la ecuación (6.28).
Consideremos ahora dos partículas de cuadrimomentos p1 y p2 , con masas
en reposo m01 y m02 respectivamente y sea v la velocidad relativa entre ellas.
Entonces el producto interno minkowskiano entre sus cuadrimomentos, que es
un invariante relativista, está dado por

p1 · p2 = c2 m01 m2 = c2 m1 m02 = c2 m01 m02 γ(v) (6.29)


p
en donde γ(v) = 1 − v 2 /c2 es el factor γ de la velocidad relativa. Para obtener
esta expresión, basta con calcular el producto interno en el sistema de referen-
cia propio de una de las partículas (segunda o tercera igualdad de la ecuación
(6.29)), mientras que la última igualdad de esta ecuación se deduce del hecho
que v es la velocidad de una de las partículas medida en el sistema de referencia
de la otra (i.e. la velocidad relativa).
En mecánica newtoniana se define una colisión elástica entre dos partículas,
cuando la energía cinética del sistema es la misma antes y después de la coli-
sión. Así, en una colisión inelástica parte de la energía cinética de las partículas
se transforma en otras formas de energía, como por ejemplo, calor, ondas me-
cánicas, etc.. Consideremos ahora una colisión relativista entre dos partículas
puntuales, con cuadrimomentos p1 y p2 antes de la colisión y p01 y p02 después de
la colisión. De la hipótesis de conservación del cuadrimomento se obtiene que

p1 + p2 = p01 + p02 (6.30)


CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 80

elevando al cuadrado y utilizando las propiedades del producto interno Min-


kowskiano (ecuación (4.67)) obtenemos

p21 + p22 + 2p1 · p2 = p02 02 0 0


1 + p2 + 2p1 · p2 (6.31)

Uno de los hechos más interesantes que surge en relatividad y que no tie-
ne su contraparte clásica, es que en un proceso de colisión (interacción) entre
partículas, es posible que algunas o todas de las partículas iniciales que inter-
vienen en el proceso se aniquilen y surjan otras diferentes. Que este hecho sea
posible es una consecuencia de la equivalencia masa-energía (ecuación (6.12)).
Es importante reiterar que los parámetros que caracterizan una clase de partí-
culas (electrones, protones, etc.) son su masa en reposo, carga eléctrica, spin, y
otros números cuánticos. En los procesos que son de interés para nosotros, solo
va a intervenir la masa en reposo de las partículas y por lo tanto, este único
parámetro es suficiente para caracterizar dinámicamente a una partícula dada.
Retomando la discusión de la colisión entre dos partículas, consideremos el
caso particular en el cual las partículas que intervienen en el proceso (ecuaciones
(6.30) y (6.31)) son las mismas antes y después de la colisión. Si m01 y m02 son
las masas en reposo de las partículas, entonces de la relación (6.26) se tiene que

p21 = p02 2 2
1 = m01 c (6.32)

p22 = p02 2 2
2 = m02 c (6.33)
y por lo tanto la ecuación (6.31) se reduce a la igualdad

p1 · p2 = p01 · p02 (6.34)

Teniendo presente el resultado de la ecuación (6.29), aplicandolo a ambos


miembros de la ecuación (6.34), se llega a que

c2 m01 m02 γ(v) = c2 m01 m02 γ(v 0 ) (6.35)

con v y v 0 las velocidades relativas entre las partículas antes y después de la


colisión, de donde se obtiene que

v = v0 (6.36)

Por lo tanto, llegamos a la conclusión general que la magnitud de la velocidad


relativa entre las partículas no cambia. Esta situación nos conduce a hacer la
siguiente definición:
Una colisión entre partículas se llama elástica, si las partículas que intervie-
nen en el proceso son las mismas antes y después de la colisión, o equivalen-
temente, si las masas en reposo de las partículas que intervienen en la colisión
no cambian. Con esta definición, el resultado expresado en la ecuación (6.36) se
conoce como el lema de la colisión elástica para dos partículas. Esta definición
de colisión elástica tiene relación con la correspondiente definición newtoniana
de colisión elástica, pues en el límite de bajas velocidades se reduce a la con-
servación de la energía cinética. Para ver esto, basta con tener en cuenta la
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 81

definición de energía cinética relativista como la diferencia entre la energía total


y de reposo. Si llamamos Ei y Ef las energías totales antes y después de la
colisión, entonces de la conservación de la energía total se tiene

Ei = m1 c2 + m2 c2 = m01 c2 + m02 c2 = Ef (6.37)

Por lo tanto, la energía cinética del sistema antes y después de la colisión es


la misma:

Ki = Ei − m01 c2 − m02 c2 = Ef − m01 c2 − m02 c2 = Kf (6.38)

6.4. Sistema centro de masa


Como vimos en la Proposición 4.6, dado un cuadrivector V temporal siem-
pre es posible encontrar un sistema de referencia Σ0 , para el cual sus compo-
nentes se reducen a (V 0 , ~0), dejando además el signo de la primera componente
invariante, puesto que V o está dirigido al futuro (V 0 > 0) o dirigido al pasado
(V 0 < 0). Si W es otro cuadrivector temporal, sincrono con V , i.e., V 0 W 0 > 0,
entonces en el sistema de referencia Σ0 se cumple
~ 2 = V 2 + W 2 + 2V 0 W 0 > 0
(V + W )2 = (V 0 + W 0 )2 − W (6.39)

por lo tanto, se llega al siguiente resultado importante que lo enunciaremos como


un lema:
Lema 5.1 La suma de dos cuadrivectores temporales y sincronos, es un
cuadrivector temporal y sincrono con cada uno de los sumandos.
Por inducción este resultado es válido para una suma cualquiera de cuadri-
vectores temporales sincronos.
Consideremos ahora un sistema de un número finito de partículas no interac-
tuantes, salvo colisiones puntuales mutuas, con masas en reposo m0i , i = 1, 2, ...
y cuadrimomentos pi y sea Σ un sistema de referencia inercial cualquiera. De-
finamos la masa relativista total m̄ del sistema y su cuadrimomento total p̄
como X
m̄ := mi (6.40)
i=1
X X
p̄ := pi = (mi c, p~i ) = (m̄c, p~) (6.41)
i=1 i=1

en donde hemos definido el momento total del sistema p~ en la última igualdad


de la ecuación (6.41). De los postulados de conservación todas las cantidades
definidas, p̄ y por tanto m̄ y p~, son constantes en el tiempo. Por el lema anterior,
el cuadrimomento total del sistema es un cuadrivector temporal y dirigido al
futuro pues m̄c > 0. Por las propiedades dadas en la Proposición 5.1 y Pro-
posición 5.2, podemos encontrar un sistema de referencia que lo llamaremos
ΣCM o sistema de referencia centro de masa, para el cual el cuadrimomento
total p̄ no tenga componentes espaciales, esto es, un sistema para el cual p~ = ~0.
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 82

La velocidad uCM del sistema de referencia centro de masa respecto a Σ está


dada por
p~
~uCM = (6.42)

A diferencia de la mecánica newtoniana, el vector centro de masa de un siste-
ma de partículas relativistas es dependiente del sistema de referencia inercial, lo
cual se puede entender fácilmente si tenemos en cuenta que la masa inercial de
las partículas depende de la velocidad de las mismas. Sin embargo, este vector
centro de masa siempre está en reposo en el sistema de referencia ΣCM . Para
ver esto, definamos para un sistema de referencia inercial Σ, el vector posición
centro de masa del sistema como
P
~ri mi
~rCM := Pi=1 (6.43)
i=1 mi

entonces
d~
ri
ri dm
P P P
i=1 dt mi + i=1 ~
i
d~rCM dt i=1 p~i
= = = ~uCM (6.44)
dt m̄ m̄
en donde se han utilizado las definiciones (6.42), (6.43) y (6.44), el hecho de que
m̄ es una Pconstante de movimiento y además que para interacciones puntuales
(colisión) i=1 ~ri dmi /dt = 0 entre colisiones. Este resultado significa que para
cualquier sistema de referencia, el centro de masa del sistema se mueve con la
velocidad del sistema centro de masa, lo que no significa que el vector posición
centro de masa sea el mismo para todos los observadores inerciales. Por esta
razón, es usual definir el centro de masa del sistema como el vector posición
~rCM medido en el sistema ΣCM .
Definida la velocidad ~uCM (ecuación (6.42)), la cuadrivelocidad del centro
de masa está dada por
UCM = γ(~uCM )(c, ~uCM ) (6.45)
entonces, de la definición de cuadrimomento total (ecuación (6.41)), velocidad
del centro de masa (ecuación (6.42) y la definición de cuadrivelocidad del centro
de masa (ecuación (6.45)), tenemos que

p̄ = (m̄c, p~) = m̄(c, ~uCM ) = m̄γ −1 (~uCM )UCM (6.46)

Tomando la norma al cuadrado de esta ecuación

p̄2 = m̄2 γ −2 (~uCM )c2 (6.47)

la cual debe ser un invariante relativista, nos conduce a la definición de la masa


total del sistema de partículas en el sistema de referencia centro de masa ΣCM :

mCM := (6.48)
γ(~uCM )
Por lo tanto, podemos escribir el cuadrimomento total del sistema como

p̄ = mCM UCM (6.49)


CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 83

en donde mCM y UCM para el sistema de partículas, juegan el papel de m0


y U para una partícula simple. Es importante aclarar que mCM , la masa en
reposo del sistema en ΣCM , excede a la suma de las masas en reposo de las
partículas del sistema, pues a ella contribuyen también las energías cinéticas de
las partículas individuales, puesto que la energía cinética del sistema en ΣCM
está dada por
KCM = mCM c2 − m̄0 c2 (6.50)
en donde hemos definido
n
X
m̄0 := m0i (6.51)
i=1

6.5. Energía umbral


La primera patícula fundamental que se identificó fue el electrón, el cual era
el responsable de la conducción eléctrica. Luego a comienzos de la década de
los treinta, se identificaron el protón y el neutrón como los constituyentes del
núcleo atómico. Por esta época Yukawa desarrolló un modelo para la interac-
ción nuclear, en el cual surgía una nueva partícula fundamental, el pión, que
luego fue observada experimentalmente. Esta época se puede considerar como
el comienzo de la física de las partículas fundamentales y ya en la década de los
sesenta, se conocian cientos de nuevas partículas, las cuales se podían producir
en el laboratorio como producto de las colisiones entre partículas aceleradas a
altas energías (por ejemplo electrones contra electrones o protones). Cuando
chocan dos partículas con energía cinética suficiente, se pueden generar nuevas
y más masivas partículas, como el resutaldo de la transformación de energía
cinética en energía en reposo de las nuevas partículas. La pregunta dinámica
que surge es ¿Cual es la energía mínima necesaria de las partículas incidentes,
para producir una nueva partícula de una masa dada?. La respuesta a esta pre-
gunta la constituye el llamado problema de la energía umbral, que es una de las
aplicaciones más importantes de la dinámica relativista.
Para introducir el concepto de energía umbral, consideremos por ejemplo
un electrón de masa en reposo m0 y energía total E = mc2 , que choca contra
otro electrón en reposo y como producto de la colisión surge, además de los dos
electrones iniciales, una nueva partícula de masa en reposo M0 . El problema es
encontrar la energía mínima necesaria del electrón incidente, llamada energía
umbral, para que esta reacción pueda suceder. La respuesta no es simplemente
(m + M0 )c2 , i.e., que la energía cinética del electrón incidente sea justamente
la energía en reposo de la nueva partícula, pues dado que el momento del siste-
ma debe conservarse, el producto de la colisión en general, debe poseer alguna
energía cinética y por lo tanto parte de la energía inicial debe gastarse en esta
energía cinética y la otra parte debe suplir la energía en reposo de la nueva par-
tícula. De cualquier manera, la energía mínima (umbral) se tendrá cuando las
partículas resultantes de la colisión estén en reposo en el sistema de referencia
del centro de masa del sistema. Esta última afirmación define el concepto de
energía umbral.
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 84

Tomemos por el momento el caso general de dos partícula de masas en reposo


m01 y m02 y cuadrimomentos p1 y p2 respectivamente, que al chocar producen
una nueva partícula de masa en reposo M0 . Entonces, el cuadrimomento total
del sistema está dado por:
p̄ = p1 + p2 (6.52)
Elevando al cuadrado esta expresión y teniendo en cuenta la ecuación (6.29)
y la definición (6.48), tenemos

m201 c2 + m202 c2 + 2m01 m2 c2 = p̄2 = m2CM c2 (6.53)

De esta relación se obtiene que la energía de la partícula incidente, en el


sistema de referencia del laboratorio, será mínima cuando mCM sea mínima, lo
cual ocurre cuando todas las partículas emergentes estén en reposo en el sistema
de referencia centro de masa. Puesto que en este caso la masa del sistema centro
de masa coincide con la suma de las masas en reposo de las partículas que salen,
el límite de mínima energía (6.53) se reduce a

m201 + m202 + 2m01 m02 γ(v) = (m01 + m02 + M0 )2 (6.54)

siendo v la velocidad de incidencia de la partícula 2. Dadas las masas de las


partículas iniciales y la masa de la nueva partícula, podemos obtener de esta
ecuación la velocidad de la partícula incidente y así la energía umbral. Para el
ejemplo de los dos electrones, que al colisionar crean una nueva partícula de
masa en reposo M0 , podemos despejar de la ecuación (6.54) el factor γ(v):

2M0 M2
γ(v) = 1 + + 02 (6.55)
m0 m0

y por lo tanto la energía umbral está dada por

M02 2
EU = m0 γ(v)c2 = m0 c2 + 2M0 c2 + c (6.56)
m0
Esta ecuación es fundamental cuando se diseñan experimentos para buscar
nuevas partículas. Como ejemplo, tomemos el caso del último de los quarks
buscado por los físicos de altas energías, el quark top t, el cual fue detectado
en el año de 1995 en el Fermilab (Estados Unidos). Es importante anotar que
el cálculo que vamos a mostrar, es tan solo un estimado de la mínima energía a
partir de la cual podría detectarse el quark, pues en la reacción donde aparece el
quark, también pueden aparecer otras partículas y por lo tanto, para un cálculo
más exacto se debe tener en cuenta estos efectos adicionales. El quark top se
espera que aparezca en una colisión protón-antiproón (p− p̄) y supongamos para
simplificar, que después de la colisión permanece el par (p − p̄) y el quark τ .
Las predicciones teóricas de la existencia del quark τ , así como su posible masa,
dependen del modelo teórico utilizado, pues por ejemplo, tomando los modelos
más aceptados en julio de 1994 (tomados del Particle Physics Booklet, July
1994, American Institute of Physics) la masa predicha para el quark oscilaba
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 85

entre 62Gev/c2 , pasando por 131Gev/c2 y 174Gev/c2 , hasta el valor más alto
de 169Gev/c2 , calculado a partir del modelo estandar electro-débil. Tomando
para la masa del protón m0 = 0,94Gev/c2 , que es la misma masa del antiprotón,
obtenemos de la ecuación (6.56) la energía umbral en el sistema laboratorio para
la creación del quark top
EU = 32557Gev (6.57)
asumiendo una masa para el quark top de 174Gev/c2 . Es importante anotar
que esta energía umbral calculada, corresponde a la energía con la que deben
incidir, por ejemplo los protones sobre los antiprotones estacionarios, para que
esta reacción pueda ocurrir. En la práctica, las energías alcanzadas hasta el
presente en los grandes aceleradores están en el orden de los cientos de Gev.
Sin embargo, en la mayoría de los aceleradores los experimentos se realizan
en el sistema centro de masa directamente, pues tanto los protones como los
antiprotones (o electrones) son acelerados a las mismas energías en un anillo,
viajando en direcciones opuestas y por lo tanto la energía a la cual ellos son
acelerados debe ser del orden de la energía umbral en el sistema centro de masa,
que para nuestro caso corresponde a energías del orden de la masa en reposo de
la partícula que se quiere encontrar, estos es a energías del orden de los 200Gev.
Para ilustrar esta situación, calculemos la energía disponible en un experimento
de dispersión de protones contra protones (o antiprotones) en dos casos: En el
primer caso, los protones son acelerados hasta alcanzar una energía de 100GeV y
chocan contra un blanco de protones en reposo (por ejemplo un gas de hidrógeno
a baja temperatura, para el cual podemos despreciar la energía cinética típica de
las partículas del gas). En un segundo experimento, los protones son acelerados
a energías del orden de 50GeV , se divide el rayo en dos partes y se hacen chocar
los dos haces de protones frontalmente. Sean p y q los cuadrimomentos iniciales
de los protones y sea ECM la energía del sistema en el centro de masa. De
acuerdo a las ecuaciones (6.47) y (6.48) la cantidad
(p + q)2 = m2CM c2 = ECM
2
/c2 (6.58)
es un invariante, la cual puede ser evaluada en cualquier sistema de referen-
cia. Para el primer caso, protones chocando con un blanco estacionario p =
(E1 /c, p~1 ) y q = (mp0 c, ~0), tenemos
2
ECM = 2m2p0 c4 + 2E1 mp0 c2 ' 2E1 mp0 c2 (6.59)
pues, mp0 c2  E. Con E1 = 100GeV y mp0 c2 = 0,94GeV , la energía disponible
es del orden de 13,7GeV .
Para el segundo experimento, p = (E2 /c, p~2 ) y q = (E2 /c, −~
p ), por lo tanto,
la energía disponible está dada por:
2
ECM = 4E22 =⇒ ECM = 100GeV (6.60)
Para alcanzar esta energía en el experimento de blanco estacionario, sería
necesario acelerar los protones hasta una energía del orden de
2
ECM
E1 ' ' 5319GeV (6.61)
2mp0 c2
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 86

6.6. Fotones y partículas de masa propia cero


En esta sección vamos a introducir el concepto de partícula de masa en re-
poso cero, y en particular el concepto de fotón, como la partícula portadora de
la interacción electromagnética. El concepto de fotón o quantum de energía está
estrechamente relacionado con la teoría cuántica, pero como veremos enseguida
su origen es estrictamente relativista. No está dentro de los objetivos de este li-
bro discutir la formulación de la teoría cuántica de campos, pues no es necesario
tener un conocimiento en física cuántica, para entender los ejemplos y procesos
que vamos a desarrollar a lo largo del presente capítulo. Sin embargo, hare-
mos un breve recuento de los principales hechos históricos que contribuyeron al
desarrollo del concepto de fotón.
En la segunda mitad del siglo XIX, cuando la teoría de Maxwell se consolida
con los experimentos de Herz sobre ondas electromagnéticas, se plantean varios
problemas en diferentes áreas de la física, que finalmente conducen al desarrollo
de la mecánica cuántica. En el campo de la espectroscopia se tenía el problema
de explicar la estructura y en particular, el espectro de emisión y absorción de
radiación electromagnética por átomos. En el experimento de Herz sobre las
ondas electromagnéticas, se reporta un fenómeno curioso que luego, en experi-
mentos más detallados conducen al descubrimiento del efecto fotoelectrico, esto
es, la producción de una corriente eléctrica (fotocorriente) en un material, de-
bido a la incidencia de radiación electromagnética. El problema surge, cuando
todos los intentos teóricos basados sobre la electrodinámica de Maxwell, fallan
para explicar las características de este efecto. Hacia finales del siglo XIX, Max
Planck trabajando sobre el espectro de radiación de cuerpo negro, introduce
la hipótesis de la emision y absorción discreta de energía de los osciladores del
cuerpo negro, el cual se puede modelar por una cavidad cerrada, en la cual se
encuentra radiación electromagnética en equilibrio térmico a una temperatura
T dada. Esta radiación a su vez, está en equilibrio termodinámico con el mate-
rial que conforma la cavidad que está emitiendo y absorviendo continuamente
radiación electromagnética. Contrario a la situación clásica, para la cual se es-
pera que un oscilador pueda absorber o emitir energía en cualquier cantidad,
Planck postuló que cada oscilador podía enmitir o absorber energía únicamente
en valores discretos, múltiplos de una cantidad fundamental

E = hν (6.62)

en donde ν es la frecuencia de cada oscilador que emite y absorve radiación elec-


tromagnética y h se conoce como la constante de Planck, cuyo valor actual es
6,626075(40) × 1034 J · s. Seis años después en 1905, Einstein extiende esta hipó-
tesis y postula que la energía de la radiación electromagnética está cuantizada y
no solamente los osciladores materiales que emiten y absorven la radiación. Así
una onda electromagnética de frecuencia ν transporta su energía en paquetes o
quantos de energía, llamados fotones, de valor hν. Con esta hipótesis, Einstein
explica el efecto fotoeléctrico y predice además que de acuerdo a la equivalencia
masa-energía, los fotones deben transferir momento al igual que cualquier otra
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 87

partícula. La diferencia con las partículas usuales, tales como el electrón o el


protón, está en su masa en reposo, como veremos enseguida.
Partiendo de la definición de las componentes del cuadrimomento (ver ecua-
ción (6.4))
pα = (E/c, p~) (6.63)
y de sus propiedades, ecuación (6.24) o equivalentemente ecuación (6.28), se
tiene la relación, entre la energía total de la partícula E, su energía en reposo
E0 y su momento p~:
2
E 2 = E02 + |~
p| c2 (6.64)
Esta relación nos permite considerar el caso de una partícula de energía en
reposo nula, i.e., E0 = 0. Esto implica por una parte, que su masa en reposo es
cero m0 = 0 y además, que la norma del cuadrimomento de esta partícula es un
cuadrivector nulo, pues su norma se hace cero
2
p2 = E 2 /c2 − |~
p| = 0 (6.65)

Estas partículas se llaman partículas de masa en reposo nula y su principal


característica es que sus líneas de universo siempre están sobre el cono de luz
y por lo tanto no existe ningún observador inercial para el cual estas partículas
estén en reposo. La ecuación (6.65) nos da la relación entre el momento físico
y la energía total de las partículas de masa en reposo nula. El fotón, que es la
partícula asociada al campo electromagnético, es un caso particular de partícula
de masa en reposo nula.
Consideremos ahora el cuadrivector de onda

k = (ω/c, ~k) (6.66)

definido en el capítulo anterior (sección (5.4)), que nos representa una onda
electromagnética plana de frecuencia ω y número de onda ~k y postulemos, de
acuerdo a Einstein, que esta onda transporta su energía y momento en quantos
o fotones, cuyo cuadrivector momento está dado por:

p := ~k = (~ω/c, ~~k) (6.67)

en donde se ha introducido la constante ~, relacionada con la constante de


Planck por ~ = h/2π. De esta relación se sigue que el fotón transporta una
energía total
E = ~ω = hν (6.68)
pues ω = 2πν, de acuerdo al postulado original de Einstein y un momento físico

p~ = ~~k (6.69)

que de acuerdo a las propiedades del cuadrivector de onda (ecuación (5.70)), la


energía (ecuación (6.68)) y el momento físico (ecuación (6.69)), deben cumplir
la relación
2
~2 k 2 = E 2 /c2 − |~
p| = 0 (6.70)
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 88

la cual nos define una partícula de masa en reposo nula, teniendo en cuenta la
ecuación (6.65). Las partículas de masa en reposo cero pueden tener también
otras características que las diferencian entre sí, tales como la carga, momento
magnético, etc.. Aparte del fotón, en la naturaleza se encuentran otras partí-
culas de masa en reposo cero, como por ejemplo los neutrinos. Es importante
anotar que la física busca permanentemente nuevos experimentos para deter-
minar si estos neutrinos son realmente partículas de masa en reposo cero, o si
estos poseen una masa en reposo. Hasta el presente se ha determinado que la
masa en reposo de estos neutrinos, si la tienen, es inferior a 17kev/c2 , que al
compararla con la masa del electrón (la partícula estable de menor masa en
reposo conocida) m0 = 0,51M ev/c2 , es realmente muy pequeña. De hecho para
el fotón también se han realizado experimentos para imponerle cotas superiores
a su masa en reposo. Como ya se ha dicho en la introducción de esta sección,
el carácter dual que presentan las ondas electromagnéticas, esto es, para cierto
tipo de fenómenos, como el efecto fotoeléctrico o el efecto Compton (que dis-
cutiremos más adelante), para los cuales la luz interacciona como partículas,
contrasta con otros fenómenos típicos del carácter ondulatorio de la luz, como
los efectos de interferencia o difracción. Esta dualidad es una característica ge-
neral de toda la materia cuyo estudio le corresponde a la mecánica cuántica.
Esta dualidad es tal vez, uno de los aspectos más interesantes que presenta la
naturaleza y su interpretación ha sido objeto de muchos trabajos. La teoría de
la relatividad no pretende conciliar estas ideas y de hecho, este comportamien-
to dual aparentemente contradictorio, no se presenta como un problema en el
contexto de la teoría de la relatividad, pues tanto las ondas electromagnéticas,
como las partículas de masa en reposo cero (y en particular los fotones) son
conceptos relativistas y su relación física se establece solo a través del postulado
de cuantización de la energía de Planck, el cual en ningún momento entra en
contradicción con los principios básicos de la relatividad.
Para finalizar esta sección, retomaremos algunos resultados generales de la
dinámica relativista, que siguen siendo válidos si alguna o todas las partículas
que intervienen en el proceso son de masa en reposo nula, como por ejemplo la
emisión de un fotón por un átomo.
En primer lugar consideremos el caso de dos partículas de cuadrimomento
p1 y p2 , para el cual el producto interno minkowskiano está dado por la relación
invariante ecuación (6.29). Si una de las partículas es un fotón, e.g., la partícula
2, entonces m02 = 0 y podemos escribir esta relación en la forma:
p1 · p2 = cm01 E2 (6.71)
en donde p1 = (m1 c, p~1 ) y p2 = (E2 /c, p~2 ), con E2 la energía del fotón en el
sistema de referencia propio de la partícula 1. En el caso en que las dos partí-
culas sean fotones, la relación (6.29) se vuelve indeterminada. Para encontrar
la relación correcta, supongamos que p1 = (E1 /c, p~1 ) y p2 = (E2 /c, p~2 ). Como
p1 y p2 son cuadrivectores nulos, se debe cumplir que |pi | = Ei /c, para i = 1, 2,
entonces de la definición de producto interno minkowskiano se tiene:
E1 E2
p1 · p2 = E1 E2 /c2 − p~1 · p~2 = (1 − cos θ) (6.72)
c2
CAPÍTULO 6. DINÁMICA RELATIVISTA: FUNDAMENTOS 89

en donde θ es el ángulo formado por los vectores momento de las partículas, que
para el caso de fotones, sería el ángulo entre las direcciones de propagación de
las ondas electromagnéticas o fotones.
Otra relación que permanece válida para el caso de partículas de masa en
reposo cero, se refiere al problema de la energía umbral, ecuación (6.53). Si por
ejemplo la partícula que choca es un fotón, entonces m2 = ~ω/c2 , m02 = 0 y
por lo tanto
mCM = m01 (6.73)
Capítulo 7

Dinámica relativista:
Aplicaciones

7.1. Introducción
En este capítulo daremos algunos ejemplos de procesos dinámicos, los cuales
ilustran los fenómenos y aplicaciones más importantes de la teoría especial de
la relatividad y más específicamente, de los postulados de conservación de la
energía y el momento.
Restringiremos nuestra discusión a procesos de colisión entre partículas pun-
tuales, i.e., consideraremos únicamente interacciones de contacto, sin entrar en
los detalles de las interacciones (fuerzas) que rigen estos procesos. Como se
mencionó al comienzo del capítulo anterior, de las cuatro interacciones funda-
mentales que determinan la dinámica de todos los procesos conocidos, solamente
la interacción electromagnética admite una descripción clásica relativista. De-
jaremos para el capítulo sobre electrodinámica, el problema de formular las
ecuaciones de movimiento de partículas cargadas en campos electromagnéticos.

7.2. Colisiones elásticas


El ejemplo más importante de una colisión elástica, tanto por su importan-
cia histórica como por sus aplicaciones prácticas, lo constituye el proceso de
dispersión Compton. Este proceso, llamado también efecto Compton, jugó un
papel fundamental en el desarrollo de la mecánica cuántica, pues éste ofreció
una de las primeras pruebas directas del carácter corpuscular de la luz y de paso
también, una prueba más de la dinámica relativista. A. H. Compton recibió el
premio nobel en 1927 por el estudio de este efecto (ver, por ejemplo, el artículo
original: Compton A.H., 1923, Phys. Rev. 22,409).

90
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 91

Figura 7-1: Efecto Compton

7.2.1. Efecto Compton


La dispersión Compton es el proceso de colisión elástico entre una partícula
de masa en reposo cero (e.g., un fotón) contra una partícula masiva (e.g., un
electrón). El experimento original se realizo haciendo colisionar fotones de alta
energía (como rayos X o rayos gama) contra electrones practicamente en reposo,
es decir, electrones con energías cinéticas mucho menores que las energías típicas
de los fotones.
Tomemos el eje z en la dirección de incidencia del fotón (ver Figura 6.1),
entonces su cuadrimomento inicial se puede escribir como

pγ = (Eγ /c, p~γ ) (7.1)

con Eγ = hν la energía, siendo ν la frecuencia del fotón incidente y p~γ =


(0, 0, Eγ /c) su momento, en donde se ha hecho uso de la relación (6.65). El
cuadrimomento inicial del electrón en reposo está dado por:

pe = (me0 c, ~0) (7.2)

Sean
p0γ = (Eγ0 /c, p~0γ ) y p0e = (me c, p~0e ) (7.3)
los correspondientes cuadrimomentos del fotón y del electrón después de la co-
lisión. Sin pérdida de generalidad, supongamos que el plano en el cual se realiza
la colisión es el x − z y sea θ el ángulo que forma la dirección de dispersión del
fotón con respecto al eje z y ϕ el ángulo de dispersión del electrón respecto al eje
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 92

Figura 7-2: Lineas de universo del efecto Compton

z. Entonces de la conservación del cuadrimomento total del sistema, tenemos

pγ + pe = p0γ + p0e (7.4)

En la Figura 6.2 se muestran las líneas de universo del electrón y el fotón en


el sistema de referencia del laboratorio. La línea de universo del fotón, dibujada
a 45o en un plano paralelo al plano ct − z, intercepta a la línea de universo del
electrón en reposo, evento P. En este punto el electrón es dispersado, siguiendo
una línea de universo dentro del cono de luz del evento P, mientras que el fotón
es dispersado en otra dirección, siguiendo una línea de universo sobre el cono de
luz del evento P.
Puesto que experimentalmente se mide la frecuencia (energía) o longitud de
onda del fotón dispersado, en función del ángulo de dispersión y de la frecuencia
o longitud de onda del fotón incidente, despejemos p0e de la ecuación (7.4) y
tomando la norma al cuadrado de esta ecuación resultante, obtenemos:

(pγ + pe − p0γ )2 = (p0e )2 (7.5)

Teniendo en cuenta que


p2γ = p02
γ =0 (7.6)
y
p2e = p02 2 2
e = me0 c (7.7)
llegamos finalmente a la relación:

pγ · p0γ + pe · (p0γ − pγ ) = 0 (7.8)


CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 93

Utilizando la ecuación (6.72) para el producto punto entre cuadrivectores


nulos y de las expresiones (ecuaciones (7.1) a la (7.2)) para los cuadrimomento
del electrón y los fotones inicial y final, obtenemos

Eγ Eγ0
(1 − cos θ) + me0 (Eγ0 − Eγ ) = 0 (7.9)
c2
Expresando las energías de los fotones en términos de la longitud de onda
asociada,
Eγ = hν = hc/λ (7.10)
y
Eγ0 = hν 0 = hc/λ0
obtenemos finalmente, la expresión estandar para la dispersión Compton, la
cual nos da la diferencia entre las longitudes de onda dispersada e incidente, en
función del ángulo de dispersión θ:

λ0 − λ = λe (1 − cos θ) (7.11)

A la cantidad λe := h/me0 c se le llama longitud de onda de Compton aso-


ciada al electrón. En la (Figura 7-3) se reproducen los resultados originales de
Compton.
En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys. Rev.
80,929) midieron por primera vez al electrón dispersado simultáneamente con el
fotón, en un experimento de coincidencia, obteniendo resultados en concordancia
con la teoría. Para calcular el ángulo de dispersión del electrón, en función del
ángulo de dispersión del fotón y de la energía del fotón incidente, despejemos
la velocidad del electrón de las componentes espaciales de la ecuación (7.4) y
eliminando Eγ0 en esta expresión, con la ayuda de la ecuación (7.9), obtenemos:

me0c c2 sin θ
tan ϕ = (7.12)
(Eγ + me0 c2 )(1 − cos θ)

en donde ϕ es el ángulo de dispersión del electrón, medido con respecto a la


dirección de incidencia del fotón. En el experimento de coincidencia de Cross y
Ramsey se midió un ángulo ϕ = 31,3◦ , para una energía del fotón incidente de
2,6M ev y un ángulo θ = 30,0◦ para el fotón dispersado.

7.2.2. Efecto Compton inverso


Como otro ejemplo de colisión elástica, consideremos la dispersión de un
fotón de muy baja energía por una partícula, por ejemplo un protón, de alta
energía. Después de la colisión la partícula masiva le cede parte de su energía
cinética al fotón, el cual se dispersa con una frecuencia mayor dependiente del
ángulo de dispersión. Por esta razón, a este proceso lo llamaremos efecto Comp-
ton inverso. El desarrollo matemático es similar al del efecto Compton tratado
en el parágrafo precedente, aun cuando algo más complejo, pues la partícula
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 94

Figura 7-3: Resultados experimentales de Compton

está inicialmente en movimiento. Para discutir un fenómeno interesante que se


puede presentar con los rayos cósmicos y los fotones de la radiación cósmica de
fondo, vamos a restringir la discución a un caso particular de este proceso de
dispersión.
Supongamos que la energía del fotón inicial Eγ es mucho menor que la energía
total de la partícula incidente Ep = mp c2 , i.e., Eγ  mp c2 y consideraremos
solamente el caso de máxima transferencia de energía en el proceso de colisión,
que de acuerdo con la relación (ecuación (7.11)) se obtiene para el caso de
dispersión frontal, es decir θ = 180. Sea pγ = (Eγ /c, p~γ ) el cuadrimomento
del fotón y pp = (Ep /c, p~p ) el cuadrimomento del protón antes de la colisión
y sean p0γ = (Eγ0 /c, p~0γ ) y p0p = (Ep0 /c, p~0p ) los correspondientes cuadrimomentos
después de la colisión. De manera similar al caso tratado para el efecto Compton,
despejamos p0p de la ecuación de conservación (7.4) y elevando al cuadrado,
obtenemos
pγ · p0γ + pp · (p0γ − pγ ) = 0 (7.13)
0
Teniendo en cuenta que |~ pγ | = Eγ /c, p~γ = Eγ0 /c y utilizando la aproxima-
ción
q m2p0 c4
pp | c = Ep2 − m2p0 c4 ≈ Ep − −
|~ (7.14)
2Ep
obtenemos, para la energía del fotón dispersado

Eγ (Ep + P~p c)

0 Ep
Eγ = ≈ (7.15)
2Eγ + Ep − |~ pp | c 1 + m2p0 c4 /Eγ E p
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 95

El modelo estandar de la cosmología describe la estructura y evolución del


universo actual, postulando su origen a partir de un estado inicial de altísima
densidad y temperatura (en principio infinitas). Una de las predicciones funda-
mentales del modelo estandar de la cosmología es la existencia de un fondo de
radión cósmica (radiación electromagnética con un espectro de cuerpo negro),
el cual se ha ido enfriando debido a la expansión del universo, alcanzando una
temperatura actual del orden de 2,73◦ K. Esta radiación cósmica de fondo se
puede modelar como un gas de fotones, con una cierta distribución de energías.
En promedio un fotón típico de este fondo de radiación tiene una energía media
dada por
Eγ = kB T (7.16)
en donde T es la temperatura absoluta de 2,73◦ K y

kB = 1,380 × 10−23 J · K −1 = 8,617 × 10−5 eV · K −1 (7.17)

es la constante de Boltzmann.
Por otra parte, los rayos cósmicos son haces de partículas elementales (en
su mayoría electrones y protones) de alta energía E ∼ 1020 eV , cuya fuente, aun
cuando no está completamente determinada, parece ser de origen galáctico. Un
protón típico de estos rayos cósmicos, puede entonces dispersar elásticamente
un fotón del fondo de radión cósmica y suministrarle entonces una energía, que
de acuerdo a la relación (6.39), es del orden de

1020 eV
Eγ0 ' ' 2,6 × 1018 eV (7.18)
1 + (0,938 × 109 )2 /(1020 · 2,37 × 10−4 )

Es decir, el fotón dispersado puede adquirir energías típicas de los rayos


gama.

7.3. Colisiones inelásticas


Las aplicaciones más importantes de la dinámica relativista se encuentran
en los procesos de dispersión inelásticos, tales como la absorción y emisión de
fotones y la creación de nuevas partículas. Cuando colisionan dos partículas,
se pueden producir muchos tipos de efectos que podemos esquematizar en los
siguientes tipos de reacciones:

A+B =C
A+B =A+B+C
(7.19)
A+B =A+C
A+B =C +D+F +···

La primera reacción por ejemplo, representa un proceso en el cual las partícu-


las que chocan se aniquilan, para dar lugar a una nueva partícula (por partícula
queremos significar tanto las partículas elementales, como aquellas que presen-
tan estructura interna o están conformadas por otras partículas elementales,
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 96

tales como los átomos, moléculas o núcleos). La segunda reacción representa un


proceso en el cual las partículas iniciales sobreviven a la colisión, dando lugar
a una nueva partícula. En el tercer caso, una de las partículas que entra en la
reacción se aniquila, dando lugar a la creación de otra y en la última reacción
las partículas iniciales desaparencen y surgen varias partículas nuevas.
¿Que leyes físicas determinan cuál o cuáles reacciones pueden ocurir?. En
primer lugar están las leyes de conservación, las cuales determinan si un proceso
dado puede o no suceder. Tomemos como ejemplo un fotón que choca contra
un electrón inicialmente en reposo y captura al fotón, saliendo el electrón con
cierta energía cinética. Sean
p = (me0 c, ~0) (7.20)
y
q = (Eγ /c, Eγ /cn̂) (7.21)
los cuadrimomentos iniciales del electrón y el fotón respectivamente, con n̂ un
vector unitario en la dirección de movimiento del fotón incidente y sea

p0 = (mc, mvn̂) (7.22)

el cuadrimomento del electrón depués de la colisión. Al aplicar el postulado


de la conservación del cuadrimomento, p + q = p0 , obtenemos un resultado
inconsistente, pues basta con elevar al cuadrado esta expresión:

m2e0 c2 + 2me0 Eγ = (p + q)2 = p02 = m2e0 c2 (7.23)

la cual implica que me0 = 0 o Eγ = 0. Esto significa que este proceso es prohi-
bido, pues viola el principio de conservación del cuadrimomento. En segundo
lugar existen otros principios de conservación los cuales, en general, dependen
de la interacción (fuerte, electromagnética, débil o gravitacional) que media el
proceso de colisión y que de igual manera, a los principios fundamenta de con-
servación de la energía y momento, restringen los procesos que puedan ocurrir
en una colisión entre partículas. Algunos de estos principios de conservación son
de validez general, tal como la conservación de la carga eléctrica, mientras que
otros, como la conservación del número bariónico o la paridad, solamente se
cumplen para unas interacciones pero no para otras. Por ejemplo, la interacción
electromagnética conserva la paridad, pero la interacción débil no la conserva.

7.3.1. Absorción de un fotón por un átomo


Antes de entrar en el problema de absorción de un fotón por un átomo, es
importante aclarar la diferencia, desde el punto de vista de la dinámica rela-
tivista, entre un átomo y una partícula elemental. La partícula elemental está
caracterizada por su masa propia y eventualmente por otros números cuánticos
como la carga, el spin, el isospin, etc, y basta que uno de estos parámetros sea
diferente para que se tenga otra partícula elemental diferente. Un átomo, por
otra parte, está caracterizado por su número atómico (i.e., el número de elec-
trones o protones el cual determina sus propiedades químicas) y su número de
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 97

nucleones (protones más neutrones del núcleo) el cual determina los diferentes
isótopos de un mismo elemento químico. La masa propia de los átomos no es
estrictamente un parámetro que determine un tipo particular de átomos, pues
dado que los atómos presentan estructura interna, (como los diferentes niveles
de energía) la energía cinética de las partículas que lo constituyen y la energía
potencial de interacción entre ellas contribuyen también a la masa propia de
los átomos. Es de anotar, que si bien la contribución a la masa de los átomos
debida a esta energía interna, es muy pequeña comparada con la suma de las
masas de las partículas que lo conforman, sí hacen una diferencia fundamental,
cuando se trata el problema dinámico de la emisión y absorción de fotones por
átomos, como veremos en esta sección.
Así, un átomo que ha emitido o absorbido un fotón, tendrá una masa pro-
pia diferente antes y después del proceso, sin que cambien necesariamente sus
propiedades químicas y por lo tanto desde el punto de vista de la dinámica re-
lativista relativista, estos átomos son partículas diferentes antes y después de la
emisión o absorción de un fotón. Esta misma situación sigue siendo válida, aún
en el caso en que el átomo se ionise (pierda uno o varios de sus electrones) y
también cuando estamos tratando con otras estructuras como los núcleos ató-
micos. Por esta razón, una partícula elemental (sin estructura interna) aislada,
tal como un electrón, no puede emitir o absorber un fotón individual, sin violar
los principios de conservación fundamentales como vimos en el ejemplo tratado
anteriormente.
Consideremos una partícula no elemental (átomo, molécula, ión o núcleo)
con masa en reposo M0 , sobre la cual incide un fotón de frecuencia ν, el cual es
absorbido por la partícula. En la Figura 6.4 se muestra el proceso de absorción
de un fotón por un átomo. La línea de universo del átomo inicialmente en reposo,
intercepta a la línea de universo del fotón, evento P. El átomo captura al fotón
y se dispersa siguiendo una línea de universo recta, la cual está dentro del cono
de luz futuro del evento P.
Sea M00 la masa de la partícula después de la colisión y calculemos, suponien-
do que la partícula inicial está en reposo, la velocidad con que sale la partícula
final. Llamemos p = (M0 c, ~0) y q = (Eγ /c, Eγ /cn̂) los cuadrimomentos iniciales
de la partícula y el fotón respectivamente, en donde Eγ = hν y n̂ es un vector
unitario en la dirección de propagación del fotón. El cuadrimomento final del
sistema será p0 = (M 0 c, M 0 vn̂), pues por la conservación del momento, la direc-
ción de movimiento de la partícula final es la misma que la del fotón incidente,
siendo v su velocidad y p
M 0 = M00 / 1 − v 2 /c2 (7.24)
De la conservación del cuadrimomento p + q = p0 podemos despejar directa-
mente, elevando al cuadrado esta expresión, la masa en reposo de la partícula
final r
0 2Eγ
M0 = M0 1 + (7.25)
M 0 c2
Escribiendo explícitamente en componentes la ecuación de conservación del
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 98

Figura 7-4: Lineas de universo del átomo y el fotón capturado

cuadrimomento
M 0 c2 + E γ = M 0 c2
(7.26)
Eγ /c = M 0 v
podemos calcular la masa relativista y la velocidad de la partícula final:

M 0 = M0 + (7.27)
c
v
β= Eγ
(7.28)
c+ M0 c2 +Eγ

Las partículas con estructura interna, como los átomos, moléculas y núcleos,
poseen niveles de energía internos Ei con i = 0, 1, 2, ..., (en donde el nivel E0
se le llama estado base o fundamental del sistema) y por lo tanto el proceso de
absorción de fotones por este tipo de partículas es selectivo, esto es, la partícula
solo puede absorber fotones de ciertos valores de energía que cumplan con la
condición que Ej − Ek ' Eγ , estrictamente Eγ > Ej − Ek , pues parte de la
energía del fotón incidente debe gastarse en la energía cinética final del átomo
(lo cual se deduce de las ecuaciones (7.27) y (7.28)).
En un átomo, por ejemplo, la diferencia típica entre niveles de energía es-
tá en el rango de los electronvoltios. Puesto que la masa propia de los átomos
oscila entre 1GeV /c2 (para el átomo de hidrógeno) hasta los cientos de gigaelec-
tronvoltios (para átomos pesados), la fracción Eγ /M0 c2 es del orden de 10−8 ,
calculada para el caso de un átomo de hidrógeno, mientras que la diferencia
entre niveles de energía es inferior a 13,6eV (valor que corresponde a la energía
de ionización del átomo de hidrógeno).
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 99

De la ecuación (7.25) vemos que la masa propia del átomo exitado (que ha
absorbido el fotón) es tan solo una fracción del orden de 10−8 mayor que la masa
del átomo inicial. Por otra parte, la velocidad del átomo exitado está dada por
la ecuación (7.28)), obteniendose

v = 10−8 c (7.29)

en donde para estos cálculos, hemos asumido un valor típico de 10eV para la
energía Eγ del fotón incidente.
Es de anotar que si incide un fotón sobre un átomo con una energía mayor a
la de ionización, el fotón puede ser capturado por el átomo, o más exactamente
por un electrón del átomo, el cual se desprende del sistema con una energía
cinética igual al exceso de energía del fotón sobre la energía de ionización. Este
proceso, diferente al que estamos considerando, es la base del efecto fotoeléctrico
el cual, como ya se ha mencionado anteriormente, jugó un papel fundamental
en el desarrollo de la mecánica cuántica. Si llamamos ϕ la energía de ligadura
del electrón al átomo, o a la estructura de átomos para el caso de un sólido
(llamada también función trabajo del material), y Eγ = hν a la energía del
fotón incidente, entonces si este fotón es absorbido por el sólido, el electrón se
puede desprender del material, con una energía cinética dada por

Ke = hν − ϕ (7.30)

La energía cinética de los electrones desprendidos, llamados fotoelectrones,


se puede medir utilizando un contravoltaje. La ecuación (7.30) presenta dos
características importantes probadas experimentalmente, las cuales no pueden
ser explicadas con un modelo ondulatorio de la luz: La primera característica
es la relación líneal entre la frecuencia de la luz incidente, sin importar cual
sea la intensidad de ella (la intensidad de la luz, en el modelo ondulatorio es
proporcional al cuadrado de la amplitud de los campos electromagnéticos, mien-
tras que en el modelo corpuscular de la luz, la intensidad es proporcional a la
densidad de fotones). La segunda característica importante, es la existencia de
una frecuencia umbral ν0 , por debajo de la cual no hay corriente de fotoelectro-
nes, la cual se obtiene cuando Ke = 0 = hν0 − ϕ y que depende del material,
pues la función trabajo ϕ es una propiedad del material, más no de la radiación
electromagnética incidente.

7.3.2. Emisión de un fotón por un átomo exitado


Consideremos ahora el proceso inverso al descrito en la sección anterior.
Supongamos que un átomo exitado de masa propia M0 , inicialmente en reposo,
emite un fotón de frecuencia ν, esto es, de energía Eγ = hν.
En la Figura 6.5 se muestran las líneas de universo del proceso de emisión
de un fotón por un átomo. El átomo exitado, inicialmente en reposo, emite un
fotón: evento P. El fotón emitido sigue una línea de universo que está sobre el
cono de luz futuro del evento P, en tanto que la línea de universo del átomo
dispersado es descrito por la línea recta, interior al cono de luz del evento P.
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 100

Figura 7-5: Lineas de universo del átomo y el fotón emitido

De manera similar al caso tratado en la sección anterior, la energía del fotón


emitido no puede ser exactamente igual a la diferencia entre dos niveles de
energía del átomo, de hecho debe ser ahora menor Eγ < Ej − Ek ≡ Eγ0 ,
pues por conservación de momento el átomo, al emitir el fotón, debe sufrir
un retroceso y por lo tanto parte de la energía suministrada por el átomo al
realizar la transición, debe ser transformada a energía cinética del átomo final.
Es de anotar que esta energía Eγ0 corresponde también a la diferencia entre las
energías en reposo de los átomos inicial y final, i.e.,

Eγ0 = M0 c2 − M00 c2 (7.31)

Una variable de interés en este proceso es la relación entre la energía del


fotón emitido, con respecto a la diferencia entre dos niveles internos de energía
del átomo, o equivalentemente, a la energía de un fotón emitido por el átomo,
si este no sufriera retroceso.
Sean
p = (M0 c, ~0) (7.32)
el cuadrimomento del átomo inicial y

q = (Eγ /c, Eγ /cn̂) (7.33)

y
p0 = (M 0 c, −M 0 vn̂) (7.34)
los cuadrimomentos finales del fotón y el átomo, en donde n̂ es la dirección de
propagación del fotón y v la velocidad de retroceso del átomo. De la ecuación
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 101

de conservación del cuadrimomento, escrita en la forma p0 = p − q y elevando al


cuadrado esta ecuación, se obtiene la relación:

M002 c2 = M02 c2 − 2M0 Eγ (7.35)

Remplazando la masa en reposo del átomo final, en términos de Eγ0 , se llega


finalmente a
Eγ0
Eγ = Eγ0 (1 − ) (7.36)
2M0 c2
Para ganar una idea de las magnitudes de las variables físicas involucradas,
tomemos de nuevo el caso del átomo de hidrógeno y supongamos que Eγ0 '
10eV y M0 c2 ' 1GeV , entonces la energía del fotón emitido será una fracción del
orden de 10−12 veces menor, que la frecuencia de un fotón emitido sin retroceso.
Como se discutió anteriormente, el efecto del retroceso causa una dismi-
nución en la frecuencia del fotón emitido con respecto a la frecuencia de la
transición y la fración en la cual cambia esta frecuencia, es inversamente pro-
porcional a la masa del átomo (ver ecuación (7.36)). Si el átomo emisor está
ligado a una estructura, por ejemplo a una red de átomos como en un sólido,
entonces la masa efectiva que absorbe el momento de retroceso será ahora del
orden de 1023 veces la masa del átomo emisor y la energía del fotón emitido,
prácticamente coincide con la energía propia de la correspondiente transición
entre niveles de energía del átomo. Este efecto de emisión sin retroceso fue des-
cubierto por Möβbauer, quien recibió el premio nobel en 1961 y este efecto es
actualmente una fuente de muchas aplicaciones en física atómica, estado sólido
y física nuclear.

7.4. Sistemas de masa variable


Puesto que la masa inercial de una patícula medida por un observador de-
pende de la velocidad, se puede considerar que todo sistema relativista es, de
hecho, un sistema de masa variable. Sin embargo en relatividad, el equivalente
al caso de la mecánica clásica de un sistema de masa variable, corresponde a
un sistema cuya masa propia sea variable. Un ejemplo de un sistema de masa
propia variable, lo constituye el cohete fotónico, esto es, un cohete para el cual
el sistema de propulsión transforma masa en energía radiante (fotones).
Retomemos el ejemplo discutido en el capítulo anterior de una nave espacial
que realiza un viaje al centro de nuestra galaxia, con aceleración propia constante
igual a la aceleración de la gravedad g y supongamos que esta nave dispone de
un cohete de propulsión que transforma masa en reposo en fotones y los radía
con un ciento por ciento de eficiencia, directamente hacia atrás y perfectamente
colimados. Calculemos entonces qué fracción de la masa propia inicial es gastada
para realizar el viaje hasta el centro de la galaxia, suponiendo (como en el
ejemplo del capítulo cuarto, sección (4.5.3)) que durante la mitad del viaje
acelera y la otra mitad frena, con aceleración propia constante g. Sea M la
masa propia del cohete en un instante dado (la cual es variable) y P = M U su
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 102

cuadrimomento, en donde
~ ) = (U 0 , Ux , 0, 0)
U = (U 0 , U (7.37)

es la cuadrivelocidad del cohete, el cual se mueve a lo largo del eje x y

prad = (Erad /c, p~rad ) (7.38)

el cuadrimomento de la radiación. Por conservación de la energía, el cambio en


la energía del cohete es igual al cambio en la energía radiada, entonces

d(M U 0 ) = −dErad /c (7.39)

Como la energía radiada es en forma de fotones, se debe tener que:

dErad = cdprad (7.40)

y por conservación del momento tenemos:

dprad = d(M Ux ) (7.41)

Entonces, de estas relaciones obtenemos la ecuación:

dM U 0 = −d(M Ux ) (7.42)

la cual se puede escribir en la forma:

dM d(U 0 + Ux )
=− (7.43)
M U 0 + Ux

Integrando esta ecuación y teniendo en cuenta las expresiones para U 0 y


Ux (ecuación (5.47)) se llega, finalmente a la expresión para la masa propia del
cohete, en función del tiempo propio τ :

M = M0 e−τ g/c (7.44)

en donde M0 es la masa propia inicial de la nave. De acuerdo a la ecuación (5.59),


el tiempo propio para que la nave realice la mitad del viaje es de 10,3años y
por lo tanto eτ g/c ' 29700, de donde se sigue que la masa propia de la nave a
la mitad del viaje es de M1/2 = M0 /29700 y la masa propia al final del viaje
hasta el centro de la galaxia será

Mf inal = M0 /(29700)2 ' 10−9 M0 (7.45)

Esto significa que la gran mayoría de la masa de la nave (109 ) debe ser
gastada como combustible.
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 103

7.5. Creación y aniquilación de partículas


Una de las aplicaciones más importantes de la equivalencia entre la masa y
la energía, es la posibilidad de generar nuevas partículas en procesos de colisión
inelástica, o también a partir del decaimiento (aniquilación) espontáneo de una
partícula inestable. Como ya se mencionó en la sección (6.7.3) sobre colisiones
inelásticas, la posibilidad de una determinada reacción, por ejemplo la creación
de un antiprotón a partir de la colisión entre dos protones depende, en primer
lugar, de los principios de conservación dinámicos de energía-momento y en
segundo lugar, que la interación que media el proceso permita este tipo de
reacción. La teoría física fundamental que describe estos procesos se llama teoría
cuántica de campos y ella nos permite predecir, no solo que reacciones son
posibles, sino también la probabilidad con que un determinado proceso puede
ocurrir. La probabilidad para que un cierto proceso ocurra significa lo siguiente:
cuando dos partículas colisionan, o una partícula inestable se desintegra, como
resultado de esta reacción pueden surgir diferentes productos, todos permitidos
por las diferentes leyes de conservación y cada uno de ellos con una probabilidad
de ocurrencia, o equivalentemente, con un porcentaje de ocurrencia. Por ejemplo
el barión Λ0 puede decaer en 6 formas diferentes, cada una de ellas con diferente
probabilidad:

Λ0 −→ p + π − (63,9 ± 0,5) % (7.46)

Λ0 −→ n + π 0 (35,8 ± 0,5) % (7.47)


Λ0 −→ n + γ (1,75 ± 0,15) × 10−3 % (7.48)
0 − −4
Λ −→ p + π + γ (8,4 ± 1,4) × 10 % (7.49)
0 − −4
Λ −→ p + e + ν̄e (8,32 ± 0,14) × 10 % (7.50)
0 − −4
Λ −→ p + µ + ν̄µ (1,57 ± 0,35) × 10 % (7.51)
El porcentaje entre paréntesis significa que, de cada 100 eventos de decai-
miento del barión Λ0 , por ejemplo, decáe en un protón y en un pión aproxi-
madamente 64 veces, el cual es el evento más probable, miéntras que el último
proceso, decaimiento en un protón, un muón y un neutrino muónico es el me-
nos probable, con una ocurrencia de un evento por cada 106 , aproximadamente.
La masa del barión Λ0 es de 1115,684M eV y su vida media, esto es el tiempo
propio que la partícula permanece desde su creación hasta que ella decáe, es
de 2, 632 × 10−10 s. A su vez esta partícula, el barión Λ0 , es producido en otra
reacción, como por ejemplo

π + + n −→ K + + Λ0 (7.52)

Si las masas del pión π + , el neutrón n y el mesón K + son

mπ0 = 140M eV /c2


mn0 = 940M eV /c2 (7.53)
mK0 = 494M eV /c2
CAPÍTULO 7. DINÁMICA RELATIVISTA: APLICACIONES 104

respectivamente, calculemos por ejemplo la energía cinética umbral del mesón


π + , para que al chocar con el neutrón en reposo, se cree el barión Λ0 a un
ángulo de 90◦ , medidos con respecto a la dirección de incidencia del pión. De la
conservación del cuadrimomento, tenemos

pπ + pn = pK + pΛ (7.54)

Puesto que no estamos interesados en la información para la partícula K + ,


despejemos su cuadrimomento de la ecuación anterior y tomemos el cuadrado
de la expresión resultante:

m2K0 c2 = m2π0 c2 + m2n0 c2 + m2Λ0 c2 + 2pπ · pn − 2pπ · pΛ − pn · pΛ (7.55)

donde se ha utilizado la notación pπ = (Eπ /c, p~π ), con mπ0 la masa en reposo
del pión y similarmente para las otras partículas.
Puesto que en el sistema de laboratorio

pπ = (Eπ /c, p~π ) (7.56)

pn = (mn0 c, ~0) (7.57)


pΛ = (EΛ /c, p~Λ ) (7.58)
y además p~π · p~Λ = 0 dado que el ángulo de dispersión del barión Λ0 es de 90◦ ,
entonces podemos despejar la energía total Eπ de esta expresión, para obtener

m2K0 c2 − m2π0 c2 − m2n0 c2 − m2Λ0 c2 + 2mn0 EΛ


Eπ = (7.59)
2(mn0 − EΛ /c2 )

por lo tanto, para que Eπ sea mínimo se requiere que la energía del barión Λ0
sea mínima y para esto basta tomar EΛ = mΛ0 c2 , entonces

m2K0 − m2π0 − m2n0 − m2Λ0 + 2mn0 mΛ0 2


Eπ (umbral) = c (7.60)
2(mn0 − mΛ0 )
= 1149M eV

y por lo tanto la energía cinética umbral del pión incidente será de

Kumbral = 1149M eV − 140M eV = 1009M eV ' 1Gev (7.61)


Capítulo 8

Tensores

8.1. Introducción
Uno de los elementos fundamentales de toda teoría física lo constituye el
modelo matemático adecuado para describir las variables físicas y las leyes que
rigen su comportamiento. En el capítulo 3 se definieron los conceptos de cua-
drivector y de invariante relativista, el primero como una cantidad con cuatro
componentes que bajo una transformación de Lorentz, sus componentes se trans-
forman de acuerdo a una ley definida (ecuación (4.29)) y el segundo como una
cantidad invariante bajo una TL, es decir una cantidad que toma el mismo valor
numérico en todos los sistemas de referencia inerciales, el cual llamaremos en
lo sucesivo escalar de Lorentz. Para muchos de los fenómenos físicos conocidos
estos objetos matemáticos, escalares y cuadrivectores, son suficientes para defi-
nir las variables que permiten describir los procesos físicos. Sin embargo, existe
toda una serie de variables dinámicas, tales como por ejemplo el momento de
inercia de un sólido rígido, las cuales requieren para su descripción otros objetos
matemáticos llamados tensores. El objetivo fundamental del presente capítulo
es introducir el concepto de tensor y dar las herramientas fundamentales del
álgebra y del cálculo tensorial.
Existen varios caminos posibles para definir el concepto de tensor, por ejem-
plo, la aproximación algebráica, la cual es una extensión del álgebra lineal y de
los espacios vectoriales. Otro camino más cercano a sus aplicaciones físicas, es a
través de la definición de un tensor por sus propiedades de transformación bajo
un cambio de coordenadas. Este será el camino que seguiremos en este capítulo.
Es importante anotar en este punto, que las variedades diferenciales consti-
tuyen el marco matemático natural para definir de manera rigurosa y general
el concepto de tensor. Pero no abordaremos aquí esta teoría, pues está más allá
del alcance del presente libro y además para los objetivos que perseguimos, for-
mular la electrodinámica clásica en forma relativista explícita, no es necesario
desarrollar este formalismo matemático en toda su extensión. Sin embargo, vale
la pena resaltar que los resultados del análisis tensorial que presentaremos son

105
CAPÍTULO 8. TENSORES 106

válidos en el caso general y sirven como punto de partida para un estudio más
riguroso de geometría diferencial, necesario para abordar el estudio de la Teoría
General de la Relatividad desarrollada por Einstein en 1916.

8.2. Definiciones fundamentales


En esta sección introduciremos los conceptos fundamentales del cálculo ten-
sorial. Los objetos matemáticos fundamentales con los cuales trataremos son
los escalares, los vectores y los tensores, los cuales son en general funciones de
las coordenadas. Estos objetos serán definidos en términos de sus propiedades
de transformación, cuando cambiamos de sistemas de coordenadas. Aun cuando
todas las definiciones que daremos, así como sus propiedades, son generales, nos
restringiremos exclusivamente a transformaciones de Lorentz, pero mantendre-
mos en lo posible una notación general.
Definición 8.1 Sean Σ y Σ0 dos sistemas de referencia inerciales y sean
x = (x0 , x1 , x2 , x3 ) y x0µ = (x00 , x01 , x02 , x03 ) las coordenadas de un evento físico
µ

medidas en Σ y Σ0 respectivamente. Entonces una transformación de Lorentz


de las coordenadas está definida como:

xµ 7−→ x0µ = Λµν xν (8.1)

tal que el producto punto minkowskiano queda invariante bajo esta transforma-
ción de coordenadas.
Definición 8.2 Un escalar de Lorentz es una cantidad (en general una
función de las coordenadas) que es invariante bajo transformaciones de Lorentz.
Ejemplos de escalares de Lorentz son: la masa propia de una partícula, el
intervalo de tiempo propio entre dos eventos, la norma de todo cuadrivector, el
producto interno de cuadrivectores, etc.
Definición 8.3 Un cuadrivector V es una cantidad cuyas componentes,
que denotaremos por V µ , µ = 0, 1, 2, 3, medidas por el observador inercial Σ, se
transforman bajo una transformación de Lorentz de las coordenadas (ecuación
(8.1)), de la misma manera que las coordenadas, es decir:

V 0µ = Λµν V ν (8.2)

donde V 0µ denota las componentes del cuadrivector V medidas en el sistema de


referencia Σ0 . A las cantidades V µ se le llaman las componentes contravariantes
del cuadrivector V. Esta denominación de las componentes contravariantes será
justificada más adelante.
Ejemplos de cuadrivectores contravariantes son: el cuadrivector posición x,
cuyas componentes son las coordenadas de un evento físico, las diferenciales de
coordenadas dxµ , la cuadrivelocidad U µ , la cuadriaceleración Aµ , el cuadrimo-
mento pµ , la cuadrifuerza f µ , etc.
Las componentes de un cuadrivector V µ y V 0µ relacionadas por una trans-
formación de Lorentz, representan el mismo objeto matemático ”medido” en dos
CAPÍTULO 8. TENSORES 107

sistemas de referencia inerciales Σ y Σ0 respectivamente. Asi V es el cuadrivec-


tor y V µ son las componentes de V en el sistema Σ y V 0µ sus componentes en
el sistema Σ0 .
Definición 8.4 Un tensor T de segundo orden dos veces contravariante, es
un conjunto de 16 componentes T µν ; µ, ν = 0, 1, 2, 3 medidas en un sistema de
referencia Σ, tales que bajo una transformación de Lorentz (ecuación (8.1)) sus
componentes se transforman como:

T 0µν = Λµα Λνβ T αβ (8.3)

donde T 0µν denota las componentes del tensor T en el sistema de referencia


Σ0 .
Definición 8.5 La definición anterior se generaliza al caso de un tensor T
contravariante de orden r, como un objeto de 4r componentes, medidas en un
sistema de referencia Σ, cuyas componentes se transforman bajo una transfor-
mación de Lorentz (8.1) en la forma:

T 0µ1 µ2 ...µr = Λµν11 Λµν22 · · · Λµνrr T ν1 ν2 ...νr (8.4)

Así, podemos definir un tensor de orden cero como un escalar y un tensor


contravariante de orden uno como un cuadrivector.
En el siguiente capítulo veremos ejemplos de tensores de segundo orden
con significado físico, tales como el tensor campo electromagnético y el tensor
energía-momento. Por ahora trabajaremos con estas cantidades como objetos
matemáticos abstractos, sin asignarles ningún significado. Es de anotar que en
física no aparecen cantidades que se describan por tensores de orden mayor
al segundo, salvo en el caso de la Teoría General de la Relatividad, en donde
se requiere del tensor de Riemann, el cual es un tensor de cuarto orden y cu-
yo significado está ligado al concepto geométrico de curvatura de la variedad
espacio-tiempo.

8.2.1. Componentes covariantes


Las transformaciones de Lorentz las definimos como el conjunto de transfor-
maciones de coordenadas, tales que dejen invariante el intervalo espacio-tiempo
(ver capítulo 4, ecuaciones (4.25) a la (4.30)), es decir, si xµ y xµ + dxµ , son
las coordenadas de dos eventos físicos medidas por un observador inercial Σ,
entonces la distancia espacio-tiempo entre estos dos eventos, definida como:

ds2 = ηµν dxµ dxν (8.5)

es invariante bajo una transformación de coordenadas, es decir:

ds2 = ηµν dxµ dxν = ηµν dx0µ dx0ν (8.6)


CAPÍTULO 8. TENSORES 108

en donde la matriz de Minkowski η (llamado también tensor métrico de Min-


kowski, por las razones que veremos en seguida) está definido por:

 1; si µ = ν = 0
ηµν := −1; si µ = ν = 1, 2, 3 (8.7)
0; si µ 6= ν

Así, para que bajo una transformación de Lorentz el escalar de Lorentz ds2
permanezca invariante, esto es:

ds2 = ηµν dx0µ dx0ν = ηµν Λµα Λνβ dxα dxβ = ηαβ dxα dxβ (8.8)

se debe cumplir que la matriz de Minkowski satisfaga la relación:

ηαβ = Λµα Λνβ ηµν (8.9)

Como el determinante de la matriz de Minkowski es diferente de cero, i.e.,


det(ηαβ ) = −1, entonces existe la matriz de transformación inversa (ηαβ )−1 ,
cuyas componentes que denotaremos por η αβ , satisfacen la siguiente relación:

ηη −1 = 1 (8.10)

la cual, escrita en términos de componentes toma la forma:

ηαβ η βσ = δασ (8.11)

en donde δασ son los elementos de la matriz identidad.


Los elementos de la matriz inversa de Minkowsky coinciden numéricamente
con ηαβ , como se puede probar directamente. Además, la matriz de Minkowski
y su inversa son matrices simétricas, i.e. ηαβ = ηβα y η αβ = η βα .
Por otra parte, la inversa de una transformación de Lorentz está dada por:

xµ = Λνµ x0ν (8.12)

con
−1
Λνµ = (Λµν ) ⇐⇒ Λνε Λνµ = δµε (8.13)
Los elementos de la transformación inversa de Lorentz se pueden obtener a
partir de la relación:
Λνµ = ηνγ η µδ Λγδ (8.14)
pues
Λνµ Λνδ = ηνγ η µβ Λγβ Λνδ = ηδ η µ = δδµ (8.15)
en donde se ha hecho uso de la ecuación (8.9). Por ejemplo, si consideramos el
caso particular de una transformación de Lorentz entre sistemas de referencia
CAPÍTULO 8. TENSORES 109

inerciales Σ y Σ0 , con ejes espaciales paralelos y v la velocidad de Σ0 en la direc-


ción del eje x positivo, entonces los elementos de la matriz de transformación
de Lorentz están dados por (ver la ecuación (4.40))
 
γ −βγ 0 0
 −βγ γ 0 0 
Λαβ = 
 0
 (8.16)
0 1 0 
0 0 0 1
por lo tanto aplicando la relación (8.14), tenemos
 
γ βγ 0 0
µ µδ γ
 βγ γ 0 0 
Λν = ηνγ η Λ δ =    (8.17)
0 0 1 0 
0 0 0 1
la cual corresponde a la transformación del sistema de referencia Σ0 al Σ, que
equivale como vimos en el capítulo 3, a cambiar la velocidad v por −v.
Definición 8.6 Definamos las “componentes” covariantes de un cuadrivector
V como
Vα := ηαβ V β (8.18)

Esta definición tiene sentido, pues dado que la matriz de Minkowski ηαβ
posee una inversa, la relación entre las componentes contravariantes y covarian-
tes de un cuadrivector es una relación biyectiva (uno a uno y sobre) y por lo
tanto es un isomorfismo, es decir, dadas las componentes contravariantes V µ de
un cuadrivector, sus componentes covariantes Vν están unívocamente definidas
(ecuación (8.18)) y viceversa; es decir, dadas las componentes covariantes Vµ ,
entonces sus correspondientes componentes contravariantes se obtienen de la
transformación inversa, así
V µ = η µν Vν (8.19)
Este resultado nos permite identificar a las componentes covariantes Vν y a
las contravariantes V µ de un cuadrivector, como representaciones de un mismo
objeto abstracto V.
Podemos generalizar esta operación, que se conoce en el marco del análisis
tensorial como subir y bajar índices, al caso de tensores de cualquier rango. Así
por ejemplo, las componentes covariantes de un tensor de segundo orden están
relacionadas con sus componentes contravariantes por la ecuación:
Tµν = ηµα ηνβ T αβ (8.20)
o también, podemos definir las componentes de un tensor de segundo orden una
vez contravariante y una vez covariante, con las siguientes posibilidades:
Tα β = ηβµ T αµ ; Tα β
= ηµα T µβ (8.21)

De esta forma, T αβ , Tµν , T α β , y Tα β son todas diferentes representaciones


de un mismo tensor de segundo rango T. Es importante anotar que el orden de
CAPÍTULO 8. TENSORES 110

los índices en una ecuación tensorial debe ser preservado, dado que en general
T αβ 6= T βα y por esta razón las componentes mixtas T α β y Tα β del tensor T
son diferentes en general.
Para encontrar como se transformanlas componentes covariantes de cual-
quier tensor, bajo una transformación de Lorentz, consideremos primero el caso
particular de un cuadrivector:

V 0µ = Λµν V ν =⇒ Vα0 = ηαµ V 0µ = ηαµ Λµν V ν (8.22)

Ahora, de la relación (8.14) multiplicándola por ηβµ a ambos lados y suman-


do sobre el índice µ, obtenemos

ηβµ Λν µ
= ηβµ ηνγ η µδ Λγδ = ηνγ δβδ Λγδ = ηνγ Λγβ (8.23)

Remplazando esta relación en el último término de la ecuación (8.22), tene-


mos
Vα0 = ηνµ Λα µ V ν = Λα µ Vµ (8.24)

Esta ecuación nos da la ley de transformación de las componentes covariantes


de un cuadrivector.
De lo visto hasta ahora, es fácil generalizar esta ecuación para obtener la ley
general de transformación de las componentes covariantes y contravariantes de
un tensor cualquiera T, r-veces contravariante y s-veces covariante:

Tγ0µ1 γ1 2µ...γ
2 ...µr
s
= Λµν11 Λµν22 · · · Λµνrr Λγδ11 Λγδ22 · · · Λγδrr Tδν11δν22...δ
...νr
s
(8.25)

8.2.2. Algebra tensorial


Denotemos por Πrs el conjunto de todos los tensores Tδν11δν22...δ
...νr
s
de orden n =
r+s, r-veces contravariante y s-veces covariante. Así, en esta notación un escalar
es un elemento de Π00 , un cuadrivector contravariante es un elemento de Π10 y
uno covariante de Π01 , etc.
Definición 8.7 Suma de tensores: Dados dos tensores T, S ∈ Πrs definimos
la suma y la multiplicación por un escalar λ ∈ R, por:

Qνδ11δν22...δ
...νr
s
:= (T + S)νδ11δν22...δ
...νr
s
:= Tδν11δν22...δ
...νr
s
+ Sδν11δν22...δ
...νr
s
(8.26)

Pδν11δν22...δ
...νr
s
:= (λT )δν11δν22...δ
...νr
s
:= λTδν11δν22...δ
...νr
s
(8.27)
Notemos que estas operaciones no son más que la generalización directa
de la suma y el producto por un escalar de vectores cartesianos, en donde el
vector resultante de estas operaciones se obtiene como la suma componente a
componente y por el producto del escalar por cada componente del vector.
Cuando se define una operación con tensores, hay que demostrar que esta
operación está bien definida, es decir, que la operación preserva el carácter
CAPÍTULO 8. TENSORES 111

tensorial. Esto significa que por ejemplo, para las operaciones definidas en las
ecuaciones (8.26) y (8.27), para la suma y multiplicación por un escalar de
tensores de un mismo rango, las componentes resultantes Qδν11...δ
...νr
s
y Pδν11...δ
...νr
s
se
transforman efectivamente como las componentes de un tensor del tipo Πrs , es
decir:
T, S ∈ Πrs =⇒ Q = T + S ∈ Πrs y P =λT ∈ Πrs (8.28)
La demostración general de este resultado es muy sencilla y por esta razón
ilustraré el método para el caso particular de un tensor mixto de segundo rango.
Sean T, S ∈ Π11 con componentes para un observador inercial Σ dadas por T αβ
y S αβ respectivamente y sea

Qαβ = T αβ + S αβ (8.29)

Debemos probar que bajo una transformación de coordenadas, las componentes


Qαβ se transforman como un tensor del tipo Π11 . Así, para un sistema de referen-
cia Σ0 tenemos, aplicando la ley de transformación (8.25) para las componentes
de los tensores T 0α 0α
β y S β,

Q0αβ = T 0α 0α
β +Sβ
µ µ
= Λαν Λβ T νµ + Λαν Λβ S νµ
µ
= Λαν Λβ (T νµ + S νµ )
µ
= Λαν Λβ Qαβ (8.30)

lo cual implica que las cantidades Qαβ se transforman como las componentes
de un tensor del tipo Π11 , como se quería probar. Un procedimiento similar se
puede hacer para el producto de un escalar por un tensor.
Este resultado muestra que el conjunto de todos los tensores del tipo Πrs ,
forman un espacio vectorial.
Definición 8.8 Producto tensorial: Dados dos tensores T ∈ Πrs y S ∈ Πpq ,
definimos el producto tensorial como:
ν ν ...ν ν ...ν ν1 ν2 ...νr ν ν ...ν
Wδ11δ22...δsrδs+1
r+1 r+p r+1 r+2 r+p
...δs+q := Tδ1 δ2 ...δs Sδs+1 δs+2 ...δs+q (8.31)
r+p
el cual es un tensor de Πs+q , es decir W ∈ Πr+p
s+q .
Esta operación no tiene su correspondiente en el cálculo vectorial ordinario
y representa lo que en álgebra matricial se llama un producto directo. Como en
el caso anterior, hay que probar que esta operación está bien definida y para
este fin consideremos el caso particular del producto de dos cuadrivectores, uno
covariante y el otro contravariante. Sea T ∈ Π10 y llamemos sus componentes
T µ , y S ∈ Π01 con componentes Sµ . Entonces, de la definición 8.8 el producto
está dado por
W µν = T µ Sν (8.32)
y debemos probar que las componentes del producto Wνµ se transforman como:

W 0µν = Λµα Λνβ W αβ (8.33)


CAPÍTULO 8. TENSORES 112

de acuerdo con la ecuación (8.25). Sean T 0µ y Sν0 las componentes de los cuadri-
vectores T y S medidas en el sistema de referencia Σ0 , entonces en este sistema
de referencia las componentes del producto están dadas por:

W 0µ ν = T 0µ Sν0 (8.34)

Puesto que T y S son cuadrivectores, sus componentes se transforman de


acuerdo con la relación:

T 0µ = Λµα T α ; Sν0 = Λνβ Sβ (8.35)

Remplazando estas expresiones en la ecuación (8.34), tenemos

W 0µ ν = T 0µ Sν0 = Λµα T α Λνβ Sβ = Λµα Λνβ T α Sβ = Λµα Λνβ W αβ (8.36)

como se quería demostrar.


La siguiente operación que vamos a definir es fundamental en el cálculo
tensorial, pues nos permite obtener a partir de un tensor dado de rango n, un
tensor de rango n−2. Así, si partimos de un tensor de rango par, por aplicaciones
sucesivas de esta operación, podemos obtener un tensor de rango cero, es decir
un escalar de Lorentz o en términos más físicos, un invariante relativista.
Definición 8.9 Contracción de Indices: Dado un tensor T ∈ Πr1s definimos
la contracción del índice contravariante αi (1 ≤ i ≤ r) con el índice covariante
βj (1 ≤ j ≤ s) por:
(α )
C(βji) (Tβα11βα22...β
...αi ...αr
j ...βs
) := Tβα11βα22...σ...β
...σ...αr
s
∈ Πr−1
s−1 (8.37)

Es decir, dado un tensor mixto de orden n = r +s, r −veces contravariante y


s − veces covariante, al sumar sobre dos índices repetidos, uno contravariante y
otro covariante, obtenemos un tensor de orden n−2, r −1−veces contravariante
y s − 1 − veces covariante. Para demostrar que esta operación está bien definida
consideremos, sin pérdida de generalidad, un tensor de de rango 4, 2 − veces
αβ
contravariante y 2 − veces covariante Tγδ ∈ Π22 y contraigamos por ejemplo, el
primer índice contravariante con el segundo covariante:
(α)αβ σβ β
C(δ) (Tγδ ) = Tγσ := Tγ ∈ Π11 (8.38)

Entonces, veamos que las componentes que resultan Tγ β , después de realizada


la operación de contracción, se transforman como las componentes de un tensor
mixto de rango 2. Si denotamos como es costumbre, por cantidades primadas
las componentes de los tensores en el sistema de referencia Σ0 y aplicamos las
correspondientes leyes de transformación de tensores, tenemos entonces
0λβ σβ
Tγ0 β = Tγλ = Λλσ Λβη Λγµ Λλϑ Tµϑ
σβ
= δσϑ Λβη Λγµ Tµϑ = Λβη Λγµ Tµσ
ση

= Λβη Λγµ Tµη (8.39)


CAPÍTULO 8. TENSORES 113

lo cual demuestra que la operación de contracción de índices está bien definida.


En la segunda igualdad hemos utilizado la ley de transformación para el tensor
0λβ
Tγλ , la cual se aplica independientemente del hecho que el tensor tenga dos
índices repetidos sobre los cuales se suma. Para obtener la tercera igualdad se ha
utilizadoel hecho que los elementos de la transformación Λλσ y Λλϑ , corresponden
a la transformación de Lorentz de Σ a Σ0 y a su inversa respectivamente y por lo
tanto satisfacen la relación (8.15). Finalmente, al sumar sobre el índice repetido
ϑ, por la definición de la delta de Kronecker δσϑ , todos los términos son cero,
salvo aquel para el cual ϑ = σ, obteniendose de esta forma la cuarta igualdad.
Antes de continuar con otras operaciones entre tensores, mostremos que
las componentes de la matriz de Minkowski ηαβ , su inversa η αβ y la delta de
Kronecker δαβ son tensores de segundo rango, lo que justifica el nombre de tensor
métrico de Minkowski y además estas cantidades ηαβ , η αβ y δαβ corresponden
a diferentes representaciones del mismo objeto matemático, el tensor métrico
η, con la particularidad que las componentes de este tensor métrico toman los
mismos valores numéricos en todos los sistemas de referencia inerciales.
El papel especial de este objeto matemático lo podemos ver, si retornamos a
la definición del intervalo espacio-tiempo entre los puntos de la variedad espacio-
tiempo
xµ y xµ + dxµ (8.40)
dado por
ds2 = ηµν dxµ dxν (8.41)
El escalar ds es obtenido a partir del producto de tres tensores (ηµν , dxµ y
2

dxν ) seguida de una doble contracción sobre índices, y por lo visto hasta ahora,
estas operaciones están bien definidas. También, podemos probar directamente
el carácter tensorial de η, pues dado que ds2 es un invariante, entonces
0
ds2 = ηµν dx0µ dx0ν
= Λµα Λνβ Λµγ Λνϑ ηαβ dxγ dxϑ
= δγα δϑβ ηαβ dxγ dxϑ
= ηαβ dxα dxβ (8.42)
0
en donde hemos denotado por ηµν a las componentes del tensor métrico medidas
0
en el sistema de referencia Σ , las cuales están relacionadas con sus componentes
en el sistema Σ por:
0
ηµν = Λµα Λνβ ηαβ (8.43)
Un cálculo directo, aplicando las propiedades de las transformaciones de
Lorentz, muestra que las componentes del tensor η en el sistema Σ0 coinciden
con sus componentes en Σ. Un procedimiento similar se puede seguir para probar
que η αβ y δβα también se transforman como tensores de segundo rango (dos veces
contravariante y mixto respectivamente) y que sus componentes son las mismas
en todos los sistema de referencia inerciales.
Un caso particular que surge de la combinación de las operaciones, producto
tensorial y contracción de índices, es la generalización de la Definición 8.6,
CAPÍTULO 8. TENSORES 114

llamada subir y bajar índices, pues el producto tensorial del tensor métrico η de
segundo orden (sea de sus componentes contravariantes η µν , covariantes ηµν o
mixtas δνµ ) con un tensor cualquiera T de orden n, seguida de una contracción
de índices, produce de nuevo un tensor de orden n; por ejemplo, consideremos
un tensor T de cuarto orden del tipo Π22 . Al multiplicar este tensor T por el
tensor métrico η αβ ∈ Π20 , produce un tensor del tipo Π42 , que al contraer dos
índices conduce a otro tensor del tipo Π31 . Resumiendo tenemos:

η µν Tγν
σβ
= Tγσβµ (8.44)

Otro caso particular de la combinación de estas dos operaciones tensoriales,


producto tensorial seguida de una contracción, es el producto punto de dos
cuadrivectores, pues

V · V = ηµν V µ V ν = η µν Vµ Vµ = δνµ V ν Vµ = V µ Vµ (8.45)

Por ejemplo, consideremos el cuadrivector momento p de una partícula de


masa en reposo m0 , cuyas componentes contravariantes en algún sistema de
referencia inercial Σ, están dadas por

pµ = (p0 , p1 , p2 , p3 ) ≡ (E/c, px , py , pz ) (8.46)

entonces podemos calcular sus correspondientes componentes covariantes en este


sistema como

pα = ηαβ pβ = (p0 , p1 , p2 , p3 ) = (E/c, −px , −py , −pz ) (8.47)

Aplicando ahora cualquiera de las expresiones dadas en la ecuación (8.45),


obtenemos que su norma al cuadrado está dada por

p2 = p · p = E 2 /c2 − p2x − p2y − p2z = m20 c2 (8.48)

8.2.3. Propiedades de simetría de tensores


En esta sección definiremos los conceptos de tensores simétricos y antisimé-
tricos e introduciremos la operación tensorial de simetrización (y antisimetriza-
ción) de las componentes de un tensor, la cual es de utilidad para generalizar
algunas operaciones del cálculo vectorial usual, como veremos en la última sec-
ción del presente capítulo.
Definición 8.10 Un tensor T de segundo rango del tipo Π20 , con componen-
tes T αβ en un sistema de referencia Σ, se llama simétrico si

T αβ = T βα (8.49)

y antisimétrico si
T αβ = −T βα (8.50)
Esta definición es válida también, para las componentes covariantes de un tensor
de segundo rango y puede ser generalizada a cualquier par de índices de un tensor
CAPÍTULO 8. TENSORES 115

de rango n ≥ 2. Por ejemplo, para un tensor R de cuarto rango del tipo Π04 ,
simétrico en su primera y tercera componente y antisimétrico en la segunda y
cuarta componente, se tiene que

Rαβγδ = Rγβαδ ; Rαβγδ = −Rαδγβ (8.51)

Es fácil probar, a partir de las propiedades de transformación de las compo-


nentes, que el carácter simétrico o antisimétrico de un tensor es independiente
del sistema de referencia, pues si T αβ = T βα en un sistema de referencia Σ,
entonces de las propiedades de transformación (ecuación (8.3)) tenemos

T 0µυ = Λµα Λνβ T αβ = Λµα Λνβ T βα = Λνβ Λµα T βα = T 0νµ (8.52)

como se quería probar.


Dado un tensor de segundo rango con componentes T αβ en un sistema de
referencia, siempre se puede escribir este tensor como la suma de un tensor
simétrico más uno antisimétrico, es decir

T αβ = S αβ + Aαβ (8.53)

con S αβ = S βα y Aαβ = −Aβα . Para demostrar esta afirmación basta con tomar
1 αβ
S αβ := (T + T βα ) (8.54)
2
y
1 αβ
Aαβ := (T − T βα ) (8.55)
2
en donde al tensor S αβ se le llama la parte simétrica del tensor T αβ y al tensor
Aαβ su parte antisimétrica. Claramente estas mismas relaciones son válidas para
índices covariantes. De estas ecuaciones ( (8.54) y (8.55)) se deduce además, que
un tensor es simétrico si su parte antisimétrica es cero y es antisimétrico si su
parte simétrica es cero:
1 αβ
T αβ = T βα ⇐⇒ Aαβ = (T − T βα ) = 0 (8.56)
2
1 αβ
T αβ = −T βα ⇐⇒ S αβ = (T + T βα ) = 0 (8.57)
2
Un ejemplo de un tensor simétrico es el tensor métrico de Minkowski, pues
por su definición ηαβ = ηβα .
Las ecuaciones (8.54) y (8.55) nos conducen a la siguiente definición de dos
nuevas operaciones tensoriales:
Definición 8.11 Dado un tensor T de segundo rango del tipo Π20 , con
componentes T αβ en un sistema de referencia Σ, definamos un nuevo tensor que
lo denotaremos como T (αβ) , por la operación
1 αβ
T (αβ) := (T + T βα ) (8.58)
2
CAPÍTULO 8. TENSORES 116

el cual por definición es simétrico, es decir T (αβ) = T (βα) . A esta operación se le


conoce en la literatura como simetrización de un tensor. Claramente, si el tensor
T αβ es simétrico, entonces el tensor simetrizado coincide con el tensor original,
esto es T (αβ) = T αβ y si el tensor T αβ es antisimétrico, el tensor simetrizado
es cero: T (αβ) = 0.
Similarmente, definimos la operación de antisimetrización de un tensor dado
T αβ , que lo denotaremos como T [αβ] , por:
1 αβ
T [αβ] := (T − T βα ) (8.59)
2
De la misma manera se tiene que si un tensor T αβ es simétrico, entonces el
tensor antisimetrizado es cero y si T αβ es antisimétrico, entonces T [αβ] = T αβ .
Claramente estas operaciones son válidas también para tensores del tipo Π02 .
Tanto las definiciones de simetría y antisimetría dadas (Definición 8.10),
así como las operaciones de simetrización y antisimetrización (Definición 8.11),
se pueden generalizar a tensores de orden mayor. Antes de considerar este pro-
blema, se introducirán algunos elementos básicos de la teoría de permutaciones.
Consideremos el conjunto {1, 2, ..., r} de los r primeros números naturales y
denotemos por (n1 , n2 , ..., nr ) un arreglo ordenado de ellos, sin que ninguno se
repita. Existen entonces r! = 1 · 2 · 3 · ... · r formas diferentes de ordenar en este
arreglo los r pimeros números naturales. Por ejemplo, si tomamos el conjunto
{1, 2, 3}, podemos construir 3! = 6 arreglos diferentes:

(1, 2, 3); (1, 3, 2); (2, 1, 3); (2, 3, 1); (3, 1, 2); (3, 2, 1) (8.60)

Dado un arreglo (n1 , n2 , ..., nr ), definimos una permutación Pσ sobre este


arreglo, como el arreglo obtenido al permutar los elementos del arreglo original.
Denotaremos simbólicamente esta operación de permutación por

Pσ (n1 , n2 , ..., nr ) = (nσ(1) , nσ(2) , ..., nσ(r) ) (8.61)

en donde σ es una función (uno a uno y sobre)

σ : {1, 2, ..., r} −→ {1, 2, ..., r}


(8.62)
ni 7−→ σ(ni ) = nj

Por ejemplo, el arreglo (3, 2, 1) se puede obtener a partir del primer arreglo
(1, 2, 3) permutando los números 1 y 3:

Pσ (1, 2, 3) ≡ Pσ (n1 , n2 , n3 ) = (nσ(1) , nσ(2) , nσ(3) ) = (3, 2, 1) (8.63)

Definamos ahora una transposición como una permutación

Pni ↔ni+1 (8.64)

obtenida, al permutar dos números consecutivos ni y ni+1 del arreglo original:

Pni ↔ni+1 (n1 , n2 , ..., ni , ni+1 , ..., nr ) = (n1 , n2 , ..., ni+1 , ni , ..., nr ) (8.65)
CAPÍTULO 8. TENSORES 117

Claramente, cualquier arreglo de los números {1, 2, ..., r} se puede obtener por
una permutación Pσ sobre un arreglo dado, incluyendo como caso particular,
la permutación identidad que no cambia el areglo original. Además, cualquier
permutación dada se puede obtener aplicando sucesivamente transposiciones. Es
decir, toda permutación se puede descomponer, o factorizar, como el producto
de transposiciones:

Pσ = Pni ↔ni+1 Pnj ↔nj+1 · · · Pnk ↔nk+1 (8.66)

En el ejemplo ilustrado en la ecuación (8.60), se puede obtener el segundo


arreglo (1, 3, 2) a partir del primer arreglo (1, 2, 3), aplicando la transposición
P2↔3 , esto es:
P2↔3 (1, 2, 3) = (1, 3, 2) (8.67)
pero también es posible obtener este mismo arreglo en otra forma, por aplicación
sucesiva de las transposiciones siguientes:

P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 (1, 2, 3) = P3↔1 P2↔1 P2↔3 P1↔3 (2, 1, 3)(8.68)
= P3↔1 P2↔1 P2↔3 (2, 3, 1)
= P3↔1 P2↔1 (3, 2, 1)
= P3↔1 (3, 2, 1)
= (1, 3, 2) (8.69)

Este ejemplo muestra que no hay una única forma de obtener una permuta-
ción dada por transposiciones sucesivas. Sin embargo, el número definido por:

Nσ +1 si Nσ es par
(−1) = (8.70)
−1 si Nσ es impar

sí es independiente de las transposiciones realizadas para obtener la permuta-


ción dada. Este número es llamado el signo de la permutación, siendo Nσ igual
al número de las transposiciones realizadas. Esto significa que si una permuta-
ción dada se factoriza en un número par (impar) de transposiciones, entonces,
cualquier otra factorización de la misma permutación, contendrá también un
número par (impar) de transposiciones. Una permutación se llama par(impar)
si el signo es +1(−1).
Así en el ejemplo anterior, la permutación Pσ (1, 2, 3) = (1, 3, 2) se puede
escribir en términos de transposiciones, como Pσ = P2↔3 , en cuyo caso Nσ = 1
y el signo de la permutación es (−1)Nσ = −1, o también se puede factorizar en
la forma Pσ = P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 , con Nσ = 5 y por lo tanto el mismo
5
signo de la permutación (−1) = −1.
Con estos elementos básicos de la teoría de permutaciones, podemos extender
las operaciones anteriores de simetrización y antisimetrización a tensores de
orden superior.
Definición 8.12 Dado un tensor T de rango r del tipo Πr0 , con componentes
T α1 ···αr en un sistema de referencia Σ, definamos dos nuevos tensores, uno com-
pletamente simétrico en todos sus índices que denotaremos como T (α1 ···αr ) y el
CAPÍTULO 8. TENSORES 118

otro completamente antisimétrico en todos sus índices que denotaremos como


T [α1 ···αr ] , por las operaciones
1 X Pσ (α1 ···αr )
T (α1 ···αr ) := T (8.71)
r!

1 X
T [α1 ···αr ] := (−1)Nσ T Pσ (α1 ···αr ) (8.72)
r!

en donde la suma se realiza sobre todas las permutaciones de los índices (α1 , · ·
·, αr ). La misma definición vale para índices covariantes.
Por ejemplo, consideremos un tensor Tαβγ del tipo Π03 y construyamos los
tensores T(αβγ) y T[αβγ] por las operaciones definidas en las ecuaciones (8.66) y
(8.72):
1
T(αβγ) := (Tαβγ + Tαγβ + Tβαγ + Tβγα + Tγαβ + Tγβα ) (8.73)
3!
1
T[αβγ] := (Tαβγ − Tαγβ + Tβγα − Tβαγ + Tγαβ − Tγβα ) (8.74)
3!
Es fácil comprobar directamente que el nuevo tensor T(αβγ) es completamen-
te simétrico bajo cualquier permutación de sus índices; por ejemplo T(031) =
T(013) = etc, mientras que el tensor T[αβγ] es completamente antisimétrico bajo
permutación de sus índices, pues por ejemplo T[031] = −T[013] , pero T[031] =
T[310] dado que en el primer caso los índices [013] corresponden a una permu-
tación par de los índices originales [031], mientras que en el segundo caso el
arreglo de índices [310] es una permutación par del arreglo original [031]. No-
temos que las definiciones dadas para tensores de segundo rango son un caso
particular de la Definición 8.12. Un ejemplo de esta operación de antisimetri-
zación de tensores, lo constituye la generalización del producto cruz usual del
cálculo vectorial tridimensional.
Sean Aα y B β las componentes de dos cuadrivectores en un sistema de refe-
rencia Σ. Definamos un nuevo vector como el producto tensorial antisimetrizado
de estos dos cuadrivectores:
1
C αβ := A[α B β] = {Aα B β − Aβ B α } (8.75)
2
Un tensor de segundo rango C αβ en n dimensiones tiene n2 componentes
independientes. En el caso particular de las 4 dimensiones del espacio-tiempo
n2 = 16 componentes independientes. Si el tensor es simétrico entonces C αβ =
C βα y su número de componentes independientes se reduce a:
n2 − n n(n + 1)
+n= (8.76)
2 2
Ahora, si el tensor es antisimétrico C αβ = −C βα su número de componentes
independientes está dado por:
n2 − n n(n − 1)
= (8.77)
2 2
CAPÍTULO 8. TENSORES 119

pues en este caso las componentes con índices repetidos son cero. En el caso
de vectores tridimensionales cartesianos n = 3, y por lo tanto el número de
componentes independientes de un tensor antisimétrico de segundo rango es
tres. Así, podemos identificar a las tres componentes independientes que surgen
de la operación definida en la ecuación (8.75), a su vez con las componentes de
un nuevo vector, el cual se conoce como el producto cruz del cálculo vectorial
usual. Notemos que esta identificación no es posible para otras dimensiones del
espacio, pues por ejemplo, en cuatro dimensiones el número de componentes
independientes de un tensor antisimétrico de segundo rango es de seis y por lo
tanto estas componentes no pueden ser identificadas con las componentes de
ningún cuadrivector.
Para finalizar esta sección consideraremos un ejemplo especial de un tensor
de cuarto rango completamente antisimétrico, el cual jugará un papel impor-
tante en el capítulo octavo sobre las ecuaciones de Maxwell. Definamos el tensor
εαβγδ , llamado tensor de Levi-Civita, por la ecuación:

 +1 si αβγδ es permutación par de 0123
εαβγδ := −1 si αβγδ es permutación impar de 0123 (8.78)
0 en los demás casos

Este tensor, al igual que el tensor métrico de Minkowski, tiene la parti-


cularidad que en todos los sistemas de referencia inerciales sus componentes
tienen el mismo valor numérico. Para probar que εαβγδ es un tensor con esta
característica, se debe mostrar que sus componentes se transforman, bajo una
transformación de Lorentz, en la forma
ε0αβγδ = Λαµ Λβν Λγσ Λδ ρ εµνσρ ≡ εαβγδ (8.79)
Para esto, es suficiente notar lo siguiente: si en la ecuación anterior reem-
plazamos los índices α, β, γ y δ por 0, 1, 2 y 3 respectivamente, entonces la
ecuación (8.79) toma la forma
1 = ε0123 = Λ0 µ Λ1ν Λ2σ Λ3ρ εµνσρ = det |Λ| (8.80)
De lo visto en el capítulo 3 sobre las propiedades de las transformaciones de
Lorentz, es fácil deducir que toda transformación de Lorentz propia, es decir que
no involucra inversión de los ejes espaciales o inversión de la coordenada tempo-
ral, tiene determinante igual a 1. Así, la ecuación (8.80) es una identidad y por
lo tanto las componentes εαβγδ del tensor de Levi-Civita deben transformarse
de acuerdo con la ecuación (8.79), como se quería mostrar.

8.3. Transformación general de coordenadas


Antes de continuar con la generalización de los operadores vectoriales usua-
les del cálculo diferencial (gradiente, divergencia y rotacional), veamos el caso
general de transformaciones de coordenadas que contienen, lógicamente, el ca-
so particular de las transformaciones de Lorentz que hemos considerado hasta
ahora.
CAPÍTULO 8. TENSORES 120

Sean Σ y Σ0 dos sistemas de referencia y llamemos xµ y x0ν las coordena-


das de un punto medidas en los sistemas de referencia Σ y Σ0 respectivamente.
Supongamos, sin pérdida de generalidad, que nuestro espacio es de cuatro di-
mensiones. Entonces, un cambio general de coordenadas entre los sistemas Σ
y Σ0 se puede expresar como un conjunto de cuatro ecuaciones, en donde las
nuevas coordenas primadas son funciones continuas, con inversa continua, de las
coordenadas no primadas. Así la transformación de coordenadas y su inversa,
se pueden escribir como:
x0µ = x0µ (xα ) (8.81)
xβ = xβ (x0ν ) (8.82)

Notemos que si exigimos que las transformaciones de coordenas sean lineales,


entonces estas ecuaciones se reducen a la forma:
x0µ = Λµ α xα (8.83)
xβ = Λν β x0ν (8.84)
con los coeficientes de la transformaciones Λµα
(y los de la transformación inversa
Λνβ ) constantes, independientes de las coordenadas. Las componentes del vector
desplazamiento infinitesimal dx en el sistema de coordenadas Σ están dadas
por dxµ = (dx0 , dx1 , dx2 , dx3 ), mientras que las correspondientes componentes
medidas en Σ0 son dx0ν = (dx00 , dx01 , dx02 , dx03 ). Para encontrar la relación entre
las componentes del vector dx en los dos sistemas, basta con tomar la diferencial
total de cada una de las funciones en las ecuaciones (8.81) y (8.82), así:
∂x0µ ν
dx0µ = dx (8.85)
∂xν
∂xµ 0ν
dxµ = dx (8.86)
∂x0ν
Estas ecuaciones definen la ley de transformación (y su inversa) para las
componentes de cualquier vector en los dos sistemas de referencia:
∂x0µ ν
V 0µ = V (8.87)
∂xν
∂xµ 0ν
Vµ = V (8.88)
∂x0ν
En el caso particular de transformaciones lineales (ecuaciones (8.83) y (8.84)),
la ley de transformación para las componentes de un vector toma la forma:
V 0µ = Λµ ν V ν (8.89)
V µ = Λνµ V 0ν (8.90)
la cual se obtiene del caso general si hacemos la siguiente identificación:
∂x0µ
Λµ ν = (8.91)
∂xν
CAPÍTULO 8. TENSORES 121

∂xµ
Λνµ = (8.92)
∂x0ν
Finalmente, puesto que las transformaciones de coordenadas deben ser in-
vertibles se debe cumplir que
∂x0µ ∂xα
= δνµ (8.93)
∂xα ∂x0ν
Esta relación se obtiene directamente, si aplicamos la regla de la cadena para
las derivadas a la transformación idéntica x0µ (xα (x0ν )) ≡ x0µ , la cual para el
caso particular de transformaciones lineales, toma la forma Λµ α Λνα = δνµ . Así,
teniendo en cuenta las ecuaciones (8.91) y (8.92), toda el álgebra y los conceptos
del cálculo tensorial desarrollados en este capítulo, para el caso particular de
transformaciones de Lorentz, son válidos para el caso más general de transfor-
maciones arbitrarias de coordenadas. Las restricciones que impongamos sobre el
conjunto de transformaciones de coordenadas entre sistemas, nos determinan las
propiedades matemáticas (o físicas, según sea el caso) del espacio sobre el cual
estamos trabajando. Por ejemplo, si consideramos que los sistemas de referencia
físicamente significativos son los inerciales y que el principio de la constancia
de la velocidad de la luz en el vacío se cumple, entonces solamente las ecua-
ciones de transformación de coordenadas admisibles son aquellas que dejan el
intervalo espacio-tiempo invariante, obteniendo entonces el caso particular de
transformaciones de Lorentz que hemos estado considerando en este capítulo.
Otra posibilidad sería por ejemplo, aceptar el principio de la constancia de la
velocidad de la luz, pero postular que las leyes de la física son válidas en todos
los sistemas de referencia, séan inerciales o no. Para este caso más general ya
no estamos restringidos a transformaciones de coordenadas lineales, como en
el caso anterior que corresponde a la relatividad especial, aún cuando se sigue
exigiendo que el intervalo espacio-tiempo permanezca invariante, esto es
0
ds2 = gµν dxµ dxν = gαβ dx0α dx0β (8.94)

En este caso, bajo una transformación admisible de coordenadas, las com-


ponentes del tensor métrico (denotado ahora por g) son en general funciones de
las coordenadas y por tanto, a diferencia del tensor métrico de Minkowski, sus
componentes varían de un sistema de coordenadas (o de referencia) a otro. Este
último ejemplo adquiere todo su significado en la teoría general de la relatividad,
cuyo estudio está más allá del alcance del presente libro.

8.4. Operadores vectoriales


En el cálculo vectorial usual sobre R3 se define el operador gradiente como:

~ =( ∂ , ∂ , ∂ )
∇ (8.95)
∂x ∂y ∂z
el cual al actuar sobre una función escalar produce un vector en la dirección del
máximo cambio de la función. Por función escalar real se entiende, una función
CAPÍTULO 8. TENSORES 122

de valor real y variable vectorial, es decir una función de la forma

f : R3 7−→ R (8.96)

tal que, a un vector x = (x, y, z) de R3 le asocia un número real f (x, y, z). Así,
al actuar el operador gradiente ∇ ~ sobre la función f (x, y, z) da como resultado
un vector sobre cada punto de R3 , con sus componentes dadas por

~ = ( ∂f , ∂f , ∂f )
∇f (8.97)
∂x ∂y ∂z

Si consideramos ahora una función vectorial F~ (x, y, z), es decir una función
de valor vectorial y variable vectorial:

F~ : R3 7−→ R3 (8.98)

con componentes (Fx , Fy , Fz ), entonces podemos hacer actuar el operador gra-


diente sobre F~ en la forma

~ · F~ = ∂Fx + ∂Fy + ∂Fz


∇ (8.99)
∂x ∂y ∂z

para obtener una función real llamada la divergencia de F~ . También es posible


obtener un vector a partir del operador gradiente, actuando éste sobre una
función vectorial en la forma:

~ × F~ = ( ∂Fz − ∂Fy , ∂Fx − ∂Fz , ∂Fy − ∂Fx )


∇ (8.100)
∂y ∂z ∂z ∂x ∂x ∂y
conocida como el rotacional de una función vectorial. Notemos que las tres
~ el gradiente, la divergencia y el
operaciones definidas a partir del operador ∇,
rotacional, se pueden considerar como una extensión de las operaciones usua-
les del álgebra vectorial: el producto de un vector por un escalar, el producto
interno entre vectores y el producto cruz, respectivamente. Por esta razón es
usual considerar para todos los efectos al operador ∇~ como un vector, con el
cual podemos construir todo tipo de operaciones permitidas dentro del cálculo
vectorial usual, solamente teniendo presente el orden en el cual entra ∇~ en la
~
expresiones, pues el vector ∇ actua sobre funciones. Así por ejemplo, podemos
construir expresiones tales como
2 2 2
∇2 = ∇ ~ = ∂ + ∂ + ∂
~ ·∇ (8.101)
∂x2 ∂y 2 ∂z 2
conocida como el operador Laplaciano.
Definamos entonces el cuadrivector gradiente ∇ como un operador diferen-
cial, tal que al actuar sobre una función escalar de las coordenadas Φ(xµ ), pro-
duce el cuadrivector ∇Φ, cuyas componentes en un sistema de referencia Σ están
dadas por:
µ ∂Φ ∂Φ ∂Φ ∂Φ
(∇Φ) = ( 0 , 1 , 2 , 3 ) (8.102)
∂x ∂x ∂x ∂x
CAPÍTULO 8. TENSORES 123

A las componentes de ∇Φ las denotaremos también como ∂Φ/∂xµ , o ∂µ Φ. Vea-


mos entonces, que las componentes de ∇Φ se transforman como las componentes
covariantes de un cuadrivector bajo una transformación de coordenadas. Sean
xµ y x0ν las coordenadas de un evento, medidas en los sistemas de referencia Σ
y Σ0 respectivamente y relacionadas por una transformación de Lorentz, enton-
ces las componentes covariantes de un cuadrivector V, en los dos sistemas de
referencia, están relacionadas por:
∂xν
Vµ0 = Λµν Vν ≡ Vν (8.103)
∂x0µ
de acuerdo con las ecuaciones (8.91) y (8.92) de la sección anterior. Bajo una
transformación de coordenadas por definición, una función escalar permanece
invariante, es decir Φ(xµ ) = Φ(x0ν ). Teniendo en cuenta que bajo la transforma-
ción de coordenadas se tiene x0µ = x0µ (xν ) y aplicando la regla de la cadena a
la función Φ(x0µ (xν )), obtenemos para las componentes del operador gradiente,
medidas en los dos sistemas de referencia, la relación
∂Φ ∂xα ∂Φ
∇0 Φ(x0µ ) ≡ = (8.104)
∂x0µ ∂x0µ ∂xα
Puesto que esta relación es general e independiente de la función escalar
Φ, podemos concluir que las componentes del operador gradiente se transfor-
man, bajo un cambio de coordenadas, como las componentes covariantes de un
cuadrivector, es decir
∂µ0 = Λµν ∂v (8.105)
A partir de esta definición, podemos construir los operadores de uso más fre-
cuente en física, siguiendo los mismos procedimientos que en el caso del cálculo
vectorial tridimensional estandar. Consideremos un campo vectorial Ψµ (xα ), es-
to es, una función vectorial de las coordenadas y calculemos el producto interno
minkowskiano entre este campo vectorial y el vector gradiente:

∇ · Ψ = ∂ν Ψν (8.106)

que corresponde a la generalización del operador divergencia tridimensional. Un


ejemplo de esta operación de uso muy frecuente en física, es la llamada ecuación
de continuidad:
∂ Ψ0 ~
∂ν Ψν = 0 ⇐⇒ + ∇Ψ = 0 (8.107)
∂x0
~ significa el operador gradiente tridimensional. Claramen-
en donde el simbolo ∇
te esta ecuación, por provenir de un producto interno entre cuadrivectores, es
invariante bajo transformaciones de coordenadas, es decir

∂ν Ψν = 0 = ∂ν0 Ψ0ν (8.108)

lo que significa que la ecuación de continuidad escrita de esta manera, auto-


máticamente satisface el principio de relatividad. Ahora, si definimos un nuevo
CAPÍTULO 8. TENSORES 124

operador (conocido en la literatura como el D’Alembertiano ) como el produc-


to interno del operador gradiente consigo mismo, obtenemos un operador que
es un invariante (un escalar) bajo transformaciones de coordenadas, así

∂2 ~2
 = η µν ∂µ ∂ν = ∂ µ ∂µ = −∇ (8.109)
∂x02
la cual nos permite escribir directamente la ecuación de ondas como:

Ψ = 0 (8.110)

Es conocido del álgebra vectorial, que el producto cruz entre vectores es una
operación que solo tiene sentido para vectores cartesianos en tres dimensiones y
por lo tanto en la forma usual como ella se define, no es posible generalizarla a
vectores definidos en otras dimensiones espaciales. Realmente el producto cruz
usual es un caso particular de tensores de segundo rango, como fue discutido al
final de la sección 5.2.3.
La operación de antisimetrizar un tensor de segundo rango (ver ecuación
(8.59)) nos permite generalizar el producto cruz del cálculo vectorial usual en
tres dimensiones, al caso de varias dimensiones, obteniéndose no un vector axial
como en el caso tridimensional, sino un tensor de segundo rango antisimétrico.
Así por ejemplo, el “rotacional” de una función vectorial Ψα está dado por:

∂[α Ψβ] = ∂α Ψβ − ∂β Ψα (8.111)

Si aplicamos esta definición al caso particular de un vector tridimensio-


nal usual, con componentes A = (Ax , Ay , Az ) ≡ (A1 , A2 , A3 ) ≡ Ai y ∇ =
(∂/∂x, ∂/∂y, ∂/∂z) ≡ ∂j , entonces las siguientes tres componentes independien-
tes del tensor ∂[i Aj]

∂Ax ∂Ay
∂[1 A2] = −
∂y ∂x
∂Az ∂Ax
∂[3 A1] = − (8.112)
∂x ∂z
∂Ay ∂Az
∂[2 A3] = −
∂z ∂y
corresponden a las componentes x, y y z del rotacional ∇ × A respectivamente,
en el cálculo vectorial ususal.
Capítulo 9

Electrodinámica

9.1. Introducción
En el segundo capítulo sobre los fundamentos de la teoría especial de la re-
latividad, vimos como las ecuaciones de Maxwell no permanecían invariantes
bajo transformaciones de Galileo, indicando que si se aceptan las leyes de la
electrodinámica, entonces ellas son válidas únicamente en un sistema de refe-
rencia privilegiado y por lo tanto, a través de experimentos electromagnéticos
se podría determinar el movimiento absoluto. Los resultados negativos de estos
experimentos planteaban una inconsistencia entre los principios de la mecánica
newtoniana y las leyes del electromagnetismo, las cuales condujeron a muchos
teóricos de la época, a desarrollar elaboradas teorías que permitieran coexistir,
sin aparente contradicción, a estos dos grandes pilares de la física del siglo XIX.
La relatividad especial, basada sobre los potulados de la constancia de la
velocidad de la luz en el vacío y el principio de relatividad, es una teoría inde-
pendiente de los fenómenos eléctricos y mecánicos y por esta razón constituye
uno de los pilares fundamentales de la física.
En efecto, podemos partir por ejemplo de la validez de la ley de Coulomb
para la fuerza entre dos partículas cargadas en reposo respecto a algún observa-
dor inercial (o equivalentemente, del campo eléctrico producido por una carga
en reposo) y del carácter invariante de la carga eléctrica y encontrar, utilizando
los principios de la dinámica relativista, la necesidad de introducir un campo
dependiente de la velocidad de la partícula que lo produce, conocido como el
campo magnético. Continuando con este procedimiento, más algunas hipótesis
de origen experimental, tales como la conservación de la carga, se pueden encon-
trar las leyes de la electrodinámica que rigen el comportamiento de los campos
electromagnéticos, así como la fuerza sobre las partículas cargadas en campos
electromagnéticos.
Este método de trabajo para mostrar el carácter relativista de la electro-
dinámica ha sido extensivamente utilizado en la literatura (ver por ejemplo el
exelente tratado en el libro de Rosser) y por esta razón presentaré en este capí-

125
CAPÍTULO 9. ELECTRODINÁMICA 126

tulo otro método de trabajo, el cual nos permite encontrar de manera directa las
propiedades de transformación de los campos electromagnéticos entre sistemas
de referencia inerciales.
El objetivo fundamental de este capítulo es entonces, escribir las leyes de
la electrodinámica en forma explícita covariante, es decir, de tal manera que su
invarianza relativista sea manifiesta. Como una consecuencia de esta formulación
de las ecuaciones de Maxwell, obtendremos las ecuaciones de transformación de
los campos eléctricos y magnéticos bajo transformaciones de Lorentz.
Para este fin, haremos uso del formalismo tensorial desarrollado en el capí-
tulo anterior, postulando en primer lugar, que las leyes de la electrodinámica,
constituidas por las ecuaciones de Maxwell, la ecuación de continuidad para la
carga y la ley de la fuerza de Lorentz, son válidas y luego reescribiremos estas
ecuaciones en términos de cantidades tensoriales.

9.2. Ecuaciones de Maxwell


Las leyes de la electrodinámica están constituidas por dos conjuntos de ecua-
ciones. El primer conjunto lo conforman las ecuaciones de Maxwell que están
dadas por (en unidades cgs):
~ ·E
∇ ~ = 4πρ (9.1)
~ ·B
∇ ~ =0 (9.2)
~
~ ×B
∇ ~ = 1 ∂ E + 4π J~ (9.3)
c ∂t c
~
~ ×E
∇ ~ + 1 ∂B = 0 (9.4)
c ∂t
las cuales nos determinan los campos eléctrico E ~ y magnético B~ en términos
de sus fuentes (cargas y corrientes), con ρ la densidad volumétrica de carga y
J~ la densidad de corriente eléctrica. La primera de estas ecuaciones es conocida
como la ley de Gauss y establece que las cargas eléctricas son fuente del campo
eléctrico, mientras que la segunda ecuación, la correspondiente ley de Gauss para
el campo magnético, nos dice que no existen fuentes para el campo magnético,
es decir, que en la naturaleza no existen cargas magnéticas aisladas, conocidas
en la literatura como monopolos magnéticos. La tercera de las ecuaciones de
Maxwell contiene dos términos: por una parte está la ley de Ampere, esto es, que
~
las corrientes eléctricas (representadas en el término 4π J/c) producen campos
~
magnéticos y por otra parte está el término 1/c∂ E/∂t, introducido por Maxwell,
que nos dice que campos eléctricos variables en el tiempo son también una
fuente de campo magnético. La última de las ecuaciones de Maxwell es la ley
de inducción de Faraday, la cual establece que campos magnéticos variables en
el tiempo inducen campos eléctricos.
El segundo conjunto de ecuaciones que conforman las leyes de la electro-
dinámica, lo constituyen la ecuación de continuidad y la ley de la fuerza de
CAPÍTULO 9. ELECTRODINÁMICA 127

Lorentz:
~ · J~ + ∂ρ = 0
∇ (9.5)
∂t
d~
p ~ + q ~u × B
~
= qE (9.6)
dt c
en donde q es la carga de la partícula y ~u su velocidad. La primera de estas
ecuaciones, la ecuación de continuidad, establece que la carga eléctrica es con-
servada en la naturaleza. Es decir, si en una región del espacio la densidad de
carga eléctrica varía
∂ρ/∂t 6= 0 (9.7)
es porque esta entrando o saliendo carga de esa región
~ · J~ 6= 0

Es de anotar que esta ley de conservación de la carga está contenida en las


ecuaciones de Maxwell y por lo tanto no constituye una ley independiente de
la electrodinámica, pues basta con tomar la divergencia de la segunda ecuación
de Maxwell y teniendo en cuenta la ley de Gauss (primera ecuación) se llega
directamente a la ecuación de continuidad. Sin embargo, es usual y útil, para
claridad en la discusión, mantener explícitamente esta ecuación de continuidad.
Finalmente, la ley de la fuerza de Lorentz nos da la ecuación de movimiento
para una carga puntual inmersa en un campo electromagnético.
Las ecuaciones de Maxwell muestran como los campos eléctricos y magnéti-
cos son en realidad aspectos diferentes de un solo fenómeno. Sin embargo, hasta
el siglo XVIII los fenómenos eléctricos y los magnéticos, conocidos por la huma-
nidad desde tiempos remotos, se consideraban como fenómenos completamente
independientes entre sí, situación que se puede entender ahora, si consideramos
el caso particular de campos electromagnéticos independientes del tiempo, con
sus fuentes de cargas y corrientes estacionarias. Bajo estas condiciones (campos
y densidades de carga y corriente independientes del tiempo), las ecuaciones
de Maxwell (ecuaciones (9.1) a la (9.4)) se pueden separar en dos conjuntos
independientes: El primer conjunto de ecuaciones, dado por:
~ ·E
∇ ~ = 4πρ (9.8)

~ ×E
∇ ~ =0 (9.9)
describe las leyes de la electrostática. La primera ecuación, la ley de Gauss,
describe que la única fuente del campo eléctrico son las cargas (estacionarias),
mientras que la segunda ecuación nos dice que el campo producido por estas car-
gas es conservativo. Estas dos ecuaciones son equivalentes a la ley de Coulomb.
El segundo conjunto de ecuaciones

∇ ~ = 4π J~
~ ×B (9.10)
c
~ ·B
∇ ~ =0 (9.11)
CAPÍTULO 9. ELECTRODINÁMICA 128

constituido por la ley de Ampere (con densidad de corriente estacionaria J, ~ i.e.


~ · J~ = 0) y la ley de Gauss para el campo magnético, describen las leyes de la

magnetostática y muestran que la única fuente del campo magnético también
son las cargas eléctricas, pero ahora en movimiento (corrientes). Si bien sabemos
que el origen de los campos electrostáticos y magnetostáticos son las cargas, los
conjuntos de ecuaciones (9.8), (9.9) y (9.10), (9.11) para los campos E ~ yB ~ no
~ yB
establecen ninguna relación entre estos campos, es decir, si bien E ~ tienen en
últimas las mismas fuentes por origen, son conceptual y fenomenológicamente
diferentes. Veremos en la siguiente sección, como la relatividad especial nos
permite establecer una relación entre el campo magnético y el eléctrico, aún en
el caso particular de campos independientes del tiempo.

9.3. Magnetismo: un efecto relativista


Antes de entrar al tema central del presente capítulo, mostraremos en esta
sección la estrecha relación que existe entre los fenómenos eléctricos y magnéticos
(para campos independientes del tiempo) como una aplicación de los postulados
fundamentales de la teoría especial de la relatividad. Veamos entonces, como
surge el concepto de campo magnético como una necesidad para mantener la
invarianza de las leyes físicas, si suponemos que la ley de Coulomb, la cual nos
da la fuerza entre dos partículas cargadas en reposo, es válida. Coulomb fue
el primero en describir cuantitativamente la fuerza entre partículas cargadas
estacionarias a través de la ley de fuerzas:
q1 q2
f~12 = k 2 r̂ (9.12)
r
en donde q1 y q2 miden las cargas eléctricas de las partículas, r es la distancia
entre en ellas, con r̂ un vector unitario en la dirección del radio vector que une
la carga 1 con la carga 2, y k es una constante de proporcionalidad que depende
del sistema de unidades elegido (k = 1 en el sistema cgs que usaremos en el
presente capítulo). Entonces f~12 nos mide la fuerza que la carga q2 experimenta
debido a la carga q1 , siendo esta fuerza atractiva o repulsiva dependiendo del
signo de las cargas: repulsiva si las cargas son del mismo signo y atractiva en
caso contrario. Además, esta expresión de la fuerza satisface por su definición
la tercera ley de Newton, esto es

f~12 = −f~21 (9.13)

En esta relación (ecuación (9.12)) se ha expresado la fuerza sobre la carga q2


debido a la carga q1 y en este sentido podemos escribir la ley de Coulomb en la
forma:
f~12 = q2 E
~ 1 (~r) (9.14)
~ 1 (~r), definida como
en donde la cantidad E

~ 1 (~r) := q1 r̂
E (9.15)
r2
CAPÍTULO 9. ELECTRODINÁMICA 129

Figura 9-1: Interacción Coulombiana normal al movimiento

es el campo eléctrico producido por la carga q1 en el punto ~r (hemos elegido el


origen del sistema de coordenadas espaciales en la posición de la carga q1 para
simplicar las expresiones).
Estas expresiones para la fuerza (ecuación (9.12)) y el campo eléctrico (ecua-
ción (9.15)) son válidas para un observador inercial Σ, con respecto al cual la
carga q1 está en reposo. Es un hecho experimental, que la fuerza sobre la carga
de prueba q2 es independiente del estado de movimiento de la carga de prueba, lo
cual está implícito en la expresión para la fuerza de Coulomb, pues ella depende
solamente de la posición instantánea de la carga q2 . Además, tanto la fuerza de
Coulomb como el campo eléctrico producido por la carga q1 , son independientes
del tiempo siempre y cuando la carga q1 permanezca en reposo.
Experimentalmente determinamos la fuerza f~12 sobre la carga de prueba q2
en el sistema de referencia inercial Σ, midiendo la rata de cambio del momento
p~2 de la carga q2 , es decir midiendo d~
p2 /dt, así como también las otras variables
cinemáticas y dinámicas que entran en la definición de la fuerza de Coulomb,
tales como la distancia entre la carga q1 y la de prueba, la velocidad (nula en
este caso) de la carga q1 y el momento p~2 de q2 . Si consideramos otro sistema de
referencia inercial Σ0 , el cual se mueve con velocidad v a lo largo de los ejes x, x0
con respecto a Σ, entonces todas las cantidades cinemáticas y dinámicas deben
transformarce de acuerdo con los principios de la relatividad especial y a partir
de estas cantidades podemos determinar la fuerza sobre la carga de prueba, pero
ahora estando las cargas q1 y q2 en moviento.
Nuestro primer objetivo es determinar la fuerza sobre una carga de prueba
q2 , medida por un observador inercial Σ, debida a una carga q1 que se mueve
con velocidad constante. Para simplificar los cálculos y sin pérdida de generali-
dad, consideraremos dos situaciones particulares: En la primera, ilustrada en la
Figura 8.1, la carga de prueba q2 se encuentra en reposo con respecto al sistema
Σ y está situada sobre el eje y en las coordenadas (0, y, 0), mientras que la carga
CAPÍTULO 9. ELECTRODINÁMICA 130

Figura 9-2: Interacción Coulombiana en la dirección de movimiento

q1 se mueve con velocidad v a lo largo del eje positivo de las x y pasa por el
origen de coordenadas en el instante t = 0. La segunda situación, mostrada en
la Figura 8.2, se diferencia de la anterior solamente en que ahora la carga de
prueba, que la denotaremos ahora por q3 , se situa en reposo respecto al sistema
Σ sobre el eje de las x en las coordenadas (x, 0, 0).
Debido a que la carga q1 se está moviendo, debemos pasarnos a un sistema de
referencia inercial Σ0 con respecto al cual esta carga se encuentre en reposo, con
el fin de poder aplicar la ley de Coulomb. Considerados un sistema de referencia
inercial Σ0 , que se mueva con velocidad v a lo largo del eje positivo x, siendo v
la velocidad de la carga q1 respecto a Σ.
Entonces, para todo instante t0 la carga q1 se encuentra en reposo en el origen
de coordenadas de Σ0 , mientras que la carga de prueba q2 pasa por el punto de
coordenadas (0, y 0 , 0) en el instante t0 = 0 y la carga q3 pasa por el punto de
coordenadas (x0 , 0, 0) en t0 = 0. Bajo estas condiciones, las fuerzas sobre las
cargas q2 y q3 están dadas por la ley de Coulomb (ecuación (9.12)). Entonces,
sobre la carga q2 la fuerza en el instante t0 = 0 solo tiene componente y y está
dada por:
0 0 q1 q2 0
fx12 = 0; fy12 = 02 ; fz12 =0 (9.16)
y
mientras que para la carga q3 la fuerza de Coulomb, en t0 = 0, tiene solo com-
ponente x:
0 q1 q3 0 0
fx13 = 02 ; fy13 = 0; fz13 =0 (9.17)
x
Retornemos ahora al sistema de referencia inercial Σ. Para este fin, recorde-
mos la definición de las componentes del cuadrivector fuerza (ecuación (6.19))
1
f α = (f 0 , f 1 , f 2 , f 3 ) = γ(~u)( f~ · ~u, f~) (9.18)
c
CAPÍTULO 9. ELECTRODINÁMICA 131

en donde ~u es la velocidad de la partícula sobre la cual está actuando la fuer-


za física f~. Bajo la transformación de Lorentz que estamos considerando, las
componentes de la cuadrifuerza medidas por Σ0 están relacionadas con las co-
rrespondientes componentes de la cuadrifuerza medidas en Σ, por las relaciones:

f 0 = γ(−v)(f 00 + βf 01 ) (9.19)

f 1 = γ(−v)(f 01 + βf 00 ) (9.20)
2 02
f =f (9.21)
f 3 = f 03 (9.22)
0
siendo −v la velocidad de Σ respecto a Σ , β = v/c y γ(−v) = γ(v). Teniendo en
cuenta la ecuación (9.18) y recordando la forma como el factor γ(~u0 ) se transfor-
ma (ver ecuación (5.18)), las ecuaciones de transformación para las componentes
de la fuerza física f~ están dadas por:
v ~0
fx0 + u0
c2 f · ~
fx = vu0
(9.23)
1 + c2x

f0
fy =  y  (9.24)
vu0x
γ(v) 1 + c2

f0
fz =  z  (9.25)
vu0x
γ(v) 1 + c2

Dado que la velocidad ~u0 de las cargas q2 y q3 , que las denotaremos por ~u01
y ~u02
respectivamente, están dadas por:

~u01 = (−v, 0, 0) (9.26)

~u02 = (−v, 0, 0) (9.27)


con respecto al sistema de referencia Σ0 , tenemos que las componentes de la
fuerza física respecto a Σ son:
0
fx12 = fx12 =0 (9.28)

0 q1 q2
fy12 = γ(v) fy12 = γ(v) (9.29)
y 02
0
fz12 = fz12 =0 (9.30)
para la carga q2 , y
0 q1 q3
fx13 = fx13 = (9.31)
x02
0
fy13 = fy13 =0 (9.32)
0
fz13 = fz13 =0 (9.33)
CAPÍTULO 9. ELECTRODINÁMICA 132

para la carga q3 . Puesto que bajo la transformación de Lorentz considerada


y 0 = y y x0 = γ(v)x, obtenemos que las componentes no nulas de la fuerza en
Σ, sobre las cargas de prueba q2 y q3 , están dadas por:
q1 q2
fy12 = γ(v) (9.34)
y2
1 q1 q3
fx13 = (9.35)
γ 2 (v) x2
respectivamente. A partir de estos resultados, es fácil intuir la forma general
para la fuerza eléctrica en un instante dado sobre una partícula de prueba q2
en reposo en un punto de coordenadas (x, y, z), debido a una carga q1 que se
desplaza a velocidad constante v a los largo del eje de las x y que pasa por el
origen de coordenadas en ese instante:
γ(v)~r
f~ = q1 q2 (9.36)
(γ 2 (v)x2 + y 2 + z 2 )3/2
en donde ~r es el vector posición instantáneo que une la carga q1 con la carga de
prueba q2 . Así, podemos definir el campo eléctrico producido por una partícula
móvil, situada instantáneamente en el origen de coordenadas, como:

~ = q1 γ(v)~r
E (9.37)
(γ 2 (v)x2 + y 2 + z 2 )3/2
Notemos en primer lugar, que el campo eléctrico sigue siendo radial, aún
cuando ya no es esféricamente simétrico como en el caso del campo eléctrico
producido por una carga en reposo, pues de la ecuación anterior se deduce
que el campo eléctrico se intensifica en un factor γ(v) para puntos del espacio
situados en el plano perpendicular a la dirección de movimiento de la partícula,
mientras que se hace un factor 1/γ 2 (v) más pequeño para puntos situados a lo
largo de la dirección de movimiento de la carga q1 .
Consideremos ahora dos cargas q1 y q2 como se muestra en la Figura 8.3,
en donde la carga q1 se mueve con velocidad v a lo largo del eje x positivo
con respecto al sistema de referencia Σ y la carga q2 se mueve con velocidad
~u = (ux , uy , uz ) respecto a Σ y supongamos que en el instante t = 0, la carga
q1 pasa por el origen de coordenadas y q2 por el punto (x, y, z) . Similar al caso
anteriormente discutido, sea Σ0 un sistema de referencia inercial que se desplaza
con velocidad v en la dirección positiva de las x respecto a Σ.
Entonces, con respecto al observador Σ0 la carga q1 se encuentran en repo-
so en el origen de coordenadas de Σ0 y q2 pasa por el punto de coordenadas
(x0 , y 0 , z 0 ) en el instante t0 = 0, moviendose con una velocidad ~u0 . De la ley de
Coulomb, las componentes de la fuerza medidas por el observador inercial Σ0
están dadas por:
0 q 1 q 2 x0
fx12 = 02 (9.38)
(x + y 02 + z 02 )3/2
0 q1 q2 y 0
fy12 = (9.39)
(x02 + y 02 + z 02 )3/2
CAPÍTULO 9. ELECTRODINÁMICA 133

Figura 9-3: Interacción entre cargas con movimiento arbitrario

0 q1 q2 z 0
fz12 = (9.40)
(x02 + y 02 + z 02 )3/2
las cuales son independientes de la velocidad ~u0 de la carga de prueba. Aplicando
las ecuaciones (9.23), (9.24) y (9.25) para la transformación de las componentes
de la fuerza y teniendo en cuenta la ley de transformación de velocidades:
ux − v
u0x = (9.41)
1 − vu
c2
x

uy
u0y = vux
 (9.42)
γ(v) 1 − c2
uz
u0z = vux
 (9.43)
γ(v) 1 − c2
obtenemos para las componentes de la fuerza sobre la carga de prueba q2 , me-
didas por el observador inercial Σ:

γ(v)q1 q2  vuy vuz 


fx12 = x + y + z (9.44)
(γ 2 (v)x2 + y 2 + z 2 )3/2 c2 c2

γ(v)q1 q2 y  vux 
fy12 = 1− (9.45)
(γ 2 (v)x2 + y 2 + z 2 )3/2 c2
γ(v)q1 q2 z  vu 
x
fz12 = 2 1− (9.46)
(γ (v)x2 + y 2 + z 2 )3/2 c2
Sabemos que la fuerza de Coulomb sobre una carga de prueba es independiente
del estado de movimiento de dicha carga de prueba. Sin embargo, comparando
la ecuación (9.34) con las ecuaciones (9.44), (9.45) y (9.46) para la fuerza sobre
la carga de prueba q2 , la primera cuando q2 está en reposo y la segunda cuando
CAPÍTULO 9. ELECTRODINÁMICA 134

está en movimiento, vemos que en el segundo caso aparecen unos términos extras
a la fuerza eléctrica (de Coulomb).
Para ver esto de una manera más directa, notemos que la fuerza sobre la
carga de prueba q2 (ecuaciones (9.44), (9.45) y (9.46)) la podemos escribir en la
forma:
(elec)
f~12 = f~12
(mag)
+ f~12 ~ + q2 ~u × B
; = q2 E ~ (9.47)
c
en donde E ~ es el campo eléctrico producido por la carga q1 dado por (ecuación
(9.37)):
~ = q1 γ(v)~r
E (9.48)
(γ (v)x2 + y 2 + z 2 )3/2
2

siendo ~u la velocidad de la carga de prueba q2 y definimos el campo magnético


~ producido por la carga q1 , como:
B

~ 1 γ(v)q1~r
B : = ~v × 2 (9.49)
c (γ (v)x2 + y 2 + z 2 )3/2
1 ~
= ~v × E (9.50)
c
siendo ~v la velocidad de la carga q1 .
Teniendo en cuenta que la velocidad de la carga q1 , en el caso considerado
está dada por ~v = (v, 0, 0), es fácil ver por un cálculo directo, que la expresión
general dada por la ecuación (9.47) se reduce a la expresión para fuerza, encon-
trada en las ecuaciones (9.44), (9.45) y (9.46). En la ecuación (9.47) se dividió
explícitamente la fuerza que actúa sobre la carga de prueba en dos términos:
El primero término corresponde a la fuerza Coulombiana que actúa sobre la
carga q2 , la cual es independiente del estado de movimiento de dicha carga de
prueba, mientras que el segundo término sí es dependiente de la velocidad de
dicha carga. Además, este segundo término se anula si cualquiera de las cargas,
la carga fuente q1 o la de prueba q2 están en reposo. Este resultado nos muestra
la estrecha relación entre los fenómenos eléctricos y magnéticos.
Es importante tener en mente, que en todo nuestro análisis hemos trabajo
bajo la suposición que las cargas no están sometidas a aceleraciones, pues para
considerar esta situación es necesario trabajar con las leyes completas de la
electrodinámica.
Es posible continuar con este método de trabajo y obtener la ley de Biot-
Sabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estos
temas de lado, para concentrarnos en el objetivo fundamental del presente ca-
pítulo.
En la siguiente sección escribiremos las ecuaciones de Maxwell en forma
explícita relativista y encontraremos las leyes generales de transformación de los
campos electromagnéticos, entre sistemas de referencia inerciales y mostraremos,
cómo los resultados anteriormente obtenidos, corresponden a casos particulares
de estas leyes de transformación.
CAPÍTULO 9. ELECTRODINÁMICA 135

9.4. Ecuaciones de Maxwell covariantes


Consideremos en primer lugar la ecuación de continuidad (9.5), la cual po-
demos escribir en forma explícitamente covariante, como:
∂µ J µ = 0 (9.51)
teniendo encuenta lo establecido en la última sección del capítulo anterior y
donde el cuadrivector corriente J ν se ha definido en la forma:
~
J ν := (J 0 , J 1 , J 2 , J 3 ) = (cρ, J) (9.52)
0
La componente temporal J representa la densidad de carga (siendo la carga
un invariante relativista) y las componentes espaciales J i , i = 1, 2, 3 correspon-
den a las componentes del vector densidad de corriente eléctrica. Esta definición
del cuadrivector corriente nos da inmediatamente, las ecuaciones de transfor-
mación para las densidades de carga y corriente, medidas por dos observadores
inerciales. En efecto, dados dos sistemas de referencia inerciales Σ y Σ0 , con
Jν = ~
(cρ, J) (9.53)
J 0ν
= (cρ0 , J~0 ) (9.54)
las componentes del cuadrivector corriente medidas por los dos observadores,
entonces J ν y J 0ν están relacionadas por (ver ecuación (8.2)):
J 0ν = Λµν J ν (9.55)
Para el caso particular de dos sistemas de referencia inerciales, con v la
velocidad del sistema Σ0 respecto a Σ, a lo largo del eje positivo de las x y
ejes espaciales paralelos, tenemos que las ecuaciones de transformación para las
componentes de la densidad de corriente están dadas por:
J 00 = γ(v)(J 0 − βJ 1 ) (9.56)
J 01 = γ(v)(J 1 − βJ 0 ) (9.57)
02 2
J =J (9.58)
03 3
J =J (9.59)
en donde hemos utilizado las ecuaciones (3.49) para los elementos de la trans-
formación de Lorentz Λµν , siendo
p
γ(v) = 1/ 1 − β 2 (9.60)
y β = v/c. Remplazando las componentes J 0ν y J ν en términos de las densidades
de carga y de corriente, dadas por
J0 = cρ (9.61)
J 00 = cρ0 (9.62)
j i
= J~ ≡ (Jx , Jy , Jz ) (9.63)
j 0i ~0
= J ≡ (Jx0 , Jy0 , Jz0 ) (9.64)
CAPÍTULO 9. ELECTRODINÁMICA 136

obtenemos las relaciones:


v
ρ0 = γ(v)(ρ − Jx ) (9.65)
c2
Jx0 = γ(v)(Jx − vρ) (9.66)
Jy0 = Jy (9.67)
Jz0 = Jz (9.68)
En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones
~ y magnéticos B
(9.1) a la (9.4)) los campos eléctricos E ~ son vectores cartesianos
usuales y por lo tanto no corresponden a ninguna cantidad relativista, es decir
a un escalar de Lorentz, o a un cuadrivector, o a un tensor. Por otra parte, para
describir los campos electromagnéticos producidos por alguna distribución de
cargas y corrientes, es necesario conocer seis cantidades independientes, esto es,
las tres componentes del campo eléctrico y las tres del campo magnético.
Esta situación nos conduce a postular, que el objeto matemático (relativista)
adecuado para describir al campo electromagnético, es un tensor de segundo
orden antisimétrico, pues por lo discutido en el capítulo anterior (sección 8.2.3),
este tensor posee solo seis componentes independientes. Estos argumentos nos
motivan a definir el tensor campo electromagnético F medido por un observador
inercial Σ, como un tensor de segundo rango antisimétrico cuyas componente
contravariantes están definidas por:

F 12 = −F 21 = Bz F 23 = −F 32 = Bx F 31 = −F 13 = By
F 01 = −F 10 = Ex F 02 = −F 20 = Ey F 03 = −F 30 = Ez (9.69)
F αα = 0 ∀α = 0, 1, 2, 3

Con esta definición, podemos escribir las dos primeras ecuaciones de Maxwell
(ecuaciones (9.1) y (9.2)) en la forma:
4π β
∂α F αβ = − J (9.70)
c
la cual es una ecuación covariante relativista, pues el lado izquierdo es el pro-
ducto del operador gradiente ∂α por el tensor electromagnético F αβ contraido
en su primer índice α, para obtener así un cuadrivector contravariante, el cual
es proporcional al cuadrivector densidad de corriente. Esto significa que esta
ecuación tiene la misma forma en todos los sistemas de referencia inerciales,
es decir, en un sistema de referencia Σ0 , para el cual F 0αβ y J 0β son las co-
rrespondientes componentes del tensor campo electromagnético y densidad de
corriente, las dos primeras ecuaciones de Maxwell tienen la forma:
4π 0β
∂α0 F 0αβ = − J (9.71)
c
en donde las componentes de la densidad de corriente J 0β medidas en Σ0 , están
relacionadas con las medidas en Σ, por las ecuaciones de transformación (9.55)
CAPÍTULO 9. ELECTRODINÁMICA 137

( o las ecuaciones (9.56), (9.57), (9.58) y (9.59) o también las ecuaciones (9.65),
(9.66), (9.67) y (9.68) en el caso particular usual). Las componentes del tensor
campo electromagnético medidas por los dos observadores inerciales Σ y Σ0
están relacionadas por las ecuaciones de transformación (ver el capítulo anterior
ecuación (8.3)):
F 0µν = Λµα Λνβ F αβ (9.72)
Estas relaciones nos dan entonces, las ecuaciones de transformación para
los campos eléctricos y magnéticos medidas por dos observadores inerciales.
Consideremos de nuevo, el caso particular de transformaciones de Lorentz entre
sistemas de referencia con ejes paralelos y velocidad relativa a lo largo de los
ejes xx0 , en donde los elementos de la transformación de Lorentz están dados
por (ecuación (3.50)):
Λ00 = Λ11 = γ (9.73)
Λ01 = Λ10 = −βγ (9.74)
Λ22 = Λ33 = 1 (9.75)
con

β = v/c (9.76)
p
γ = 1 − β2 (9.77)

y los demás elementos cero.


Sean
~
E = (Ex , Ey , Ez ) (9.78)
~
B = (Bx , By , Bz ) (9.79)
~0
E = (Ex0 , Ey0 , Ez0 ) (9.80)
~0
B = (Bx0 , By0 , Bz0 ) (9.81)

las componentes de los campos eléctricos y magnéticos medidas por Σ y Σ´res-


pectivamente. Entonces aplicando las ecuaciones de transformación (9.72), con
los elementos de la transformación de Lorentz dados por las ecuaciones (9.73),
(9.74) y (9.75) y la definición (9.69) de las componentes del tensor electromag-
nético, tenemos (para las componentes no nulas de F):
0
01
Ex0 = F = Λ0α Λ1β F αβ (9.82)
= Λ00 Λ10 F 00 + Λ00 Λ11 F 01 + Λ00 Λ12 F 02 + Λ00 Λ13 F 03
+Λ01 Λ10 F 10 + Λ01 Λ11 F 11 + Λ01 Λ12 F 12 + Λ01 Λ13 F 13
+Λ02 Λ10 F 20 + Λ02 Λ11 F 21 + Λ02 Λ12 F 22 + Λ02 Λ13 F 23
+Λ03 Λ10 F 30 + Λ03 Λ11 F 31 + Λ03 Λ12 F 32 + Λ03 Λ13 F 33
= Λ00 Λ11 F 01 + Λ01 Λ10 F 10
= γ 2 Ex − β 2 γ 2 Ex
= Ex (9.83)
CAPÍTULO 9. ELECTRODINÁMICA 138

Un cálculo similar se puede hacer para las demás componentes, pero por
brevedad, aquí solo presentaremos los téminos no nulos que surgen en la trans-
formación:
0
02
Ey0 = F = Λ0α Λ2β F αβ = Λ00 Λ22 F 02 + Λ01 Λ22 F 12
= γ(Ey − βBz ) (9.84)

0
03
Ez0 = F = Λ0α Λ3β F αβ
= Λ00 Λ33 F 03 + Λ01 Λ33 F 13
= γ(Ez + βBy ) (9.85)

0
23
Bx0 = F = Λ2α Λ3β F αβ
= Λ22 Λ33 F 23
= Bx (9.86)

0
31
By 0 = F = Λ3α Λ1β F αβ
= Λ33 Λ10 F 30 + Λ33 Λ11 F 31
= γ(By + βEz ) (9.87)

0
12
Bz0 = F = Λ1α Λ2β F αβ
= Λ10 Λ22 F 02 + Λ11 Λ22 F 12
= γ(Bz − βEy ) (9.88)

Antes de considerar aplicaciones de estas ecuaciones de transformación de


los campos, las cuales serán dadas más adelante, escribamos las otras ecuaciones
de Maxwell en notación tensorial.
Las ecuaciones de Maxwell homogéneas (ecuaciones (9.2) y (9.4)), con la
ayuda del tensor de Levi-Civita introducido en el capítulo anterior (ecuación
(8.78)), las podemos escribir en la forma:

εαβγδ ∂β Fγδ = 0 (9.89)

en donde en esta última ecuación se ha utilizado el tensor de Minkowski para


bajar los índices del tensor electromagnético F, esto es:

Fγδ = ηαγ ηβδ F αβ (9.90)

las cuales nos representa las componentes covariantes del tensor campo elec-
tromagnético. Para recordar más fácilmente la relación entre las componentes
contravariantes del tensor F, definidas en la ecuación (9.69) y su relación con las
CAPÍTULO 9. ELECTRODINÁMICA 139

componentes covariantes, definidas en la ecuación (9.90), es útil escribir estas


componentes en forma matricial:
 00 

 F F 01 F 02 F 03  
 10
F F 11 F 12 F 13

αβ
(F ) = (9.91)
 F 20 F 21 F 22 F 23 
 
 30
F F 31 F 32 F 33

 

 0 Ex Ey Ez  
−Ex 0 Bz −By
 
= (9.92)

 −Ey −Bz 0 Bx  
−Ez By −Bx 0
 

Aplicando, ahora, la ecuación (9.90), tenemos:


 

 F00 F01 F02 F03 

F10 F11 F12 F13
 
(Fαβ ) = (9.93)

 F20 F21 F22 F23 

F30 F31 F32 F33
 
 

 0 −Ex −Ey −Ez 

Ex 0 Bz −By
 
= (9.94)

 E y −B z 0 Bx 

Ez By −Bx 0
 

Ilustremos como se aplicó la ecuación (9.90) para llegar a la ecuación anterior,


calculando explícitamente dos términos, por ejemplo F02 y F21 . Recordando,
para simplificar, que los elementos del tensor métrico de Minkowski se anulan
si los índices son diferentes, vemos que de los 16 sumandos que aparecen por la
doble suma en la ecuación (9.90), solo un término es no nulo:
F02 = ηα0 ηβ2 F αβ = η00 η22 F 02 = −Ey (9.95)
F21 = ηα2 ηβ1 F αβ = η22 η11 F 21 = −Bz (9.96)
Veamos ahora que efectivamente la ecuación (9.89) reproduce las ecuaciones
de Maxwell homogeneas. Notemos en primer lugar que la ecuación (9.89) con-
tiene cuatro ecuaciones, una para cada α = 0, 1, 2, 3 y cada una a su vez (debido
a la triple suma sobre los índices repetidos β, γ y δ) está conformada por 64
sumandos. Sin embargo, dado que las componentes del tensor de Levi-Civita se
anulan para cualquier par de índices repetidos, en cada ecuación sobreviven solo
cuatro sumandos. Así, para α = 0 los términos no nulos son:
0 = ε0123 ∂1 F23 + ε0132 ∂1 F32 + ε0213 ∂2 F13 + (9.97)
0231 0312 0321
ε ∂2 F31 + ε ∂3 F12 + ε ∂3 F21
∂Bx ∂By ∂Bz ~ ·B
~
= 2 +2 +2 = 2∇ (9.98)
∂x ∂y ∂z
obteniendo la ecuación de Maxwell para la divergencia del campo magnético.
Para la última ecuación de Maxwell, la ley de Faraday, consideremos explícita-
mente solo el caso de α = 1, pues el resultado se puede extrapolar fácilmente a
CAPÍTULO 9. ELECTRODINÁMICA 140

α = 2 y 3. Entonces, para α = 1 los términos no nulos son:

0 = ε1023 ∂0 F23 + ε1032 ∂0 F32 + ε1203 ∂2 F03 + (9.99)


1230 1302 1320
ε ∂2 F30 + ε ∂3 F02 + ε ∂3 F20
∂Bx ∂Ez ∂Ey 2 Bx ~ × E)
~ x
= −2 +2 −2 =− − 2(∇ (9.100)
∂ct ∂y ∂z c ∂t
en donde hemos utilizado el hecho que x0 = ct, obteniendo así la componente x
de la ley de Faraday.
Finalmente consideremos la ecuación de la Fuerza de Lorentz (segunda ecua-
ción en (9.6)), la cual podemos escribir en forma covariante como:
dpα q dxγ q α dx
γ
fα = = ηβγ F βα = Fγ (9.101)
dτ c dτ c dτ
en donde pα es el cuadrimomento de la partícula de carga q, τ el tiempo propio,
xγ sus coordenadas de posición y Fγ α las componentes mixtas del tensor campo
electromagnético definidas por:
α
Fγ = ηγσ F σα (9.102)

Desarrollemos explícitamente la ecuación (9.101), para interpretar los térmi-


nos que de ella surgen, pues si bien afirmamos que esta ecuación es equivalente
a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz una ecua-
ción vectorial, contiene tres ecuaciones escalares independientes, mientras que
la ecuación (9.101) es cuadrivectorial y por tanto contiene cuatro ecuaciones. En
primer lugar calculemos, utilizando la ecuación (9.102), las componentes mixtas
F αγ del tensor campo electromagnético:
 

 F0 0 F1 0 F2 0 F 03  
F0 1 F1 1 F2 1 F3 1
 
(Fβ α ) = 2 2 2 2 (9.103)

 F0 F1 F2 F3 

F0 3 F1 3 F2 3 F3 3
 
 

 0 Ex Ey Ez  
Ex 0 Bz −By
 
= (9.104)

 Ey −Bz 0 Bx  
Ez By −Bx 0
 

Remplazando estas cantidades en la ecuación (9.101), y desarrollandola ex-


plícitamente en componentes, tenemos:

q dx1 dx2 dx3


f0 = (Ex + Ey + Ez ) (9.105)
c dτ dτ dτ
q dx0 dx2 dx3
f1 = (Ex + Bz − By ) (9.106)
c dτ dτ dτ
q dx0 dx1 dx3
f 2 = (Ey − Bz + Bx ) (9.107)
c dτ dτ dτ
CAPÍTULO 9. ELECTRODINÁMICA 141

q dx0 dx1 dx2


f3 = (Ez + By − Bx ) (9.108)
c dτ dτ dτ
Para interpretar estas ecuaciones, recordemos el significado físico de las com-
ponentes de la cuadrifuerza dado en el capítulo 5 (ver ecuación (6.19)). Las
componentes de la cuadrifuerza se pueden escribir en la forma:
1
f α = γ(~u)( f~ · ~u, f~) (9.109)
c

en donde f~ = d~ p/dt es la fuerza física sobre la partícula, ~u su velocidad y la


componente temporal representa el trabajo por unidad de tiempo que realiza la
fuerza física f~ sobre la partícula. Recordando que
dt 1
= γ(~u) := p (9.110)
dτ 1 − ~u2 /c2

(ver capítulo 4 ecuación (5.8)), podemos reescribir las ecuaciones (9.105), (9.106),
(9.107) y (9.108), en la forma siguiente:
1~ q~
f · ~u = E · ~u (9.111)
c c

f~ = q E
~ + q~u × B
~ (9.112)
Notemos que el factor de Lorentz γ(~u) se cancela. La componente temporal
de la cuadrifuerza, corresponde al hecho de que solo el campo eléctrico realiza
trabajo sobre las partículas, una situación que está contemplada en la expresión
para la fuerza de Lorentz, puesto que la fuerza debida al campo magnético es
~ y por lo tanto:
de la forma q~u × B

~ + q ~u × B)
f~ · ~u = (q E ~ · ~u = E
~ · ~u (9.113)
c
Resumiendo, las leyes de la electrodinámica (que incluyen las ecuaciones de
Maxwell, la ecuación de continuidad y la fuerza de Lorentz) escritas en forma
relativista covariante son:
∂α F αβ = −4πJ β (9.114)
εαβγδ ∂β Fγδ = 0 (9.115)
µ
∂µ J = 0 (9.116)
γ
q α dx
fα = F (9.117)
c γ dτ
Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de las
propiedades de transformación de los campos. Consideremos en primer lugar
los ejemplos tratados en la sección anterior. Supongamos que una partícula de
carga q1 se mueve con velocidad constante v respecto a un sistema de referencia
inercial Σ, a lo largo del eje positivo de las x y pasa por el origen en el intante
t = 0. Sea Σ0 otro sistema de referencia inercial, el cual se mueve con velocidad
CAPÍTULO 9. ELECTRODINÁMICA 142

v respecto a Σ en la dirección del eje positivo de las x. Entonces, si los orígenes


de Σ y Σ0 coinciden en t = t´= 0, la carga q1 se encuentra en reposo en el origen
de Σ0 y por lo tanto el campo electromagnético, en un punto de coordenadas
(x0 , y 0 , z 0 ) y en cualquier instante, producido por q1 se reduce a:

~ 0 = q1 ~r0 ; B
E ~0 = 0 (9.118)
r03
de acuerdo con la ley de Coulomb, en donde ~r0 = (x0 , y 0 , z 0 ) y r0 = (x02 + y 02 +
z 02 )1/2 . Para calcular el campo electromagnético medido por el observador iner-
cial Σ, calculamos primero las componentes del tensor campo electromagnético
en Σ0 y luego aplicamos las propiedades de transformación del tensor Fµν 0
. De
la ecuación (9.118) tenemos (en notación matricial):
q1 x0 q1 y 0 q1 z 0
 

 0 r 03 r 03 r 03 

 q1 x0 
− r03 0 0 0
 
0αβ
(F ) = q1 y 0 (9.119)
 − r030

 0 0 0 


− qr103z 0 0 0
 

Aplicando las ecuaciones de transformación para las componentes del tensor


F 0µν (ecuación (9.72)), pero teniendo en cuenta que ahora estamos transforman-
do del sistema Σ0 al Σ:
F µν = Λµα Λνβ F 0αβ (9.120)
en donde los elementos de la transformación de Lorentz Λµα están dados por las
ecuaciones (9.73), (9.74) y (9.75), cambiando β = v/c por −β, y teniendo en
cuenta que γ(−v) = γ(v).
Consideremos primero los término F 0i , i = 1, 2, 3 que corresponden a las
componentes del campo eléctrico medido en Σ. Entonces, como

Λ02 = Λ03 = 0 (9.121)

y
Λiβ = 0 (9.122)
para β 6= 0 y β 6= i y teniendo en cuenta que

F 0ij = 0 i, j = 1, 2, 3 (9.123)

(no hay campo magnético en Σ0 ), tenemos que los términos no nulos de la


ecuación (9.120) son:

F 0i = Λ0α Λiβ F 0αβ (9.124)


= Λ00 Λiβ F 00β + Λ01 Λiβ F 01β
= Λ00 Λii F 00i + Λ01 Λi0 F 010 (9.125)

Notemos que en el primer término de la última igualdad no hay suma sobre


el índice i, pues está repetido tres veces. Esto surgió del hecho que Λij = 0 si
CAPÍTULO 9. ELECTRODINÁMICA 143

i 6= j; i, j = 1, 2, 3. Remplazando explícitamente los diferentes términos, tenemos


que las componentes del campo eléctrico medidas por el observador Σ están
dadas por:
Ex = γ 2 (v)Ex0 − β 2 γ 2 (v)Ex0 = Ex0 (9.126)
Ey = γ(v)Ey0 (9.127)
Ez = γ(v)Ez0 (9.128)
Notemos que en el instante t = 0 medido en Σ, la carga está en el origen y
la relación entre las coordenadas del punto donde estamos observando el campo
eléctrico es
(x0 , y 0 , z 0 ) = (γ(v)x, y, z) (9.129)
en ese instante. Entonces, si expresamos el campo eléctrico medido por Σ en
términos de las coordenadas de Σ, obtenemos el resultado ya encontrado en la
sección anterior, ecuación (9.37). Calculemos ahora las componentes del campo
magnético en el sistema de referencia Σ. Procediendo de forma similar, escriba-
mos primero las componentes no nulas de la ecuación (9.120) que corresponden
al campo magnético, notando que i 6= j; i, j = 1, 2, 3 y no hay suma sobre tres
índices repetidos:

F ij = Λiα Λjβ F 0αβ (9.130)


= Λi0 Λjj F 00j + Λii Λj0 F 0i0 (9.131)

Remplazando, tenemos que las componentes del campo magnético son:

Bx = F 23 = 0 (9.132)

By = F 31 = −βγ(v)Ez0 (9.133)
Bz = F 12 = βγ(v)Ey0 (9.134)
Este resultado lo podemos escribir en forma condensada como:

~ = 1 ~v × E
B ~ (9.135)
c
en completo acuerdo con el resultado obtenido en la sección anterior, ecuación
(9.49), teniendo en cuenta las ecuaciones (9.126), (9.127) y (9.128) y que la
velocidad está dada por:
~v = (v, 0, 0) (9.136)

9.5. Transformaciones Gauge


Hay dos teoremas del cálculo diferencial en varias variables, que nos permiten
escribir las ecuaciones de Maxwell en forma más compacta:
Teorema 9.1: Sea F~ una función vectoria tal que su rotacional es cero, i.e.,
~ × F~ = 0
∇ (9.137)
CAPÍTULO 9. ELECTRODINÁMICA 144

entonces la función F~ se puede escribir como el gradiente de una función escalar


Ψ(~r), esto es:
F~ = ∇Ψ(~
~ r) (9.138)
Teorema 9.2: Sea F~ una función vectorial tal que su divergencia es cero, i.e.,
~ · F~ = 0
∇ (9.139)

entonces la función F~ se puede escribir como el rotacional de una función vec-


~ r), esto es:
torial Υ(~
F~ = ∇~ × Υ(~
~ r) (9.140)
Apliquemos estos dos resultados del cálculo vectorial a los campos eléctrico y
magnético. La tercera ecuación de Maxwell (9.3) establece que

~ ·B
∇ ~ =0 (9.141)

entonces podemos escribir el campo magnético como el rotacional de una función


vectorial, es decir:
~ =∇
B ~ ×A ~ (9.142)
~ se le llama el potencial vectorial.
en donde la función vectorial A
Ahora, si reemplazamos el campo magnético en la última de las ecuaciones
~ tenemos:
(9.4) en términos del potencial vectorial A,

~
∇ ~ + ∂A ) = 0
~ × (E (9.143)
∂t

esto significa, de acuerdo con el Teorema 9.2, que la función vectorial E ~ +


~
∂ A/∂t la podemos escribir como el gradiente de una función escalar Φ, es decir

~
~ + ∂ A = −∇Φ
E ~ (9.144)
∂t
en donde Φ es el potencial escalar. El signo menos en la ecuación anterior permite
interpretar directamente al potencial Φ, para el caso de campos independientes
del tiempo, como el trabajo por unidad de carga realizado por el campo eléctrico,
llamado potencial electrostático, el cual es un campo conservativo.
Estos dos teoremas del cálculo vectorial, corresponden a casos particulares
de un teorema más general de tensores:
Teorema 9.3: Sean Tαβ las componentes covariantes de un tensor de se-
gundo rango antisimétrico, tal que

εαβγδ ∂β Tγδ = 0 (9.145)

entonces el tensor Tαβ se puede escribir como el “rotacional” (ver ecuación


(8.111)) de una función cuadrivectorial W γ , es decir

Tαβ = ∂[α Wβ] = ∂α Wβ − ∂β Wα (9.146)


CAPÍTULO 9. ELECTRODINÁMICA 145

Como vimos en la sección 9.4 de este capítulo, las dos ecuaciones de Maxwell
homogeneas

∇~ ·B
~ = 0 (9.147)
~ ×E
∇ ~ + ∂ B/∂t
~ = 0 (9.148)

se pueden escribir en la forma

εαβγδ ∂β Fγδ = 0 (9.149)

en donde Fγδ es el tensor campo electromagnético. Entonces, de acuerdo con


el Teorema 9.3, el tensor campo electromagnético Fγδ se puede escribir en la
forma
∂Aδ ∂Aγ
Fγδ = ∂γ Aδ − ∂δ Aγ = γ
− (9.150)
∂x ∂xδ
en donde el cuadrivector Aµ , definido como:
~
Aµ := (Φ, A) (9.151)
~ el potencial vectorial y Φ el potencial escalar
es llamado el cuadripotencial,con A
definidos en la ecuaciones (9.142) y (9.144) respectivamente.
Con esta definición del cuadripotencial Aµ , podemos escribir las ecuaciones
de Maxwell inhomogeneas (ver ecuación (9.70)):

∂α F αβ = −4πJ β (9.152)

en términos del cuadripotencial Aµ . Remplazando la ecuación (9.150) en la


ecuación anterior y teniendo en cuenta que

F αβ = η αµ η βν Fµν (9.153)
β
Jγ = ηγβ J (9.154)

obtenemos:
∂ µ ∂µ Aγ − ∂ µ ∂γ Aµ = −4πJγ (9.155)
De esta manera, esta última ecuación es equivalente a las ecuaciones de cam-
po de Maxwell, pues dadas las fuentes de los campos J α y resolviendo la ecuación
(9.155), conocemos el cuadripotencial Aµ y así los campos electromagnéticos.
Por otra parte, de la ecuación de definición de Fγδ en términos del potencial
cuadrivectorial, notemos que podemos cambiar Aµ , adicionándole una función
cualquiera de la forma ∂µ ϕ, sin que cambie el tensor campo electromagnético
Fγδ . Es decir, si realizamos la transformación

Aµ * õ = Aµ + ∂µ Λ (9.156)

en donde Λ es una función cualquiera de las coordenadas, la ecuación (9.150)


nos conduce a:
∂ Ãδ ∂ Ãγ
F̃γδ = γ

∂x ∂xδ
CAPÍTULO 9. ELECTRODINÁMICA 146

∂ ∂
= γ
(Aδ + ∂δ Λ) − (Aγ + ∂γ Λ)
∂x ∂xδ
∂ ∂ ∂2Λ ∂2Λ
= γ
Aδ − δ
Aγ + γ δ

∂x ∂x ∂x ∂x ∂xδ ∂xγ
∂ ∂
= Aδ − Aγ = Fγδ (9.157)
∂xγ ∂xδ
lo cual significa que la función Fγδ permanece invariante bajo la transformación
(9.156) y así también los campos electromagnéticos E ~ y B.
~ A la transformación
(9.156) se le llama una transformación “gauge”. Este tipo de transformaciones
juega un papel fundamental en la teoría cuántica de campos y en las llamadas
teorías de unificación de las interacciones fundamentales de la naturaleza.
Para finalizar este capítulo, veamos como esta característica de la teoría
electromagnética (cuando se formulan las ecuaciones de Maxwell en términos
del cuadripotencial), de permanecer los campos físicos E ~ yB ~ invariantes bajo
una transformación gauge, nos permite simplicar las ecuaciones que rigen el
comportamiento del cuadripotencial Aµ .
Dado que el cuadripotencial Aµ no está definido de manera única, entonces,
podemos imponer sobre él una condición o ecuación de ligadura, llamada la
elección de un gauge particular, la cual por lo establecido anteriormente, no
cambia la física, es decir no cambian los campos E ~ y B.
~ Así, podemos escoger
la función arbitraria Λ en la ecuación (9.156), de tal manera que el potencial
cuadrivectorial Aµ cumpla con la ecuación:

∂ µ Aµ = 0 (9.158)

llamado el gauge de Lorentz, de tal manera que la ecuación (9.155) se simplifica,


reduciendose a la ecuación:
Aµ = −Jµ (9.159)
que es la ecuación de ondas inhomogénea. Recordando la definición del operador
, ecuación (8.109), vemos que la teoría electromagnética de Maxwell, expresada
por la ecuación (9.159) contiene al postulado de la constancia de la velocidad
de la luz, pues dado que el operador  definido por:

1 ∂2 ~2
= −∇ (9.160)
c2 ∂t2
es un invariante bajo transformaciones de Lorentz, entonces el coeficiente 1/c2 ,
que representa la velocidad de propagación de los campos electromagnéticos, es
una constante independiente del observador. Este último resultado ilustra con
toda claridad y sin restarle méritos a la genialidad de Albert Einstein, como la
teoría de la relatividad especial estaba ya presente en la física.
Capítulo 10

Revisión bibliográfica

La literatura disponible sobre relatividad es tal vez de las más amplias,


tanto en el campo especializado como en el divulgativo. Se listarán a continua-
ción algunas referencias, desde literatura de divulgación, pasando por textos
elementales, obras de valor histórico, hasta textos y libros avanzados que, sin
pretender ser exaustivas, sí cubren globalmente la temática de la teoría especial
de la relatividad.
Referencias de carácter divulgativo

1. Bucker R. B., Geometry, Relativity and the fourth dimension. Dover


Publications, Inc. N. Y. 1977
2. Lilley S., Discovering Relativity for yourself. Cambridge University Press
1981
3. Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978
4. Williams L. P., La Teoría de la Relatividad. Alianza Universidad 1977

Textos elementales a nivel universitario sobre relatividad especial

1. Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y Mo-


vimiento. McGraw Hill 1993
2. Resnick R., Introducción a la Teoría Especial de la Relatividad. Limusa
1981
3. Skinner R., Relativity for Scientists and Engineers. Dover Publishing N.
Y. 1982
4. Smith J. H., Introducción a la Relatividad Especial. Ed. Reverté 1978

Textos universitarios de relatividad a nivel intermedio

147
CAPÍTULO 10. REVISIÓN BIBLIOGRÁFICA 148

1. Enrique L., Física Relativista. Buenos Aires 1955


2. French A. P., Special Relativity. Massachusetts Institute of Technology
1968
3. Rindler W., Essential Relativity. Special, General and Cosmology. Sprin-
ger-Verlag 1977
4. Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San
Francisco 1966

Libros y textos avanzados sobre relatividad


Algunos de ellos incluyen, también, elementos básicos de la Relatividad Ge-
neral:
1. Aharoni J., The Special Theory of Relativity. Oxford University Press
1965
2. Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978
3. Fock V., The Theory of Space Time and Gravitation, Pergamon Press
1959
4. Gill T. P., The Doppler Effect. Academic Press 1965
5. Kopczynski W. and Trautman A., Spacetime and Gravitation. John
Wiley & Sons 1992
6. Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers
Moscow 1989
7. Rosser W. G. V., An Introduction to the Theory of Relativity. Butter-
worth, London 1964
8. Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow 1979

Libros avanzados de relatividad

con un fuerte énfasis en aspectos matemáticos

1. Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963


2. Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation. W.
H. Freeman and Co. 1973
3. Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag
1992
4. Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992
CAPÍTULO 10. REVISIÓN BIBLIOGRÁFICA 149

Libros clásicos de relatividad

y obras formales de carácter histórico

1. Born M., Einstein’s Theory of Relativity. Dover Publications, Inc. 1965


(1a ed. 1920)

2. Einstein A., The Principle of Relativity. Dover N. Y. 1958


3. Poincaré H., La Mécanique Nouvelle. Conference Mémoire et note sur
la Théorie de la Relativité. Editions Jacques Gabay 1989
4. Rocard J. M., Newton et la Relativité. Press University France 1986

5. Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970


6. Silberstein L., The Theory of Relativity. Great Britain 1914
7. Synge J. L., Relativity: The Special Theory. North-Holland Publishing
Company 1958

8. Whittaker Sir E. T., History of the Theories of Aether and Electricity.


Harper and Row, N. Y. 1960

También podría gustarte