0% encontró este documento útil (0 votos)
51 vistas118 páginas

Relatividad General Dar Io N U Nez Juan

Cargado por

spartano4991
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
51 vistas118 páginas

Relatividad General Dar Io N U Nez Juan

Cargado por

spartano4991
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Relatividad General

Notas del curso de la Facultad de Ciencias, UNAM

Darı́o Núñez
Juan Carlos Degollado

The Publisher N D

1
Mantener viva la llama

2
Índice

1 Introducción 7

2 Relatividad especial 9

3 Diagramas de espacio-tiempo 17
3.1 Transformaciones de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.1 Composición de velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.2 Parámetro de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.1.3 Contracción de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.4 Tiempo propio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.5 Dilatación temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.1.6 Ejercicio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4 Dinámica relativista 31
4.1 Cuadrivelocidad, cuadrimomento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.1 La acción de una partı́cula libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.1.2 Conservación del cuadrimomento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.3 Efecto Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Espacio Curvo, tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5 Fı́sica en el espacio tiempo 57


5.1 Cuadrivecctor de flujo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.1.1 Geodésicas de nuevo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.1.2 Electromagnetismo en 4d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1.3 Hidrodinámica 4d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.1.4 Campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

6 Principio de equivalencia 67

7 Curvatura, Riemann 71

8 Ecuaciones de Einstein 79
8.1 Acción de Einstein Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

9 Soluciones a las ecuaciones de Einstein 87


9.1 Espacio-tiempo de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.1.1 Espacio-tiempo de Friedman - Lemaı̂tre . . . . . . . . . . . . . . . . . . . . . . . . 96

3
10 Movimiento en el espacio tiempo de Schwarzschild. 109

4
Prólogo

Estas notas han sido elaboradas para servir como base al curso de Relatividad que forma parte de
las materias obligatorias en la carrera de Fı́sica de la Facultad de Ciencias de la Universidad Nacional
Autónoma de México. Los autores las hemos escrito y refinado conforme hemos impartido el curso,
procurando discutir de la manera más intuitiva la generación de los conceptos requeridos para llegar a
postular la interacción entre la materia y el espacio.
Para seguir el curso, es requisito sentirse cómodo en cálculo de varias variables; tener claros los
conceptos de Fı́sica elemental: Mecánica, Electromagnetismo, Hidrodinámica. Ciertos conocimientos de
ecuaciones diferenciales, son una buena ayuda y ... ¡Listo! Ganas de querer aprender. Estos son los
ingredientes necesarios para poder seguir estas notas y entender los conceptos centrales que conducen a
la teorı́a de la relatividad general.
El curso inicia con una revisión de las tranformaciones galileanas y el ver que éstas, no dejan invari-
ante a la teorı́a electromagnética. Al buscar cuáles son las transformaciones que sı́ la dejan invariante,
se determinan las transformaciones de Lorentz y, con ellas, surge el concepto de espacio-tiempo y la
invariancia de la velocidad de la luz: esto es la relatividad especial. Se presentan varios casos donde
se muestran cómo varı́an entonces conceptos tan arraigados e intuitivos, como la simultaneidad de dos
eventos.
Al generalizar a las transformaciones de coordenadas, se introducen nuevos objetos geométicos car-
acterizados por su comportamiento bajo tranformaciones coordenadas en el espacio-tiempo, los tensores,
luego describimos sus propiedades y caracteı́sticas.
Estudiamos con detalle la manera de pasar de leyes conocidas de la Fı́sica a la descripción del equiv-
alente de dichas leyes, pero en el espacio-tiempo. Presentamos el movimiento de partı́culas libres; el
campo electromagnético, las leyes de la hidrodinámica, de un modo intuitivo, pero sin perder la solidez
matemática.
Dejamos para el final a la ley de la gravitación universal de Newton. Al estudiar su equivalente en el
cuadriespacio, vemos la necesidad de introducir un nuevo tensor, el de Riemann y, uniendo lo aprendido
sobre otras ramas de la Fı́sica, llegamos a la expresión de la ley de gravitación en el cuadriespacio, con una
sorpresa, ¡no hay fuerza gravitatoria, hay geometrı́a! Esta nueva relación son las ecuaciones de Einstein.
Presentamos un par de ejemplos de soluciones a las ecuaciones de Einstein, mostrando su derivación
y discutiendo las caracterı́sticas de dichas soluciones: la de hoyo negro y la del cosmos. Terminamos con
un estudio del movimiento de partı́culas en el espacio tiempo del hoyo negro.
Los autores consideramos que, de este modo, los lectores han quedado con las bases necesarias para,
en caso de que deseen, profundizar en los diferentes temas de la relatividad general y, para aquél, aquella,
que se piensa dedicar a otra área, esperamos que le habrán quedado claros los conceptos fundamentales de
una de las teorı́as más profundas que haya logrado la humanidad y que es un conocimiento que debe tener
todo profesional de la Fı́sica. Reiteramos, no es un conocimiento para especialistas y que sólo pueden
alcanzar cierto tipo de expertos; es una teorı́a con bases claras y conceptos perfectamente asequibles,
claro, con dedicación.

5
Hemos diseñado una serie de ejercicios antes de cada tema y, de hecho, hemos escrito las soluciones
en un apéndice, sugiriéndole al lector que intente dar su respuesta, antes de ver la nuestraRespecto a las
tareas, es nuestra experiencia que los conceptos se aprenden en base al trabajo contı́nuo y cotidiano. Por
ello sugerimos el intentar resolver los ejercicios antes de empezar el capı́tulo respectivo, avanzar un poco
y seguir resolviéndolos conforme avanza en el capı́tulo. Posteriomente, ver nuestra respuesta.
El curso de la Facultad de Ciencias dura 16 semanas aproximadamente y, trabajando tres horas a
la semana en el curso y por lo menos el mismo tiempo dedicado fuera del aula, se alcanza a cubrir el
material y lograr aquirir los conocimientos básicos de la Relatividad General.
Hemos añadido las fotografı́as de los personajes que intervinieron el el desarrollo de esta gran teorı́a,
aparte de que es agradable conocerlos, consideramos importante que se vea a esas personas como eso...,
¡personas!
Queremos mencionar nuestro reconocimiento al apoyo recibido por los proyectos PAPIIT IN115311 e
IN103514 durante el perodo de elaboración de estas notas.
Como libros complementarios a éstas notas, le recomendamos al lector unos clásicos: El libro de
Taylor-Wheeler, primera edición, [?] para la parte de relatividad especial, y el libro de Weinberg [?] para
la parte tensorial y de relatividad general. Se tiene también al clásico, el MTW [?] que nos parece muy
útil para consultar, una vez que se ha entendido el tema y se desea profundizar. Recomendamos también
al libro de Ligthman et al.[?], que contiene muchos problemas y sus soluciones.
Es nuestro deseo que disfrutes estas notas y te sean útiles
Instituto de Ciencias Nucleares Ciudad Univeristaria México 2013

6
Capı́tulo 1

Introducción

La Relatividad General describe una de las 4 interacciones fundamentales de la naturaleza, la gravitatoria.


Modifica radicalmente nuestra concepción de espacio y tiempo, desecha la idea de fuerza gravitacional,
ofreciendo en vez de ella el concepto de curvatura y postula una interdependencia entre la geometrı́a del
espacio-tiempo y la materia - energı́a presente en él. Es de gran belleza y aborda una amplia gama de
situaciones, describiendo con precisión a la dinámica del Universo en su conjunto, la Cosmologı́a, ası́ como
a fenómenos a escala del Sistema Solar. Es una teorı́a que describe consistentemente las observaciones
cosmológicas más finas, prediciendo la existencia de nuevos tipos de materia, la llamada materia obscura,
ası́ como de, posiblemente, una nueva constante en el Universo, la constante cosmológica, Λ. Describe
la formación y propiedades de los hoyos negros, inclusive el choque entre ellos; predice la existencia de
perturbaciones en el espacio-tiempo, las ondas gravitatorias. Describe inclusive a objetos posiblemente
hipotéticos como los hoyos de gusano.
Todos estos fenómenos y muchos más, están dentro de esta teorı́a y es la que se presenta y discute en
estas notas.
La relatividad especial surge de la idea de que la Fı́sica vista en un sistema de referencia, sea clara-
mente descrita en cualquier otro sistema de referencia inercial al primero, sin que ningún sistema sea más
importante que ningún otro. Esta democratización conduce a un nuevo concepto donde se puede manifes-
tar, el cuadriespacio. El querer estudiar estas relaciones en sistemas descritos en coordenadas curvilı́neas,
nos lleva a introducir objetos geométricos que tengan un comportamiento claro bajo cambios de sistemas
de referencia, los tensores. Al notar que las coordenadas curvilı́neas pueden, en sı́, estar describiendo
a un espacio curvo, se generaliza el concepto de movimiento libre en el cuadriespacio y, en general, se
aprende a reescribir a las leyes conocidas de la Fı́sica, en este cuadriespacio con expresiones tensoriales.
Al reescribir de este modo a la ley de fuerza gravitatoria de Newton, se llega a un nuevo paradigma, a
que en sı́, no hay fuerza gravitatoria, sino curvatura, la materia curva al espacio y la geometrı́a determina
al movimiento de la materia.

7
Ejercicios 1

1. Convertir las siguientes cantidades a sus equivalentes en unidades con c = G = 1 llamadas Unidades
naturales:

• La constante de Planck ~ = 1.05 × 10−34 J · s


• Momento de una partı́cula p = 3 × 104 Kg · m · s−1
• Presión atmosférica P = 1 × 105 N · m−2
• Densidad del agua ρ = 1 × 103 Kg · m−3

2. Convertir de unidades naturales a unidades del SI

• Velocidad v = 1 × 10−2
• Tiempo t = 1 × 1018 m
• Aceleración a = 10 m−1
• Presión P = 1 × 1019 kg · m−3

3. Cuando se considera que las interacciones fundamentales son descritas por la gravedad relativista
y la mecánica cuántica, se tiene que las constantes fundamentales de la naturaleza son la velocidad
de la luz, c, la constante de gravitación universal, G y la constante de Plank, ~. Combinando dichas
constantes, construye una cantidad con unidades de tiempo, de masa y de distancia.

4. Demostrar que las ecuaciones de Maxwell para los campos magnéticos y eléctricos no son invariantes
ante trasformaciones de Galileo.

5. La vida media de un mesón π + es de τ̄ = 10−6 segundos. Si las partı́culas cósmicas los producen al
chocar con los elementos de la atmósfera a una altura de 60 km. Dado que la velocidad promedio
con la que viajan es muy cercana a la velocidad de la luz, calcula el tiempo que les toma llegar a la
superficie de la Tierra, compáralo con su vida media y, con estos resultados, explica ¿Cómo es que
se detectan en Tierra?

8
Capı́tulo 2

Relatividad especial

Uno de los conceptos más importantes, tanto por su utilidad como por su profundidad, es el de ”¿Respecto
a qué se mide (describe) un fenómeno fı́sico?”. En el léxico de la Fı́sica, a este algo respecto al cual se
mide se le llama Marco o Sistema de Referencia. Es por esta pregunta que surge la relatividad especial,
que a su vez dará paso a la relatividad general, la cual en cuántica ha generado no pocos dolores de cabeza.
Como todo concepto profundo, no es trivial dar su definición, como tiempo, espacio, vida. Pero podemos
decir algo ası́: Un sistema de referencia es inercial en una cierta región del espacio y del tiempo cuando,
en dicha región espacio-temporal y dentro de cierta exactitud, cualquier partı́cula prueba no experimenta
ningún tipo de aceleración.
Vemos entonces que este concepto es una idealización, una entelequia, no en un sentido peyorativo,
sino en un sentido aristotélico de ser un objeto perfecto, del mundo de las ideas de Platón, pues nos
habla de cosas ideales como la partı́cula prueba, que es un objeto que no modifica al espacio-tiempo, sólo
lo siente, lo mide, el sistema inercial depende del tamaño de la región y de la exactitud que tengan los
instrumentos que se utilicen para realizar las mediciones. Puede parecer alarmante que la definición de
un concepto medular sea ası́, sin embargo, debe entenderse como una idealización no tan alejada de lo que
pasa en la realidad. Pensemos en una superficie arbitraria. Ahora bien, imaginemos que en cada punto
de dicha superficie, salvo algunos puntos patológicos, podemos pegar un plano tangente. Sı́ además es
cierto que la zona de la superficie en una vecindad de dicho punto será parecida a la zona correspondiente
en el plano tangente, entonces la Tierra me la puedo imaginar plana en una región alrededor mı́o y, no
sólo imaginarla sino utilizar una fı́sica en esta Tierra plana, que funciona, describe correctamente, hasta
cierta aproximación, los fenómenos que suceden en ella.
En fin, una vez que se definen sistemas inerciales, es decir, el lugar donde se modelan los fenómenos,
uno se puede preguntar, qué pasa cuando se tienen dos sistemas inerciales, dos observadores inerciales
estudiando el mismo fenómeno. Esto lo hemos visto desde mecánica clásica, donde lo que ve una persona
se puede traducir a lo que ve otra persona que se mueve con velocidad constante respecto a la primera.
Sabemos que un movimiento de caida libre para la primera persona se traduce en un tiro parabólico para
la segunda, via las transformaciones galileanas:
x~′ = ~x + v~rel t, (2.1)
con v~rel la velocidad relativa entre los dos observadores. Entonces, derivando (2.1), la velocidad que mide
cada observador es
v~′ = ~v + v~rel , (2.2)
al volver a derivar obtenemos que la aceleración que mide cada uno de ellos es igual,
a~′ = ~a, (2.3)

9
por lo que la fuerza que calcula cada observador es la misma, es decir, ambos ven la misma segunda ley
de Newton. Otra manera de decirlo es que las leyes de Newton son invariantes bajo transformaciones
galileanas.
Como dichas leyes son la base para la fı́sica newtoniana, vemos que ella es invariante bajo transforma-
ciones galileanas. Ası́, se tiene que lo que se concluya en un sistema de referencia inercial, es independiente
de su estado de movimiento respecto a otros sistemas inerciales. Las fuerzas medidas en tal sistema son
las mismas que se medirán en cualquier otro sistema inercial. Hasta este punto esta descripción es con-
sistente, hasta que se postulan las leyes de Maxwell para el electromagnetismo, las ecs. de Maxwell no
son invariantes bajo transformaciones galileanas.

Figura 2.1: James Clerck Maxwell, 1831 - 1879.

En efecto, las ecuaciones de Maxwell

~ ·E
~ = ρQ ~− 1 ~ ~ = 4 π j~Q ,
∇ ǫ0 , ǫ0 ∂t E µ0 ∇ ×B
~ ·B
∇ ~ = 0, 1 ~ + ǫ0 ∇
~ ×E
~ = 0,
µ0 ∂ t B

bajo una transformación galileana, es decir, desde otro sistema de referencia, cambian su forma. Lo cual
sı́ es preocupante, pues implica que la ecuaciones tienen esta forma sólo para un sistema de referencia,
¿cuál? y, al pasar a otro, ¿cambia entonces la fı́sica dependiendo de quién la vea? Esto claramente no
suena bien y la comunidad interesada sı́ se preocupaba.
Por un lado, se postulaba el ether, no sólo como el medio en el cual se propagaban las ondas de luz,
sino donde las leyes de Maxwell eran válidas y, por otro lado, se daba una intensa búsqueda teórica de
soluciones alternativas.
Se trataba de entender la idea central de las leyes de la Fı́sica desde los distintos sistemas de ref-
erencia. Trabajaban inténsamente varios cientı́ficos, destacando Hendrik Antoon Lorentz, un cientı́fico
holandés nacido en Arnhem, Holanda y muerto también en Holanda en 1928. Era un cientı́fico de amplio
espectro. Buscó y encontró unas transformaciones entre sistemas de referencia que dejaran invariante
a los fenómenos eléctricos y ópticos. Estaba muy consciente de la importancia fı́sica de este resultado.
Manteniendo una amplia comunicación con Henri Poincaré.
Henri Poincaré era un gran cientı́fico francés, nacido en las vecindades de la ciudad ducal de Nancy, en
el departamento de Meurthe-et-Moselle, en Francia, en 1854, muere en 1912 en Paris. Fue un cientı́fico
muy prolijo, tanto en fı́sica como en matemáticas y trabajó muy activamente sobre el problema de
las transformaciones de coordenadas. Como mencionamos, mantenı́a un estrecho contacto con Lorentz,
enfatizando el sentido fı́sico de sus trabajos. Ya en 1898 trabajaba con la idea de que la constancia de
la velocidad de la luz debı́a tomarse como un postulado [?] y, conocı́a las transformaciones de Lorentz

10
Figura 2.2: Hendrik Antoon Lorentz, 1853 - 1928.

[?]. Poincaré es el que le da nombre a muchos de los conceptos actuales, empezando por llamar teorı́a
de la relatividad a este nuevo conjunto de conceptos, ası́ como a las transformaciones entre sistemas de
referencia propuesta por Lorentz, él es el que las llama transformaciones de Lorentz.

Figura 2.3: Henri Poincaré, 1854 - 1912.

Pero es Albert Einstein, un joven estudiante suizo, nacido en Ulm, Alemania en 1879, y muerto en
1955 en Princeton, Estados Unidos, el que se decide a dar a la luz a esta nueva teorı́a en 1905. De
hecho, este 1905 fué un año fantástico para y Einstein, y para el desarrollo cientı́fico, pues publicó cinco
trabajos, dos de los cuales son la base para el desarrollo de la fı́sica moderna. En lo que se refiere su
trabajo sobre las transformaciones y la invarianza, en [?] enuncia el principio de relatividad, que tiene
dos postulados:

1. Todos los sistemas inerciales son equivalentes.

2. La velocidad de la luz es la misma en todos los sistemas inerciales.

De este modo, nace una teorı́a que va a ir mucho más allá de sus metas originales: por supuesto que
deja covariantes a las ecuaciones de Maxwell; al tema del eter, no es que lo resuelva, sino que simplemente
lo vuelve innecesario. Pero más allá de esto, nos habla de una nueva manera de concebir al mundo, por
ahora quitándole el carácter absoluto a las distancias entre dos sucesos y al tiempo transcurrido entre

11
Figura 2.4: Albert Einstein, 1879 - 1955, premio Nóbel de Fı́sica 1921

ellos. De aquı́ surgirá la relación entre masa y energı́a, ası́ como un gran número de fenómenos no
intuitivos a la manera newtoniana de ver al mundo.
Es nuestra opinón que la teorı́a de la relatividad especial, ya estaba por ser descubierta. La comunidad
cientı́fica rondaba cerca de ella. El que la haya propuesto una persona en especı́fico es algo irrelevante,
en cuanto a que si no lo hacı́a uno, lo hubiera hecho otro. Sin restar el mérito e ingenio de Albert
Einstein, Lorentz y Poincaré, por mencionar a los más cercanos, estaban también ahı́ y jugaron un papel
importante. Mencionamos este punto pues los autores estamos convencidos, en base a nuestra experiencia
académica que la ciencia avanza como resultado de un esfuerzo colectivo. La fı́sica no es el trabajo de un
solo hombre o mujer.
Vamos a ver que las transformaciones galileanas se generalizan, para cumplir con el principio de
relatividad, a las transformaciones de Lorentz y que si bien el tiempo y el espacio pierden su caracter
invariante, lo que va a ser invariante es un “mezcla” de los dos, una combinación que es el espacio-
tiempo.
En términos mitológicos, para los griegos serı́a el hijo de Cronos, dios del tiempo y tal vez de la musa
Urania. Interesante que las culturas mesoamericanas tenı́an ya un dios de la dualidad, los aztecas lo

Figura 2.5: Cronos y Urania.

conocan como Ometéotl, el que se inventa a s mismo, Moyocoyani. Es un concepto aún polémico en
nuestra cultura, pero su existencia la sostienen cientı́ficos como León Portilla, Caso y Lopez Austin [?].

12
En lo que atañe a nosotros, hay evidencia de que los mesoamericanos tenı́an este concepto de una entidad
que se manifiesta de diferentes formas, pero que es una sola; concepto que, junto a mucha cosas, fue
perdido durante la invación y ocupación española y que ahora se retoma.

Figura 2.6: Quetzalcóatl (su nombre es ya una unión de opuestos), dios del viento, númen creador, señor
de la vida. Con Mictlantecuhtli, dios de la muerte, formando una unidad, posiblemente representando a
Ometéotl. Lámina 73 del códice Borgia.

La idea de unir al tiempo y al espacio, utiliza la noción de invariancia de la velocidad de la luz, al


ser una constante fundamental de la naturaleza podemos medir al tiempo en centı́metros considerando
t = c x, con c la velocidad de la luz.
Ası́, para combinar el tiempo y al espacio podemos sumar, intervalos de tiempo, c2 d t2 con distancias
dl = dx2 + dy 2 + dz 2 . Como veremos más adelante ası́ se forma el concepto fructı́fero de elemento de
2

lı́nea, ds2 , en el espacio-tiempo (en coordenadas cartesianas):

ds2 = −dt2 + dx2 + dy 2 + dz 2 . (2.4)

La cuestión de los signos es convención, igualmente podrı́amos considerar ds2 = dt2 − dx2 − dy 2 − dz 2 ,
sin olvidar que una vez que se elige una convención hay que seguirla, no podemos cambiarla a mitad del
camino. Regresando al elemento de lnea, Minkowski dijo al respecto ... Por ello, el espacio por sı́ mismo
y el tiempo por sı́ mismo, quedan condenados a desaparecer como meras sombras. Sólo una especie de
unión de los dos mantendrá una realidad independiente. [?]. Hermann Minkowski, nacido en Aleksota,
reino de Polonia, en 1864 y muerto en Götingen, Imperio Alemán, en 1909, fue maestro de Albert Einstein
y es el que plantea la descripción geométrica de la teorı́a de la Relatividad Especial como una teorı́a en
el espacio-tiempo cuatridimensional como la conocemos ahora [?].
Ahora introducimos la notación de ı́ndices que usaremos durante el curso. El elemento de lı́nea,
Ec. (2.4), lo reescribiremos como:
ds2 = ηµν dxµ dxν . (2.5)
Los ı́ndices griegos van de 0 a 3, 0 es la coordenada temporal, (mientras que los ı́ndices latinos van de
1 a 3 y estan asociados a las coordenadas espaciales). Hemos definido también a la métrica o tensor de
Minkowski ηµν cuyas componentes en coordenadas cartesianas son,

−1 0 0 0
 
0 1 0 0
ηµν =
0 0

1 0
0 0 0 1

13
Figura 2.7: Hermann Minkowski, 1864 - 1909. El tiempo pierde su caracter absoluto.

y la diferencial dxµ = (c dt, dx, dy, dz) ası́ como la convención de suma de Einstein que nos dice que
ı́ndices repetidos arriba y abajo se suman. En efecto, partiendo del elemento de lı́nea dado en la ec. (2.5),
sumamos primero sobre el ı́ndice µ, de cero a cuatro y despueés sobre el ı́ndice ν, quedándonos una suma
con 16 términos que, al usar la forma del tensor de Minkowski y de la diferencial, se recupera la expresión
ec. (2.4).
Es esta unión, esta nueva distancia ds2 la que será invariante bajo transformaciones de Lorentz y, en
general, bajo transformaciones de coordenadas.

14
Ejercicios 2

1. Sobre las curiosidades de la luz. El principio de la Relatividad Especial nos indica que la luz viaja
a la misma velocidad en todos los sistemas de referencia. Las implicaciones de esto son enormes.
Considera las siguientes preguntas:

• Un observador moviéndose, con respecto a otro observador en reposo, a 0.9 c y sosteniendo un


espejo frente a él, ¿Cómo ve su imagen?
• Si para un observador ha transcurrido un tiempo ∆ t, ¿Cuánto tiempo ha transcurrido para
un fotón en su sistema de referencia?

2. Un observador nota que el reloj de otro observador moviéndose relativo a él, funciona lento debido
al movimiento relativo, ¿Verá, a su vez, el segundo observador que el reloj del primero también
funciona lento? o ¿verá que funciona rápido?

3. ¿Significa la dilatación del tiempo que el tiempo en realidad pasa más lentamente en sistemas en
movimiento relativo? ó ¿sólo parece que pasa más lento?

4. Dos eventos ocurren en el mismo lugar en el sistema de referencia del laboratorio y están separados
por un intervalo de tiempo de 3 segundos.

• ¿ Cuál es la distancia espacial entre éstos dos eventos en un sistema de referencia de un cohete
en el que los eventos están separados 5 segundos?
• ¿Cuál es la velocidad relativa vrel entre el cohete y el laboratorio?

5. Efecto de enfoque. Un haz de luz se emite formando un ángulo φ′ con respecto al eje x′ del
sistema de referencia del cohete. Muestra que el ángulo que tiene la dirección de este haz con
respecto al eje x del sistema de referencia del laboratorio está dado por la ecuación:

cos φ′ + β
cos φ = , (2.6)
1 + β cos φ′

con β = vrel
c . Ahora considera que se emite la luz se emite uniformemente en todas direcciones.
Considera que el 50% de esta luz se va en la dirección hacia adelante en el sistema del cohete y que
el cohete se mueve muy rápido. Muestra que en le sistema de laboratorio esta luz se concentra en
un cono delgado hacia adelante cuyo eje coincide con la dirección de movimiento del cohete.

6. El eje temporal de un observador O’, son los puntos que satisfacen x′ = 0 y su lı́nea de mundo se ve
en el diagrama de espacio tiempo de O como una recta que hace un ángulo α con el eje t, además,
está relacionado con la velocidad relativa v como: tanα = v. Mostrar que el ángulo que hace el eje
x′ con el eje x es también α.

15
16
Capı́tulo 3

Diagramas de espacio-tiempo

Para ayudarnos a entender este nuevo concepto de espacio-tiempo, como siempre, ayuda tener una rep-
resentacion gráfica. En particular, aquellas que contienen información útil.
Los vectores en el espacio tiempo de Minkowski estan dados por sus componentes con respecto a un
sistema coordenado y se denotan por xµ . A los puntos del espacio tiempo de Minkowski los llamamos
eventos. Las coordenadas de un evento (c t, x, y, z), algunas veces se escribirán genéricamente como
(x0 , x1 , x2 , x3 ) o xα . Como mencionamos, utilizaremos que los ı́ndices griegos toman valores de 0 a 3 y
que los ı́ndices latinos toman valores de 1 a 3. La curva que describe un cuerpo A al moverse en este
diagrama, se le conoce como lı́nea mundo.
Veamos inicialmente cómo se relacionan los diagramas de espacio tiempo de dos observadores moviéndose
a velocidad ~v , constante, uno respecto del otro, es decir, dos observadores inerciales. Por simplicidad (e
incapacidad de hacer dibujos en 4 dimensiones) tomamos un espacio tiempo de 2 dimensiones, la tempo-
ral y una espacial, que llamamos x. Consideramos que el observador O utiliza coordenadas (c t, x) y el
observador O’, que se mueve en con velocidad v relativa a O, utiliza coordenadas (c t′ , x′ ). Supongamos
también que el origen de coordenadas es el mismo para ambos inicialmente.
Considerando que uno de los postulados principales de la relatividad especial es el que la velocidad de
la luz es un invariante para los sistemas coordenados, sacrificaremos la idea de dibujar ambos sistemas
de referencia con ejes coordenados perpendiculares. Primero dejemos al sistema O con sus ejes perpen-
diculares, dado que la velocidad de un cuerpo es la pendiente de la recta, en nuestras coordenadas, con
c t y x, una recta con pendiente uno, es decir, a 45 grados, implicará una velocidad de c, es decir, la de
luz. Esto es importante, en los diagramas espacio-tiempo las rectas a 45 grados representan
puntos moviéndose a la velocidad de la luz. Un detalle. Es costumbre en relatividad especial, hacer
estos diagramas poniendo al eje temporal en las ordenadas, a diferencia de como se usa ponerlo en otras
disciplinas, como en mecánica. Esta es otra convención y es usual en relatividad, por lo que la respetamos
en este texto. De este modo, un cuerpo moviéndose a velocidad vx será descrito en estos diagramas con
una recta con pendiente m = c/vx .
Entonces, para dibujar al sistema O’ junto con el O, consideramos que los orı́genes coinciden inicial-
mente. El origen de O’, que será el conjunto de puntos que satisfacen, en O’, que x′ = 0, se moverá,
desde el punto de vista de O, como una recta con pendiente m = c/v, dado que consideramos que v < c,
esta recta estará dentro del cono determinado por la recta a 45 grados y el eje c t. De este modo, el eje
c t′ , visto desde O, queda descrito por la rect c t = (c/v) x y son los puntos que satisfacen, en O’, que
x′ = 0. Dibujamos entonces una recta ası́ y, para dibujar al eje x′ , que corresponde a todos los puntos
que en O’ están en el instante c t′ = 0, recordamos que este observador O’ también ve a la velocidad
de la luz como la recta con pendiente 1. Por ello, dejando la idea de perpendicularidad en el diagrama,

17
dibujamos a la recta complemento de la que representa al eje c t′ tal que la velocidad de la luz también
bisecte a las rectas c t′ y x′ , es decir, el eje x′ es, para el eje x, el equivalente de lo que es el eje c t′ para
el eje c t. Ver figura (3.2).
Ası́ tenemos a los dos sistemas de observadores, O y O’ en relatividad especial, con ambos describiendo
a la velocidad de la luz con la misma magnitud, c. Como vimos, el eje x′ son todos los momentos que O’
mide simultáneamente.
Para obtener una ecuación para el eje x′ visto desde O, equivalente a la que obtuvimos para el eje c t′ ,
usamos el siguiente razonamiento. Ya vimos que la pendiente del eje c t′ , visto como recta en O es c/vx ,
es decir, tan α = c/vx , con α el ángulo que hace el eje c t′ con la horizontal, con el eje x, entonces, el eje
c t′ hace un ángulo αc con el eje vertical, c t, donde αc es el ángulo complementario de α. Ahora, como
el eje de luz bisecta tanto al sistema de ejes c t − x, como al sistema c t′ − x′ , sea γ el ángulo que hace el
eje c t′ con el eje de luz, entonces, hay un ángulo γ entre el eje de luz y el eje x′ , por lo que, α + γ debe
ser igual a γ + σ, donde σ es el eje que hace el eje x′ con la horizontal, el eje x. Por lo tanto, σ = α, por
lo que la pendiente del eje x′ visto desde O es m1 = tan α = 1/ tan αc = vx /c. Con lo que conlcuimos
que el eje x′ visto desde O está descrito por la ecuación c t = vx /c x, que son el conjunto de puntos, en
O’ que satisfacen c t′ = 0.
Otra manera de convencernos de que el eje que dibujamos para que la velocidad de la luz bisecte al
sistema (c t′ , x′ ), podemos marcar estos eventos en el diagrama de espacio tiempo de la siguiente manera.
Para cualquier sistema, O o O’, supongamos que a c t′ = −a se manda un rayo de luz. Este rayo tendrá
como ecuación, visto en O, de c t = −x + a (cos α − senα). El rayo llegará al punto x = a en c t′ = 0. Si
el rayo es reflejado para llegar al eje temporal, llegará en c t′ = a.
Si ahora dibujamos la trayectoria desde O y marcamos el rayo desde que sale en t′ = −a y un rayo que
entra en t′ = a, con ecuaci’on c t = −x + a (cos α + senα) el punto de intersección es el punto, visto desde
O, I = a (senα, cos α)y, visto desde O’ es x′ = a.

Figura 3.1: Diagrama espacio-tiempo de dos sistemas de referencia inerciales uno respecto del otro, para
los cuales la velocidad de la luz, lı́nea a trazos, tiene la misma magnitud en ambos, es decir, satisface el
principio de relatividad especial. Nótese cómo la luz bisecta a ambos sistemas de referencia.

18
Tenemos entonces, dos puntos que definirán al eje x′ , visto desde O, el origen e I, x′ = 0 y x′ = a
y ası́ podemos trazar la recta y ver que, en efecto es el eje que dibujamos. Podemos mostrar entonces
que este eje de x′ visto desde O tiene como ecuación c t = (a cos α)/(asenα) = (1/ tan α) x/c = (v/c) x y
corresponde a los puntos con t′ = 0.
La recta que describe a la luz forma un abanico hacia arriba y hacia abajo, con origen en O. Si
dibujamos otro eje espacial, los argumentos se pueden repetir y nuestro abanico se convierte en un cono.
Este cono se conoce como el cono de luz y va a ser una frontera muy importante para la fı́sica, como
discutiremos más adelante. Todos las curvas que desde el origen están dentro del cono de luz, corresponden
a eventos moviéndose a velocidades menores a la de la luz, se les llama eventos tipo tiempo y, para el
elemento de lı́nea Ec. (2.4), tenemos que d s2 < 0. Todos los eventos sobre el cono de luz, se conocen,
claro, como eventos tipo luz y su elemento de lı́nea correspondiente es d s2 = 0. Los eventos que son
curvas del origen bajo el cono corresponden a cuerpos moviéndose a velocidades mayores a la de la luz,
se les llama eventos tipo espacio y el elemento de lı́nea para ellos es d s2 > 1.
Vemos entonces que, en el espacio tiempo, las distancias no tienen por qué ser positivas definidas,
como en la geometrı́a euclideana. Este tipo de geometrı́as se les llama geometrı́a lorentziana o pseudo-
riemanniana. Las distancias entre dos eventos pueden ser cero sin que eso implique que son el mismo
evento, de hecho, como vimos, son todos los puntos sobre el cono de luz.

Hipérbola invariante
Una vez que se conoce como estan relacionados ambos marcos de referencia es necesario calibrarlos uno
con respecto a otro, para ello consideremos la ecuación

− c2 t2 + x2 = −a2 , (3.1)

cuya gráfica, en el plano t − x, es una hipérbola, esta hipérbola pasa sobre todos los eventos cuyo intervalo
al origen es a, pero debido a la invarianza del intervalo, estos eventos también estan sobre la curva

− c2 t′2 + x′2 = −a2 , (3.2)

Para fijar ideas, tomemos a = 1, luego entonces, un evento A sobre el eje c t tiene x = 0 asi que c t = 1 de
igual manera, el evento B, que pertenece a la hipérbola tal que x′ = 0 tiene c t′ = 1, con este procedimiento
podemos calibrar el eje c t′ . Para calibrar el eje x′ utilizamos el mismo procedimiento pero utilizando la
familia de hipérbolas
− c2 t′2 + x′2 = b2 , (3.3)
c t = 0, x = b para un evento C, y el evento D, c t′ = 0 satisface x′ = b

Simultaneidad
En la figura (3.2) se muestran los diagramas de espacio-tiempo de dos observadores inerciales O y O’ en
movimiento relativo. En la figura estan marcados dos eventos, A y B. Para encontrar el instante en que
ocurren los eventos para O se deben proyectar los puntos A y B sobre el eje c t en forma paralela al eje
x. Para los sucesos mostrados en la figura, se encuentra que ambos sucesos ocurren en el mismo instante
para O. De la misma manera para encontrar el instante en que ocurren los eventos para O’ se deben
proyectar los eventos sobre el eje c t′ paralelamente al eje x′ , para los sucesos en la figura se encuentra
que los eventos no ocurren de manera simultánea para O’, el evento B. ocurre antes que el evento A. Ası́
hemos mostrado que el concepto de simultaneidad no es absoluto como ocurre en la mecánica newtoniana
sino que depende del observador.
Es importante recalcar que los tiempos c tA B y c t′A y c t′B , son los instantes en que, para un tiempo

19
universal del sistema, ocurren los sucesos para los dos observadores; no son los tiempos en que los obser-
vadores ven los sucesos. Es posible encontrar los tiempos en los que los observadores ven los eventos.

Supongamos que los dos eventos consisten en destellos de luz que son emitidos en dirección de los
observadores situados en x = 0. En la figura (3.3) se han graficado los mismos sucesos A y B con los
rayos de luz que son emitidos en direción de los observadores, los instantes que los observadores ven, la
luz emanada de A y B, se denotan por c tv A , c tv B , c t′v A ,c t′v B respectivamente. A pesar de que los
dos sucesos ocurren simultáneamente para O, él registra el suceso A antes que el B, esto se debe a que el
suceso A ocurre mas cerca de O.

También el observador O’ registra el evento A antes que el evento B, la explicacion es la misma que
el caso anterior, el evento A ocurre mas cerca de O’ que el evento B.

Figura 3.2: Aunque dos eventos sean simultaneos en un sistema de referencia pueden no serlo para otro
sistema.

Causalidad
Para que dos eventos estén causalmente conectados algo debe propagarse desde el evento causa al evento
efecto, en la figura (3.4) se muestra el diagrama de espacio-tiempo para dos observadores inerciales y dos
eventos A y B ¿Pueden estos dos eventos estar causalmente conectados? es decir ¿podrı́a ser A el efecto
de B o viceversa? la respuesta es no como se concluye de la figura, para O el evento A ocurre antes que
el evento B, mientras que para O’ el evento A ocurre después que el evento B. Si por ejemplo, A fuese el
evento de un jugador lanzando una pelota y B el evento de otro jugador recibiendo la pelota, para O no
habrı́a problemas de interpretación, se habrı́a atrapado la pelota antes de haber sido lanzada. Pero, para
O’, ¡primero se atrapa la pelota y después es lanzada! Los eventos A y B de la figura no pueden estar
por tanto, causalmente conectados.
Como veremos más adelante, esto se relaciona con el hecho de que ninguún cuerpo masivo puede viajar
a la velocidad de la luz, su velocidad siempre es menor. Los cuerpos no masivos viajan a la velocidad
de la luz. Ası́ mismo, el carácter tipo espacio, luz o tiempo de un par de eventos se mantiene para todo

20
Figura 3.3: Es posible registrar como los observadores ven los eventos.

Figura 3.4: Los eventos A y B no pueden estar causalmente conectados. Para el observador O el evento
A ocurre primero que B. Sin embargo para el observador O’ Es el evento B el que ocurre primero.

21
sistema de referencia inercial, por lo que, si es tipo tiempo desde un sistema de referencia, lo será en
cualquier otro sistema de referencia inercial. Por ello, los eventos fuera del cono de luz están causalmente
desconectados, para todo sistema de referencia. Entonces, nada puede viajar a velocidades mayores a las
de la luz. Si algo lo hiciera, vioları́a causalidad.

3.1 Transformaciones de Lorentz


Las transformaciones de Lorentz son cambios de coordenadas que expresan las coordenadas de O’ en
términos de las de O. Si orientamos los ejes de tal modo que O’ se mueva con velocidad v sobre el eje
positivo de O la transformación lineal más general es de la forma:

c t′ = k0 c t + k1 x, (3.4)

x′ = k2 c t + k3 x, (3.5)
y′ = y (3.6)

z =z (3.7)
con kµ constantes por determinar. Sabemos además que el eje x′ tiene como ecuación en O, c t = (v/c) x
y el eje c t′ : c t = (c/v) x y sustituyendo en (3.4) y (3.5)
 v 
k0 + k1 x = 0, (3.8)
c
 c 
k2 + k3 x = 0, (3.9)
v
lo que implica que v/c = − kk32 = − kk01 , por lo que podemos escribir las transformaciones lineales como:
v
c t′ = k0 (c t − x), (3.10)
c
v
x′ = k3 (x − c t). (3.11)
c
Ahora, usamos que la velocidad de la luz tiene la misma magnitud para los dos observadores, es decir,

x
ct = cxt′ = 1, por lo que, al dividir ec. (3.10) entre ec. (3.11), obtenemos que k0 = k3 .
Finalmente, otra información de la que disponemos, de hecho, que imponemos, es la invarianza del
intervalo. Si sustituimos la forma diferencial de las transformaciones (3.10) y (3.11) en ds′2 obtenemos:
  v 2  v 2 
ds′2 = −c2 dt′2 + dx′2 = k0 2 −c2 dt2 + 2 v dt dx − dx2 + dx2 − 2 v dt dx + c2 dt2 ,
c c
2
v
= k0 2 (1 − 2 ) −c2 dt2 + dx2 ,

c
al imponer que esta expresión sea igual a ds2 , obtenemos que el coeficiente k0 debe tener la forma:
1
k0 = ± q , (3.12)
v2
1− c2

que nos conducen finalmente a la forma que deben tener las transformaciones entre sistemas de referencia
para, tanto tener la misma magnitud de la velocidad de la luz en ambos sistemas, como para dejar invari-
ante al elemento de lı́nea, son las llamadas transformaciones de Lorentz para dos sistemas de referencia
O, O’, con O’ moviéndose a velocidad v en la dirección x:
1  v 
c t′ = q ct − x , (3.13)
2
1 − vc2 c

22
1  v 
x′ = q x− ct , (3.14)
1− v2 c
c2

y′ = y,

z = z.

3.1.1 Composición de velocidades


Veamos ahora esta idea de que la velocidad de la luz es la misma para los diferentes sistemas, relacionados
por medio de una transformación de Lorentz. Para ello, veamos la manera en la que se suman velocidades.
Consideremos una partı́cula que se mueve a velocidad w en la dirección x medida por observadores en
dx′
O, es decir w = dx ′
dt , vista desde O. En O’ su velocidad será w = dt′ , que, desde la perspectiva galileana,
serı́a la suma de w, la velocidad que tiene la partćula vista desde O, menos la velocidad con la que O’ ve
a O moverse, v. Utilizando las transformaciones de Lorentz (3.13) y (3.14), tenemos que

w′ dx′
=
c c dt′ q
v v2
(dx − c dt)/ 1 −
c c2
= q ,
v2
(c dt − vc dx)/ 1 − c2
dx
c dt − vc
= v dx
,
1− c c dt

con lo que finalmente obtenemos


w
w′ −v
= c v cw . (3.15)
c 1− c c
Esta relación se conoce como la ley de composición de velocidades de Einstein. Como era de esperarse, no
es la composición de velocidades galileana, ec.(2.2), sino que es algo más complicado, pero que, cuando
las velocidades son pequñas respecto a la de la luz, se debe reducir al caso galileano. Recordemos, al
decir que algo es chico, es importante aclarar respecto a qué. En la ecuación anterior podemos ver el caso
en el que v y w son pequeñas respecto a la velocidad de la luz, por lo que v/c << 1 y w/c << 1, con lo
que, v w /c2 << 1 con mayor razón, por lo que podemos considerar al denominador igual a uno y, aquı́
v, w y w′ son del orden, no se desprecia nada, pero, multiplicando por c, recuperamos la composici´’on
galileana, para la suma de velocidades entre dos observadores, con velocidad relativa −v.
Es interesante el caso en el que lo que se mueve sea un rayo de luz. Para O se tiene que w = c, que,
en las ecuación que derivamos, ec. (3.15) implica
v
w′ 1− c
= v . (3.16)
c 1− c

es decir, w′ = c también. Si un cuerpo se mueve a la velocidad de la luz en un sistema, se mover a la


velocidad de la luz en otro inercial a él.
Vemos de este modo que se satisface uno de los postulados de la relatividad especial, que la luz se
mueve a la misma velocidad en todos los sistemas de referencia inerciales.
Al revés, si por otra parte se tiene w′ = c por lo cual w/c − v/c = 1 − vw/c2 y
v w w v
1− + − = 0,
 c v c  c w 
c
1− 1− = 0,
c c

23
que implica que ⇒ w = c el cuerpo se mueve a la velocidad de la luz en O, (o que la velocidad relativa entre
los sistemas es la de la luz, pero esto podrı́a traer complicaciones, lo dejamos con la primera conclusión).

3.1.2 Parámetro de velocidad


En geometrı́a euclı́dea, el cambio de coordenadas corespondiente a una rotación en el plano alrededor de
un eje, deja invariantes las distancias medidas entre dos puntos, en dos dimensiones, una rotación de los
ejes coordenados x − y está dada por transformaciones de tipo:

x′ = x cosφ + y sinφ
y ′ = −x sinφ + y cosφ

que dejan invariante el elemento de lı́nea: dx2 + dy 2 = dx′2 + dy ′2 .


Para el espacio de Minkowski las transformaciones que dejan invariante el elemento de lı́nea son las de
Lorentz que estudiamos en secciones anteriores, vamos a ver que existe una analogı́a que hace que las
transformaciones de Lorentz se vean como rotaciones en ese espacio, para ello consideremos las transfor-
maciones siguientes y estudiemos su relación con las de Lorentz:

x′ = x coshθ + t sinhθ (3.17)

c t′ = −x sinhθ + c t coshθ (3.18)


que es fácil mostrar que satisfacen dx2 − c2 dt2 = dx′2 − c2 dt′2 .
θ tiene una interpretación muy sencilla, el origen de O’ tiene x′ = 0 que implica en (3.17) que
x
= tanhθ, (3.19)
ct
x
pero desde el punto de vista de O, el cociente ct es precisamente la velocidad v/c del sistema O’ entonces
v
= tanhθ, (3.20)
c
y se desprende que:
v
c
sinhθ = q , (3.21)
v2
1− c2
y
v
coshθ = q c , (3.22)
v2
1− c2

y sustituyendo en (3.17) y (3.18) se llega a las transformaciones de Lorentz (3.13) y (3.14). Consideremos
la composición de velocidades estudiada en la sección anterior con un ejemplo sencillo: una partı́cula con
parámetro de velocidad θ1 relativa al sistema O’ que se mueve con velocidad v (y parámetro de velocidad
θ2 ) con respecto al sistema de laboratorio O entonces el parámetro de velocidad medido por O es

θ = θ1 + θ2 , (3.23)

ya que

tanhθ = tanh(θ1 + θ2 ),
tanhθ1 + tanhθ2
= .
1 + tanhθ1 tanhθ2

24
Que es la composición de velocidades de Einstein, por éste motivo el parámetro de velocidad θ es la
manera mas natural de medir velocidades asi como un ángulo es la manera natural de medir inclinación
(y no las pendientes!).
El parecido entre la forma funcional de rotaciones y transformaciones de Lorentz no es una coincidencia,
de hecho, una transformación de Lorentz general se define como una tranformacion lineal y homogénea de
coordenadas de xµ a x′µ tal que preserva el intervalo entre xµ y el origen dado por x2 = ηµν xν xν = x2 −t2 .
Esto significa que la matriz Λµν debe satisfacer

ηµν Λµρ Λνσ = ηρσ . (3.24)

Este conjunto de transformaciones incluyen las rotaciones espaciales ordinarias. Para hacerlo evidente
hay que tomar Λ00 = 1, Λ0i = 0 y Λij = Rji donde R es una matriz de rotación ortogonal.
El conjunto de transformaciones de Lorentz forma un grupo: el producto de cualquiera dos transforma-
ciones de Lorentz es otra transformacion de Lorentz, el producto es asociativo, hay una matriz identidad
Λµν = δνµ y cualquier transformacion de Lorentz tiene inversa. Para encontrar la inversa escribimos (3.24)
como Λνρ Λνσ y subimos el ı́ndice ρ en ambos lados para obtener Λρν Λνσ = δσρ por lo tanto

(Λ−1 )ρν = Λρν . (3.25)

3.1.3 Contracción de Lorentz


Medir la longitud de una barra por ejemplo, es medir la distancia entre sus dos extremos en el mismo
instante de tiempo, si la barra se mueve, la posición de los extremos debe determinarse simultáneamente
para que la medición tenga sentido.
Si en un sistema de referencia se determina la posición de los extremos de la barra en el mismo tiempo,
estas mediciones no ocurren simultáneamente en otro sistema de referencia que se mueve con respecto
al primero. El que la simultaneidad no sea un invariante se puede ver fácilmete en un diagrama de
espacio-tiempo. Este es el punto medular de todos los problemas que parecen paradójicos.
Por definición, la distancia entre dos puntos debe medirse simultáneamente y, a pesar de que este
concepto depende del observador, podemos definir la longitud propia como la longitud de un objeto
medida en el marco de referencia en el cual está en reposo. Si la barra esta en reposo en O’ y las
coordenadas de los extremos son x′1 y x′2 entonces la longitud propia de la barra es L0 = x′2 − x′1 . En
el sistema que se mueve a lo largo del eje x con velocidad v respecto a O’ se obtendra, a partir de las
transformaciones de Lorentz, ec. (3.14) para cada punto

1  v 
x′1 = q x1 + c t1 ,
1− v2 c
c2
1  v 
x′2 = q x2 + c t2 .
1− v2 c
c2

Pero, en O la medición se realiza simultáneamente, por lo que c t1 = c t2 , por lo que la longitud de la


barra en O, que es la distancia entre los puntos de la barra x1 y x2 medida, es decir L = x2 − x1 . Se
tiene por lo tanto, despejando a las x:
r
v2
L = x2 − x1 = 1 − 2 (x′2 − x′1 ),
c
r
v2
L = 1 − 2 L0 .
c

25
Que nos expresa que un cuerpo se ve contraido, más chico, al ser medido en un sitema de referencia que
se mueve respecto de él. Es la fórmula conocida como contracción de longitudes de Lorentz.
Nótese que es en la dirección donde está el movimiento. Las otras direcciones perpendiculares no
sufren este efecto.

Figura 3.5: x.

Figura 3.6: x.

3.1.4 Tiempo propio


Ya que definimos a la distancia propia, podemos mencionar al tiempo propio. Este es el tiempo que mide
un observador, en reposo consigo mismo, es su tiempo. Por lo que el elemento de lı́nea, ec. (2.4) con
dl2 = 0, la parte espacial se anula, el observador está en su origen, se tiene entonces ds2 = −c2 dt2 , lo
que nos da base para definir al tiempo propio, τ :

c2 d τ 2 = −ds2 = c2 dt2 − dx2 − dy 2 − dz 2 . (3.26)

la signatura se refiere al tiempo, no al intervalo y es tiempo que, para el observador en su propio sistema
de referencia, coincide con su propio tiempo.

3.1.5 Dilatación temporal


Para este observador en reposo consigo mismo, que no se mueve, el tiene y está en su origen y ve, como
John Lennon, pasar el tiempo, puede medir cuánto tiempo pasó desde que empezó a medir. Es decir, su
tiempo inical es c t′ = 0 y pasaron tantos metros, c t′ . Para un sistema de referencia que lo ve moverse,
veamos cuánto tiempo pasó. De nuevo, usamos las transformaciones de Lorentz, considerando que, para

26
el sistema de John, O’, él no se está desplazando en el espacio, sólo pasó el tiempo, por lo que x′ = 0,
usamos la transformación inversa (que se obtiene al sustituir, v → −v)

1  v ′
ct = q c t′ + x , (3.27)
1− v2 c
c2

pero, como x′ = 0, tenemos que el tiempo que mide el observador que ve moverse a John es

t′
t= q , (3.28)
v2
1− c2

que, al estar dividido por una cantidad menor a uno, es mayor a t′ , el ve pasar un intervalo de tiempo
mayor que el que mide. John, para el observador, se queda viendo al tiempo pasar un intervalo mayor.
Finalmente, mencionamos que todos los eventos que están separados tipo luz de un evento particular
A estan sobre un cono cuyo vértice es A, este es el cono de luz de A y todos los eventos dentro del cono
de luz son alcanzables para A y los que estan afuera no, estos últimos están causalmente desconectados.
Las transformaciones de Lorentz preservan la causalidad, para eventos tipo tiempo y tipo luz.

3.1.6 Ejercicio
A petición de l@s alum@s y para fijar ideas, veamos un par de ejercicios. Tomados del [?], 52 y 53.

La regla inclinada
Consideremos una regla de un metro paralela al eje x y que se mueve en la dirección y con velocidad vy .
En el sistema primado, que se mueve a velocidad vx , en la dirección x (y x′ ), respecto del no primado, la
regla se ve inclinada hacia arriba, en la dirección positiva de las x′ . Explicar porqué pasa esto, primero
sin ecuaciones y después calculando el ángulo θ′ al que la regla está inclinada respecto al eje x′ .
Esto tiene que ver con la idea de simultaneidad y su no invariancia para los diferentes sistemas de
referencia. Consideramos que el tiempo inicial sea el mismo en ambos, c t0 = c t′0 = 0 y que, a ese tiempo,
los orı́genes coinciden con el centro de la regla. Ahora, con el dibujo del espacio tiempo, tengo el sistema
con los ejes (c t, x), la regla está sobre el eje x, con todos los puntos a c t = 0. Al ver a la regla desde el
sistema (c t′ , y ′ ), vemos que ya no todos los puntos están a c t′ = 0, más bien, sólo el origen. Al trazar
rectas paralelas a x′ desde los puntos de la regla, vemos que las rectas de la parte derecha de la regla
intersectan al eje c t′ en su zona negativa. Esto quiere decir que, para el sistema O’, ya pasaron por el
tiempo c t′ = 0. El punto medio está curzándolo y los puntos de la izquierda aún no lo cruzan. Por ello,
para el observador en O’ la regla está avanzando inclinadamente, con la parte dereche hacia adelante.
Dando valores, el extremo derecho de la regla, D, tiene coordenadas, en O, (0, 1/2). En el sistema
′ ′
p las transformaciones de Lorentz, vemos que las coordenadas de D son (c t ′ = −vx /2 c, x =
O’, con
2
1/2)/ 1 − (vx /c) . Para determinar la posición del extremo D no a este tiempo c t negativo, sino al
tiempo c t′ = 0, donde sabemos que el centro de la regla está en x′ = 0, hay que determinar su velocidad.
En O su velocidad es (0, vy ). Por la composición de velocidades, ec. (3.15), en O’ su velocidad
en la dirección x es vx′ = −vx , la relativa entre ambos. Para ver a la velocidad en la dirección y, es
′ ′ ′ ′
interesante notar que, p si bien y = y, vy /c = dy /(c dt ), la y no cambia, ¡pero el tiempo sı́!, entonces
′ ′ ′
vy = dy /(c dt ) = 1 − (vx /c)2 dy/(c dt), pues dx es cero. De donde obtenemos que la velocidad en la
dirección y ′ es entonces p
vy′ = 1 − (vx /c)2 vy , (3.29)
la velocidad en y, cambia, a pesar de ser dirección perpendicular, pues el tiempo cambia.

27
′ ′
p
De este modo, el punto
p D de la regla estará, partiendo
p de que a c t = 0, un tiempo c t = (v x /2 c, )/ 1 − (vx /c)2
′ ′ ′ 2 2 2 ′ ′ ′ ′ ′
después en y = pvy t = 1 − (vx /c) vy (vx /2 c, )/ 1 − (vx /c) = vx vy /(2 c ). Y, x será x = x0 + vx t ,
es decir, x′ = 21 1 − (vx /c)2 .
Con lo que podemos determinar que el ángulo que hace la regla respecto al eje x′ , es decir, la inclinación
que tiene en el sistema O es θ′ con

y′ vx vy
tan θ′ = = p . (3.30)
x′ c 2 1 − (vx /c)2

Claramente se ve que deben ir a velocidades relativista, tanto la velocidad entre los sistemas de referencia
y (o) la regla para que esta inclinación sea perceptible. Sin embargo, es importante, es algo que pasa,
chiquito o no, pero ocurre y es un fenómeno netamente relativista. De hecho, la inclinación del momento
de espı́n del electrón al estar en órbita alrrededor de un núcleo, cambia su orientación y esto se puede
medir y explicar con la descripción del cambio en la inclinación para distintos sistemas de referencia
inerciales. Esto se conoce como la precesión de Thomas (ver ejercicio 103 del [?]).
Y, ahora sı́, ya quedamos listos para ver el famoso problema de la varilla y el plano con hoyo. La
idea es que van una varilla y un plano con hoyo moviéndose con velocidad constante. En su sistema de
referencia tanto la varilla como el diámetro del hoyo miden exáctamente igual, digamos un metro para
fijar ideas. La cosa es que la varilla se mueve en dirección perpendicular al la direcci’on en la que se
mueve el plano con hoyo y, se ajusatn las cosas de modo tal que ambas llegan al mismo tiempo a un
punto. Desde un sistema de referencia, el del plano con hoy, la varilla tiene una contracción de Lorentz,
por lo que pasará limpiamente, sin embargo, desde el sistema de la varilla, lo que se contrae es el hoyo,
por lo que no pasa y habrá una colisión. Esto sı́ es un problema, pues ambos sistemas de referencia son
equivalente, por lo que no puede pasar una cosa en un sistema y otra muy distinta en el otro. Este tipo
de problemas se les dice paradojas, pero más que paradójicos son malas interpretaciones de la relatividad.
En fin, este es el famoso problema de la varilla y el plano con hoy y la pregunta es, ¿chocan o no?
Usando el problema anterior, vemos que ya se tien la respuesta: no chocan. En efecto, hay contracción
pero, muy importante, el plano estará inclinado para la varilla, por lo que, por más que se contraiga,
la varilla pasa y tampoco hay colisión es este sistema de referencia. Basta ver al plano con hoyo, como
el sistema O, siendo la regla ahora el diámetro del hoyo y lo ajustamos en la dirección x. El sistema
O’ queda ahora representado por la varilla, con una velocidad relativa a O, dada por vx . El plano se
mueve en la dirección y, en O. Vemos que el problema queda perfectametne análogo al anterior, queda
para el lector, de tarea, describir y mostrar que para la varilla, el plano se inclina. Finalmente, uno
se puede preguntar, pero si la velocidad no es relativista, la inclinación es despreciable, por lo que ¡sı́
chocarı́a! Claramente es incorrecto, pues si la inclinación es despreciable, ¡también lo será la contracción
de Lorentz! No hay colisión.

28
Ejercicios 3

1. Orden temporal
El evento A, ocurre antes que el evento B. Muestra que el orden temporal de dos eventos en el
sistema de referencia del laboratorio es el mismo que en el del sistema en movimiento si y solo si
los eventos tienen una separación tipo luz o tipo tiempo.

2. Una sucesión...
Un carro de juguete rueda sobre una mesa con velocidad v, un carro más chico rueda sobre el
primero en la misma dirección con la misma velocidad v relativa al primero, un tercer carro rueda
sobre el segundo en la misma dirección con velocidad relativa v y ası́ sucesivamente hasta que son
n carros, ¿Cuál es la velocidad vn del n-ésimo carro en el sistema de referencia de la mesa? ¿A que
valor tiende vn conforme n → ∞ ?

3. Masa y energı́a
Considerando la ecuación E = mc2 , ¿Puede afirmarse que la materia se transforma en energı́a pura
cuando viaja al cuadrado de la velocidad de la luz?

4. Ley de la reflexión
Un espejo se mueve perpendicularmenete a su plano con velocidad v, un rayo de luz incide sobre su
superficie a un ángulo θ medido desde la normal, ¿con qué ánguo es reflejado? ¿Cuál es el cambio
en la frecuencia de la luz reflejada?

5. Una paradoja...
Una barra, de 1m de longitud, que está en el eje x del sistema O se acerca al origen con una
velocidad vx . Una lámina paralela al plano x-z se mueve en la dirección y + con velocidad vy . La
lámina tiene un agujero circular de 1m de diámetro con centro en el eje y. El centro de la barra
llega al origen de O al mismo tiempo (medido por O) que la lámina llega al plano y = 0. Como la
barra sufre una contracción de Lorentz en O, fácilmente pasará por el agujero de la lámina y, por lo
tanto, no habrá colisión y cada uno continuará su movimiento. Sin embargo, alguien que quisiera
objetar esta conclusión puede argumentar lo siguiente: En el sistema O′ , en el que la barra esta en
reposo, el agujero de la lámina sufre una contracción de Lorentz y por ello, el metro no podra pasar
por el egujero contraı́do y por lo tanto debe haber colisión.
Resuelve esta paradoja y responde ¿Hay o no colisión?

6. Desintegración
Un pión π 0 que se mueve en la direción x con velocidad v, y decae en dos fotones idénticos en x = 0.
En el sistema en que el pión esta en reposo, estos fotones se emiten en las direcciones positiva y
negativa del eje y. Encuentra la energı́a de estos fotones en este sistema y las energı́as y direcciones
de propagación de los dos fotones en el sistema de laboratorio.

29
30
Capı́tulo 4

Dinámica relativista

4.1 Cuadrivelocidad, cuadrimomento


El concepto de velocidad es el siguiente concepto fundamental después del de posición. De mecánica
sabemos que ~v = d~x/dt, pero ahora el tiempo tambiés es una coordenada, por lo que el parámetro
respecto al cual medimos el cambio puede ser el tiempo propio, con la ventaja adicional de que es
invariante bajo transformaciones de Lorentz. Consideremos a la cuadrvelocidad definida como

d xα
uα = , (4.1)

ası́ tenemos una velocidad temporal, u0 = d c t/d τ y velocidades espaciales, ui = d c xi /d τ , unidas en un


concepto de cuadrivelocidad. Ahora, podemos preguntarnos, ¿cuál es su magnitud en este cuadriespacio?
Al hablar de magnitud, recordamos una manera geométrica de medirla, por medio del producto punto,
~2=A
|A| ~ · A,
~ que, al escribirla como |A|
~ 2 = δij Ai Aj , donde estamos usando la convención de suma de
Einstein y definiendo a la delta de Kronecker, δij , descubierta, o propuesta (las matemáticas, ¿se
descubren o se inventan?) por Leopold Kronecker y definida como

Figura 4.1: Leopold Kronecker, 1823 - 1891.

31
(
0 si i 6= j,
δij = (4.2)
1 si i = j.

Esto es una manera elegante de escribir |A| ~ 2 = Ax 2 + Ay 2 + Az 2 , considerando i = 1 = x, i = 2 = y e


i = 3 = z. Pero no es sólo elegante, nos da una idea de que, para definir la magnitud del cuadrivector en
el espacio tiempo, usemos al tensor de Minkowski:

|uα |2 = ηµ ν uµ uν , (4.3)

El tensor de Minkowski, al darnos la magnitud de este vector, se le conoce como tensor métrico. Tiene
la propiedad, que después veremos que no es sólo notación, de bajar el ı́ndice del cuadrivector uν . Es
decir, definimos
uµ = ηµ ν uν , (4.4)
nótese la suma de Einstein en la parte derecha de la ecuación y, como debe ser, los ı́ndices libres de cada
lado de la ecuación coinciden, en nombre y en posición. Los ı́ndices arriba se les llama contra-variantes
y a los ı́ndices abajo los llamamos co-variantes. Regresaremos a ésto más adelante, por ahora lo dejamos
como notación.
De este modo, la ecuación para la norma del cuadrivector, ec. (4.3), la escribimos como:

uα uα = η µ ν uµ uν , (4.5)

y uα uα denota, se lee como, la norma del vector uα . Nótese el uso de ı́ndices mudos en la ecuación
anterior, se les llama mudos, sólo que se suman, no están libres y, eso sı́, los ı́ndices libres deben coincidir
siempre en una ecuación, en nombre y posición. En la ecuación anterior no hay ı́ndices libres.
Pero hay más sorpresas. Recordando la definición del elemento de lı́nea, ec. (2.5) y la de la cuadrive-
locidad, podemos escribir el lado derecho de ésta última ecuación como
d x µ d xν
ηµ ν uµ uν = η µ ν uµ uν = ηµ ν , (4.6)
dτ dτ
µ ν
ηµ ν d x d x
= (4.7)
d τ2
donde hemos usado el hecho de que la diferencial de una función la podemos ver como el cociente de los
incrementos diferenciales. y, recordando la definición de tiempo propio, ec. (3.26), tenemos el siguiente
resultado:
uα uα = −c2 , (4.8)
¡la norma de la cuadrivelocidad, de cualquier cuadrivelocidad, es negativa, es igual a menos el cuadrado
de la velocidad de la luz! Tal vez conviene interpretar este resultado como que la velocidad en el espacio
tiempo es un arreglo entre la velocidad temporal y la espacial (respecto al tiempo propio) y que, este
arreglo es tal que que se mantiene constante.
Definimos al cuadrimomento como:
pα = m uα , (4.9)
donde m es la masa en reposo de la partı́cula bajo estudio. La norma del cuadrimomento es

pα pα = −m2 c2 , (4.10)

Con esta manera de ver a la velocidad y el momento en el cuadriespacio, tal vez no nos sonará tan
extraño el siguiente resultado: como hemos visto con el cono de luz, en el cono avanzamos lo mismo en
espacio que en la coordenada temporal, x0 = c t, entonces para la luz, la velocidad temporal es igual a

32
la velocidad espacial y, dada la diferencia de signo, vemos que el intervalo, ec. (2.5) o el tiempo propio,
¡son cero!.
Dado que el tiempo propio, para la luz, es igual a cero, ası́ como la masa del fotón, para definir al
cuadrivector momento de la luz, usamos otro parámetro, λ, que se le conoce como parámetro afı́n

d xα
kα = , (4.11)

y su norma es cero,
kα k α = 0. (4.12)

De este modo, vemos que, para partı́cula masivas, moviéndose con velocidades menores a las de luz,
es decir, en el diagrama espacio-tiempo están dentro del cono de luz, pues su pendiente inversa (que
como vimos es 1/m = 1/ tan α = v/c), da la razón de la magnitud velocidad espacial a la de la luz, que
es menor a uno en este caso. Repetimos entonces, los eventos que están relacionados entre sı́ por señales
propagándose a velocidades menores a las de la luz, están dentro del cono de luz y se les llama, eventos
tipo-tiempo y, la norma de su cuadrivelocidad es −c2 , es decir la ec. (4.8), uα uα = −c2 . Los eventos
relacionados entre sı́ con señales viajando a la velocidad de la luz, están sobre el cono de luz, se les
llama eventos tipo luz y la norma de su cuadrivelocidad es cero, ec. (4.12), kα k α = 0.
Recordemos que en la fı́sica newtoniana de 3 dimensiones, la velocidad es un vector tangente a la
trayectoria de la partı́cula. Siguiendo esta idea, en la geometrı́a de cuatro dimensiones se define la 4-
velocidad como el vector tangente unitario a la lı́nea de mundo de la partı́cula en el sistema inercial, en
µ
d c t dxi
el que la partı́cula está en reposo, uµ = dx
dτ = ( dτ , dτ ) y, como está en reposo, el tiempo coordenado
coincide con el tiempo propio, por lo que uµ = (c, ~0).
Una partı́cula acelerada no tiene un marco de referencia en el cual siempre este en reposo, sin embargo,
hay un sistema inercial que instáneamente tiene la misma velocidad que la partı́cula. Este marco se llama
Marco de referencia momentáneamente comóvil.
La 4-velocidad de una partı́cula acelerada se define como el vector tangente a la lı́nea de mundo en
ese marco de refencia de ése evento, éste vector es tangente a la lı́nea de mundo de la partı́cula.
Como ya vimos, el cuadrimomento de define como pα = m uα . Para familiarizarnos con este concepto,
consideremos una partı́cula de masa en reposo m, en el sistema de referencia O’. dicho sistema mueve
con velocidad v en la direccion x respecto al marco de referencia O. ¿Cuáles son las componentes de su
cuadrivelociad y del cuadrimomento en este sistema?
Básicamente, sólo tenemos que aplicar la transformación de Lorentz a la cuadrivelocidad que, en O
tiene componentes uµ ′ = (c, ~0). Vista desde O tendrá componentes

d xα
uα = ,

β′
Λαβ′ d x
= ,


d xβ
= Λα
β′ ,

β′
= Λα
β′ u , (4.13)

donde usamos repetidas veces que el tiempo propio es un escalar, invariante bajo las transformaciones de
Lorentz. Como veremos más adelante, ésta manera de tranformarse de la cuadrivelocidad, se elevará a ser
la definición de una cantidad vectorial. Por ahora lo dejamos en que es la manera en que se transforma

33
la velocidad y, para nuestro caso, obtenemos que, en O la velocidad que se observa tiene la forma

c
 
1  v 
uα = q   0 .
  (4.14)
v 2
1− c
0

por lo que, para el cuadrimomento, visto desde O tenemos:

c
 
m  v 
pα = q  0 .
  (4.15)
v
 2
1− c
0

Nótese cómo, para un sistema de referencia que se mueva casi a la velocidad de la luz, la cuadriveloci-
dad y el cuadrimomento vistos desde O, divergen. Considermos conveniente dejar a la masa en reposo,
m, como un número, y lo que crece y tiende a divergir es la velocidad relativa.

4.1.1 La acción de una partı́cula libre


Los conceptos de tiempo propio y velocidad que hemos discutido, nos permiten usar los principios varia-
cionales en relatividad especial. En mecánica dichos principios nos permiten obtener las ecuaciones de
Euler-Lagrange al encontrar un extremo de la acción. Es un concepto muy profundo, pues está antes de
las ecuaciones; se puede trabajar con ellas aún antes de formularlas.

Figura 4.2: Giuseppe Luigi comte de Lagrange, 1736 - 1813 y Leonhard Euler, 1707 - 1783.

En efecto, los principios variacionales son una herramienta muy poderosa y los usaremos durante el
curso. Veamos por ahora el caso más sencillo de la acción para una partı́cula libre dentro de relatividad
especial.
A partir de la acción, S, definida como
Z t2
S= Ldt, (4.16)
t1
2
con L la función Lagrangiana, una funcional que, para una partı́cula libre tiene la forma L = mv 2 ,
construiremos la acción para el caso relativista.
La acción debe ser un escalar. De otra manera tendrı́a un valor mı́nimo para un observador pero un
valor distinto para otro, por lo que no se podrı́a obtener un resultado general. En el caso de una partı́cula

34
libre el escalar más sencillo que puede construirse es el tiempo propio τ que, como vimos, ec. (3.26), es el
tiempo que mide un observador en movimiento con la partı́cula. Escribamos entonces la acción relativista
Z t2
S=K Ldτ (4.17)
t1

Con K una constante a determinar. De la ecuación del tiempo propio, ec. (3.26), reacomodando
términos podemos reescribir (con dl2 = dx2 + dy 2 + dz 2 ):

c2 d τ 2 = c2 d t2 − dl2 ,
 2 !
2 2 dl
= c dt 1 − ,
c dt
  v 2 
2 2
≡ c dt 1 − , (4.18)
c
q
v 2

es decir, d τ = dt 1 − c . De este modo, substituyendo en la acción relativista el lagrangiano para
una partı́cula libre será r  v 2
L=K . 1− (4.19)
c
Consideremos el lı́mite no relativista para dar un valor a K. En este lı́mite v/c << 1, la norma de la
velocidad es mucho menor a la de la luz y por tanto podemos hacer un desarrollo de Taylor a primer
orden en (v/c)2
v2 K v2
 
L≈K 1− 2 =K − . (4.20)
2c 2 c2
Identificamos el segúndo término con algo parecido a la energı́a cinética, que, de hecho, es lo que se
obtiene en caso newtoniano. Por lo que, escogiendo K = −m c2 , recuperámos el término cinético de la
teorı́a newtoniana. La Lagrangiana relativista queda
r  v 2
2
L = −m c 1− , (4.21)
c
que, por construcción, tiene el lı́mite no relativista correcto. La constante −m c2 que queda en la la-
grangiana en este lı́mite no tiene relevancia, pues constantes no afectan a las ecuaciones de Euler -
Lagrange.
A partir de la Lagrangiana, definimos el momento generalizado de la partı́cula libre relativista:
∂L mvi
pi = =q 2 . (4.22)
∂v i
1 − vc

Nótese que hemos usado que v 2 = δlm v l v m y sacado la parcial de esto respecto a v i . Nótese los
ı́ndices y su posición.
Una vez que tenemos al momento conjugado, podemos construir el Hamiltoniano. El Hamiltoniano
es una funcional (funcion de funciones) definida como

H = pi v i − L. (4.23)

Substituyendo la expresión que obtuvimos para la Lagrangiana y para el momento, obtenemos que el
Hamiltoniano para la partı́cula libre relativista es (usamos que vi v i = v 2 )
m c2
H= q . (4.24)
v 2

1− c

35
Figura 4.3: Sir William Rowan Hamilton, 1805 - 1865.

Esta última expresión es muy interesante, ya que al identificar el Hamiltoniano con la energı́a total,
E, nos indica que incluso para una partı́cula en reposo con v = 0 su energı́a no es cero, sino

E = m c2 . (4.25)

La famosa fórmula de Einstein que relaciona la masa en reposo con la energı́a.

Figura 4.4: Centro financiero mundial de Taipei, el edicificio más alto del mundo en ese momento, en
honor a los 50 años de la muerte de Albert Einstein, 18 de abril de 1955, organizó sus luces para mostrar
la famosa ecuación.

Adem’as, le da un sentido a la componente temporal del cuadrimomento. En efecto, si se está en


reposo, ~v = 0, por lo que p~ = 0, pero de la normalización del cuadrimomento, ec. (4.10), tenemos que en
2
este caso, p0 p0 = −m2 c2 , pero p0 = −p0 , por lo que p0 = m2 c2 , es decir p0 = m c, concluimos que la
componente temporal del cuadrimomento la podemos asociar con la energı́a en reposo:
E
p0 = , (4.26)
c
las componentes del cuadrimometo las podemos expresar como
 
α E
p = , p~ . (4.27)
c

36
Estos resultados nos permiten considerar el caso para una partı́cula sin masa como el fotón que, como
ya vimos su norma en el cuadriespacio es cero y definir a sus componentes de la siguiente forma:


kα = (1, n) , (4.28)
c
con ~ la constante de Planck, ω la frecuencia angular del fotón y n un vector unitario que apunta en la

Figura 4.5: Max Karl Ernst Ludwig Planck, 1858 - 1947.

dirección de propagación.
De este modo vemos que, ası́ como unimos a los conceptos de espacio y tiempo en un concepto vemos
que los conceptos de energı́a y momento se unen en nuevo concepto, el cuadrimomento.

4.1.2 Conservación del cuadrimomento


Esta ley tiene un estatus de extra postulado, pues es uno de los muchos resultados cuyo limite no
relativista es correcto, sin embargo, como los dos postulados fundamentales de la reltividad especial, ha
sido ampliamente verificado y es de gran importancia para el estudio de colisiones entre partı́culas que
se mueven con velocidades relativistas.
De este modo, postulamos: El cuadrimomento total de un sistema, se conserva:

∆ PT α = PT α final − PT α inicial = 0. (4.29)

Nuevamente, dos leyes de conservación en mecánica se unen en una sola. La conservación de la energı́a
y la conservación del momento lineal, se unen en la conservación del cuadrimomento.

4.1.3 Efecto Compton


Una consecuencia de la conservación del cuadrimomento es el resultado del proceso que consiste en
considerar un fotón con cuadrimomento k α que choca con un electrón en reposo. Se observa que el fotón
cambia su frecuencia después del choque. Este resultado fue descrito por A. H. Compton y es uno de los
resultados fundamentales en la fı’sica de partı́culas.
Para describir y cuantificar este cambio en la frecuencia del fotón, consideremos la ley de conservación
del cuadrimomento, tomando en cuenta que, los cuadrivectores satisfacen el postulado de aditividad.
Inicialmente a un electrón en reposo y a un fotón que colisiona con él. Como resultado, ambos se
dipersan:
PT α inicial = k0 α + p0 α = kf α + pf α = PT α final . (4.30)

37
Figura 4.6: Arthur Holly Compton, 1892 - 1962, premio Nobel de Fı́sica 1927

donde pα es el momento del electrón, k α el del fotón y los subı́ndices o y f se refieren a los valores
repectivos antes y después de la colisión. Ahora, sabemos que

p0 α : (m c, 0),
~ ω0
k0 α : (1, n0 ),
c
~ωf
kf α : (1, nf ), (4.31)
c
mc
pf α : (q  , p~f ).
v 2
1− c
(4.32)

Reescribiendo ec. (4.30) como


k 0 α − k f α + p0 α = pf α . (4.33)
Si hacemos el equivalente en cuadrivectores de elevar al cuadrado la ecuación de conservación, ec. (4.30),
es decir, contraer con las expresiones contravariantes correspondientes, k0α − kf α + p0 α , y pf α :

k0α − kf α + p0 α (k0 α − kf α + p0 α ) pf α p f α ,

=
−2 k0α kf α + 2 k0α − kf α p0 α − m2 c2 −m2 c2 ,

=

donde hemos usado que k0α k0 α = kf α kf α = 0, son vectores nulos, que p0 α p0 α = pf α pf α = −m2 c2 y que
k0α kf α = kf α k0 α . Ahora, como kα = ηαβ k β , de ec. (4.31), obtenemos que k0α : (~ ω0 /c) (−1, n0 ), kf α :
(~ ωf /c) (−1, nf ), por lo que, desarrollando las componentes tenemos

~ ω0 ωf
(1 − n0 · nf ) − (ω0 − ωf ) m c = 0
c
lo que, usando el producto punto usual nos lleva a la relación:
~ mc mc
(1 − cos φ) − + =0
c ωf ω0

con φ el ángulo entre las direcciones incidente y saliente de los fotones. Finalmente, con c = ν λ,
~ = h/(2 π) y que ω = 2 π ν, con ν la frecuencia y λ la longitud de onda de los fotones, obtenemos la

38
relación entre las longitudes de onda de los fotones entrantes y salientes:

h
λf = λ 0 + (1 − cos φ) , (4.34)
mc
que es la relación de dispersión de Compton.

Figura 4.7: Diagrama del efecto Compton

Es interesante que el mismo resultado se puede obtener con conceptos casi totalmente clásicos: sin
espacio-tiempo ni cuadri-vectores, ni masa nula del fotón, si consideramos al fotón y al electrón como un
par de partı́culas clásicas, que chocan.
Consideramos al de electrón inicialmente en reposo, pero sı́ consideramos que tiene una energı́a en
reposo, E0e = m0 c2 , com m0 la masa del electrón en reposo y p0 e = 0, su momento lineal inicial es cero.
Respecto al fotón, consideramos que su energı́a inicial es E0f = h ν y su momento inicial p0 f = h ν0 /c.
Despué del choque tenemos que el fotón sale formando un ángulo φ con la dirección de incidencia y el
electrón un correspondiente ángulo θ. El fotón tendrá una nueva energı́a y un nuevo momento: Ef f = h νf
p
y su momento inicial pf f = h νf /c, ası́ como el electrón, Ef e = m0 2 c4 + p2 c2 , pf e = p.
Resolviendo el problema como un problema clásico de conservación de energı́a y de momento lineal,
tenemos conservación de energı́a y conservación de momento en las dos direcciones:
p
E: h ν0 + m0 c2 = h νf + m0 2 c4 + p2 c2 , (4.35)
h ν0 h νf
phor : = cos φ + p cos θ, (4.36)
c c
h νf
pver : 0 = senφ + p senθ. (4.37)
c

Combinando las ecuaciones de los momentos para obtener una expresión para p2 y otra para p2 de la
ecuación de conservación de energı́a e igualándolas obtenemos después de simplificar:
ν νf  ν0 νf ν0 νf
0
2h − − 2 h2 2 = −2 h2 2 cos φ, (4.38)
c c c c
con lo que, al escribir esta expresión en términos de la longitud de onda, λ, utilizando ν λ = c, obtenemos
diréctamente:
h
λf = λ0 + (1 − cos φ) , (4.39)
m0 c
que es la expresión para el cambio en longitud de onda, la dispersión de Compton, que obtuvimos arriba
con el tratamiento completamente relativista. Nótese que en este tratamiento clásico hay una mezcla de
ideas clásicas y de cuántica primitiva, pero aún ası́ nos dan la misma expresión para el cambio de longitud
de onda del fotón, al ser dispersado por en electrón. Interesante.

39
Aniquilación de partı́culas
Otro ejemplo muy común es la aniquilación de una partı́cula con su anti-partı́cula. Consideremos la
colisión de un electrón y un positrón que se aniquilan y producen un fotón, es decir, de acuerdo la
siguiente reacción e+ e− → γ. Primero vamos a mostrar que no es posible este proceso.

pα α α
− + p+ = k . (4.40)

Aún sin dar valores a las componentes, vemos que es posible ir al sistema de referencia de centro de masa,
donce verı́a al electronón y al positrón acercarse al origen, con lo que el momento lineal total inicial serı́a
cero, pero, por otro lado, el fotón ¡no puede tener momento lineal cero! La reacción que propusimos es
incorrecta, se deben generar por lo menos dos fotones. Y tomemos ahora que el positrón choca con un
electrón en reposo:

pα α α α
− + p+ = k 1 + k 2 , (4.41)

donde tenemos que

pµ − : (m c, 0),
mc
pµ + : (q 2 , p~f ),
1 − vc
~ω1
kµ 1 : (1, n1 ) ,
c
~ω2
kµ 2 : (1, n2 ) . (4.42)
c
Contrayendo con los respectivos vectores covariantes:

(p− α + p+ α ) (p− α + p+ α ) = (kα1 + kα1 ) (k α 1 + k α 2 ) ,


−m2 c2 + p− α p+ α = kα1 k α 2 ,
(4.43)

tomando el cuenta las componentes de los vectores, considerarando cuidadosamente aquellos que son
covariantes, se obtiene
 q 
v 2

1+ 1− c
~2 ω 1 ω 2
m2 c2 = (1 − n1 · n2 ) , (4.44)
c2
q 2
1 − vc

y, nuevamente considerando a θ como el ángulo entre las dos direcciones de los fotones y las definicones
de frecuencias y longitudes de onda del ejercicio anterior se obtiene:
q 2
h2 (1 − cosθ) 1 − vc
λ1 λ2 =  q . (4.45)
v 2

2
m c 2 1+ 1− c

Colisiones inelásticas
Como último ejemplo, veamos al equivalente al choque inelástico entre partı́culas relativistas. En un
choque inelástico, las partı́culas cambian debido a su interacción. Consideremos por ejemplo el proceso
conocido como fotoproducción de piones γ + p → π + + n.

40
En esta reacción el protón absorbe al fotón transformando parte de su energı́a en masa para crear el
pión y a un neutrón (la masa del protón es de 938,3 MeV g mientras que la del neutrón es de 939,5 MeV).
La energı́a mı́nima necesaria en este proceso es cuando se produce un pión y un neutrón y permanecen
en reposo justo después de haberse producido (En el sistema de centro de momentos), de otra forma serı́a
necesaria mas enegı́a para ponerlos en movimiento.
En el sistema centro de momentos el protón tiene un momento espacial que compensa el momento
que tiene la partı́cula final. Visto desde el sistema de laboratorio la reacción se ve como si el pión y el
neutrón se moviesen como si fueran una partı́cula cuya masa es la suma de las masas de ambas partı́culas.
Consideremos la reacción:
pα α α
p + k = pπ+n , (4.46)
contrayendo

2 kα pp α − m2p c2 = −(mπ + mn )2 c2 , (4.47)

y en el marco de referencia de laboratorio k : (~ ω/c) (1, n) y p : (mp c, 0) ası́ que

(mπ + mn )2 c2 − m2p c2
~ω = , (4.48)
2 mp

que es la energı́a mı́nima o umbral que se requiere para producir un pión por medio de la reacción anterior.
Estos resultados son un ejemplo de la base conceptual, la relatividad especial, aplicada al estudio
de las part’iculas elementales. Hay grandes y profundos desarrollos que se realizan en las instituciones
de investigación del mundo, destacando los resultados de los grandes aceleradores, que nos acercan, a
entender más sobre la naturaleza del micro-cosmos.

Figura 4.8: El Centro Europea de Investigación Nuclear, CERN, por sus siglas en francés, Conseil Eu-
ropéen pour la Reaserche Nucléaire, fundado en 1954, es uno de los aceleradores de partı́culas más
importantes del mundo.

41
Ejercicios 4

1. Cartesianas ←→ Esféricas
Dada la transformación de coordenadas cartesianas a esféricas

t′ = t,
x = r cos φ sin θ,
y = r sin φ sin θ,
z = r cos θ,
(4.49)

y la transformación inversa

t = t′ ,
p
r = x2 + y 2 + z 2 ,
y
tan φ = ,
x
z
tan θ = p ,
x + y2
2

(4.50)

demuestra explı́citamente que el elemento de lı́nea se transforma de la siguiente manera

ds2 = −c2 dt2 + dx2 + dy 2 + dz 2 ↔ ds2 = −c2 dt2 + dr2 + r2 dθ2 + sen2 θ dφ2 ,

(4.51)

2. Geodésicas en la esfera
Considera una esfera de radio R. El elemento de lı́nea en este caso esta dado por

ds2 = R2 dθ2 + sen2 θ dφ2 ,



(4.52)

Calcula explı́citamente, a partir de la métrica gij , (Ahora los ı́ndices corren de uno a dos), los
sı́mbolos de Christoffel Γσ αµ , obtén las expresiones para las ecuaciones de geodésicas y resúelvelas.
Muestra que la métrica se transforma efectivamente como un tensor.

3. Tensores
Demuestra las siguientes identidades:

(a) gαβ ,γ = Γαβγ + Γβαγ . Recuerda que Γαβγ = gαν Γνβγ .


(b) gµν g νβ ,γ = −gµν ,γ g νβ ,
(c) g αβ ,γ = −gµβ Γα β
µγ − gµα Γµγ

4. Más geodésicas
Para el espacio descrito por
−dt2 + dx2
ds2 = , (4.53)
t2
encuentra las ecuaciones geodésicas, resuélvelas y dibúja las trayectorias en un diagrama espacio-
tiempo.

5. Propiedades de la derivada covariante


Demuestra explı́citamente:

42
(a) Γµµλ = 1
2 g µν gµν ,λ ,
(b) Para un tensor antisimétrico, F µν = −F µν , demuestra que
1 √
F µν ;ν = √ −g F µν ,ν

(4.54)
−g

(c) Y que se satisface la relación cı́clica:

Fµν;λ + Fλµ;ν + Fνλ;µ = Fµν,λ + Fλµ,ν + Fνλ,µ (4.55)

6. Maxwell
Utilizando este resultado cuando este tensor F µν es el de Faraday, dado por la ec. (5.16), de la
misma forma en que se demostró que F µν ; ν = 4 π j µ , contiene a la ley de Gauss y a la ley de
inducción de Faraday, demuestra que

Fµν;λ + Fλµ;ν + Fνλ;µ = 0 (4.56)

son las otras cuatro ecuaciones de Maxwell: la ley de Gauss para magnetismo (no hay monopols
magnéticos) y la ley de circuito de Ampère.

7. Más tensores
Muestra que la derivada covariante de un vector covariante Aµ ,

Aµ;ν = Aµ,ν − Γα
µ ν Aα , (4.57)

es un tensor.

8. gµν;α = 0
Demuéstralo, utilizando la relación
1 σν
Γσ αµ = g (gνα,µ + gνµ,α − gµα,ν ) . (4.58)
2

43
4.2 Espacio Curvo, tensores

La relatividad especial surge de la inquietud de considerar que los sistemas de referencia inerciales son
todos equivalentes entre sı́, no hay un sistema de referencia privilegiado. Hay, eso sı́, sistemas que son
más útiles para describir un fenómeno dado, en cuanto a la facilidad con lo que se pueden describir, pero
no en cuanto a su valor intrı́nseco sobre los otros sistemas. Esto, aunado al postulado de la velocidad de
la luz tiene la misma magnitud en todos los sistemas de referencia, llevó a Lorentz a mostrar el tipo de
ecuaciones que relacionan la dinámica de un cuerpo visto desde un sistema de referencia, con la dinámica
observada en otro sistema inercial.
Vimos que surge el concepto de espacio-tiempo, que es el que queda con sentido fı́sico en cuanto
a que es una función cuyo valor en cada punto del espacio tiempo, no cambia, mientras que el valor
del tiempo y del espacio, sı́ lo hacen, se contraen, se dilatan e incluso pueden verse rotados, al ser
observados en distintos sistemas inerciales. Vimos también que, al definir una velocidad y un momento es
este cuadriespacio, surgieron la cuadrivelocidad y el cuadrimomento y, cuando medimos su norma, ésta
resultó constante para todos los cuerpos, en el caso del cuadrimomento esta constante es la masa de la
partı́cula en reposo. Concepto que tiene una iterpretación no tan intuitiva, pero que, vimos, es de gran
utilidad al tratar problemas de colisión de partı́culas elementales. Vimos que el cuadrimomento reúne a
los conceptos de energı́a y momento en una sóla entidad, mostraando una equivalencia entre la masa y
la energı́a.

Figura 4.9: Conceptos y aplicaciones de la relatividad especial. Los conceptos de la relatividad especial
nos han permitido entender mejor a la naturaleza, con resultados que verifican lo adecuado de sus de-
scripciones. Desafortunadamente no nos han permitido entendernos mejor a nosotros mismos y a nuestra
convivencia.

Las transformaciones entre sistemas de referencia, las estudiamos en el espacio tiempo plano, descrito
en coordenadas cartesianas, ecs. (3.13, 3.14). Resulta natural el preguntarse ¿qué pasa si cambiamos
estas condiciones? Si estudio al espacio tiempo en otras coordenadas, no planas, sino curvilı́neas, como las
polares o las esféricas que hemos usado en otros cursos de Fı́sica al resolver varios problemas. Las ideas
y principios de covariancia, deben seguir siendo válidos. Después de todo, las coordenadas no están en el
espaciotiempo, es algo que se usa para describir al fenómeno que estudio, para facilitarme su compresión.
Sin embargo, el que todo funcione en otras coordenadas es algo que conviene mostrar.
Más aún, podemos nos preguntamos, ¿y si no es que las coordenadas sean curvilı́neas, sino que resulta
que sı́, el espacio tiempo es curvo? Despues de todo, ¡vivimos en una superficie curva!, la Tierra, ¡es
curva!

44
Figura 4.10: Imágenes de nuestra Tierra vista desde el espacio, claramente curva.

Las superficies curvas son algo natural, el que la descripción de la Fı́sica considerando al espacio plano
sea adecuada, se debe a que las distancias, velocidades y desplazamientos son en regiones pequeñas (en
muchos de los casos estudiados). Es de esperar que el principio de relatividad, la covariancia, sigan siendo
válidas en espacios curvos.
Este estudio nos llevará a conceptos geoétricos totalmente independientes de las coordenadas especf́icas
que se utilicen y nos permitirá describir a las ecuaciones de la Fı́sica de manera covariante. Para ello
contruiremos a los tensores y a su álgebra.
Estos dos temas, relatividad especial y tensores, nos dejarán ya a un paso de la relatividad general.
Empecemos con una transformación de coordenadas sencilla, de cartesianas a esféricas
Es, como decı́amos, un ejemplo de coordenadas son curvilineas. Que ya sea porque el problema se
describe mejor en ellas o porque el espacio es curvo. Es una transformación de coordenadas como las que
hemos visto xµ → xµ ′ = xµ ′ (xν ), paso de las antiguas a las nuevas, y en el caso de la transformación a
coordenadas esféricas, dejando al tiempo sin transfomar:

t′ = t,

x = r cos θ sin φ,

y = r sin θ sin φ,

z = r cos φ,
(4.59)

el elemento de lı́nea toma la forma

ds2 = −c2 dt2 + dr2 + r2 dθ2 + sen2 θ dφ2 .



(4.60)

Ya no es una transformación de Lorentz, es simplemente un cambio de coordenadas. ¿Qu pasa con


el principio de equivalencia y lo que hemos visto hasta ahora? Como ya mencionamos, construiremos la
base que nos permitirá llegar a la Relatividad General, donde sus principios nos dicen que las leyes de la
Fı́sica deben ser covariantes, es decir, independientes del sistema de referencia o de coordenadas que se
utilize.
Antes de ello, mostraremos qué pasa con las distancias entre dos puntos en espacios curvos o en
sistemas con coordenadas curvilı́neas.
De la forma del elemento de lı́nea en esféricas vemos que para ponerlo en notación de ı́ndices se debe
escribir
ds2 = gαβ dxα dxβ , (4.61)
donde gαβ es una matriz, de hecho veremos que es un tensor, y se le llama tensor métrico o métrica,
que es función de las coordenadas y lo consideramos simétrico, es decir, gαβ = gβα . Para determinar la
distancia más corta entre dos eventos, dos puntos del espacio tiempo, usaremos nuevamente el principio
de acción, ec. (4.16).

45
Actualmente todas las teorı́as de la Fı́sica son derivables de un principio variacional, de una la-
grangiana. Lo que no es trivial es postularla.
Para el espacio tiempo, eb donde queremos medir distancias y encontrar la distancia más corta entre
dos eventos, el extremo entre dos puntos.

Figura 4.11: Hay que encontrar el mejor camino, no siempre es trivial.

Tenemos una integral sobre el elemento de lı́nea, simplemente


Z
S = ds, (4.62)

p
con ds = gαβ dxα dxβ , es decir, se tiene la acción
Z q
S= gαβ dxα dxβ , (4.63)

y queremos variarla con respecto a las coordenadas, δxµ . Entonces


Z q
δS = δ gαβ dxα dxβ , (4.64)

δds2
recordemos que la variación es como una derivada, y δds2 = 2 dsδds, por lo que δds = 2 ds y

δds2 = δgαβ dxα dxβ + 2 gαβ dxα δdxβ , (4.65)

donde usamos que la métrica es simétrica y que los ı́ndices son mudos. Ahora, como la métrica es función
de las coordenadas, usamos la regla de la cadena δgαβ = gαβ,ν δxν . Notar que se usan comas para indicar
∂A
derivadas: A, ν = ∂x ν . También se utiliza el hecho de que la variación y la diferenciación conmutan

(esto se puede demostrar formalmente, nosotros lo tomamos como un hecho): [δ, d] = 0, por lo que
2 gαν dxα dδxν , se conmutó y de nuevo se utilizó que los ı́ndices son mudos.
Ahora, se completa una derivada total, d (gαν dxα δxν ) = d (gαν dxα ) δxν + gαν dxα dδxν , es decir,
gαν dxα dδxν = d (gαν dxα δxν ) − d (gαν dxα ) δxν . Y, el segundo término de la derecha se reescribe
como −d (gαν dxα ) δxν = − gαν,µ dxµ dxα + gαν d2 xα δxν , donde se ha usado la regla de la cadena.


Finalmente obtenemos −d (gαν dxα ) δxν = − 21 gαν,µ + 21 gµν,α dxµ dxα + gαν d2 xα δxν .
 

Juntando todo estos resultados se tiene que

1
δds2 = − (−gαµ,ν + gαν,µ + gµν,α ) dxα dxµ + gαν d2 xα δ xν + d (gαν dxα δxν ) .

(4.66)
2

46
Para que quede más compacto se define
1
Γαµ ν = (gαν,µ + gµν,α − gαµ,ν ) , (4.67)
2
con lo que queda la siguiente expresión para la variación del cuadrado del elemento de lı́nea.

δds2 = − gαν d2 xα + Γαµ ν dxα dxµ δ xν + d (gαν dxα δxν ) .



(4.68)

Regresando a la expresión para la acción,

δds2 δds2
Z Z Z
δS = δds = ds = − ds, (4.69)
2ds2 2dτ 2

es decir, al substituir δds2

d2 xα dxα dxµ
 
1 1 d
Z Z Z
ν
δS = δds = gαν 2
+ Γ αµ ν δ x ds + (gαν dxα δxν ). (4.70)
2 dτ dτ dτ 2 ds

En el segundo término, vemos que queda una integral exacta y queda gαν dxα δxν evaluado en los ex-
tremos, pero en ellos δxν = 0, por lo que este término es cero. Ahora, tomando el extremo, e igualando a
cero, δS = 0, queda la integral de algo, multiplicado por δ xν igualado a cero, pero como las variaciones
son arbitrarias, ese algo debe ser cero, es decir, obtenemos la ecuación que nos da el extremo del elemento
de lı́nea, el extremo de la separación espacio temporal entre dos puntos:

d2 xα dxα dxµ
gαν 2
+ Γαµ ν = 0, (4.71)
dτ dτ dτ
multiplicando por el inverso del tensor métrico, g σν , es decir g σν gαν = δασ , obtenemos finalmente

d2 xσ dxα dxµ
2
+ Γσ αµ = 0, (4.72)
dτ dτ dτ
con
1 σν
Γσ αµ = g (gνα,µ + gνµ,α − gµα,ν ) . (4.73)
2
La ecuación de moviemiento que obtuvimos se conoce como ecuación geodésica y es la que deben
satisfacer las trayectorias que minimizan (en sı́, que dan un extremo) la distancia. La Γσ αµ se conocen
como los sı́mbolos de Christoffel y van a jugar un papel muy importante en el álgebra tensorial que
veremos más adelante.
2 σ
La ecuación geodésica nos habla de aceleraciones, de cuadriaceleraciones, ddτx2 y si definimos a la
α µ
cantidad f σ = Γσ αµ dx dx
dτ dτ y la interpretamos como una una cuadrifuerza, se puede considerar a las
ecuaciones de geodésicas como la versión relativista de la segunda ley de Newton. Siguiendo esta idea,
dicha fuerza es algo, como vemos, puramente geométrico, no es ningún tipo de interacción sino que las
modificaciones a la trayectoria, son debidas a la búsqueda de que dicha trayectoria sea el camino más corto
en la geometrı́a dada. Siguiendo esta idea, se puede pensar a los coeficientes métricos como potenciales.
Si bien la idea anterior es interesante y, de hecho, sı́ se relaciona a los coeficientes métricos con poten-
ciales gravitacionales, la fuerza geométrica, como veremos más adelante, no es un concepto geométricamente
bien definido, por lo que pierde su valor conceptual y queda en una mera analogı́a. Las curvas extremales
en espacio curvo se llaman geodésicas.
Bueno, con esto empezamos a ver fı́sica en coordenadas curvilı́neas, de hecho, en espacio curvo.
También vemos la necesidad de contar con una manera de expresar a las leyes de la Fı́sica de un modo
independiente de las coordenadas que se utilicen.

47
Figura 4.12: Elwin Bruno Christoffel, 1829 - 1900.

Para ello estudiaremos el álgebra tensorial. Fundamentalmente se basa en la manera en que los objetos
cambian bajo una transformación de coordenadas. Supongamos entonces que tengo una variedad, un
espacio-tiempo, al que describo por medio de las coordenadas xµ y damos una transformación a otras
coordenadas xν ′ :
xµ → xµ ′ = xµ ′ (xν ), (4.74)
notemos que no hemos impuesto ninguna restricción sobre dicha transformación, por lo que no le podemos
asociar ningún carácter geométrico. No hay un vector posición en este sentido. Al tomar la diferencial y
usando regla de la cadena se obtiene:
∂xµ ′ ν
dxµ ′ = dx , (4.75)
∂xν
y a este comportamiento es a lo que le llamaremos vector, de hecho un vector contravariante. A
la diferencial de la posición sı́ le podemos asignar un comportamiento definido bajo un cambio de co-
ordenadas y generalizamos dicho comportamiento: Una cantidad Aµ es un vector si y solo si, bajo una
transformación de coordenadas se transforma de acuerdo a la regla

∂xµ ′ ν
Aµ → Aµ ′ = A . (4.76)
∂xν
Podemos definir ahora a un escalar, como aquel objeto que no cambia su magnitud bajo una transfor-
mación de coordenadas, es decir φ(xµ ) es un escalar si y solo si, bajo una transformación de coordenadas
se mantiene invariante:
φ(xµ ) → φ(xµ ′ ) = φ(xµ ). (4.77)
Aquı́ notemos que no tenemos ı́ndices libres, esto de los ı́ndices libres nos va a dar idea de que tipo de
objeto es. Un objeto que ya conocemos que no tiene ı́ndices libres y por tanto es un escalar, es el elemento
de lı́nea, ds2 = gµν dxµ dxν , si damos una transformación de coordenadas:

ds2 → ds2 = gµ′ ν ′ dxµ ′ dxν ′ = ds2 = gαβ dxα dxβ , (4.78)

pero ya sabemos cómo se transforma dxµ ′ , por lo que obtenemos

∂xµ ′ ∂xν ′
g µ′ ν ′ dxα dxβ = gαβ dxα dxβ , (4.79)
∂xα ∂xβ
es decir
∂xµ ′ ∂xν ′
g µ′ ν ′ = gαβ , (4.80)
∂xα ∂xβ

48
Figura 4.13: El globo rojo, Paul Klee

queremos ver cómo se transforma gµ′ ν ′ , debemos despejarla, para lo cual usamos que la parcial de una
transformación por la parcial de la transformación inversa debe dar la identidad:
∂xµ ′ ∂xα ′

α ν ′ = δνµ′ , (4.81)
∂x ∂x
análogamente:
∂xα ∂xµ ′
= δβα , (4.82)
∂xµ ′ ∂xβ
∂xα ∂xβ
Ası́, multiplicamos por ∂xσ ′ ∂xτ ′ :

∂xµ ′ ∂xν ′ ∂xα ∂xβ ∂xα ∂xβ


g µ′ ν ′ ′ ′ = gαβ σ ′ , (4.83)
α β
∂x ∂x ∂x ∂x σ τ ∂x ∂xτ ′
Es decir
′ ∂xα ∂xβ
gµ′ ν ′ δσµ′ δτν′ = gαβ

, (4.84)
∂xσ ′ ∂xτ ′
encontramos finalmente que
∂xα ∂xβ
gσ′ τ ′ = gαβ , (4.85)
∂xσ ′ ∂xτ ′
que es la forma en la que se debe transformar la métrica para mantener invariante al intervalo de espacio-
tiempo. Esto es lo que vamos a definir como un tensor covariante de dos ı́ndices, un objeto Tµν , que bajo
transformaciones de coordenadas se transforma como
∂xα ∂xβ
Tµν → Tµ′ ν ′ = Tαβ . (4.86)
∂xµ ′ ∂xν ′
De aquı́ ya vemos cómo defimos a un objeto con un ı́ndice pero abajo, que será un vector covariante,
a aquel objeto Aµ que, bajo una transformación de coordenadas se comoporta como
∂xα
Aµ → Aµ′ = Aα . (4.87)
∂xµ ′
y con esto podemos ya generalizar a objetos con mas ı́ndices, arriba y abajo, cada ı́ndice se debe trans-
formar, es decir, un objeto Rµ νστ , será un tensor, mixto de cuarto orden si, bajo una transformación de
coordenadas se comporta como
∂xµ ′ ∂xβ ∂xγ ∂xδ α
Rµ νστ → Rµ ′ ν ′ σ′ τ ′ = R βγδ . (4.88)
∂xα ∂xν ′ ∂xσ ′ ∂xτ ′
Una vez definidos los objetos podemos deducir varias operaciones válidas en álgebra tensorial. Sean
a, b, B α , T α β , S α β , Rµ νστ tensores, entonces:

49
1. Combinación lineal: P α β = a T α β + b S α β es un tensor. Noten que para sumar dos tensores éstos
deben ser del mismo tipo.

2. Producto directo T α β γ = Rα β B γ , es tensor

3. Contracción. Un ı́ndice covariante, abajo, con un ı́ndice contravariante, arriba. Se tiene una suma
implı́cita y el ı́ndice desaparece, se obtiene un tensor de grado dos veces menor que el inicial:
Tντ = Rµ νµτ .

Nos falta una operación, la diferenciación, pero esa la veremos un poco más adelante. Para el producto
directo, se da una transformacion de coordenadas y se obtiene

′ γ′ ′
Tα β′ = Rα β′ Bγ ′ (4.89)

como Rα β y B γ son tensores,


′ γ′ ∂xα ′ ∂xν ∂xγ ′ µ
Tα β′ = R ν Bσ (4.90)
∂xµ ∂xβ ′ ∂xσ
es decir
′ γ′ ∂xα ′ ∂xν ∂xγ ′ µ σ
Tα β′ = T ν , (4.91)
∂xµ ∂xβ ′ ∂xσ
por lo que es un tensor.
Otra operación es combinar producto directo y contracción,

Aµ = Sµν B ν , (4.92)

y se obtiene un tensor. Cuando se usa al tensor métrico, se dice que se le baja el ı́ndice:

Aµ = gµν Aν , (4.93)

y de este modo se relacionan un vector contravariante con uno covariante.


La diferenciación es una de las operaciones más importantes en la fı́sica y es necesario que tengamos
esta noción para tensores. La idea es que cuando tengo una cantidad bien definida geométricamente, se le
pueda derivar y se obtenga otra que también este bien definido (en el sentido que sigue las mismas reglas
de transformación). Consideremos un cuadrivector Aµ . Al dar una transformación de coordenadas éste
µ′
se transforma como, Aµ → Aµ ′ = ∂x ν µ
∂xν A . Ahora lo derivamos y tenemos un nuevo objeto, Bν = A ,ν y
µ

hay que ver cómo se comporta:

∂xµ ′ α
 
′ ∂
B µ ′ ν ′ = Aµ ,ν ′ = A . (4.94)
∂xν ′ ∂xα

Aquı́ hay que tener cuidado. el término entre paréntesis es una función de las coordenadas no primadas
y, el operador que actúa sobre él es con respecto a las primadas, hay que hacer regla de la cadena. Veámoslo
en general. Se tiene una función de las coordenadas no primadas: f (xα ), le aplicamos el operador derivada
∂f ∂xβ
con las primadas: ∂x∂ν ′ f (xα ), uso regla de la cadena: ∂x β ∂xν ′ , lo reacomodamos para que se vea más
∂xβ ∂
claro: ∂xν ′ ∂xβ f , como esto es para una función arbitraria, podemos concluir que

∂ ∂xβ ∂
′ = , (4.95)
∂x ν ∂xν ′ ∂xβ

50
que es justo la definición de transformación de un vector covariante, por lo que el operador de derivada
es un vector covariante. Regresando a la derivación, se tiene entonces que
 µ′
∂xβ ∂

′ ∂x
B µ ′ ν ′ = Aµ ,ν ′ = A α
,
∂xν ′ ∂xβ ∂xα
∂xβ ∂xµ ′ ∂Aα ∂xβ ∂ 2 xµ ′
= + Aα ,
∂xν ′ ∂xα ∂xβ ∂xν ′ ∂xβ ∂xα
∂xβ ∂xµ ′ α ∂xβ ∂ 2 xµ ′
= B β + Aα , (4.96)
∂xν ′ ∂xα ∂xν ′ ∂xβ ∂xα
no es tensor. Vemos que tenemos el primer término que se comporta como tensor, pero le sobra el segundo
término, que involucra segundas derivadas. Era de esperarse pues la derivada es el cambio con respecto
a las coordenadas que, a su vez, están cambiando. Este término que sobra, se puede reescribir de la
siguiente forma, derivando a la delta:

∂  µ′ 
δν ′ = 0,
∂xα
∂x ∂xµ ′
 β 

= 0,
∂xα ∂xν ′ ∂xβ
∂xβ ∂ 2 xµ ′ ∂xµ ′
 β
∂ ∂x
ν ′ β α
+ α ν
= 0,
∂x ∂x ∂x ∂x ∂x ′
∂xβ
′ ′
∂xβ ∂ 2 xµ ′ ∂xµ ∂xλ ∂ ∂xβ
 
+ = 0,
∂xν ′ ∂xβ ∂xα ∂xβ ∂xα ∂xλ′ ∂xν ′
′ ′
∂xβ ∂ 2 xµ ′ ∂xµ ∂ 2 xβ ∂xλ
= − , (4.97)
∂xν ′ ∂xβ ∂xα ∂x ∂xν ′ ∂xλ′ ∂xα
β

por lo que la transformación de la derivada de un vector queda de la siguiente forma:


′ ′
′ ∂xβ ∂xµ ′ α ∂xµ ∂ 2 xβ ∂xλ ρ
Aµ,ν → Aµ ,ν ′ = ν ′ α
A ,β − A , (4.98)
∂x ∂x ∂x ∂xν ′ ∂xλ′ ∂xρ
β

Sea este término


∂xτ ∂ 2 ξ µ
Γτσ α = . (4.99)
∂ξ µ ∂xσ ∂xα
Notar, que Γτσ α es un objeto simétrico en los ı́ndices covariantes.
Como se ha mencionado, dado un objeto con ı́ndices, no se puede concluir que es un vector, hay que
estudiar su comportamiento bajo una transformación de coordenadas y ver si se transforma de acuerdo
a las reglas dadas, en cuyo caso, será un tensor, de otro modo, no será un objeto geométricamente bien
definido.
Veamos cómo se transforma esta Γτσ α . En coordenadas primadas tiene la forma

′ ∂xµ ∂2ξα
Γµν ′ λ′ = ,
∂ξ ∂xν ′ ∂xλ′
α

∂xµ ∂xβ ∂ ∂xγ ∂ξ α
 
= ,
∂xβ ∂ξ α ∂xν ′ ∂xλ′ ∂xγ
′ ′
∂xµ ∂xβ ∂xγ ∂xδ ∂ 2 ξ α ∂xµ ∂xβ ∂ξ α ∂ 2 xγ
= + ,
∂xβ ∂ξ α ∂xλ ∂xν ∂xδ ∂xγ
′ ′
∂xβ ∂ξ α ∂xγ ∂xν ′ ∂xλ′
′ ′
∂xµ ∂xγ ∂xδ ∂xβ ∂ 2 ξ α ∂xµ ∂ 2 xβ
= + , (4.100)
∂xβ ∂xλ ∂xν ∂ξ α ∂xδ ∂xγ
′ ′
∂xβ ∂xν ′ ∂xλ′

51
donde hemos usado el operador como parcial de las primadas y de las no primadas como corresponde.

Obtenemos entonces la transformación para el Γµν ′ λ′ :
′ ′
′ ∂xµ ∂xγ ∂xδ β ∂xµ ∂ 2 xβ
Γµν ′ λ′ = β λ ν ′ Γγ δ + . (4.101)
∂x ∂x ∂x′
∂x ∂xν ′ ∂xλ′
β

El objeto Γ no es un tensor. También le sobra un término como a la derivada del vector, compara
con la ec. (4.96). La idea es tratar de juntar ambos problemas. Al definir una nueva operaci
on, que incluya y cancele los términos que le sobran a la derivada normal, construiremos un operador que
generalize a la derivada, permitiéndonos que, al actuar sobre un objeto geométricamente bien definido,
nos da un nuevo objeto, también geométricamente bien definido. Entonces, introducimos el operador de
derivada covariante:
Aµ ;ν = Aµ ,ν + Γµν α Aα , (4.102)
este operador se reduce al operador de derivada usual cuando no estamos en coordenadas curvilı́neas,
pues en ese caso las transformaciones de coordenadas que dejan invariante al intervalo son lineales, como
vimos, por lo que Γµν α = 0. Veamos cómo se transforma dado una transformación de coordenadas:

+ Γµν ′ λ′ Aλ ,
′ ′ ′
Aµ ;ν → Aµ ;ν ′ = Aµ ,ν ′
′ ′ ′ ′
! ′
∂xµ ′ ∂xβ α ∂xµ ∂ 2 xβ ∂xλ ρ ∂xµ ∂xβ ∂xδ α ∂xµ ∂ 2 xβ ∂xλ ρ
= α ν ′ A ,β − A + ′ Γβ δ + A ,
∂x ∂x ∂x ∂xν ′ ∂xλ′ ∂xρ
β α ν
∂x ∂x ∂x′ λ ∂x ∂xν ′ ∂xλ′
β ∂xρ
∂xµ ′ ∂xβ
Aα ,β + Γα ρ

= ′ βρA ,
∂xα ∂x ν

∂xµ ′ ∂xβ α
= A ;β , (4.103)
∂xα ∂xν ′
vemos que ya queda la transformación como tensor. Con esta operación de derivada covariante, dado un
vector, se deriva covariantemente y, bajo una transformación de coordenadas se transforma

′ ∂xµ ′ ∂xβ α
Aµ ;ν → Aµ ;ν ′ = A ;β , (4.104)
∂xα ∂xν ′
como un tensor mixto. Para un vector covariante, la regla para derivada covariante es:

Aµ;ν = Aµ,ν − Γα
µ ν Aα , (4.105)

que es un tensor. Notemos cómo en ambos casos se reduce a la derivada normal para espacio plano
descrito en coordenadas cartesianas.
Podemos entonces definir la derivada covariante de un tensor mixto:

Rνµ σ τ ;β = Rνµ σ τ,β + Rνα σ τ Γµα β − Rα


µ α µ α µ α
σ τ Γν β − R ν α τ Γσ β − R ν σ α Γτ β . (4.106)

Importante, la derivada covariante de un objeto escalar, coincide con la derivada normal:

φ;α = φ,α , (4.107)

al derivar covariantemente a un escalar, se obtiene un vector covariante, geométricamente bien definido.


De este modo, terminamos de contruir el álgebra tensorial, sabiendo cómo se definen a los tensores
de diferentes tipos y las operaciones de combinación lineal, producto directo, contracción, subir y bajar
ı́ndices y diferenciación covariante.
Antes de pasar a otro tema les queremos mostrar la relación que hay entre la conexión afı́n, Γµα β y la
métrica.

52
Notemos primero que la derivada covariante satisface la regla de Leibnitz:

(Aµ Bν );α = Aµ ;α Bν + Aµ Bν ;α . (4.108)

Al sacar la derivada covariante de un vector covariante se obtiene un tensor: Sαβ = Aα ; β . Se puede


expresar a dicho tensor con el ı́ndice arriba: Sαβ = gα µ Sβµ . Por otro lado:

Sαβ = Aα ; β = (gα µ Aµ ); β ,
= gα µ Aµ; β + gα µ ;β Aµ ,
= gα µ Sβµ + gα µ ;β Aµ ,
= Sαβ + gα µ ;β Aµ , (4.109)

por lo que gα µ ;β Aµ = 0 y, como es para un vector arbitrario, concluimos que

gα µ ;β = 0. (4.110)

Por otro lado, de la definición de derivada covariante

0 = gα µ ;β ,
= gα µ ,β − Γναβ gν µ − Γνµβ gα ν , (4.111)

usando que el tensor métrico es simétrico, ası́ como los ı́ndices covariantes de la conexión afı́n, llego
finalmente a la expresión:
1
Γν αβ = g νσ (gνα,β + gνβ,α − gαβ,ν ) . (4.112)
2
que se les llama los sı́mbolos de Christoffel y son los mismo que aparecieron cuando derivamos la ecuación
geodésica. Los sı́mbolos de Christoffel son la conexión afı́n.

53
Ejercicios 5

1. Demuestra explı́citamente que:

(a)  φ = 0, con  = g µ ν ∇µ ∇ν , y φ una función escalar, se puede reescribir como


1 √
−g g µ ν φ,ν ,µ .

φ = √
−g

Al operador  se le conoce como D’Alambertiano.

2. Utilizando el cuadripotenical electromagnético, Aµ , que se relaciona con el tensor de Faraday Fµ ν =


Aµ; ν − Aν; µ = Aµ, ν − Aν, µ (muestra ésta última igualdad). Escribe las ecuaciones de Maxwell,
F µ ν ; ν = 0 y F(µ ν ;λ) = en términos de este cuadripotencial

3. Considera un espacio de 2 dimensiones con métrica


dr2 + r2 dθ2 r2 dr2
ds2 = − 2
r 2 − a2 (r2 − a2 )
donde r > a, demostrar que las ecuaciones de las geodésicas se pueden escribir como
 2
2 dr
a + a2 r 2 = K r 4 .

donde K es una constante tal que K = 1 si la geodésica es nula. Si hacemos r dθ


dr = tan φ, demuestra
que este espacio se mapea en el plano euclideano con coordenadas polares (r, φ) y que las geodésicas
se mapean en lı́neas rectas.

4. Considera el tensor de energı́a esfuerzos de un fluido perfecto:


uµ uν
T µν = ρ0 c2 h + p g µν ,
c2
con ρ0 la densidad de energı́a en reposo, h la entalpı́a por unidad de energı́a, definida como h =
1 + ǫ + c2pρ0 , con ǫ la energı́a interna y p la presión. Demuestra que:

(a) Tµν uµ uν = ρ0 c2 (1 + ǫ) ≡ µ, lo que nos da una forma covariante de definir a la densidad de


energı́a, µ
(b) Si me voy a un sistema de referencia en el que me muevo con el fluido, (este
 sistema
 se le llama el
~
~
marco comovil), el tensor de energı́a esfuerzos del fluido perfecto ∂t ~v + ∇ · ~v ~v + ∇ p2 + ∇~ φ =,
µc
con φ el potencial gravitatorio.toma la forma

−µ c2 0 0 0
 
0 p 0 0
T µν = 


 0 0 p 0
0 0 0 p

Demuéstralo.
(c) Finalmente, muestra que la divergencia del tensor de energı́a esfuerzos igual a cero, T ν µ ; µ = 0,
junto con la ecuación de continuidad, j µ ; µ = 0 implica la ecuación de Euler para fluidos (en el
  ~ p
~ ~v + ∇
lı́mite o relativista), ∂t ~v + ~v · ∇ ~
2 + ∇ φ =, con φ el potencial gravitatorio. Muestra
µc
que también implica la forma de la primera ley de la termodinámica para procesos adiabáticos:
d U + p dV = 0

54
5. El tensor de energı́a esfuerzos para el campo escalar es
1
Tµν = φµ φν + gµν (φα φα + V (φ)) ,
2
donde φµ denota ∂µ φ y V (φ) es el potencial escalar. Muestra que su divergencia igual a cero,
implica a la ecuación de Klein Gordon:
dV
φ − = 0.

55
56
Capı́tulo 5

Fı́sica en el espacio tiempo

En relatividad especial, veı́amos e introducı́amos conceptos que nos permitı́an dejar a las ecuaciones de
la Fı́sica, vimos en particular a las del electromagnetismo, invariantes bajo transforamciones de Lorentz.

Nos preguntamos sobre la elección de coordenadas para estudiar a un problema dado y veı́amos que
tampoco deberı́an las ecuaciones de la Fı́sica de depender del sistema de coordenadas que uno elija para
estudiar un fenómeno dado y considerabamos la idea de que pudiera ser que no fuesen las coordenadas
las que sean curvilı́neas, sino que el espacio mismo donde estuviésemos estudiando fuese curvo.

Vimos entonces que nos convenı́a tner una herramienta matemática que nos permitiera conocer con
claridad cómo pasar de un sistema de coordenadas a otro, o de un sistema inercial a otro, por lo que
introdujimos y estudiamos a los tensores.

Regresando a nuestro planteamiento de que la Fı́sica sea descrita de un modo genérico, es decir, de
que queremos expresar a las leyes que conocemos en forma covariante, que sean válidas manteniendo su
caracter independiente tanto del estado de movimiento del observador como de las coordenas utilizadas.
Es un principio de Relatividad General.

Pero a nivel práctico, queremos escribir las leyes de la Fı́sica en el cuadriespacio, para el caso plano
y una vez descritas aqui, como dichas leyes deben ser válidas en todos los sistemas de referencia y todos
ellos son equivalentes, tendremos que si se vale en un sistema de referencia, debe ser válida en todos.

Pero si ya reescribimos a la ley bajo estudio de un modo covariante en el espacio tiempo plano, sólo
nos resta generalizar dicha ley a cualquier otro espacio-tiempo, plano o no, con coordenadas cartesiana
o no. Y la receta es sencilla: en la ecuación ya generalizada al caso de espacio-tiempo plano, substituyo
como por punto y coma, es decir, traduzco la derivada usual a derivada covariante, si aparece el tensor
de Minkowski, ηµ ν , se cambia por un tenosr métrico general.

Veamos varios ejemplos de objetos y leyes de la Fı́sica que describiremos en forma covariante.

57
5.1 Cuadrivecctor de flujo
Recordemos la ecuación para la cuadrivelocidad, −c2 = gµ ν uµ uν reescrita en el espacio plano es
 2  2  2  2
dct dx dy dz
−c2 = ηµ ν uµ uν = − + + + ,
dτ dτ dτ dτ
 2  2  2  2 !
2 dt dx dy dz
= −c 1− − − ,
dτ dt dt dt
 2    
dt v x 2  v y 2  v z 2
= −c2 1− + + ,
dτ c c c
 2   v 2 
2 dt
= −c 1− , (5.1)
dτ c
por lo que, en el lı́mite no relativista, cuando las velocidades son mucho menores a la velocidad de la luz,
de la ecuación anterior tenemos que, el tiempo coordenado tiende a coincidir con el tiempo propio.
Veamos una ecuación muy importante en Fı́sica, la ecuación de continuidad

Figura 5.1: diagrama de continuidad de un flujo.

~ · (ρ0 ~v ) = 0,
∂ t ρ0 + ∇ (5.2)
que describe el cambio en la densidad, ρ0 , contenida en un volumen dado, moviéndose a velocidad ~v . La
ecuación se deriva considerando de dos maneras el flujo que sale de un volumen V0 : por un lado, dicho
flujo se puede escribir como ρ0 ~v · df~, con df~ el vector perpendicular al elemento de área y, por otro
H
R
lado, dicho flujo es ∂t ρ0 dV . Igualando ambas expresiones y usando el teorema de Gauss, llegamos a
la ecuación de continuidad.
Ahora, la idea es reescribir ésta ecuación en el espacio tiempo. Para ello notamos dos cosas: primero
que tenemos al llamado vector de flujo o vector de corriente, ~j = ρ0 ~v y, segunda, que podemos
reescribir a la ecuación de continuidad, en coordenadas cartesiana, como (ρ0 ),t + (ρ0 v i ),i = 0. Ambas
ideas nos sugieren definir a un cuadrivector de flujo,

j µ = ρ0 u µ , (5.3)

y reescribir a la ecuación de continuidad como

j µ , µ = 0. (5.4)

Revisando, al desarrollar la ecuación anterior obtengo j µ ,µ = j 0 ,t + j i ,i = ρ0 u0 ,t + ρ0 ui ,i = ρ0 u0 ,t +


ρ0 u0 v i ,i = 0, donde desarrollamos la convención de suma de Einstein y usamos la definición del cuadrivec-
tor de flujo y la regla de la cadena. Ahora, si nos vamos al lı́mite newtoniano, que es de donde salió
originalmente la ecuación, acabamos de mostrar que ahı́ dt ≡ dτ , por lo que u0 ≡ 1, por lo que vemos que,
en efecto, nuestra ecuación se reduce a la ecuación conocida en el lı́mite, por lo tanto, la consideramos
una generalización válida de la ecuación de continuidad al cuadriespacio.

58
Muy bien, pero, el o la lector@ atent@ notará que esta no es una ecuación covariante buona fide.
Sabemos que la derivada normal no respecta el que los objetos queden geométricamente bien definidos.
Cierto, pero la derivada covariante, ¡sı́ lo hace! Por lo que proponemos a la ecuación covariante de
continuidad, o, simplemente, a la ecuación de continuidad como

j µ ; µ = 0. (5.5)

Esta sı́. Es una ecuación covariante, válida en un sistema de referencia (el plano), por lo tanto, válida en
todos los sistemas de referencia. ¿Qué tal?

5.1.1 Geodésicas de nuevo


Otra ecaución muy importante es la de las geodésicas que ya vimos, ec.(4.72). Pero no se ve muy
covariante con los sı́mbolos de Christoffel ahı́ explı́citos que, además, ya vimos que son la conección afı́n
y no están geométricamente bien definidos. Las podemos reescribir como

d uµ
+ Γµ α β uα uβ = 0. (5.6)

Ahora, es útil notal que, para un objeto función de las coordenadas, por regla de la cadena:

dA ∂A d xλ
= = Aµ , λ u λ , (5.7)
dτ ∂ xλ d τ
por lo que podemos reescribir al primer término de la ecuación de geodésicas como

(uµ , λ + Γµ α λ uα ) uλ = 0, (5.8)

donde factorizamos a la cuadrivelocidad, aprovechando que su ı́ndice es mudo en los dos sumandos. Pero
el término entre paréntesis ¡no es sino la derivada covariante de uµ !. Por ello, podemos escribir a la
ecuación de las geodésicas como
uµ ;ν uν = 0, (5.9)
que ya quedan claramente covariantes y muy elegantes.
Antes de dejar a las geoésicas, es interesante ver su lı́mite newtoniano. Considerando el término con
los Christoffels, desarrollamos el término con las velocidades:
2
dxα dxβ d c t dxi dxi dxj

dct
Γµ α β = Γµ 00 + 2 Γµ 0i + Γµ ij ,
dτ dτ dτ dτ dτ dτ dτ
 2
dxi dxi dxj
 
dt
= Γµ 00 + 2 Γµ 0i µ
+ Γ ij c 2
,
dct dct dct dτ
 2
vi vi vj
 
dt
= Γµ 00 + 2 Γµ 0i + Γµ ij c2 , (5.10)
c c c dτ

como antes. En el lı́mite newtoniano, v << c en cualquiera de sus componentes y dt ≡ dτ . Por lo que
este término de la ecuación geodésica se reduce a c2 Γµ 00 , ya que como veremos, también el término Γµ 00
es el dominante en los Christoffels.
En efecto, para acercarnos al caso newtoniano, de coordenadas cartesianas, podemos considerar que la
métrica es sólo una pequeña desviación de la plana, y que esta desviación no depende del tiempo (como
en general se comportan los potenciales gravitatorios newtonianos). De la definición del Christoffel,
ec.(4.73), tenemos que Γµ 00 = 21 g µ σ (2 gσ0,ct − g00 ,σ ) ≡ ǫ η µ σ φ, σ ; donde usamos que es estática, que

59
gµ ν = ηµ ν + ǫ hµ ν , con ǫ << 1, lo que implica que g µ ν = η µ ν − ǫ hµ ν , ası́ como denotamos a h00 = −2 φ,
con φ una función adimensional. Los demás coeficientes de Christoffel son más pequeños.
Respecto al primer término de la ecución de geodésicas, desarrollamos la suma de Einstein: uµ , λ uλ =
i
u , c t u0 + uµ , i u0 vc , por lo que la ecuación geodésica en el lı́mite newtoniano se reduce a
µ

i
 
0 µ µ v
u u ,ct + u ,i + ǫ η µ σ (c2 φ), σ = 0,
c
por lo que, la componente µ = 0, recordando que consideramos un campo estático, implica a primer
orden, que u0 , c t = 0. Como ya tenı́amos que a este orden, u0 = c, la ecuación nos dice que se queda
con el valor constante, la de la luz; el tiempo coordenado sigue siendo muy cercano al tiempo propio. La
j
componente espacial, µ = j, considerando u0 = c y de nuevo usando que uj = u0 vc , implica:
~ ~v + ∇(ǫ
∂t ~v + ~v · ∇ ~ c2 φ) = 0, (5.11)

al identificar a φ con el potencial gravitatorio, adimensional, obtenemos ¡la ecuación de Euler de los
fluidos! En el caso sin presión y en presencia de un potencial gravitatorio.
Muy interesante. De este modo, vemos que el lı́mite newtoniano de las ecuaciones de geodésicas no
son una especie de segunda ley en el cuadriespacio, donde se hablabla de una ”fuerza geométrica”, sino
que su lı́mite nos lleva a las ecuaciones de Euler de los fluidos. Las partı́culas al moverse libremente en
el espacio curvo, generalizan al movimiento de los fluidos.

5.1.2 Electromagnetismo en 4d
De este modo, vamos viendo la manera de reescribir a las leyes de la Fı́sica del lenguaje newtoniano a
la descripción primero en el cuadriespacio y después de una modo completamentamente covariante, ası́
como la manera de regresar una ecuación covariante, al caso newtoniano.
Veamos ahora a las ecuaciones del electromagnetismo,

Figura 5.2: Descarga producida por bobinas Tesla.

las ecuaciones Maxwell:


~ ·E
~ = ρQ ~− 1 ~ ~ = 4 π j~Q ,
∇ ǫ0 , ǫ0 ∂t E µ0 ∇ ×B (5.12)
~ ·B
∇ ~ = 0, 1 ~ + ǫ0 ∇
~ ×E
~ = 0,
µ0 ∂ t B (5.13)

donde E, ~ B~ son los campos eléctrico y magnético, ρQ es la densidad de carga y j~Q la corriente y
ǫ0 , µ0 son la permetitividad eléctrica en el vacı́o y la permeabilidad magnética en el vacı́o (o constante
magnética),respectivamente y satisfacen ǫ0 , µ0 = 1/c2 .
Es interesante notar que las ecuaciones de la electrodinámica forman un sistema contreñido, con
restricciones, es decir, el sistema de ecuaciones diferenciales consiste de seis ecuaciones de evolución y
dos ecuaciones que no evolucionan, es decir, que se deben satisfacer a todo tiempo y a éstas se les llama
constricciones. Esto es algo común con la interacción gravitatoria. Nótese también la asimetriı́a de las

60
ecuaciones, no hay una carga monopolar magnética, ni su correspondiente corriente. Esto es algo que
a algunos investigadores les ha parecido iconsistente y dedican su vida a la búsqueda del mono-polo
magnético. En la opinión de los autores, no es justificada dicha búsqueda, ¡ası́ están bien las ecuaciones
de Maxwell!
Queremos entonces escribir a las ecuaciones de Maxwell de un modo covariante, independiente del
sistema de coordenadas con las que se describan o del estado de movimiento de quien las observe. En-
tonces, las ecuaciones de Maxwell deben ser descritas en el espacio-tiempo. Ya vimos que para definir
objetos ahı́, hemos unido conceptos como tiempo y espacio, energı́a y momento, carga y corriente. Es de
suponer entonces que queremos unir en un sólo objeto a los campos eléctrico y magnético.
Son entonces seis entradas, por lo que no caben en un tensor, si me voy al siguiente objeto, es un
tensor de dos ı́ndices, pero en general éste tiene 16 entradas independientes (en 4d), por lo que se pasa.
Sin embargo, si consideramos que dicho tensor sea simétrico, tendremos diez entradas independientes y,
si consideramos que sea antisimétrico, me quedan seis, suena bien.
Consideremos entonces, para que sea el objeto que une en un sólo concepto a los campos campos
eléctrico y magnético, un tensor con dos ı́ndices antisimétrico, F µ ν = −F ν µ . Queremos reproducir,
reescribir las ecuaciones de Maxwell. Muy bien, fijémonos en las primeras cuatro , ecs. (5.12), una que es
constricción y otra es una vectorial. En ambas aparecen los campos derivados y están igualadas a carga
y corriente. Con lo que ya hemos visto, vemos que para el lado derecho definiremos al cuadrivector de
corriente o flujo de carga, j µ Q = (ρQ , ~jQ ). Del lado izquierdo, tenemos derivadas de los campos, es decir,
deber entrar derivadas del tensor F y, como queremos cuatro ecuaciones, suena natural probar con la
divergencia, es decir, consideremos
F µ ν , ν = jµ. (5.14)
Al hacer µ = 0, obtengo F 0 ν ,ν = j 0 , es decir, F 0 i ,i = ρQ , donde usamos que F 00 = 0, por antisimetrı́a,
comparando con las ecuaciones que queremos reproducir, vemos que, haciendo F 0 i = ǫ0 E i , recuperamos
la de Coulomb. ¡Vamos bien!
Hagamos entonces µ = j, del lado derecho obtenemos la componente j de la corriente y del izquierdo
F j 0 ,t + F j l ,l , recordando que F j l ,l = 0 cuando j = l. F j 0 ya lo identificamos como la componente
j del campo eléctrico, obteniendo ǫ0 E,tj , muy bien e identificamos a F j l ,l como a la componente j del
rotacional de un vector, por lo que, tomando a dicho vector como B/mu ~ 0 , obtenemos que haciendo µ = j
en ec. (5.14), obtenemos la componente j del la ecuación vectorial de ec. (5.12). ¡Perfecto! Ya tenemos
entonces que, en efecto, ec. (5.14) es la manera de escribir a cuatro de las ecuaciones de Maxwell en el
cuadriespacio.
Para terminar, usando el principio de equivalencia, vemos que las ecuaciones son correctas en el espacio
plano y con coordenadas cartesianas y están escritas de un modo válido en plano, su generalización a
cualquier espacio curvo o con coordenadas curvilineas es, siguiendo la receta, , →;:

F µ ν ; ν = jµ. (5.15)

son las primeras cuatro ecuaciones de Maxwell perfectamente covariantes. El tensor F tiene entonces la
forma
ǫ0 E 1 ǫ0 E 2 ǫ0 E 3
 
0
1
−ǫ E 1
 0 0 µ0 B3 − µ10 B2 
F µν =  , (5.16)

2 1 1
−ǫ0 E − µ0 B3 0 µ0 B 1 
1
−ǫ0 E 3 µ0 B2 − µ10 B1 0
y se le conoce como tensor de Faraday (¡de ahı́ la F!).
Las otras cuatro ecuaciones de Maxwell, ecs.(5.13), no son tan intuitivas, pero se puede mostrar que
las ecuaciones
Fµ ν ;λ + Fλ µ ;ν + Fν λ ;µ = 0, (5.17)

61
en efecto, reproducen a las otras cuatro ecuaciones, cuando me reduzco al caso plano, considerando coma,
en vez de punto y coma. Queda de tarea comprobarlo, teniendo cuidado de bajar los ı́ndices, es fácil ver
que el tensor con ı́ndices abajo, covariante, es también antisimétrico. Nótese que son muchas ecuaciones,
¡64! y nosotros sólo queremos cuatro, por lo que muchas son idénticamente cero y otras son equivalentes,
demuéstralo.
De este modo, vemos que las ecuaciones de Maxwell son descritas por ecs.(5.15, 5.17) de un modo
completamente covariante, por lo que su forma no cambia bajo transformaciones de sistemas de referencia,
no sólo para transformaciones de Lorentz, sino para cualquier transformación entre sistemas inerciales y
descritas en cualquier sistema de coordenadas.
Por ello, nos esperamos hasta ahora para probar que la teorı́a electromagnética es una teorı́a co-
variante, por ello no lo mostramos en la sección de relatividad especial, a pesar de que fue una de las
motiviciones de Lorentz, encontrar unas transformaciones que dejaran invariantes a las ecuaciones de
Maxwell, pues ahora vemos que no es por las transformaciones sino por la manera de escribir a las
ecuaciones como vemos y probamos su covariancia.
Vemos ası́, cómo se va haciendo la conexión con la Fı́sica conocida y se describe en este nuevo contexto
de espacio tiempo de manera covariante en dicho espacio-tiempo.
Otro punto interesante, es la existencia o uso de los potenciales electromagnéticos. De cursos anteri-
ores, sabemos que es posible expresar a los campos eléctrico y magnético en términos de dos potenciales,
uno vectorial, A~ y uno escalar, φ de la siguiente manera:

~ = −∂t A
E ~+∇
~ φ, ~ =∇
B ~ × A.
~ (5.18)

Nuevamente, queremos unir estos potenciales, que son cuatro componentes, en un sólo concepto. Ya
con la experiencia que tenemos, es de esperar que el objeto sea

~
Aµ = (φ, A), (5.19)

el que sea un cuadrivector bien definido, lo tomamos como definición, es decir, consideramos que, en efecto,
bajo una transformación de coordenadas, se transforma como dicta la regla, imponiendo condiciones al
potencial escalar y vectorial.
Y, de las ecuaciones ecs.(5.18) y la definición del tensor de Faraday en términos de los campos
eléctrico y magnético, nos permite inferir que este tensor de Faraday se relaciona con el cuadripotencial
de la siguiente manera:
Fµ ν = 2 A[µ ;ν] , (5.20)

los paréntesis cuadrados me indican antisimetrización, A[µ ;ν] = 12 (Aµ ;ν − Aν ;µ ). Es fácil ver que la
derivada covariante antisimetrizada se reduce a la derivada usual, se anulan los Christoffels, por lo que
podemos escribir Fµν = A[µ ,ν] ,, pero se ve feyucho. Es importante notar que al cuadripotencial le podemos
sumar el gradiente de una función escalar arbitraria y, dado que las derivadas normales conmutan, la
definición del tensor de Faraday, que es, a fin de cuentas, lo que tiene Fı́sica, no cambia. Esta propiedad
se conoce como libertad de norma del potencial electromagnético:

õ = Aµ + f (xλ ), µ ⇒ Fµ ν = 2 A[µ ;ν] = 2 Ã[µ ;ν] , (5.21)

por lo que siempre es posible elegir una componente del potencial electromagnético arbitrariamente, o
dar una relación arbitraria entre dichas componentes.
Ası́, podemos reescribir a las ecuaciones de Maxwell ahora en términos del cuadripotencial, queda
de tarea hacerlo y pensar una norma que le da un sentido muy interesante a las ecuaciones ası́ escritas,
¡inténtalo lector!

62
Las ecuaciones de Maxwell nos permiten ver varias propiedades de las ecuaciones escritas de modo
covariante. Para empezar, veamos una relación muy útil. Desde el álgebra matricial se conoce la siguiente
relación general. Dada una matriz A con determinante A, dicha relación es:
 
d A = Tr à d A , (5.22)

con à la matriz adjunta de A. Pero en nuestro caso, à = A A−1 , con A−1 la mariz inversa. Entonces

d (ln A) = Tr A−1 d A ,

(5.23)

Con lo que, para el caso del tensor métrico, tenemos la siguiente relación:
−g,λ
= g µν gµν ,λ , (5.24)
−g

con g el determinante del tensor métrico y le puse el menos pues ya sabemos que son espacios lorentzianos.
Esta es una relación muy útil que nos permite simplicar varias de las ecuaciones que se obtienen.
Por ejemplo, tenemos que para los sı́mbolos de Christoffel se puede ver que la contracción de sus
ı́ndices implica
1
Γµµλ = g µν gµν ,λ , (5.25)
2
por lo que, usando la relación recién derivada, tenemos que podemos expresar a los Christoffels contraidos
como: √
µ
−g ,λ
Γµλ = √ . (5.26)
−g
Esta es una relación no sólo bonita sino muy útil, veamos que le pasa a la divergencia covariante de un
vector Aµ , es decir a Aµ; µ , que vemos que es una divergencia, derivarlo cada ı́ndice por su correspondiente
coordenada:

Aµ;µ = Aµ,µ + Γµµλ Aλ , (5.27)



λ
−g ,λ λ
= A,λ + √ A ,
−g
1 √ √
−g Aλ,λ + −g ,λ Aλ ,

= √
−g
1 √
−g Aλ ,λ .

= √ (5.28)
−g

Se va la derivada covariante y me queda la derivada usual. Esto ayuda mucho a simplificar los
cálculos y a estudiar a las ecuaciones. También se tiene que, para un tensor antisimétrico, F µν = −F µν ,
su divergencia satisface la relación:

1 √
F;νµν = √ −g F µν ,ν .

(5.29)
−g

Y, para un escalar, φ, su D’Alambertiano,  φ = ∇α ∇α φ, satisface

1 √
−g g µν φ,µ ,ν .

φ = √ (5.30)
−g

¡Que cosa! Ya que la aprendemos a usar, ¡la queremos quitar!.

63
Figura 5.3: Comportamientos de los fluidos.

5.1.3 Hidrodinámica 4d
Otro tipo de materia, materia-energı́a, que es importante poder describir en forma covariante son los
fluidos.
Son sistemas muy interesantes que describen muchos de los fenómenos con los que estamos en contacto
y que nos interesarán en la relatividad general.
Dada la definición de fluido, como la da Laudau, por ejemplo [?], como un sistema macroscópico,
un medio denso, lo que implica que cualquier elemento de volumen del fluido, por más pequeño que se
considere, es suficientemente grande para contener una gran cantidad de moléculas.
Una partı́cula de fluido, en el sentido dado arriba, es la que sigue una trayectoria determinada por
una velocidad ~v y tiene densidad ρ0 , lo que nos permite definir al vector de flujo y su generalización al
cuadriespacio, ec.(5.3) y su correspondiente ecuación de conservación, ec.(5.4):

j µ = ρ0 u µ , j µ ; µ = 0. (5.31)

También ya vimos que la ecuación de las geodésicas, es la manera covariante de escribir a las ecauciónes
de Euler en el caso sin presión. Entonces, como queremos un objeto que, al sacarle la divergencia (como
ya vimos en el caso de electromagnetismo y el tensor de Faraday), me de las de Euler, podemos definir
al siguiente objeto, geométricamente bien definido:

T µ ν = ρ0 u µ u ν , (5.32)

al sacarle la divergencia e igualarla a cero, usando las propiedades de regla de Leibnitz para la derivada
covariante:
T µ ν ; ν = uµ (ρ0 uν ); ν + ρ0 uµ ; ν uν = 0,
pero el primer sumando se anula independientemente por la conservación del flujo, por lo que la diver-
gencia del tensor igualada a cero nos da un término proporcional a la ecuación de las geodésicas, que
ya vimos que son la generalización de las ecuaciones de Euler en el cuadriespacio. De este modo, nos
convencemos de que el tensor dado por la ec. (5.32), junto con la ecuación de continuidad, describen a un
fluido sin presión. Este tipo de fluido con presión cero se les conoce en relatividad general como polvo.
Agregar un término que, en el lı́mite newtoniano que de el término de presión en las ecuaciones de
Euler, ∇~ p/ρ0 , es directo, basta con añadirle al de polvo un término con presión, p sin embargo hay que
sumarlo también en el témino de la densidad porque en el espacio tiempo de Minkowski un observador
que se mueve con las parı́culas no siente ninguna presión. Dado que la derivada covariante no ve al tensor
métrico, tenemos:
T µ ν = (ρ0 c2 + p) uµ uν + p g µ ν , (5.33)
sabemos qeu al tomar la divergencia aparecerá un término p, ν g µ ν que, al considerar una presión que sea
independinte del tiempo, nos llevará en el lı́mite newtoniano (también se debe considerar que el término

64
de la presión es muy pequeño comparado con la densidad) a tener sumado al término de las geodésicas,
un término con ∇ ~ p. Finalmente, al dividir entre el a densidad, ρ0 , recuperamos las ecuaciones de Euler
con todo y término de presión.
Sin embargo, para tener un fluido general que incluya procesos internos se modifica el primer coeficiente
del tensor dado por ec. (5.33) obteniendo:

uµ uν
T µ ν = ρ0 c 2 h + p g µν , (5.34)
c2
con ρ0 la densidad de energı́a en reposo, h la entalpı́a por unidad de energı́a, definida como h = 1+ǫ+ c2pρ0 ,
con ǫ la energı́a interna y p la presión, dejámos explı́citos los términos con la velocidad de la luz para
enfatizar a las unidades. Este es el tensor de energı́a esfuerzos del fluido perfecto.
Veamos nuevamente las ecuaciones que obtenemos al igualar su divergencia a cero. Entonces, de
ec. (5.34), T µ ν ; ν = 0 implica (recuerden que ρ0 , ǫ y p son escalares, su derivdada covariante se reduce a
la usual).

uµ ; ν uν uν ; ν  uν uµ
 
2 ν 2
ρ0 c h + (1 + ǫ) c (ρ0 u ); ν + p + ρ0 c ǫ, ν + p, ν + p, ν g µν = 0. (5.35)
c2 c c c
ρ0 , ν uν
Usando la ecuación de continuidad, dos veces, tanto j ν ; ν = 0, como uν ; ν = − ρ0 , obtenemos:

uµ ; ν uν
 ν µ
ρ0 , ν

u u
ρ0 c2 h + ρ 0 c 2
ǫ ,ν − p + p ,ν + p, ν g µν = 0. (5.36)
c2 ρ0 c c

Ahora, contraemos con uµ y obtenemos:

ρ0 , ν
 
ρ0 c 2 ǫ , ν − p uν = 0, (5.37)
ρ0

donde pasaron varias cosas. Primero, uµ uµ ; ν = 0, demuéstralo, es buen ejercicio. Esto nos quitó el
primer término. Al contraer tenemos que uµ uµ = −c2 (¿no es sugestivo para la pregunta anterior?) y
con g µν le sube el ı́ndice, por lo que se cancelan los términos de derivada de presión. Y ası́, llegamos a
ec. (5.37).
Usando esta ecuación de regreso en ec. (5.35), tenemos que la podemos reescribir como

uµ ; ν uν uµ uν
 
p, ν µν
+ g + = 0. (5.38)
c2 ρ0 c 2 h c2

que es, finalmente, la ecuación generalizada de Euler para fluidos perfectos con presión y energı́a interna,
totalmente covariante. En efecto, notemos inicialmente que no son cuatro ecuaciones, ya sólo son tres
independientes, pues, al contraer con uµ queda idénticamente igual a cero. Segundo, el término ρ0 c2 h =
ρ0 c2 (1 + ǫ) + p = µ c2 + p, donde hemos definido a

µ = ρ0 (1 + ǫ) , (5.39)

como la densidad total de energı́a. en la fı́sica newtoniana, la cotidiana, el término de presión es muchı́simo
menor que el término de densidad por la velocidad de la luz al cuadrado. Esta es una de las razones
de mantener unidades, poder tener intuición de los órdenes de magnitud de las cantidades fı́sicas. Aún
si consideramos presiones que nos parecerı́an enormes, como la presión en los abismos marinos, a doce
kilómetros de profundidad, ese término sigue siendo mucho menor que la densidad por la velocidad de la
luz al cuadrado. Este término de presión será significativo sólo en condiciones de altas, altı́simas presiones,
µ ν
como en una estrella de neutrones; en los casos usuales, se puede despreciar. Ası́ mismo, el término u c2u

65
en general se puede despreciar frente al término de la métrica; el que podrı́a pintar es la componente 00,
pero, como en el caso newtoniano consideramos que la presión no depende del tiempo, este término es
p
cero, por lo que la ecuación (5.38), en el lı́mite newtoniano se reduce a uµ ; ν uν + µ, ν g µ ν = 0, que ya
sabemos que nos llevará a las ecuciones de Euler usuales, con µ representando a la densidad newtoniana,
pero sabemos que incluye la densidad en reposo, ρ0 y una densidad de energı́a interna, ǫ ρ0 .
Por último, como T µ ν ; ν = 0, son cuatro ecuaciones, y ya vimos que incluye la generalización covariante
de las tres de Euler (tres, pues es una ecuación vectorial), ¿Qué pasa con la cuarta? Para ver esto,
regresamos a la ecuación que tambien obtuvimos de pedir que se anulara la divergencia, la ecuación
(5.37). Ya vimos que a, ν uν = dd τa , cuando a es una función de las coordenadas, entonces podemos
reescribir dicha ecuación como  
m
d
2 dǫ ρ0
mc +p = 0,
dτ dτ
donde reacomodamos un poco y multiplicamos   por una masa caracterı́stica del sistema, la masa de cada
partı́cula de fluido, por ejemplo. Pero d ρm0 = d V , con V un volumen caracterı́stico del sistema. Como
τ es un parámetro, puedo entonces escribir esta ecuación como

d U + p d V = 0, (5.40)

donde definimos a U = m c2 ǫ. Pero esta es la energı́a interna del sistema, por lo que podemos ver que
recuperamos la primera ley de la termodinámica para procesos adiabáticos, d Q = 0.
De este modo, vemos que la divergencia igual a cero del tensor de energı́a esfuerzos del fluido perfecto
contiene a la generalización covariante de las ecuaciones de Euler, ası́ como a la de la primera ley de la
termo, implicando que los procesos descritos por estos fluidos, son adiabáticos.

5.1.4 Campo escalar


Finalmente, queremos mencionar a otro tensor de energı́a esfuerzos que describe a otro tipo de materia:
el campo escalar. Este es un campo interesante y los autores de las presentes notas lo han trabajado
en diversas investigaciones, estudiando la posibilidad de que la materia obscura, algo que mencionaremos
en el capı́tulo de cosmologı́a, sea descrita por dicho campo escalar.
Por ahora, basta con que presentemos al tensor de energı́a esfuerzos para el campo escalar:

c4
 
1
Tµν = φµ φν + gµν (φα φα + V (φ)) , (5.41)
8πG 2

donde φµ denota ∂µ φ y V (φ) es el potencial escalar. Queda de tarea mostrar que su divergencia igual a
cero, implica a la ecuación de Klein Gordon:
dV
φ − = 0. (5.42)

Esta es la ecuación que rige la dinámica del campo escalar. Es una dinámica muy rica y, hasta donde
hemos investigado, el campo escalar (complejo) sigue siendo un candidato viable para describir a la
materia obscura. El campo escalar también se usa para describir otras posibles etapas de la evolución
de nuesro Universo, ası́ como para describir estados condensados de las partı́culas, al identificarlo con la
función de onda.

66
Capı́tulo 6

Principio de equivalencia

Ya armados con el álgebra tensorial, tenemos entonces que podemos reescribir a las leyes de la Fı́sica de un
modo perfectamente covariante, es decir independiente del observador en particular y de las coordenadas
que se usen y, además, sabemos cómo pasar de un sistema de referencia dado a cualquier otro.
Esto inclusive ya es más de lo necesario, pues la Fı́sica está definida entre sistemas de referencia
inerciales; nosotros tenemos leyes de transformación entre cualesquiera sistemas, y en sı́ nos interesan las
transformaciones entre sistemas de referencia inerciales, eso sı́, independientemente de las coordenadas
que se estén usando. Estas transformaciones son un poco más generales que las de Lorentz, pues incluyen
translaciones y, de hecho, forman un grupo, el llamado grupo de Poincaré, Ası́ que vemos que las leyes de
la Fı́sica no dependen del sistema de referencia. Por otro lado, tenemos este resultado que los cuerpos, al
estar libres de fuerzas que actúen sobre ellos, siguen rectas que, cuando el espacio es curvo, dichas “rectas”
son geodésicas, es decir, ya no siguen el quinto postulado de Euclı́des, pero siguen siendo las trayectorias

Figura 6.1: Euclı́des, 325 - 265 antes de Cristo y fragmento de papiro de Los elementos.

que minimizan la distancia, en un espacio dado caracterizado por el tensor métrico, gµ ∋ . Entonces,
cuando vemos una trayectoria no-recta y consideramos que hay una fuerza que actúa sobre ella, por
primera ley de Newton, ¿podrı́amos pensar que no es que haya fuerza, sino que sı́ es recta pero en espacio
curvo? Es decir, cuando vemos las trayectorias de los cuerpos en el sistema solar, digamos a las elipses,
la idea de Newton es que siguen esa trayectoria debido a la acción de la Fuerza gravitatoria que ejerce
el Sol sobrel los planetas, pero, ¿pudiera ser que siguen esa trayectoria, no por la acción de una fuerza,
sino que dicha trayectoria es la recta en un espacio-curvo? De este modo, dada la trayectoria, podrı́amos

67
determinar cuál es la curvatuar del espacio tiempo que tiene como geodésicas a dichas trayectorias... Muy

Figura 6.2: Triángulo formado por geodésicas en la esfera

interesante. Estos razonamientos nos llevan a entender la postulación del principio de equivalencia:
Un campo gravitacional se puede describir como un sistema en espacio curvo, nos llevan a una propuesta
básicamente genial. No sabemos si ası́ se le ocurrió a Albert Einstein, pues, como mencionamos, no era
dado a citas ni agradecimientos, pero es una posibilidad que lo haya pensado ası́.
Otra manera de postular esta equivalencia entre gravitación y curvatura se tiene lléndonos hasta la
época de Galileo. él nota que los cuerpos caen al mismo tiempo, independiente de su masa, es decir, que
la fuerza gravitacional actúa del mismo modo sobre todos los cuerpos. Ya con Newton, se propone que la
masa que aparece en su segunda ley, que se le llama masa inercial, es la misma que la masa que aparece
en su su ley de gravitación universal, la masa gravitacional y se han hecho muchos experimentos donde
se demuestra que, efectivamente, estas masas coinciden.
Einstein, al pensar sobre esto, se da cuenta de que si uno está en un sistema bajo un campo grav-
itacional, digamos constante para simplificar la idea o uno está en un sistema acelerado, en este caso el
equivalente serı́a con aceleración uniforme entonces, como la aceleración actúa sobre los cuerpos indepen-
dientemente de su masa inercial y la fuerza de gravedad también actúa sobre los cuerpos independien-
temente de su masa gravitacional y, como ambas son equivalentes. El considera que son la misma. Por
otro lado, si estoy en un sistema cerrado en caida libre, todos los cuerpos, yo incluido, flotarı́amos. Todos
respondemos igual a esa aceleración, por lo que ¡no podrı́amos detectarla! Es como si estuviésemos en un
sistema inercial.
Con ello, llegamos nuevamente al principio de equivalencia. En efecto, Einstein propone el Principio
de equivalencia de la Gravitación y la inercia, que es: En cada punto del espacio tiempo en un
campo gravitacional arbitrario, es posible elegir un sistema coordenado localmente inercial tal que, dentro
de una región suficientemente pequeña alrededor de dicho punto, las leyes de la Naturaleza toman la
misma forma que en un sistema de coordenadas cartesianas no acelerado en ausencia de gravedad.
De este modo, uniéndo a estas dos ideas, primero que un sistema no acelerado, es un sistema sin
campo gravitacional y lo puedo describir como el espacio tiempo de Minkowski, un sistema acelerado,
donde actúa un campo gravitacional, lo describo como un sistema en el espacio-tiempo donde el elemento
de lı́nea queda descrito por el tensor métrico, gµν . Y, el principio de equivalencia lo veo como en cualquier
punto de un espacio tiempo curvo, puedo dar una región en la cual la métrica se reduce a la de Minkowski.
Notemos que, al derivar al lı́mite newtoniano de la ecuación de geodésicas y obtener las ecuaciones de
Euler, ec. (5.38), obtuvimos que identificábamos
 
φ
g00 = − 1 + 2 2 , (6.1)
c
con φ el potencial newtioniano. Es decir, ya estábamos obteniendo que la geometrı́a, dada por el tensor

68
métrico, se relaciona con la fuerza gravitatoria, en especı́fico con el potencial gravitatorio. Vemos que ya
se dibuja esta relación entre espacio curvo, descrito por la métrica y el potencial gravitacional.
Esta relación nos permite ver el Principio de equivalencia de la Gravitación y la inercia como lo
habı́amos postulado también: El no tener campo gravitacional lo interpreto como espacio plano, Minkowski
y un espacio curvo lo asociaré con una métrica. Ası́, el principio de equivalencia lo interpretamos que en
una región suficientemente cercana a cualquier punto del espacio tiempo la métrica la puedo ver como
plana. Tengo ası́ la analogı́a con el axioma de superficies de Gauss, que cualquier punto de una superficie
curva en una cierta vecindad, se puede asociar a una región en al plano tangente a la superficie en ese
punto, i. e. las superficies curvas son localmente planas.
Es importante notar quedan varios detalles que el la lector@ atent@ puede notar. Está bien, ya se
tiene esta analogı́a entre curvatura y campos gravitacionales. Sin embargo, dado un espacio-tiempo,
digamos plano, ¡es plano independientemente de las coordenadas que yo utilice para describirlo! Es claro
que hay que refinar esta idea de que coordenadas curvilı́neas representan un espacio curvo. Necesitamos
una manera invariante de caracterizar la curvatura y esa estará dada por un tensor, que es el de Riemann.

69
Ejercicios 6

1. Derivada covariante
Demuestra explı́citamente la igualdad:

uα ;β γ − uα ;γ β = uσ Rα σ β γ , (6.2)

donde uα es un cuadrivector.

2. Bianchi
Usando las propiedades de simetrı́a y antisimetr’ia del tensor de Riemann descritas en clase, com-
prueba las identidades de Bianchi:

Rλ µ ν κ ;η + Rλ µ η ν ;κ + Rλ µ κ η ;ν = 0, (6.3)

Ayuda: Hazlo en un sistema de coordenadas localmente inercial.

3. Espacio tiempo plano ⇔ Riemann=0


Discute este teorema y sus aplicaciones, ası́ como esboza una demostración de él, en ambas direc-
ciones.

4. Riemann
Partiendo de la expresión para el tensor de Riemann derivada en clase:
µ
Rα ν λ ρ = Γα α α µ α
ν ρ ,λ − Γν λ ,ρ + Γλ µ Γν ρ − Γρ µ Γν λ , (6.4)

demuestra que en su forma covariante se puede escribir como


1
(gµ ν ,κ λ − gλ ν ,κ µ + gλ κ ,ν µ − gµ κ ,ν λ ) − gη σ Γην λ Γσµ κ − Γηκ λ Γσµ ν ,

Rλ µ ν κ = (6.5)
2

5. Ricci y el escalar de curvatura


Escribe en términos de los Christoffel y la métrica en la forma más simplificada posible, las expre-
siones para el tensor de Ricci y para el escalar de curvatura.

6. Espacio tiempo esféricamente simétrico y estático A partir de la forma del elemento de lı́nea
para el espacio tiempo esféricamente simétrico y estático,

ds2 = −S(r) dt2 + C(r) dt dr + T (r) dr2 + D(r) r2 dΩ2 , (6.6)

demuestra que, redefiniendo a la coordenada radial y temporal, se puede llevar a la forma

ds2 = −A(r) dt2 + B(r) dr2 + r2 dΩ2 , (6.7)

7. Geodésicas en Schwarzschild Muestra que las expresiones obtenidas en clase para ẋµ en términos
de las cantidades conservadas, efectivamente satisfacen las ecuaciones geodésicas. Hay que calcular
(o buscar) los Christoffels, ni modo.

70
Capı́tulo 7

Curvatura, Riemann

Ya tenemos una manera de expresar a las leyes de la Fı́sica en un contexto de espacio-tiempo, de co-
ordenadas curvilı́neas, de modo que queden descritas independientemente de las coordenadas utilizadas
y sabemos cómo se transforman bajo cambios de coordenadas o de sistemas de referencia, para lo que
utilizamos la formulación tensorial y ası́, las leyes de la Fı́sica, al quedar como ecuaciones tensoriales,
quedan invariantes bajo transformaciones de coordenadas o de sistemas de referencia.
También ya vimos la equivalencia entre coordenadas curvilı́neas en el espacio tiempo y un campo
gravitacional.
Por otro lado, como ya mencionamos, el estudiante atento y despierto, no asustado por la formulación,
nota que las caracterı́sticas y propiedades de un espacio-tiempo, no pueden depender de las coordenadas
que yo use para describirlo. Si es plano, será plano independientemente de que yo use, para describirlo,
un sistema de coordenadas cartesiano o un sistema con coordenadas curvilı́neas. Por lo que sı́ hay una
relación entre las coordenadas y aceleración o curvatura, pero hay que profundizar más en esta relación.
Hay que ver con detalle esta idea de la curvatura de un espacio-tiempo. Podemos guiarnos con la
ecuación de la fuerza gravitacional, la ley gravitacional de Newton
m1 m2
F~ = G r̂, (7.1)
r2
que nos conviene usar el hecho de que, para fuerzas conservativas, ellas pueden ser derivadas a partir de
un potencial, F~ = −∇φ,
~ por lo que tengo

~ = −G m1 m2 r̂.
∇φ (7.2)
r2
Por otro lado, por el teorema de Gauss se tiene que S F~ · n̂ d S = 4 π G MV , con lo que, podemos
R
~ φ · n̂ d S = −4 π G
R R
reescribir S ∇ V
ρ d V , donde hemos usando la definición de la masa, MV como la
integral de la densidad, ρ, sobre el volumen. Entonces, usando el teorema de la divergencia obtenemos
∇2 φ d V = 4 π G V ρ d V , donde, el operador ∇2 = ∇ ~ · ∇,
~ se conoce como el Laplaciano. Como
R R
V
esta identidad es válida para un volumen arbitrario, llegamos entonces a la siguiente manera de reescribir
a la ley de Gravitación Universal, que se conoce como la ecuación de Poisson:

∇2 φ = 4 π G ρ. (7.3)

Por otro lado, ya vimos que el potencial gravitacional, φ, lo puedo asociar con los coeficientes métricos,
gµν . En sı́, vimos que se relaciona con g00 a primer orden y consideramos que esta relación se da para
todos los coeficientes. Por lo que, como mencionamos, guiándonos con la ecuación de Poisson, para

71
Figura 7.1: Simeón Denise Poisson, 1781 - 1840.

verla en el espacio tiempo, debemos construir un tensor que tenga que ver con segundas derivadas de los
coeficientes métricos.
Ya hemos mostrado que las primeras derivadas de los coeficientes métricos se relacionan con, los
sı́mbolos de Christoffel, que no definen a un tensor. Partamos desde aquı́. De la transformación de la
conexión afı́n, ec. (4.101), (escrita para las coordenadas no-primadas):
′ ′ ′
∂xµ ∂xγ ∂xδ β ′ ∂xµ ∂ 2 xβ
Γµν λ = Γ + . (7.4)
∂xβ ∂xλ ∂xν γ δ
′ ′

∂xβ ′ ∂xν ∂xλ
2 β′
∂ x
de donde despejamos ∂x ν ∂xλ y vamos a usar el mismo truco que usamos para demostrar la invariancia

del intervalo, es decir, derivar y jugar con los ı́ndices. Considerando el término con segundas derivadas:
′ ′ ′
∂xµ ∂ 2 xβ µ ∂xµ ∂xγ ∂xδ β ′
= Γνλ − Γ ′ ′, (7.5)
∂xβ ∂xν ∂xλ

∂xβ ′ ∂xλ ∂xν γ δ
despejando, recuerda lector@ que lo hacemos utilizando al ı́ndice libre, µ:
′ ′ ′ ′ ′
!
∂xσ ∂xµ ∂ 2 xβ ∂xσ ∂xµ ∂xγ ∂xδ β ′
= Γµν λ − Γ ′ ′ ,
∂xµ ∂xβ ′ ∂xν ∂xλ ∂xµ ∂xβ ′ ∂xλ ∂xν γ δ
′ ′ ′ ′
∂ 2 xσ ∂xσ µ ∂xγ ∂xδ σ′
= Γ − Γ ′ ′, (7.6)
∂xν ∂xλ ∂xµ ν λ ∂xλ ∂xν γ δ
y volviendo a derivar:
′ ′ ′ ′ ′ ′ ′
! ′ ′ ′
∂ 3 xσ ∂ 2 xσ µ ∂xσ µ ∂ 2 xγ ∂xδ ∂xγ ∂ 2 xδ ′ ∂xγ ∂xδ ∂xτ σ′
= Γ + Γ − + Γσγ ′ δ′ − Γ ′ ′ ′,
∂xρ ∂xν ∂xλ ∂xρ ∂xµ ν λ ∂xµ ν λ ,ρ ∂xρ ∂xλ ∂xν ∂xλ ∂xρ ∂xν ∂xλ ∂xν ∂xρ γ δ ,τ
′ ′ ′ ′
! ′ ′ ′ ′
∂ 3 xσ ∂xσ α ∂xγ ∂xδ σ′ ∂xσ µ ∂xγ ∂xδ ∂xτ σ′
= Γρ µ − Γ ′ ′ Γµν λ +
Γν λ ,ρ − Γ ′ ′ ′+
∂x ∂xν ∂xλ
ρ ∂x α ∂xρ ∂xµ γ δ ∂x µ ∂xλ ∂xν ∂xρ γ δ ,τ
′ ′ ′
! ′ ′ ′ ′ ′
!!
∂xγ µ ∂xτ ∂xǫ γ ′ ∂xδ ∂xγ ∂xδ µ ∂xτ ∂xǫ δ′ ′
− µ
Γρ λ − λ ρ
Γτ ′ ǫ ′ ν
+ λ µ
Γρ ν − ρ ν
Γτ ′ ǫ′ Γσγ ′ δ′ ,
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x
σ′ γ ′
δ ′
τ ′ 
∂x α α µ  ∂x ∂x ∂x σ′ ǫ′ σ′ ǫ′ σ′

= Γ ν λ ,ρ + Γ Γ
ρµ ν λ − Γγ δ ,τ
′ ′ ′ + Γ τ γ
′ ′ Γ ǫ ,δ
′ ′ + Γ τ δ
′ ′ Γ γ ǫ
′ ′ +
∂xα ∂xλ ∂xν !∂xρ
′ ′ ′ ′
∂xγ µ ∂xγ µ ∂xγ µ ∂xδ σ′
− Γ + Γ + Γ Γ ′ ′. (7.7)
∂xρ ν λ ∂xν ρ λ ∂xλ ν ρ ∂xµ γ δ

72
Claramente se ven feyuchos los términos que tienen productos de gammas y gammas primadas, pero
si obtengo la misma expresión con los ı́ndices ρ y λ intercambiados (en los términos con gamma prima
renombro γ ′ y τ ′ , que son mudos):
′ ′ ′ ′ ′
∂ 3 xσ ∂xσ α α µ
 ∂xτ ∂xδ ∂xγ  σ′ ′ ′ ′ ′

= Γ ν ρ ,λ + Γ Γ
λµ ν ρ − Γτ ′ δ′ ,γ ′ + Γǫτ ′ γ ′ Γσǫ′ ,δ′ + Γǫγ ′ δ′ Γστ ′ ǫ′ +
∂x ∂xν ∂xρ
λ ∂x α ρ
∂x ∂x !∂xν λ
γ′ γ′ ′ ′
∂x µ ∂x µ ∂xγ µ ∂xδ σ′
− Γ + Γ + Γ Γ ′ ′, (7.8)
∂xλ ν ρ ∂xν ρ λ ∂xρ ν λ ∂xµ γ δ

al restar ambas expresiones, el lado izquierdo se cancela pues las derivadas conmutan, del lado derecho
se van los términos con gamma y gamma prima y obtengo:

∂xσ µ 
0= α
Γα α α µ α
ν ρ ,λ − Γν λ ,ρ + Γλ µ Γν ρ − Γρ µ Γν λ
∂x
′ ′ ′
∂xγ ∂xδ ∂xτ  σ′ ǫ′ σ′ ǫ′ σ′ σ′ ǫ′ σ′ ǫ′ σ′

+ λ Γ γ δ ,τ
′ ′ ′ + Γ τ γ
′ ′ Γ ǫ ,δ
′ ′ + Γ τ δ
′ ′ Γ γ ǫ
′ ′ − Γ τ δ ,γ
′ ′ ′ − Γ τ γ
′ ′ Γ ǫ ,δ
′ ′ − Γγ δ
′ ′ Γτ ǫ
′ (7.9)

∂x ∂xν ∂xρ
es decir:

γ′ ′ ′
∂xσ µ  ∂x ∂xδ ∂xτ  σ′ σ′ ǫ′ σ′ ǫ′ σ′

0= Γαν ρ ,λ − Γα
ν λ ,ρ + Γ α
Γµ
λµ ν ρ − Γ α
Γ
ρµ ν λ − Γ τ δ ,γ
′ ′ ′ − Γ γ δ ,τ
′ ′ ′ − +Γγ δ
′ ′ Γτ ǫ
′ ′ − Γ τ δ
′ ′ Γ γ ǫ
′ ′ ,
∂xα ∂xλ ∂xν ∂xρ
(7.10)
¡es el mismo objeto en coordenadas primadas y no primadas!, ¡Un tensor! Paso al lado derecho y despejo:

′ ′ ′ ′ ′ ′ ∂xσ ∂xλ ∂xν ∂xρ µ
Γση′ ω′ ,ξ′ −Γσξ′ ω′ ,η′ +Γǫξ′ ω′ Γση′ ǫ′ −Γǫη′ ω′ Γσξ′ ǫ′ = Γα α α µ α

ν ρ ,λ − Γν λ ,ρ + Γλ µ Γν ρ − Γρ µ Γν λ
∂xα ∂xξ′ ∂xω′ ∂xη′
(7.11)
es decir ′
σ′ ∂xσ ∂xλ ∂xν ∂xρ α
R ξ′ ω′ η′ = R ν λ ρ, (7.12)
∂xα ∂xξ′ ∂xω′ ∂xη′
donde
µ
Rα ν λ ρ = Γα α α µ α
ν ρ ,λ − Γν λ ,ρ + Γλ µ Γν ρ − Γρ µ Γν λ , (7.13)
es una cantidad tensorial, de hecho, La cantidad tensorial, se le conoce como el tensor de Riemann, pues
lo dedujo Riemann en sus trabajos sobre hipersuperficies.

Figura 7.2: Georg Friedrich Bernhard Riemann, 1826 - 1866.

Es justo como lo queremos, bueno, tal vez un poco más complicado de lo que se podı́a esperar, pero
es una cantidad tensorial formada con derivadas de las conexiones afines que, al verlas como sı́mbolos
de Christoffel, son segundas derivadas del tensor métrico. Regresando a la ecuación de Piosson y a la

73
analogı́a entre coeficientes métricos y potenciales gravitacionales, podemos sospechar que este tensor de
Riemann es el que va a intervenir en la generalización de la ecuación de Poisson al caso de espacio-tiempo
curvo.
Mencionamos que la definición del tensor de Riemann, ec. (7.13), claramente tiene una libertad de
signo. Es posible definirlo como menos esta definición y sigue siendo un tensor con las mismas propiedades.
Un cambio de signo global no lo afecta, es por convención que se elige uno u otro (como la signatura
de la métrica, aunque en este caso no hay una argumentación para preferir una u otra signatura), sin
embargo, se tiene que ser consistente con la definición elegida. A final de cuentas, lo que queremos es que
las convenciones sean consistentes y se reduzcan a las leyes de la Fı́sica conocidas en el lı́mite newtoniano,
donde no hay libertad de elegir al signo, es decir, la ecuación de Poisson está fija, no es que se pueda
elegir que el laplaciano del potencial sea igual a menos la densidad. Entonces tomamos esta definición de
Riemann y mencionamos que en el Weinberg [?], éste la toma como menos la nuestra.
Por ahora veremos que de hecho, este tensor es único, es el único que se puede construir con segundas
derivadas de los coeficientes métricos y veremos algunas de sus propiedades.
Para empezar, una caracteristica bonita del tensor de Riemann es que es lineal en las segundas
derivadas de la métrica, es decir, cuando considero al tensor de Riemann con todos los ı́ndices covariantes,
Rλ µ ν κ = gλ α Rα µ ν κ , utilizando que gλ σ g σ ρ ,κ = −g σ ρ gλ σ ,κ = −g σ ρ (gησ Γηκ λ − gηλ Γηκ σ ), que ya quedó
de tarea demostrar estas propiedades, se llega a
1
(gµ ν ,κ λ − gλ ν ,κ µ + gλ κ ,ν µ − gµ κ ,ν λ ) + gη σ Γηκ λ Γσµ ν − Γην λ Γσµ κ ,

Rλ µ ν κ = (7.14)
2
también queda de tarea demostrarlo. Esta forma de escribir al tensor de Riemann muestra claramente
su linealidad respecto a las segundas derivadas de la métrica y es útil en algunos análisis.
Hay otros dos tensores que son muy útiles y que puedo construir a partir del de Riemann contrayendo
los ı́ndices, uno es el tensor de Ricci:

Rν ρ = Rνα α ρ = Γα α α µ α µ
ν ρ ,α − Γν α ,ρ + Γα µ Γν ρ − Γρ µ Γν α , (7.15)

que aún se puede simplificar, lo dejamos de tarea. Otro es, ya encarrerados, pues subirle el ı́ndice al

Figura 7.3: Gregorio Ricci-Curbastro, 1853 - 1925.

Ricci y contraerlo, lo que me da un escalar, el escalar de curvatura:

R = g µ ν Rµ ν = Rµµ . (7.16)

74
Ellos juegan un papel muy importante en la fı́sica, como veremos más adelante. Por ahora vemos más
propiedades interesantes del tensor de Riemann y de sus contracciones. Notamos de paso que en la
definición del tensor de Ricci, también hay una libertad de signo, se puede definir contrayendo el primer
ı́nidice, contravariante, con el tercero, como lo hemos hecho en estas notas, o con el cuarto, siendo de
nuevo, una diferencia de un signo. Mantenemos la presentada, primero con tercero.
El tensor de Riemann si nos habla directamente de la curvatura, aquı́ sı́, independientemente de las
coordenadas. Hay un teorema muy bonito que nos dice que El tensor de Riemann es cero, si y sólo si la
metrica es plana, i. e., Rµα α ν = 0 ⇔ gµ ν = ηµ ν . La demostración de regreso es trivial, pues si la métrica
α β
∂x ∂x
es plana, se que existe una transforamción x → x′ tal que la lleva a la de Minkowski, ηµ′ ν ′ = ∂x µ′ ∂xν ′ gα β

y, para Minkowski, los Christoffels son cero, ası́ como sus derivadas, por lo que Riemann es cero en ese
sistema y, como es una igualdad tensorial, es cero en todos los sistemas de referencia. Para la ida, lo
discutiremos más adelante.
Veamos de una vez las simetrı́as del tensor de Riemann y ası́ podemos determinar cúantas componentes
independientes tiene y cúantas son cero. De entrada se pensarı́a que tengo N 4 componentes, con N la
dimensión del espacio que se está considerando, para N = 4, ¡son 256!, pero veamos con cuidado.
Considero la forma del tensor de Riemann con los ı́ndices abajo y es fácil ver directamente las siguientes
simetrı́as:

1. Simetrı́a
Intercambio de la primer pareja de ı́ndices con la segunda

Rλ µ ν κ = Rν κ λ µ (7.17)

2. Antisimetrı́a
Intercambio de ı́ndices consecutivos

Rλ µ ν κ = −Rµ λ ν κ = −Rλ µ κ ν = Rµ λ ν κ , (7.18)

3. Ciclicidad
Esta no es tan directa de ver, pero es fácil de comprobar, dejo fijo el primero y les doy vuelta a los
tres siguientes:
R λ µ ν κ + Rλ κ µ ν + Rλ ν κ µ = 0 (7.19)

De aquı́ya nos queda claro que no puedo formar otras contracciones que Ricci, que fue contraer el
primero con el tercero, pues contraer el primero con el segundo es cero y contraer con el cuarto, sólo
cambia el signo. De hecho hay autores que definen al Ricci con la contración de primero y cuarto, lo que
me cambia el signo de la definición. Esto es convención, como el definir la signatura del elemento de lı́nea
como (−, +, +, +) o (+, −, −, −), nosotros hemos tomado la primera y para Ricci, lo contraemos con el
tercero. Al ver otros textos, hay que ver la convención de signos que usan.
Ahora sı́ podemos contar cuántas componentes independientes tiene el tensor de Riemman. Recorde-
mos que una matriz de n dimensiones si es simétrica tiene 12 n (n + 1) entradas independientes y si es
antisimétrica, tiene 21 n (n − 1) entradas independientes. Si consideramos a Riemann como una matriz
R(α β) (µ ν) con ”ı́ndices” (α β) y (µ ν). De la antisimetrı́a vemos que cada ”ı́ndice” toma un número de
valores independientes igual al número de elementos independientes de una matriz antisimétrica de N
dimensiones, es decir, 12 N (N − 1). Y, como la ”matriz” R(α β) (µ ν) es simétrica, sus dimensiones son
1 1 1
 1  1 2

2 N (N − 1), por lo que tiene 2 2 N (N − 1) 2 N (N − 1) + 1 = 8 N (N − 1) N N − N + 2 .
Falta considerar la ciclicidad. La simetrı́a y la antisimetrı́a de Riemann, hacen que la suma cı́clica
Pλ µ ν κ = Rλ µ ν κ + Rλ κ µ ν + Rλ ν κ µ , sea un tensor completamente antisimétrico, hacer uno explı́cito,
Pµ λ ν κ = −Pλ µ ν κ . Estos tensores tienen un número de componentes independientes dadas por N (N − 1) (N − 2) (N − 3) /4

75
buscar una desmostración de esto. Por lo que la ciclicidad impone este número de relaciones entre los
coeficientes, es decir, este número de constricciones, por lo que finalmente me queda que el número de el-
ementos independientes de Riemann es 18 N (N − 1) N N 2 − N + 2 − N (N − 1) (N − 2) (N − 3) /4!,


es decir
1 2
N N2 − 1 .

CN = (7.20)
12
Para N = 1, es cero, no hay componentes independientes, no hay curvatura, bueno, es cero, como se ve de
la antisimetrı́a. Una lı́nea no tiene curvatura, pues Riemann refleja las propiedades internas del espacio,
no el como se encuentra embebido dentro de otro espacio de dimensión mayor. Para una superficie,
N = 2, hay una componente, relacionada con la curvatura gaussiana. Para N = 3, hay seis componentes
y para N = 4, se tienen veinte componentes independientes del tensor de Riemann.
Respecto al Ricci, es directo ver que es un tensor simétrico, Rµ ν = Rν µ , En una dimensión tiene una
componente, cero, en dos tiene tres componentes, en tres dimensiones seis, igual que Riemann, por lo que
Riemann se puede expresar en términos del Ricci. En cuatro tengo 10 componentes de Ricci, por lo que
no son suficientes para determinar al Riemann completo.
Finalmente, otra relación muy importante entre los componentes de Riemann son las identidades
de Bianchi, una relación cı́clica de la derivada covariante de Riemann. La manera más fácil de verla es
en un punto y considerar en ese punto un sistema inercial de coordenadas, que me mata a los Christoffels,
me deja a Riemann sólo con las segundas derivadas de la métrica y la derivada covariante se reduce a la
usual en ese punto, es decir, de la ec. (7.14):
1 ∂
Rλ µ ν κ ;η = (gµ ν ,κ λ − gλ ν ,κ µ + gλ κ ,ν µ − gµ κ ,ν λ ) (7.21)
2 ∂xη
permuto los tres últimos indices y obtengo

Rλ µ ν κ ;η + Rλ µ η ν ;κ + Rλ µ κ η ;ν = 0, (7.22)

que son las identidades de Bianchi.

Figura 7.4: Luigi Bianchi, 1856 - 1928.

Como es una expresión tensorial, válida en un sistema de referencia, es válida en cualquier sistema.
Muy bonito y vemos que este m”etodo es poderoso. Fı́jense que, si contraigo en las identidades de Bianchi
λ con ν, obtengo: (Primero lo subo usando que la métrica es transparente a la derivada covariante)

Rλ µ ν κ ;η + Rλ µ η ν ;κ + Rλ µ κ η ;ν = 0,
Rλ µ λ κ ;η + Rλ µ η λ ;κ + Rλ µ κ η ;λ = 0,
Rµ κ ;η − Rµ η ;κ + Rλ µ κ η ;λ = 0. (7.23)

76
y vuelvo a contraer, pero ojo, Rλ µ κ η ;λ = g λ α Rα µ κ η ;λ = −g λ α Rµ α κ η ;λ = −g λ α gµ β Rβ α κ η ;λ , por lo
que obtengo: Rµ κ ;η − Rµ η ;κ − g λ α gµ β Rβ α κ η ;λ = 0 y puedo subir el ı́ndice µ:

Rµ κ ;η − Rµ η ;κ − g λ α Rµ α κ η ;λ = 0, (7.24)

ahora sı́, contraigo µ y κ:

R;η − Rµ η ;µ − g λ α Rα η ;λ = 0,
R;η − Rµ η ;µ − Rα η ;α = 0,
R;η − 2 Rµ η ;µ = 0,
1
Rµ η ;µ − δ µ η R;µ = 0,
 2 
µ 1 µ
R η− δ ηR =0 (7.25)
2 ;µ

es decir  
µν 1
R − gµ ν R = 0. (7.26)
2 ;ν

Las identidades de Bianchi nos implican que divergencia del tensor


1
Gµ ν = Rµ ν − g µ ν R, (7.27)
2
es siempre cero, para cualquier espacio. Este tensor se conoce como el tensor de Einstein y, recalcamos,
su divergencia es cero, por argumentos puramente geométricos.
Más propiedades de Riemann. Veamos a la derivada covariante de un vector, Vµ , es decir Vµ ;ν , que
ya la sabemos desarrollar y tomamos una segunda derivada covariante: Vµ ;ν κ , es decir, considerando que
Vµ ;ν es un tensor
Vµ ;ν κ = Vµ ;ν ,κ − Γλµ κ Vλ ;ν − Γλν κ Vµ ;λ , (7.28)
y desarrollo la derivada covariante:

Vµ ;ν κ = Vµ ,ν − Γλµ ν Vλ ,κ − Γλµ κ (Vλ ,ν − Γσλ ν Vσ ) − Γλν κ Vµ ,λ − Γσµ λ Vσ ,


 

Vµ ,ν κ − Γλµ ν Vλ ,κ − Γλµ κ Vλ ,ν − Γλν κ Vµ ,λ − Γσµ ν ,κ − Γλµ κ Γσλ ν − Γλν κ Γσµ λ Vσ . (7.29)



=

Tomo la expresión intercambiando los ı́ndices ν y κ:

Vµ ;κ ν = Vµ ,κ ν − Γλµ κ Vλ ,ν − Γλµ ν Vλ ,κ − Γλν κ Vµ ,λ − Γσµ κ ,ν − Γλµ ν Γσλ κ − Γλν κ Γσµ λ Vσ ,



(7.30)

y las resto, para ver qué pasa al conmutar derivadas covariantes:

Vµ ;ν κ − Vµ ;κ ν = Vµ ,ν κ − Vµ ,κ ν − Γλµ ν Vλ ,κ − Γλµ κ Vλ ,ν − Γλν κ Vµ ,λ + Γλµ κ Vλ ,ν + Γλµ ν Vλ ,κ + Γλν κ Vµ ,λ +


Γσµ ν ,κ − Γσµ κ ,ν − Γλµ κ Γσλ ν − Γλν κ Γσµ λ + Γλµ ν Γσλ κ + Γλν κ Γσµ λ Vσ ,


Γσµ ν ,κ − Γσµ κ ,ν − Γλµ κ Γσλ ν + Γλµ ν Γσλ κ Vσ ,

= (7.31)

es decir
Vµ ;ν κ − Vµ ;κ ν = Vσ Rσ µ ν κ . (7.32)
Muy bonito también. Vemos como Riemann, la curvatura, es la responsable de que no conumten las
derivadas covariantes. Sólo lo hacen en espacio plano.
Para terminar esta sección, veamos la unicidad. Para ver la unicidad del tensor de Riemann, en el
sentido de que es el único tensor que se puede construir con el tensor métrico y sus primeras y segundas

77
derivadas y es lineal en las segundas derivadas, usaremos el hecho de que al darse una igualdad tensorial,
dicha igualdad es válida para todo sistema de referencia, que es una de las ideas centrales de dar la
formulación covariante, pero usamos esta idea al revés, es decir, se demuestra una igualdad tensorial
en un sistema de referencia, claramente se escoje uno que sea fácil y, dada la igualdad, válida es dicho
sistema, como es una igualdad tensorial, lo será en todos los sistemas.
Ası́ pues, nos fijamos en un punto del espacio tiempo, X y ya sabemos que en dicho punto y en
una región cercana a él, puedo elegir un sistema de referencia localmente inercial, donde los coeficientes
métricos se reducen a los de Minkowski y los sı́mbolos de Christoffel son cero. Más aún, nos fijamos
sólo en las transformaciones de coordenadas que me dejan cero a la conexión afı́n, es decir, aquellas que
satisfacen ′
∂ 2 xβ
|x=X = 0. (7.33)
∂xν ∂xλ
Queremos construir un tensor lineal en las segundas derivadas de la métrica. Como pido que se anulen
los Christoffels en X, dicho tensor debe ser una combinacionón lineal de derivadas de la conexión afı́n.
De las expresiones que obtuvimos antes para derivar al tensor de Riemann, vemos que, en el caso en que
σ′
la Γαλ µ y Γτ ′ ǫ′ son cero, obtengo, en x = X:

′ ′ ′ ′ ′
∂ 3 xσ ∂xσ α ∂xτ ∂xδ ∂xγ σ′
= Γν ρ ,λ − Γ ′ ′ ′, (7.34)
λ
∂x ∂x ∂xν ρ ∂x α ∂xρ ∂xν ∂xλ τ δ ,γ
es decir, la tranformación para la derivada de la conexión afı́n me queda en este caso, en x = X:
′ ′
′ ∂xρ ∂xν ∂xλ ∂xσ α ∂xρ ∂xν ∂xλ ∂ 3 xσ
Γσǫ′ ω′ ,η′ = Γ ν ρ ,λ − , (7.35)
∂xǫ ∂xω ∂xη ∂xα
′ ′ ′
∂xǫ ∂xω ∂xη ∂xλ ∂xν ∂xρ
′ ′ ′

pero quiero obtener un tensor con estas derivadas de gamma, por lo que, de nuevo, me sobra el último
termino. Con la experiencia que tenemos, veo que si conmuto λ y ρ y los resto, este término se cancela,
para cualquier transformación que yo de, por lo que, en x = X,

Tναρ λ = Γα α
ν ρ ,λ − Γν λ ρ (7.36)

es el tensor que estamos buscando. Pero, cuando Γ = 0, el tensor de Riemann es igual a este tensor,
Rνα ρ λ = Tναρ λ . Esta es una igualdad para un punto arbitrario, por lo que se vale para cualquier punto, es
válida para un sistema de referencia, pero es una igualdad tensorial, por lo que es válida para cualquier
sistema. Por lo que demostramos que Riemann es el único tensor lineal en las segundas derivadas de los
coeficientes métricos.
Muy bien, piensa bien lector@ esta demostración pues usa esta idea muy poderosa de igualdades
tensoriales.
Queda pendiente la demostración de regreso para el teorema. Si Riemann es cero, el espacio es plano.
Podemos usar esta idea de hacerlo en un punto, donde siempre es posible elegir que la métrica sea en ese
punto la de Minkowksi y los Chistoffels sean cero, con lo que nos queda Riemann sólo en términos de las
segundas derivadas, usando la expresión para Riemann dada por la ec. (7.14),

0 = gµ ν ,κ λ − gλ ν ,κ µ + gλ κ ,ν µ − gµ κ ,ν λ , (7.37)

en X, donde usamos la hipótesis de que Riemann es cero. Combinando los ı́ndices podemos mostrar, que
gλ ν ,κ µ = 0, por lo que, si a orden cero es Minkowski, a primer orden también, por elección en un punto
y las segundas derivadas también son cero, entonces la métrica es la de Minkowski y el espacio es plano.

78
Ejercicios 7

Usando las ecuaciones de Einstein:


1 8πG
Rµ ν − gµ ν + Λ gµ ν = Tµ ν , (7.38)
2 c4
1. Lı́mite newtoniano
Demuestra que el lı́mite newtoniano de estas ecuaciones es la ecuación de Poisson, ∇2 φ = 4 π G ρ.

2. Divergencia nula de Einstein Utilizando las identidades de Bianchi, muestra que el tensor de
Einstein, Gµ ν = Rµ ν − 21 gµ ν , de hecho, aún incluyendo al término con constante cosmológica, tiene
divergencia nula: Gµ ν ; ν = 0.

3. Complejidad escondida
Como vimos en clase, las ecuaciones de Einstein, son un sistema de diez ecuaciones diferenciales de
segundo orden acopladas y altamente no lineales.
Considerando una métrica totalmente general, es decir, los diez componentes métricos no nulos
y dependientes de las cuatro coordenadas, describe una idea para calcular cuántos términos de
coefieiente métricos, tienen cada una de las ecuaciones.

4. Vacı́o Considera a las ecuaciones de Einstein en vacı́o, es decir, cuando Tµ ν = 0. Considerando


que la constante cosmológica es cero, Λ = 0, demuestra que vacı́o implica que

• Rµ ν = 0,
• y que R = 0

Esto NO implica que el espacio sea plano. Discute esta afirmación.

79
80
Capı́tulo 8

Ecuaciones de Einstein

Ya con estos conocimientos sobre la descripción tensorial de la Fı́sica, podemos ver la formulación covari-
ante de la ecuación de gravitación misma, es decir,de la ley de Gravitación Universal de Newton:
m1 m2
F~ = G r̂, (8.1)
r2
que nos habla de cómo se atraen dos masas y la vemos en su forma de Poisson:

∇2 φ = 4 π G ρ. (8.2)

Lo haremos de dos formas, una, adivinando más o menos y otra a partir de la acción y principios
variacionales.

Adivinanza educada

La primera, pues ya hemos identificado al potencial gravitacional newtoniano, φ, con los coeficientes
métricos gµ ν . Y vemos que tenemos del lado derecho segundas derivadas del potencial. Por lo que, en
una descripción covariante, debo tener un objeto tensorial formado con las segundas derivadas de los
coeficientes métricos y vemos que debe ser lineal en ellas, por lo que ya sabemos que solo hay un tensor
que tiene dichas propiedades y es Riemann. Por lo que del lado derecho vemos que debe haber algo con
este tensor, Rνµ λ τ .
Del lado derecho tenemos a la materia, la densidad. Hemos visto que su generalización a un objeto
en el espacio tiempo puede ser el cudrivector de corriente, j µ o el tensor de energı́a esfuerzos, Tµ ν . Es
decir, del lado derecho debe haber un cuadrivector o un tensor de dos ı́ndices. Debo tener un objeto
con el mismo caracater del lado izquierdo. Para formarlo a partir de Riemann y donde sólo intervenga
la métrica, pues si formase una contracción digamos de Ricci con un cuadrivector de velocidad, uµ Rµ ν ,
estarı́a introduciendo un término extra en las ecuaciones, la velocidad. Y no puedo formar un tensor con
un sólo ı́ndice sólo con Riemann y la métrica, por lo que el objeto al que debo generalizar la densidad,
debe ser proporcional al Tµ ν .
Un objeto formado con Riemann y la métrica, de dos ı́ndices pues debe ser aquél que tiene Ricci
y/o al escalar de curvatura, R, multiplicado por la métrica. Es decir, debe ser una combinación Aµ ν =
a Rµ ν + b gµ ν R + c gµ ν , con a, b, c constantes, no funciones escalares sino constantes.
Una propiedad muy bonita del tensor de energı́a esfuerzos, es su conservación, T µ ν ;ν = 0. La discu-
timos para el caso de fluido perfecto y consideramos que debe ser una propiedad general para cualquier
tensor de materia, el que se conserve, por lo que del lado derecho debo tener que ese tensor formado por

81
la combinación de Riemann yla métrica, también debe tener divergencia cero, Aµ ν ;ν = 0 y ya vimos, por
las identidades de Bianchi, que el tensor que hace esto es
1
Gµ ν = R µ ν − gµ ν R, (8.3)
2
por lo que podemos concluir que la forma covariante de la descripción del campo gravitacional debido a
la materia es  
1
C Rµ ν − g µ ν R + c g µ ν = 4 π G T µ ν . (8.4)
2
Quedan dos constantes por determinar, C y c. Para fijarlas me voy al lı́mite newtoniano, como le
hicimos con las geodésicas. Considero un campo débil y estático, es decir, gµ ν ≃ ηµ ν y en este caso,
sabemos que la componente principal del Tµ ν es 00 ≃ ρ y las demás son despreciables. Esto lo vemos para
el caso de fluido perfecto, recordando que uν = , es decir, considero que C Ri j − 12 ηi j R + c ηi j ≃ 0.


Pero, por otro lado, R = η 0 0 R0 0 + η i j Ri j , es decir, R ≃ −R0 0 + 12 3 R − 3 c, lo que implica que en este
caso
R ≃ 2 R0 0 + 6 c. (8.5)
Considero ahora la componente 00: Tenemos C R0 0 − 21 η0 0 R + c η0 0 = C R0 0 + 12 R − c ≃
 

2 C (R0 0 + c).
Para obtener la forma de R0 0 tengo que R0 0 = η µ ν R0 µ 0 ν = −R0 0 0 0 + δ i j R0 i 0 j y estas las saco de
la forma de Riemann que ya hemos visto, ec. (7.14) y que en esta aproximación es
1
Rλ µ ν κ = (gµ ν ,κ λ − gλ ν ,κ µ + gλ κ ,ν µ − gµ κ ,ν λ ) , (8.6)
2
como la métrica es estática, R0 0 0 0 = 0 y, para la otra parte, me queda sólo el término que tiene ambas
derivadas espaciales, es decir R0 i 0 j = − 21 g0 0 ,i j , por lo que R0 0 = − 12 ∇2 g0 0 , y la componente 00 queda
entonces −C ∇2 g0 0 + 2 c .


Por otro lado, hemos visto que en este caso, al comparar con la expresión newtoniana obtuvimos que
g0 0 ≃ − (1 + 2 φ), con φ el potencial newtoniano, por lo que la ecuación se reduce a C 2 ∇2 φ + 2 c , es


decir:
C 2 ∇2 φ + 2 c ≃ 4 π G ρ,

(8.7)
1
comparando con la ecuación de Poisson se concluye que C = 2 y c = 0. Las ecuaciones finales son:
1
Rµ ν − g µ ν R = 8 π G Tµ ν , (8.8)
2
que son las ecuaciones de Einstein, presentadas por Albert Einstein en 1915.
Ahora sı́, estudiante, ¡ya puedes morir en paz! Este es el clı́max del curso. El concepto de espacio-
tiempo y la invariancia de las leyes de la Fı́sica respecto a sistemas de referencia, el álgebra tensorial
estudiada, la manera de reescribir a las leyes de la Fı́sica newtoniana de una manera covariante, el
movimiento geodésico, en fin, la generalización del concepto de recta a geodésica, nos permiten llegar a
una manera covariante de ver a la interacción gravitatoria.
Son muchas cosas las que ellas, las ecuaciones de Einstein, que nos dicen. La más importante es el
nuevo paradigma que nos plantean. De un lado, el izquierdo, tenemos curvatura, es decir, geometrı́a, del
lado derecho, materia. Las ecuaciones de Einstein nos relacionan materia con geometrı́a, la materia es
la que determina la geometrı́a, en palabras de Wheeler La materia le dice al espacio cómo curvarse y el
espacio le dice a la materia cómo moverse. Esto último via las ecuaciones geodésicas. La materia curva
al espacio y el espacio determina la trayectoria de la materia. Muy interesante, el cı́rculo se cierra, ya
habı́amos visto que los cuerpos siguen las trayectorias determinadas por la curvatura del espacio y es la
materia la que curva a dicho espacio. ¡No hay fuerza gravitatoria!

82
Figura 8.1: John Archivald Wheeler, 1911 - 2008.

En efecto, en este nuevo paradigma el Sol, por ejemplo, curva al espacio-tiempo, por el sólo hecho de
estar en él. Los cuerpos entonces siguen queriendo estar en las trayectorias que minimizan su energı́a,
sólo que en este caso, como el espacio es curvo, ya no son rectas, son geodésicas, dichas geodésicas pueden
ser ... ¡elipses! por ejemplo. Ası́, los planetas siguen sus trayectorias alrrededor del Sol no por la acción
de una fuerza gravitatoria que, de hecho, no existe, sino porque dichas trayectorias son las geodésicas del
espacio curvado por el Sol. Interesante, ¿no crees lector@?
El espacio, unido con el tiempo, el espacio-tiempo dejan de ser un escenario innerme donde ocurren
los fenómenos, como lo describe la fı́sica newtoniana, sino que responde y es afectado por la presencia de
la materia. El escenario depende de los actores.
¡Que cambio de paradigma! El, la lector@ se puede preguntar, si, muy bien, pero ¿Cómo se puede
probar? ¿Cómo saber si este paradigma es correcto? ¿Qué es correcto?
Pues correcto, una teorı́a es correcta si describe consistentemente a la Naturaleza y, mientras mejor
la describa, es decir, mientras sus descripciones y predicciones coincidan mejor con lo que se mide en un
experimento, con lo que ocurre en la Naturaleza, será una mejor teorı́a. Ası́, dadas dos teorı́as, la manera
de medir cuál es mejor que la otra, es considerando un experimento y determinando cuál es la teorı́a cuya
predicción, cuantitativa, el numerito, coincide mejor con el medido. Eso es que una teorı́a sea Fı́sica y
que sea correcta. No elucubraciones sin posibilidad de ser aterrizadas.
Las ecuaciones de Einstein, si bien, como hemos mencionado, se pudieron “adivinar”, a partir de la
ecuación de Poisson y, como ya vimos al considerar el lı́mite newtoniano de la ecuación de geodésicas,
encontramos que el coeficiente métrico g00 se relacionaba con el potencial gravitatorio, φ, ya tenı́amos que
la gravitación, φ se relacionaba con la geometrı́a, gµ ν y, como el potencial se determina con la materia
(ecuación de Poisson), tenemos ya que la geometrı́a está relacionada con la materia, la idea medular de
Einstein. Pero claro, una vez que conocemos la respuesta, es fácil decirla, pero, aquı́ sı́, es Albert Einstein
el que se lleva todo el mérito.
Si bien, cuando presentamos a la teorı́a de la relatividad especial, discutimos que la teorı́a “ya estaba
en el aire”, este concepto de unir a la gravitación con la curvatura y, a su vez, ésta con la materia, es com-
pletamente original del ingenio de Albert Einstein. Aquı́ sı́, pensamos, esta idea hubiera tardado muchos
años en surgir en otra persona. La originalidad y paternidad de la Relatividad General, corresponden a
Albert Einstein.
Hay que mencionar, sin embargo, que sı́ hubo gente que apoyó y contribuyó al desarrollo de la idea,
como Marcel Grossman Marcel Grossman fue un geómetra que constribuyó con Einstein al desarrollo de
la Teorı́a de la Relatividad General y, desafortunadamente, no recibió ningún crédito que sepamos por
parte de Einstein. Y hubo más, si bien tuvo esa idea, esa intuición genial, la teorı́a no se desarrolló por

83
Figura 8.2: Marcel Grossmann, 1878 - 1936.

el trabajo de un sólo hombre, aunque este sea Albert Einstein. Como decimos, lástima.
Regresando a las ecuaciones de Einstein, otro punto muy interesante es la constante, c en la ec. (8.7)
que, al llegar al lı́mite newtoniano, la ecuación de Poisson, igualamos a cero. Pero esto hay que tomarlo
con cuidado. El cero es algo que no es fácil de tener, ¡aún en una calificación! Si pensamos en lo que
hemos discutido sobre lo correcto de las ecuaciones al compararlas con la Naturaleza, esto siempre se
realiza con mediciones y éstas, las mediciones, tienen un lı́mite de precisión, dada por los instrumentos
utilizados. Por lo tanto, podemos afirmar que la ecuación de Poisson se ha probado hasta cierta precisión
y, con esta base, lo que es correcto afirmar es que dicha constante c es menor a cierto valor dado por la
precisión de las mediciones, no cero, por lo que, en sı́, las ecuaciones de Einstein se escriben como
1
Rµ ν − g µ ν R + Λ g µ ν = 8 π G Tµ ν , (8.9)
2
donde hemos llamado a la constante c, Λ. Esta constante tiene una historia muy intersante que ver-
emos cuando discutamos la solución cosmológica de Friedmann-Lemaitre. Por ahora, lo dejamos ası́,
mencionando que esta es la forma general de escribir a las ecuaciones de Einstein.
En fin, muchas cosas que comentar y ya se está acabando el curso. Terminamos la sección mencionando
una propiedad importante de las ecuaciones de Einstein (y la demostración queda de tarea). Partiendo
de que las ecuaciones de Einstein, ec. (8.8) se pueden reescribir como
 
1
Rµ ν = 8 π G Tµ ν − gµ ν T , (8.10)
2
con T la traza del tensor de energı́a momento, es decir, T = g µ ν Tµ ν . De aquı́ vemos claramente que si
estoy en vacio, no hay materia, Tµ ν = 0, por lo que su traza también, tengo que las ecuaciones se reducen
a
Rµ ν = 0, (8.11)
que implican que el escalar de curvatura es cero,

R = 0, (8.12)

pero, ¡mucho cuidado! ¡no implican que el espacio es necesariamente plano! Hemos visto que si Riemann
es cero, sı́ es plano, pero no dijimos nada de si el tensor de Ricci o el escalar de curvatura son cero, implique
lo mismo y, de hecho, no lo es. Veremos casos interesantes que son de vacı́o, pero tienen curvatura. Muy
curioso y lo iremos discutiendo.
Como mencionamos, ahora mostraremos, siguiendo al Landau, [?], una derivación alternativa y muy
elegante de las ecuaciones de Einstein. Derivar a las ecuaciones de campo por medio de principios
variacionales.

84
8.1 Acción de Einstein Hilbert
Para derivar a las ecuaciones de Einstein a partir de la acción, que ya conocemos de los cursos de mecánica
y vimos en acción, enfatizo esta redundancia, con las ecuaciones de geodésicas. . Esta derivación es
debida a David Hilbert, también le andaba dando vuetas a la idea pero, nuevamente, no recibió ningún

Figura 8.3: David Hilbert, 1862 - 1943.

reconocimiento por parte de Einstein. Como veremos, su idea es una manera muy elegante de derivar a las
ecuaciones de campo y, de hecho, ahora todas las interacciones son derivables de principios variacionales.
Entonces, para el caso de campos, como el gravitacional, hay que hacer algunas, traducciones, de
conceptos de partı́culas a conceptos de campos. En partı́culas tenemos que la lagrangiana, L es función
de las coordenadas generalizadas, q i , las velocidades generalizadas, q̇ i , y el tiempo, L = L q i , q̇ i , t y


variamos y las ecuaciones de Euler nos dan ecuaciones para las aceleraciones, q̈ i , es decir, las fuerzas.
Para campos, queremos que la función lagrangiana, se le llama de hecho funcional lagrangiana, sea
un escalar, pues queremos una acción invariante, es decir, escalar. En mecánica el parámetro es eltiempo
y en campos lo son las coordenadas, por lo que identificamos t → xα , las coordenadas generalizadas las
identificamos con los campos, q i → φ, en el caso del campo gravitacional, q i → gµ ν y las velocidades
generalizadas se van a las derivadas de los campos, q̇ i → φ,ν , q̇ i → gµ ν ,λ , por lo que para campos
la funcional lagrangian es L = L (φ, φ,ν , xα ), para el caso gravitacional, L = L (gµ ν , gµ ν ,λ , xα ), la
integración en mecánica es sobre el tiempo, en campos es sobre el cuadrivolumen, dt → d4 x, pero

debemos considerar al volumen invariante, es decir dt → −g d4 x, con g el determinante de la métrica.
Tenemos entonces que la acción en campos es

Z
S= L (φ, φ,ν , xα ) −g d4 x (8.13)

y la lagrangiana debe ser un escalar. Para el caso del campo gravitacional, el escalar que rápidamente
se ocurre es el escalar de curvatura, R. Ya pensándole más, vemos que puede haber problemas, pues el
escalar involucra segundas derivadas del campo, de gµ ν , que nos podrı́a dar ecuaciones con las terceras
derivadas, que ya no será correcto. Sin embargo, como veremos más adelante, ¡funciona bien!
Veamoslo. Entonces, consideramos la acción,

Z
S= −g (R + LMateria ) d4 x, (8.14)

que se conoce como la acción de Einstein-Hilbert.

85
La idea es que, al variar y hacerla extremo, encontremos las ecuaciones. Veamos primeramente la
√ √
parte geom’etrica. Variamos, δ Sg = δ ( −g R) d4 x = δ ( −g g µ ν Rµ ν ) d4 x, que me implica, por
R R
√ √ √
Leibnitz, δ Sg = (δ −g g µ ν Rµ ν + −g δ (g µ ν ) Rµ ν + −g g µ ν δ (Rµ ν )) d4 x.
R

Ya hemos mencionado la relación entre las derivadas del determinante y las de los coeficientes métricos,
g,ν αβ
g =g gα β ,ν . Lo mismo vale para la variación, es decir,

√ −g µ ν
δ −g = − g δ gµ ν , (8.15)
2
Para la variación de Ricci, nos vamos de nuevo a un sistema donde en un punto arbitrario la métrica
es la de Minkowski y los Christoffel se anulan, por lo que para Ricci obtenemos, como ya se mostró,

Rν ρ = Γα α α µ α µ
α ν ,ρ − Γν ρ ,α + Γρ µ Γν α − Γα µ Γν ρ , (8.16)

en el punto estudiado se reduce a:


Rµ ν = Γα α
α µ ,ν − Γµ ν ,α , (8.17)
al hacer la variación, que conmuta con las derivadas, obtenemos

g µ ν δ Rµ ν = g µ ν δ Γα
α µ ,ν − g
µν
δ Γα
µ ν ,α . (8.18)

Como la métrica se reduce a la plana, es posible incluirla en la derivada y se obtiene que

g µ ν δ Rµ ν = ∂α g µ α δ Γνν µ − g µ ν δ Γα

µν , (8.19)

es decir,
g µ ν δ Rµ ν = ∂α ω α , (8.20)
donde ω α = g µ α δ Γνν µ − g µ ν δ Γα
µ ν . De este modo, se llega a que g
µν
δ Rµ ν es igual a la divergencia
α
de un vector (se puede demostrar que ω es efectivamente un vector). Para obtener la expresión en un
sistema arbitrario, la regla es, como ya hemos mencionado, Minkowski se va a gµ ν y comas a punto
y coma, derivada usual a derivada covariante, por lo que se tiene

g µ ν δ Rµ ν = ω α ;α , (8.21)

que es una expresión tensorial, válida en un sistema de referencia, por lo que es válida en cualquier
sistema. Por otro lado, ya sabemos que la divergencia de un vector la puedo escribir como la derivada
usual, por lo que
1 √
g µ ν δ Rµ ν = √ −g ω α ,α ,

(8.22)
−g
con g el determinante de la métrica. Por lo que todo el término, dentro de la integral queda de la forma
√ √
Z Z
µν 4
−g ω α ,α d4 x,

−g g δ Rµ ν d x = (8.23)

que, usando el teorema de Gauss, se puede reescribir como una integral en la frontera que contiene al
cuadrivolumen.
√ √
Z Z
−g g µ ν δ Rµ ν d4 x = −g ωα dS α ,

(8.24)
∂V
pero en dicha frontera, siguiendo la idea variacional de mecánica, las variaciones son nulas, por lo que
este término se anula y obtenemos entonces que la variación de la acción es

 
1
Z
δ Sg = −g Rµ ν − gµ ν R δ g µ ν d4 x, (8.25)
2

86
Respecto a la materia se toma como definición que el tensor de energı́a esfuerzos es la variación de la
lagrangiana de materia respecto al tensor métrico:
δLMateria
k Tµ ν = . (8.26)
δ gµ ν
Es posible mostrar que esta es una definicón correcta y consistente de los tensores de energı́a esfuerzos
que hemos presentado con anterioridad, siendo el caso más claro el del tensor de enrgı́a esfuerzos del
campo escalar, ec. (5.41), que proviene de variar la lagrangiana

Lc.e. = g µ ν ∇µ φ ∇ν φ + V (φ). (8.27)

En efecto, δL
δ g µ ν nos genera el corresponiente tensor, ec. (5.41), y la variación respecto al campo escalar,
c.e.

δLc.e.
δ φ nos genera a la ecuación de Klein- Gordon, ec. (5.42).
De este modo, obtenemos finalmente que

 
1
Z
δS = −g Rµ ν − gµ ν R − k Tµ ν δ g µ ν d4 x. (8.28)
2

Al tomar el extremo, igual a cero la variación y como es una integral igualada a cero y los δ g µ ν son
arbitrarios, concluimos que el integrando debe ser cero, es decir:
1
Rµ ν − gµ ν R − k Tµ ν = 0, (8.29)
2
8πG
con lo que finalmente obtenemos, identificando a la constnate k con k = c4 :

1 8πG
Rµ ν − gµ ν R = Tµ ν , (8.30)
2 c4
las ecuaciones de Einstein.
De este modo vemos que las ecuaciones de campo gravitatorio, en efecto, surgen de una lagrangiana
y del principio variacional. Claramente, si se desea incluir en la lagrangiana a la constante cosmológica,
Λ, basta con redefinirla como

Z
S= −g (R + Λ + LMateria ) d4 x (8.31)

y, al hacer la variación de esta acción e igualarla a cero, obtenemos


1 8πG
Rµ ν − gµ ν R + Λ gµ ν = Tµ ν , (8.32)
2 c4
las ecuaciones de Einstein incluyendo a la constante cosmológica.
De este modo, hemos obtenido a las ecuaciones de Einstein de dos maneras, cada una mostrándonos
diferentes aspectos de la teorı́a de la relatividad general; en el primero, como generalización covariante
de la fuerza de gravitación de Newton, quitando fuerza por geometrı́a y, en el segundo, a partir de una
Lagrangiana, lo que nos permite asomarnos a conceptos aún más profundos de las interacciones de la
Naturaleza.

87
Ejercicios 8

1. Espacio tiempo esféricamente simétrico y estático A partir de la forma del elemento de lı́nea
para el espacio tiempo esféricamente simétrico y estático,

ds2 = −S(r) dt2 + C(r) dt dr + T (r) dr2 + D(r) r2 dΩ2 , (8.33)

demuestra que, redefiniendo a la coordenada radial y temporal, se puede llevar a la forma

ds2 = −A(r) dt2 + B(r) dr2 + r2 dΩ2 , (8.34)

2. Transformación conforme
Encuentra la transformación de cooordenadas que lleva el elemento de lı́nea de un agujero negro en
coordenadas de Schwarzschild vistas en clase a:
 2  4
2 1 − M/2r 2 M
ds = − dt + 1 + (dr2 + r2 dΩ2 ), (8.35)
1 + M/2r 2r

a este tipo de transformación de coordenadas se les llama conformalmente planas porque la parte
espacial es la métrica plana multiplicada por una función.

3. Geodésicas en Schwarzschild
Obtén una primera integral para las geodésicas en Schwarzschild. Ayuda: ¡NO necesitas los Christof-
fel!

88
Capı́tulo 9

Soluciones a las ecuaciones de


Einstein

Las ecuaciones de Einsten nos muestran entonces que la geometrı́a del espacio tiempo, descrita por
Riemann y sus parientes tensoriales, Ricci y el escalar de curvatura, queda determinada por la distrubución
de materia-energı́a presente en ese espacio. El espacio-tiempo no es inerme a la materia que esté en él, el
espacio tiempo se curva al ponerle materia.
Ası́, la materia le dice al espacio cómo curvarse y, vı́a las geodésicas, el espacio le dice a la materia,
cómo moverse. Es una relación nada lineal, tal vez tiene sentido el pensar que no es una relación
aristotélica de identidad, sino más una relación móvil, tipo de las que mencionaba Epicureo al plantear
que sĺo podrı́amos cruzar un rı́o una vez, es decir, a = a, a = b implica b = a, pero sólo en un instante.
La relación entre materia y geometrı́a es más dinámica de lo que la pueden describir matemáticas
basadas en lógica aristotélica. Presenta interés el desarrollar una matemática basada en otra lógica, una
lógica más dinámica, como la dialéctica y, al formular la Fı́sica en esa matemática, podamos entender y
tratar mejor éstas relaciones.
Mientras llega ese estudio, las trabajamos ası́ como están.
A pesar de su belleza, las volvemos a poner:

1 8πG
Rµ ν − gµ ν R + Λ gµ ν = Tµ ν , (9.1)
2 c4
son de una gran complejidad, no sólo conceptual sino en términos prácticos, tienen una enorme cantidad
de términos, si los desarrollásemos, serı́an cientos, queda de ejercicio el contarlos. En 4d, las ecuaciones
de Einstein son 10 ecuaciones diferenciales de segundo orden, acopladas, altamente no lineales. Son el
ejemplo más compeljo de ecuaciones diferenciales que tiene la Fı́sica.
Como es de esperarse, el resolver a éstas ecuaciones no es una tarea sencilla. Aunque, es importante
aclarar qué queremos decir por resolver a una ecuación diferencial. Resover a las ecuaciones de Einstein,
es dar un conjunto de funciones (gµ ν , Tµ ν ), que satisfagan a dichas ecuaciones. Pero no sólo esto, sino
que deben tener sentido fı́sico. Veamoslas en su lı́mite newtoniano, las ecuaciones de Poisson, resolverlas
no sólo es dar una paraje (φ, ρ), pues ası́ nomás, se puede hacer, pero no tiene sentido fı́sico. En efecto,
si consideramos una función perfectamente arbitraria, y la llamo ”potencial gravitacional”, por ejemplo,
x2 +y 2
sea φ = senh (k0 (z − t vz )) e σ2 , se le aplica el LAplaciano, lo cual es directo y as eso que salga, se le
divide entre 4 π G y se le llama densidad ρ, efectivamente, se tiene una pareja (φ, ρ), que es solución, por
construcción, de la ecuación de Poisson, sin embargo, dicha solución no tiene sentido fı́sico. La Fı́sica
me la da la densidad, doy una distribución de densidad, vacio, una nube de gas esférica, un toro rotante

89
y busco cuál es el potencial gravitacional generado por esa distribución, dicha paraeja será solución y sı́
tendrá sentido Fı́sico.
De maner análoga, se puede considerar a una matriz que tenga como entradas funciones arbitrarias,
se deriva un par de veces dicha matriz con respecto a las diferentes coordenadas y se construye al
correspondiente tensor de Riemann, (nótese que todas son operaciones directas). Una vez que se calcula
al tensor de Riemann, se contrae para contruir al correspondiente tensor de Ricci y al escalar de curvatura
4
y finalmente se contruye el tensor de Einstein, ec. (7.27). Este se multiplica por (8cπ G y al tensor resulante
lo llamamos el tensor de energı́a esfuerzos. De este mod, se tiene una solución para las ecuaciones de
Einstein, pero, como en el caso de Poisson, sin sentido fı́sico. Análogamente al caso newtoniano, se debe
dar una expresión para el tensor de energı́a esfuerzos, Tµ ν , que describa una distribución espacio-temporal
de la materia-energı́a válida, fı́sica. Es a dicha distribución a lo que se le busca un tensor métrico solución
de las ecuaciones de Einstein para dicha distribución.
Los tensores de energı́a materia que tienen sentido fı́sico son aquellos que describen una distribución
razonable de la materia. Puede ser el dar las posiciones y velocidades de un conjunto de partı́culas y
determinar el Tµ ν correspondiente, lo que se hace por medio de los momentos de la ecuación de Boltzmann
conservada. Es usual es dar un tensor que describa a un fluido, al fluido perfecto por ejemplo, pidiendo
que este describa una situación fisicamente realista. Podemos pedir que sea vacio, que sea debido a un
campo electromagnético, aunque esto sea una situación especulativa, determinar la curvatura en el espacio
tiempo que genera un campo electromagnético, es, sin embargo, una propuesta válida. Ası́ mismo, se
puede considerar al tensor generado con un campo escalar. En fin, el punto es dar un tensor de energı́a
esfuerzos con una interpretación fı́sica y a éste es al que se le busca la solución en las ecuaciones de
Einstein. No es trivial.

9.1 Espacio-tiempo de Schwarzschild


Dada este reto, el resolver para situaciones fı́sicas un sistema de ecauciones tan complejo, fue (y sigue
siendo) admirable el que a los pocos mese de que Albert Einstein publicara sus ecuaciones, Karl Schwarzschild
encontrara una solución exacta, analı́tica, de ellas. Es una solución de vacı́o, es válido como vimos y, se
plante entonces el caso homogéneo de las ecuaciones de Einstein.
Schwarzschild en 1916, con gran ingenio, utilizó las técnicas que ahora son estándar en buscar solución
a las ecuaciones diferenciales y es el introducir simetrı́as. Considera entonces para el espacio-tiempo la

Figura 9.1: Karl Schwarzschild, 1873 - 1916.

máxima simetr’ia, la esférica y que dicho espacio tiempo es estático, es decir, gµ ν ,t = 0, ∀µ ν. Dada estas
simetrı́as podemos inferir la forma del elemento de lı́nea correspondiente. En efecto, el espacio-tiempo

90
sólo depende de la distancia a un punto, no de los ángulos, por lo que sólo puede ser función de las
normas |~x|, |d ~x|, y su producto |~x| · |d ~x|. Al describir el espacio tiempo en coordenadas esféricas, estas
condiciones implican que los coeficientes métricos cruzados, t y los ángulos, deben ser cero y que la parte
espacial del elemento de lı́nea debe ser proporcional al elemento en esféricas, es decir:

ds2 = −A (r) c2 dt2 + C (r) dt dr + B (r) dr2 + D (r) r2 d Ω2 . (9.2)

Ahora, sin pérdida de generalidad, es posible dar una transformación de coordenadas para anular el
término cruzado en dt dr, redefiendo al”radio” , por lo que llego a que la forma más general del elemento
de lı́nea para un Universo con simetrı́a esférica y estático es

ds2 = −A (r) c2 dt2 + B (r) dr2 + r2 d Ω2 , (9.3)

con d Ω2 = d θ2 + sen2 θ d φ2 , el elemento de ángulo sólido.


Esta es la gran idea de Schwarzschild, el usar las simetrı́as. Vemos que, de diez coeficiente métricos en
general, ahora sólo quedan dos y estos, no son función de las cuatro coordenads, sino sólo de la coordenada
radial. El resto ya es directo. Se le da vuelta a la maquinita, (puede ser útil lector@ que lo hagan a mano
alguna vez en su vida. Se obienen entonces directamente los Christoffels y las componente no triviales
del tensor de Riemann. Actualmente hay los programas de cálculo tensorial que reducen este trabajo a
dar una instrucción, como por ejemplo, el programa gr-tensor dentro de Maple. De un modo u otro, las
componentes no triviales del tenosr de Riemann son:
′′
B′ A′ 2 A′
R0 r 0 r = − A2 + 4B A′ + 4 A , R0 θ 0 θ = −r 2 B , R0 φ 0 φ = Rθ t θ t sen2 θ,

Rr θ r θ = −r 2BB , Rr φ r φ = Rr θ r θ sen2 θ, (9.4)
Rθ φ θ φ = B−1 2
B r sen θ,
2

con lo que se obtienen diréctamente las componentes no nulas del tensor de Ricci, (nos conviene sacar
los mixtos):
2
A′ ′ A′ B ′ A′ A′
R0 0 = − + 2
+ 2
− ,
2AB 4AB 4A B rAB
2
A′ ′ A′ B ′ A′ B′
Rr r = − + 2
+ + , (9.5)
2AB  ′ 4 A B 4 A2B rB 2

A′

1 B 1 1
Rφ φ = Rθ θ = − + 2 1− ,
2rB B A r B
y de una vez obtenemos el escalar de curvatura:
2
A′ ′ A′ B ′ A′ B′ A′
   
2 2 1
R=− + 2
+ 2
+ − + 2 1− . (9.6)
AB 2AB 2A B rB B A r B
Muy bien, hasta aquı́, va pura geometrı́a, le ponemos fı́sica pidiendo algo sobre el tensorde energı́a
materia. Schwarazschild investigó cuando dicho tensor es cero, es decir, se busca una solución en vacı́o,
que ya vimos que no necesariamten implica que sea espacio plano, regresaremos a este punto.
Es fácil ver que en este caso, en que las tres componentes del tensor de Ricci quedan igualas a cero, que
′ ′ ′
, al restar R0 0 − Rr r , se tiene que AA + BB = 0, es decir, ln (A B) = 0, lo que implica que B
A
= constante,
pero si se pide que el espacio tiempo sea asintóticamente plano, es decir, que el elemento de lı́nea para
radios grandes tome la forma plana, lo que implica que los coeficientes A y B se vayan a 1. Pero la
relación que acabamos de obtene para estos coeficientes se debe cumplir para todo radio, cin lo que
podemos evaluar a esa constante y concluimos por lo que se tiene que los coeficientes métricos deben
cumplir que B = A1 .

91
De este modo, resta solo un coefiente métrico por determinar. Al substituir esta relación entre A y B
en Rθ θ = 0, obtenemos la ecuación r A′ + A − 1 = 0, que se resuelve diréctamente con A = 1 + f racc1 r,
con c1 una constante de integración.
¡Listo! De este modo, se ha determinado una solución a las ecuaciones de Einstein en un caso fı́sico
válido e interesante, con simetrı́a esférica y estático.
Queda una constante de integración y, para determinarla, recordamos que en el lı́mite newtoniano, en
campo débil, se tiene que donde g00 = −(1 + 2 cφ2 ), con φ el potencial gravitatorio y, sabemos que, en el
caso de una masa puntal (o distribuida esféricamente), dicho potencial va como φ = −G M/r, por lo que
comparando la solución obtenida con ésta del lı́mite newtoniano, concluimos que el valor de la constante
de integración es concluyo que c1 = −2 GcM 2 , con M una masa puntual que genera el campo gravitatorio,

por lo que la solución para el espacio tiempo es

d r2
 
GM
ds2 = − 1 − 2 2 c2 d t2 −  + r 2 d Ω2 , (9.7)
c r 1 − 2 Gc2Mr

es una solución para las ecuaciones de Einstein en vacı́o, la primera solución obtenida y se conoce como
la solución de Schwarzschild.
Muy bien, pero, algo queda extraño. Las ecuaciones de Einstein nos dice que la materia curva al
espacio, la geometrı́a depende de la materia presente, pero, si estamos en vacı́o, pues no hay materia que
curve, por lo que deberı́a ser una geometrı́a plana. Dado que ya tenemos la solución, el elemento de lı́nea,
ec. (9.7), podemos calcular de nuevo a las componentes del tensor de Riemann, ahora ya explı́citamente
para esta métrica y obtenemos:

R0 r 0 r = −2 cG2 M GM
1 − 2 Gc2Mr , R0 φ 0 φ = Rt θ t θ sen2 θ,

r 3 , R0 θ 0 θ = c2 r
GM
Rr θ r θ = − 1−2c2 Gr M , Rr φ r φ = Rr θ r θ sen2 θ, (9.8)
c2 r

Rθ φ θ φ = 2 GcM
2 r sen2 θ,

claramente vemos que si M es distinto de cero, las componentes de Riemann también lo son, por lo que
que, utilizando el teorema discutido en la sección de Riemann, el espacio no es plano, el espacio es curvo.
Entonces, sı́ tenemos a un caso de vacı́o pero curvo. ¿Qué es lo que lo curva? pues la masa M , pero si
es vacı́o, ¿dónde está?
Ya vimos que, por construcción el tensor de Ricci y el escalar de curvatura son cero, podemos sacar
otro escalar, que es un producto directo y contracción de Riemann consigo mismo, se le llama el escalar
de Kretschmann (Erich Justus Kretschmann 1887 1973, no encontramos fotografı́a de él) y al calcularlo
para el espacio-tiempo de Schwarzschild obtenemos :

g2 M 2
Rµ ν λ τ Rµ ν λ τ = 48 . (9.9)
c4 r 6
Una propiedad muy importante de los escalares es su definición, su valor no cambia por cambios en
sistemas de referencia. Por ello vemos que este escalar nos dice que en r = 0 tenemos una divergencia
y, como es una divergencia en un escalar, no es una divergencia que cambia con las coordenadas o con
el sistema de referencia. Entonces, el punto r = 0 es una divergenica fı́sica. Entonces, podemos pensar
que nuestra variedad, nuesro espacio-tiempo, es el conjunto de todos los puntos menos el origen, el origen
r = 0 está excluido pues tiene una divergencia que no puede ser descrita por la Fı́sica.
Con este razonamiento, podemos resolver nuestra paradoja. El espacio-tiempo de Schwarzschil es
vacı́o, en efecto y la masa, lo que lo curvó, se encuentra en la singularidad, en un punto ya fuera del
espacio-tiempo. Recapitulando, el escalar de Kretschmann en el espacio de Schwarzschild nos muestra
que el único lugar donde este espacio tiempo no está definido es en el origen, r = 0, consideramos entonces

92
que este es un punto que no pertence a nuestro espacio-tiempo y que es ahı́ es donde está la masa. Por lo
que podemos interpretar a la solución de Schwarzschild como un espacio donde la materia se concentró
toda en un punto, que deja de pertencer a la variedad pero que curvó al espacio tiempo. Curioso, ¿verdad?
Recordemos que ésta es una solución estática, no muestra ninguna evolución describe a un hoyo negro
que siempre a estado y estará, no cambia. Esta solución no describe el proceso de formación, aquello que
da lugar al hoyo negro.
El proceso de formación de un hoyo negro es una historia muy interesante que, resumida es la siguiente:
Las estrelals brillan pues su propio peso es tan enorme que, en el centro de ellas alcanzan una presión
sufiente para generar reacciones termonucleares de Hidrógeno transformándose a Helio. Dichas reacciones

Figura 9.2: Presión vs. gravedad y evolución de las estrellas

generan una presión de radiación suficiente que compensa al peso y la estrella está en equilibrio. Cuando
el Hidrógeno empieza a se escazo, el peso de la estrella gana y, dependiendo de la masa, puede alacanzar
otro estado de equilibiro, conviertiendo al Helio en Carbono, por ejemplo, o si la masa es suficientemente
grande, puede generar una presión que una a los protones con los electrones, creanod una estrella de
neutrones y, si es más grande aún, no hay fuerza que se pueda oponer al peso y se colapasará a un punto,
formando el hoyo negro. Este serı́a un hoyo negro no estático, cuya desripción en las ecuaciones de
Einstein es mucho más complicada que la solución estática de Schwrazschild y, para hacerlo, es necesario
recurrir a las soluciones numéricas.
Otro punto interesante en la geometrı́a del espacio tiempo de Schwarzschild es en r = 2 Mc2G . Es
fácil ver que ahı́ el elemento de lı́nea, ec. (9.7), tiene problemas. En efecto, la componente gtt se va
a cero mientras que la componente grr diverge. Pero, cuidado, estas son componentes tensoriales, su
valor sı́ cambia de un sistema de referencia a otro, de acuerdo con la ley de transformación de tensores.
El escalar de Kretschmann no muestra ningún problema al subsituir r = 2 Mc2G . De hecho, es posible
hacer un cambio de coordenadas donde la métrica no presenta problemas en este radio. Esto implica
que r = 2 Mc2G no es una singularidad fı́sica, como lo es r = 0, el problema que se ve surge debido a las
coordenadas que estamos utilizando, por lo que se le llama una singularidad coordenada.
Si bien, no hya divergencias, dicha singularidad coordenada sı́ tiene una propiedad muy interesante.
Marca el radio a partir del cual, ningún observador puede regresar, es un verdadero punto de no-retorno,
pues ni siquiera la luz puede salir, se le conoce como el horizonte. Esto nos permite definir a un hoyo negro
como aquel espacio tiempo con dos regiones, una en la que ni la luz puede salir y otra asintóticamente
plana. A la frontera entre estas regiones se le llama horizonte y al radio rSchw = 2 Mc2G , se le llama radio
de Schwarzschild y es el que pensamos al hablar del tamao de hoyo negro. Un dato que vale la pena tener
presente es el considerar a un hoyo negro con la masa del Sol. Si bien se sabe que el Sol no evolucionará
hacia un hoyo negro, pues no tiene la masa suficiente, es interesante ver de qué tamao serı́a si toda su
2
masa se colapsara. Entonces, con G = 6.67 × 10−11 Nkgm2 , c = 299 792 458 ms y, para la masa del Sol,
M⊙ = 1.9891 × 1030 kg, obtenemos que se formarı́a un hoyo negro de radio igual a rSchwSol = 2952.37 mts.

93
Figura 9.3: Diagrama artı́stico de un hoyo negro

Serı́a un objeto de un poco menos de 3 kilómetros de radio.


De este modo, vemos que los hoyos negros son una solución de las ecuaciones de Einstein en vacı́o,
son una predicción teórica de un cierto tipo de espacio-tiempos. Hay procesos que explican su formación
como la etapa final de cierto tipo de estrellas. Pero, pueden argumentar ciertos estudiantes, ¡no se ha
visto ningún hoyo negro!
Visto como tal, pues no, ¡dado que son negros! pero hay mucha evidencia de su presencia, sobre todo
en el centro de las galáxias, incluyendo la nuestra. En efecto, las observaciones detalladas y de larga
duración de cuerpos en la zona del centro de la Via Lactea, que está a unos 27,000 años luz de nosotros,
muestran a cuerpos orbitando alrrededor de algo con brillo mucho menor que el de los cuerpos en esa

Figura 9.4: Dinámica en el centro de la Vı́a Lactea

zona. La órbita y luminosidad de los cuerpos que se observan, permite inferir que se tiene a un cuerpo
muy masivo, del orden de 4.4 millones de masas solares, ocupando un volumne muy reducido (de otro
modo hubiese interacutado y destruido al cuerpo) y con una luminosidad muy inferior a la luminosidad
opbservada de los cuerpos en esa zona. Se puede calcular que, cuando cae materia al hoyo negro, dicha
materia siente una gran aceleración y, por efectos de fricción consigo misma, al ir cayendo a un volumen
menor, emite radiación en forma de rayos X. dicha radiación también se ha observado.
Todo ello forma un conjunto de pruebas que nos permiten afirmar que, en efecto, hay un hoyo negro
super masivo en el centro de la galaxia y, de hecho, se considera que la mayorı́a de las galaxias tienen
hoyo negros super masivos en su centro.

94
No podemos terminar esta sección sin por lo menor tocar un punto fundamental. Muy bien, ya vimos
que las ecuaciones de Einstein son la manera covariante de describir a la interacción gravitatoria; nos
dan un paradigma nuevo y muy diferente al que ofrece la Fı́sica de Newton, vemos esa interacción entre
geometrı́a y materia y hasta ya tenemos una solución que es la manera de ver a la acción de una masa
puntual; más aún, hay evidencias que implican la existencia de estos objetos en las galaxias. Perfecto,
pero, ¿Cómo sabemos que esto es correcto?
Como ya discutimos, una teorı́a es correcta, no por su belleza o su autoconsistencia, sino porque
mejor describa a la Naturaleza. Esto fue lo que mostró Einstein. Son dos fenómenos muy importantes
que prueban lo que se querı́a, el tener una predicción dada por una teorı́a y una diferente dada por otra.
Hacer las observaciones correspondientes y ver cuál teorı́a describe mejor o es más consistente con la
observación.
El primero de estos fenómenos es una observación que ya se conocı́a durante el siglo XIX y es la
precesión del perihelio de Mercurio: En efecto, se tenı́a ya una medición de que el perihelio de mercurio

Figura 9.5: Precesión en el perihelio de Mercurio, exagerada en el dibujo.

se desplazaba, una cantidad pequeña, 42.98 segundos de arco por siglo, pero medible y, el problema es
que no se podı́a explicar con la teorı́a de gravitación newtoniana; simplemente no es un efecto que ocurra
en ésta fı́sica. Es por ello que, la solución de Schwarzschild no sólo tenı́a el interés de ser una solución a
las ecuaciones de Einstein, sino que se podı́a usar para modelar al sitema solar. Si bien, el Sol no es un
hoyo negro, sı́ se puede considerar como una masa puntual, de hecho es como se considera para derivar
la dinámica planetaria, por lo que la solución de Schwarzschild se usó para describir la dinámica en el
espacio tiempo de una masa puntual. Después de todo, si no estamos cerca del hoyo negro, ası́ es como
se comporta.
Como mostramos en la siguiente sección, las trayectorias de los cuerpos, es decir, las geodésicas en
Schwarzschild, se pueden resolver hasta cuadraturas de un modo directo, por lo que no es difı́cil determinar
la trayectoria de los cuerpos y... Voilà! al substituir para la órbita de Mercurio se tiene este efecto de
precesión, en excelente acuerdo con las observaciones. De hecho, todos los planetas lo tienen, pero el valor
es aún más pequeño. De este modo, la teorı́a de la relatividad general no sólo contiene a los resultados
y predicciones de la teorı́a newtoniana, sino que puede explicar fenómenos donde la teorı́a newtoniana
queda muda.
Pero tal vez el más espectacular, el fenómeno de relatividad general par excellence es el de lente
gravitatoria. Es un fenómeno que muestra el gran ingenio de Einstein. Se tiene al modelo de Newton
con la fuerza gravitatoria y, por el otro lado, al modelo de Einstein con geometrı́a. Entonces, veamos un
caso donde no hay fuerza gravitatoria, pero sigue habiendo geometrı́a. Este es justo el efecto que piensa
Einstein al considerar que, dado que el fotón no tiene masa, mγ = 0, al pasar cerca del Sol, el fotón no
sentirá ninguna fuerza gravitatoria por parte de éste, por lo que su trayectoria continuará sin inmutarse.
Por otro lado, desde el punto de vista de la relatividad general, el fotón sin importar que no tenga masa,
viaja en un espacio que, en la presencia del Sol se curva, por lo que, al pasar cerca de éste, su trayectoria

95
sı́ se verá afectada y, de hecho, se puede cuantificar, no es mucho, tampoco es que se vaya al otro lado,
pero es medible, en el caso del Sol, pasándo en la orilla, la deflección es de 1.75′′ . Ası́ tenemos un caso
claro en el que no es que como el el fenómeno de Mercurio, la teorı́a newtoniana lo vea, sino que aquı́
sı́ da una predicción y es cero, no hay deflección y la relatividad general, el modelo de espacio-tiempo
curvo, da una predicción diferente, cuantificable.
Más aún, Einstein sugirió el experimento donde ésto se podrı́a medir. Durante un eclipse. En efcto,
la idea es determinar con presición la posición relativa de las estrellas, las distancias entre ellas, en una
regón donde se sabe que ocurrirá un eclipse. Una vez con esas mediciones, se espera al eclipse y, cuando
el cielo se obscurezca y se vean las estrellas, volver a medir la posición relativa de las estrellas. Aquellas
cuya luz pase justo en la orilla del Sol, sentirán el efecto de curvatura y se verán desplazadas con respecto
a las que están más lejos y entonces este efecto sea despreciable. En la siguente sección, al resolver las
geodésicas para el caso de partı́culas tipo luz, fotones, es posible ver claramente ésta predicción de la
relatividad general.

Figura 9.6: Medición del cambio de posición de una estrella durante un elipse solar

Al conocer esto, fue Arthur Eddington quien se entusiasmó con la idea y organizó dos expediciones
para observar al eclipse totales de Sol que ocurrirı́a en ese año, 1919. Una irı́a a Brasil y otra a la isla Sao
Tome y Prı́ncipe, en las costas occidental de frica, frente al actual Gabón. Eddington partió a Sao Tome
para observar el eclipse solar del 29 de mayo de 1919. Parece ser que la expedición de Eddington tuvo

Figura 9.7: Fotografı́a del eclipse hecha por Eddington, ası́ como la trayectoria de dicho eclipse

varios exabruptos, pero al final, se lograron tomar las ansiadas fotografı́as durante el eclipse solar y poder

96
medir la posición relativa de las estrellas, sobre todo, de aquellas cuya luz pasaba lo más cerca posible de
la orilla solar. Una vez con las fotografı́as, las estudió, trabajó y finalmente publicó su resultado donde
afirmaba que sus mediciones, en efecto comprobaban a la teorı́a de la relatividad general. El modelo de
espacio-tiempo curvo, es consistente, cualitativa y cuantitativamente con las observaciones. Este fue un
gran empuje a la teorı́a de Einstein y logró su aceptación por la comunidad internacional.

Figura 9.8: Arthur Stanley Eddington, 1882 - 1944 y con Albert Einstein y Hendrik Antoon Lorentz

Actualmente, el efecto de lentes gravitatorios se observa en muchos sistemas en cosmologı́a, a muy


diversas escalas [?]
Estos temas que hemos platicado, ası́ como otros relacionados, como los hoyos negros rotantes y los
cargados, pueden ser discutidos con presición y detalle en capı́tulos posteriores que se pudieran cubir en
un siguiente curso. Por ahora, aquı́ detenemos el tema de los hoyos negros.

97
9.1.1 Espacio-tiempo de Friedman - Lemaı̂tre
Otra solución a las ecuaciones de Einstein, un poco más complicada que la de Schwarzschild, fue determi-
nada por Aleksandr Friedman en 1922 - 1924, también a los pocos años de que Einstein habı́a propuesto
sus ecuaciones.

Figura 9.9: Aleksandr Aleksándrovich Friedman, 1888 - 1925.

Nuevamente, Friedman utiliza las simetrı́as, pero ahora buscando una solución para un fluido perfecto
en el que consideró que dicho fluido era homogéneo e isotrópico, es decir, existe un sistema de referencia en
el que sus parámetros, como densidad y presión, son independientes de la posción, por lo que sólo pueden
depender del tiempo coordenado. Esta consideración, aplicada a nuesrto Universo, es lo que actualmente
se conoce como el Principio Cosmológico: Nuestro Universo es, espacialmente, homogéneo e isotrópico.
Es decir, todos los puntos, de una sección espacial, son equivalentes (no se quiere volver a tener problemas
de definir un centro, un punto privilegiado) y tampoco hay direcciones preferentes, es equivalente, en una
sección espacial, el desplazarse hacia una dirección que hacia otra. Es decir, las secciones espaciales sı́
pueden cambiar, pero lo hacen con todos los puntos, no en regiones independientes.
Dichas condiciones nos implican que se debe tener simetrı́a esférica en cada punto de las secciones
espaciales. La distancia entre puntos sólo puede depender de su norma, no de su dirección, por lo que se
tiene, para la sección espacial, que dl2 = A(r) d r2 + r2 d Ω2 , con d Ω2 = d θ2 + sen2 θ d φ2 , la diferencial
de ángulo sólido que ya hemos visto. Más aún, el Principio Cosmoógico implica que las hipersuperficies
tengan curvatura constante, es decir que su su escalar de curvatura sea constante. Cuando se calcula el
escalar de curvatura, asociado con la hipersuperficie, se obtiene una única ecuación dierencial para A(r)
 
2 dA(r)
3R = 2 r + A(r)2 − A(r) , (9.10)
r A(r)2 dr

al suponer que 3 R = 6 k =cte y que limA(r) = 1 (r → ∞) se obtiene la forma del coeficiente métrico
consistente con el Principio Cosmológico: A = 1/(1 − k r2 ). De este modo, el elemento de lı́nea espacial
sólo puede representar a tres tipos de espacios, a tres tipos de secciones espaciales: a la plana, a una

98
cerrada o a una abierta. Es decir,

1 si la seccion espacial es plana,


A(r2 ) = 1
1−r 2 si la seccion espacial es cerrada,
(9.11)

 1 si la seccion espacial es abierta.

1+r 2

En efecto, es claro ver que, si A = 1, el elemento de lı́nea espacial queda dl2 = d r2 + r2 d Ω2 , plano
1 2 d r2 2 2
en coordenadas esféricas. Si A = 1−r 2 , el elemento espacial tiene la forma dl = 1−r 2 + r d Ω ; si

definimos r2 = sen2 ζ, es directo ver que el elemento de lı́nea toma la forma dl2 = d ζ 2 + sen2 ζ d Ω2 , que
es el de una 3-esfera, por ello son secciones espaciales con la forma de 3-esfera y se les llama cerradas.
Finalmente, si A = 1+r 1
2 , ahora se define r
2
= senh2 ψ, con lo que el elemento de lı́nea toma la forma
dl2 = d ψ 2 + senh2 ψ d Ω2 , que son secciones hiperbólicas, por lo que la sección espacial es abierta.
De manera unificada podemos escribir al elemento de lı́nea de la sección espacial, consistente con
d r2 2 2
el Principio Cosmológico como 1−k r 2 + r d Ω , con la k, como vimos, relacionada con el escalar de
curvatura de dicha hipersuperfcie. Finalmente, como se quiere que dicha simetrı́a se mantenga para todo
tiempo, obtenemos que el elemento de lı́nea del espacio-tiempo consistente con el Principio Cosmológico,
encontrado por Friedman es

d r2
 
ds2 = −c2 dt2 + a2 (t) + r 2
d Ω 2
, (9.12)
1 − k r2

donde a la función a, que sólo depende del tiempo coordenado, se le llama factor de escala. También
lo podemos llamar factor de encajamiento, ya que nos muestra cómo toda la sección espacial se va
metiendo al espacio-tiempo.
Dada esta forma del elemento de lı́nea, Friedmann buscó que fuese solución de las ecuaciones de
Einstein con fluido perfecto.
Como en el caso de Schwarzschild, esta es ya la idea genial, el describir la forma del espacio tiempo; el
resto es hacer derivadas y sumas; bueno, hasta llegar a las ecuaciones donde nuevamente hay que analizar
las cosas, pero, en términos de buscar la solución, como vemos, lo importante está en el planteamiento.
Respecto al fluido perfecto, cuyo tensor de energı́a esfuerzos viene dado por la ec. (5.34), como se vió
en uno de los ejercicios, para el observador comóvil, que se mueve junto con el fluido, por lo que, en este
sistema de referencia, el fluido está en reposo, por lo que su cuadrivelocidad se reduce a uµ = (u0 , ~0), y,
de la normalización, uµ uµ = −c2 , para la geometrı́a de Friedman, ec. (9.12), tenemos que u0 = c. Se vió
entonces que dicho tensor se puede escribir como

−µ c2 0 0 0
 
 0 p 0 0
T µν =
 0
. (9.13)
0 p 0
0 0 0 p

Y escribimos a las ecuaciones de Einstein de la forma Gµ ν = 8 cπ2G T µ ν . el cálculo del tensor de


Einstein, Gµ ν a partir de la métrica de Friedman ec. (9.12), es directo y obtenemos entonces que sólo hay
dos ecuaciones diferenciales no triviales (la temporal y las tres espaciales i i que dan la misma ecuación)
 2 !
ȧ k 8πG
3 + 2 = µ, (9.14)
a a c2
 2
ä ȧ k 8πG
−2 − − 2 = p, (9.15)
a a a c4

99
donde denotamos a punto, como derivada respecto al tiempo en unidades de distancia, c t. Antes de
intentar resolverlas, hay un punto intersante. Como sabemos, el tensor de energı́a esfuerzos debe satisfacer
que su divergencia es cero. Por lo que, para nuestro caso, T µ ν ; µ = 0 implica la ecuación:
ȧ 2
c2 µ̇ + 3

c µ + p = 0, (9.16)
a
pero esta ecuación es dependiente de las de Einstein. Claramente, si se satisfacen las de Einstein, se satis-
face la de conservación, por lo que tenemos tres ecuaciones pero solo dos funcionalmente independientes,
escojemos las más sencillas y el sistema a resolver es:
k 8πG
H2 + = µ, (9.17)
a2 3 c2
c2 µ̇ + 3 H c2 µ + p = 0, (9.18)

donde hemos definido a la razón de la derivada del factor de escala al factor de escala, la derivada
logarı́tmica, como

H= , (9.19)
a
que se conoce como la función de Hubble.
Aquı́ las cosas ya no le empezaron a gustar a Einstein, pues él abogaba por un Universo estático, es
decir, en el cual ȧ = 0, por ende H = 0 y eso implicaba que si las secciones espaciales eran planas, ambas
suposiciones en boga en 1920, se pensaba que el Universo era inmutable y casi plano, se teniá entonces
que la única solución era la trivial, un espacio-tiempo sin materia, Minkowski.
Aparte del punto de vista de Einstein, las ecuaciones sı́ resultaban muy interesantes. Veamos a la
ec. (9.17). Si la evaluamos al dı́a de hoy y es costumbre normalizar al factor de encajamiento a0 = a(t =
hoy) = 1, se tiene  
2 8πG
k = H0 µ0 − 1 , (9.20)
3 c 2 H0 2
donde H0 es la función de Hubble evaluada al dı́a de hoy, lo que se conoce como la constante de Hubble
y µ0 es la densidad del Universo al dı́a de hoy. De ésta ecuación vemos que el valor de k está determinado
por la magnitud de la densidad al dı́a de hoy. En efecto, conociendo el valor de la constante de Hubble
y la densidad, podemos determinar algo tan interesante como la curvatura de las secciones espaciales de
nuestro Universo, de acuerdo al modelo de Friedman. Al valor de la densidad al dı́a de hoy que hace que
la sección espacial sea cero, se le conoce como densidad crı́tica:

3 c 2 H0 2
µcritica = , (9.21)
8πG
ası́, de acuerdo al modelo de Friedmann, si la densidad del Universo al dı́a de hoy es mayor que la crı́tica,
las secciones espaciales serán cerradas, tendremos un Universo con secciones espaciales de 3-esfera. Si la
densidad del Universo al dı́a de hoy es menor a la crı́tica, las secciones espaciales de nuestro Universon
serán hiperbólicas, un Universo abierto. Y si la densidad del Universo al dı́a de hoy es igual a la crı́tica,
las secciones espaciales del Universo donde vivimos serán planas, tendremos a un Universo abierto y su
sección espacial plana.
Tomando el valor más reciente que se ha obtenido para la constante de Hubble [?],
km
H0Planck = 67.3 ± 1.2 . (9.22)
s Mpc
. Ya que estamos usando valores, es muy importante considerar las unidades que se estén utilizando.
Como se ha mostrado, a lo largo de estas notas hemos mantenido explı́citamente en todas las ecuaciones a

100
las constante fı́sicas, a diferencia de muchos textos y trabajos donde trabajan con las llamadas unidades
geométricas, donde se considera G = c = 1 o las llamadas unidades naturales, ~ = c = 1. Siendo
consistentes con que la coordenada temporal en el espacio tiempo es c t, con unidades de distancia. Por
ello, la función y constante de Hubble, ecs. (9.19), tienen unidades de inverso de distancia. Los valores
reportados son utilizanod unidades donde c = 1, por lo que, para utilizar el valor reportado, este debe
ser dividido entre la velocidad de la luz, es decir, H0 = H0Planck /c. Al utilizarlo entonces en la expresión
2
para la densidad crı́tica, ec. (9.21), la velocidad de la luz se cancela en ella, quedando µcritica = 3 H80 Planck
πG
que, incidentalmente, es la expresión que se obtiene en los textos que utilizan c = 1, como el Weinberg,
[?]. Dicho lo cual, expresamos a la constante de gravitación universal como,
 2  2
−6 km Kpc −9 km Mpc
G = 4.297 × 10 = 4.297 × 10 , (9.23)
s MSol s MSol
(expresar a G en estas unidades es muy útil al trabajar en problemas de cosmologı́a, con MSol denota
a la masa del Sol, MSol = 1.98 × 1033 grs.); la velocidad de la luz dadas las unidades de H0Planck no es
necesaria, por lo que obtenemos que la densidad crı́tica, aquella para la cual, de acuerdo a este modelo, un
atomito más y el Univeso se cierra o igual o uno menos y el Universo se expande para siempre, no son varias
toneladas sobre metro cúbico, ni la del agua, ni la de una nubecilla, sino es (1parsec = 3.08 × 1018 cms)
MSol grs
µcritica = 1.26 × 1011 = 8.54 × 10−30 , (9.24)
Mpc3 cm3
un valor muy pequeño, dicha densidad se está logrado alcanzar en los laboratorios que trabajan en vacı́os.
El mejor vaciı́o se ha logrado en el CERN y es cerca de 10−13 atm = 10−29 gr/cm3 , ya cerca de la densidad
crı́tica. Es interesante entonces que el Universo con densidades del órden de la crı́tica es un Universo,
prácticamente vaciı́o, sı́ hay galaxias y cúmulos, pero repartidos en un enorme espacio que dejan que a
una densidad promedio cercana a los vacı́os que se están logrando en los laboratorios.
Siguiendo con el estudio de las ecuaciones de campo, definimos entonces la razón de la densidad µ a
la densidad crı́tica, como
µ
Ω= , (9.25)
µcritica
y la ecuación de Einstein, ec. (9.17) la reescribimos como:
k
H 2 = H0 2 Ω − , (9.26)
a2
es decir, q
ȧ = H0 2 Ω a2 − k, (9.27)
esta forma de escribir a la ecuación diferencial es muy útil para poder resolverlas, una vez que conocemos
a la densidad, µ como función del factor de escala, a. Para ello, nuevamente el, la, estudiante atento, se da
cuenta que tenemos dos ecuaciones diferenciales (ya que vimos que las dos de Einstein y la de continuidad
son funcionalmente dependientes) y tres incógnitas, a, µ y p. Para cerrar el sistema necesitamos una
ecuación extra y esta es la que se conoce como ecuación de estado, una relación entre la presión p y la
densidad, µ. Desde el punto de vista fı́sico, necesitamos decir qué tipo de materia es la que tenemos para
poder cerrar el sistema y ası́ determinar cómo se expande el Universo y cómo cambia la materia en él.
Pero, antes de hablar de la ecuación de estado, hay un punto importante que señalar que involucra
a la ecuación de continuidad. En el sistema comóvil la ecuación j µ ; µ = 0 implica ρ0 u0 ; 0 = 0. Para el
elemento de lı́nea de Friedman, ec. (9.12), la normalización de la cuadrivelocidad, uµ uµ = −c2 , implica
que u0 = c, por lo que la ecuación de continuidad queda, usando las propiedades de derivada covariante:
1 √ 
√ −g ρ0 , t = 0. (9.28)
−g

101
4
r
Ahora, dado que el determinante del tensor métrico para el elemento de Friedman es g = −a6 1−k 2
r 2 sen θ,
3
y como las coordenada son independientes, la ecuación de continuidad implica (a ρ0 ), 0 = 0, por lo que
concluimos:
a3 (t) ρ0 = cte, (9.29)
lo cual es una relación interesante y, ya pensándola, muy natural. Nos dice que la densidad de materia
en reposo varı́a como el cubo del factor de escala. Si pensamos que el factor de escala es una medida del
sector espacial inmerso en el cuadriespacio, tenemos que la densidad de materia en reposo varı́a con el
inverso del volumen, lo que, para una situación en la que no se crea ni destruye materia, es natural.
Relacionamos ası́ ρ0 con el factor de escala. Dada la definición de densidad, µ = ρ0 (1 + ǫ), lo que nos
queda entonces es determinar la relación entre la energı́a interna y el factor de escala. Entonces, para
cerrar al sistema necesitamos, como decı́amos, relacionar la densidad, µ, con la presión, p, es decir, dar
una ecuación de estado.
Ahora, ¿de qué estaba formado el Universo en su inicio? Es lo que se llama, la sopa cósmica, ¿cuáles
eran sus ingredientes? Pues se considera que habı́a electrones, protones, fotones, neutrinos, algún campo
escalar. Nosotros consideraremos ahora un modelo en el que sólo haba algún tipo de materia, como la
bariónica, representada digamos por neutrones, que la podemos tratar como un fluido sin presión, es
decir, como polvo, p = 0.
Al tener esta relación para la presión, se cierra el sistema y podemos integrar la ecuación de conser-
vación, ec. (9.18). Reescribiéndola como derivadas respecto al tiempo:
dµ 3 da
c + c µ = 0, (9.30)
dt a dt
que se resuleve diréctamente, obteniendo que la densidad, µ, ası́ como la densidad en reposo,
rho0 , en el caso de polvo va como a−3 :
cte µ0
µ= = 3 , (9.31)
a3 (t) a (t)
donde hemos evaluado la constante, utilizanod la normalización de que el factor de escala, al dı́a de
hoy, vale uno, con lo que µ0 denota la densidad de dicho polvo al dı́a de hoy. Utilizando la definición
de µ = ρ0 (1 + ǫ), con ǫ la energı́a interna del polvo, vemos que en este caso, dicha energı́a interna es
una constante: ǫ = ρµ000 − 1, con ρ00 la densidad de materia en reposo al dı́a de hoy. De hecho, dicha
constante es cero, pues para el polvo, como no hay interacción entre las partı́culas, la energı́a interna
es cero. Todo es consistente y coincide la densidad µ con la densidad en reposo, ρ0 . De este modo,
µ µ0 Ω0 polvo
Ω = µcritica = µcritica a3 = a3 .
Ya con la densidad determinada en términos del factor de encajamiento, resta resolver la ecuación de
Friedman, ec. (9.27), que reescribimos para dejarla en forma integral, integrando de 0 a a/a0 el factor de
escala y de 0 a t el tiempo
a
Za0 Zt
da
q = c H0 d t, (9.32)
Ω0 polvo
0 a + 1 − Ω 0polvo 0

donde hemos usado la ecuación (9.20) para la constante de las secciones espaciales, y la hemos escrito en
términos de la razón de densidades: k = H0 2 Ω0polvo − 1 .


Haremos el estudio para cada curvatura, es decir, para cada valor de k. El caso k = 0 es inmediato,
Ω0polvo = 1, ya que la densidad es igual a la crı́tica en este caso y tenemos que nuestra ecuación se reduce
a a
Za0

a d a = c H0 t, (9.33)
0

102
con lo que obtenemos la siguiente expresión para el factor de escala:
2
a(t) = a0 (c H0 t) 3 . (9.34)

¡Listo! Tenemos nuestro primer modelo del Universo donde han quedado determinadas todas las funciones.
Veámoslo entonces con cierto detalle. Tenemos para el factor de encajamiento, una función que va desde
un tiempo inicial, t = 0, en el que este encajamiento vale cero. Esto es, el modelo tiene un inicio, donde
toda la sección espacial se empieza a meter, a encajar en el cuadriespacio; del elemento de lı́nea, ec. (9.12),
vemos que las distancias espaciales a tiempo constante, t = T = cte son
2
dl2 = a0 (c H0 T ) 3 dr2 + r2 d Ω2 ,

(9.35)

al anularse el factor a, se anulan las distancias, ¡Es un punto en el cuadriespacio! A este punto inicial
se le llamó el átomo cósmico y después se llamó Big Bang que, como vemos, no es un punto del
espacio, es un punto del espaciotiempo y, dado el caso, es un tiempo, en el que toda la sección espacial
se empieza a encajar en el cuadriespacio. Tenemos entonces que, nuevamente, este modelo, como el de
Schwarzschild, presenta una singularidad y ahora, esta singularidad sı́ está en contacto causal con el resto
del cuadriespacio, no está cubierta por ningún horizonte.
Posteriormente, al avanzar el tiempo, avanza el encajamiento de las secciones espaciales. La distancia
espacial entre los puntos, ec. (9.35), aumenta, ¡el Universo se expande! Las cantidades fı́sicas, como la
densidad y la densidad en reposo van como
µ0
µ= , (9.36)
c2 H 0 2 t2
por lo que divergen al tiempo inicial. Se empieza entonces, en este modelo, con un punto del espaciotiempo
donde la densidad era divergente y, conforme le Universo se expande, las secciones espaciales, la densidad
va decreciendo, de hecho, como el tiempo a la menos dos.
Podemos incluisve saber cuánto tiempo ha transcurrido desde la gran explosión. Diréctamente de la
ecuación (9.34), a t = hoy, donde a(t = hoy) = a0 = 1, tenemos que ha transcurrido un tiempo dado por

1
thoy = , (9.37)
c H0

nuevamente, utilizando el valor de H0 obtenido en la misión Planck (consideran un modelo de Universo


diferente, más completo, pero, nos da idea, de hecho, bastante buena), se tiene que c H0 = 2.18 ×
10−18 Hertz, con lo que obtenemos que la edad del Universo, el tiempo transcurrido desde el Big Bang es

Edad del Universo = 14.51 Giga − años. (9.38)

Por último, mencionamos que, esta distancia a tiempo constante, ec. (9.35), nos permite definir en
general a la distancia propia, (por simplicidad, tomamos a ángulos constante también)

lpropia = a(t) r, (9.39)

que nos permite definir una velocidad de recesión:

vrec = ȧ(t) r, (9.40)

que, evaluada al dı́a de hoy, nos permite inferir la velocidad con la que se alejan los puntos, unos de otros,
debido a la expansión cosmológica:
vrec = H0 r, (9.41)

103
es decir, se alejan más rápido conforme se encuentran más lejos.
De este modo, el modelo de Universo de Friedman nos da una descripción de cómo cambia la geometrı́a,
cómo se espanden las secciones espaciales y, como va cambiando la materia presente en él, permitiéndonos
inferir resultados fı́sicos.
El modelo de Friedman, si bien criticado inicialmente por Einstein, fue ampliamente defendido y
profundizado por Georges Lemaı̂tre, que le encantaba la idea de un Universo con un inicio. Por ello, el
modelo se conoce como Universo de Friedman-Lemaı̂tre.

Figura 9.10: Georges Henri Joseph Édouard Lemaı̂tre, 1894 - 1966.

Para terminar la descripción del modelo, veamos los otros dos casos, cuando la densidad de materia
es mayor a la crı́tica, donde tendermos a un Universo cerrado, con k = 1 y cuando la densidad de materia
es menor a la crı́tica, donde tendremos un Universo, como el del caso plano, abierto.
Entonces, para el caso con k = 1, tenemos que la ecuación de Einstein, ec. (9.32), tiene Ω0polvo − 1
positivo, pues en este caso tenemos una densidad del Universo, mayor a la crı́tica. Al hacer la integral,
a
Za0 ! !
da Ω0polvo p −1 2y − 1 3π
q = 3 −2 y (1 − y) + tan p − ,
Ω0 polvo
2 Ω0polvo − 1 2 2 y (1 − y) 2
0 a + 1 − Ω0polvo
(9.42)
donde hemos definido y = a Ω0polvo − 1 / a0 Ω0polvo y recuerda lector@ que tan−1 (−∞) = 3 π/2.
 

Por lo que en este caso, la ecaución de Einstein nos da una ecuación trascendente para el factor de
encajamiento en términos del tiempo.
Las ecuaciones trascendentes, lo son tanto para los humanos, como para las máquinas, es decir, en
este caso, lector@, no se tiene una ecuación trascendente y se espera que las computadoras la resuelvan.
Hay que pensarle un poco.
La manera más directa de lidiar con una ecuación trascendente, es parametrizándola, es decir, expresar
tanto a la variable, como a la función, en términos de un parámetro que nos permita trabajar con la
variable y con la función.
De la ecuación (9.42), se ve que ese término con arco tangente, es latoso, por lo que definimos al
argumento como el inverso de la función: √2 y−1 = tan (θ + α), donde θ es él parámetro que estamos
2 y (1−y)
buscando y α es una fase para fijar el origen, como veremos. Resolvemos ésta relación para la función

104
y, obteniendo y = (1 + sen (θ + α))/2. Como queremos que el factor de escala esté parametrizado siendo
igual a cero en cero, escojemos a la fase tal que cumpla esto: α = 3 π/2. Las propiedades trigonométricas
y las integrales se pueden buscar en lı́nea o, con cierta añoranza, en [?].
De este modo, tenemos que el factor de encajamiento queda parametrizado como

Ω0polvo − 1 1 − cos θ
 
a = a0 , (9.43)
Ω0polvo 2

y, al substituir en la ecuación de Einstein integrada, ec. (9.42), tenemos, simplificando

Ω0polvo
 3 (−sen θ + θ) − = c H0 t, (9.44)
2 Ω0polvo − 1 2

con lo que queda también parametrizado el tiempo, la variable. Vemos que θ = 0 implica t = 0. Tenemos
entonces que ya podemos graficar a la función a(t), el factor de escala para el caso en el que la densidad es
mayor a la densidad crı́tica y las secciones espaciales son 3-esferas. Damos un valor de θ y obtenemos la
3
correspondiente pareja [c H0 p t(θ), a(θ)/a0 ] = [θ − senθ, (1 − cos θ)/2], con p = 2 Ω0polvo − 1 2 /Ω0polvo .
La gráfica de este comportamiento la mostramos en la figura (9.11).

Figura 9.11: Comportamiento del factor de escala en el modelo de Friedman-Lemaı̂tre para cuando el
Universo tiene las secciones espaciales planas, k = 0, hiperbólicas, k = −1, o de 3-esferas, k = 1 Los dos
primeros casos muestran que el factor de encajamiento crece sin lı́mite, mientras que el caso k = 1 de
este modelo, cuando la densidad de materia es mayor a la crı́tica, el factor de encajamiento crece, pero
posteriormente decrece y se recolapsa. Por simplicidad, estamos tomando los coeficientes en t y en el
factor de escala igual a uno en los tres casos.

Muy interesante. Es la gráfica de una cicloide. Entonces, en el modelo de Friedmann-Lemaı̂tre,


cuando las secciones espaciales son 3-esferas, la densidad de materia es mayor a la densidad crı́tica y el
Universo se expande, alcanza un radio máximo y se recolapsa.
Finalmente, el caso con densidad menor a la crı́tica, donde k = −1. En este caso, la integral de la
ecuación (9.42) sigue siendo válida, pero ahora Ω0polvo < 1, por lo que y < y nos conviene cambiar a la
variable y → −ȳ, por lo que el coeficiente en dicha ecuación toma la forma
a
Za0 ! !
da Ω0polvo p 2 ȳ + 1 3π
q =  23 2 ȳ (1 + ȳ) − tanh−1 p − ,
Ω0 polvo
2 1 − Ω0polvo 2 ȳ (1 + ȳ) 2
0 a + 1 − Ω0polvo
(9.45)

105
donde usamos que tan−1 (i x) = i tanh−1 (x) y que tanh
p
−1
(∞) = i 3 π/2. Con un procedimiento análogo
al caso con k = 1, pidiendo ahora que (2 ȳ + 1)/(2 ȳ (1 + ȳ) = tanh(θ + α), (conviene definir θ = i Ψ,
α = i beta, desarrollar y luego regresar). Se obtiene en este caso:

Ω0polvo − 1 cosh θ − 1
a = a0 , (9.46)
Ω0polvo 2

un factor de encajamiento que, como el caso plano, crece sin lı́mite. Para el tiempo, obtenemos en este
caso
Ω0polvo
¸H0 t =  3 (senh θ − θ) . (9.47)
2 1 − Ω0polvo 2

De este modo, queda también parametrizada la soulción en este caso y la hemos graficado en la figura
(9.11), donde se ve claramente cómo crece el factor de escala ilimitadamente en este caso. También hemos
2
graficado el caso plano parametrizado en este caso, de un modo trivial, c H0 t = θ, por lo que a = a0 θ 3 .
De este modo, presentamos al modelo de Friedman - Lemaı̂tre. Hay quien le llama también incluyendo
los nombres de Robertson y de Walker, pero los autores no hemos podido determinar cuál fue su con-
tribución al modelo. Ya hablando de nombres, el caso en el que el factor de escala va como el tiempo a la
dos tercios, que es el caso de Friedman-Lemaı̂tre para secciones espaciales planas, se le llama Universo de
Einstein-de Sitter, pero, nuevamente, no vemos justificado el llamar ası́ a este caso particular del modelo.
Muy bien, tenemos una solución a las ecuaciones de Einstein con fluido perfecto polvo, que es ho-
mogénea e isotrópica. Pero ... ¿Tiene algo que ver con nuestro Universo?
El tema es ... apasionante y da lugar a cursos posteriores y trabajos de investigación. Por ahora
presentaremos sólo un breve resumen de la extensión del modelo de Friedman - Lemaı̂tre a lo que se
le llama el modelo cosmológico estándard y su comparación con las observaciones cosmológicas de
primer orden.
Como vemos, una de las predicciones del modelo es la expansión de las secciones espaciales, este
encajamiento que vemos determinado por el factor de escala, a(t), produce que la distancia entre los
cuerpos se modifique, aumente si el factor crece. Lemaı̂tre, como mencionamos, era un gran defensor del
modelo y abogó mucho por él, argumentando que el corrimiento al rojo que se veı́a en las galaxias, no era
por un movimiento propio de cada galaxia, sino que era el movimiento general debido a la expansión. De

Figura 9.12: Observaciones sobre el corrimiento al rojo de las galaxias y su interpretación cosmoógica. A
la izquierda, la de Lemaı̂tre, 1927, a la derecha, la de Hubble, 1929.

hecho, Lemaı̂tre mostró, en 1927, que la velocidad con la que se alejaban era proporcional a la distancia.
Esta relación fue redescubierta un par de años más tarde por Hubble, aunque él no la interpretaba como
evidencia de la expansión del Universo:

v = H0 d, (9.48)

106
Figura 9.13: Edwin Hubble, 1889 - 1953.

esta relación es muy importante y, como vemos, es la derivada en el modelo Friedman-Lemaı̂tre, ec. (9.41),
lo que evidencı́a la concordancia del modelo con observaciones reales. Este modelo, sı́ estaba describiendo
aspectos cosmológicos de nuestro Universo.
Otro aspecto muy importante es el de la radiación electromagnética en el Universo. En este caso,
se puede incluir en el modelo de Friedman-Lemaı̂tre, a la radiación, aparte del polvo, como parte de la
materia que forma al Universo. Esto fue realizado e impulsado principalmente por Georgi Gámov.

Figura 9.14: Georgi Antónovich Gámov, (George Gamow), 1904 - 1968.

En efecto, al considerar en la sopa cósmica a los fotones, lo cual se puede representar por un fluido
donde la velocidad del sonido coincide con la de la luz, lo que ocurre al considera un fluido con ecuación
de estado prad = ρrad c2 /3. Tomando esto en cuenta, un análisis similar al presentado para el caso de
polvo, nos permite concluir que, en este caso, la relación entre esta densidad de radiación y el factor de
escala es ρrad ∝ a−4 , lo que, considerando a dicha densidad de radiación como la energı́a de un cuerpo

107
negro, al aplicar la ley de Stephan-Boltzmann, ρrad ∝ σ T 4 , Gámov concluye que
1
T ∝ , (9.49)
a(t)

la temperatura del Universo varı́a como el inverso del factor de escala. Entonces, en el inico empieza
siendo divergente y ba bajando la temperatura conforme el Universo se expande. Por ello, predice Gámov,
nuestro Universo, de acuerdo al modelo Friedman-Lemaı̂tre, debe tener acutalmente una temperatura de
fondo, una radiación de fondo homogénea e isótropa. Más aún, dado que ya se tenı́a una manera de
calcular el tiempo pasado desde el inicio, se podı́a tener una idea de la magnitud de ésta temperatura de
fondo, que Gámov calculó, en 1948, era del órden de 50o K.
Dicha radiación fue descubierta, accidentalmente, por A. Penzias y R. Wilson (no ponemos foto por
lo accidental del hecho), en 1964 y les fue otorgado el premio Nobel en 1967, sin ningún reconocimiento
a Gámov, ni a ningún otro teórico.
En fin, esta fue una prueba más de la bondad del modelo Friedman-Lemaı̂tre para describir efectiva-
mente a las caracterı́sticas generales de nuestro Universo. Nuestro Universo, en efecto, sı́ está descrito
por el modelo Friedman-Lemaı̂tre.
La última pruba comológica del modelo la dió la Fı́sica de partı́culas. Al estudiar al Universo,
se descubrió que la materia que vemos en él, está compuesta fundamentalmente por Hidrógeno y, en
segundo lugar, por Helio. Más aún, se puede determinar que están en una proporporción 4 a 1. Esto,
como decimos, es un dato observacional.
Por otro lado, al considerar la sopa cósmica en un ambiente con temperaturas y densidades inicialmente
divergentes y que, debido a la expansión, van disminuyendo, se puede calcular el camino libre medio de
las diferentes partı́culas que forman a la sopa, como función del tiempo. Al estar a altas temperaturas y
denisdades, son muy probables las colisiones y fusiones entre las partı́culas y, al ir bajando la temperatura
y la densidad, por la expansión, baja la probabilidad de dichas fusiones hasta que ya no se dan más. La
proporción de iones de Helio que se alcanzan a formar por fusión de protones, Hidrógeno, se puede calcular
y, ¡maravilla! se obtiene que esta proporción es de 0.24, en excelente acuerdo con el dato observacional
de 1 a 4.
De este modo, el modelo Friedman-Lemaı̂tre, es consistente con las tres observaciones cosmológicas
de nuestro Universo: la radiación cósmica de fondo, la recesión de las galaxias, con todo y ley Lemaı̂tre-
Hubble y con la abundancia relativa entre Hidrógeno y Helio. Por ello, se considera que el modelo describe
adecuadamente al Universo y se le llama, el modelo cosmológico estándard.
Quedan aún muchas sorpresas que ha dado la investigación del Universo, como las misteriosas compo-
nentes obscuras, la materia y la energı́a obscuras, que son, como mencionamos, temas de investigación y
acaloradas polémicas actualmente y forman, por sı́ mismas, temas con suficiente material para discutirse
en cursos completos, por lo que, con cierta tristeza, no profundizamos en explicaciones más detalladas de
las observaciones, ni de las nuevas investigaciones cosmológicas, esperando que el, la lector@ haya disfu-
tado de esta ”probadita” del modelo, una muestra de la gran riqueza y profundidad de las ecuaciones de
Einstein.

108
Figura 9.15: Historia del Universo

109
110
Capı́tulo 10

Movimiento en el espacio tiempo de


Schwarzschild.

Un tema muy interesante y formativo es el del movimiento de partı́culas libres en espacio-tiempos curvos.
No sólo nos muestra una cinemática muy interesante, sino que, además, es muy ilustrativo para lidiar
con ecuaciones diferenciales. En esta sección estudiaremos al movimiento de partı́culas libres, es decir, a
las geodésicas, en el espacio tiempo de Schwarschild.
Es interesante que las simetrı́as de este este espacio, como vimos, esfericidad y estaticidad, nos per-
miten resolver la ecuación de las geodésicas,
d2 xµ µ d xα d x β
+ Γ α β = 0, (10.1)
d λ2 dλ dλ
sin siquiera calcular los sı́mbolos de Christoffel. En la ecuación anterior, λ es un parámetro, se conoce
como parámetro afı́n y, para partı́culas no son tipo tiempo, este parámetro puede ser el tiempo propio.
Usamos a las propiedades de la Lagrangiana. entonces, tomamos a la métrica de Schwarzschild
1
ds2 = −(1 − rs /r)c2 dt2 + dr2 + r2 dΩ2 , (10.2)
1 − rs /r
donde hemos utilizado el radio de Schwarzschild rs := 2M G/c2 .
Como vimos, esta métrica, corresponde a una solución estacionaria, esféricamente simétrica de las
ecuaciones de campo de Einstein en vacı́o.
Las ecuaciones geodésicas están dadas en general por (10.1). Esta representación permite calcu-
lar las ecuaciones construyendo los sı́mbolos de Christoffel a partir de la métrica. Sin embargo, como
mencionamos, es posible obtener las geodésicas directamente de la métrica y luego de éstas, uno puede
simplemente leer los sı́mbolos de Christoffel.
El lagrangiano para una partı́cula en el espacio tiempo de Schwarzschild es (diréctamente el elemento
de lı́nea sobre el tiempo propio (parámetro afı́n) al cuadrado, es decir, la norma de la cuadrivelocidad,
dividimos entre dos para quitarnos doces que bajan al derivar)
ṙ2
 
1 rs
L = gµν ẋµ ẋν = −(1 − )c2 ṫ2 + + r 2 2
θ̇ + r 2
sin θ ϕ̇ 2
/2. (10.3)
2 r 1 − rrs
Punto denota derivadas con respecto al parámetro afı́n λ. En el caso de partı́culas con masa tomaremos
este parámetro como el tiempo propio de la partı́cula. Para obtener las ecuaciones de movimiento
escribimos las ecuaciones de Euler  
d ∂L ∂L
µ
− = 0. (10.4)
dλ ∂ ẋ ∂xµ

111
Primero, hay que resaltar que la métrica no depende de ϕ y como consecuencia el lagrangiano tampoco,
es lo que se conoce como una variable cı́clica, ası́ que de la ecuación para ϕ se tiene que d(r2 sin θϕ̇)/dλ = 0.
La cantidad conservada asociada a ϕ queda como

r2 ϕ̇ = cte = Lϕ . (10.5)

Además, debido a la simetrı́a esférica del espacio tiempo la geodésica debe permanecer en un plano.
Podemos restringir entonces el estudio al plano θ = π/2 y como consecuencia las ecuaciones relativas a θ
se satisfacen trivialmente. Notamos, sin embargo, que no es necesario el fijar al ángulo θ. En efecto, se
puede mostrar que el momento angular total,

L2 ϕ
L2 = L2 θ + , (10.6)
sen2 θ
con Lθ el momento conjugado a la variable θ:
∂L
Lθ = = r2 θ̇, (10.7)
∂ θ̇

es una cantidad ˙2
 conservada, es decir, L = 0. Para mostrar esto se utiliza la ecuación de Euler-Lagrange
d ∂L ∂L 2
para θ: dλ ∂ θ̇ − ∂θ = 0, es decir (r θ̇). − r2 senθ cos θ ϕ̇2 = 0.
Por otro lado, podemos ver que la coordenada temporal t, también es cı́clica, por lo que su momento
conjugado, es una cantidad conservada, e:
rs
− (1 − )c ṫ = cte = −e c. (10.8)
r
Claramente, estas cantidades son las equivalentes a la conservación de los momentos generalizados que
se encuentran en la formulación Analı́tica de la Mecánica Clásica.
Ya tenemos tres de las coordenadas integradas. Nos falta ver la coordenada radial, r. Esta, claramente,
no es cı́clica, pero tenemos, una constricción: la norma de la cuadrivelocidad. Es decir, para obtener la
ecuación para r utilizaremos que

rs 2 2 ṙ2 2
  d s2
− (1 − ) c ṫ + rs + r θ̇2 + sen2 θ ϕ̇2 = = −κ, (10.9)
r 1− r d λ2

donde κ = 1 o κ = 0 si se trata de partı́culas masivas o sin masa respectivamente. Al sustituir (10.8) y


(10.6) en (10.9) se encuentra que:

e2 ṙ2 L2
− + + = κ, (10.10)
1 + rrs 1 − rrs r2

la cual podemos escibir como:

L2
 
2 2
 rs 
ṙ = e − V (r), V (r) = 1 − +κ , (10.11)
r r2
Esta ecuación puede interpretarse como la ecuación de una partı́cula que se mueve bajo la influencia de
un potencial efectivo V .
De este modo, como prometimos, vemos que las cuatro coordenadas, como funicón del parámetro afı́n,
han sido integradas una vez. La ecuación de geodésicas nos da a las segundas derivadas de éstas coor-
denadas respecto al parámetro afı́n, en términos de los Christoffel y productos de las primeras derivadas
de las coordenadas. Utilizando la Lagrangina, hemos logrado encontrar expresiones para las primeras
derivadas de las cuatro coordenadas; hemos bajado en un órden el problema y, como decimos, ¡sin haber

112
tenido que escribir las ecuaciones de las geod”esicas! Cuando el problema queda en términos de derivadas
de primer orden, es decir, integrales, se dice que el problema queda resuelto a cuadraturas.
El problema del movimiento geodésico en el espacio-tiempo de Schwarzschild queda, de este modo,
resuelto en cuadraturas.
Veamos más explı́citamente las trayectorias. En el caso de partı́culas masivas, existe una relación muy
importante entre el valor de su momento angular y el potencial. Los extremos del potencial estan dados
por (V ′ = 0):
rs √  rs 2
r± = 1 ± 1 − 6a , a= . (10.12)
2a 2 L2
Que corresponden a un máximo y mı́nimos locales. El comportamiento de las partı́culas es muy diferente
si a < 1/6 o a > 1/6 como veremos a continuación.
Para a < 1/6 caso en el que existen dos raı́ces reales, se puede acotar el valor de las raı́ces por
3
rs ≤ r− ≤ 3rs , y r+ ≥ 3rs . (10.13)
2
Es posible hacer una clasificación de las órbitas mediante un análisis del potencial efectivo, justo como
en el caso de mecánica clásica. Hay que notar que la partı́cula se mueve sobre una lı́nea horizontal con
e2 = cte en una región en donde e3 > V para asegurar que ṙ2 > 0.
El siguiente paso es encontrar a r y ϕ como función del parámetro, sin embargo, para entender el
comportamiento de las órbitas es suficiente encontrar r = r(ϕ). Como sabemos, el movimiento de las
partı́culas se da en un plano, esto es, θ constante. Y podemos orientar nuestros ejes para que este ángulo
sea θ = π/2. De este modo, θ̇ = 0 y L = Lϕ y ϕ̇ = Lϕ /r2 .
Entonces, podemos determinar a r como función del ángulo, lo que nos da la imagen de la trayectoria.
Para hallar la ecuación diferencial en términos del ángulo notemos entonces que ṙ = r,ϕ ϕ̇ = Lϕ r,ϕ /r2 .
Si además definimos una nueva función u = rs /r con derivada u,ϕ = −rs /r2 r,ϕ = −u2 r,ϕ /rs se obtiene
(u,ϕ )2 − 2 a e2 + (1 − u)(u2 + 2aκ).

u,ϕ (2u,ϕϕ + 2u − 2aκ − 3u2 ) = 0 . (10.14)

Sin considerar la solución trivial de u = cte, se obtiene que

u,ϕϕ + u = a κ + 3/2u2 . (10.15)

Las condiciones iniciales para u se obtienen a partir de los valores de Lϕ , e y r0 = r(λ = 0). Notemos
que r,ϕ = ṙ0 /ϕ̇ = ṙ0 r02 /Lϕ y u,ϕ = −rs r,ϕ /r2 = −rs ṙ0 /h y a su vez ṙ0 = [e2 − V (r0 )]1/2 .
A continuación estudiamos el comportamiento de las órbitas a partir del análisis del potencial. Hay
que notar que es diferente del correspondiente potencial central en el caso newtoniano; las soluciones no
son sólamente las cónicas y, en este caso, las partı́culas sı́ pueden caer hasta el centro
En la figura 10.1 se muestra el potencial efectivo para una partı́cula con un momento angular Lϕ = 4.1.
Se tienen 4 diferentes órbitas de acuerdo con el valor de e2 en la ecuación (10.11). En las graficas siguientes
consideramos que la partı́cula esta inicialmente en r = 30.
En la figura hemos caracterizado las órbitas por los valores ei , i = 1...4. El comportamiento de la
partı́cula para e1 a partir de la gráfica del potencial nos dice que la partı́cula estará en una órbita acotada,
entre dos valores de r, es importante señalar que partiendo del análisis del potencial no podemos afirmar
si la órbita es cerrada, justo como en el caso de mecánica clásica para un potencial central. En la figura
10.2 se muestra la trayectoria de la partı́cula para ese valor de e1 . Nótese como la trayectoria va de un
radio mı́nimo a un radio máximo pero no es una trayectoria cerrada. Cuando el valor de la energı́a es
tal que e2 es el mostrado en la figura 10.1 la partı́cula situada del lado derecho del máximo de potencial
tendera a un valor mı́nimo, en el cual e2 = V y despues saldra dispersada hacia infinito. Esta trayectoria

113
Figura 10.1: Potencial efectivo correspondiente a un valor de Lϕ = 4.1. Las órbitas están descritas por
su energı́a que se mantiene constante.

se muestra en la figura 10.2. Cuando la partı́cula tiene una energı́a tal que e sobrepasa el máximo del
potencial efectivo, es decir algo como e4 , la partı́cula alcanzará en centro de atracción en r = 0. La
figura correspondiente a esta trayectoria se muestra en la figura 10.2. Finalmente, cuando la partı́cula
se encuentra del lado izquierdo del máximo del potencial y es lanzada hacia afuera, alcanzá un radio
máximo (en donde e4 = V ) y luego caerá hacia r = 0, como se muestra en la figura 10.2.
Cuando el valor del momento angular de la partı́cula no es muy grande, digamos h = 3.8, la forma
del potencial es la mostrada en la figura 10.3. Ahora el máximo local de potencial es menor que su
valor asintótico (V → 1). Para e1 el valor de la energı́a de la partı́cula está entre el máximo local y el
valor asintótico. Las propiedades de las trayectorias son similares al caso anterior pero difieren de forma
cualitativa. Por ejemplo, en ambos casos las órbitas están acotadas entre los valores de r en los que
e1 = V . Pero en este caso intermedio, las órbitas son cerradas.
Para un valor de e2 como el mostrado en 10.3, la partı́cula alcanzará un radio máximo (en donde
e2 = V ) y luego caerá hacia r = 0. La trayectoria se muestra en la figura 10.4. Para la trayectoria e4
el comportamiento es parecido al caso con momento angular mayor. La partı́cula simplemente alcanzará
r = 0. La trayectoria se muestra en 10.4. Para e4 si la partı́cula se encuentra a la izquierada del máximo
relativo, alcanzara un radio máximo y caerá al centro de atracción. El comportamiento se muestra en la
figura 10.4.
Si el momento angular de la partı́cula es peqeño comparado con los casos anteriores, h = 1 por
ejemplo, se tienen solo dos tipos de órbitas. Su comportamiento depende del valor de e relativo a V . En
la figura 10.5 se muestra el potencial efectivo para este caso. El potencial ya no tiene un máximo ni un
mı́nimo relativos (aunque el valor asintótico sigue siendo 1) por lo que no se tendrán órbitas que vayan
de un r máximo a un r mı́nimo. Se tienen órbitas como e3 en que simplemente caen hacia el centro de
atracción y aquellas como e4 que alcanzan un r máximo cuando e4 = V y luego caen hacia r = 0. Estas
órbitas se muestran en la figura 10.6.
En el caso de partı́culas sin masa κ = 0 el potencial efectivo tiene un máximo en r = 23 rs y su valor
asintótico es cero, su forma se encuentra graficada en la figura 10.7. Para este potencial, tres tipos de
órbitas son posibles: Si la partı́cula tiene una energı́a correspondiente a e2 , la partı́cula que llega desde
infinito, alcanza el potencial en un radio mı́nimo y luego es expulsada de nuevo hacia infinito como lo
muestra la figura 10.8. Si la energı́a de la partı́cula es mayor que el máximo de potencial, esta caerá
hacia el centro de atracción como lo muestra la figura 10.8. Por otro lado, si la partı́cula se encuentra
a la izquierda del máximo de potencial y tiene una velocidad inicial hacia afuera, entonces alcanzará un
radio máximo y luego caerá hacia r = 0 como se puede ver en la figura 10.8.

114
(a) (b)

(c) (d)

Figura 10.2: Diferentes tipos de órbitas. Cuando la partı́cula tiene una energı́a e1 su órbita esta acotada
entre dos valores de r = cte, sin embargo no corresponde a una elipse o circunferencia como el caso
Newtoniano. La curva presenta un movimiento de precesión. Es este el tipo de movimiento que siguen
los planetas de nuestro sistema solar. El efecto de precesión es mas evidente en Mercurio por ser el planeta
mas cercano al sol. Si la partı́cula tiene una energı́a e2 caerá hacia el centro de atracción alcanzando
un radio mı́nimo y luego continuara su movimiento hacia infinito. Si la energı́a es e3 , la particula caerá
hacia el centro de atración. En el caso que la energı́a es e4 la partı́cula no puede sobrepasar la barrera
de potencial, de modo que alcanza un radio máximo y luego cae.

115
Figura 10.3: Potencial efectivo para Lϕ = 3.8.

(a) (b)

(c) (d)

Figura 10.4: Diferentes tipos de órbitas.

116
Figura 10.5: Potencial efectivo.

(a) (b)

Figura 10.6: Diferentes tipos de órbitas.

Figura 10.7: Potencial efectivo.

117
(a) (b)

(c)

Figura 10.8: Diferentes tipos de órbitas.

118

También podría gustarte