0% encontró este documento útil (0 votos)
646 vistas473 páginas

Elipticas Curvas Elipticas

El documento trata sobre curvas elípticas y contiene información sobre su geometría, álgebra y propiedades sobre diferentes cuerpos. Se divide en varios capítulos que explican conceptos como ecuaciones de Weierstrass, estructura de grupo, isogenias, puntos sobre cuerpos finitos y propiedades numéricas.

Cargado por

chicho6404
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
646 vistas473 páginas

Elipticas Curvas Elipticas

El documento trata sobre curvas elípticas y contiene información sobre su geometría, álgebra y propiedades sobre diferentes cuerpos. Se divide en varios capítulos que explican conceptos como ecuaciones de Weierstrass, estructura de grupo, isogenias, puntos sobre cuerpos finitos y propiedades numéricas.

Cargado por

chicho6404
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Carlos Ivorra Castillo

CURVAS ELÍPTICAS
La aritmética es una clase de conocimiento en
el que las mejores naturalezas deben ser entrenadas,
y que no debe ser abandonado.
Platón
Índice General

Introducción ix

Capı́tulo I: Preliminares de geometrı́a algebraica 1


1.1 Variedades afines . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Variedades proyectivas . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Variedades cuasiproyectivas . . . . . . . . . . . . . . . . . . . . . 10
1.4 Variedades complejas . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Curvas proyectivas . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Capı́tulo II: La geometrı́a de las curvas elı́pticas 31


2.1 Ecuaciones de Weierstrass . . . . . . . . . . . . . . . . . . . . . . 31
2.2 La estructura de grupo . . . . . . . . . . . . . . . . . . . . . . . . 47
2.3 Cúbicas singulares . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.4 Isogenias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.5 Curvas conjugadas . . . . . . . . . . . . . . . . . . . . . . . . . . 63

Capı́tulo III: El álgebra de las curvas elı́pticas 75


3.1 Las multiplicaciones enteras . . . . . . . . . . . . . . . . . . . . . 75
3.2 La isogenia dual . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.3 Curvas supersingulares . . . . . . . . . . . . . . . . . . . . . . . . 83
3.4 Los módulos de Tate . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.5 El anillo de endomorfismos . . . . . . . . . . . . . . . . . . . . . 96

Capı́tulo IV: Curvas elı́pticas sobre cuerpos finitos 99


4.1 Puntos racionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2 Curvas supersingulares . . . . . . . . . . . . . . . . . . . . . . . . 102
4.3 El número de curvas sobre un cuerpo . . . . . . . . . . . . . . . . 108

Capı́tulo V: Grupos formales 115


5.1 Desarrollos de Taylor en O . . . . . . . . . . . . . . . . . . . . . 115
5.2 Grupos formales . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.3 Grupos formales sobre cuerpos métricos . . . . . . . . . . . . . . 129
5.4 Grupos formales en caracterı́stica prima . . . . . . . . . . . . . . 133

v
vi ÍNDICE GENERAL

Capı́tulo VI: Curvas elı́pticas sobre cuerpos locales 137


6.1 Ecuaciones minimales . . . . . . . . . . . . . . . . . . . . . . . . 138
6.2 Reducción de curvas elı́pticas . . . . . . . . . . . . . . . . . . . . 144
6.3 Puntos enteros y puntos de torsión . . . . . . . . . . . . . . . . . 156
6.4 La topologı́a métrica . . . . . . . . . . . . . . . . . . . . . . . . . 161

Capı́tulo VII: Curvas elı́pticas sobre cuerpos numéricos 165


7.1 El discriminante mı́nimo . . . . . . . . . . . . . . . . . . . . . . . 165
7.2 El subgrupo de torsión . . . . . . . . . . . . . . . . . . . . . . . . 174
7.3 El teorema débil de Mordell-Weil . . . . . . . . . . . . . . . . . . 180
7.4 Alturas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
7.5 El teorema de Mordell-Weil . . . . . . . . . . . . . . . . . . . . . 193

Capı́tulo VIII: El rango de una curva elı́ptica 203


8.1 Curvas con tres puntos de orden 2 . . . . . . . . . . . . . . . . . 204
8.2 Los grupos de Selmer y Tate-Shafarevich . . . . . . . . . . . . . . 219
8.3 Curvas con un punto de orden 2 . . . . . . . . . . . . . . . . . . 226
8.4 Curvas sin puntos de orden 2 . . . . . . . . . . . . . . . . . . . . 240

Capı́tulo IX: Puntos enteros 251


9.1 Resultados elementales . . . . . . . . . . . . . . . . . . . . . . . . 251
9.2 Aproximación diofántica . . . . . . . . . . . . . . . . . . . . . . . 255
9.3 El teorema de Roth . . . . . . . . . . . . . . . . . . . . . . . . . . 257
9.4 Resultados auxiliares . . . . . . . . . . . . . . . . . . . . . . . . . 263
9.5 El teorema de Siegel . . . . . . . . . . . . . . . . . . . . . . . . . 274

Capı́tulo X: Curvas elı́pticas complejas 283


10.1 Retı́culos y toros complejos . . . . . . . . . . . . . . . . . . . . . 283
10.2 Las funciones de Weierstrass . . . . . . . . . . . . . . . . . . . . . 286
10.3 Isogenias complejas . . . . . . . . . . . . . . . . . . . . . . . . . . 296
10.4 Funciones modulares asociadas . . . . . . . . . . . . . . . . . . . 303
10.5 El grupo modular . . . . . . . . . . . . . . . . . . . . . . . . . . . 312

Capı́tulo XI: Superficies modulares 317


11.1 Transformaciones de Möbius . . . . . . . . . . . . . . . . . . . . . 317
11.2 Grupos topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . 320
11.3 Puntos elı́pticos y parabólicos . . . . . . . . . . . . . . . . . . . . 327
11.4 La estructura analı́tica . . . . . . . . . . . . . . . . . . . . . . . . 334
11.5 Ejemplos de superficies modulares . . . . . . . . . . . . . . . . . 343
11.6 La medida de una superficie modular . . . . . . . . . . . . . . . . 352

Capı́tulo XII: Funciones modulares 357


12.1 Funciones modulares de grado cero . . . . . . . . . . . . . . . . . 357
12.2 La ecuación modular . . . . . . . . . . . . . . . . . . . . . . . . . 362
12.3 Funciones modulares de grados superiores . . . . . . . . . . . . . 370
12.4 Funciones modulares de LE(2, Z) . . . . . . . . . . . . . . . . . . 376
12.5 La función eta de Dedekind . . . . . . . . . . . . . . . . . . . . . 383
ÍNDICE GENERAL vii

12.6 Funciones modulares respecto a Γ0 (N ) . . . . . . . . . . . . . . . 386


12.7 Funciones modulares respecto a Γ(2) . . . . . . . . . . . . . . . . 392

Capı́tulo XIII: Multiplicación compleja 399


13.1 Multiplicaciones ideales . . . . . . . . . . . . . . . . . . . . . . . 399
13.2 El cuerpo de clases de Hilbert . . . . . . . . . . . . . . . . . . . . 406
13.3 La máxima extensión abeliana . . . . . . . . . . . . . . . . . . . 411
13.4 El teorema fundamental . . . . . . . . . . . . . . . . . . . . . . . 418
13.5 Módulos completos . . . . . . . . . . . . . . . . . . . . . . . . . . 424
13.6 Órdenes arbitrarios . . . . . . . . . . . . . . . . . . . . . . . . . . 431

Apéndice A: La hipótesis de Riemann 437

Apéndice B: Operadores de Hecke 447

Bibliografı́a 455

Índice de Materias 456


Introducción

La teorı́a de las curvas elı́pticas es una de las creaciones más interesantes


de la matemática del siglo XX, si bien sus antecedentes se remontan hasta la
matemática griega. Con la teorı́a que vamos a desarrollar en este libro podremos
tratar problemas como éste (resuelto por Mordell en 1962):

Problema 1 Demostrar que los únicos números naturales no nulos que pueden
expresarse simultáneamente como producto de dos y tres números consecutivos
son
6=2·3=1·2·3 y 210 = 14 · 15 = 5 · 6 · 7.

Esto equivale a encontrar las soluciones enteras de la ecuación


Y (Y + 1) = (X − 1)X(X + 1).
El problema puede ser abordado mediante técnicas de la teorı́a algebraica de
números, es decir, utilizando la factorización real o ideal de los anillos de enteros
algebraicos de los cuerpos numéricos. Sin embargo, nosotros lo trataremos desde
el punto de vista de la geometrı́a algebraica. La ecuación anterior determina
una curva proyectiva regular de género 1, y la cuestión es, pues, encontrar los
puntos con coordenadas enteras de una curva algebraica dada.

Puntos racionales y enteros En realidad la teorı́a que vamos a desarrollar se


centra principalmente en la búsqueda de puntos con coordenadas racionales,1 si
bien en muchos casos y de forma más o menos indirecta nos permitirá ocuparnos
de las soluciones enteras. Sucede que la existencia de puntos enteros o racionales
en una curva depende crucialmente de su género. Podemos distinguir tres casos:
• Una curva de género g = 0 no tiene puntos racionales o bien tiene infinitos.
Sin embargo, puede no tener puntos enteros, tener una cantidad finita de
ellos o tener infinitos.
• Una curva de género g = 1 no tiene puntos racionales, tiene un número
finito de ellos o bien tiene infinitos, pero sólo puede tener una cantidad
finita de puntos enteros.
1 Por soluciones racionales entenderemos soluciones en un cuerpo arbitrario k prefijado, no

necesariamente Q.

ix
x Introducción

• Una curva de género g ≥ 2 sólo puede tener una cantidad finita de puntos
racionales.

Veamos un ejemplo que ilustra la situación en género 0:

Problema 2 Encontrar todas las ternas pitagóricas, es decir, las ternas (a, b, c)
de números naturales tales que a2 + b2 = c2 .
Solución: Ante todo es fácil ver que si dos componentes de una terna
pitagórica tienen un divisor primo común p, lo mismo le sucede al tercero, y al
eliminarlo de los tres obtenemos otra terna pitagórica. Diremos que una terna
es primitiva si sus componentes son primas entre sı́ (en cuyo caso lo son dos
a dos). Toda terna pitagórica es múltiplo de una única terna primitiva, luego
basta determinar las ternas primitivas.
Más aún, si a y b fueran impares, entonces c2 ≡ 2 (mód 4), lo cual es impo-
sible, luego una de las dos primeras componentes ha de ser par, y no perdemos
generalidad si suponemos que lo es la primera.
Si (a, b, c) es una terna pitagórica, entonces (a/c, b/c) es un punto racio-
nal de la cónica X 2 + Y 2 = 1. Recı́procamente, todo punto racional de esta
cónica determina una terna pitagórica (admitiendo temporalmente ternas con
componentes negativas).
Tomamos uno de estos puntos, por ejemplo (0, 1), y consideramos la pro-
yección estereográfica que a cada punto (t, 0) del eje X le asigna el segundo
punto donde la recta que pasa por (0, 1) y (t, 0) corta a la cónica. La recta es
X = (1−Y )t, y el punto de corte con la cónica ha de cumplir (1−Y )2 t2 +Y 2 = 1
o, equivalentemente,

(1 + t2 )Y 2 − 2t2 Y + t2 − 1 = 0

Una raı́z es Y = 1, pero buscamos la otra. Si dividimos entre el coeficiente


director, el término independiente será el producto de las dos raı́ces, luego la
otra es (t2 − 1)/(t2 + 1). De la ecuación de la recta obtenemos el valor de X,
con lo que el punto t de la recta se corresponde con el punto
 
2t t2 − 1
φ(t) = 2 , 2 .
t +1 t +1
Es fácil calcular la correspondencia inversa y comprobar que también está
definida por funciones racionales en X, Y , de modo que φ biyecta los números
racionales t con los puntos racionales de la cónica. (El punto (0, 1) se corres-
ponde con el punto infinito de la recta proyectiva.) Si t = u/v, con u, v ∈ Z,
primos entre sı́, v = 0, entonces
 
2uv u2 − v 2
φ(t) = , ,
u2 + v 2 u2 + v 2

que se corresponde con la terna pitagórica (2uv, u2 − v 2 , u2 + v 2 ). Notemos


que si eliminamos la restricción v = 0 (con lo que estamos admitiendo t = ∞)
xi

recuperamos el punto (0, 1) que habı́amos perdido (o, más exactamente, las
ternas triviales asociadas a él).
Vamos a probar que las ternas pitagóricas primitivas (con primera compo-
nente par) son exactamente las de la forma

(2uv, u2 − v 2 , u2 + v 2 ),

donde 0 < v < u son números naturales primos entre sı́ de paridades opuestas.
Es inmediato comprobar que estas condiciones hacen que la terna sea primi-
tiva. Recı́procamente, si (a, b, c) es una terna primitiva, hemos demostrado que
existen enteros (u, v) primos entre sı́ tales que

a 2uv b u2 − v 2
= 2 , = 2 .
c u + v2 c u + v2
Obviamente ha de ser 0 < v < u (si partimos de una terna de números
naturales no nulos). Si u y v fueran ambos impares podrı́amos simplificar el 2
de la primera fracción y concluirı́amos que a es impar, en contra de lo supuesto.

El procedimiento empleado es general: Si una cónica dada por una ecuación


con coeficientes en un cuerpo k tiene un punto racional (o sea, con coordena-
das en k), entonces tiene infinitos puntos racionales, parametrizables en P1 (k)
mediante la proyección estereográfica.
Más en general aún, veremos que toda curva proyectiva de género 0 definida
mediante ecuaciones con coeficientes en k es birracionalmente equivalente a una
cónica con coeficientes en k a través de una aplicación birracional definida me-
diante polinomios con coeficientes en k, de modo que los puntos racionales de
la curva dada se corresponden biunı́vocamente (salvo quizá un número finito de
excepciones) con los de la cónica. Si la curva es regular no hay excepciones.
Además, toda cónica admite una ecuación homogénea de la forma

aX 2 + bY 2 + cZ 2 = 0, a, b, c ∈ k.

(La ecuación de una cónica en coordenadas homogéneas es una forma cuadrática,


y toda forma cuadrática es diagonalizable.)
Dicho esto, no volveremos a ocuparnos de las curvas de género 0. En general,
los problemas concernientes a estas curvas se tratan más convenientemente con
técnicas de la teorı́a algebraica de números. El objeto de este libro serán las
curvas de género g = 1. Una curva elı́ptica sobre un cuerpo k es una curva
proyectiva regular de género 1 definida por ecuaciones con coeficientes en k y que
tiene al menos un punto racional. En el problema 1 hemos visto un ejemplo de
curva elı́ptica. No es casual que venga dada por una ecuación cúbica. Veremos
que toda curva elı́ptica es isomorfa a una cúbica (plana) regular.

El ejemplo de Selmer Toda cúbica proyectiva regular tiene género g = 1.


Supuesto que esté definida mediante una ecuación con coeficientes en Q, para
xii Introducción

que sea una curva elı́ptica sobre Q todavı́a falta que cumpla una condición
adicional, a saber, que tenga un punto racional, y esto dista mucho de ser
trivial.
Para curvas de género g = 0, el problema puede reducirse a determinar si
una forma cuadrática de tipo

aX 2 + bY 2 + cZ 2 = 0, a, b, c ∈ Q.

tiene una solución no trivial en Q. El teorema de Hasse-Minkowski afirma que


esto es equivalente a que tenga solución en R y en todos los cuerpos p-ádicos
Qp , y a su vez esto puede reducirse a un número finito de comprobaciones en
términos de congruencias.
Sin embargo, el teorema de Hasse-Minkowski no es válido para curvas de
género 1. Un ejemplo clásico se debe a Selmer, quien demostró que la ecuación

3U 3 + 4V 3 + 5W 3 = 0

tiene soluciones no triviales en R y en todos los cuerpos Qp , pero no tiene


soluciones en Q. El estudio local de las curvas elı́pticas no deja por ello de
ser una herramienta valiosa, pero ya no es definitiva, lo cual hace que algunos
aspectos de la teorı́a sean mucho más complejos que los equivalentes en el caso
de curvas de género 0.
Veamos otro problema que nos lleva a una familia de curvas elı́pticas:

Problema 3 Un número natural es congruente si es el área de un triángulo


rectángulo de lados racionales. Encontrar un método para decidir si un número
dado es o no congruente.
Observemos en primer lugar que es muy fácil determinar si un número na-
tural n es o no el área de un triángulo rectángulo de lados enteros. Dichos lados
formarán una terna pitagórica d(2uv, u2 − v 2 , u2 + v 2 ), luego

n = d2 uv(u2 − v 2 ).

Teniendo en cuenta que u, v y d han de ser divisores de n, siempre es posible


decidir si existen en un número finito de casos. Por ejemplo, es fácil ver que el
menor natural que cumple esto es 6, el área del triángulo de lados (3, 4, 5).
El problema ya no es trivial cuando admitimos lados racionales. Observemos
que un número es congruente si y sólo si lo es su parte libre de cuadrados,
luego basta ocuparse de números libres de cuadrados. Notemos también que no
ganarı́amos en generalidad si buscáramos números racionales congruentes, pues
u/v es el área de un triángulo rectángulo racional si y sólo si lo es uv.
No es cierto que 6 sea el menor número congruente, pues en 1225 Fibonacci
descubrió que 5 también lo es. El triángulo correspondiente tiene lados
 
3 20 41
, , .
2 3 6
xiii

Se trata del menor posible, pero esto no es trivial. Tuvieron que pasar cuatro
siglos hasta que Fermat demostrara que los números 1, 2 y 3 no son congruentes
(luego 4 tampoco). La relación con las curvas elı́pticas viene dada por el teorema
siguiente, que todavı́a no estamos en condiciones de probar completamente:

Teorema 1 Si n es un número natural libre de cuadrados, las condiciones


siguientes son equivalentes:

a) n es congruente.

b) Existen tres cuadrados racionales en progresión aritmética de razón n.

c) La curva Y 2 = X 3 − n2 X tiene un punto racional (finito) (x, y) distinto


de (−n, 0), (0, 0) y (n, 0).

Demostración: De momento probaremos que a) ⇔ b) ⇒ c). La impli-


cación que falta está en la página 51.
a) ⇒ b) Si n = ab/2, para cierta terna pitagórica (a, b, c), entonces tomemos
x = c2 /4, de modo que (a−b)2 /4 = x−n y (a+b)2 /4 = x+n, luego los números
x − n, x, x + n forman una progresión aritmética de cuadrados racionales.
b) ⇒ a) Si la progresión es x − n, x, x + n, definimos
√ √ √ √ √
a = x + n + x − n, b = x + n − x − n, c = 2 x,

de modo que a, b, c ∈ Q, a2 + b2 = c2 y n = ab/2.


b) ⇒ c) Si la progresión es x − n, x, x + n, entonces su producto es de la
forma y 2 , para un cierto y ∈ Q. Ası́ pues, y 2 = x3 − n2 x2 . No puede ser x = 0
o x = ±n porque n es libre de cuadrados.
Aún no estamos en condiciones de aprovechar este teorema para obtener
resultados concretos, pero veamos un ejemplo relacionado.

Ejemplo La ecuación U 4 + V 4 = W 2 .
Fermat demostró que esta ecuación no tiene soluciones enteras no triviales
(trivial quiere decir con una componente nula). Su argumento es elemental y se
basa en aplicar varias veces la fórmula para las ternas pitagóricas. No vamos a
verlo aquı́. En cambio veremos que el problema se puede reformular en términos
de curvas elı́pticas.
En primer lugar, una solución no trivial cumple (U/V )4 + 1 = (W/V 2 )2 .
Es inmediato comprobar que la ecuación dada no tiene soluciones enteras no
triviales si y sólo si la ecuación Y 4 + 1 = Z 2 no tiene soluciones racionales
distintas de (0, ±1).
Para convertir esta ecuación en una cúbica basta hacer el cambio de variable
Z = Z  + Y 2 , con lo que obtenemos Z 2 + 2ZY 2 = 1. También es inmediato que
las soluciones racionales de la ecuación anterior se corresponden biunı́vocamente
con las de ésta, y las soluciones triviales siguen siendo (Y, Z) = (0, ±1).
xiv Introducción

Ya tenemos una curva elı́ptica,2 pero veremos que toda curva elı́ptica admite
un tipo de ecuación canónica llamada forma de Weierstrass, que no es sino una
ecuación de la forma

Y 2 + a1 XY + a3 Y = X 3 + a2 X 2 + a4 X + a6 ,

y la ecuación que hemos obtenido no es de esa forma, aunque estamos muy cerca.
Para obtener una ecuación de Weierstrass consideramos la clausura proyectiva,
cuya ecuación homogénea es

XZ 2 + 2ZY 2 = X 3 .

Los puntos triviales son ahora (X, Y, Z) = (1, 0, ±1), a los que hemos de
añadir los dos puntos infinitos (0, 1, 0) y (0, 0, 1), pues éstos tampoco proporcio-
nan soluciones a la ecuación de Fermat.
Ahora consideramos la curva afı́n que resulta de tomar como recta del infinito
a Z = 0. Es la curva
2Y 2 = X 3 − X.
Los puntos triviales son ahora (X, Y ) = (±1, 0) y (0, 0) (el cuarto ha quedado
en el infinito). Para tener una ecuación de Weierstrass basta cambiar el 2 de
sitio. Multiplicando por 8 tenemos

(4Y )2 = (2X)3 − 4(2X),

y un cambio de variables obvio transforma la ecuación en:

Y 2 = X 3 − 4X.

Los puntos triviales son ahora (±2, 0) y (0, 0). Hemos probado que la
ecuación U 4 + V 4 = W 2 no tiene soluciones enteras no triviales si y sólo si
la curva Y 2 = X 3 − 4X no tiene puntos racionales no triviales (donde el sentido
de “no trivial” es distinto en cada caso).
Si aceptamos que esto es ası́ —ya hemos dicho que el argumento para la
ecuación de Fermat es elemental— tenemos probado que 2 no es un número
congruente.
Consideremos ahora la curva elı́ptica Y 2 = X 3 −25X, relacionada con la con-
gruencia del número 5. Si particularizamos la prueba del teorema 1 al triángulo
de Fibonacci obtenemos el punto racional
 
20.172 62.279
, .
1.728 1.728

Hay soluciones no triviales más simples, como (−4, ±6). Fermat descubrió
una forma sencilla de obtener nuevos puntos racionales de una cúbica a partir
de otros dados. Es fácil ver que si trazamos la secante a la curva por dos puntos
2 Habrı́a que comprobar que ciertamente lo es, pero esto será evidente en cuanto disponga-

mos de la teorı́a elemental.


xv

racionales, la recta cortará a la curva en un tercer punto racional. Aquı́ hay


que considerar que una recta pasa dos veces por cada punto de la curva donde
es tangente (o a veces incluso tres veces, según el sentido usual de orden de
intersección definido en geometrı́a algebraica).
Por ejemplo, si unimos el punto (−4, 6) con el punto trivial (−5, 0) obtenemos
un nuevo punto con coordenadas enteras, a saber, el punto (45, 300). Si trazamos
la tangente por (−4, 6), obtenemos el punto P correspondiente al triángulo de
Fibonacci:
(45, 300)

P
(−4, 6)

Este procedimiento geométrico se reduce en la práctica a unas sencillas


fórmulas algebraicas explı́citas que veremos en su momento. En realidad Dio-
fanto ya lo habı́a utilizado algebraicamente sin darse cuenta de su interpretación
geométrica, y a su vez Fermat no podı́a advertir el profundo significado del pro-
ceso. En efecto, veremos que mediante el trazado de secantes y tangentes se
puede definir una operación de grupo abeliano sobre toda curva elı́ptica, de
modo que éstas resultan ser los ejemplos más simples de variedades abelianas
(variedades proyectivas con una estructura de grupo definida por aplicaciones
regulares).
Por ejemplo, uno de los resultados fundamentales de la teorı́a de curvas
elı́pticas (generalizable a variedades abelianas) es el teorema de Mordell-Weil,
según el cual, los puntos racionales de una curva elı́ptica definida sobre un cuerpo
numérico forman un grupo abeliano finitamente generado. Esto se traduce en
que todos los puntos racionales de la curva pueden obtenerse a partir de un
número finito de ellos mediante la construcción sucesiva de secantes y tangen-
tes. Desde un punto de vista algebraico, el teorema de Mordell-Weil implica
que el conjunto de puntos racionales de una curva elı́ptica definida sobre un
cuerpo numérico se descompone en suma directa del subgrupo formado por los
elementos de torsión (los elementos de orden finito) y un grupo abeliano libre.
La solución de los problemas que hemos comentado depende en gran medida
de la determinación de esta descomposición. Veremos que es fácil determinar el
subgrupo de torsión de una curva elı́ptica, mientras que el problema de calcular,
no ya unos generadores concretos, sino simplemente el rango de la parte libre,
es complicado, hasta el punto de que no se conoce ningún método general para
resolverlo. La solución de los problemas que hemos comentado depende en gran
medida de la posibilidad de calcular este rango en algunos casos concretos.
xvi Introducción

Supondremos al lector familiarizado con la geometrı́a algebraica y la teorı́a


algebraica de números. No obstante, en el primer capı́tulo revisaremos los con-
ceptos y los resultados más importantes que vamos a necesitar de geometrı́a
algebraica, poniendo especial énfasis (con demostraciones completas) en las con-
secuencias que podemos extraer del hecho de que una variedad algebraica pueda
ser definida mediante ecuaciones en un cuerpo especı́fico (no necesariamente al-
gebraicamente cerrado). Algunos de estos resultados requerirán algunos conoci-
mientos de cohomologı́a de grupos. Estos hechos son esenciales en la prueba de
la hipótesis de Riemann para curvas algebraicas, que incluimos en un apéndice
porque, siendo un resultado de gran interés en sı́ mismo, no nos va a ser necesa-
rio en todo el libro (el caso particular correspondiente a curvas elı́pticas admite
una demostración mucho más simple que veremos en el capı́tulo IV).
Los dos capı́tulos siguientes desarrollan la teorı́a básica sobre curvas elı́pticas,
y a continuación estudiamos las curvas elı́pticas definidas sobre cuerpos finitos
y cuerpos locales, como requisitos necesarios para abordar las curvas defini-
das sobre cuerpos numéricos, y en particular el teorema de Mordell-Weil. En
el capı́tulo X nos centramos en las curvas elı́pticas definidas sobre C, lo que
nos conduce de forma natural al estudio de las llamadas funciones modulares,
que son unas familias de funciones holomorfas que podrı́an ser estudiadas de
forma independiente, pero que están ı́ntimamente relacionadas con las curvas
elı́pticas. De hecho, los resultados más profundos de la teorı́a que vamos a
exponer (resultados que quedan completamente fuera del alcance de este libro
y que conducen, entre otras cosas, a la demostración del Último Teorema de
Fermat) consisten en mostrar profundas relaciones entre las curvas elı́pticas y
las funciones modulares.
Finalmente, el último capı́tulo está dedicado a mostrar una conexión clásica
entre las curvas elı́pticas, las funciones modulares y la teorı́a de cuerpos de
clases.
Capı́tulo I

Preliminares de geometrı́a
algebraica

Suponemos que el lector está familiarizado con la geometrı́a algebraica básica.


De todos modos, en este primer capı́tulo recordaremos los conceptos y resulta-
dos más importantes que vamos a necesitar. Al mismo tiempo aprovecharemos
para observar que, si bien la geometrı́a algebraica requiere trabajar con cuerpos
de constantes algebraicamente cerrados, lo cierto es que si consideramos varie-
dades y funciones definidas por polinomios con coeficientes en un cuerpo menor,
esta circunstancia se conserva a través de las construcciones usuales.
A lo largo de todo este capı́tulo k será un cuerpo perfecto y k será una
clausura algebraica prefijada. De este modo, la extensión k/k es de Galois, y
los elementos de k son los fijados por el grupo de k-automorfismos G(k/k).

1.1 Variedades afines


El espacio afı́n n-dimensional sobre un cuerpo k es An (k) = k n . Entonces
tenemos que An (k) ⊂ An (k). Escribiremos An en lugar de An (k). A los puntos
de An (k) los llamaremos puntos racionales de An .
Un sistema de referencia afı́n en An (k) es una n + 1-tupla (O, P1 , . . . , Pn )
−−→
tal que los vectores OPi sean linealmente independientes sobre k. Diremos que
está definido sobre k si los puntos O y Pi son racionales. Los puntos racionales
de An se caracterizan como los puntos que tienen coordenadas en k n respecto
a cualquier sistema de referencia prefijado definido sobre k.
Siempre que hablemos de un sistema de referencia en An se entenderá que
está definido sobre k.
Si S ⊂ k[X1 , . . . , Xn ], llamaremos V (S) al conjunto de todos los puntos de
An cuyas coordenadas en un sistema de referencia prefijado anulan a todos los
polinomios de S.

1
2 Capı́tulo 1. Preliminares de geometrı́a algebraica

Se dice que un conjunto C ⊂ An es algebraico si C = V (S), para cierto


conjunto de polinomios S ⊂ k[X1 , . . . , Xn ] (y cierto sistema de referencia). Si
S ⊂ k[X1 , . . . , Xn ] diremos que C está definido sobre k.
El carácter algebraico de un conjunto (y el hecho de que esté o no definido
sobre k) no depende del sistema de referencia considerado, si bien el conjunto
S que lo define variará de un sistema a otro.
Si C es un conjunto algebraico definido sobre k, llamaremos C(k) al conjunto
de todos los puntos racionales de C, es decir, C(k) = C ∩ An (k). Conviene tener
presente que C(k) puede ser vacı́o, por lo que en ningún momento podremos
apoyarnos en C(k) para definir conceptos asociados a C. (Basta pensar en
C = V (X 2 + Y 2 + 1) con k = Q).
El grupo de Galois G(k/k) actúa de forma natural (componente a compo-
nente) sobre An y, como deja invariantes a los puntos de cualquier sistema de
referencia (definido sobre k), es claro que para cada σ ∈ G(k/k) y cada P ∈ An ,
las coordenadas de P σ son las imágenes por σ de las coordenadas de P . En par-
ticular, los puntos racionales de An son los fijados por todos los automorfismos
de G(k/k). De aquı́ obtenemos una caracterización de los conjuntos algebraicos
definidos sobre k:

Teorema 1.1 Un conjunto algebraico C ⊂ An está definido sobre k si y sólo si


σ[C] = C para todo σ ∈ G(k/k).

Demostración: La condición es claramente necesaria: si C = V (S) con


S ⊂ k[X1 , . . . , Xn ], P ∈ C, F ∈ S y σ ∈ G(k/k), entonces F (P ) = 0, luego
F (P σ ) = 0, luego P σ ∈ C.
Recı́procamente, sea C = V (S), con S ⊂ k[X1 , . . . , Xn ]. La hipótesis hace
que si F ∈ S y σ ∈ G(k/k), entonces F σ (P ) = 0 para todo P ∈ C. En efecto,
−1 −1
tenemos que P σ ∈ C, luego F (P σ ) = 0, luego F σ (P ) = 0. Esto implica que
podamos suponer que S es unión de clases de conjugación respecto a la acción
de G(k/k).
Supongamos que F1 , . . . , Fr es una de estas clases de conjugación y sean
e1 , . . . , er los polinomios simétricos elementales con r indeterminadas. Vamos
a probar que V (S) no se altera si sustituimos F1 , . . . , Fr por ei (F1 , . . . , Fr ),
para i = 1, . . . , r, con lo que el teorema quedará probado, pues estos polinomios
tienen sus coeficientes en k. Concretamente, hemos de probar que un punto P es
raı́z de los polinomios Fi si y sólo si lo es de los ei (F1 , . . . , Fr ). Una implicación
es obvia. Si P es raı́z de los ei (F1 , . . . , Fr ), en particular lo es de

er (F1 , . . . , Fr ) = F1 · · · Fr .

Esto significa que Fi (P ) = 0 para un i. No perdemos generalidad si supone-


mos F1 (P ) = 0. Teniendo en cuenta esto y que P es raı́z de em−1 (F1 , . . . , Fr ),
concluimos que también es raı́z de F2 · · · Fr , luego Fi (P ) = 0 para i ≥ 2. Pode-
mos suponer F2 (P ) = 0. Prosiguiendo de este modo concluimos que P anula a
todos los Fi .
1.1. Variedades afines 3

Ası́ pues, si C está definido sobre k el grupo G(k/k) actúa sobre C. También
es claro que
C(k) = {P ∈ C | P σ = P para todo σ ∈ G(k/k)}.

Si C es un conjunto algebraico, llamaremos I(C) al ideal de todos los po-


linomios de k[X1 , . . . , Xn ] que se anulan sobre (las coordenadas de) los puntos
de C. Si C está definido sobre k definimos además
I(C/k) = I(C) ∩ k[X1 , . . . , Xn ],
que es un ideal de k[X1 , . . . , Xn ].
Una variedad afı́n es un conjunto algebraico V ⊂ An tal que I(V ) es un
ideal primo. Si V está definida sobre k, es claro que I(V /k) también es un ideal
primo, pero del hecho de que I(V /k) sea primo no podemos inferir que V sea
una variedad. Basta pensar en V (X 2 + Y 2 ) con k = Q.
Una aplicación φ : V −→ W entre dos variedades afines definidas sobre k
es polinómica (sobre k) si, fijados sistemas de referencia afines definidos sobre
k, existen F1 , . . . , Fn ∈ k[X1 , . . . , Xm ] tales que para todo P ∈ V se cumple
que φ(P ) = (F1 (P ), . . . , Fn (P )). (Aquı́ φ(P ) representa en realidad al vector de
coordenadas de φ(P ).)
Un isomorfismo es una aplicación biyectiva tal que tanto ella como su inversa
son polinómicas.
Es claro que la composición de aplicaciones polinómicas es una aplicación
polinómica y que las aplicaciones polinómicas transforman puntos racionales en
puntos racionales.
Sea V una variedad afı́n definida sobre k. Llamaremos k[V ] al conjunto de las
funciones polinómicas (definidas sobre k) V −→ k. Aquı́ estamos considerando a
k = A1 (k) como una variedad. Es claro que k[V ] es un anillo con las operaciones
definidas puntualmente (y aquı́ consideramos a k como cuerpo y no meramente
como espacio afı́n). Además contiene una copia de k (formada por las funciones
constantes). Notemos que haciendo k = k tenemos definido el anillo k[V ] como
caso particular. Evidentemente k[V ] ⊂ k[V ].
Fijado un sistema de referencia, cada polinomio F ∈ k[X1 , . . . , Xm ] define
una función polinómica f ∈ k[V ] dada por f (P ) = F (P ) (entendiendo que el
segundo miembro es F actuando sobre las coordenadas de P ). La aplicación
F → f es un epimorfismo de anillos y su núcleo es I(V /k). Por consiguiente
tenemos la representación
k[V ] ∼
= k[X1 , . . . , Xn ]/I(V /k). (1.1)
Notemos que lo mismo vale en particular si cambiamos k por k e I(V /k) por
I(V ). El monomorfismo natural
k[X1 , . . . , Xn ]/I(V /k) −→ k[X1 , . . . , Xn ]/I(V )
se corresponde a través de los isomorfismos (1.1) con la inclusión k[V ] ⊂ k[V ].
4 Capı́tulo 1. Preliminares de geometrı́a algebraica

Representaremos por xi a la clase de Xi en k[X1 , . . . , Xn ]/I(V /k). Cla-


ramente tenemos que k[V ] = k[x1 , . . . , xn ]. Como I(V /k) es un ideal primo,
la representación (1.1) muestra que k[V ] es un dominio ı́ntegro, luego podemos
considerar su cuerpo de cocientes, al que llamaremos k(V ). Tenemos la inclusión
k(V ) ⊂ k(V ).
Más aún, como ambos cuerpos están generados por las clases x1 , . . . , xn , de
hecho k(V ) = kk(V ). Esto implica que la extensión k(V )/k(V ) es de Galois.
Se dice que α ∈ k(V ) es regular en P ∈ V si α = f /g con1 f , g ∈ k[V ],
g(P ) = 0, y en tal caso definimos α(P ) = f (P )/g(P ). Ası́, puede haber re-
presentaciones de α para las que el denominador se anule y otras para las que
no se anule. No obstante, si α es regular en P , el valor α(P ) no depende de
la representación con la que se calcula. Si α no es regular en P se dice que es
singular.
Podemos identificar los elementos de k(V ) con las funciones que determinan,
en el sentido de que si f /g y f  /g  coinciden sobre el conjunto de puntos regulares
para ambas, entonces f /g = f  /g  .
En efecto, fijado un sistema de referencia, sea f = [F ], g = [G], f  = [F  ] y
g = [G ]. Sea H = F G − GF  . Entonces tenemos que HGG ∈ I(V /k), pero


G, G ∈/ I(V /k), pues g, g  = 0. Como I(V /k) es primo, ha de ser H ∈ I(V /k),
luego f g  − gf  = 0, con lo que f /g = f  /g  .
En vista de esto, los elementos de k(V ) se llaman funciones racionales de V .
Es claro que el grupo de Galois G(k/k) actúa de forma natural sobre el
anillo de polinomios k[X1 , . . . , Xn ] (coeficiente a coeficiente), de modo que los
polinomios invariantes son precisamente los de k[X1 , . . . , Xn ]. Observemos que
si F ∈ k[X1 , . . . , Xn ], P ∈ An y σ ∈ G(k/k), entonces
−1
F σ (P ) = F (P σ )σ .

Si V es una variedad definida sobre k, entonces σ[I(V )] = I(V ) para todo


−1 −1
σ ∈ G(k/k), pues si F ∈ I(V ) y P ∈ V , entonces P σ ∈ V , luego F (P σ ) = 0,
luego F σ (P ) = 0, con lo que F σ ∈ I(V ).
Esto nos permite extender cada automorfismo σ ∈ G(k/k) a un automor-
fismo σ : k[V ] −→ k[V ] (dado por [F ]σ = [F σ ]) y éste a su vez a un automorfismo
σ ∈ G(k(V )/k(V )). Explı́citamente, si α ∈ k(V ), P ∈ V y σ ∈ G(k/k), entonces
−1
ασ (P ) = α(P σ )σ .
−1
(Entendiendo que ασ es regular en P si y sólo si α es regular en P σ .)
Tenemos ası́ un isomorfismo de grupos G(k/k) ∼ = G(k(V )/k(V )). En efecto,
cada k(V )-automorfismo de k(V ) se restringe a un k-automorfismo de k (porque
k/k es normal) y está completamente determinado por dicha restricción, dado
1 Notemos que no exigimos que f y g estén en k[X , . . . , X ]. De este modo α es regular
1 n
en los mismos puntos vista como elemento de k(V ) o de k(V ).
1.1. Variedades afines 5

que k(V ) = kk(V ). Ası́ pues, cada k(V )-isomorfismo de k(V ) es la (única)
imagen de su restricción a k. En particular vemos que

k(V ) = {α ∈ k(V ) | ασ = α para todo σ ∈ G(k/k)}.

También podemos concluir que k es algebraicamente cerrado en k(V ), pues


si α ∈ k(V ) es algebraico sobre k, entonces α ∈ k y queda fijo por todo G(k/k),
luego α ∈ k.
Otra consecuencia es que si α ∈ k, sus conjugados sobre k son también
conjugados sobre k(V ), luego el polinomio mı́nimo de α sobre k sigue siendo
irreducible sobre k(V ). De aquı́ se sigue que si l es una extensión finita de
k entonces |l : k| = |l(V ) : k(V )|, y a su vez esto implica que una k-base
de k es también una k(V )-base de k(V ). En otros términos, todo elemento
de k(V ) se expresa de forma única como combinación lineal de dicha k-base
con coeficientes en k(V ). De aquı́ podemos concluir que existe un isomorfismo
natural k(V ) ∼
= k(V ) ⊗k k y, por consiguiente, k[V ] ∼
= k[V ] ⊗k k.
Tenemos las sucesiones exactas

0  I(V /k) ⊗k k  k[X1 , . . . , Xn ] ⊗k k  k[V ] ⊗k k 0

  
0  I(V )  k[X1 , . . . , Xn ]  k[V ] 0

donde las dos últimas flechas verticales son los isomorfismos naturales, que for-
man un cuadrado conmutativo. De aquı́ concluimos que el isomorfismo central
se restringe a un isomorfismo I(V ) ∼ = I(V /k) ⊗k k. En otros términos, conclui-
mos que el ideal I(V ) es el espacio vectorial (o el ideal) generado por I(V /k).
Tenemos ası́ una caracterización de las variedades definidas sobre k (que
enunciamos conjuntamente con el teorema 1.1):

Teorema 1.2 Si V ⊂ An es una variedad afı́n, las afirmaciones siguientes son


equivalentes:

a) Existe S ⊂ k[X1 , . . . , Xn ] tal que V = V (S) (es decir, V está definida


sobre k).

b) Existe S ⊂ k[X1 , . . . , Xn ] tal que I(V ) = (S).

c) σ[V ] = V para todo σ ∈ G(k/k).

Hemos probado que k(V ) es el cuerpo fijado por G(k/k) en k(V ). Más
delicado es el teorema siguiente:

Teorema 1.3 Si V es una variedad afı́n definida sobre k, entonces

k[V ] = {f ∈ k[V ] | f σ = f para todo σ ∈ G(k/k)}.


6 Capı́tulo 1. Preliminares de geometrı́a algebraica

Demostración: Una inclusión es trivial, pero para la contraria necesitamos


usar un resultado de cohomologı́a de grupos.
Tomemos f = [F ] ∈ k[V ] invariante por G(k/k). Para cada σ ∈ G(k/k)
existe un polinomio Hσ ∈ I(V ) tal que F σ = F + Hσ . Notemos que F tiene
un número finito de conjugados, luego en realidad tenemos un número finito de
polinomios Hσ .
Teniendo en cuenta que I(V ) está generado por I(V /k), es claro que I(V )
es, de hecho, el k-espacio vectorial generado por I(V /k). Los polinomios Hσ
se expresarán como combinación lineal de un número finito de polinomios de
I(V /k), con coeficientes en una extensión finita de Galois K de k. Sea M ⊂ I(V )
el K-espacio vectorial generado por estos polinomios y sea B = {f1 , . . . , fr } una
base de M .
El ideal I(V ) tiene un generador formado por polinomios de k[X1 , . . . , Xn ].
Si multiplicamos los generadores por todos los monomios con coeficiente 1, obte-
nemos un generador de I(V ) como k-espacio vectorial, del cual podemos extraer
una base. En definitiva, tenemos una k-base de I(V ) formada por polinomios
de k[X1 , . . . , Xn ] (invariantes por G(k/k)). Podemos suponer además que K
contiene a todos los coeficientes de F . Ası́, los polinomios F σ con σ ∈ G(K/k)
son todos los conjugados de F por G(k/k) y los polinomios Hσ = F σ − F son
los mismos que los que ya tenı́amos definidos para σ ∈ G(k/k). En particular
Hσ ∈ M .
Ahora bien, para σ, τ ∈ G(K/k) tenemos que

F στ = F + Hστ = (F + Hσ )τ = F + Hτ + Hστ ,

luego Hστ = Hτ + Hστ .


Más aún, si llamamos Hσi ∈ K a la coordenada de Hσ en la base B corres-
i
pondiente a fi , tenemos igualmente que Hστ = Hτi + Hσiτ (aquı́ usamos que la
base es invariante por G(K/k)).
Esto significa que la aplicación σ → Hσi (para un i fijo) es un 1-cociclo
respecto de la acción de G = G(K/k) sobre K + . Ahora usamos un resultado de
la cohomologı́a de grupos finitos, a saber, que H 1 (G, K + ) = 0, lo que significa
que todo cociclo es una cofrontera. Explı́citamente, existe un Gi ∈ K tal que
Hσi = Gσi − Gi . El polinomio G ∈ I(V ) que en la base B tiene coordenadas Gi
verifica la relación Hσ = Gσ −G, con lo que F σ −F = Gσ −G, o equivalentemente
(F + G)σ = F + G, para todo σ ∈ G(K/k).
Concluimos que F + G ∈ k[X1 , . . . , Xn ] y ası́ [F ] = [G] ∈ k[V ].
La importancia del teorema anterior se debe a que ahora sabemos que

k[V ] ∩ k(V ) = k[V ].

En otros términos: si α ∈ k[V ] está definida sobre k como elemento de k(V )


(es decir, si es el cociente de dos elementos de k[V ]), entonces está en k[V ]. En
efecto, al estar definida sobre k es invariante por G(k/k).
Observemos que para calcular una función α ∈ k(V ) en un punto P ∈ V
podrı́a hacer falta expresarla como α = f /g con f , g ∈ k[V ], pero aún ası́, si P
1.1. Variedades afines 7

es un punto racional de V se cumple que α(P ) ∈ k, pues α(P ) es invariante por


el grupo de Galois G(k/k).
Para cada punto P ∈ V definimos el anillo local OP (V ) como el anillo de las
funciones racionales de V regulares en P . Claramente k[V ] ⊂ OP (V ) ⊂ k(V ).

Teorema 1.4 Sea V una variedad afı́n definida sobre k. Entonces



k[V ] = OP (V ),
P ∈V

es decir, k[V ] es el conjunto de las funciones de k(V ) que no tienen singulari-


dades.

Demostración: Sea α ∈ k(V ) una función sin singularidades. Considere-


mos el ideal
I = {G ∈ k[X1 , . . . , Xn ] | [G]α ∈ k[V ]}.
Se cumple que V (I) = ∅. En efecto, como claramente I(V ) ⊂ I, tenemos
que V (I) ⊂ V (I(V )) = V , luego si P ∈ V (I) entonces P es un punto de
V , donde α no es singular, luego α = [F ]/[G] con G(P ) = 0, pero entonces
[G]α = [F ] ∈ k[V ] y G ∈ I, contradicción.
Por el teorema de los ceros de Hilbert ha de ser I = k[X1 , . . . , Xn ], luego
1 ∈ I y, por lo tanto, α = [1]α ∈ k[V ] ∩ k(V ) = k[V ].
Necesitamos un último resultado sobre funciones polinómicas:
Si φ : V −→ W es una aplicación polinómica definida sobre k podemos
definir el k-homomorfismo de anillos φ : k[W ] −→ k[V ] dado por φ(f ) = φ ◦ f .
Es claro que φ determina a φ, pues si ψ es otra aplicación polinómica y se
cumple φ = ψ, entonces, para todo P ∈ V , tenemos que φ(xi )(P ) = ψ(xi )(P ),
es decir, xi (φ(P )) = xi (ψ(P )), luego φ(P ) = ψ(P ).

Teorema 1.5 Si V ⊂ Am y W ⊂ An son variedades afines definidas sobre k,


la correspondencia φ → φ es una biyección entre las aplicaciones polinómicas
φ : V −→ W (definidas sobre k) y los k-homomorfismos φ : k[W ] −→ k[V ].

Demostración: Hemos probado que la correspondencia es inyectiva. Para


probar que es suprayectiva tomamos un k-homomorfismo α : k[W ] −→ k[V ].
Sea α(xi ) = [Fi ], con Fi ∈ k[X1 , . . . , Xm ]. Entonces los Fi determinan una
aplicación polinómica φ : Am −→ An , ası́ como el homomorfismo de anillos
φ∗ : k[X1 , . . . , Xn ] −→ k[X1 , . . . , Xm ] dado por G → G(F1 , . . . , Fn ).
Si G es un generador de I(W ) con coeficientes en k, entonces φ∗ (G) ∈ I(V ),
pues la clase de φ∗ (G) módulo I(V ) es

G([F1 ], . . . , [Fn ]) = G(α(x1 ), . . . , α(xn )) = α([G]) = α(0) = 0.

Por lo tanto φ[V ] ⊂ W , pues si P ∈ V y G ∈ I(W ) es un generador, entonces


G(φ(P )) = φ∗ (G)(P ) = 0, luego φ(P ) ∈ V (I(W )) = W . Ası́ pues, φ se restringe
a una función polinómica de V en W definida sobre k, y es fácil ver que cumple
φ = α.
8 Capı́tulo 1. Preliminares de geometrı́a algebraica

1.2 Variedades proyectivas


Llamaremos Pn (k) al espacio proyectivo de dimensión n sobre el cuerpo
k. Como en el caso afı́n podemos considerar Pn (k) ⊂ Pn (k). Escribiremos
simplemente Pn para referirnos a Pn (k) y a los puntos de Pn (k) los llamaremos
puntos racionales de Pn .
Diremos que un sistema de referencia de Pn está definido sobre k si está
determinado por puntos racionales. Respecto a un sistema en estas condiciones,
los puntos racionales son los que admiten un vector de coordenadas homogéneas
en k n+1 . En lo sucesivo supondremos siempre que los sistemas de coordenadas
que consideramos están definidos sobre k.
El grupo G(k/k) actúa de forma natural sobre Pn y fija a los puntos racio-
nales. El recı́proco no es trivial:

Teorema 1.6 En las condiciones anteriores, se cumple que

P (k) = {P ∈ P | P = P para todo σ ∈ G(k/k)}.


n n σ

Demostración: Fijemos un sistema de referencia y consideremos un punto


invariante de coordenadas P = [α1 , . . . , αn+1 ]. Sea K una extensión finita de
Galois de k que contenga a todos los αi . Tenemos entonces que

[α1σ , . . . , αn+1
σ
] = [α1 , . . . , αn+1 ], para todo σ ∈ G(K/k),

luego existe un λσ ∈ K ∗ tal que αiσ = λσ αi , para i = 1, . . . , n + 1.


Si σ, τ ∈ G(K/k), tenemos que

αiστ = λστ αi = (λσ αi )τ = λτσ λτ αi .

Como algún αi ha de ser no nulo, concluimos que λστ = λτ λτσ . Esto significa
que σ → λσ es un 1-cociclo para la acción de G = G(K/k) sobre K ∗ , y el
teorema de Hilbert-Speiser afirma que H 1 (G, K ∗ ) = 1, luego existe un λ ∈ K ∗
tal que λσ = λσ /λ. Por consiguiente, αiσ = λσ αi /λ o, lo que es lo mismo,
(αi /λ)σ = αi /λ para todo σ ∈ G(K/k). Por consiguiente αi /λ ∈ k y

P = [α1 /λ, . . . , αn+1 /λ] ∈ Pn (k).

Si S es un conjunto de formas (polinomios homogéneos) en k[X1 , . . . , Xn+1 ],


llamaremos V (S) al conjunto de todos los puntos de Pn cuyas coordenadas
homogéneas en un sistema de referencia prefijado anulan a todos los polinomios
de S.
Se dice que un conjunto C ⊂ Pn es algebraico si C = V (S), para cierto
conjunto de formas S ⊂ k[X1 , . . . , Xn+1 ]. Si S ⊂ k[X1 , . . . , Xn+1 ] diremos que
C está definido sobre k. El carácter algebraico de un conjunto (y el hecho de que
esté o no definido sobre k) no depende del sistema de referencia considerado.
1.2. Variedades proyectivas 9

Si C es un conjunto algebraico definido sobre k, llamaremos C(k) al conjunto


de todos los puntos racionales de C, es decir, C(k) = C ∩ Pn (k). Notemos que
σ[C] = C para todo σ ∈ G(k/k), ası́ como que

C(k) = {P ∈ C | P σ = P para todo σ ∈ G(k/k)}.

La prueba del teorema 1.1 es válida palabra por palabra en este contexto,
de modo que un conjunto algebraico C está definido sobre k si y sólo si el grupo
G(k/k) actúa sobre C de forma natural.
Llamaremos I(C) al ideal de todos los polinomios de k[X1 , . . . , Xn+1 ] que
se anulan2 sobre (las coordenadas de) los puntos de C. Se prueba que está
generado por un conjunto (finito) de formas. Definimos

I(C/k) = I(C) ∩ k[X1 , . . . , Xn+1 ],

que es un ideal de k[X1 , . . . , Xn+1 ].


Una variedad proyectiva es un conjunto algebraico V ⊂ Pn tal que I(V ) es
un ideal primo. Si V está definida sobre k, es claro que I(V /k) es también un
ideal primo.
Fijado un sistema de referencia, definimos el dominio ı́ntegro

kh [V ] = k[X1 , . . . , Xn+1 ]/I(V /k)

y el cuerpo k(V ) formado por las fracciones de su cuerpo de cocientes deter-


minadas por clases de formas del mismo grado. Similarmente se define k(V ).
Como ambos cuerpos están generados por las fracciones [Xi /Xn+1 ], tenemos
que k(V ) = kk(V ).
Diremos que un α ∈ k(V ) es regular en P si α = f /g, con f , g ∈ k h [V ] y
g(P ) = 0. (Notemos que g(P ) no está bien definido, pero la condición g(P ) = 0
sı́ lo está.) En tal caso, el valor α(P ) = f (P )/g(P ) está bien definido. Si α no
es regular en P diremos que es singular en P .
Ası́, los elementos de k(V ) determinan funciones parciales sobre V . El mismo
argumento que en el caso afı́n justifica que elementos distintos determinan fun-
ciones distintas. Más aún, las funciones (parciales) en V obtenidas de este modo
no dependen del sistema de referencia con el que se calcula k(V ). Por ello con-
sideraremos a k(V ) como un cuerpo de funciones parciales en V que admite
distintas representaciones como cocientes de clases de polinomios según el sis-
tema de referencia que consideremos. A los elementos de k(V ) los llamaremos
funciones racionales en V (definidas sobre k).
Como en el caso afı́n, la extensión k(V )/k(V ) es de Galois y tenemos un
isomorfismo natural G(k/k) ∼ = G(k(V )/k(V )) determinado por
−1
ασ (P ) = α(P σ )σ .
2 Se entiende que un polinomio se anula sobre un punto del espacio proyectivo si se anula
sobre cualquier vector de coordenadas homogéneas, y esto equivale a que se anulen todas las
formas que lo componen.
10 Capı́tulo 1. Preliminares de geometrı́a algebraica

En particular

k(V ) = {α ∈ k(V ) | ασ = α para todo σ ∈ G(k/k)}.

Por lo tanto k es algebraicamente cerrado en k(V ).


En realidad, estos hechos pueden deducirse de los correspondientes al caso
afı́n. Ello se debe a que si V ⊂ Pn es una variedad proyectiva, podemos suponer
que no está contenida en el hiperplano Xn+1 = 0, en cuyo caso la intersección
V∗ = V ∩ An es una variedad afı́n. Es fácil ver que una está definida sobre k
si y sólo si lo está la otra. De hecho, I(V∗ ) se obtiene deshomogeneizando los
polinomios de I(V ) (o sea, haciendo Xn+1 = 1), y esto es un homomorfismo de
anillos. Recı́procamente, si V∗ está definida sobre k y F ∈ I(V ) es una forma, no
puede ocurrir que Xn+1 | F , lo cual garantiza que F = (F∗ )∗ (donde la estrella
superior representa la forma que se obtiene al completar con potencias de Xn+1
el polinomio F∗ ). Tenemos que F∗ ∈ I(V∗ ) es combinación lineal de polinomios
con coeficientes en k, luego F es combinación lineal de formas con coeficientes
en k.
En particular vemos que V está definida sobre k si y sólo si el ideal I(V )
está generado por formas con coeficientes en k, luego el teorema 1.2 es válido
para variedades proyectivas.
Si P ∈ V , definimos OP (V ) como el conjunto de las funciones de k(V )
regulares en P .
Si V es una variedad afı́n definida sobre k, es claro que su clausura proyectiva
V ∗ está definida sobre k. Recı́procamente, si V es una variedad proyectiva
definida sobre k y tomamos un hiperplano infinito H definido sobre k, la variedad
afı́n V∗ = V \ H está definida sobre k (y V es su clausura proyectiva).
Si V ∗ es la clausura proyectiva de V , es conocido que la restricción deter-
mina un k-isomorfismo de k(V ∗ ) en k(V ), que obviamente se restringe a un
k-isomorfismo de k(V ∗ ) en k(V ). Además, si P ∈ / H, entonces el anillo OP (V ∗ )
se corresponde con OP (V ).

1.3 Variedades cuasiproyectivas


Recordemos que la topologı́a de Zariski en Pn es la que tiene como conjuntos
cerrados a los subconjuntos algebraicos. Una variedad cuasiproyectiva (o, sim-
plemente, una variedad) en Pn es un abierto V en una variedad proyectiva de
Pn respecto a la topologı́a de Zariski. La variedad proyectiva referida es nece-
sariamente la clausura V de V en Pn . Las variedades cuasiproyectivas incluyen
a las variedades afines y a las proyectivas.
Diremos que V está definida sobre k si lo está V y para todo automorfismo
σ ∈ G(k/k) se cumple σ[V ] = V . Esta definición es consistente con la que ya
tenı́amos para variedades afines y proyectivas.
Se demuestra que cada función de k(V ) está determinada por su restricción
a V , lo que nos permite definir el cuerpo de las funciones racionales de V como
1.3. Variedades cuasiproyectivas 11

el formado por las restricciones a V de todas las funciones de k(V ). Tenemos,


pues, que k(V ) ∼
= k(V ). De nuevo, esta definición de k(V ) es consistente con la
que ya tenı́amos para variedades afines y proyectivas.
−1
Si α ∈ k(V ) y σ ∈ G(k/k), definimos ασ ∈ k(V ) como ασ (P ) = α(P σ )σ .
Si α se extiende a α ∈ k(V ), es claro que ασ es la restricción a V de ασ . Esto
prueba que está bien definida y que la acción de G(k/k) sobre k(V ) es la misma
que su acción sobre k(V ). En particular

k(V ) = {α ∈ k(V ) | ασ = α | para todo σ ∈ G(k/k)}.

Para cada punto P ∈ V definimos OP (V ) como el subanillo de k(V ) formado


por las restricciones de las funciones de OP (V ). Para cada abierto U en V
definimos

k[U ] = OP (V ).
P ∈U

En particular, k[V ] es el anillo de las funciones racionales en V regulares


sobre todos los puntos de V . Una vez más, esta definición es consistente con la
que ya tenı́amos para variedades afines. Trivialmente k[U ] = k(V ) ∩ k[U ].
Puede probarse que toda función α ∈ k(V ) es regular en un abierto U ⊂ V ,
de modo que k(V ) es la unión de los anillos k[U ], donde U recorre los abiertos
de V .
Una aplicación φ : V −→ W entre dos variedades es regular si es continua
para la topologı́a de Zariski y para todo abierto U de W (tal que U ∩ φ[V ] = ∅)
y toda función α ∈ k[U ], se cumple que φ(α) = φ ◦ α ∈ k[φ−1 [U ]]. La aplicación
φ es un isomorfismo si es biyectiva y tanto φ como φ−1 son regulares.
Ası́, toda aplicación regular φ induce k-homomorfismos de anillos

φ : k[U ] −→ k[φ−1 [U ]].

Si V y W están definidas sobre k, diremos que φ está definida sobre k si los


homomorfismos φ se restringen a k-homomorfismos φ : k[U ] −→ k[φ−1 [U ]].
La composición de aplicaciones regulares definidas sobre k es una aplicación
regular definida sobre k. Es conocido que las aplicaciones regulares entre va-
riedades afines son precisamente las aplicaciones polinómicas. En virtud del
teorema 1.5 tenemos que las aplicaciones regulares definidas sobre k entre va-
riedades afines definidas sobre k son precisamente las aplicaciones polinómicas
definidas sobre k.

Teorema 1.7 Si V es una variedad definida sobre k, entonces k[V ] es el con-


junto de las aplicaciones regulares α : V −→ A1 definidas sobre k.

Demostración: Admitimos que k[V ] es el conjunto de las aplicaciones


regulares α : V −→ A1 . Hemos de ver que α está definida sobre k (en el sentido
de que su extensión a k(V ) está en k(V )) si y sólo si α está definida sobre k
12 Capı́tulo 1. Preliminares de geometrı́a algebraica

(en el sentido general para aplicaciones regulares). Una implicación no ofrece


dificultad.
Supongamos que α está definida sobre k en el sentido general y vamos a
probar que ασ = α para todo σ ∈ G(k/k). Si x ∈ k[A1 ] es la identidad, tenemos
que α(x) ∈ k[V ], luego para todo P ∈ V se cumple que
−1 −1 −1
ασ (x)(P ) = x(α(P σ )σ ) = xσ (α(P σ ))σ
−1
= α(x)(P σ )σ = α(x)σ (P ) = α(x)(P ).
Ası́ pues, ασ (x) = α(x), pero como x es la identidad, esto es lo mismo que
σ
α = α.

Teorema 1.8 Si φ : V −→ W es una aplicación regular definida sobre k y


P ∈ V es un punto racional, entonces φ(P ) también lo es.

Demostración: Podemos suponer que xn+1 (φ(P )) = 0. Consideremos


el abierto U = {Q ∈ W | xn+1 (Q) = 0} ⊂ W . Entonces P ∈ φ−1 [U ] y
xi /xn+1 ∈ k[U ], luego φ(xi /xn+1 ) ∈ k(φ−1 (U )). Por consiguiente

φ(xi /xn+1 )(P ) = xi (φ(P ))/xn+1 (φ(P )) ∈ k.

De aquı́ se sigue que si tomamos un vector de coordenadas homogéneas para


φ(P ) cuya última coordenada valga 1, todas las demás estarán en k.
Una aplicación racional φ : V −→ W entre dos variedades es una aplicación
regular definida en un subconjunto abierto de V que no puede extenderse a una
aplicación regular en ningún abierto mayor. Se dice que φ es regular o singular
en un punto P ∈ V según si φ está o no definida en P .
Si las variedades V y W están definidas sobre k, diremos que φ está definida
sobre k si lo está la restricción al abierto en el que está definida.
Cualquier aplicación regular de un abierto de V en W se extiende a una
única aplicación racional φ : V −→ W . La composición de aplicaciones racio-
nales (definidas sobre k) es una aplicación racional (definida sobre k). En vista
del teorema 1.7, también es evidente que k(V ) es el conjunto de las funciones
racionales α : V −→ A1 definidas sobre k.
Sea φ : V −→ W una aplicación racional entre variedades definidas sobre k.
Para cada σ ∈ G(k/k), podemos definir φσ : V −→ W mediante
−1
φσ (P ) = φ(P σ )σ .

Es claro que si φ es regular en un abierto U ⊂ V , entonces φσ es regular en


el abierto σ[U ] ⊂ V , luego φσ es también una aplicación racional. Además esta
definición extiende a la que ya tenı́amos sobre k(V ).

Teorema 1.9 Una aplicación racional φ : V −→ W entre variedades definidas


sobre k está definida sobre k si y sólo si φσ = φ para todo σ ∈ G(k/k).
1.3. Variedades cuasiproyectivas 13

Demostración: Supongamos que φ es invariante por automorfismos. Sea


U un abierto en W que corte a la imagen de α y sea α ∈ k[U ]. Hemos de probar
que φ(α) ∈ k[φ−1 [U ]] o, simplemente, que φ(α) ∈ k(V ), pues ya sabemos que φ
es racional. En efecto,

φ(α)σ = (φ ◦ α)σ = φσ ◦ ασ = φ ◦ α = φ(α),

luego φ(α) ∈ k(V ) y φ está definida sobre k. Recı́procamente, si φ está definida


sobre k y σ ∈ G(k/k), sea V0 ⊂ V el abierto donde φ está definida y sea
P ∈ V0 ∩ σ[V0 ]. Si φ(P ) = φσ (P ), podrı́amos tomar α ∈ k(W ) que fuera regular
en ambos puntos pero que tomara valores distintos en ellos (basta restringir a
W un cociente de formas lineales adecuado con coeficientes en k). Entonces
φ(α) = φσ (α), mientras que, razonando como antes, φ(α) = φ(α)σ = φσ (α),
contradicción

Si φ : V −→ W es una aplicación racional densa (es decir, con imagen


densa) entre variedades definidas sobre k, la composición con φ induce un k-
monomorfismo de cuerpos φ : k(W ) −→ k(V ). Se cumple que φ está definida
sobre k si y sólo si φ se restringe a un k-monomorfismo φ : k(W ) −→ k(V ). En
efecto: si se cumple esto y U ⊂ V es un abierto donde φ es regular, para cada
abierto W  ⊂ W y cada f ∈ k[W  ], tenemos que φ(f ) ∈ k[φ−1 [W  ]] ∩ k(V ) =
k[φ−1 [W  ]], luego φ|U está definida sobre k.

Teorema 1.10 Dadas dos variedades V y W definidas sobre k, la correspon-


dencia φ → φ biyecta las aplicaciones racionales densas φ : V −→ W definidas
sobre k con los k-monomorfismos φ : k(W ) −→ k(V ).

Demostración: Admitiendo el teorema cuando k es algebraicamente ce-


rrado, sólo hay que observar que todo k-monomorfismo φ se extiende a un único
k-monomorfismo φ : k(W ) −→ k(V ).
Sea φ : V −→ W una función racional definida sobre k, con V ⊂ Pn y
W ⊂ Pm y sea P0 ∈ V . Podemos suponer sin pérdida de generalidad que
Xm+1 (P0 ) = 0, con lo que, llamando Am al espacio afı́n dado por Xm+1 = 0,
tenemos que U = φ−1 [Am ] es un entorno de P0 en V , la variedad W∗ = W ∩ Am
es afı́n y φ|U : U −→ W∗ sigue siendo una aplicación racional sobre k. Al
componer φ con las funciones coordenadas xi ∈ k[W∗ ] obtenemos funciones
racionales fi = φ|U ◦ xi ∈ k(V ). Por lo tanto, la función φ viene dada sobre U
por una expresión de la forma

φ(P ) = [f1 (P ), . . . , fm (P ), 1].

Vemos ası́ que toda función racional φ : V −→ W definida sobre k admite


en un entorno de cada punto una expresión de la forma

φ(P ) = [f1 (P ), . . . , fm+1 (P )], fi ∈ k(V ),

definida en el abierto de puntos regulares para todas las funciones fi y donde


alguna de ellas no se anula. Recı́procamente, toda expresión de esta forma
14 Capı́tulo 1. Preliminares de geometrı́a algebraica

determina una función racional en V definida sobre k que es regular (al me-
nos) donde lo son todas las funciones coordenadas y alguna de ellas es no nula.
En principio φ : V −→ Pm , pero si la imagen de φ está contenida en una
variedad W definida sobre k, también podemos considerar φ : V −→ W (de-
finida sobre k). (Para comprobar que está definida sobre k observamos que
φσ (P ) = [f1σ (P ), . . . , fm+1
σ
(P )].)
Una aplicación birracional φ : V −→ W es un isomorfismo entre un abierto
de V y un abierto de W . Decimos que está definida sobre k cuando lo está como
aplicación racional.
Es fácil ver que las aplicaciones birracionales φ : V −→ W definidas sobre
k se corresponden con los k-isomorfismos φ : k(W ) −→ k(V ), ası́ como que
la inversa de una aplicación birracional definida sobre k está también definida
sobre k.

1.4 Variedades complejas


En esta sección demostraremos que si K es un subcuerpo de C, toda variedad
proyectiva V /K se extiende a una variedad proyectiva V /C definida por las
mismas ecuaciones. Para ello necesitamos algunos resultados algebraicos.

Definición 1.11 Sea F/K una extensión de cuerpos y sean A y B dos dominios
intermedios. Diremos que A y B son linealmente disjuntos sobre K si cuando
{ai }i∈I ⊂ A y {bj }j∈J ⊂ B son conjuntos linealmente independientes sobre K,
entonces {ai bj }(i,j)∈I×J es linealmente independiente sobre K.

Teorema 1.12 Sea F/K una extensión de cuerpos y sean A y B dos dominios
intermedios linealmente disjuntos sobre K.

a) Si {ai }i∈I y {bj }j∈J son bases de A y B sobre K respectivamente, entonces


{ai bj }(i,j)∈I×J es una base de AB sobre K.

b) Los cuerpos de cocientes de A y B son linealmente disjuntos sobre K.

Demostración: a) Por hipótesis {ai bj }(i,j)∈I×J es linealmente indepen-


diente sobre K, y obviamente es un generador de AB, luego es una base.
b) Sean A y B  los cuerpos de cocientes. Si no fueran linealmente disjuntos,
existirı́an familias finitas {ai }i∈I ⊂ A y {bj }j∈J ⊂ B  linealmente independien-
tes sobre K tales que {ai bj }(i,j)∈I×J es linealmente dependiente sobre K. Esto
significa que 
λij ai bj = 0,
i,j

para ciertos λij ∈ K no todos nulos. Existen a ∈ A, b ∈ B no nulos tales que


aai ∈ A, bbj ∈ B para todo i, j. Entonces

λij (aai )(bbj ) = 0,
i,j
1.4. Variedades complejas 15

de donde se sigue que la familia {(aai )(bbj )}(i,j)∈I×J es linealmente dependiente


sobre K. Por hipótesis, una de las familias {aai }i∈I ⊂ A o {bbj }j∈J ⊂ B ha de
ser linealmente dependiente sobre K, lo cual es absurdo.

Teorema 1.13 Sea F/K una extensión de cuerpos y sean A y B dos dominios
intermedios. Si existen K-bases {ai }i∈I y {bj }j∈J de A y B respectivamente,
tales que {ai bj }(i,j)∈I×J es linealmente independiente sobre K, entonces A y B
son linealmente disjuntos sobre K.
Demostración: Para probar que A y B son linealmente disjuntos basta
tomar familias finitas {ur }mr=1 ⊂ A, {vs }s=1 ⊂ B linealmente independientes
n

sobre K y demostrar que el producto es también linealmente independiente.


Sean I  ⊂ I, J  ⊂ J conjuntos finitos tales que

{ur }m
r=1 ⊂ ai | i ∈ I  , {vs }ns=1 ⊂ bj | j ∈ J   .
Sean d = dim ai | i ∈ I  , e = dim bj | j ∈ J  . Podemos extender {ur }m r=1
y {vs }ns=1 a dos bases {ur }dr=1 y {vs }es=1 de los espacios ai | i ∈ I   y bj | j ∈ J  
respectivamente. Es claro entonces que
ur vs | r = 1, . . . , d, s = 1, . . . , e = ai bj | i = 1, . . . , d, j = 1, . . . , e .
Por hipótesis, el segundo espacio tiene dimensión de, luego la familia {ur vs }
ha de ser linealmente independiente.

Teorema 1.14 Sea K un cuerpo algebraicamente cerrado y sea K(S) una ex-
tensión tal que S sea algebraicamente independiente sobre K. Supongamos que
S = S1 ∪ S2 , con S1 = {x1 , . . . , xm }, S2 = {y1 , . . . , yn }. En una clausura al-
gebraica de K(S), consideremos dos cuerpos L1 y L2 tales que las extensiones
Li /K(Si ) sean finitas de Galois. Entonces L1 y L2 son linealmente disjuntos
sobre K.
Demostración: Sea αi ∈ Li tal que Li = K(Si )(αi ). Consideremos el
epimorfismo de anillos K[X1 , . . . , Xm+1 ] −→ K[S1 ][α1 ] dado por Xi → xi ,
para i = 1, . . . , m, y Xm+1 → α1 . Su núcleo es un ideal primo que deter-
mina una variedad afı́n V1 tal que K[V1 ] ∼ = K[S1 ][α1 ] y el isomorfismo se
extiende a un isomorfismo K(V1 ) ∼ = K(S1 )(α1 ). Las funciones coordenadas
x1 , . . . , xm son algebraicamente independientes, y el polinomio mı́nimo de xm+1
sobre K(x1 , . . . , xm ) se corresponde con el de α1 sobre K(S1 ).
Similarmente, definimos una variedad afı́n V2 tal que K[V2 ] ∼ = K[S2 ][α2 ] y
K(V2 ) ∼ = K(S2 )(α2 ). El producto V1 × V2 es una variedad afı́n y cumple que
K(V1 × V2 ) = K(x1 , . . . , xm+1 , y1 , . . . , yn+1 ). Una base de trascendencia de este
cuerpo es {x1 , . . . , xm , y1 , . . . , yn }, que nos da un isomorfismo
K(x1 , . . . , xm , y1 , . . . , yn ) ∼
= K(S).
Si extendemos el isomorfismo a dos clausuras algebraicas, tenemos que xm+1
ha de corresponderse con un conjugado de α1 , mientras que yn+1 ha de corres-
ponderse con un conjugado de α2 . Cambiando los αi por estos conjugados,
16 Capı́tulo 1. Preliminares de geometrı́a algebraica

podemos suponer que el isomorfismo K(V1 × V2 ) = ∼ K(S)(α1 , α2 ) hace corres-


ponder las funciones coordenadas con los generadores del cuerpo de la derecha.
En particular se restringe a un isomorfismo K[V1 × V2 ] ∼ = K[S][α1 , α2 ].
Por otra parte tenemos un isomorfismo K[V1 ] ⊗K K[V2 ] ∼ = K[V1 × V2 ] dado
por f ⊗g → f g, donde en la parte derecha hay que entender que f (P, Q) = f (P )
y g(P, Q) = g(Q). Es claro que se trata de un homomorfismo bien definido y
trivialmente es suprayectivo, pues la imagen contiene a las funciones coordena-
das.
Una K-base de K[V1 ] ×K K[V2 ] es de la forma {fi ⊗ gj }, donde {fi }i es
una K-base de K[V1 ] y {gj }j es una K-base de K[V2 ]. Para probar que el
epimorfismo es inyectivo basta ver que esta base se transforma en un conjunto
linealmente independiente. Ahora bien, si existieran cij ∈ K tales que

cij fi (P )gj (Q) = 0
i,j

para todo (P, Q) ∈ V1 × V2 , fijando Q tenemos una combinación lineal nula de


las funciones fi , lo que implica que

cij gj (Q) = 0
i,j

para todo Q ∈ V2 , de donde se sigue que los cij son nulos.


Componiendo los isomorfismos tenemos que

K[S][α1 , α2 ] ∼
= K[S1 ][α1 ] ⊗K K[S2 ][α2 ].

Por lo tanto, el producto de una K-base de K[S1 ][α1 ] por una K-base de
K[S2 ][α2 ] es linealmente independiente sobre K. Esto significa que los dominios
K[Si ][αi ] son linealmente disjuntos, y por el teorema 1.12 también lo son sus
cuerpos de cocientes, es decir, L1 y L2 .
Ahora ya podemos demostrar el resultado básico:

Teorema 1.15 Sea K un subcuerpo de C y sea V /K una variedad proyectiva.


Entonces el conjunto algebraico V /C definido por las mismas ecuaciones que
V /K es una variedad proyectiva.

Demostración: No perdemos generalidad si suponemos que K es alge-


braicamente cerrado. También es claro que basta probar el teorema para una
variedad afı́n. Sea S2 una base de trascendencia de K(V ) formado por fun-
ciones coordenadas. Consideremos una extensión K(V )(S1 ), donde S1 es un
conjunto de indeterminadas de cardinal igual al grado de trascendencia de la
extensión C/K. Es claro entonces que S = S1 ∪ S2 es una base de trascendencia
de K(V )(S1 ) sobre K. Si en una clausura algebraica de este cuerpo tomamos
la clausura algebraica de K(S1 ), obtenemos un cuerpo algebraicamente cerrado
cuyo grado de trascendencia sobre K es el mismo que el de C. Obviamente es
K-isomorfo a C, luego podemos identificarlo con C. Esto nos permite considerar
a C y a K[V ] como subdominios de un mismo cuerpo.
1.4. Variedades complejas 17

Se cumple que C y K[V ] son linealmente disjuntos, pues si tomamos con-


juntos finitos linealmente independientes en uno y en otro, podemos formar dos
cuerpos L1 y L2 que los contengan y que estén en las condiciones del teorema
anterior. Por consiguiente, el epimorfismo natural C ⊗K K[V ] −→ CK[V ] es un
isomorfismo de K-espacios vectoriales.
Esto implica que si transportamos a C ⊗K K[V ] el producto de CK[V ], esto
es, si definimos (α ⊗ f )(β ⊗ g) = (αβ) ⊗ (f g), la definición es consistente y
tenemos un dominio ı́ntegro.
Consideremos ahora la sucesión exacta
0 −→ I(V ) −→ K[X1 , . . . , Xn ] −→ K[V ] −→ 0.
El producto tensorial es exacto sobre sucesiones de módulos libres, luego
tenemos la sucesión exacta
0 −→ C ⊗K I(V ) −→ C ⊗K K[X1 , . . . , Xn ] −→ C ⊗K K[V ] −→ 0.
Pero tenemos un isomorfismo natural C ⊗K K[X1 , . . . , Xn ] ∼= C[X1 , . . . , Xn ],
a través del cual C ⊗K I(V ) se corresponde con el ideal P generado por I(V )
en C[X1 , . . . , Xn ]. Esto nos da el diagrama conmutativo siguiente:

0  C ⊗K I(V )  C ⊗K K[X1 , . . . , Xn ]  C ⊗K K[V ] 0

  
0 P  C[X1 , . . . , Xn ]  C[V ] 0

Aquı́ C[V ] es el anillo de funciones regulares del conjunto algebraico definido


por P , es decir, por las mismas ecuaciones que V . Lo que queremos probar es
que P es un ideal primo o, lo que es lo mismo, que C[V ] es un dominio ı́ntegro.
Pero tenemos que, como espacio vectorial, C[V ] es isomorfo a C ⊗K K[V ] y si
transportamos la estructura de anillo al producto tensorial, obtenemos el mismo
producto que hemos considerado antes, y sabemos que con él es un dominio
ı́ntegro.

Nota En la prueba del teorema anterior hemos visto que C[V ] ∼ = C ⊗K K[V ],
luego los dominios C y K[V ] son linealmente disjuntos, luego también lo son
los cuerpos C y K(V ), luego C(V ) ∼
= C ⊗K K(V ). Ası́ pues, el cuerpo K(V )
determina el cuerpo C(V ).
En las condiciones del teorema anterior, cada función de K[V ] se extiende
a una función de C[V ], lo que nos permite considerar K[V ] ⊂ C[V ], ası́ como
K(V ) ⊂ C(V ). Notemos que los cuerpos K(V ) y C(V ) están ambos generados
por un mismo sistema de funciones coordenadas afines. Si un subconjunto de
ellas es algebraicamente dependiente sobre K, también lo es sobre C, luego
tenemos que dim V /C ≤ dim V /K. Por otra parte, si dim V /K = n, existe una
sucesión de subvariedades cerradas (sobre K):
V0  V1  · · ·  Vn = V,
18 Capı́tulo 1. Preliminares de geometrı́a algebraica

que se extienden a otras tantas variedades complejas que mantienen las inclu-
siones no estrictas, luego dim V /C ≥ n. Ası́ pues, al extender una variedad
obtenemos otra variedad de la misma dimensión.
También es claro que si V /K es regular, lo mismo le sucede a V /C, pues
un punto singular (para cualquiera de las dos variedades) es solución de un
sistema de ecuaciones polinómicas con coeficientes en K. Si el sistema no tiene
solución en K n , el teorema de los ceros de Hilbert implica que el polinomio 1
es combinación lineal de los polinomios que definen el sistema, luego tampoco
puede haber solución en Cn .

Teorema 1.16 Si K es un subcuerpo de C algebraicamente cerrado y V /K es


una variedad proyectiva, entonces V (K) es denso en V (C) para la topologı́a de
Zariski.

Demostración: Lo probaremos por inducción sobre la dimensión de V .


Para dimensión 1 basta observar que los abiertos (no vacı́os) de V (C) son cofi-
nitos, mientras que V (K) es infinito.
Supuesto cierto para variedades de dimensión n, supongamos que V tiene
dimensión n + 1. Sea U un abierto no vacı́o en V (C). Reduciéndolo podemos
suponer que no contiene puntos singulares. Tomemos una función coordenada x
que no sea constante en V . Entonces x es una función holomorfa no constante,
luego es abierta para la topologı́a compleja. Podemos tomar un abierto conexo
no vacı́o G ⊂ U (abierto para la topologı́a compleja) tal que x[G] es abierto en
C. Como K contiene a la clausura algebraica de Q y ésta es densa en C, vemos
que existe un punto P ∈ U tal que x(P ) = α ∈ K.
Si añadimos a V la ecuación x = α obtenemos una subvariedad W de menor
dimensión, que se extiende a una subvariedad de V /C que contiene al punto P .
Por hipótesis de inducción, el abierto W ∩ U (que no es vacı́o porque contiene
a P ) contiene un punto de W (K), luego U contiene un punto de V (K).
Consideremos ahora una aplicación racional φ : V −→ W entre variedades
definidas sobre K. En un abierto de V , φ viene definida por formas del mismo
grado:

φ([X1 , . . . , Xm+1 ]) = [F1 (X1 , . . . , Xm+1 ), . . . , Fn+1 (X1 , . . . , Xm+1 )].

Si F ∈ I(W ), entonces F (F1 , . . . , Fn+1 ) se anula en V (K), luego está en


I(V ), luego se anula en todos los puntos de V /C. Esto se traduce en que
F1 , . . . , Fn+1 definen una aplicación racional entre las variedades extendidas que
extiende a φ. Teniendo en cuenta que V (K) (donde K es la clausura algebraica
de K) es denso en V (C), es fácil ver que la extensión es única.

Teorema 1.17 Sea V /K una variedad proyectiva definida sobre un subcuerpo


K ⊂ C. Entonces K(V ) es el subcuerpo de C(V ) fijado por todos los K-
automorfismos de C.

Demostración: Si representamos por G(C/K) al grupo de K-automor-


fismos de C (aunque la extensión C/K no sea necesariamente algebraica), es
1.5. Curvas proyectivas 19

claro que G(C/K) actúa sobre el cuerpo C(V ) del modo usual, y ciertamente
todos los automorfismos de G(C/K), extendidos a C(V ), fijan a K(V ). Tome-
mos ahora α ∈ C(V ) \ K(V ) y vamos a construir un automorfismo que no lo
fije. Supongamos en primer lugar que α es algebraico sobre K(V ) y sea α un
conjugado de α en una clausura algebraica C(V ) de C(V ). Consideremos el
K(V )-isomorfismo σ : K(V )(α) −→ K(V )(α ) que cumple σ(α) = α .
Sea S una base de trascendencia de C(V ) sobre K(V )(α). Se cumple que S
es también algebraicamente independiente sobre K(V )(α ), pues si tuviéramos
una ecuación polinómica F (s1 , . . . , sr ) = 0, con F ∈ K(V )(α )[X1 , . . . , Xr ] y
si ∈ S, entonces el producto

F σ (X1 , . . . , Xr ),
σ

donde σ recorre los automorfismos de la clausura normal de K(V )(α) sobre


K(V ), es un polinomio no nulo con coeficientes en K(V ) y anula a s1 , . . . , sr ,
luego S serı́a algebraicamente dependiente sobre K(V ) y también sobre K(V )(α).
Es claro entonces que σ se extiende a un K(V )(S)-isomorfismo

σ : K(V )(α)(S) −→ K(V )(α )(S).

Como La extensión C(V )/K(V )(α)(S) es algebraica, σ se extiende a su vez


a un K(V )-monomorfismo σ : C(V ) −→ C(V ). Ahora bien, C(V ) = CK(V )
y, como C es algebraicamente cerrado y la extensión C/(C ∩ K(V )(S)) es alge-
braica, ha de ser σ[C] = C, luego σ : C(V ) −→ C(V ) es la (única) extensión del
K-automorfismo σ|C , y cumple ασ = α .
Si α es trascendente sobre K(V ) repetimos el razonamiento anterior par-
tiendo del K(V )-automorfismo σ : K(V )(α) −→ K(V )(α) dado por σ(α) = −α.

Si V /K y W/K son dos variedades proyectivas y φ : V −→ W es una


aplicación racional entre las variedades complejas correspondientes, es claro que
φ es la extensión de una aplicación racional definida sobre K, si y sólo si lo son
las composiciones de φ con las funciones coordenadas de W , lo que nos permite
aplicar el teorema anterior para concluir que esto sucede si y sólo si φσ = φ para
todo σ ∈ G(C/K).
Como consecuencia, si K es algebraicamente cerrado, una aplicación regular
φ; V −→ W está definida sobre K si y sólo si φ[V (K)] ⊂ W (K). En efecto,
en tal caso, para todo σ ∈ G(C/K) tenemos que φσ (P ) = φ(P ) para todo
P ∈ V (K), luego φσ y φ coinciden en un conjunto denso, luego son iguales.

1.5 Curvas proyectivas


En general, si V es una variedad definida sobre k, tenemos que k(V ) es una
extensión algebraica de k(V ), por lo que ambos cuerpos tienen el mismo grado
de trascendencia sobre sus respectivos cuerpos de constantes k y k. A dicho
20 Capı́tulo 1. Preliminares de geometrı́a algebraica

grado de trascendencia se le llama dimensión de la variedad V . Las curvas son


las variedades (cuasiproyectivas) de dimensión 1.
A partir de aquı́ usaremos los siguientes convenios de notación:

– Como hasta ahora, k será un cuerpo perfecto y k su clausura algebraica.

– C/k indicará que C es una curva proyectiva definida sobre k.

– Como hasta ahora, k(C) será el cuerpo de las funciones racionales de C y


k(C) será el subcuerpo formado por las funciones definidas sobre k.

– Por el contrario, OP (C) representará siempre el anillo de las funciones de


k(C) (no de k(C)) regulares en el punto P ∈ C.

– Si P es un punto de una curva C, llamaremos

mP (C) = {α ∈ OP (C) | α(P ) = 0},

que es el único ideal maximal del anillo OP (C).

– Como hasta ahora, C(k) representará el conjunto (tal vez vacı́o) de los
puntos racionales de C.

Los cuerpos k(C) y k(C) son cuerpos de funciones algebraicas (de una va-
riable) con cuerpo de constantes exacto k y k respectivamente. Además k(C)
es una extensión de constantes de k(C).
Representaremos por D(C) el grupo de los divisores de k(C) (a los que nos
referiremos también como divisores de C), por H(C) el grupo de clases de k(C)
y por H0 (C) el grupo de clases de grado 0 de k(C).
Recordemos que una curva C es regular en un punto P ∈ C si el ideal
mP (C) es principal, en cuyo caso OP (C) resulta ser un dominio de ideales prin-
cipales con mP (C) como único ideal primo, el cual determina una valoración
vP : k(C) −→ Z ∪ {+∞} que tiene a OP (C) como anillo de enteros. Los gene-
radores de mP (C) (es decir, las funciones α ∈ OP (C) tales que vP (α) = 1) se
llaman parámetros locales de C en P .
Si C es una curva proyectiva, para cada valoración v en k(C) existe un único
punto P ∈ C tal que v(f ) ≥ 0 para toda f ∈ OP (C) y v(f ) > 0 si f ∈ mP (C).
Si P es un punto regular, la única valoración de k(V ) situada sobre P en este
sentido es vP . En particular, si C es una curva proyectiva regular, la aplicación
P → vP biyecta los puntos de C con las valoraciones de k(C) o, lo que es lo
mismo, con los divisores primos de k(C). La acción natural del grupo G(k/k)
en C se corresponde a través de esta biyección con la acción natural sobre los
divisores primos.
Observemos que si C/k es una curva proyectiva regular y p es un divisor
primo de k(C), entonces p factoriza en k(C) como p = P1 · · · Pr (pues las
extensiones de constantes son no ramificadas). Además los primos Pi forman
una clase de conjugación respecto al grupo de Galois G(k/k). Ası́ pues, los
1.5. Curvas proyectivas 21

divisores primos de k(C) se corresponden con las clases de conjugación de puntos


de C. A cada divisor primo le corresponden tantos puntos conjugados como
indica su grado. En particular, los divisores primos de grado 1 en k(C) se
corresponden con los puntos de V invariantes por G(k/k), es decir, con los
puntos racionales de C.

El ejemplo de Selmer Como aplicación de esta última observación vamos a


probar la mitad de lo anunciado en la introducción sobre el ejemplo de Selmer,
a saber, que la curva
3U 3 + 4V 3 + 5W 3 = 0
tiene puntos racionales en R y en todos los cuerpos p-ádicos Qp . El caso real es
trivial. Para encontrar soluciones p-ádicas usaremos el criterio siguiente:3

Sea p un número primo, F ∈ Z[X1 , . . . , Xn ] y c ∈ Zn un punto


tal que vp (F (c)) > 2vp (Fi (c)) para cierto i (donde Fi representa la
derivada respecto a Xi ). Entonces existe un punto α ∈ Qnp tal que
F (α) = 0 y además αj ≡ cj (mód p), para j = 1, . . . , n.

Para p = 2 aplicamos el criterio al punto (1, 0, 1) con i = 1.


Para p = 3 consideramos (0, 2, −1) con i = 2.
Para p = 5 consideramos (2, −1, 0) con i = 1.
Para p > 5 llamamos C a la curva definida por la ecuación de Selmer sobre el
cuerpo k = Z/pZ y consideramos el cuerpo de funciones racionales k(C). Sucede
que4 k(C) tiene al menos un divisor primo de grado 1. Éste se corresponde
con un punto racional de C, es decir, con una terna (x1 , x2 , x3 ) ∈ Z3 tal que
3x31 + 4x32 + 5x33 ≡ 0 (mód p) y xi ≡ 0 (mód p) para algún i. Basta aplicar el
criterio a este punto y a este ı́ndice i.
Una propiedad fundamental afirma que una aplicación racional entre curvas
proyectivas es regular sobre los puntos regulares. En particular, si φ : C1 −→ C2
es una aplicación regular entre curvas proyectivas regulares, entonces φ[C1 ] ha
de ser un subconjunto algebraico de C2 (las imágenes de las variedades proyec-
tivas son cerradas), y las únicas posibilidades son que sea finito (en cuyo caso
sólo puede constar de un punto, por la irreducibilidad de C1 ) o que sea toda
C2 . Ası́ pues, toda aplicación regular entre curvas es constante o suprayectiva.
En particular “densa” equivale a “suprayectiva” o a “no constante”, luego el
teorema 1.10 nos da que las aplicaciones no constantes φ : C1 −→ C2 entre
curvas proyectivas regulares definidas sobre k se corresponden biunı́vocamente
con los k-monomorfismos φ : k(C2 ) −→ k(C1 ) entre sus cuerpos de funciones
racionales.
Es fácil ver que todo cuerpo de funciones algebraicas sobre un cuerpo de
constantes exacto k es k-isomorfo al cuerpo de funciones racionales de una curva
proyectiva C/k. Vamos a demostrar que la curva puede tomarse regular.
3 Es un caso particular del teorema 7.17 de mi Teorı́a de Números.
4 Teorema 9.29 de mi Geometrı́a Algebraica. (Ver también las observaciones tras la defi-
nición 9.9.)
22 Capı́tulo 1. Preliminares de geometrı́a algebraica

Teorema 1.18 Sea K un cuerpo de funciones algebraicas sobre un cuerpo de


constantes exacto k. Entonces K es k-isomorfo al cuerpo de funciones raciona-
les de una curva proyectiva regular C/k.

Demostración: Consideremos la extensión de constantes K = kK, que


es un cuerpo de funciones algebraicas sobre el cuerpo de constantes exacto k.
Podemos tomar x1 ∈ K no constante tal que la extensión K/k(x1 ) sea separable.
Si K tiene caracterı́stica 0 sirve cualquier elemento no constante, mientras que
si K tiene caracterı́stica prima p, basta exigir además que x1 ∈ / K p . Notamos
esto para observar que x2 = 1/x1 cumple lo mismo. Por el teorema del elemento
primitivo, podemos tomar y1 , y2 ∈ K tales que K = k(x1 , y1 ) = k(x2 , y2 ). De
aquı́ se sigue a su vez que K = k(x1 , y1 ) = k(x2 , y2 ). Para i = 1, 2, sea Bi la
clausura entera de k[xi ] en K y sea B i la clausura entera de k[xi ] en K.
La razón de hacerlo todo por duplicado es que si P es un divisor primo de
K entonces vP (xi ) ≥ 0 para i = 1 o bien i = 2, luego k[xi ] ⊂ OP (K), donde
OP (K) representa el anillo de enteros de la valoración vP , que es ı́ntegramente
cerrado en K (porque tiene factorización única), luego Bi ⊂ B i ⊂ OP (K).
Por simplicidad suprimiremos temporalmente el subı́ndice i. Vamos a usar
que, en general, si D es un dominio ı́ntegro noetheriano ı́ntegramente cerrado
y L es una extensión finita separable de su cuerpo de cocientes, entonces la
clausura entera de D en L es un D-módulo finitamente generado.5 Aplicando
esto a D = k[x] y L = K obtenemos que B es un k[x]-módulo finitamente
generado. En particular B = k[x1 , . . . , xn ].
Por otra parte, B es la clausura entera de B en K. En efecto, todo elemento
de B es entero sobre k[x] y, a su vez, x y los elementos de k son enteros sobre
k[x], luego sobre B.
La prueba del resultado que hemos citado puede refinarse en estas condicio-
nes para demostrar que B = k[x1 , . . . , xn ]. En efecto, tomemos f ∈ B. Existe
una extensión finita l de k tal que f ∈ lK. Tomemos una k-base w1 , . . . , wr de
l, que será también una K-base de lK. Por lo tanto

r
f= gj wj ,
j=1

para ciertos gj ∈ K. Basta probar que en realidad gj ∈ B. Ahora bien,


consideremos la base dual z1 , . . . , xr ∈ l de z1 , . . . , zr , esto es, la base que cumple
Tr(zi wj ) = δij , donde Tr es la traza de la extensión lK/K (que sobre constantes
coincide con la de l/k). Basta observar que gi = Tr(zi f ) es entero sobre B, luego
gi ∈ B.
Consideremos ahora el epimorfismo k[X1 , . . . , Xn ] −→ B dado por Xi → xi ,
cuyo núcleo determina una variedad afı́n C/k. Claramente k[C] ∼ = B, luego
k(C) ∼ = K. Además k(C) ∼
= K (lo que implica que C es una curva) y como
k[C] ∼= B es ı́ntegramente cerrado en k(C), tenemos que C es regular (como
curva afı́n, si bien su clausura proyectiva puede tener singularidades en el infi-
nito).
5 Teorema 1.19 de mi geometrı́a algebraica.
1.5. Curvas proyectivas 23

Ahora volvemos a introducir el ı́ndice i, de modo que en realidad tenemos


dos curvas regulares afines C1 /k y C2 /k, con la propiedad de que si P es un
divisor primo de K entonces existe un i tal que k[Ci ] ⊂ OP (K), luego P ∩ k[Ci ]
es un ideal maximal en k[Ci ] que se corresponde con un punto (regular) P de
Ci , en el sentido de que P ∩ k[Ci ] está formado por las funciones de k[Ci ] que
se anulan en P . La regularidad implica que vP = vP .
Con más rigor, tenemos dos k-isomorfismos φi : k(Ci ) −→ K, que se extien-
den a k-isomorfismos φi : k(Ci ) −→ K, de modo que cada divisor primo de K
se corresponde a través de uno de estos dos isomorfismos con un punto (regular)
de una de las curvas Ci .
Si llamamos C i a la clausura proyectiva de la curva Ci , la composición
φ2 ◦ φ−11 induce una aplicación birracional φ : C 1 −→ C 2 definida sobre k, de
modo que φ = φ2 ◦ φ−1 1 .
Esto se traduce en que si P es un divisor primo de k(C 1 ), entonces, o bien
está situado sobre un punto de C1 , o bien φ(P) está situado sobre un punto de
C2 . Notemos además que φ es regular sobre C1 (porque sus puntos son regula-
res). Todo esto es cierto por simetrı́a si cambiamos los ı́ndices y consideramos
φ−1 en lugar de φ.
Consideramos ahora la superficie V = C 1 × C 2 , junto con las aplicaciones
ψi : Ci −→ V dadas por ψ1 (P ) = (P, φ(P )), ψ2 (P ) = (φ−1 (P ), P ). Definimos
C = ψ1 [C1 ] ∪ ψ2 [C2 ]. Vamos a probar que C es una curva proyectiva regular
definida sobre k tal que k(C) ∼ = K.
En primer lugar observamos que si U ⊂ C1 es el abierto donde φ se restringe
a un isomorfismo, entonces X = {(P, φ(P )) | P ∈ U } es una curva contenida
en ψ1 (C1 ) isomorfa a U . Además ψ1 [C1 ] ⊂ X. En efecto, si Q ∈ C1 y W es
un abierto en V tal que ψ1 (Q) ∈ W , hemos de probar que W ∩ X = ∅. Como
ψ1−1 [W ] y U son abiertos (no vacı́os) en C1 , se cumple que ψ1−1 [W ] ∩ U = ∅ y,
por lo tanto, W ∩ X = ∅.
Como X \ X es finito, lo mismo le sucede a X \ ψ1 [C1 ], luego ψ1 [C1 ] es
una curva cuasiproyectiva isomorfa a C1 (el isomorfismo es ψ, cuya inversa es
la proyección en la primera componente). En particular ψ1 [C1 ] es regular, y el
mismo razonamiento se aplica a ψ2 [C2 ]. Más aún, el conjunto X es el mismo
en ambos casos, por lo que C ⊂ X es una curva cuasiproyectiva cubierta por
los dos abiertos regulares ψi [Ci ]. Como la regularidad es una propiedad local
concluimos que C es regular.
El hecho de que las curvas Ci estén definidas sobre k, al igual que φ, implican
inmediatamente que C es invariante por G(k/k), luego C está definida sobre k.
Como las aplicaciones ψi son birracionales (y están definidas sobre k), tenemos
que k(C) ∼ = k(Ci ) ∼
= K. Falta probar que C es proyectiva.
Tomemos un punto P ∈ C y sea P un divisor primo de k(C) situado sobre
P . La relación ψ1 = φ ◦ ψ2 se traduce en la relación ψ 1 = ψ 2 ◦ φ entre los
k-isomorfismos inducidos. La construcción de φ implica que ψ i (P) está situado
sobre un punto Q ∈ Ci , para algún ı́ndice i, pero entonces P = ψi (Q) ∈ C.
Ası́ pues, tenemos una correspondencia biunı́voca entre las clases de k-
isomorfı́a de cuerpos de funciones algebraicas sobre un cuerpo de constantes
24 Capı́tulo 1. Preliminares de geometrı́a algebraica

exacto k y las clases de k-isomorfı́a de curvas proyectivas regulares definidas


sobre k.

Nota Supongamos que C es una curva compleja definida sobre Q. Entonces C


es birracionalmente equivalente a una curva compleja regular definida sobre Q.
Esto no es una consecuencia directa del teorema anterior, pues la extensión C/Q
no es algebraica. Ahora bien, si A es la clausura algebraica de Q, el teorema
anterior nos da que A(C) ∼= A(C  ), donde C  /Q es una curva proyectiva regular.
Dicha curva se extiende a una curva proyectiva regular C  /C, y es claro entonces
que C(C) ∼ = C(C  ).
Volviendo al estudio de las aplicaciones regulares, si φ : C1 −→ C2 es una
aplicación regular no constante entre curvas proyectivas regulares definidas sobre
k, el k-monomorfismo φ : k(C2 ) −→ k(C1 ) nos permite considerar a k(C1 ) como
extensión de k(C2 ). Puesto que ambos cuerpos tienen grado de trascendencia 1
sobre k, la extensión es algebraica y, como k(C1 ) es finitamente generado sobre
k —luego también sobre k(C2 )—, la extensión es finita.
Definimos el grado de φ como grad φ = |k(C1 ) : k(C2 )| = |k(C1 ) : k(C2 )|, con
el convenio de que el grado de una aplicación constante es 0. En general, diremos
que una aplicación (no constante) definida sobre k es separable, puramente
inseparable, etc. según lo sea o no la extensión k(C1 )/k(C2 ) que determina.
Teniendo en cuenta que las aplicaciones racionales son regulares en los puntos
regulares es fácil ver que las aplicaciones regulares de grado 1 entre curvas
proyectivas regulares son los isomorfismos.
Si φ : C1 −→ C2 es una aplicación regular no constante entre curvas pro-
yectivas regulares y P ∈ C1 , entonces φ(P ) se corresponde con el único divisor
primo de k(C2 ) divisible entre P . Representaremos por eφ (P ) el ı́ndice de ra-
mificación de P sobre φ(P ), de modo que si P1 , . . . , Pr son las antiimágenes de
un mismo punto Q ∈ C2 se cumple la relación

eφ (P1 ) + · · · + eφ (Pr ) = grad φ.

Si φ es separable, el número de puntos ramificados es finito. En tal caso,


fórmula del género de Hurwitz afirma que si g1 y g2 son los géneros de E1 y E2 ,
entonces

2g1 − 2 ≥ (2g2 − 2) grad φ + (eφ (P ) − 1),
P ∈C1

y la igualdad se da si y sólo si la caracterı́stica de k es 0 o bien es prima y no


divide a ningún ı́ndice eφ (P ).
La aplicación φ se extiende por linealidad a un homomorfismo de grupos
φ : D(C1 ) −→ D(C2 ). Es claro que φ(a) no es sino la norma de a en D(C2 ).
También tenemos la norma Nφ : k(C1 ) −→ k(C2 ). La compatibilidad entre
ambas normas nos da que φ((f )) = (Nφ (f )), para toda función f ∈ k(C1 ),
luego φ transforma divisores principales en divisores principales y por lo tanto
induce un homomorfismo φ : H(C1 ) −→ H(C2 ) entre los grupos de clases.
1.5. Curvas proyectivas 25

Por otra parte, el k-monomorfismo φ : k(C2 ) −→ k(C1 ) induce un mono-


morfismo φ : D(C2 ) −→ D(C1 ), determinado por

φ(Q) = P eφ (P ) .
P ∈φ−1 [Q]

Si f ∈ k(C2 ) tenemos que φ((f )) = (φ(f )), luego φ transforma divisores


principales en divisores principales, por lo que induce un homomorfismo de
grupos φ : H(C2 ) −→ H(C1 ).
Las propiedades siguientes son meras transcripciones de propiedades de las
extensiones de cuerpos de funciones algebraicas:

a) grad φ(a) = (grad φ)(grad a), para todo a ∈ D(C2 ).

b) grad φ(a) = grad a, para todo a ∈ D(C1 ).

En particular vemos que φ induce homomorfismos entre los grupos de clases


de grado 0:

φ : H0 (C1 ) −→ H0 (C2 ) y φ : H0 (C2 ) −→ H0 (C1 ).

Representaremos por Ω(Ci ) el espacio de las diferenciales de k(Ci ). Tenemos


que φ induce un k-monomorfismo de espacios vectoriales φ : Ω(C2 ) −→ Ω(C1 )
dado por
φ(f dx) = φ(f ) dφ(x).
Dado x ∈ k(C), se cumple que dx = 0 si y sólo si x es separador, es decir,
si y sólo si la extensión k(C)/k(x) es (finita) separable (se puede probar que
siempre existen elementos separadores). En particular, si car k = 0, las únicas
funciones con diferencial nula son las constantes. De aquı́ se deduce un criterio
de separabilidad:

Teorema 1.19 Una aplicación regular no constante φ : C1 −→ C2 entre dos


curvas proyectivas regulares es separable si y sólo si φ : Ω(C2 ) −→ Ω(C1 ) es
inyectiva, si y sólo si φ es no nula.

Demostración: Si ω = f dx ∈ Ω(C2 ) cumple ω = 0, entonces f = 0


y dx = 0, luego k(C2 )/k(x) es separable, al igual que la extensión isomorfa
φ[k(C2 )]/k(φ(x)). Por otra parte φ(f ) = 0.
Ası́ pues, φ(ω) = φ(f ) d(φ(x)) = 0 si y sólo si d(φ(x)) = 0, si y sólo si
k(C1 )/k(φ(y)) es separable, si y sólo si k(C1 )/φ[k(C2 )] es separable, si y sólo si
φ es separable.
Cada forma diferencial ω ∈ Ω(C) tiene asociado un divisor (ω) ∈ D(C)
determinado por que  
dx
vP (f dx) = vP f ,
dt
donde t es un parámetro local en P . Es claro que (φ(ω)) = φ((ω)).
26 Capı́tulo 1. Preliminares de geometrı́a algebraica

El teorema de Riemann-Roch En el capı́tulo siguiente necesitaremos el


teorema de Riemann-Roch en una única ocasión, pero será un uso crucial (en la
prueba de que toda curva elı́ptica admite una ecuación de Weierstrass), ası́ que
vamos a recordar su enunciado.
Si K es un cuerpo de funciones algebraicas sobre el cuerpo de constantes
exacto k y a es un divisor de K, se define el espacio de múltiplos de a como el
conjunto

m(a) = {f ∈ K | vp (f ) ≥ vp (a) para todo divisor primo p de K}.

Se prueba que m(a) es un k-espacio vectorial de dimensión finita. Teniendo


en cuenta que los divisores principales tienen grado 0, vemos que si f ∈ m(a) es
una función no nula, entonces
 
0 = grad(f ) = vp (f ) grad p ≥ vp (a) grad p = grad a,
p p

luego si grad a > 0 entonces dim m(a) = 0.


Adoptaremos el convenio usual de definir dim a = dim m(a−1 ). De este
modo, los divisores de grado < 0 tienen dimensión nula. Es fácil ver que la
dimensión depende únicamente de la clase de similitud de a, por lo que podemos
hablar de la dimensión de una clase de divisores de K.
Se prueba que si K tiene género g, entonces contiene una única clase de
divisores W , llamada clase canónica de K, caracterizada por que

dim W = g, grad W = 2g − 2.

El teorema de Riemann-Roch afirma que para toda clase de ideales A de K


se cumple la relación

dim A = grad A − (g − 1) + dim(W/A).

Por ejemplo, si K tiene género g = 1 (que es el único caso que nos va a


interesar), tenemos que la clase canónica tiene grado 0, luego si grad A > 0 se
cumple grad(W/A) < 0 y dim(W/A) = 0, con lo que el teorema de Riemann-
Roch se reduce a la igualdad dim A = grad A.
Aprovechamos la ocasión para demostrar un resultado que hemos citado en
la introducción, aunque no nos va a hacer falta en ningún momento:

Teorema 1.20 Toda curva proyectiva C/k de género 0 es birracionalmente


equivalente (sobre k) a una cónica definida sobre k.

Demostración: Tenemos que k(C) es un cuerpo de funciones algebraicas


de género g = 0. En este caso la clase canónica cumple grad W = −2, luego
si grad A ≥ 0 entonces grad W/A < 0 y dim W/A = 0, luego el teorema de
Riemann-Roch se reduce a la relación

dim A = grad A + 1.
1.5. Curvas proyectivas 27

Si k(C) tiene un divisor de grado 1 podemos tomarlo entero (pues toda clase
de divisores de grado ≥ 0 contiene un divisor entero), luego primo, digamos
p. Por el teorema de Riemann-Roch dim p = 2, luego existe una función no
constante x ∈ m(p−1 ).
Entonces p ha de ser el denominador de (x) tanto en k(C) como en k(x) y
tiene grado 1 en ambos cuerpos, luego |k(C) : k(x)| = 1, es decir, k(C) = k(x).
De aquı́ se sigue que C es birracionalmente equivalente (sobre k) a la recta
proyectiva, que a su vez es k-isomorfa, por ejemplo, a la cónica X 2 + Y 2 = 1.
Si, por el contrario, k(C) no tiene divisores primos de grado 1, al menos
tiene que haber uno p de grado 2 (basta tomar un divisor entero de W −1 ). En-
tonces tenemos que dim p = 3, luego podemos tomar tres funciones linealmente
independientes 1, x, y ∈ m(p−1 ).
Ahora (x) = q/p, para cierto divisor primo q de grado 2. Como p tiene
grado 1 en k(x), concluimos que |k(C) : k(x)| = 2. Además y ∈ / k(x), pues en
caso contrario serı́a una función racional de x con a lo sumo un único polo simple
en el infinito, luego serı́a un polinomio en x de grado ≤ 1, pero esto contradice
la independencia lineal de 1, x, y. De aquı́ deducimos que k(C) = k(x, y).
Por otra parte, 1, x, y, x2 , xy, y 2 ∈ m(p2 ), y este espacio tiene dimensión 5,
luego se cumple una relación
ax2 + bxy + cy 2 + dx + ey + f = 0
con los coeficientes en k no todos nulos. Más aún, alguno de los tres primeros
ha de ser no nulo, por la independencia lineal de 1, x, y. La ecuación ha de ser
irreducible, o llegarı́amos a que y ∈ k(x) o bien a que x ∈ k.
De aquı́ se sigue inmediatamente que k(C) es k-isomorfo al cuerpo de las
funciones racionales (sobre k) de la cónica definida por la ecuación anterior,
luego C es birracionalmente equivalente (sobre k) a dicha cónica.

La aplicación de Frobenius Introducimos ahora una técnica para estudiar


aplicaciones regulares inseparables. En lo que sigue supondremos que k es un
cuerpo (perfecto) de caracterı́stica prima p. Ası́, si m = pr , la correspondencia
a → am define un automorfismo de k que se restringe a un automorfismo de
k. Para cada polinomio F ∈ k[X1 , . . . , Xn ], representaremos por F (m) el po-
linomio que resulta de elevar a m todos los coeficientes de F . Esto define un
automorfismo del anillo de polinomios que se restringe a un automorfismo de
k[X1 , . . . , Xn ].
Si C/k ⊂ Pn es una curva proyectiva, entonces I(C) es un ideal primo de
k[X1 , . . . Xn+1 ] generado por formas de k[X1 , . . . Xn+1 ], luego I(C)(m) cumple
lo mismo y define una curva C (m) ⊂ Pn definida sobre k. La curva C (m) está
determinada por la relación
I(C (m) ) = {F (m) | F ∈ I(C)}.
Ahora definimos la aplicación φ : C −→ C (m) mediante
φ([x1 , . . . , xn+1 ]) = [xm m
1 , . . . , xn+1 ].
28 Capı́tulo 1. Preliminares de geometrı́a algebraica

Esto es correcto, pues si [x1 , . . . , xn+1 ] ∈ C y F ∈ I(C), entonces

F (m) (xm m m
1 , . . . , xn+1 ) = F (x1 , . . . , xn+1 ) = 0.

Obviamente φ es una aplicación regular definida sobre k, conocida como apli-


cación de Frobenius de grado m. A continuación probamos que, efectivamente,
tiene grado m.

Teorema 1.21 Sea C/k una curva proyectiva sobre un cuerpo de caracterı́stica
prima p y sea φ : C −→ C (m) la aplicación de Frobenius de grado m = pr .

a) φ es puramente inseparable y tiene grado m.

b) φ[k(C (m) )] = k(C)m .

c) Si C es regular, entonces C (m) también lo es.

Demostración: b) Fijado un sistema de referencia, toda α ∈ k(C (m) ) es


de la forma α = [F (m) ]/[G(m) ], donde F , G ∈ k[X1 , . . . , Xn+1 ] son formas del
mismo grado. Entonces, para P = [x1 , . . . , xn+1 ] en un abierto adecuado de C,

F (m) (xm m
1 , . . . , xn+1 ) F (x1 , . . . , xn+1 )m
φ(α)(P ) = = = β m (P ),
G(m) (xm m
1 , . . . , xn+1 ) G(x1 , . . . , xn+1 )m

donde β = [F ]/[G] ∈ k(C). Esto prueba la inclusión φ[k(C (m) )] ⊂ k(C)m .


Invirtiendo el razonamiento tenemos la inclusión contraria.
a) Ahora es obvio que φ es puramente inseparable. Falta probar que su
grado es m. Sea t ∈ k(C) tal que la extensión k(C)/k(t) sea separable. Esto
equivale a que t ∈
/ k(C)p . Entonces, la extensión k(C)/k(C)m (t) está contenida
en la extensión separable k(C)/k(t) y en la extensión puramente inseparable
k(C)/k(C)m , luego ha de ser k(C) = k(C)m (t). Por consiguiente,

grad φ = |k(C)m (t) : k(C)m |.

Ahora bien, del hecho de que t ∈


/ k(C)p se sigue que el polinomio mı́nimo de
t sobre k(C)m es xm − tm , luego el grado es m.
c) Supongamos que C ⊂ Pn y que I(C) = (F1 , . . . , Fr ). La regularidad de C
en un punto P equivale a que el espacio tangente TP (C) tenga dimensión 1, lo
cual equivale a que la matriz formada por las derivadas parciales de F1 , . . . , Fr
tenga rango n − 1 en P , lo que a su vez equivale a que cierto menor M de orden
n − 1 no se anule.
La regularidad de C (m) en φ(P ) equivale a que la matriz de las derivadas
(m) (m)
parciales de F1 , . . . , Fr tenga rango n − 1 en φ(P ), pero es claro que
   m
∂Fi  ∂Fi 
(m)
 = ,
∂Xj  ∂Xj P
φ(P )
1.5. Curvas proyectivas 29

(aquı́ usamos que todo natural s cumple s ≡ sm (mód p)), luego el menor co-
rrespondiente a M es M m = 0, luego C (m) es regular en φ(P ) y, como φ es
suprayectiva por el apartado a), concluimos que C (m) es regular.
Es fácil ver que las aplicaciones de Frobenius son biyectivas, pero no son
isomorfismos salvo si m = 1 (en cuyo caso convenimos que C (1) = C y que φ es
la identidad), pues las inversas no son regulares. El interés de la aplicación de
Frobenius se debe al teorema siguiente:

Teorema 1.22 Sea ψ : C1 −→ C2 una aplicación regular no constante entre


curvas regulares definida sobre un cuerpo k de caracterı́stica prima p y sea m =
gradi ψ (el grado de inseparabilidad). Entonces ψ es una composición
φ (m) χ
C1 −→ C1 −→ C2 ,

donde φ es la aplicación de Frobenius de grado m y χ es una aplicación regular


separable definida sobre k.

Demostración: Sea K la clausura separable de ψ[k(C2 )] en k(C1 ). Enton-


ces k(C1 )/K es puramente inseparable de grado m, luego tenemos las inclusiones

ψ[k(C2 )] ⊂ k(C1 )m ⊂ K ⊂ k(C1 ),

pero por el teorema anterior k(C1 )/k(C1 )m también tiene grado m, luego
(m)
K = k(C1 )m = φ[k(C1 )].
(m)
La inclusión ψ[k(C2 )] ⊂ φ[k(C1 )] induce una aplicación racional, luego
(m)
regular (y definida sobre k), χ : C1 −→ C2 tal que χ[k(C2 )] = ψ[k(C2 )]. Es
obvio que χ cumple el teorema.
Comentemos por último que si C es una curva definida sobre un cuerpo finito
k de m elementos, entonces el automorfismo a → am es la identidad en k, luego
C (m) = C y la aplicación de Frobenius es una biyección φ : C −→ C.
Capı́tulo II

La geometrı́a de las curvas


elı́pticas

Empezamos el estudio de las curvas elı́pticas ocupándonos de sus propiedades


relacionadas directamente con la geometrı́a algebraica o, lo que esencialmente es
lo mismo, con la posibilidad de trabajar con un cuerpo de constantes algebrai-
camente cerrado. En capı́tulos posteriores estudiaremos las peculiaridades de
las curvas elı́pticas definibles sobre cuerpos menores. Mantenemos la notación
del capı́tulo anterior. En particular k será un cuerpo perfecto arbitrario y k su
clausura algebraica.

2.1 Ecuaciones de Weierstrass


Una curva elı́ptica sobre un cuerpo k es una curva proyectiva regular de
género 1 que tenga al menos un punto racional. Esta última condición es super-
flua si k es algebraicamente cerrado, pero es crucial en caso contrario. Según
veremos, la existencia de un punto racional nos permite dotar a la curva de
una estructura de grupo definida geométricamente que resulta ser una repre-
sentación del grupo de clases de grado 0 de su cuerpo de funciones racionales.
Por este motivo, en la definición de curva elı́ptica no sólo exigimos que haya
un punto racional, sino que seleccionamos uno para que represente el papel de
elemento neutro. En definitiva, la definición queda como sigue:

Definición 2.1 Una curva elı́ptica sobre un cuerpo k es un par (E, O), donde
E es una curva proyectiva regular de género 1 y O ∈ E(k). Un isomorfismo
entre dos curvas elı́pticas (E, O) y (E  , O ) es un isomorfismo entre E y E  que
haga corresponder O con O .

En la práctica escribiremos E (o E/k) en lugar de (E, O). Si E/k es una


curva elı́ptica, el cuerpo k(E) es un cuerpo de funciones elı́pticas, en el sentido
de que es un cuerpo de funciones algebraicas de género 1 y tiene al menos un
divisor primo de grado 1, a saber, el correspondiente al punto O.

31
32 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Vamos a demostrar que toda curva elı́ptica es isomorfa a una curva elı́ptica
plana. Más aún, a una curva determinada por una ecuación con una forma
particular:

Definición 2.2 Una ecuación de Weierstrass es una ecuación de la forma

Y 2 + a1 XY + a3 Y = X 3 + a2 X 2 + a4 X + a6 . (2.1)

Pronto comprenderemos la razón de los subı́ndices. De momento, como regla


mnemotécnica, podemos pensar que cada coeficiente ai tiene asociado un peso i,
que las indeterminadas X e Y tienen pesos 2 y 3 respectivamente y que el peso
de un monomio es la suma de los pesos de sus factores. Entonces los ı́ndices
están elegidos para que todos los monomios tengan peso 6.
Toda ecuación de Weierstrass define una curva proyectiva plana con un único
punto infinito, O = [0, 1, 0]. En principio dicha curva no tiene por qué ser
elı́ptica, ya que puede tener puntos singulares. Por otra parte, éste es el único
inconveniente posible, ya que es conocido que toda cúbica regular tiene género 1.
Cuando una curva C definida por una ecuación de Weierstrass sea regular, la
consideraremos como curva elı́ptica tomando como punto O el punto infinito.
El hecho de que toda curva elı́ptica admita una ecuación de Weierstrass es
una consecuencia del teorema de Riemann-Roch:

Teorema 2.3 Si E/k es una curva elı́ptica, existen funciones x, y ∈ k(E)


tales que la aplicación φ : E −→ P2 dada por φ(P ) = [x(P ), y(P ), 1] define un
isomorfismo entre E y una curva plana C determinada por una ecuación de
Weierstrass con coeficientes en k y φ(O) = [0, 1, 0]. Dicha ecuación es única
salvo una transformación afı́n de la forma

X = u2 X  + r, Y = u3 Y  + su2 X  + t, u, r, s, t ∈ k, u = 0.

Más aún, cualquier k-isomorfismo entre dos curvas elı́pticas definidas por
ecuaciones de Weierstrass (sobre k) está inducido por una transformación afı́n
de este tipo.

Demostración: Para cuerpos de género 1, el teorema de Riemann-Roch


implica que la dimensión de un divisor de grado > 0 es igual a su grado. En
particular dim On = n, luego podemos encontrar una función x ∈ k(E) tal que
1, x formen una k-base del espacio m(O−2 ). Igualmente, existe y ∈ k(E) tal
que 1, x, y forman una k-base de m(O−3 ).
Notemos que x tiene un polo doble en O, pues de lo contrario estarı́a en
m(O−1 ) y serı́a constante. Ası́, el divisor de x es (x) = a/O2 y O2 es el primo
infinito del cuerpo K = k(x), luego |k(V ) : k(x)| = 2.
/ k(x), ya que en tal caso 1, x, y ∈ mK (O−2 ), mientras
Por otra parte, y ∈
que dimK O = gradK O2 + 1 = 2, ya que K tiene género 0. Por lo tanto
2

k(E) = k(x, y). También es claro que y tiene un polo en O de orden exactamente
igual a 3.
2.1. Ecuaciones de Weierstrass 33

A continuación observamos que 1, x, x2 , x3 , xy, y, y 2 ∈ m(O−6 ), y la


dimensión de este espacio es 6, luego se cumple

A1 + A2 x + A3 y + A4 x2 + A5 xy + A6 y 2 + A7 x3 = 0,

con Ai ∈ k. Los coeficientes A6 y A7 no pueden ser nulos, o de lo contrario


cada sumando tendrı́a un polo de orden distinto en O, lo cual es imposible.
Cambiamos x = −A6 A7 x , y = A6 A27 y  y, tras dividir entre A36 A47 , la ecuación
queda en la forma del enunciado.
La aplicación φ del enunciado es regular salvo quizá en O, pero la expresión

φ(P ) = [(x/y)(P ), 1, (1/y)(P )]

muestra que φ(O) = [0, 1, 0]. Por otra parte, el monomorfismo de cuerpos
φ : k(C) −→ k(E) transforma las funciones coordenadas de C en x, y, luego es
un isomorfismo y φ también lo es.
Supongamos ahora que x, y son funciones arbitrarias que cumplen el enun-
ciado. A través del isomorfismo φ se corresponden con las coordenadas X, e Y
de la parte afı́n de C, luego x e y son regulares en toda la curva E salvo en O,
donde tienen polos de grados 2 y 3. Esto es consecuencia de que |k(E) : k(x)| = 2
y |k(E) : k(y)| = 3, luego el primo infinito de k(x) es O2 y el de k(y) es O3 .
Ası́ pues, si x e y  ∈ k(E) dan lugar a una ecuación similar, tenemos que
{1, x} y {1, x } son bases de m(O−2 ), mientras que {1, x, y}, {1, x , y  } son bases
de m(O−3 ). Por consiguiente,

x = u1 x + r, y = u2 y  + s2 x + t, u1 , u2 , r, s2 , t ∈ k.

Además u1 y u2 no pueden ser nulos. Si sustituimos estas transformaciones


en la ecuación del enunciado, debemos obtener otra ecuación similar, salvo quizá
un factor constante que será a la vez el coeficiente de X 3 y el de Y 2 . Esto nos
da que u31 = u22 . Haciendo u = u2 /u1 y s = s2 /u2 tenemos u1 = u2 , u2 = u3 ,
s2 = su2 , y las transformaciones se convierten en las de enunciado.
Por último, supongamos que un isomorfismo φ : E −→ E  definido sobre
k hace corresponder dos curvas elı́pticas definidas por ecuaciones de Weiers-
trass con coeficientes en k. Entonces φ induce un k-isomorfismo de cuerpos
φ : k(x , y  ) −→ k(x, y), donde x, y, x , y  son las funciones coordenadas de E y
E  respectivamente. Entonces φ(x ), φ(y  ) son funciones de k(E) que satisfacen
una ecuación de Weierstrass sobre k (la misma que x , y  ), luego por la parte
ya probada ambas ecuaciones están relacionadas por un cambio de variables del
tipo indicado.
34 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Ejemplo: La curva de Fermat La curva de Fermat es la curva C dada por


U 3 +V 3 = 1. Recibe este nombre porque su forma homogénea es U 3 +V 3 = W 3 ,
de donde se sigue que el último teorema de Fermat para exponente 3 equivale a
que C(Q) = {(0, 1, 1), (1, 0, 1), (1, −1, 0)}.
Ciertamente tiene género 1, pues no tiene puntos
singulares (las derivadas de la ecuación homogénea no
se anulan en ningún punto de C). Tiene tres puntos
en el infinito, a saber, [1, −ω i , 0], donde ω es una raı́z
cúbica de la unidad. Podemos considerar a C como
curva elı́ptica sobre Q tomando O = [1, −1, 0]. Igual-
mente podrı́amos definir la curva de Fermat de expo-
nente n ≥ 2, pero su género serı́a g = (n − 1)(n − 2)/3, luego sólo obtenemos
una curva elı́ptica cuando n = 3.
Veamos cómo encontrar una ecuación de Weierstrass para C. Más en general,
vamos a considerar la curva C dada por

U 3 + V 3 = aW 3 , a ∈ k∗ .

Suponiendo que k no tiene caracterı́stica 3, vemos que C es también una


curva elı́ptica con O = [1, −1, 0]. Si k contiene una raı́z cúbica
√ de a entonces C
es isomorfa sobre k a la curva de Fermat (basta hacer W  = 3 a W ). En general,
C es isomorfa sobre k a la curva de Fermat, pero no necesariamente sobre k.
Observemos que la recta tangente a C por O es U = −V , luego buscamos
una transformación proyectiva [U, V, W ] → [X, Y, Z] que haga corresponder O
con [0, 1, 0] y la recta U − V = 0 con la recta Z = 0. La última condición queda
garantizada si hacemos Z = U +V , y para que se cumpla la primera basta hacer
X = W . Podemos tomar, por ejemplo,

(X, Y, Z) = (W, V − U, V + U ).

La transformación inversa es (U, V, W ) = (Z − Y, Z + Y, 2X), y es fácil ver


que (tras deshomogeneizar respecto de Z) la ecuación se transforma en

3Y 2 = 4aX 3 − 1.

Para pasar a una ecuación de Weierstrass basta multiplicar por 24 · 32 · a2 y


hacer el cambio X  = 12aX, Y  = 36aY , con lo que obtenemos la ecuación

Y 2 = X 3 − 432a2 .

Si componemos las dos transformaciones que hemos hecho vemos que el


isomorfismo entre las dos curvas viene dado por
36a − Y 36a + Y
U= , V = .
6X 6X
En particular, la curva de Fermat es isomorfa (sobre Q) a la curva dada por
la ecuación Y 2 = X 3 − 432. Sus puntos triviales son (12, ±36) y O.
2.1. Ecuaciones de Weierstrass 35

Ejemplo: Curvas de Selmer Se llaman curvas de Selmer las curvas dadas


por una ecuación homogénea de la forma

aU 3 + bV 3 + cW 3 = 0, abc = 0.

Evidentemente toda curva de Selmer es regular, luego es una curva elı́ptica


sobre cualquier cuerpo sobre el que tenga un punto racional. Sin embargo, la
existencia de puntos racionales en estas curvas no es trivial. En la introducción
hemos anunciado que la curva E/Q dada por

3U 3 + 4V 3 + 5W 3 = 0 (2.2)

cumple E(Q) = ∅, luego no es una curva elı́ptica sobre Q.


Es fácil decidir si una curva de Selmer contiene puntos racionales con alguna
coordenada nula. Por ejemplo, es claro que (2.2) no contiene ninguno. Vamos
a probar que una condición necesaria para que una curva de Selmer pueda
contener un punto racional (u, v, w) con coordenadas no nulas es que la curva
de Selmer
R3 + S 3 + abcT 3 = 0 (2.3)
contenga un punto racional con T = 0. (Trabajamos con k = Q). Sea ρ una
raı́z cúbica primitiva de la unidad y sea σ el automorfismo no trivial de Q(ρ)/Q.
Definimos

λ = au3 + ρbv 3 + ρ2 cw3 , µ = au3 + ρ2 bv 3 + ρcw3 .

De este modo σ(λ) = µ. Teniendo en cuenta que

X 3 + Y 3 = (X + Y )(X + ρY )(X + ρ2 Y ) = (X + Y )(ρ + ρ2 Y )(ρ2 X + ρY ),

obtenemos que λ3 + µ3 = (3au3 )(3bv 3 )(3cv 3 ), lo que a su vez implica que los
puntos
P = (λ, ρµ, ν), P  = (µ, ρ2 λ, ν),
con ν = −3uvw, cumplen la ecuación R3 + S 3 + abcT 3 = 0. Notemos que
P σ = P  y que P = P  . La recta que pasa por P y P  ha de cortar a la cúbica
en un tercer punto (R, S, T ), que será invariante por σ, luego racional. Hemos
de probar que la tercera coordenada de dicho punto es no nula. Si lo fuera, el
punto tendrı́a que ser (1, −1, 0). La ecuación de la recta es
 
 1 −1 0 
 
 λ ρµ ν  = 0,
 
 µ ρ2 λ ν 

que se reduce a λ + ρµ − µ − ρ2 λ = 0, o también

λ − µ + ρ(λ + µ) = 0.

Esto implica λ = µ = 0, lo cual es imposible (lleva a au3 = bv 3 = cw3 y la


ecuación original implica a = 0 o u = 0).
36 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Ası́ pues, si una curva de Selmer tiene un punto racional no trivial (con
coordenadas no nulas), la curva (2.3) tiene un punto racional con T = 0 o,
equivalentemente, la cúbica R3 + S 3 = −abc tiene un punto racional finito.
Ahora bien, esta cúbica es del tipo estudiado en el ejemplo anterior, en virtud
del cual podemos concluir que la curva elı́ptica
Y 2 = X 3 − 432 · a2 b2 c2
tiene un punto racional distinto de O. En particular, para probar que la curva
(2.3) no tiene puntos racionales basta demostrar que la curva
Y 2 = X 3 − 432 · 602
no tiene puntos racionales distintos de O.
Volviendo a la teorı́a general, bajo ciertas hipótesis podemos simplificar aún
más la ecuación que define a una curva elı́ptica. Por ejemplo, si la caracterı́stica
de k es distinta de 2, el cambio Y = Y  − a21 X  − a23 transforma una ecuación
de Weierstrass general en una ecuación de la forma
b 2 2 b4 b6
Y 2 = X3 + X + X+ , (2.4)
4 2 4
donde
b2 = a21 + 4a2 , b4 = 2a4 + a1 a3 , b6 = a23 + 4a6 .
Si además la caracterı́stica de k es distinta de 3 el cambio X = X  + 12
b2
nos
da la ecuación
c4 c6
Y 2 = X3 − X − , (2.5)
48 864
donde c4 = b22 − 24b4 , c6 = −b32 + 36b2 b4 − 216b6 .
Finalmente, con el cambio Y = Y  /2 la ecuación adquiere la forma
Y 2 = 4X 3 − g2 X − g3 , (2.6)
donde g2 = 108c4 y g3 = 216c6 . Esta ecuación no es de Weierstrass a causa
del coeficiente de X 3 , pero es la expresión más conveniente cuando se estudian
analı́ticamente las curvas elı́pticas sobre C. (En realidad son las ecuaciones de
esta forma las que consideró Weierstrass.) Debemos tener presente que una de
las técnicas que vamos a emplear para estudiar curvas elı́pticas definidas sobre
cuerpos como Q será reducir los coeficientes módulo diferentes primos p, incluso
p = 2 o p = 3, por lo que no podemos dejar de estudiar las curvas elı́pticas
sobre cuerpos de caracterı́stica 2 y 3. En la práctica, esto sólo nos supondrá
unos pocos cálculos molestos adicionales en unas pocas ocasiones (la mayorı́a
en este capı́tulo).
Definición 2.4 A las ecuaciones de Weierstrass generales (2.1) las llamaremos
ecuaciones de tipo a, a las de la forma (2.4) las llamaremos ecuaciones de tipo b,
a las de la forma (2.5) las llamaremos ecuaciones de tipo c y a las de la forma
(2.6) las llamaremos ecuaciones de Weierstrass clásicas (que no son ecuaciones
de Weierstrass según nuestra definición y no las consideraremos como tales salvo
que lo indiquemos explı́citamente).
2.1. Ecuaciones de Weierstrass 37

En estos términos, hemos probado que toda curva elı́ptica sobre un cuerpo
de caracterı́stica > 2 admite una ecuación de Weierstrass de tipo b (es decir,
con a1 = a3 = 0), y si la caracterı́stica es > 3 admite una ecuación de tipo c
(con a2 = 0). En la definición siguiente recogemos las cantidades que nos han
ido apareciendo hasta ahora junto con algunas más:

Definición 2.5 Para cada ecuación de Weierstrass (2.1) definimos:

b2 = a21 + 4a2 , c4 = b22 − 24b4 ,


b4 = 2a4 + a1 a3 , c6 = −b32 + 36b2 b4 − 216b6 ,
b6 2
= a3 + 4a6 , ∆ = −b22 b8 − 8b34 − 27b26 + 9b2 b4 b6 ,
b8 = a1 a6 + 4a2 a6 − a1 a3 a4 + a2 a3 − a4 , j = c34 /∆.
2 2 2

Alternativamente (en caracterı́stica = 2, 3): ∆ = (c34 − c26 )/123 .

Observaciones Según hemos visto, las cantidades b2 , b4 y b6 son (salvo unos


denominadores 4 y 2) los coeficientes de la ecuación de tipo b en que se puede
transformar la ecuación dada si la caracterı́stica del cuerpo es > 2. Sin embargo,
hemos de tener presente que están definidas incluso en caracterı́stica 2. (Los
denominadores 4 y 2 no se incluyen en la definición de los bi para que esto sea
cierto.) También conviene observar que si la ecuación de partida está ya en la
forma (2.4), al calcular b2 , b4 y b6 según las fórmulas anteriores obtenemos las
cantidades de partida.
Las observaciones precedentes se aplican igualmente a c4 y c6 con los cambios
obvios (ecuaciones de tipo c y caracterı́stica > 3).
La cantidad b8 se introduce como paso intermedio para definir ∆, el cual se
conoce como discriminante de la ecuación. Pronto veremos que una ecuación
de Weierstrass define una curva regular (y, por lo tanto, elı́ptica) si y sólo si
su discriminante es no nulo. El discriminante tiene una interpretación natural
para ecuaciones de tipo b. Recordemos que todo polinomio

F (X) = a0 (X − α1 ) · · · (X − αn )

tiene asociado un discriminante



D = a2n−2
0 (αi − αj )2 ,
1≤i<j≤n

de modo que F (X) tiene raı́ces simples si y sólo si su discriminante es no nulo.


Podemos ver a D como un polinomio simétrico en las indeterminadas αi , lo
que se traduce en que D depende polinómicamente de los polinomios simétricos
elementales, los cuales, evaluados en las raı́ces de F , son —salvo signo— los
coeficientes de F , de donde se sigue que D depende polinómicamente de dichos
coeficientes. La expresión explı́cita de D en términos de los coeficientes se
obtiene por un cálculo rutinario. En el caso de F (X) = X 3 + bX 2 + cX + d
dicha expresión resulta ser

D = −4b3 d + b2 c2 + 18bcd − 4c3 − 27d2 .


38 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Si aplicamos esta fórmula a la ecuación (2.4) y comparamos con la definición


de ∆, veremos que ∆ = 16D. Ası́ pues, el discriminante de una ecuación
de Weierstrass de tipo b es —salvo un factor 16, que se introduce para que
la definición sea válida en caracterı́stica 2— el discriminante de su miembro
derecho en el sentido algebraico usual. Si la aplicamos a (2.5) obtenemos la
definición alternativa de ∆ en términos de c4 y c6 (salvo un 16), que sólo es
válida en caracterı́stica > 3. (Naturalmente, dicha definición alternativa exige
comprobar que ambas expresiones se corresponden con el mismo polinomio en
los coeficientes ai , lo que no es más que un cálculo rutinario.)
El invariante j sólo está definido para ecuaciones con discriminante no nulo.
Según hemos comentado, vamos a ver que éstas son precisamente las que definen
curvas elı́pticas, y entonces demostraremos que j depende únicamente de la
curva, en el sentido de que todas las ecuaciones de una misma curva tienen
el mismo invariante y dos curvas son isomorfas si y sólo si tienen el mismo
invariante.
En principio no tenemos definidos ∆ y j para una ecuación clásica (2.6),
pero podemos definirlos como los correspondientes a la ecuación que resulta de
hacer el cambio Y = 2Y  . Entonces a4 = −g2 /4, a6 = −g3 /4 y

1728 g23
∆ = g23 − 27g32 , j= .
g23 − 27g32

El teorema siguiente explica por fin la elección de los subı́ndices:

Teorema 2.6 Si aplicamos a una ecuación de Weierstrass un cambio de va-


riables del tipo descrito en el teorema 2.3, sus coeficientes y las cantidades que
acabamos de definir se transforman según las fórmulas siguientes:

ua1 = a1 + 2s,
u2 a2 = a2 − sa1 + 3r − s2 ,
u3 a3 = a3 + ra1 + 2t,
u4 a4 = a4 − sa3 + 2ra2 − (t + rs)a1 + 3r2 − 2st,
u6 a6 = a6 + ra4 + r2 a2 + r3 − ta3 − t2 − rta1 ,
u2 b2 = b2 + 12r,
u4 b4 = b4 + rb2 + 6r2 ,
u6 b6 = b6 + 2rb4 + r2 b2 + 4r3 ,
u8 b8 = b8 + 3rb6 + 3r2 b4 + r3 b2 + 3r4 ,
u4 c4 = c4 ,
u6 c6 = c6 ,
12 
u ∆ = ∆,
j = j.

Demostración: Se trata de una comprobación rutinaria.


Con la ayuda de este teorema podemos encontrar ecuaciones canónicas lo
más simples posibles para curvas definidas sobre cuerpos de caracterı́stica 2 o 3.
2.1. Ecuaciones de Weierstrass 39

En la práctica sólo nos van a interesar las cantidades j, ∆ y c4 , ası́ que vamos
a calcularlas explı́citamente sobre las ecuaciones canónicas:

Teorema 2.7 Sea E/k una curva (no necesariamente regular) definida me-
diante una ecuación de Weierstrass. Entonces, bajo las hipótesis indicadas,
existe un cambio de variables del tipo descrito en el teorema 2.3 que la trans-
forma en otra de la forma indicada en la tabla siguiente:

car k = 2, 3 Y 2 = X 3 + a4 X + a6
4a34
∆ = −16(4a34 + 27a26 ) j = 1728 c4 = −48a4
4a34 + 27a26
car k = 3, c4 = 0 Y 2 = X 3 + a2 X 2 + a6
∆ = −a32 a6 j = −a32 /a6 c4 = a22

car k = 3, c4 = 0 Y 2 = X 3 + a4 X + a6
∆ = −a34 j=0 c4 = 0

car k = 2, c4 = 0 Y 2 + XY = X 3 + a2 X 2 + a6
∆ = a6 j = 1/a6 c4 = 1

car k = 2, c4 = 0 Y 2 + a3 Y = X 3 + a4 X + a6
∆ = a43 j = 0, c4 = 0

Demostración: El caso en que la caracterı́stica es distinta de 2 y 3 lo


tenemos ya demostrado. Si la caracterı́stica es 3, hemos visto que podemos
llegar a una ecuación de tipo b, que podemos reescribir como

Y 2 = X 3 + a2 X 2 + a4 X + a6 ,

con c4 = a22 . Si c4 = 0, entonces a2 = 0 y la ecuación tiene ya la forma indicada.


En caso contrario el cambio X = X  + a4 /a2 nos da la ecuación que buscamos.
Partiendo de una ecuación de Weierstrass general, en caracterı́stica 2 se
cumple que c4 = a41 , luego si c4 = 0 tenemos a1 = 0 y basta hacer el cambio
X = X  + a2 . Si c4 = 0 entonces a1 = 0 y el cambio oportuno es

X = a21 X  + a3 /a1 , Y = a31 Y  + (a21 a4 + a23 )/a31 .

Conviene observar que cuando j está definido (∆ = 0) la distinción c4 = 0 o


c4 = 0 equivale a j = 0 o j = 0.
Ahora ya podemos caracterizar la regularidad de una ecuación de Weierstrass
en términos de su discriminante, tal y como habı́amos anunciado:
40 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Teorema 2.8 Sea C/k una curva definida por una ecuación de Weierstrass.
Entonces C es regular si y sólo si ∆ = 0. En caso contrario C tiene un único
punto singular, que es finito y racional.

Demostración: Observemos en primer lugar que el punto infinito O nunca


es singular. Para ello homogeneizamos la ecuación de Weierstrass:

F (X, Y, Z) = Y 2 Z + a1 XY Z + a3 Y Z 2 − X 3 − a2 X 2 Z − a4 XZ 2 − a6 Z 3 ,

y observamos que 
∂F 
= 1 = 0.
∂Z (0,1,0)
El teorema 2.6 muestra que la condición ∆ = 0 no se altera por cambios
de variable (definidos sobre k) y obviamente lo mismo vale para la regularidad
de la curva y la racionalidad del punto singular si es que existe. Por lo tanto,
no perdemos generalidad si suponemos que la curva viene dada por una de las
ecuaciones canónicas descritas en el teorema 2.7.
Supongamos primero que car k = 2, 3. Entonces la ecuación es de la forma

Y 2 = X 3 + a4 X + a6 ,

y un punto singular ha de cumplir, además de esta ecuación, las condiciones

2Y = 0, 3X 2 + a4 = 0.

En definitiva, un punto singular ha de ser de la forma (x0 , 0), donde x0


es una raı́z del polinomio X 3 + a4 X + a6 y de su derivada, es decir, una raı́z
múltiple del polinomio. En otras palabras, la curva es singular si y sólo si este
polinomio tiene raı́ces múltiples. Ahora bien, para una ecuación de tipo c, hemos
comprobado que esto equivale a que el discriminante sea nulo. Además, en tal
caso, es fácil ver que el punto singular es (X, Y ) = (−3a6 /2a4 , 0), luego es único
y racional.
En el segundo caso (en particular car k = 3), un punto singular ha de cumplir

Y 2 = X 3 + a2 X 2 + a6 , 2a2 X = 0, 2Y = 0.

Si a2 = 0 tenemos ∆ = 0 y (X, Y ) = (− 3 a6 , 0) es la única solución de estas
ecuaciones (es racional porque k es perfecto de caracterı́stica 3).
Si a2 = 0 las dos últimas ecuaciones se cumplen únicamente en (0, 0), y la
primera se cumple si y sólo si a6 = 0, es decir, si y sólo si ∆ = 0.
En el tercer caso (también con car k = 3) las condiciones son

Y 2 = X 3 + a4 X + a6 , a4 = 0, 2Y = 0.

Ciertamente hay solución si y sólo si a4 = 0 (si y sólo si ∆ = 0), y dicha



solución es de nuevo (X, Y ) = (− 3 a6 , 0).
2.1. Ecuaciones de Weierstrass 41

En el cuarto caso (ahora con car k = 2) las condiciones son

Y 2 + XY = X 3 + a2 X 2 + a6 , Y = 3X 2 , X = 0,

que se cumplen únicamente en (0, 0) cuando ∆ = a6 = 0. El el último caso


tenemos

Y 2 + a3 Y = X 3 + a4 X + a6 ,3X 2 + a4 = 0, a3 = 0,
√ √
y esto se cumple únicamente en (X, Y ) = ( −a4 , a6 ) cuando ∆ = 0.
Ası́ pues, si E/k es una curva elı́ptica y C/k es una curva en las condiciones
del teorema 2.3, se cumple que ∆C = 0, por lo que el invariante jC está definido
y, según 2.6, no depende de la curva C con que lo calculamos. Por ello podemos
hablar del invariante j(E) ∈ k de cualquier curva elı́ptica definida sobre k.

Teorema 2.9 Dos curvas elı́pticas son isomorfas (sobre k) si y sólo si tienen
el mismo invariante.

Demostración: Es claro que dos curvas isomorfas tienen el mismo inva-


riante (pues podemos representarlas por la misma ecuación de Weierstrass).
Supongamos ahora que E y E  son dos curvas con el mismo invariante. Supon-
gamos primeramente que car k = 2, 3. Entonces las curvas admiten ecuaciones

Y 2 = X 3 + a4 X + a6 , Y 2 = X 3 + a4 X  + a6 ,

con
4a34 4a3
4
= 2 .
4a34 + 27a26 4a3
4 + 27a6
Distinguimos tres casos:
Si a4 = 0, entonces a4 = 0 y a6 = 0 = a6 (porque ∆ = 0). Tomamos un
u ∈ k tal que u6 = a6 /a6 y entonces el cambio X = u2 X  , Y = u3 Y  transforma
una curva en otra.
Si a6 = 0 entonces a6 = 0, luego a4 = 0 = a4 y tomamos u ∈ k tal que
u = a4 /a4 . De nuevo, el cambio X = u2 X  , Y = u3 Y  hace corresponder las
4

curvas.
Si a4 = 0 = a6 , entonces también a4 = 0 = a6 (por los casos anteriores). De
la igualdad de los invariantes se sigue que a34 a2 3 2
6 = a4 a6 o, equivalentemente,
(a4 /a4 )3 = (a6 /a6 )2 . Tomamos u ∈ k tal que u4 = a4 /a4 , de manera que
u12 = (a6 /a6 )2 y u6 = ±a6 /a6 . Si el signo es negativo, multiplicamos u por
una raı́z cuarta primitiva de la unidad, con lo que u4 sigue siendo el mismo y
u6 cambia de signo. En definitiva, tenemos que u4 = a4 /a4 y u6 = a6 /a6 . El
cambio X = u2 X  , Y = u3 Y  hace corresponder las ecuaciones.
Supongamos ahora que car k = 3 y j = 0. Podemos considerar ecuaciones
de la forma
Y 2 = X 3 + a2 X 2 + a6 ,
con a2 = 0 = a2 , a6 = 0 = a6 , a32 a6 = a3 2 
2 a6 . Basta tomar u = a2 /a2 .
42 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

El caso siguiente es car k = 3, j = 0, con lo que las ecuaciones canónicas son


de la forma
Y 2 = X 3 + a4 X + a6 ,
 a4 . Esta vez hemos de considerar un cambio de coordenadas de
con a4 = 0 =
la forma X = u2 X  + r, Y = u3 Y  . Basta tomar u y r de modo que

u4 = a4 /a4 , r3 + a4 r + a6 − u6 a6 = 0.

Supongamos ahora que car k = 2 y j = 0. En este caso

Y 2 + XY = X 3 + a2 X 2 + a6

con a6 = a6 = 0. Consideramos el cambio X = X  , Y = Y  + sX  , donde s es


una raı́z de la ecuación s2 + s + a2 + a2 = 0.
Finalmente, si car k = 2, j = 0, tenemos

Y 2 + a3 Y = X 3 + a4 X + a6

con a3 = 0 = a3 . Consideramos un cambio X = u2 X  +s2 , Y = u3 Y  +u2 sX  +t,


de modo que
u3 = a3 /a3 , s4 + a3 s + a4 − u4 a4 = 0,
t2 + a3 t + s6 + a4 s2 + a6 − u6 a6 = 0.

Este teorema junto con el que demostramos a continuación muestra que hay
tantas clases de curvas elı́pticas como elementos tiene k.

Teorema 2.10 Para cada j0 ∈ k existe una curva elı́ptica definida sobre k con
invariante j0 .

Demostración: Si j0 = 0, 1728 consideramos la curva


36 1
Y 2 + XY = X 3 − X− .
j0 − 1728 j0 − 1728

Un simple cálculo nos da que ∆ = j02 /(j0 − 1728)3 y j = j0 . Para los dos
casos que faltan, consideramos las curvas

Y 2 + Y = X 3, ∆ = −27, j = 0,
Y 2 = X 3 + X, ∆ = −64, j = 1728.

Notemos que si car k = 2, 3, entonces 1728 = 0, y una de las dos curvas tiene
discriminante no nulo.

Definición 2.11 Si E es una curva elı́ptica, llamaremos Aut(E) al grupo de


los automorfismos de E, es decir, los isomorfismos de E en E que fijan a O.
2.1. Ecuaciones de Weierstrass 43

Vamos a usar las ecuaciones de Weierstrass para determinar el grupo de


automorfismos de una curva elı́ptica.

Teorema 2.12 Si E es una curva elı́ptica de invariante j sobre un cuerpo de


caracterı́stica p (nula o prima), entonces Aut(E) es un grupo finito y su orden
es 
 2 si j = 0, 1728,


 4 si j = 1728 y p = 2, 3,
|Aut(E)| = 6 si j = 0 y p = 2, 3,



 12 si j = 0 = 1728 y p = 3,
24 si j = 0 = 1728 y p = 2.
En los tres primeros casos Aut(E) es un grupo cı́clico.

Demostración: No perdemos generalidad si suponemos que E viene dada


por una ecuación de Weierstrass según el teorema 2.7.
Un automorfismo φ : E −→ E está completamente determinado por las
funciones x = φ ◦ x, y  = φ ◦ y. Dichas funciones han de satisfacer la misma
ecuación de Weierstrass que x, y. Por el mero hecho de satisfacer una ecuación
de Weierstrass, el teorema 2.3 (más exactamente su demostración) nos da que
la relación entre x, y, x , y  ha de ser

x = u2 x + r, y = u3 y  + su2 x + t, u, r, s, t ∈ k, u = 0,

pero además u, r, s, t han de cumplir lo necesario para que la nueva ecuación


sea la misma. Equivalentemente, lo que tenemos es que φ−1 es la restricción a
E de la transformación afı́n determinada por las ecuaciones

X = u2 X  + r, Y = u3 Y  + su2 X  + t.

Distingamos los cinco casos correspondientes al teorema 2.7. Si p = 2, 3, la


ecuación es de la forma
Y 2 = X 3 + a4 X + a6 .
Ahora usamos el teorema 2.6. La ecuación de a1 nos da s = 0, la de a2 nos
da r = 0 y la de a3 nos da t = 0. Por consiguiente, el isomorfismo se reduce a
X = u2 X  , Y = u3 Y  , y la nueva ecuación pasa a ser

Y 2 = X 3 + u−4 a4 + u−6 a6 .

Si a4 = 0 y a6 = 0 (lo cual equivale a que j = 0, 1728), entonces se ha de


cumplir que u−4 = 1 y u−6 = 1, lo que equivale a que u2 = 1. Por consiguiente
tenemos sólo dos automorfismos, dados por Y = ±Y  .
Si a6 = 0, entonces j = 1728 y la condición se reduce a que u−4 = 1, lo que
da lugar a cuatro automorfismos distintos. Observemos que la aplicación que a
cada raı́z cuarta de la unidad u le asigna su automorfismo correspondiente es
un isomorfismo de grupos, luego Aut(E) resulta ser un grupo cı́clico.
Si a4 = 0 entonces j = 0 y razonamos igualmente, sólo que ahora u es una
raı́z sexta de la unidad.
44 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Supongamos ahora p = 3, j = 0. Entonces la ecuación es

Y 2 = X 3 + a2 X 2 + a6 .

Las transformaciones de a1 , a3 y a4 nos dan de nuevo que r = s = t = 0 y


la ecuación se convierte en

Y 2 = X 3 + u−2 a2 X 2 + u−6 a6 ,

con lo que ha de ser u2 = 1 y tenemos únicamente dos automorfismos.


Si j = 0 podemos tomar

Y 2 = X 3 + a4 X,

pero ahora sólo podemos concluir s = t = 0, y la ecuación se transforma en

Y 2 = X 3 + u−4 a4 X + u−6 (a4 r + r3 ).

Vemos, pues, que u√4 = 1, y que r3 + a4 r = 0, lo que da tres valores distintos


para r, a saber, 0 y ± −a4 . Por lo tanto hay 12 automorfismos. Si representa-
mos por (u, r) el automorfismo
√ correspondiente a unos
√ valores dados de u y r,
es fácil ver que g = ( 4 −1, 0) tiene orden 4, a = (1, −a4 ) tiene orden 3 y que
no conmutan, por lo que ag = a−1 , de donde g 2 conmuta con a y h = g 2 a tiene
orden 6. En definitiva,

Aut(E) = g, h | h6 = 1, g 2 = h3 , hg = h−1 .

Si p = 2 y j = 0 podemos tomar

Y 2 + XY = X 3 + a6 ,

con lo que ha de ser u = 1 (de la ecuación de a1 ), r = 0 (de la ecuación de a3 ),


t = 0 (de la ecuación de a4 ) y s2 + s = 0 (de la ecuación de a2 ). En definitiva,
hay dos automorfismos, determinados por el valor de s = 0, 1.
Por último, si p = 2 y j = 0 podemos tomar la ecuación

Y 2 + a3 Y = X 3 .

De la ecuación de a2 sale r = s2 y la ecuación transformada es

Y 2 + u−3 a3 Y = X 3 + (sa3 + s4 )X + u−6 (t2 + a3 t + s6 ).

Se ha de cumplir u3 = 1, s4 + a3 s = 0, t2 + a3 t + s6 = 0. Tenemos
tres posibilidades para u, cuatro para s y, para cada valor de s, la tercera
ecuación tiene dos raı́ces distintas (o serı́a a3 = 0). En total Aut(E) consta de
24 automorfismos. Un análisis más detallado muestra que está formado por un
subgrupo de orden 8 de tipo cuaternio sobre el que actúa por conjugación un
grupo cı́clico de orden 3 (que permuta los generadores i, j, k).
2.1. Ecuaciones de Weierstrass 45

El teorema de Riemann-Roch implica que el espacio de las diferenciales de


primera clase (diferenciales holomorfas, o sin polos) tiene dimensión 1 sobre k.
Además, los divisores de las formas diferenciales recorren la clase canónica, que
en un cuerpo elı́ptico es la clase principal. Esto significa que las diferenciales
de primera clase no tienen ni ceros ni polos. Vamos a calcular explı́citamente
una diferencial de primera clase para una curva elı́ptica determinada por una
ecuación de Weierstrass:

Definición 2.13 A cada curva C/k definida por una ecuación

F (X, Y ) = Y 2 + a1 XY + a3 Y − X 3 − a2 X 2 − a4 X − a6 = 0

le asociamos la forma diferencial


dx dy
ω= = 2 .
2y + a1 x + a3 3x + 2a2 x + a4 − a1 y
En otros términos,
dx dy
ω= =− .
FY FX
La igualdad se debe a que las funciones x, y ∈ k(C) cumplen F (x, y) = 0,
luego diferenciando queda FX dx + FY dy = 0.
Una comprobación rutinaria muestra que ante un cambio de coordenadas
como el del teorema 2.6, la forma que acabamos de definir se transforma según
la relación u−1 ω  = ω.

Teorema 2.14 Si C/k es una curva elı́ptica definida por una ecuación de
Weierstrass, entonces la forma ω es una diferencial de primera clase que no
se anula en ningún punto.

Demostración: Si P = (x0 , y0 ) ∈ C es un punto finito, entonces la tan-


gente a C por P es la recta de ecuación

FX (P )(X − x0 ) + FY (P )(Y − y0 ) = 0.

Si FX (P ) = 0 entonces Y − y0 = 0 no es la recta tangente a C en P , luego


y − y0 es un parámetro local de C en P (cualquier recta no tangente induce un
−1
parámetro local), y entonces vP (ω) = vP (FX d(y − y0 )) = −vP (FX (x, y)) = 0,
pues la función FX (x, y) es regular y no nula en P .
Similarmente, si FY (P ) = 0 entonces x − x0 es un parámetro local de C
en P y vP (ω) = −vP (−FY (x, y)) = 0. Con esto hemos probado que ω no
tiene ni ceros ni polos en ningún punto finito de C. Falta, pues, estudiar, el
comportamiento de ω en el punto infinito O.
Sea t un parámetro local en O. Sabemos que x = f t−2 , y = gt−3 , donde f
y g son funciones regulares y no nulas en O. Entonces
dx f  t−2 − 2t−3 f f  t − 2f
ω= = dt = dt.
2y + a1 x + a3 2gt−3 + a1 f t−2 + a3 2g + a1 f t + a3 t3
46 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Si car k = 0, es claro que vO (ω) = 0. En caso contrario llegamos a la misma


conclusión razonando igualmente con la expresión de ω en términos de dy.
Terminamos la sección estudiando una clase especial de ecuaciones canónicas
de Weierstrass:

Definición 2.15 Una ecuación de Weierstrass está en forma de Legendre si


puede escribirse como

Y 2 = X(X − 1)(X − λ), λ ∈ k.

Llamaremos Eλ a la curva definida por esta ecuación. Un simple cálculo muestra


que su discriminante es ∆ = 16λ2 (λ − 1)2 , luego es singular cuando car k = 2 o
cuando λ = 0, 1. En los casos restantes se comprueba que
(λ2 − λ + 1)3
j(Eλ ) = 28 .
λ2 (λ − 1)2

Teorema 2.16 Si car k = 2, toda curva elı́ptica es isomorfa (sobre k) a una


curva Eλ , para cierto λ ∈ k, λ = 0, 1. La aplicación λ → j(Eλ ) es suprayectiva
y toma seis veces cada valor de k, excepto 0 (que lo toma sólo dos veces cuando
car k = 3 y una en caso contrario) y 1728 (que lo toma sólo tres veces cuando
car k = 3 y una en caso contrario).

Demostración: Basta tomar como λ una raı́z de la ecuación

28 (λ2 − λ + 1)3 − jλ2 (λ − 1)2 = 0,

donde j es el invariante de la curva dada. Es claro que 0 y 1 no son raı́ces, luego


λ = 0, 1. Como j(Eλ ) = j, tenemos que Eλ es isomorfa a la curva dada.
Si j(Eλ ) = j(Eµ ) entonces las dos curvas son isomorfas, y es posible trans-
formar sus ecuaciones mediante un cambio de coordenadas afı́n. Ahora bien,
para que un cambio de este tipo transforme una ecuación de Legendre en otra,
ha de ser más concretamente de la forma

X = u2 X  + r, Y = u3 Y  .

Igualando las ecuaciones tenemos:


   
r  r−1 r−λ
X(X − 1)(X − µ) = X + 2 X+ X + ,
u u2 u2
y hay exactamente seis formas de hacer corresponder los factores. Por ejemplo,
si los hacemos corresponder en el orden en que los hemos escrito, queda que
r = 0, u2 = 1, µ = λ. Considerando similarmente las otras posibilidades
llegamos a que  
1 1 λ λ−1
µ ∈ λ, , 1 − λ, , , .
λ 1−λ λ−1 λ
Ası́ pues, j(Eµ ) toma seis veces distintas el valor j(Eλ ), salvo que algunos
de los valores del conjunto anterior coincidan. Igualándolos dos a dos vemos que
2.2. La estructura de grupo 47

esto sucede cuando λ = −1, 2, 1/2 (en cuyo caso µ toma tres valores distintos
salvo si car k = 3) y cuando λ2 − λ + 1 = 0 (en cuyo caso µ toma dos valores
salvo si car k = 3). Es fácil ver que j(Eλ ) es 1728 en el primer caso y 0 en el
segundo.

Para cuerpos con caracterı́stica 2, hay una clase de ecuaciones que desempeña
un papel similar:

Definición 2.17 Una ecuación de Weierstrass está en forma de Deuring si


puede escribirse como

Y 2 + αXY + Y = X 3 , α ∈ k.

Llamaremos Dα a la curva definida por esta ecuación. Un simple cálculo


muestra que
α3 (α3 − 24)3
∆ = α3 − 27, j= .
α3 − 27
Ası́ pues, Dα es elı́ptica cuando α3 = 27. Si car k = 3 esto equivale a α = 0,
y en tal caso j(Dα ) = α9 . Vemos, pues, que en caracterı́stica 3 toda curva
elı́ptica con invariante j = 0 admite una ecuación en forma de Deuring. En las
demás caracterı́sticas no hay excepciones:

Teorema 2.18 Si car k = 3, toda curva elı́ptica es isomorfa (sobre k) a una


curva Dα , para cierto α ∈ k, α3 = 27.

Demostración: Basta tomar como α una raı́z de la ecuación

α3 (α3 − 24)3 − (α3 − 27)j = 0.

No puede ser α3 = 27, pues entonces serı́a 272 = 0, absurdo.

2.2 La estructura de grupo


Si E es una curva elı́ptica, podemos considerar la aplicación E −→ H0 (E)
dada por P → [P/O]. Esta aplicación es inyectiva, pues si [P/O] = [Q/O]
entonces [P ] = [Q], luego existe una función f ∈ k(E) tal que (f ) = P/Q. Por
consiguiente f ∈ m(Q−1 ), pero dim Q = grad Q = 1 y m(Q−1 ) contiene a las
constantes, lo que nos lleva a un absurdo.
La aplicación también es suprayectiva, pues si a es un divisor de grado 0,
el teorema de Riemann-Roch nos da que dim aO = grad aO = 1, luego existe
una función f ∈ m(a−1 O−1 ) no nula. Entonces (f )aO es un divisor entero de
grado 1, luego tiene que ser primo, es decir, un punto P ∈ E. Tenemos ası́ que
[aO] = [P ] o, equivalentemente, que [a] = [P/O].
A través de esta biyección podemos trasladar la operación del grupo de clases
a la curva E. Notemos antes que si E está definida sobre k, entonces k(E) es
una extensión de constantes de k(E), por lo que podemos considerar al grupo de
48 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

clases de grado 0 de k(E) como un subgrupo de H0 (E), y el argumento anterior


muestra que la biyección que hemos definido se restringe a una biyección entre
los divisores primos de grado 1 de k(E) (es decir, los puntos de E(k)) y las
clases de divisores de grado 0 de k(E).

Definición 2.19 Si E es una curva elı́ptica, definimos en E la ley de compo-


sición interna determinada por [(P + Q)/O] = [P/O][Q/O].

El razonamiento precedente muestra que E se convierte con esta operación


en un grupo abeliano isomorfo a H0 (E) a través del isomorfismo P → [P/O].
El elemento neutro de E es el punto O. Si E está definida sobre k, entonces
E(k) es un subgrupo de E isomorfo al grupo de clases de grado 0 de k(E).
Conviene observar que, en términos de la suma en E, el isomorfismo inverso de
E∼= H0 (E) viene dado por

[P1m1 · · · Prmr ] → m1 P1 + · · · + mr Pr .

(Porque [P1m1 · · · Prmr ] = [(P1 /O)m1 · · · (Pr /O)mr ].)


La suma que acabamos de definir tiene una interpretación geométrica simple:

Teorema 2.20 Sea E una curva elı́ptica determinada


R
por una ecuación de Weierstrass y sean P , Q ∈ E.
Llamemos R al tercer punto donde la recta que pasa
Q por P y Q corta a E. Entonces P + Q es el tercer
punto donde la recta que pasa por R y O corta a E.
P
Demostración: Recordemos que, para una curva
determinada por una ecuación de Weierstrass, las fun-
ciones coordenadas cumplen x ∈ m(O−2 ), y ∈ m(O−3 ).
De hecho, 1, x, y forman una base de m(O−3 ). Una
P +Q recta proyectiva L es el conjunto de ceros de un polino-
mio aX +bY +cZ. Su ecuación afı́n es aX +bY +c = 0.
La función l = ax + by + c ∈ k(E) cumple l ∈ m(O−3 ), luego tenemos que
(l) = P1 P2 P3 /O3 , para ciertos puntos Pi ∈ E no necesariamente distintos entre
sı́ ni distintos de O. Estos tres puntos son precisamente los puntos de corte de
la recta L con E. Más precisamente, el número de intersección IP (E ∩ L) es el
número de veces que P aparece entre los Pi .
En efecto, recordemos que si F es una forma lineal que no se anula en P y
f = L/G ∈ k(E), entonces IP (E ∩ L) = vP (f ). Ası́, si P = 0, podemos tomar
F = Z, con lo que IP (E ∩ L) = vP (l) es el número de veces que P aparece
entre los Pi . Si P = O, tomamos F = Y , con lo que f = l(Z/Y ) = l/y. Sea
(y) = Q1 Q2 Q3 /O3 , donde Qi son los puntos (finitos) donde la recta Y = 0
corta a E. Entonces IO (E ∩ L) = vO (P1 P2 P3 /Q1 Q2 Q3 ) es también el número
de veces que O aparece entre los Pi .
Observemos que el razonamiento vale incluso cuando la recta es Z = 0, en
cuyo caso l = 1 = O3 /O3 , y obtenemos que IO (E ∩ L) = 3.
2.2. La estructura de grupo 49

En las condiciones del enunciado, si llamamos L a la recta que pasa por P


y Q, entonces (l) = P QR/O3 y si L es la recta que pasa por O y R entonces
(l ) = ORS/O3 , para cierto punto S ∈ E. Hemos de probar que S = P + Q.
Ahora bien, esto es inmediato: [P/O][Q/O] = [O/R] = [S/O], luego ciertamente
S = P + Q.
Observemos que el opuesto −P de un punto finito P ∈ E se calcula como el
tercer punto de la recta (vertical) que une O con P . En efecto, si llamamos Q a
este punto, el tercer punto de la recta que une P con Q es O, y el tercer punto
de la recta que une O con O es O, luego P + Q = O.
Vamos a dar fórmulas explı́citas para la suma en una curva elı́ptica E definida
por un polinomio
F (X, Y ) = Y 2 + a1 XY + a3 Y − X 3 − a2 X 2 − a4 X − a6 .
Sea P = (x0 , y0 ) ∈ E un punto finito. El punto −P es el tercer punto
(x0 , y0 ) donde la recta X = x0 corta a E (además de P y O). Tenemos que
F (x0 , Y ) = c(Y − y0 )(Y − y0 ). Comparando los coeficientes de Y 2 sale c = 1 y
comparando los coeficientes de Y obtenemos que −P = (x0 , −y0 − a1 x0 − a3 ).
Consideremos ahora dos puntos finitos P1 = (x1 , y1 ) y P2 = (x2 , y2 ) en E.
Si x1 = x2 y y1 + y2 + a1 x2 + a3 = 0, entonces P1 + P2 = O. Descartamos
este caso y consideramos la recta que une P1 con P2 (la tangente a E por P1 si
son el mismo punto). Digamos que su ecuación es Y = λX + µ. (Los valores
explı́citos de λ y µ son fáciles de calcular y están dados en el enunciado del
teorema siguiente). Llamemos P3 al tercer punto en que esta recta corta a E.
Se trata de P3 = −P1 − P2 , luego es finito. Para calcularlo hacemos
F (X, λX + µ) = c(X − x1 )(X − x2 )(X − x3 ).
Igualando los coeficientes de X 3 queda que c = −1, y con X 2 obtenemos
x1 + x2 + x3 = λ2 + a1 λ − a2 .
Sustituyendo en la ecuación de la recta queda que y3 = λx3 + µ. Aplicando
la fórmula para calcular el opuesto, obtenemos P1 + P2 = −P3 . En el teorema
siguiente damos explı́citamente las fórmulas resultantes:
Teorema 2.21 Sea E una curva elı́ptica determinada por una ecuación de
Weierstrass. Entonces
a) Si P0 = (x0 , y0 ) ∈ E es un punto finito, −P0 = (x0 , −y0 − a1 x0 − a3 ).
b) Si P1 = (x1 , y1 ), P2 = (x2 , y2 ) son puntos finitos de E tales que x1 = x2
y y1 + y2 + a1 x2 + a3 = 0, entonces P1 + P2 = O. En caso contrario, sean
y2 − y1 y1 x2 − y2 x1
λ= , µ= , si x1 = x2 ,
x2 − x1 x2 − x1
3x21 + 2a2 x1 + a4 − a1 y1
λ= ,
2y1 + a1 x1 + a3
−x31 + a4 x1 + 2a6 − a3 y1
µ= , si x1 = x2 .
2y1 + a1 x1 + a3
50 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Entonces, P3 = P1 + P2 viene dado por

x3 = λ2 + a1 λ − a2 − x1 − x2 ,
y3 = −(λ + a1 )x3 − µ − a3 .

c) En particular se cumple la fórmula de duplicación:

x4 − b4 x2 − 2b6 x − b8
x(2P ) = .
4x3 + b2 x2 + 2b4 x + b6

(Para probar la fórmula de duplicación podemos partir de una ecuación de


tipo b, pues el cambio de variables cumple X  = X.)

Estas fórmulas muestran explı́citamente que la suma de puntos racionales


es de nuevo un punto racional. También nos permiten demostrar el teorema
siguiente:

Teorema 2.22 Si E/k es una curva elı́ptica, entonces las aplicaciones

+ : E × E −→ E y − : E −→ E

son regulares y están definidas sobre k.

Demostración: No perdemos generalidad si suponemos que E está defi-


nida por una ecuación de Weierstrass. El teorema anterior muestra entonces
que la restricción de la aplicación inversa a la parte afı́n de E es polinómica,
luego es regular (y definida sobre k), luego determina una aplicación racional en
E, pero toda aplicación racional entre curvas proyectivas regulares es regular.
En realidad, puesto que es su propia inversa, vemos que es un isomorfismo.

El teorema anterior muestra también que la suma es regular (y definida


sobre k) en todos los puntos de E × E salvo a lo sumo en los de la forma (P, P ),
(P, −P ), (P, O) y (O, P ). Para ocuparnos de éstos consideramos las traslaciones
τQ : E −→ E dadas por τQ (P ) = P + Q. El teorema anterior muestra que son
regulares en un abierto (concretamente, para P = O, ±Q), y por la regularidad
de E son regulares en E. Además, la inversa de una traslación es otra traslación,
luego son isomorfismos (pero no de curvas elı́pticas, pues no conservan el cero).

Dado un par (P1 , P2 ) ∈ E × E, podemos escoger traslaciones τ1 y τ2 de


modo que (τ1 (P1 ), τ2 (P2 )) esté en el abierto de E × E donde sabemos que la
suma es regular. Ahora basta observar que, en un entorno de (P1 , P2 ), la suma
se descompone como
τ ×τ + τ −1 τ −1
E × E −→
1 2
E × E −→ E −→
1
E −→
2
E.

Esto prueba que la suma es regular en E × E.


2.2. La estructura de grupo 51

Ejemplo Consideremos la curva Y 2 = X 3 − 25X. En la introducción hemos


comentado que los puntos (−4, 6), (−5, 0) y (45, 300) están alineados, lo que
equivale a que
(−4, 6) + (−5, 0) + (45, 300) = 0.
Similarmente, 2(−4, −6) = (20.172/1.728, 62.279/1.768). Estos resultados
pueden comprobarse fácilmente con las fórmulas del teorema 2.21. Por ejemplo,
la fórmula de duplicación es

x4 + 50x2 + 625
x(2P ) = .
4x3 − 100x
Los puntos triviales (−5, 0), (0, 0) y (5, 0) cumplen 2P = O.
Ahora podemos demostrar la implicación c) ⇒ b) del Teorema 1 de la intro-
ducción (la caracterización de los números congruentes):
Demostración: Consideramos un natural n libre de cuadrados, suponemos
que la curva elı́ptica E/Q dada por Y 2 = X 3 − n2 X tiene un punto racional
distinto de O, (−n, 0), (0, 0), (n, 0), y hemos de probar que existen tres cuadra-
dos racionales en progresión aritmética de razón n (lo que a su vez implica que
n es congruente).
Es claro que para que un punto P de E/Q tenga orden 2 es necesario y
suficiente que la tangente a la curva por P sea vertical, lo que a su vez equivale
a que Y = 0. En definitiva, los puntos exceptuados son precisamente los puntos
de orden 2 de E/Q. Ası́ pues, si la curva tiene otro punto racional P , se cumplirá
que P = O = 2P . Pongamos que P = (x, y) y 2P = (x , y  ).
Sea Y = aX + b la tangente a la curva en P . Esta recta pasa por (x, y)
(dos veces) y por (x , −y  ). Esto significa que si sustituimos Y = aX + b en la
ecuación de E, el polinomio resultante

(X + n)X(X − n) − (aX + b)2

tiene a x como raı́z doble y a x como tercera raı́z. Teniendo en cuenta que es
mónico, vemos que

(X + n)X(X − n) − (aX + b)2 = (X − x)2 (X − x ).

Ahora hacemos X = −n, con lo que

(b − an)2 = (x + n)2 (x + n).

Sabemos que x + n = 0 (pues P = (−n, 0)), luego concluimos que x + n es


un cuadrado. Similarmente llegamos a que x y x − n son cuadrados.
A la vista de la demostración anterior, la forma más natural de llegar a
que el número 5 es congruente consiste en observar que (−4, −6) es un punto
no trivial de Y 2 = X 3 − 25X, calcular 2P = (x , y  ) (ver el ejemplo anterior),
obtener la progresión aritmética x − 5, x , x + 5 y a partir de aquı́ calcular la
terna (a, b, c) según la demostración del Teorema 1 en la introducción.
52 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Ejemplo El número 14 es congruente.


La curva elı́ptica Y 2 = X 3 − 142 X tiene el punto racional P = (18, 48).
(Es fácil encontrarlo con un ordenador.) Aplicando la fórmula de duplicación
obtenemos que
 2
4225 65
x(2P ) = = ,
144 12
de donde  2  2
47 79
x(2P ) − 14 = , x(2P ) + 14 = .
12 12
Según la prueba del Teorema 1 de la introducción, un triángulo rectángulo
racional de área 14 es (a, b, c) = (21/2, 8/3, 65/6), que se obtiene haciendo
79 47 79 47 65
a= + , b= − , c=2· .
12 12 12 12 12

Ejercicio: Demostrar que el número 15 es congruente y encontrar una terna asociada


partiendo del punto P = (−9, 36).

Definición 2.23 Si E es una curva elı́ptica y P ∈ E, definimos la traslación


por P como la aplicación τP : E −→ E dada por τP (Q) = P + Q.

Claramente, las traslaciones son isomorfismos de curvas, pero, como ya he-


mos comentado, no son isomorfismos de curvas elı́pticas porque no cumplen
τP (O) = O (salvo en el caso de τO , que es la identidad). Es claro que las
traslaciones forman con la composición un grupo isomorfo a E.

Teorema 2.24 Si E es una curva elı́ptica y ω es una diferencial de primera


clase en E, entonces ω es invariante por traslaciones, es decir, se cumple que
τ P (ω) = ω para todo P ∈ E.

Demostración: Como τP es un isomorfismo, τ P : Ω(E) −→ Ω(E) es un


k-isomorfismo, luego τ P (ω) = 0. Por consiguiente existe una función no nula
fP ∈ k(E) tal que τ P (ω) = fP ω. Tomando divisores vemos que

(fP ) = (τ P (ω))/(ω) = (τ P (ω))/(ω) = 1/1 = 1,

pues las diferenciales de primera clase en un cuerpo de género 1 no tienen ceros


ni polos. Esto implica que fP ∈ k es una constante. Tenemos ası́ definida una
función f : E −→ k ∗ tal que τ P (ω) = f (P )ω. De esta relación se sigue que
f (P + Q) = f (P )f (Q). En particular f (O) = 1. Vamos a ver que f es regular.
Sea E ∗ = E \ {O}. No perdemos generalidad si suponemos que E es una
curva plana definida por una ecuación de Weierstrass. Entonces E ∗ es una curva
afı́n. Consideremos el producto E ∗ × E ∗ , con funciones coordenadas u, v, x, y.
Pongamos que ω = α dx, con α ∈ k(E).
2.3. Cúbicas singulares 53

La función que a cada par (P, Q) ∈ E ∗ × E ∗ le asigna τ P (x)(Q) = x(P + Q)


es una función racional en E ∗ × E ∗ , puesto que la suma es regular y x es
racional. Podemos llamarla τ (x). Esto significa que τ P (x)(Q) ∈ A1 se calcula
(cuando está definido) mediante una función racional R(U, V, X, Y ) a partir de
las coordenadas (u, v) de P y (x, y) de Q. Para un punto prefijado P = (u0 , v0 ),
la función τ P (x) ∈ k(E ∗ ) se calcula mediante la función R(u0 , v0 , X, Y ) a partir
de las coordenadas (x, y) de Q. Por lo tanto, la función
dτ P (x)
∈ k(E ∗ )
dx
se calcula mediante la derivada parcial de R(U, V, X, Y ) respecto de X a partir
de las coordenadas (u0 , v0 ) de P y las coordenadas (x0 , y0 ) de Q. Vemos, pues,
que la función dτ (x)/dx : E ∗ × E ∗ −→ A1 es racional.
El mismo razonamiento prueba que dτ (α)/dx ∈ k(E ∗ × E ∗ ), luego llegamos
a que
(x)
τ (ω) τ (α) dτdx
= ∈ k(E ∗ × E ∗ ).
ω α
Ahora bien, antes hemos probado que, para cada P , esta función es la cons-
tante f (P ), es decir, que no depende de las coordenadas x e y. En otros términos,
fijamos un punto Q ∈ E ∗ y consideramos la aplicación E ∗ −→ E ∗ × E ∗ dada
por P → (P, Q) (claramente regular), la composición de ésta y la precedente es
la función f . Más precisamente, tenemos que f es regular en un abierto de E.
Ahora bien, la relación f (P + Q) = f (P )f (Q) implica que f es regular en
toda la curva E, pues, dado P ∈ E, sea Q ∈ E tal que f es regular en un
entorno de P + Q, entonces f (P ) = f (P + Q)/f (Q), y el segundo miembro es
regular en un entorno de P .
Resulta ası́ que f : E −→ P1 es una aplicación regular que no toma los
valores 0 ni ∞, luego no es suprayectiva y, por consiguiente, es constante. Como
f (O) = 1, ha de ser f = 1. Concluimos que τ P (ω) = ω.
En virtud del teorema anterior, las diferenciales de primera clase en una
curva elı́ptica se llaman también diferenciales invariantes. Notemos que una
diferencial que no sea de primera clase no puede ser invariante por traslaciones,
pues las traslaciones trasladan sus polos.

2.3 Cúbicas singulares


Si tenemos una curva elı́ptica definida por una ecuación de Weierstrass con
coeficientes enteros, una forma de estudiarla es considerar la curva definida por
dicha ecuación módulo un primo p. Cuando p divide al discriminante de la
ecuación obtenemos una curva singular, por lo que conviene estudiar este tipo
de curvas un poco más a fondo. En primer lugar observamos que hay dos tipos
de singularidades:
Definición 2.25 Si P es un punto singular de una cúbica plana C, diremos
que P es un nodo de C si P tiene dos tangentes distintas en P , mientras que P
es una cúspide si P tiene una única tangente (doble) en P .
54 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Notemos que la cúbica no puede tener tres tangentes, porque entonces serı́a
reducible. Las figuras siguientes muestran cúbicas con una cúspide y un nodo
en (0, 0).

Y 2 = X3 Y 2 + XY − X 3 = 0

En general, si C/k es una cúbica singular definida por una ecuación de


Weierstrass, el teorema 2.8 nos da que su punto singular es finito y racional,
digamos (x0 , y0 ). Entonces, la traslación

X = X  + x0 , Y = Y  + y0

transforma la ecuación de Weierstrass en otra cuyo punto singular es (0, 0).


Entonces
 
∂F  ∂F 
F (0, 0) = a6 = 0, = a = 0, = a3 = 0,
∂X (0,0) ∂Y (0,0)
4

luego la ecuación se reduce a

Y 2 + a1 XY − a2 X 2 − X 3 = 0.

Las tangentes en (0, 0) se obtienen factorizando la forma Y 2 +a1 XY −a2 X 2 .


Para ello consideramos la ecuación T 2 + a1 T − a2 = 0. Si llamamos s1 y s2 a
sus raı́ces, entonces haciendo T = Y /X obtenemos que

Y 2 + a1 XY − a2 X 2 = (Y − s1 X)(Y − s2 X),

luego las tangentes son Y = si X. Ahora hemos de observar que los si no están
necesariamente en k, sino que en principio pertenecen a una extensión cuadrática
de k. Si la singularidad es una cúspide, entonces s1 = s2 , el discriminante del
polinomio T 2 + a1 T − a2 es nulo y sı́ que podemos asegurar que si ∈ k (si
car k = 2 el argumento es distinto, pero llegamos a la misma conclusión). El
problema puede aparecer cuando la singularidad es un nodo. Esto nos lleva al
concepto siguiente:

Definición 2.26 Diremos que una curva C/k definida por una ecuación de
Weierstrass tiene un nodo racional si tiene un nodo y las pendientes de las
tangentes por dicho nodo están en k. En caso contrario diremos que el nodo es
irracional.
2.3. Cúbicas singulares 55

Con este matiz, podemos probar el teorema siguiente:

Teorema 2.27 Sea C/k una cúbica singular definible por una ecuación de
Weierstrass y cuya singularidad sea una cúspide o un nodo racional. Enton-
ces C/k se transforma mediante un cambio de coordenadas sobre k en una de
las dos ecuaciones Y 2 = X 3 o bien Y 2 + XY = X 3 . Ambas tienen a (0, 0) como
único punto singular.

Demostración: La traslación que lleva el punto singular a (0, 0) transforma


la ecuación en otra con una singularidad en (0, 0) del mismo tipo que la de
partida. Según hemos visto, dicha ecuación es de la forma

Y 2 + a1 XY − a2 X 2 − X 3 = 0,

y existe un s ∈ k tal que s2 + a1 s − a2 = 0. Entonces el cambio Y = Y  + sX 


reduce la ecuación a
Y 2 + AXY − X 3 = 0.
Si A = 0 tenemos ya una de las curvas del enunciado. Si A = 0, el cambio
X = A2 X  , Y = A3 Y  transforma la ecuación en Y 2 + XY − X 3 = 0.
Es claro que si la singularidad es un nodo irracional no es posible transformar
la ecuación en Y 2 + XY − X 3 mediante un cambio de coordenadas en k, pues el
cambio inverso transformarı́a las tangentes de esta curva en (0, 0) —que tienen
pendiente racional— en las tangentes de la curva dada en su punto singular,
que por consiguiente tendrı́an también pendiente racional.

Teorema 2.28 Una cúbica C definida por una ecuación de Weierstrass puede
clasificarse como sigue:
a) C es regular si y sólo si ∆ = 0,
b) C tiene un nodo si y sólo si ∆ = 0 y c4 = 0,
c) C tiene una cúspide si y sólo si ∆ = c4 = 0.

Demostración: El apartado a) ya está demostrado. Supongamos que C


es singular. La condición c4 = 0 no se altera por cambios de coordenadas (sobre
k), ni tampoco el tipo de singularidad, luego podemos suponer que C viene dada
por una de las dos ecuaciones del teorema anterior. Ahora basta observar que
la primera cumple c4 = 0 (y tiene una cúspide en (0, 0)) y la segunda cumple
c4 = 1 (y tiene un nodo).
Veamos ahora que la descripción geométrica de la suma en una curva elı́ptica
proporciona también una estructura de grupo sobre cualquier cúbica singular,
siempre y cuando eliminemos su punto singular.

Definición 2.29 Si E/k es una curva definida por una ecuación de Weierstrass,
llamaremos Er (k) al conjunto de los puntos regulares de E(k). Sabemos que
Er (k) coincide con E(k) salvo quizá por un punto, que puede ser un nodo
(racional o irracional) o una cúspide.
56 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Teorema 2.30 Sea E/k una cúbica definida por una ecuación de Weierstrass
con una cúspide o un nodo racional S. Entonces la suma en Er (k) definida
mediante la construcción descrita en el teorema 2.20 convierte a Er (k) en un
grupo abeliano.
a) Si S es un nodo racional con tangentes Y = α1 X + β1 , Y = α2 X + β2 ,
entonces la aplicación Er (k) −→ k ∗ dada por
y − α1 x − β1
(x, y) →
y − α2 x − β2
es un isomorfismo de grupos.
b) Si S es una cúspide con tangente Y = αX + β, entonces la aplicación
Er (k) −→ k + dada por
x − x(S)
(x, y) →
y − αx − β
es un isomorfismo de grupos.

Demostración: Vamos a demostrar que la aplicación descrita en cada


apartado es biyectiva, ası́ como que si una recta corta a Er (k) en dos puntos no
necesariamente distintos, el tercer punto también está en Er (k) y el producto
(resp. la suma) de las imágenes de los tres puntos es 1 (resp. 0). De aquı́ se sigue
inmediatamente que la aplicación correspondiente conserva las operaciones, por
lo que la suma en Er (k) cumple los axiomas de grupo.
Es claro que no perdemos generalidad cambiamos de sistema de referencia,
por lo que podemos suponer que la ecuación de E/k es una de las dos dadas
por el teorema 2.27:

Y 2 − X 3 = 0, Y 2 + XY − X 3 = 0.

En ambos casos el punto singular es S = (0, 0). Consideremos primero la


curva Y 2 − X 3 = 0, que tiene una cúspide con tangente Y = 0. La aplicación es
x
(x, y) → .
y
Si tomamos como coordenadas afines X y Z en lugar de X, Y , la ecuación
se transforma en Z − X 3 = 0 y la aplicación en (x, z) → x. Ahora el punto
singular S = [0, 0, 1] está en el infinito y O = (0, 0). La aplicación biyecta Er (k)
con k + , pues tiene inversa t → (t, t3 ).
Es claro que las rectas que pasan por S (las rectas verticales) cortan a Er (k)
en un único punto (contando multiplicidades), por lo que una recta que pase
por dos puntos de Er (k) no puede pasar por S (no es vertical). Esto implica
que la suma en Er (k) está bien definida y, dada una recta Z = aX + b que pase
por tres puntos P1 , P2 , P3 ∈ Er , tenemos que las coordenadas xi de Pi son las
raı́ces de la ecuación
(aX + b) − X 3 = 0.
2.3. Cúbicas singulares 57

Como no hay término en X 2 , concluimos que x1 + x2 + x3 = 0.


Pasemos ahora a la ecuación Y 2 + XY − X 3 = 0, que tiene un nodo en (0, 0)
con tangentes Y = 0 e Y = −X. La aplicación es (x, y) → 1 + x/y.
Si hacemos el cambio X = X  − Y  la ecuación se transforma en

XY − (X − Y )3 = 0

y la aplicación en (x, y) → x/y. Conviene observar que ahora la ecuación no


es de Weierstrass. Ahora O = [1, 1, 0] y S = (0, 0). Como en el caso anterior,
tomamos como variables afines X y Z, con lo que la curva se convierte en

XZ − (X − 1)3 = 0

y la aplicación en (x, z) → x. Ahora O = (1, 0) y S = [0, 0, 1]. La aplicación es


biyectiva (como aplicación Er (k) −→ k ∗ ), pues tiene inversa dada por

t → (t, (t − 1)3 /t).

Como en el caso anterior, las rectas que pasan por S son verticales y cortan
a Er (k) en un solo punto (o en ninguno en el caso de X = 0), por lo que la
suma está bien definida y si una recta (no vertical) Z = aX + b corta a Er (k)
en tres puntos P1 , P2 , P3 , las coordenadas xi correspondientes son las raı́ces de
la ecuación
X(aX + b) − (X − 1)3 = 0.
Como el coeficiente de X 3 es −1 y el término independiente es 1, concluimos
que x1 x2 x3 = 1.
Si la singularidad es un nodo irracional, se sigue cumpliendo parte del teo-
rema anterior: el conjunto Er (k) sigue siendo un grupo, aunque su estructura es
un poco más delicada. Llamemos K a la extensión cuadrática de k que contiene
a las pendientes de las tangentes a E por su nodo. Sea σ el k-automorfismo
no trivial de K. Las pendientes de las tangentes son las raı́ces de un polinomio
de k[T ], luego son conjugadas sobre k. Las dos tangentes son rectas que pasan
por un mismo punto racional con pendientes conjugadas, luego σ(α1 ) = α2 ,
σ(β1 ) = β2 .
La curva E/K tiene un nodo racional, luego podemos aplicarle el teorema
anterior. Si llamamos φ : Er (K) −→ K ∗ al isomorfismo correspondiente, para
cada P = (x, y) ∈ Er (K) tenemos que

y σ − α1σ xσ − β1σ y σ − α2 xσ − β2
φ(P )σ = = = φ(P σ )−1 .
y σ − α2σ xσ − β2σ y σ − α1 xσ − β1

Tenemos que P ∈ Er (k) si y sólo si P = P σ , si y sólo si φ(P ) = φ(P σ ), si


y sólo si φ(P )φ(P )σ = 1, si y sólo si NK
k (φ(P )) = 1. Ası́ pues, los elementos
de Er (k) se corresponden a través de φ con el núcleo de la norma, que es un
subgrupo de K ∗ , luego Er (k) es un subgrupo de Er (K). Hemos probado el
teorema siguiente:
58 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Teorema 2.31 Sea E/k una cúbica definida por una ecuación de Weierstrass
con un nodo irracional S. Entonces la suma en Er (k) definida mediante la
construcción descrita en el teorema 2.20 convierte a Er (k) en un grupo abeliano
isomorfo al núcleo de la norma de la extensión K/k, donde K es la adjunción
a k de las pendientes de las tangentes a E por su nodo.
El caso que más nos interesa es el de curvas definidas sobre cuerpos finitos:
Teorema 2.32 Si E/k es una cúbica singular definida por una ecuación de
Weierstrass sobre un cuerpo finito k de m elementos, entonces

 m − 1 si E/k tiene un nodo racional,
|Er (k)| = m + 1 si E/k tiene un nodo irracional,

m si E/k tiene una cúspide.
Demostración: El caso del nodo irracional se sigue de que la norma de una
extensión de cuerpos finitos es suprayectiva, luego, con la notación del teorema
anterior, |K ∗ | = m2 − 1 y el núcleo de la norma tiene (m2 − 1)/(m − 1) = m + 1
elementos.
Es claro que si la singularidad es un nodo entonces Er (k) es un grupo cı́clico,
mientras que si es una cúspide es un grupo elemental (producto de cı́clicos de
orden primo). Si k tiene orden primo Er (k) es cı́clico en cualquier caso.

2.4 Isogenias
Nos ocupamos ahora de las aplicaciones que conectan adecuadamente dos
curvas elı́pticas.
Definición 2.33 Una isogenia φ : E1 −→ E2 entre dos curvas elı́pticas es una
aplicación regular tal que φ(O) = O.
Obviamente la función constante O es una isogenia (la isogenia nula), y es
la única isogenia constante. Notemos que si ψ : E1 −→ E2 es una aplicación
regular entre curvas elı́pticas y P = ψ(O), entonces φ = ψ ◦ τ−P es una isogenia,
luego toda aplicación regular ψ entre curvas elı́pticas es composición de una
isogenia seguida de una traslación: ψ = φ ◦ τP .
Ahora probamos que las isogenias cumplen más de lo que parece indicar la
definición:
Teorema 2.34 Las isogenias son homomorfismos de grupos.
Demostración: Sea φ : E1 −→ E2 una isogenia entre curvas elı́pticas.
Podemos suponer que es no nula. Consideramos el diagrama siguiente,

E1  H0 (E1 )

φ φ
 
E2  H0 (E2 )
2.4. Isogenias 59

donde las flechas horizontales son los isomorfismos P → [P/O]. Obviamente es


conmutativo, luego φ es un homomorfismo de grupos.
Como consecuencia de este teorema, si φ : E1 −→ E2 es una isogenia no
nula, entonces N(φ) = φ−1 (O) es un subgrupo finito de E1 , cuyo orden es a lo
sumo el grado de φ. Los teoremas siguientes precisan esto mucho más:
Teorema 2.35 Sea φ : E1 −→ E2 una isogenia no nula.
a) Para cada Q ∈ E2 , el cardinal |φ−1 [Q]| es el grado de separabilidad de φ.
b) Para cada P ∈ E1 , el ı́ndice de ramificación eφ (P ) es el grado de insepa-
rabilidad de φ.
c) La aplicación N(φ) −→ G(k(E1 )/k(E2 )) definida por T → τ T es un iso-
morfismo de grupos.
d) Si φ es separable entonces es no ramificada y la extensión k(E1 )/k(E2 ) es
finita de Galois, de grado igual al grado de φ.
Demostración: a) Toda extensión de cuerpos de funciones algebraicas se
descompone en una extensión puramente inseparable (en la que cada primo del
cuerpo base es divisible entre un único primo de la extensión) seguida de una
extensión separable (en la que los primos no ramificados del cuerpo base son
divisibles entre tantos primos de la extensión como indica el grado). Por lo
tanto, en cualquier extensión casi todos los primos tienen tantos divisores como
indica el grado de separabilidad. En nuestro caso eso significa que casi todos
los puntos Q ∈ E2 cumplen el apartado a), pero φ es un epimorfismo de grupos,
luego todos los puntos de E2 tienen el mismo número de antiimágenes.
b) Por el mismo argumento, casi todos los primos de una extensión tienen
ı́ndice de ramificación igual al grado de inseparabilidad. Ahora bien, cualquier
par de puntos de E1 pueden conectarse por una traslación τ , la cual induce un k-
automorfismo de k(E1 ) que hace corresponder los respectivos divisores primos.
Ası́, todos los puntos de E1 han de tener el mismo ı́ndice de ramificación, luego
éste ha de ser el grado de inseparabilidad de φ.
c) Si T ∈ N(φ) y f ∈ k(E2 ), entonces
τ T (φ(f )) = τT ◦ φ(f ) = φ(f ),
luego τ T es ciertamente un k(E2 )-automorfismo de k(E1 ). Es fácil ver que la
aplicación T → τ T es un homomorfismo de grupos. La teorı́a de extensiones
de cuerpos nos da que |G(k(E1 )/k(E2 ))| es a lo sumo el grado de separabilidad
de la extensión, que es precisamente el orden de N(φ). Ası́ pues, si probamos
que el homomorfismo es inyectivo, será un isomorfismo. En efecto, si τ T = 1,
entonces, para toda f ∈ k(E1 ) tenemos que f (O) = τ T (f )(O) = f (T ), lo cual
sólo es posible si T = O.
d) Si φ es separable de grado n entonces es no ramificada por b), el núcleo
N(φ) tiene n elementos por a) y G(k(E1 )/k(E2 )) tiene también n elementos por
c), luego la extensión ha de ser de Galois.
60 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Teorema 2.36 Si φ : E1 −→ E2 y ψ : E1 −→ E3 son isogenias tales que


N(φ) ⊂ N(ψ) y φ es separable, entonces existe una isogenia λ : E2 −→ E3 tal
que el diagrama siguiente es conmutativo:

E1
φ
 E2


ψ
 λ
 
E3

Demostración: Por el teorema anterior, k(E1 ) es una extensión finita de


Galois de k(E2 ), y también es una extensión de k(E3 ). Todo k(E2 )-automorfismo
de k(E1 ) es de la forma τ T , con T ∈ N(φ) ⊂ N(ψ), y si f ∈ k(E3 ), entonces
τ T (ψ(f )) = f . Tenemos, pues, que el grupo de Galois fija a los elementos de
k(E3 ), lo que nos da las inclusiones

ψ[k(E3 )] ⊂ φ[k(E2 )] ⊂ k(E1 ).

La primera inclusión nos da un k-monomorfismo λ : k(E3 ) −→ k(E2 ) tal


que λ ◦ φ = ψ. Por consiguiente, existe una aplicación racional (que, de hecho,
será regular) λ : E2 −→ E3 tal que φ ◦ λ = ψ. De aquı́ se sigue que λ(O) = O,
luego λ es una isogenia.
De aquı́ se obtiene la unicidad del teorema siguiente:

Teorema 2.37 Sea E una curva elı́ptica y H un subgrupo finito de E. Entonces


existe una única curva elı́ptica E  (salvo isomorfismo) y una isogenia separable
φ : E −→ E  tal que N(φ) = H.

Demostración: Cada T ∈ H induce un k-automorfismo τ T de k(E). Lla-


memos K al subcuerpo de k(E) fijado por todos ellos. Entonces k(E)/K es una
extensión finita deGalois y su grupo de Galois es isomorfo a H (si a ∈ k(E),
entonces p(X) = (X − τ T (a)) ∈ K[X]).
T ∈H

Tenemos que k ⊂ K ⊂ k(E), y la extensión superior es finita, de donde se


sigue que K es un cuerpo de funciones algebraicas sobre k, luego existe una
curva proyectiva regular E  tal que k(E  ) es k-isomorfo a K. Componiendo
este isomorfismo con la inclusión K ⊂ k(E) obtenemos un k-monomorfismo
φ : k(E  ) −→ k(E), inducido por una aplicación regular φ : E −→ E  . Por
construcción φ[k(E  )] = K.
Vamos a ver que φ es no ramificada. Tomemos P ∈ E y T ∈ H. Para toda
f ∈ k(E  ), se cumple

f (φ(P + T )) = τ T (φ(f ))(P ) = φ(f )(P ) = f (φ(P )),

donde hemos usado que τ T fija a φ(f ) ∈ K. Esto implica que φ(P + T ) = φ(P ).
Para cada Q ∈ E  tomemos P ∈ E tal que φ(P ) = Q. Entonces Q tiene a lo
sumo tantas antiimágenes como el grado de φ, que es |H|, pero por otra parte
2.4. Isogenias 61

tiene como antiimágenes a los puntos P + T , con T ∈ H, que son distintos dos
a dos, luego todos los puntos de E  tienen exactamente |H| antiimágenes. Esto
sólo es posible si φ es no ramificada y, en virtud del teorema anterior, separable.
Ahora aplicamos la fórmula del género de Hurwitz, que para una extensión
no ramificada se reduce a

0 = 2gE − 2 = (2gE  − 2) grad φ,

luego el género de E  ha de ser gE  = 1. Si definimos O = φ(O), tenemos que


E  es una curva elı́ptica y φ es una isogenia.
Para probar la unicidad observamos que si ψ : E −→ E  fuera otra isogenia
de núcleo H, por el teorema anterior existirı́a una isogenia λ : E  −→ E  tal que
φ ◦ λ = ψ, pero λ serı́a un isomorfismo, ya que si λ(P ) = O podemos expresar
P = φ(Q), con Q ∈ E, pero entonces ψ(Q) = O, luego Q ∈ H y P = φ(Q) = O.

Notemos que la isogenia φ no es única, pues, por ejemplo, −φ cumple también


el teorema.

Ejemplo Supongamos que car k = 2 y consideremos la curva dada por la


ecuación
E1 : Y 2 = X 3 + aX 2 + bX.
Su discriminante es ∆ = 16b2 (a2 − 4b), luego E1 es una curva elı́ptica si
suponemos que b = 0 y b = a2 − 4b = 0. En estas condiciones, también es
elı́ptica la curva (de la misma familia) dada por

E2 : Y 2 = X 3 − 2aX 2 + b X.

Definimos φ : E1 −→ E2 como la aplicación dada por


 2 
Y Y (b − X 2 )
φ(X, Y ) = , .
X2 X2
Veamos que, en efecto, si (X, Y ) ∈ E1 con X = 0 entonces φ(X, Y ) ∈ E2 .
Hemos de ver que
Y6 Y4 Y2 Y 2 (b − X 2 )2
6
− 2a 4 + (a2 − 4b) 2 = .
X X X X4
Dividiendo entre Y 2 y multiplicando por X 6 esto equivale a

Y 4 − 2aX 2 Y 2 + (a2 − 4b)X 4 = b2 X 2 − 2bX 4 + X 6 .

Ahora basta sustituir en el miembro izquierdo Y 4 e Y 2 por la expresión que


proporciona la ecuación de E1 y comprobar que tenemos una identidad.
El único punto (finito) de E1 con X = 0 es (0, 0). Para calcular su imagen
expresamos φ en coordenadas homogéneas:

φ(X, Y ) = [Y 2 , Y (b − X 2 ), X 2 ].
62 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Vemos que las tres coordenadas se anulan, pero la primera tiene un cero de
orden 2 en (0, 0), la segunda de orden 1 y la tercera de orden 4. Por lo tanto,
basta dividir entre Y :
 
YX
φ(X, Y ) = Y, b − X , 2
2
,
X + aX + b

de donde concluimos que φ(0, 0) = [0, 1, 0] = O. Igualmente podemos compro-


bar que φ(O) = O, si bien esto se sigue de que φ es una isogenia.
Hemos comprobado que el núcleo de φ tiene orden 2, pues está formado por
O y (0, 0).
Observemos ahora que podemos construir una curva E3 a partir de E2 igual
que hemos construido E2 a partir de E1 . El resultado es

E3 : Y 2 = X 3 + 4aX 2 + 16bX.

Ahora bien, E3 es isomorfa a E1 a través de (X, Y ) → (X/4, Y /8). Al


componer la isogenia E2 −→ E3 análoga a φ con este isomorfismo obtenemos
una isogenia φ̂ : E2 −→ E1 dada por
 2 
Y Y (b − X 2 )
φ̂(X, Y ) = , ,
4X 2 8X 2

cuyo núcleo es también de orden 2.


La situación del ejemplo anterior no es casual: Aunque no es evidente en
absoluto, veremos que toda isogenia φ : E1 −→ E2 entre dos curvas elı́pticas
tiene asociada una isogenia dual φ̂ : E2 −→ E1 .
Terminamos la sección con una observación útil para trabajar con isogenias
en cuerpos de caracterı́stica prima:

Teorema 2.38 Si E es una curva elı́ptica sobre un cuerpo de caracterı́stica


prima p y m = pr , entonces la aplicación de Frobenius φ : E −→ E (m) es una
isogenia.

Demostración: Basta probar que la curva E (m) tiene género 1, pues en-
tonces podemos considerarla como una curva elı́ptica con neutro igual a φ(O), lo
que convierte a φ en una isogenia. Si K = k(E), entonces k(E (m) ) = K m . Todo
se reduce a probar que si K es un cuerpo de funciones algebraicas de género 1
sobre un cuerpo de caracterı́stica p, entonces K m también tiene género 1. De
aquı́ se sigue que no perdemos generalidad si suponemos que E ⊂ P2 está defi-
nida por una ecuación de Weierstrass, pero en tal caso E (m) está definido por la
ecuación de Weierstrass que resulta de elevar a m los coeficientes de la ecuación
de E. El discriminante de la ecuación de E (m) se obtiene también elevando a
m el discriminante de la ecuación de E, luego es no nulo.
2.5. Curvas conjugadas 63

2.5 Curvas conjugadas


Hemos visto que dos curvas elı́pticas son isomorfas si y sólo si tienen el mismo
invariante. Ahora bien, si estamos estudiando —por ejemplo— el conjunto de
puntos racionales de una curva elı́ptica dada E/k, no podemos sustituirla por
otra curva isomorfa cualquiera, pues E(k) puede cambiar completamente, sino
que a lo sumo podemos reemplazarla por una curva elı́ptica k-isomorfa. Esto
plantea diversas cuestiones que vamos a tratar aquı́, como en cuántas clases
distintas de curvas k-isomorfas se descompone una clase de isomorfı́a de curvas.

Cohomologı́a no abeliana Los problemas que vamos a abordar se tratan


más adecuadamente con unos mı́nimos rudimentos de cohomologı́a no abeliana:
Supongamos que el grupo de Galois G(k/k) actúa sobre un grupo M no
necesariamente abeliano, es decir, que tenemos un homomorfismo de grupos

ρ : G(k/k) −→ Aut(M ).

Diremos que la acción es discreta si para cada m ∈ M el estabilizador

Est(m) = {σ ∈ G(k/k) | mσ = m}

tiene ı́ndice finito en G(k/k) o, lo que es lo mismo, es de la forma G(k/l), para


cierta extensión finita l de k. Esto equivale a que la aplicación

ρ : G(k/k) × M −→ M

inducida por la acción sea continua cuando en G(k/k) consideramos la topologı́a


de Krull y en M la topologı́a discreta. En estas condiciones, definimos el grupo
de cohomologı́a

H 0 (k/k, M ) = {m ∈ M | mσ = m para todo σ ∈ G(k/k)}.

Un cociclo es una aplicación ξ : G(k/k) −→ M que cumple la relación

ξστ = ξτ ξστ .

Diremos que ξ es continuo si lo es respecto a la topologı́a de Krull y la


topologı́a discreta en M , es decir, si ξσ depende únicamente de la clase de σ
módulo un subgrupo de ı́ndice finito en G(k/k) o, dicho de otro modo, si ξ
está inducido por una aplicación ξ : G(l/k) −→ M , para cierta extensión finita
normal l de k.
Diremos que dos cociclos ξ y ζ son cohomólogos si existe un m ∈ M tal que

ξσ mσ = mζσ para todo σ ∈ G(k/k).

Cuando M es un grupo abeliano, los cociclos continuos forman un grupo con


el producto definido puntualmente, y la cohomologı́a de cociclos es la congruen-
cia respecto al subgrupo de las cocadenas (los cociclos cohomólogos al cociclo
64 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

constante 1). Sin embargo, cuando M no es abeliano los cociclos no forman un


grupo, aunque la cohomologı́a sigue siendo una relación de equivalencia. Por
lo tanto podemos definir el conjunto cociente del conjunto de todos los cociclos
continuos respecto a la relación de cohomologı́a, y lo representaremos por

H 1 (k/k, M ).

Grupos de automorfismos Si C/k es una curva proyectiva regular llamare-


mos Aut(C) al grupo de automorfismos de C en el sentido usual en geometrı́a
algebraica, es decir, al grupo de las biyecciones regulares con inversa regular de
C en sı́ misma.
Cuando C/k sea una curva elı́ptica escribiremos Autg (C) (donde la g hace
referencia a “automorfismos geométricos”) para distinguir a este grupo del grupo
de automorfismos algebraicos (automorfismos geométricos que además conser-
van la estructura de grupo). El teorema siguiente muestra la relación entre
ambos:

Teorema 2.39 Si E/k es una curva elı́ptica, la aplicación

Aut(E) × E −→ Autg (E)

dada por (φ, P ) → φτP (donde τP (Q) = P +Q) es biyectiva, y es un isomorfismo


de grupos si en Aut(E) × E consideramos el producto semidirecto inducido por
la acción natural de Aut(E) sobre E, es decir,

(φ, P )(ψ, Q) = (φψ, ψ(P ) + Q).

Demostración: La suprayectividad se debe a que todo automorfismo


geométrico que fije al neutro O es un isomorfismo algebraico. Por consiguiente,
dado α ∈ Autg (E), tomamos P = α(O) y φ = ατ−P , de modo que φ(O) = O,
luego φ ∈ Aut(E) y (φ, P ) → ατ−P τP = α.
La inyectividad es trivial, pues si φτP = ψτQ , evaluando en O obtenemos
P = Q, de donde también φ = ψ.
Por último vemos que el producto de las imágenes de (φ, P ) y (ψ, Q) es

φτP ψτQ = φψψ −1 τP ψτQ = φψτψ(P ) τQ = φψτψ(P )+Q ,

que es la imagen del par (φψ, ψ(P ) + Q).

Curvas conjugadas Introducimos ahora el concepto principal de esta sección:

Definición 2.40 Diremos que dos curvas proyectivas regulares C/k y C  /k


son conjugadas si son isomorfas (sobre k). Representaremos por Conj(C/k) al
conjunto cociente del conjunto de curvas conjugadas con C/k respecto de la
relación de equivalencia dada por la k-isomorfı́a.
2.5. Curvas conjugadas 65

Por ejemplo, todas las curvas elı́pticas En /Q dadas por Y 2 = X 3 − n2 X son


conjugadas (pues tienen invariante j = 1728), pero no son todas Q-isomorfas. Si
lo fueran, todos los números naturales serı́an congruentes (o no lo serı́a ninguno).
Notemos ahora que G(k/k) actúa discretamente sobre Aut(C) mediante la
−1
acción dada por φσ (P ) = φ(P σ )σ . En efecto, si φ está definido sobre l,
entonces G(k/l) estabiliza a φ.
Si C/k es una curva proyectiva regular y C  /k es una curva conjugada con
C/k, elegimos un isomorfismo φ : C  −→ C y, para cada σ ∈ G(k/k), definimos

ξσ = φ−1 ◦ φσ ∈ Aut(C).

Vamos a comprobar que se trata de un cociclo continuo. Ciertamente es un


cociclo:
ξστ = φ−1 ◦ φστ = (φ−1 φτ )(φ−1 φσ )τ = ξτ ξστ .
Además es continuo, pues si φ está definido sobre una extensión finita normal
l de k, entonces ξσ sólo depende de la clase de σ módulo G(k/l).
Ahora demostramos que la clase de cohomologı́a [ξ] ∈ H 1 (k/k, Aut(C)) sólo
depende de la clase de conjugación de C/k. En efecto, si C  /k es una curva
k-isomorfa a C/k y ψ : C  −→ C es un isomorfismo, hemos de probar que los
cociclos ξσ = φ−1 ◦ φσ y ζσ = ψ −1 ◦ ψ σ son cohomólogos.
Tomemos un k-isomorfismo θ : C  −→ C  y sea α = φ−1 ◦ θ ◦ ψ ∈ Aut(C).
Entonces
ξσ ασ = φ−1 ◦ θ ◦ ψ σ = φ−1 ◦ θ ◦ ψ ◦ ζσ = αζσ .
Con esto tenemos probada una parte del teorema siguiente:

Teorema 2.41 Sea C/k una curva proyectiva regular. Para cada curva C  /k
conjugada con C/k elegimos un isomorfismo φ : C  −→ C y para cada auto-
morfismo σ ∈ G(k/k) definimos ξσ = φ−1 ◦ φσ . Entonces la correspondencia
C  /k → ξ induce una biyección

Conj(C/k) −→ H 1 (k/k, Aut(C)).

Demostración: Tenemos probada la existencia de la aplicación inducida.


Falta ver que es biyectiva. Supongamos que C  /k y C  /k son curvas conjugadas
con C/k que determinan la misma clase de cohomologı́a. Elegimos isomorfismos
φ : C  −→ C y ψ : C  −→ C y formamos los cociclos ξσ = φ−1 ◦ φσ , ζσ =
ψ −1 ◦ ψ σ . Por hipótesis existe α ∈ Aut(C) tal que ξσ ασ = αζσ , para todo
σ ∈ G(k/k). Consideramos el isomorfismo θ = φ ◦ α ◦ ψ −1 : C  −→ C  . Vamos
a probar que está definido sobre k. En efecto, si σ ∈ G(k/k), tenemos que

θσ = φσ ◦ ασ ◦ (ψ −1 )σ = φ ◦ ξσ ασ ◦ (ψ −1 )σ = φ ◦ αζσ ◦ (ψ −1 )σ = φ ◦ α ◦ ψ −1 = θ.

Esto prueba que la correspondencia es inyectiva. La parte más delicada es


la suprayectividad. Consideremos un cociclo ξ : G(k/k) −→ Aut(C). Cada
66 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

σ ∈ G(k/k) determina un automorfismo ξσ : C −→ C, el cual determina a su


vez un k-automorfismo de cuerpos ξ¯σ : k(C) −→ k(C).
Para cada f ∈ k(C) definimos f σ = ξ¯σ (f σ ). Se comprueba inmediatamente
que se trata de una acción discreta de G(k/k) sobre k(C) (distinta de la usual,
denotada por f σ ). Definimos
L = {f ∈ k(C) | f σ = f para todo σ ∈ G(k/k)}.
Es claro que L es un subcuerpo de k(C). Además L ∩ k = k, pues si f ∈ k
se cumple que f σ = f σ . Veamos ahora que kL = k(C). Tomamos f ∈ k(C) y
sea l/k una extensión finita normal tal que f σ = f para todo σ ∈ G(k/l). Sea
α1 , . . . , αn una k-base de l y sea G(l/k) = {σ1 , . . . , σn }. Los elementos

n 
n
σ
gi = (αi f )σj = αi j (f σj )
j=1 j=1

están claramente en L.
σ
Por otra parte, la matriz (αi j ) es regular, pues el cuadrado de su determi-
nante es el discriminante de la base. Esto nos permite despejar cada f σj (en
particular f ) como combinación lineal de los gi , lo que prueba que f ∈ kL.
En particular tenemos que L tiene grado de trascendencia 1 sobre k, luego
es un cuerpo de funciones algebraicas sobre el cuerpo de constantes (exacto) k.
Esto implica que L es k-isomorfo a k(C  ), donde C  /k es una curva proyectiva
regular.
El isomorfismo se extiende a un k-isomorfismo φ : k(C) −→ k(C  ). A través
de φ, la acción que hemos definido en k(C) se corresponde con una acción de
G(k/k) en k(C  ) que fija a k(C  ) y coincide con la natural sobre k. Ahora bien,
estas dos propiedades determinan completamente a dicha acción, luego ésta ha
de coincidir con la acción usual de G(k/k) sobre k(C  ). En otros términos,
para toda función f ∈ k(C) y todo σ ∈ G(k/k) tenemos que φ(f )σ = φ(f σ) =
φ(ξσ ◦ f σ ).
Sea φ : C  −→ C el isomorfismo de curvas que induce el k-isomorfismo φ, es
decir, tal que φ(f ) = φ ◦ f . Entonces
φσ ◦ f σ = φ ◦ ξσ ◦ f σ ,
para toda f ∈ k(C), de donde podemos concluir que φσ = φ ◦ ξσ o, lo que es lo
mismo, ξσ = φ−1 ◦φσ . Esto significa que la clase de la curva C  /k en Conj(C  /k)
se corresponde con la clase de ξ en H 1 (k/k, Aut(C)).

Espacios Homogéneos Vamos a ver que si E/k es una curva elı́ptica, las
curvas conjugadas con E/k determinadas por cociclos con valores en E tienen
una estructura adicional. En primer lugar describiremos dicha estructura y
luego la relacionaremos con la cohomologı́a.
Definición 2.42 Sea E/k una curva elı́ptica un espacio homogéneo (principal)
para E/k es una curva proyectiva regular C/k junto con una aplicación regular
+ : C × E −→ C definida sobre k que cumpla las propiedades siguientes:
2.5. Curvas conjugadas 67

a) p + O = p, para todo p ∈ C,

b) (p + P ) + Q = p + (P + Q), para todo p ∈ C, P , Q ∈ E,

c) Para cada p ∈ C, la aplicación θp : E −→ C dada por θp (P ) = p + P es


un isomorfismo.

En particular, la propiedad c) implica que todo espacio homogéneo sobre


E/k es una curva conjugada con E/k. Otra consecuencia es que para cada
par de puntos p, q ∈ C existe un único punto P ∈ E tal que p + P = q.
Representaremos a este punto por P = q − p.
Notemos que la resta − : C × C −→ E es una aplicación regular definida
sobre k. En efecto, fijamos un punto p0 ∈ C y observamos que1

θp−1
0
(q) − θp−1
0
(p) = p0 + θp−1
0
(q) − (p0 + θp−1
0
(p)) = q − p.

Como θp−1
0
(y la resta en E) es regular, concluimos que la resta en C también
lo es. Por otra parte, si σ ∈ G(k/k), vemos que
−1
θpσ (P ) = θp (P σ )σ = pσ + P = θpσ (P ),

luego θpσ = θpσ y, en consecuencia, (θp−1 )σ = θp−1


σ . Por consiguiente:

(p − q)σ = θq−1 (p)σ = (θqσ )−1 (pσ ) = θq−1 σ


σ (p ) = p
σ
− qσ ,

lo que significa que la resta está definida sobre k.


Diremos que dos espacios homogéneos C/k y C  /k para una curva elı́ptica
E/k son equivalentes si existe un isomorfismo θ : C −→ C  definido sobre k tal
que
θ(p + P ) = θ(p) + P,
para todo p ∈ C, P ∈ E.
Definimos el grupo de Weil-Châtelet de una curva elı́ptica E/k como el con-
junto de clases de equivalencia de espacios homogéneos para E/k. (Enseguida
veremos que tiene una estructura natural de grupo.) Lo representaremos por
WC(E/k).
Es claro que E/k es un espacio homogéneo para sı́ misma considerando la
acción definida por traslaciones. Los espacios homogéneos equivalentes a E/k
se llaman triviales. Veremos que la clase trivial es el elemento neutro del grupo
de Weil-Châtelet. En primer lugar damos una caracterización sencilla:

Teorema 2.43 Si C/k es un espacio homogéneo para una curva elı́ptica E/k,
entonces C/k es trivial si y sólo si C(k) = ∅.
1 Aquı́usamos que, en general, (q +Q)−(p+P ) = (q −p)+(Q−P ), pues esto es equivalente
a q + Q = p + P + (q − p) + Q − P , que es una consecuencia inmediata de la definición de
espacio homogéneo.
68 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

Demostración: Si C/k es trivial y θ : E −→ C es una equivalencia de


espacios homogéneos, entonces θ(O) ∈ C(k).
Recı́procamente, si p0 ∈ C(k), el isomorfismo θp0 : E −→ C está definido
sobre k y es una equivalencia de espacios homogéneos, pues

θp0 (P + Q) = p0 + P + Q = θp0 (P ) + Q.

Ejemplo Si E/k es una curva elı́ptica sobre un cuerpo finito k, entonces


WC(E/k) = 0.
Esto es consecuencia de que todo cuerpo de funciones algebraicas sobre un
cuerpo finito tiene al menos un divisor primo de grado 1. En particular, si C/k
es un espacio homogéneo para E/k, tenemos que k(C) tiene un divisor primo
de grado 1, que se corresponde con un punto de C(k) y, por consiguiente, C/k
determina la clase trivial en WC(E/k).
Teorema 2.44 Si E/k es una curva elı́ptica, existe una biyección

WC(E/k) −→ H 1 (G(k/k), E)

definida como sigue: para cada clase [C/k] ∈ WC(E/k) elegimos p0 ∈ C y le


asignamos la clase del cociclo {pσ0 − p0 }σ .

Demostración: Veamos que la aplicación está bien definida. En primer


lugar, {pσ0 − p0 }σ es un cociclo:

0 − p0 = (p0 − p0 ) + (p0 − p0 ) = (p0 − p0 ) + (p0 − p0 ).


pστ στ τ τ σ τ τ

Además es continuo, pues si p0 ∈ k  , depende sólo de la clase de σ módulo


G(k/k  ).
En segundo lugar, la imagen no depende de la elección del representante
C/k ni del punto p0 , pues si C  /k es un espacio equivalente y p0 ∈ C  (k), sea
θ : C −→ C  la equivalencia. Entonces

pσ0 − p0 = θ(pσ0 ) − θ(p0 ) = (pσ  σ 


0 − p0 ) + (θ(p0 ) − p0 ) − (θ(p0 ) − p0 ),
σ

luego los cociclos {pσ0 −p0 }σ y {pσ 


0 −p0 }σ se diferencian en la cocadena inducida

por m = θ(p0 ) − p0 e inducen la misma clase de cohomologı́a.
Ahora veamos que la aplicación es inyectiva. Si dos espacios homogéneos
C/k y C  /k determinan cociclos cohomólogos {pσ0 − p0 }σ y {pσ
0 − p0 }σ , entonces
existe un m ∈ E tal que

pσ0 − p0 = (pσ 
0 − p0 ) + (m − m),
σ

para todo σ ∈ G(k/k). Definimos θ : C −→ C  mediante θ(p) = p0 +(p−p0 )+m.


Es claro que θ es un isomorfismo. Además, si σ ∈ G(k/k) vemos que
−1 −1
θσ (p) = θ(pσ )σ = (p0 + (pσ − p0 ) + m)σ = pσ
0 + (p − p0 ) + m
σ σ
2.5. Curvas conjugadas 69

= p0 + (pσ 
0 − p0 ) + (p − p0 ) + (m − m) + m
σ σ

= p0 + (pσ0 − p0 ) + (p − pσ0 ) + m = p0 + (p − p0 ) + m = θ(p),


luego θ está definido sobre k. Se comprueba inmediatamente que θ es compatible
con la acción de E, luego C/k y C  /k son equivalentes.
Por último, veamos que la aplicación es suprayectiva. El teorema 2.39 nos
permite ver a E como subgrupo de Autg (E), luego también podemos ver un
cociclo {ξσ }σ sobre E como cociclo sobre Autg (E). Enseguida veremos que
hemos de pasar al cociclo {−ξσ }σ . El teorema 2.41 nos da una curva C/k junto
con un isomorfismo φ : C −→ E tal que para todo σ ∈ G(k/k) se cumple
φ−1 ◦ φσ = −ξσ . En particular,

(φ−1 )σ ◦ φ = −ξσσ−1 = ξσ ,

donde hemos usado la ecuación de los cociclos teniendo en cuenta que ξ1 = O.


Definimos + : C × E −→ C mediante p + P = φ−1 (φ(p) + P ). Veamos que
la suma está definida sobre k. Para ello tomamos σ ∈ G(k/k) y calculamos

(p + P )σ = (φ−1 )σ (φσ (pσ ) + P σ ) = φ−1 (φ(pσ ) − ξσ + P σ + ξσ ) = pσ + P σ .

Ahora es inmediato comprobar que C/k es un espacio homogéneo con esta


suma (su estructura es la trasladada a través de φ de la estructura trivial de
espacio homogéneo en E/k). Para calcular su cociclo, tomamos p0 = φ−1 (O),
con lo que

pσ0 − p0 = (φ−1 )σ (O) − φ−1 (O) = φ−1 (O + ξσ ) − φ−1 (O) = ξσ ,

pues, ciertamente, φ−1 (O) + ξσ = φ−1 (O + ξσ ) por la definición de la suma.

Como E es un grupo abeliano, H 1 (G(k/k), E) es un grupo, luego la biyección


descrita en el teorema anterior induce una estructura de grupo en el conjunto
WC(E/k). Es inmediato que el elemento neutro es la clase trivial.

Curvas elı́pticas conjugadas Nos ocupamos ahora de las curvas conjugadas


con una curva elı́ptica dada E/k correspondientes a cociclos con valores en el
grupo Aut(E) de los automorfismos de E como curva elı́ptica.
Notemos que el teorema 2.39 nos da homomorfismos de grupos

i : Aut(E) −→ Autg (E), j : Autg (E) −→ Aut(E)

tales que i ◦ j = 1, donde i es la inclusión. Estos homomorfismos inducen a su


vez aplicaciones

i : H 1 (G(k/k), Aut(E)) −→ H 1 (G(k/k), Autg (E)),

j : H 1 (G(k/k), Autg (E)) −→ H 1 (G(k/k), Aut(E))


70 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

tales que i◦j = 1, por lo que i es inyectiva y podemos ver a H 1 (G(k/k), Aut(E))
como subconjunto de H 1 (G(k/k), Autg (E)).
Diremos que dos curvas elı́pticas E/k y E  /k son conjugadas sobre k como
curvas elı́pticas (no sólo como curvas) si son isomorfas sobre k (a través de un
isomorfismo de curvas elı́pticas, es decir, un isomorfismo que hace corresponder
los elementos neutros respectivos). Representaremos por ConjO (E/k) el con-
junto de clases de k-isomorfı́a de curvas elı́pticas E  /k conjugadas con E en este
sentido.

Teorema 2.45 Si E/k es una curva elı́ptica, la biyección del teorema 2.41 se
restringe a una biyección

ConjO (E/k) −→ H 1 (G(k/k), Aut(E)).

Demostración: Sea E  /k una curva elı́ptica conjugada con E/k. Sea


φ : E  −→ E un isomorfismo. Entonces

(φ−1 ◦ φσ )(O) = φσ (φ−1 (O)) = φσ (O ) = φ(O )σ = Oσ = O,

luego φ−1 ◦ φσ ∈ Aut(E).


Recı́procamente, si una curva E  /k determina un cociclo {φ−1 ◦ φσ }σ con
imagen en Aut(E) (donde φ : E  −→ E es un isomorfismo de curvas), entonces,
llamando O = φ−1 (O), vemos que

φσ (φ−1 (O)) = O,

luego Oσ = O , lo que significa que O ∈ E(k) y podemos considerar a E  /k


como curva elı́ptica sobre k con neutro O, y φ se convierte en un isomorfismo
de curvas elı́pticas.
El teorema 2.12 muestra que si la caracterı́stica de k es distinta de 2 y
3 entonces Aut(E) es un grupo cı́clico, luego ConjO (E/k) tiene también una
estructura natural de grupo. Es fácil calcularlo explı́citamente:

Teorema 2.46 Sea E/k una curva elı́ptica sobre un cuerpo k de caracterı́stica
distinta de 2 y 3. Sea

 2 si j(E) = 0, 1728,
n = 4 si j(E) = 1728,

6 si j(E) = 0.

Entonces ConjO (E/k) ∼= k ∗ /k ∗n . Explı́citamente, si E/k admite una ecua-


ción de Weierstrass Y = X 3 + a4 X + a6 , entonces cada clase d (mód k ∗n ) se
2

corresponde con la curva elı́ptica dada por


Y 2 = X 3 + d2 a4 X + d3 a6 si j(E) = 0, 1728,
Y 2 = X 3 + da4 X si j(E) = 1728,
Y 2 = X 3 + da6 si j(E) = 0.
2.5. Curvas conjugadas 71

Demostración: En la demostración del teorema 2.12 se ve que Aut(E) es


un grupo cı́clico de orden n. Por lo tanto, si llamamos Cn al grupo de las raı́ces
n-simas de la unidad de k, tenemos que Aut(E) ∼ = Cn (aquı́ usamos la hipótesis
sobre la caracterı́stica). Consideramos la sucesión exacta

0 −→ Cn −→ k ∗ −→ k ∗ −→ 0,
n

de la que extraemos la sucesión de cohomologı́a:

−→ k ∗ −→ k ∗ −→ H 1 (G(k/k), Cn ) −→ H 1 (G(k/k), k ∗ ) −→
n δ

El último grupo es trivial por el teorema de Hilbert-Speiser, luego δ induce


un isomorfismo H 1 (G(k/k), Cn ) ∼= k ∗ /k ∗n .
Para calcular explı́citamente el isomorfismo, supongamos √ primeramente
√ que
j = 0, 1728. Si d ∈ k ∗ y σ ∈ G(k/k), definimos χd (σ) = ( d)σ / d ∈ {±1}.
Es claro que χd (σ) no depende de la elección de la raı́z cuadrada. De hecho, es
fácil ver que δ([d]) = [{χd (σ)}σ ].
Si llamamos E  /k a la curva indicada en el enunciado, observamos que un
isomorfismo φ : E  −→ E viene dado por φ(X, Y ) = (d−1 X, d−3/2 Y ), de modo
que φσ (X, Y ) = (d−1 X, χd (σ)d−3/2 Y ) y

(φ−1 ◦ φσ )(X, Y ) = (X, χd (σ)Y ) = χd (σ)(X, Y ).

Por consiguiente, la curva del enunciado se corresponde con [d].


Veamos ahora el caso j(E) = 1728. Ahora Aut(E) consta de cuatro auto-
morfismos de la forma (X, Y ) → (u2 X, u3 Y ), donde u es una raı́z cuarta de la
unidad. √
Partimos
√ de
√ una clase [d] ∈ k ∗ /k ∗4 , elegimos 4 d ∈ k y formamos el cociclo
ξσ = ( 4 d)σ / 4 d. Entonces δ([d]) = [{ξσ }σ ]. En este caso el isomorfismo es
φ(X, Y ) = (d−1/2 X, d−3/4 Y ), con lo que φσ (X, Y ) = (ξσ2 d−1/2 X, ξσ3 d−3/4 Y ) y

(φ−1 ◦ φσ )(X, Y ) = (ξσ2 X, ξσ3 Y ) = ξσ (X, Y ).

El caso j(E) = 0 es análogo.


Recı́procamente, es fácil decidir si dos curvas dadas son o no k-isomorfas:

Teorema 2.47 Sean E/k y E  /k dos curvas elı́pticas conjugadas sobre un cuer-
po k de caracterı́stica = 2, 3 definidas mediante ecuaciones canónicas:

E : Y 2 = X 3 + a4 X + a6 , E  : Y 2 = X 3 + a4 X + a6 .

Entonces E y E  son k-isomorfas si y sólo si se cumple la condición siguiente:



a) Si j = 0, 1728, entonces a6 /a6 ∈ k.

b) Si j = 1728, entonces 4 a6 /a6 ∈ k.
72 Capı́tulo 2. La geometrı́a de las curvas elı́pticas

c) Si j = 0, entonces 6
a6 /a6 ∈ k.

Demostración: Que las curvas sean conjugadas significa simplemente que


tienen el mismo invariante j. Observemos que j = 0 equivale a que a4 = a4 = 0,
mientras que j = 1728 equivale a que a6 = a6 = 0.
Los únicos cambios de variables que transforman una ecuación de este tipo
en otra son los de la forma X = u2 X  , Y = u3 Y  . Por lo tanto, las dos curvas
serán k-isomorfas si y sólo si existe un u ∈ k ∗ tal que

a4 = u−4 a4 , a6 = u−6 a6 . (2.7)



En el caso j = 0, 1728, si existeel isomorfismo entonces a6 /a6 = u3 ∈ k.
Recı́procamente, supongamos que a6 /a6 ∈ k. La igualdad de los invariantes
se traduce en la relación  2  3
a6 a4
= .
a6 a4
En general, si tenemos una relación v 2 = w3 , podemos llamar r = v/w y
entonces r3 = v. En nuestro caso concluimos que a6 /a6 tiene raı́z cúbica en k.
Por otra parte, si u = v 2 = w3 , entonces u = r6 , con r = v/w. Nosotros tenemos
que a6 /a6 tiene raı́z cuadrada (por hipótesis) y raı́z cúbica en k, luego tiene una
raı́z sexta: a6 /a6 = u6 . A su vez, (a4 /a4 )3 = (u4 )3 , luego a4 /a4 = ωu4 , donde
ω ∈ k cumple ω 3 = 1. Cambiamos u por ωu y entonces se cumple a4 /a4 = u4
sin dejar de cumplirse a6 /a6 = u6 .
En los casos j = 0 (a4 = 0), o j = 1728 (a6 = 0) las condiciones (2.7) son
exactamente las del enunciado.

Curvas de género 1 Si C/k es una curva proyectiva regular de género 1, no


es necesariamente una curva elı́ptica sobre k, pues para ello hace falta además
que tenga un punto racional. En cualquier caso, será una curva elı́ptica sobre
k tomando como elemento neutro cualquier punto O ∈ C. Podemos encontrar
un isomorfismo φ : C −→ E, donde E es una curva dada por una ecuación
de Weierstrass. Ahora bien, si σ ∈ G(k/k) entonces tenemos un isomorfismo
φσ : C −→ E σ , luego las curvas E y E σ son isomorfas, luego tienen el mismo
invariante j(E) = j(E)σ . Esto prueba que j(E) ∈ k. Por el teorema 2.10 existe
una curva elı́ptica E  /k con invariante j(E), luego hemos llegado a que C/k es
conjugada con una curva elı́ptica E  /k.
Sea φ : C −→ E  un isomorfismo y consideremos el cociclo ξσ = φ−1 ◦ φσ .
Por el teorema 2.39, podemos descomponer ξσ = ζσ τPσ , con ζσ ∈ Aut(E  ) y
Pσ ∈ E  . Como la proyección sobre Aut(E  ) es un homomorfismo de grupos, es
fácil ver que {ζσ }σ es también un cociclo, el cual determina una curva elı́ptica
E/k conjugada con E. Sea ψ : E −→ E  un isomorfismo tal que ψ −1 ◦ ψ σ = ζσ .
Vamos a calcular el cociclo correspondiente al isomorfismo φ ◦ ψ −1 : C −→ E:

(φ ◦ ψ −1 )−1 ◦ (φ ◦ ψ −1 )σ = ψ ◦ φ−1 ◦ φσ ◦ (ψ −1 )σ = ψ ◦ ζσ τPσ ◦ (ψ −1 )σ

= ψ σ ◦ τPσ ◦ (ψ −1 )σ = τ(ψ−1 )σ (Pσ ) .


2.5. Curvas conjugadas 73

Ası́ pues, C/k se corresponde con una clase de H 1 (G(k/k), E), y por el
teorema 2.44 admite una estructura de espacio homogéneo para E/k. Con esto
casi hemos demostrado el teorema siguiente:

Teorema 2.48 Si C/k es una curva proyectiva regular de género 1, existe una
curva elı́ptica E/k (única salvo k-isomorfismo) tal que C/k admite una estruc-
tura de espacio homogéneo para E/k.

Demostración: Sólo falta probar la unicidad. Supongamos que C/k es un


espacio homogéneo para las dos curvas E/k y E  /k. Fijemos un punto p0 ∈ C
y consideremos los isomorfismos θp0 : E −→ C, θp 0 : D −→ C dados por
θp0 (P ) = p0 + P , θp 0 (P  ) = p0 + P  .
Entonces φ : θp0 ◦ θp−10
: E −→ E  es un isomorfismo de curvas elı́pticas, pues
−1 
φ(O) = θp0 (p0 ) = O , y está definido sobre k, pues
−1 −1 −1
φσ (P ) = φ(P σ )σ = θp−1
σ (θpσ (P
0
σ
))σ = θp−1 σ
σ (p0 + P
σ
)σ = P.
0 0

Ası́ pues, E/k y E  /k son k-isomorfas.


Capı́tulo III

El álgebra de las curvas


elı́pticas

En este capı́tulo estudiamos la estructura de grupo de una curva elı́ptica


definida sobre un cuerpo algebraicamente cerrado, junto con las estructuras
relacionadas con ella. Por ejemplo, observamos que las isogenias de una curva
elı́ptica en sı́ misma forman un anillo con la suma definida puntualmente y la
composición como producto. En la primera sección definimos este anillo de
endomorfismos, pero sólo al llegar a la última sección estaremos en condiciones
de determinar su estructura.

3.1 Las multiplicaciones enteras


Definición 3.1 Si E y E  son dos curvas elı́pticas, llamamos Hom(E, E  ) al
conjunto de todas las isogenias de E en E  , que es un grupo abeliano con la
suma definida puntualmente (es obvio que la suma de isogenias es una isogenia).
Definimos End(E) como el conjunto de todas las isogenias de E en E, que es un
anillo (no necesariamente conmutativo) tomando como producto la composición
de aplicaciones.
De momento lo único que conocemos del anillo de endomorfismos de una
curva elı́ptica es su grupo de unidades, que es el grupo Aut(E) descrito en el
teorema 2.12.
Si E es una curva elı́ptica y m ∈ Z, representaremos también por m a la
isogenia m : E −→ E definida por la multiplicación por m en el sentido usual
de la teorı́a de grupos m → mP . Ciertamente es una isogenia (definida sobre
k si E lo está). La aplicación Z −→ End(E) que a cada m ∈ Z le asigna la
multiplicación por m es claramente un homomorfismo de anillos. No es evidente
en absoluto, pero vamos a probar que es inyectivo. Para ello necesitaremos el
teorema siguiente que, en contra de lo que podrı́a parecer a primera vista, no
es una consecuencia inmediata de las definiciones, sino una conexión no trivial
entre la suma en una curva elı́ptica (una operación especı́fica de las curvas

75
76 Capı́tulo 3. El álgebra de las curvas elı́pticas

elı́pticas) y la suma de formas diferenciales (una operación general de las curvas


proyectivas).

Teorema 3.2 Sean φ, ψ : E −→ E  dos isogenias entre curvas elı́pticas y sea


ω una diferencial invariante en E  . Entonces

φ + ψ(ω) = φ(ω) + ψ(ω).

Demostración: Adoptamos el convenio de que si φ es la isogenia nula


entonces φ : Ω(E  ) −→ Ω(E) es la aplicación nula. Entonces la igualdad es
trivialmente cierta si φ = 0 o ψ = 0. Supongamos ahora que ambas son no
nulas pero que φ + ψ = 0. Entonces ψ = −φ, es decir, ψ es la composición
de φ : E −→ E  con −1 : E  −→ E  (la aplicación Q → −Q). Por lo tanto,
ψ = −1 ◦ φ y en este caso basta probar que −1(ω) = −ω.
Sea k(E  ) = k(x , y  ), donde las funciones x , y  satisfacen una ecuación de
Weierstrass. Entonces el teorema 2.21 nos da que

−1(x ) = x , −1(y  ) = −y  − a1 x − a3 ,

y por el teorema 2.14 tenemos que, salvo una constante que podemos despreciar,

dx
ω= ,
2y  + a1 x + a3
luego

dx dx
−1(ω) = =−  = −ω.
2(−y  − a1 x 
− a3 ) + a1 x + a3 2y + a1 x + a3

Ası́ pues, podemos suponer que las tres isogenias φ, ψ y φ + ψ son no nulas.
Como en el caso anterior, sea k(E  ) = k(x , y  ), donde las funciones x , y 
satisfacen una ecuación de Weierstrass F (x , y  ) = 0. Según el teorema 2.14,
tenemos que
dx dy 
ω=  
=− .
FY (x , y ) FX (x , y  )
Sean x1 , y1 , x2 , y2 dos pares de funciones en k(E) que cumplan F (xi , yi ) = 0.
Luego tomaremos

x1 = φ(x ), y1 = φ(y  ), x2 = ψ(x ), y2 = ψ(y  ), (3.1)

pero el argumento requiere razonar primero con funciones arbitrarias. Derivando


la ecuación obtenemos que
dxi dyi
ω(xi , yi ) = =− .
FY (xi , yi ) FX (xi , yi )

El teorema 2.21 nos da dos funciones racionales

R(X1 , Y1 , X2 , Y2 ) y S(X1 , Y1 , X2 , Y2 )
3.1. Las multiplicaciones enteras 77

tales que, para cada par de puntos (P, Q) con x (P ) = x (Q) se cumple
x (P + Q) = R(x (P ), y  (P ), x (Q), y  (Q)),
y  (P + Q) = S(x (P ), y  (P ), x (Q), y  (Q)).
Definimos x3 = R(x1 , y1 , x2 , y2 ), y3 = S(x1 , y1 , x2 , y2 ) ∈ k(E). En el caso
particular (3.1) se cumple
x3 = φ + ψ(x ), y3 = φ + ψ(y  ). (3.2)
En general:
∂R ∂R ∂R ∂R
dx3 = dx1 + dy1 + dx2 + dy2
∂x1 ∂y1 ∂x2 ∂y2
   
∂R ∂R FX (x1 , y1 ) ∂R ∂R FX (x2 , y2 )
= + − dx1 + + − dx2 .
∂x1 ∂y1 FY (x1 , y1 ) ∂x2 ∂y2 FY (x2 , y2 )
De aquı́ llegamos a que
ω(x3 , y3 ) = M1 (x1 , y1 , x2 , y2 ) ω(x1 , y1 ) + M2 (x1 , y1 , x2 , y2 ) ω(x2 , y2 ), (3.3)
para ciertas funciones racionales M1 y M2 .
Tomemos x1 = φ(x ), y1 = φ(y  ), x2 = x (Q), y2 = y  (Q), donde Q ∈ E 
es un punto sobre el que están definidas x e y  . Notemos que las funciones
constantes x2 , y2 cumplen ciertamente F (x2 , y2 ) = 0. Con esta elección, para
cada P ∈ E tal que x (φ(P )) = x2 , tenemos que
x3 (P ) = R(φ(x ), φ(y  ), φ(x2 ), φ(y2 ))(P ) = φ(R(x , y  , x2 , y2 ))(P )
= R(x (φ(P ), y  (φ(P ), x (Q), y  (Q)) = x (φ(P ) + Q)
= x (τQ (φ(P ))) = φ(τ Q (x ))(P ).
Por lo tanto x3 = φ(τ Q (x )), e igualmente y3 = φ(τ Q (y  )). Teniendo en
cuenta el teorema 2.24, de aquı́ llegamos a que
ω(x3 , y3 ) = φ(τ Q (ω(x , y  ))) = φ(τ Q (ω)) = φ(ω) = ω(φ(x ), φ(y  )) = ω(x1 , y1 ).
Por otra parte, como x2 es constante se cumple dx2 = 0, luego ω(x2 , y2 ) = 0
y (3.3) se reduce a
ω(x1 , y1 ) = M1 (φ(x ), φ(y  ), x (Q), y  (Q)) ω(x1 , y1 ),
luego M1 (φ(x ), φ(y  ), x (Q), y  (Q)) = 1 para todo punto Q ∈ E  donde estén de-
finidas x e y  . Obviamente entonces M1 (φ(x ), φ(y  ), ψ(x ), ψ(y  )) = 1. Análoga-
mente se llega a la misma conclusión para M2 , con lo que (3.1), (3.2) y (3.3)
nos dan la relación
ω(φ + ψ(x ), φ + ψ(y  )) = ω(φ(x ), φ(y  )) + ω(ψ(x ), ψ(y  ))
o, lo que es lo mismo: φ + ψ(ω) = φ(ω) + ψ(ω).
Al aplicar este teorema a las multiplicaciones por enteros obtenemos lo si-
guiente:
78 Capı́tulo 3. El álgebra de las curvas elı́pticas

Teorema 3.3 Si E es una curva elı́ptica, ω es una diferencial invariante en E


y m ∈ Z, entonces mω = mω.

Demostración: El teorema es cierto para m = 0 por definición y clara-


mente también para m = 1. El teorema anterior nos da las relaciones

m + 1ω = mω + ω, −mω = −mω.

La primera nos da la conclusión para m ≥ 0 por inducción, y la segunda la


extiende a los números negativos.
Como consecuencia:

Teorema 3.4 Sea E una curva elı́ptica y sea m ∈ Z, m = 0. Supongamos que


car k = 0 o que car k es un primo que no divide a m. Entonces la multiplicación
por m es una isogenia separable (no nula).

Demostración: El teorema anterior y las hipótesis sobre la caracterı́stica


implican que mω = mω = 0, luego la multiplicación por m no es constante y,
por el teorema 1.19 es separable.

Teorema 3.5 Si E es una curva elı́ptica, entonces la aplicación Z −→ End(E)


que a cada entero m le asigna la multiplicación por m es un monomorfismo de
anillos.

Demostración: Basta probar que si p ∈ Z, p = 0, entonces la multipli-


cación por p es una isogenia no nula. Observemos que una composición de
isogenias no nulas (suprayectivas) es suprayectiva y, por consiguiente no nula.
Ası́ pues, podemos suponer que p es primo.
Supongamos primero que car k = 2. Si p = 2 basta aplicar el teorema
anterior. Si p es impar, basta probar que E contiene un punto P de orden 2, es
decir, tal que P = O y 2P = O. En tal caso, es obvio que pP = 0.
En efecto, por el teorema 2.7 podemos suponer que E está definida por una
ecuación de Weierstrass de la forma Y 2 = F (X). Si a ∈ k es una raı́z de F (X),
tenemos que P = (a, 0) ∈ E y la tangente a E en P es X = a, de donde se sigue
que P + P = O.
Supongamos ahora que car k = 2. Por el teorema anterior, basta considerar
el caso p = 2. Si la multiplicación por 2 fuera nula, todos los puntos de E
tendrı́an orden 2, ası́ que basta probar que no es ası́. De nuevo podemos suponer
que E está definida por una ecuación de Weierstrass F (X, Y ) = 0 de uno de los
dos tipos que indica el teorema 2.7 para caracterı́stica 2. Notemos que para que
un punto P = (a, b) ∈ E tenga orden 2, la tangente a E en P ha de ser vertical,
lo cual equivale a que FY (P ) = 0. Considerando las ecuaciones del teorema 2.7,
esta condición equivale a X = 0 en el primer caso y a a3 = 0 en el segundo
caso. La segunda posibilidad se descarta inmediatamente, pues implica ∆ = 0.
La primera, junto a F (P ) = 0 nos da Y 2 = a6 , luego E tiene únicamente dos
puntos de orden 2.
De aquı́ se deducen a su vez propiedades más generales:
3.1. Las multiplicaciones enteras 79

Teorema 3.6 Si E1 y E2 son curvas elı́pticas, entonces el grupo de isogenias


Hom(E1 , E2 ) es un Z-módulo libre de torsión. Si E es una curva elı́ptica, en-
tonces End(E) es un anillo (no necesariamente conmutativo) de caracterı́stica 0
y sin divisores de 0.

Demostración: Según hemos observado en la prueba del teorema anterior,


la composición de isogenias no nulas es no nula. Por lo tanto, si m ∈ Z y
φ ∈ Hom(E1 , E2 ) cumplen mφ = 0, esto puede verse como la composición de
φ con la multiplicación por m, luego φ = 0 o bien m = 0. El teorema anterior
garantiza que m = 0 como isogenia equivale a m = 0 como entero, luego no hay
elementos de torsión. El mismo razonamiento prueba la segunda parte.

Nota En muchos casos, el anillo de endomorfismos de una curva elı́ptica es


simplemente End(E) = Z. Cuando no sucede ası́, se dice que la curva E tiene
multiplicación compleja. Existe toda una teorı́a sobre curvas elı́pticas con mul-
tiplicación compleja en la que no vamos a entrar aquı́.

Ejemplo Sea E/Q la curva elı́ptica dada por Y 2 = X 3 − X. Si i es la unidad


imaginaria, llamemos también i a la isogenia (x, y) → (−x, iy). Puesto que
(como isogenia) cumple i2 = −1, no es la multiplicación por ningún número
entero. Ası́ pues, E tiene multiplicación compleja. Claramente podemos definir
de forma natural un homomorfismo de anillos Z[i] −→ End(E). Puede probarse
que es un isomorfismo.(Ver el ejemplo de la página 300.)
Seguidamente vamos a calcular el grado de la multiplicación por m. Para ello
necesitamos un teorema cuya demostración requiere más geometrı́a algebraica
de la que podemos explicar con la suficiente brevedad.1 La prueba requiere
cierta familiaridad con la teorı́a de divisores sobre superficies algebraicas (con-
cretamente, sobre la superficie E × E, donde E es una curva elı́ptica).

Teorema 3.7 Si E es una curva elı́ptica, existe una aplicación

( , ) : End E × End E −→ Q

que verifica las propiedades

(φ, ψ) = (ψ, φ), (φ + χ, ψ) = (φ, ψ) + (χ, ψ)

y además (φ, φ) = grad φ, para toda isogenia φ.

De aquı́ se sigue inmediatamente la relación

grad(φ + ψ) + grad(φ − ψ) = 2(grad φ + grad ψ).


1 En el apéndice de mi Geometrı́a Algebraica se da una prueba detallada. Allı́ figura la

hipótesis de que el cuerpo de constantes tenga caracterı́stica distinta de 2 o 3, pero la prueba


vale literalmente sin esta hipótesis, pues sólo se usa al apelar a resultados previos que aquı́
hemos demostrado en general.
80 Capı́tulo 3. El álgebra de las curvas elı́pticas

Si la aplicamos a φ = m ≥ 1 y ψ = 1, obtenemos

grad(m + 1) + grad(m − 1) = 2(grad m + 1),

y ahora una simple inducción demuestra el teorema siguiente:

Teorema 3.8 Si E es una curva elı́ptica y m ∈ Z, entonces el grado de la


multiplicación por m en E es grad m = m2 .

Demostración: Para m = 0 y m = 1 es obvio. Para m > 1 se prueba por


inducción a partir de la fórmula previa al teorema. Para m < 0 basta usar que
−1 es un automorfismo, luego tiene grado 1.

Definición 3.9 Si E es una curva elı́ptica y m ∈ N, definimos

E[m] = {P ∈ E | mP = 0},

de modo que


Et = E[m]
n=1

es el subgrupo de torsión de E (el subgrupo formado por los elementos de orden


finito).

Observemos que E[m] es el núcleo de la multiplicación por m. Los teoremas


2.35 y 3.4 implican que si m no es divisible entre la caracterı́stica del cuerpo de
constantes entonces el grupo E[m] tiene m2 elementos. Más precisamente, bajo
dicha hipótesis se cumple que

E[m] ∼
= (Z/mZ) × (Z/mZ).

En efecto, si descomponemos E[m] en producto de grupos cı́clicos de orden


potencia de primo, cada primo p | m no puede aparecer más que en el orden de
dos factores, pues de lo contrario |E[p]| ≥ p3 . Por otra parte, si m = pr m , con
(m, m ) = 1, entonces E[m] no puede contener un subgrupo de orden p2r , luego
ha de haber exactamente dos factores de orden pr .

Si la caracterı́stica del cuerpo de constantes es un primo p y m = pr m con


(m, m ) = 1, es evidente que

E[m] = E[pr ] ⊕ E[m ].

Queda pendiente, pues, estudiar el orden de los subgrupos E[pr ] cuando p


es la caracterı́stica de k. Para ello necesitamos la noción de isogenia dual, de la
que nos ocupamos en la sección siguiente.
3.2. La isogenia dual 81

3.2 La isogenia dual


Consideremos una isogenia no nula φ : E1 −→ E2 entre dos curvas elı́pticas.
La prueba de que las isogenias son homomorfismos de grupos se basa en que φ
se corresponde con el homomorfismo φ : H0 (E1 ) −→ H0 (E2 ) que induce entre
los grupos de clases de grado 0 (que esencialmente es la norma). Ahora bien,
φ también induce un homomorfismo φ : H0 (E2 ) −→ H0 (E1 ) (la inclusión).
Componiéndolo con los isomorfismos naturales entre las curvas y sus grupos de
clases obtenemos un homomorfismo φ̂ : E2 −→ E1 . No es trivial, pero vamos a
probar que es una isogenia no nula.

Teorema 3.10 Sea φ : E1 −→ E2 una isogenia no nula de grado m.

a) Existe una única isogenia φ̂ : E2 −→ E1 tal que φ ◦ φ̂ = m.

b) La isogenia φ̂ es la composición de los homomorfismos

φ
E2 −→ H0 (E2 ) −→ H0 (E1 ) −→ E1 ,

donde la primera y la última flecha representan los isomorfismos naturales.

Demostración: Veamos primero la unicidad. Si φ̂ y φ̂ cumplen a), enton-


ces φ ◦ (φ̂ − φ̂ ) = m − m = 0. Como φ no es nula, ha de serlo φ̂ − φ̂ .
φ ψ
Supongamos ahora que tenemos dos isogenias E1 −→ E2 −→ E3 de grados
m y n y que sabemos que φ̂ y ψ̂ existen. Entonces ψ̂ ◦ φ̂ cumple a) para φ ◦ ψ.
En efecto:
φ ◦ ψ ◦ ψ̂ ◦ φ̂ = φ ◦ m ◦ φ̂ = m ◦ φ ◦ φ̂ = m ◦ n = mn.

Ası́ pues, en virtud del teorema 1.22, basta probar la existencia de φ̂ bajo
el supuesto de que φ es separable o una aplicación de Frobenius. Supongamos
primero que φ es separable. Entonces su núcleo N(φ) es un grupo finito de
orden m (por el teorema 2.35), luego todos sus elementos tienen orden divisor
de m, es decir, N(φ) ⊂ N(m). Ahora basta aplicar el teorema 2.36, que nos da
una isogenia φ̂ : E2 −→ E1 tal que φ ◦ φ̂ = m.
Ahora supongamos que φ es una aplicación de Frobenius. Es claro que la
aplicación de Frobenius para m = pr es la composición r veces consigo misma de
la aplicación de Frobenius para p, luego podemos suponer que φ : E −→ E (p) ,
donde p es la caracterı́stica de k.
Los teoremas 1.19 y 3.3 implican que la multiplicación por p no es separable,
ya que si ω es una diferencial invariante de E entonces pω = pω = 0. Por lo
tanto, la descomposición de p según el teorema 1.22 es de la forma p = φe ◦ ψ,
donde ψ es una isogenia separable y e ≥ 1. Podemos tomar φ̂ = φe−1 ◦ ψ.
Con esto queda demostrado a). Para probar b) llamamos φ̂ a la composición
indicada y vamos a ver que φ ◦ φ̂ = m. En efecto, si P ∈ E1 tenemos que
82 Capı́tulo 3. El álgebra de las curvas elı́pticas

 
P → φ(P ) → [φ(P )/O] → eφ (P  )P  − eφ (T )T
P  ∈φ−1 [φ(P )] T ∈φ−1 [O]
 
 
= gradi φ (P + T ) − T = (grad φ)P.
T ∈N(φ) T ∈N(φ)

Aquı́ hemos usado el teorema 2.35, apartados a) y b).


Por lo tanto, para todo Q ∈ E2 , podemos elegir P ∈ E1 tal que φ(P ) = Q y
entonces φ̂(Q) = φ̂(φ(P )) = mP = φ̂ (φ(P )) = φ̂ (Q). En suma: φ̂ = φ̂.

Definición 3.11 Si φ : E1 −→ E2 es una isogenia de grado m entre dos curvas


elı́pticas, definimos la isogenia dual φ̂ : E2 −→ E1 como la única isogenia que
cumple φ ◦ φ̂ = m si m = 0 y φ̂ = 0 si m = 0 (es decir, si φ es la isogenia nula).

Si la isogenia φ está definida sobre un cuerpo k, entonces φ̂ también lo está


(porque obviamente la multiplicación por m lo está, y la unicidad de la definición
implica que φ es invariante por G(k/k)).
Diremos que dos curvas elı́pticas E1 y E2 (definidas sobre k) son isógenas
(sobre k) si existe una isogenia no nula φ : E1 −→ E2 (definida sobre k). La
existencia de la isogenia dual prueba que esta relación es de equivalencia, lo cual
no es evidente a partir de la mera definición.

Ejemplo Un cálculo rutinario muestra que las isogenias del ejemplo de la


página 61 son duales. Basta comprobar que φ ◦ φ̂ = 2.
El teorema siguiente recoge las propiedades básicas de la isogenia dual:

Teorema 3.12 Sea φ : E1 −→ E2 una isogenia de grado m entre dos curvas


elı́pticas.
a) Se cumple que φ ◦ φ̂ = m en E1 y φ̂ ◦ φ = m en E2 .

b) Si φ : E2 −→ E3 es otra isogenia, entonces φ


◦ ψ = ψ̂ ◦ φ̂.
c) En una curva elı́ptica E, la multiplicación por m ∈ Z cumple m̂ = m.

d) grad φ = grad φ̂.


ˆ
e) φ̂ = φ.

Demostración: Si φ es nula todas las propiedades se cumplen trivialmente,


ası́ que supondremos que no lo es.
a) La primera relación es la definición de isogenia dual. La segunda resulta
de cancelar φ en la igualdad siguiente:

φ ◦ (φ̂ ◦ φ) = m ◦ φ = φ ◦ m.
3.3. Curvas supersingulares 83

b) Consecuencia inmediata de la definición.


c) Puesto que m ◦ m = m2 = grad m, la unicidad de la definición implica
que m̂ = m.
d) Basta observar que

m2 = grad m = grad(φ ◦ φ̂) = (grad φ)(grad φ̂) = m grad φ̂.

e) Consecuencia inmediata de a), d) y la unicidad de la definición.

3.3 Curvas supersingulares


Ahora podemos estudiar la estructura de los grupos de torsión E[pe ], donde
E es una curva elı́ptica sobre un cuerpo de caracterı́stica prima p. Sucede que
hay dos posibilidades:

Teorema 3.13 Sea E una curva elı́ptica sobre un cuerpo de caracterı́stica p.


Entonces E[pe ] = 0 para todo e ≥ 0 o bien E[pe ] ∼
= Z/pe Z para todo e ≥ 0.

Demostración: Sea φ : E −→ E la aplicación de Frobenius de orden p


con lo que φe es la aplicación de Frobenius de orden pe . Puesto que E[pe ] es el
núcleo de la multiplicación por pe , el teorema 2.35 nos da que

e ) = grad (φe ◦ φ̂e ) = (grad φ̂)e .


|E[pe ]| = grads pe = grads (φe ◦ φ s s

Ahora basta tener en cuenta que φ̂ tiene grado p, luego su grado de separa-
bilidad sólo puede ser 1 o p.
Si E[pe ] tiene orden pe , entonces tiene que ser un grupo cı́clico, pues si
no tuviera elementos de orden pe tendrı́amos que E[pe ] = E[pe−1 ], lo cual es
imposible por la parte ya probada.

Definición 3.14 Sea E una curva elı́ptica definida sobre un cuerpo de carac-
terı́stica prima p. Diremos que E es supersingular si E[p] = 0 y que E es
ordinaria en caso contrario, es decir, si E[p] tiene orden p.

Observemos que el término “supersingular” es capcioso, pues las curvas su-


persingulares no son singulares2 (son curvas elı́pticas). Según el teorema ante-
rior, si E es una curva supersingular se cumple que todos los grupos de torsión
E[pe ] son triviales, mientras que si E es ordinaria entonces E[pe ] ∼
= Z/pe Z.
El teorema siguiente está implı́cito en la demostración de 3.13:
2 El nombre está relacionado con los anillos de endomorfismos. Lo “más normal” es que

el anillo de endomorfismos de una curva elı́ptica sea isomorfo a Z, un caso menos frecuente
es que sea isomorfo a un orden de un cuerpo cuadrático imaginario, y a las curvas con dicha
propiedad se las llama “singulares”. Veremos que las curvas supersingulares sobre cuerpos
finitos tienen anillos de endomorfismos aún mayores.
84 Capı́tulo 3. El álgebra de las curvas elı́pticas

Teorema 3.15 Sea E una curva elı́ptica sobre un cuerpo de caracterı́stica prima
e
p y sea φe : E −→ E (p ) la aplicación de Frobenius de grado pe . Las afirmacio-
nes siguientes son equivalentes:
a) E es supersingular.
b) φ̂e es (puramente) inseparable para un (para todo) e ≥ 1.
c) La multiplicación p : E −→ E es puramente inseparable.
Demostración: En la prueba de 3.13 hemos visto que el carácter super-
singular u ordinario de E depende de si φ̂1 tiene grado de separabilidad 1 o p,
lo que equivale a que φ̂e tenga grado de separabilidad 1 o pe (es decir, a que sea
puramente inseparable o separable). Esto prueba la equivalencia entre a) y b).
También hemos visto que |E[p]| = grads p, lo que nos da la equivalencia entre
a) y c).
Es obvio que el carácter supersingular u ordinario de una curva elı́ptica
es invariante por isomorfismos, luego depende únicamente de su invariante j.
Podemos hablar ası́ de invariantes supersingulares y ordinarios. El teorema
siguiente demuestra que realmente existen curvas de ambos tipos:
Teorema 3.16 En cuerpos de caracterı́stica p = 2, el único invariante super-
singular es j = 0.
Demostración: Según la tabla del teorema 2.7, una curva con invariante
j = 0 es, por ejemplo,
E : Y 2 + Y = X 3.
Un punto no nulo en E[2] ha de tener tangente vertical, es decir, la derivada
parcial de la ecuación respecto de Y ha de ser 0, pero dicha derivada es constante
igual a 1, luego E[2] = 0 y E es supersingular.
Por el contrario, una curva con invariante no nulo admite una ecuación de
la forma
E : Y 2 + XY = X 3 + a6 ,

la cual tiene un único punto de orden 2, a saber, (0, a6 ), luego E[2] = 0 y E
es ordinaria.
Más en general, el teorema siguiente muestra que el número de invariantes
supersingulares (en una caracterı́stica fija) es siempre finito:
Teorema 3.17 Si E es una curva elı́ptica supersingular sobre un cuerpo de
caracterı́stica prima p, entonces j(E) está en el cuerpo de p2 elementos.
Demostración: Sea φ̂ : E (p) −→ E la isogenia dual de la aplicación de
Frobenius de orden p. Tenemos que φ̂ es puramente inseparable de grado p,
luego por el teorema 1.22 se descompone en la forma

E (p) 
φ̂
E
 


φ 
ψ

2
E (p )
3.4. Los módulos de Tate 85

donde φ es la aplicación de Frobenius de E (p) y ψ tiene grado 1, luego es un


2
isomorfismo. Por consiguiente, j(E) = j(E (p ) ).
Ahora bien, si tomamos una ecuación de Weierstrass para E, tenemos que
2
una ecuación de Weierstrass para E (p ) se obtiene elevando a p2 todos los coe-
(p2 ) 2
ficientes de la primera, luego j(E ) = j(E)p . En definitiva, hemos probado
2
que j(E) = j(E)p , y esto implica que j(E) está en el cuerpo de p2 elementos.

Por último observamos que la supersingularidad es también invariante por


isogenia:
Teorema 3.18 Toda curva isógena a una curva supersingular es supersingular.
Demostración: Sea ψ : E1 −→ E2 una isogenia no nula entre dos curvas
definidas sobre un cuerpo de caracterı́stica prima p. Entonces p◦ψ = ψ◦p. Si E1
es supersingular, entonces p es puramente inseparable en E1 , luego, comparando
los grados en la igualdad anterior, también lo es sobre E2 , luego también ésta
es supersingular.

3.4 Los módulos de Tate


En las secciones anteriores hemos estudiado los grupos de torsión E[m] de
una curva elı́ptica E. Estos grupos contienen mucha información sobre E. Por
ejemplo, observemos que si dos isogenias coinciden sobre el grupo de torsión
Et , entonces son iguales, pues el núcleo de la diferencia es infinito. En realidad
vemos que es suficiente con que coincidan sobre el grupo


E[q ∞ ] = E[q e ],
e=0

donde q es un primo distinto de la caracterı́stica del cuerpo de constantes. En


esta sección veremos cómo “encajar” los grupos E[q e ] en una estructura más
conveniente que su unión. Para ello necesitamos la noción de lı́mite proyectivo
de un sistema de módulos:
Definición 3.19 Si A es un anillo conmutativo y unitario, un sistema pro-
yectivo de A-módulos es una sucesión {Mn }∞ n=1 de A-módulos junto con una
sucesión de homomorfismos φn : Mn −→ Mn−1 . Definimos  el lı́mite proyectivo
del sistema como el submódulo M = ←− lı́mMn del producto Mn formado por
n n
las sucesiones
x = (x1 , x2 , x3 , . . . )
tales que φn (xn ) = xn−1 , para todo n > 1. Llamaremos πn : M −→ Mn a las
restricciones de las proyecciones. Obviamente πn+1 ◦ φn+1 = πn .

Ejercicio: Demostrar que si (M  , {πn }) es otro módulo junto con homomorfismos


πn : M  −→ Mn tales que πn+1

◦ φn+1 = πn , entonces existe un único homomorfismo
φ : M −→ M tal que φ ◦ πn = πn , ası́ como que esta propiedad determina el lı́mite


proyectivo salvo isomorfismo.


86 Capı́tulo 3. El álgebra de las curvas elı́pticas

Es claro que si las aplicaciones φn son suprayectivas lo mismo sucede con las
proyecciones πn . Sin más que cambiar “módulo” por “anillo” podemos definir
el lı́mite proyectivo de un sistema proyectivo de anillos y homomorfismos de
anillos.

Ejemplo Sea p un número primo y consideremos el sistema proyectivo for-


mado por los anillos Z/pn Z con los epimorfismos naturales Z/pn+1 Z −→ Z/pn Z
dados por [x] → [x]. Llamemos Zp al lı́mite proyectivo.
Se trata de un anillo conmutativo y unitario, cuya unidad es 1 = (1, 1, 1, . . . ).
Además, para todo m ∈ Z no nulo tenemos que m1 = ([m], [m], . . . ) = 0, pues
si m1 = 0 entonces pn | m para todo n ≥ 1. Ası́ pues, Zp tiene caracterı́stica 0.
Es claro que una sucesión ([x1 ], [x2 ], [x3 ], . . . ) es una unidad de Zp si y sólo
si p
xn para todo n, pero esto equivale a que p
x1 . Ası́ pues, el grupo de las
unidades de Zp es
Up = {x ∈ Zp | π1 (x) = 0}.
Para cada x ∈ Zp no nulo, definimos vp (x) como el mı́nimo natural m tal
que πm+1 (x) = 0. Si vp (x) = m y πn (x) = [xn ], entonces, para todo n > m,

xn ≡ 0 (mód pm ) y xn ≡ 0 (mód pm+1 ),

luego xn = yn pm , con (yn , p) = 1. Obviamente, si n ≤ m podemos elegir


xn = xm+1 y se cumple lo mismo. Entonces K = (y1 , y2 , . . .) ∈ Up y x = Kpm .
En resumen, hemos probado que todo elemento x ∈ Zp no nulo se expresa
como x = Kpm , donde K ∈ Up y m ≥ 0. La descomposición es única, pues
necesariamente m = vp (x).
De aquı́ se sigue inmediatamente que Zp es un dominio ı́ntegro, pues un pro-
ducto de elementos no nulos es de la forma (Kpm )(K pn ). Si fuera nulo, entonces
serı́a pm+n = 0, lo cual es imposible porque Zp tiene caracterı́stica 0.
Llamemos Qp al cuerpo de cocientes de Zp . Es fácil ver que vp se extiende
a una valoración en Qp cuyo anillo de enteros es Zp y que restringida a Q es la
valoración p-ádica. Vamos a probar que Qp es completo con dicha valoración y
que Q es denso en Qp . De este modo, Qp resultará ser el cuerpo de los números
p-ádicos.
En efecto, si {xn } es una sucesión de Cauchy en Zp , para cada r ≥ 0 existe
un m ≥ 0 tal que si n ≥ m entonces vp (xn − xm ) ≥ r, lo que implica que
πr (xn ) = πr (xm ). En particular, la sucesión πr (xn ) es finalmente constante
igual a un cierto yr ∈ Z/pr Z. En realidad, la condición de Cauchy implica que
para cada r ≥ 0 existe un m ≥ 0 tal que si n ≥ m entonces πs (xn ) = ys para
todo s ≤ r. De aquı́ se sigue que y = (y1 , y2 , . . . ) ∈ Zp , ası́ como que y = lı́m xn .
n

Hemos probado que toda sucesión de Cauchy en Zp es convergente (lo cual


prueba que Zp es cerrado en Qp ), pero necesitamos demostrar que lo mismo
vale para toda sucesión de Cauchy en Qp . Ahora bien, toda sucesión de Cauchy
3.4. Los módulos de Tate 87

{xn } está acotada, luego existe un r ∈ Z tal que vp (xn ) ≥ r para todo n ≥ 0.
Entonces es claro que {xn p−r } es una sucesión de Cauchy en Zp , que converge
a un y ∈ Zp , y la sucesión original converge a ypr .
Por último, si x ∈ Zp y πn (x) = [xn ] entonces vp (x − xn ) ≥ n, luego Z
es denso en Zp . Podemos identificar al cuerpo de los números p-ádicos con la
clausura de Q en Qp , y entonces el anillo de los enteros p-ádicos es la clausura
de Z en Qp , o sea, Zp , según acabamos de probar. Por consiguiente, Qp es el
cuerpo de cocientes del anillo de los enteros p-ádicos, y éste es el cuerpo de los
números p-ádicos.
Observemos que la topologı́a de Zp puede describirse fácilmente en términos
de su estructura de lı́mite proyectivo: Una base de Zp la forman los conjuntos

B(n, a) = {x ∈ Zp | πn (x) = a}, n ≥ 1, a ∈ Z/pn Z.

En efecto, basta observar que si x0 ∈ Zp cumple πn (x0 ) = a, entonces

B(n, a) = {x ∈ Zp | vp (x − x0 ) > n}.

Definición 3.20 Sea E una curva elı́ptica y sea l ∈ Z un número primo. El


módulo de Tate l-ádico de E es el lı́mite proyectivo de Z-módulos

lı́m E[ln ],
Tl (E) = ←−
n

respecto de los homomorfismos naturales P → lP .

En principio Tl (E) es un Z-módulo, pero podemos dotarlo de una estructura


mejor: tenemos que E[ln ] es un Z/ln Z-módulo, luego si

α = (a1 , a2 , . . .) ∈ Zl , x = (P1 , P2 , . . .) ∈ Tl (E),

podemos definir
αx = (a1 P1 , a2 P2 , . . .) ∈ Tl (E),
y es claro que ası́ Tl (E) se convierte en un Zl -módulo. Su estructura es fácil de
determinar:
Supongamos primero que l es distinto de la caracterı́stica del cuerpo de
constantes. Las aplicaciones E[le+1 ] −→ E[le ] tienen núcleo de orden l2 , luego
son suprayectivas. Es claro que si P y P  forman una base de E[le+1 ] como
Z/le+1 Z-módulo, entonces los puntos lP y lP  forman una base de E[le ] como
Z/le Z-módulo. Más aún, si fijamos una base en E[le ], aplicando a P y P  un
cambio de base adecuado podemos exigir que lP y lP  sea la base prefijada.
Fijamos una base P1 , P1 de E[l] y a partir de ella ir formamos bases Pe , Pe
de E[le ], de modo que Pe = lPe+1 , Pe = lPe+1
. Con ellas podemos formar dos
elementos P , P ∈ Tl (E) tales que Tl (E) = P ⊕P  . Ası́ pues, Tl (E) ∼

= Zl ×Zl .
Si el cuerpo de constantes tiene caracterı́stica l podemos razonar igualmente,
con lo que llegamos al teorema siguiente:
88 Capı́tulo 3. El álgebra de las curvas elı́pticas

Teorema 3.21 Si E es una cueva elı́ptica sobre un cuerpo k y l es un número


primo, entonces Tl (E) ∼= Zl × Zl si l = car k, mientras que si l = car k entonces
Tl (E) ∼
= Zl o bien Tl (E) = 0 (según si E es ordinaria o supersingular).

Definimos en Tl (E) la topologı́a que tiene por base a los conjuntos de la


forma

B(n, P ) = {x ∈ Tl (E) | πn (x) = P }, n ≥ 1, P ∈ E[ln ].

Si l = car k y fijamos una Zl -base P , P  de Tl (E), entonces el isomorfismo


inducido Zl × Zl −→ Tl (E) resulta ser un homeomorfismo cuando en Zl × Zl
consideramos la topologı́a producto. En efecto, una base de Zl × Zl viene dada
por los conjuntos

{(α, β) ∈ Zl × Zl | πn (α) = a, πn (β) = b}, n ≥ 1, a, b ∈ Z/ln Z,

que claramente se corresponden con los abiertos básicos

{x ∈ Tl (E) | πn (x) = aPn + bPn }.

Igualmente se razona que si l = car k y Tl (E) = 0 entonces Tl (E) es topológi-


camente isomorfo a Zl .
Si φ : E1 −→ E2 es una isogenia entre dos curvas elı́pticas, es claro que φ se
restringe a homomorfismos de Z/ln Z-módulos φn : E1 [ln ] −→ E2 [ln ], los cuales
inducen un homomorfismo de Zl -módulos φl : Tl (E1 ) −→ Tl (E2 ). Tenemos ası́
un monomorfismo de grupos

Hom(E1 , E2 ) −→ Hom(Tl (E1 ), Tl (E2 )).

Es fácil ver que es inyectivo (supuesto que l = car k), pero necesitamos
un hecho más fuerte. Observemos que Hom(E1 , E2 ) es simplemente un grupo
abeliano, mientras que Hom(Tl (E1 ), Tl (E2 )) tiene una estructura natural de
Zl -módulo con las operaciones definidas puntualmente.

Teorema 3.22 Si E1 y E2 son curvas elı́pticas sobre un cuerpo de caracterı́stica


distinta de l, entonces el homomorfismo natural de Zl -módulos

Zl ⊗Z Hom(E1 , E2 ) −→ Hom(Tl (E1 ), Tl (E2 ))

es inyectivo.

Demostración: En primer lugar demostraremos que si M es un subgrupo


finitamente generado de Hom(E1 , E2 ), entonces el grupo

M ∗ = {φ ∈ Hom(E1 , E2 ) | mφ ∈ M para algún m ≥ 1}

también es finitamente generado.


En efecto, observemos que por 3.6 el Z-módulo M es libre de torsión, luego
es un Z-módulo libre de rango finito. Por consiguiente R ⊗Z M es un espacio
3.4. Los módulos de Tate 89

vectorial real de dimensión finita. La aplicación ( , ) definida en 3.7 se extiende


a una forma bilineal en R ⊗Z M , que a su vez nos da una extensión continua de
la aplicación grado. Por lo tanto, podemos considerar el conjunto

U = {φ ∈ R ⊗Z M | grad φ < 1},

que es un entorno abierto de 0.

Por otra parte, si φ ∈ M ∗ y mφ = ψ ∈ M , la aplicación φ → m


1
⊗ ψ nos

permite identificar a M con un subgrupo de R ⊗Z M .
Obviamente M ∗ ∩ U = {0}, luego M ∗ es un subgrupo discreto de R ⊗Z M .
Esto implica que es finitamente generado (es un retı́culo).

Usando una vez más que Hom(E1 , E2 ) es libre de torsión concluimos que,
de hecho, M ∗ es un Z-módulo libre.

Pasemos ya a la prueba del teorema. Si φ ∈ Zl ⊗Z Hom(E1 , E2 ) tiene imagen


nula en Hom(Tl (E1 ), Tl (E2 )), podemos tomar un subgrupo M de Hom(E1 , E2 )
finitamente generado tal que φ ∈ Zl ⊗Z M . Construimos el subgrupo M ∗ y
fijamos una base φ1 , . . . , φt ∈ Hom(E1 , E2 ). Pongamos que

φ = α1 φ1 + · · · + αt φt , αi ∈ Zl .

Entonces, la imagen de φ en Hom(Tl (E1 ), Tl (E2 )) es

φl = α1 (φ1 )l + · · · + αt (φt )l = 0.

Elijamos ai ∈ Z tales que πn (αi ) = [ai ]. Para cada P ∈ E1 [ln ], tomamos


x ∈ Tl (E1 ) tal que πn (x) = P , y entonces

πn (φl (x)) = a1 φ1 (P ) + · · · + at φt (P ) = 0,

luego la isogenia

ψ = a1 φ1 + · · · + at φt ∈ Hom(E1 , E2 )

se anula sobre E1 [ln ]. Según el teorema 2.36 existe λ ∈ Hom(E1 , E2 ) tal que
ψ = ln λ, pero entonces λ ∈ M ∗ , luego

λ = b1 φ1 + · · · + bt φt , bi ∈ Z.

Por la unicidad de las coordenadas, ha de ser ai = ln bi , luego πn (αi ) = 0


para todo n, luego αi = 0 y φ = 0.

Ahora podemos precisar la estructura de los grupos de isogenias:

Teorema 3.23 Si E1 y E2 son dos curvas elı́pticas, entonces Hom(E1 , E2 ) es


un Z-módulo libre de rango menor o igual que 4.
90 Capı́tulo 3. El álgebra de las curvas elı́pticas

Demostración: Fijemos un primo l distinto de la caracterı́stica del cuerpo


de constantes. Sabemos que Tl (E1 ) y Tl (E2 ) son Zl -módulos libres de rango 2,
luego Hom(Tl (E1 ), Tl (E2 )) es isomorfo al grupo de matrices 2×2 con coeficientes
en Zl , luego es un Zl -módulo libre de rango 4.
El teorema anterior nos permite ver a Zl ⊗Z Hom(E1 , E2 ) como Zl -submódulo
de Hom(Tl (E1 ), Tl (E2 )), luego es libre y de rango menor o igual que 4. Por
consiguiente, todo submódulo finitamente M generado de Hom(E1 , E2 ) es libre
y determina un Zl -submódulo Zl ⊗Z M del mismo rango en Hom(Tl (E1 ), Tl (E2 )),
por lo que rang M ≤ 4.
Si Hom(E1 , E2 ) no fuera finitamente generado, podrı́amos encontrar una
sucesión de submódulos finitamente generados

M 0  M1  M2  M 3  · · ·

cuyo rango está acotado por 4, luego a partir de uno dado —que podemos
suponer que es M0 — todos tendrán el mismo rango. Esto implica que los
cocientes Mn /M0 son finitos, luego existe un mn ≥ 1 tal que mn Mn ⊂ M0 .
Ası́ pues, Mn ⊂ M0∗ , donde M0∗ es el módulo definido en la demostración del
teorema anterior, donde hemos probado que es libre de rango finito. Ahora bien,
esto es imposible, pues entonces la unión de los módulos Mn también serı́a un
módulo finitamente generado, algún Mn contendrı́a un generador de la unión y
entonces Mn = Mn+1 , contradicción.
Ası́ pues, Hom(E1 , E2 ) es finitamente generado, luego es libre y de rango
menor o igual que 4.
Ahora vamos a definir una forma bilineal en Tl (E) que nos aportará infor-
mación sobre las isogenias duales. Primeramente definiremos formas bilineales
sobre los grupos E[ln ] y luego las combinaremos entre sı́. Vamos a usar con
frecuencia el siguiente hecho elemental:

Teorema 3.24Un divisor  a = P1m1 · · · Prmr en una curva elı́ptica E es princi-


pal si y sólo si mi = 0 y mi Pi = O.

Demostración: Basta observar que grad a = mi y, supuesto que a tenga
grado 0, entonces mi Pi es el punto de E correspondiente a [a] a través del
isomorfismo H0 (E) ∼= E. Ciertamente, a es principal si y sólo si su clase es el
elemento neutro de H0 (E), si y sólo si su imagen en E es O.
Dada una curva elı́ptica E/k, fijamos un natural m > 1 no divisible entre
car k. Consideremos un punto T ∈ E[m]. Por el teorema anterior existe una
función f ∈ k(E) tal que (f ) = T m /Om . La función f está determinada por m
y T salvo una constante.
Podemos tomar T  ∈ E tal que mT  = T , y entonces existe g ∈ k(E) tal que
 T + R
(g) = m(T )/m(O) = .
R
R∈E[m]

(Aquı́ usamos que |E[m]| = m2 y m2 T  = O.)


3.4. Los módulos de Tate 91

Ahora observamos que (m ◦ f ) = m((f )) = (g m ), luego multiplicando f por


una constante podemos suponer que m ◦ f = g m . De nuevo, la función g está
determinada por m y T salvo una constante.
Sea ahora S ∈ E[m] un punto arbitrario y X ∈ E. Tenemos que

g(X + S)m = f (mX + mS) = f (mX) = g(X)m .

Esto implica que las funciones g(X + S) y g(X) (para un S fijo) tienen los
mismos ceros y polos, luego el cociente g(X + S)/g(X) es constante. Más aún,
es una raı́z m-sima de la unidad en k.

Definición 3.25 Sea E una curva elı́ptica sobre un cuerpo k, sea m > 1 un
natural no divisible entre car k y sea Um el grupo de las raı́ces m-simas de la
unidad en k. Definimos el producto de Weil de orden m en E como la aplicación

em : E[m] × E[m] −→ Um

dada por
g(X + S)
em (S, T ) = ,
g(X)
donde g ∈ k(E) es cualquier función que cumpla (g) = m(T )/m(O) y X es
cualquier punto de E donde g no tenga un cero ni un polo.

Observemos que, aunque g esté definida salvo una constante, ésta se cancela
en el cociente em (S, T ), luego em (S, T ) está unı́vocamente determinado por m,
S y T . El teorema siguiente recoge las propiedades básicas de este producto.

Teorema 3.26 Sea E una curva elı́ptica sobre un cuerpo k. Entonces:

a) em (S1 + S2 , T ) = em (S1 , T )em (S2 , T ),


em (S , T1 + T2 ) = em (S, T1 )em (S, T2 ).

b) em (S, T ) = em (T, S)−1 .

c) Si em (S, T ) = 1 para todo S ∈ E[m], entonces T = O.

d) Para cada σ ∈ G(k/k), se cumple que em (S, T )σ = em (S σ , T σ ).

e) Si S ∈ E[mm ], T ∈ Em , entonces emm (S, T ) = em (m S, T ).

Demostración: a) Claramente

g(X + S1 + S2 ) g(X + S2 )
em (S1 + S2 , T ) = = em (S1 , T )em (S2 , T ).
g(X + S2 ) g(X)

Para demostrar la linealidad en la segunda componente tomamos funciones


f1 , f2 , f3 , g1 , g2 , g3 correspondientes a los puntos T1 , T2 y T3 = T1 + T2 .
92 Capı́tulo 3. El álgebra de las curvas elı́pticas

Sea h ∈ k(E) tal que (h) = T3 O/T1 T2 . Entonces (f3 /f1 f2 ) = (hm ), luego

existe c ∈ k tal que f3 = cf1 f2 hm . Componiendo con la multiplicación por m
obtenemos que g3m = cg1m g2m (m ◦ h)m , luego g3 = c g1 g2 (m ◦ h). Ası́,
g3 (X + S) g1 (X + S)g2 (X + S)h(mX + mS)
em (S, T1 + T2 ) = =
g3 (X) g1 (X)g2 (X)h(mX)
= em (S, T1 )em (S, T2 ).
b) Por el apartado anterior tenemos que
em (S + T, S + T ) = em (S, S)em (T, T )em (S, T )em (T, S).
Basta probar que em (T, T ) = 1 para todo T ∈ E[m]. Recordemos que τP
representa a la traslación X → X + P . Observemos que
m−1
  m−1   ((1 + i)T )m
m−1
τiT ◦ f = τ iT ((f )) = = 1,
i=0 i=0 i=0 (iT )m

m−1 
m−1
luego τiT ◦ f es constante y, si mT  = T la función τiT  ◦ g también lo
i=0 i=0
es, ya que su potencia m-sima es la multiplicación por m seguida de la función
anterior. Evaluándola en X y X + T  hemos de obtener el mismo resultado:

m−1 
m−1
g(X + iT  ) = g(X + (i + 1)T  ).
i=0 i=0

Cancelando términos, la igualdad se reduce a


g(X) = g(X + mT  ) = g(X + mT ).
Ası́ pues, em (T, T ) = 1.
c) Si em (S, T ) = 1 para todo S ∈ E[m], entonces g(X +S) = g(X), para todo
S ∈ E[m] y todo X ∈ E donde g esté definida. Equivalentemente, τ S (g) = g,
para todo S ∈ E[m]. Por 2.35 c) tenemos que g ∈ m[k(E)], es decir, que
g = m ◦ h, para cierta h ∈ k(E).
Ası́, (m ◦ h)m = g m = m ◦ f , luego f = hm , luego (h)m = (f ) = T m /Om ,
luego (h) = T /O, lo cual sólo es posible si T = O.
d) Si f y g definen em para T , es claro que f σ y g σ definen em para T σ ,
luego  σ
σ σ g σ (X σ + S σ ) g(X + S)
em (S , T ) = = = em (S, T )σ .
g σ (X σ ) g(X)
e) Si f y g definen em para T , entonces
    
(f m ) = T mm /Omm , (m ◦ g)mm = (mm ◦ f )m ,

luego f m y m ◦ g definen emm para T . Por consiguiente
(m ◦ g)(X + S) g(Y + m S)
emm (S, T ) = = = em (m S, T ).
(m ◦ g)(X) g(Y )
3.4. Los módulos de Tate 93

Una consecuencia sencilla de estas propiedades es el teorema siguiente:


Teorema 3.27 Si E/k es una curva elı́ptica y m > 1 no es divisible entre
car k, una condición necesaria para que E[m] ⊂ E(k) es que k contenga una
raı́z m-sima primitiva de la unidad.
Demostración: La imagen de em en Um es un subgrupo, digamos de orden
d | m. Entonces
1 = em (S, T )d = em (dS, T ),
para todo T ∈ E[m], luego dS = O para todo S ∈ E[m], lo cual sólo es posible
si d = m. En definitiva, la imagen de em es todo Um .
Si E[m] ⊂ E(k), entonces cada em (S, T ) es invariante por G(k/k), luego
em (S, T ) ∈ k, es decir, Um ⊂ k.
Veamos ahora la conexión de el producto de Weil con las isogenias duales:
Teorema 3.28 Si φ : E1 −→ E2 es una isogenia entre dos curvas elı́pticas,
m es un natural no divisible entre la caracterı́stica del cuerpo de constantes y
S ∈ E1 [m], T ∈ E2 [m], entonces
em (S, φ̂(T )) = em (φ(S), T ).
Demostración: Podemos suponer que φ no es nula. Sean f y g las funcio-
nes que definen em para T en E2 . Según el teorema 3.10, la isogenia dual está
determinada por la relación
φ̂(T )/O = φ(T /O),
luego podemos tomar h ∈ k(E1 ) tal que
Oφ(T )
(h) = .
φ(O)φ̂(T )
Claramente,
 
φ◦f φ((f )) φ(T )m φ̂(T )m
= = =
hm (h)m φ(O)m (h)m Om
y  m  
φ◦g m◦φ◦f φ◦f
= = m ◦ .
m◦h (m ◦ h)m hm
Esto significa que las funciones φ ◦ f /hm y (φ ◦ g)/(m ◦ h) definen em para
φ̂(T ). Ası́ pues,
(φ ◦ g)/(m ◦ h)(X + S)
em (S, φ̂(T )) =
(φ ◦ g)/(m ◦ h)(X)
g(φ(X) + φ(S)) h(mX)
=
g(φ(X)) h(mX + mS)
g(φ(X) + φ(S)) h(mX)
= = em (φ(S), T ).
g(φ(X)) h(mX)
94 Capı́tulo 3. El álgebra de las curvas elı́pticas

De aquı́ deducimos una propiedad no trivial de las isogenias duales:

Teorema 3.29 Si φ, ψ : E1 −→ E2 son dos isogenias entre curvas elı́pticas,



entonces φ + ψ = φ̂ + ψ̂.

Demostración: Sea χ = φ + ψ − φ̂ − ψ̂. Hemos de probar que χ = 0.


Para ello basta probar que χ se anula sobre todos los grupos E2 [m], donde m
no es divisible entre la caracterı́stica del cuerpo de constantes, ya que entonces
su núcleo será infinito. Tomamos S ∈ E1 [m], T ∈ E2 [m], de modo que

em (S, χ(T ))
= em (S, φ + ψ(T ))em (S, φ̂(T ))−1 em (S, ψ̂(T ))−1
= em ((φ + ψ)(S), T )em (φ(S), T )−1 em (ψ(S), T )−1
= em (φ(S), T )em (ψ(S), T )em (φ(S), T )−1 em (ψ(S), T )−1 = 1,

luego χ(T ) = 0, para todo T ∈ E2 [m].


Como aplicación probamos lo siguiente:

Teorema 3.30 Sea E una curva elı́ptica y φ ∈ End(E). Entonces

φ + φ̂ = 1 + grad φ − grad(1 − φ) ∈ Z.

Demostración: El teorema se cumple trivialmente si φ = 0. En caso


contrario

grad(1 − φ) = (1 − φ)(1 − φ) = (1 − φ)(1 − φ̂) = 1 − φ − φ̂ + grad φ.

Finalmente, veamos que podemos unir todos los productos eln en un único
producto sobre Tl (E).
Sea E una curva elı́ptica sobre un cuerpo k y sea l un primo distinto de car k.
Sea Uln el grupo de las raı́ces ln -ésimas de la unidad en k. Observemos que, al
igual que hemos obtenido el anillo de enteros l-ádicos Zl como lı́mite proyectivo
de los anillos Z/ln Z, podemos obtenerlo igualmente a partir de los grupos Uln
con las aplicaciones Uln+1 −→ Uln dadas por ζ → ζ l .
Concretamente, tomamos una raı́z l-ésima primitiva ζ1 ∈ Ul y vamos to-
mando inductivamente raı́ces ζn ∈ Uln de modo que ζn+1
l
= ζn . De este modo
tenemos diagramas conmutativos

Z/ln+1 Z  Uln+1

 
Z/ln Z  Uln

donde las flechas horizontales son los isomorfismos de grupos dados por [a] → ζna .
Estos isomorfismos inducen un isomorfismo de grupos ←− lı́m Z/ln Z −→ ←−
lı́m Uln .
n n
3.4. Los módulos de Tate 95

Ası́ pues, podemos identificar el grupo aditivo de Zl con el grupo (multipli-


cativo) ←−
lı́m Uln .
n

Ahora fijemos x, y ∈ Tl (E), de modo que πn (x), πn (y) ∈ E[ln ], luego pode-
mos calcular eln (πn (x), πn (y)) ∈ Uln . Estos elementos determinan un elemento
del lı́mite proyectivo, pues
eln+1 (πn+1 (x), πn+1 (y))l = eln+1 (πn+1 (x), lπn+1 (y))
= eln (lπn+1 (x), lπn+1 (y)) = eln (πn (x), πn (y)).
Llamamos e(x, y) ∈ Zl a la imagen de este elemento por el isomorfismo entre
el lı́mite proyectivo y Zl . El teorema siguiente es inmediato:
Teorema 3.31 Si E es una curva elı́ptica y l es un primo distinto de la carac-
terı́stica del cuerpo de constantes, entonces existe una aplicación
e : Tl (E) × Tl (E) −→ Zl
que verifica:
a) e(S1 + S2 , T ) = e(S1 , T ) + e(S2 , T ),
e(S , T1 + T2 ) = e(S, T1 ) + e(S, T2 ).
b) e(S, T ) = −e(T, S).
c) Si e(S, T ) = 0 para todo S ∈ Tl (E), entonces T = 0.
d) Para cada σ ∈ G(k/k), se cumple que e(S, T )σ = e(S σ , T σ ).
e) Si φ : E1 −→ E2 es una isogenia entre curvas elı́pticas, S ∈ Tl (E1 ) y
T ∈ Tl (E2 ), entonces e(φ(S), T ) = e(S, φ̂(S)).
Como aplicación demostramos lo siguiente:
Teorema 3.32 Sea E una curva elı́ptica, φ ∈ End(E) y l un primo distinto de
la caracterı́stica del cuerpo de constantes. Entonces

N(φl ) = det φ = φφ̂, Tr(φl ) = 1 + grad φ − grad(1 − φ) = φ + φ̂.


En particular la norma y la traza de φl son enteros independientes de l.
Demostración: Tomemos una base S, T ∈ Tl (E) y sea
 
a b
c d
la matriz de φl en dicha base. Entonces
(grad φ)e(S, T ) = e((grad φ)S, T ) = e(φ̂l (φl (S)), T ) = e(φl (S), φl (T ))
= e(aS + bT, cS + dT ) = (ad − bc)e(S, T ) = (det φl )e(S, T ).
Por consiguiente grad φ = det φl . Un simple cálculo muestra que toda matriz
2 × 2 cumple Tr(A) = 1 + det A − det(1 − A).
96 Capı́tulo 3. El álgebra de las curvas elı́pticas

3.5 El anillo de endomorfismos


Finalmente estamos en condiciones de determinar la estructura de los anillos
de endomorfismos de las curvas elı́pticas. Necesitamos algunas definiciones:

Definición 3.33 Un álgebra de cuaternios es una Q-álgebra A (es decir, un


anillo que contiene a Q como subcuerpo) que tiene una Q-base {1, α, β, γ} tal
que
α2 , β 2 ∈ Q, α2 < 0, β 2 < 0, γ = αβ = −βα.
Un orden en un álgebra de cuaternios A es un subanillo (unitario) que como
Z-módulo es libre de rango 4. Esto hace que una Z-base de O sea también una
Q-base de A.

Notemos que si K es un cuerpo cuadrático también podemos verlo como un


álgebra de grado 2 sobre Q y la definición anterior de orden (cambiando rango 4
por rango 2) es la usual en teorı́a de números.

Teorema 3.34 Sea O un anillo unitario de caracterı́stica 0 sin divisores de 0


que cumpla las propiedades siguientes:

a) O es un Z-módulo libre de rango menor o igual que 4.

b) O tiene una antiinvolución α → α̂, esto es, una aplicación que cumple las
propiedades siguientes:


α + β = α̂ + β̂,  = β̂ α̂,
αβ α̂ˆ = α.

Además, si α ∈ Z entonces α̂ = α.

c) Si α ∈ O entonces αα̂ ∈ Z, αα̂ ≥ 0 y αα̂ = 0 si y sólo si α = 0.

Entonces O es isomorfo a Z, a un orden de un cuerpo cuadrático imaginario


o a un orden en un álgebra de cuaternios.

Demostración: Sea A = Q ⊗ O (de modo que A es una Q-álgebra tal que


toda Z-base de O es una Q-base de A). Ciertamente O es un orden en A. Basta
probar que A es Q, un cuerpo cuadrático imaginario o un álgebra de cuaternios.
La antiinvolución de O se extiende de forma única a una aplicación Q-lineal
en A y es claro que conserva todas las propiedades del enunciado (salvo que αα̂
es, en general, un número racional y no un número entero).
Definimos una norma y una traza N, Tr : A −→ Q mediante

N(α) = αα̂, Tr(α) = α + α̂.

El hecho de que la traza está en Q se sigue de que

N(α − 1) = αα̂ − α − α̂ + 1 = N(α) − Tr(α) + 1.


3.5. El anillo de endomorfismos 97

Obviamente la traza es Q-lineal y si α ∈ Q entonces Tr(α) = 2α. Más aún,


si un α ∈ A cumple Tr(α) = 0 entonces

0 = (α − α)(α − α̂) = α2 − Tr(α)α + N(α) = α2 + N(α),

luego o bien α = 0 o bien α2 = − N(α) es un número racional negativo.


Si A = Q no hay nada que probar. En caso contrario existe α ∈ A \ Q.
Reemplazándolo por α − 12 Tr(α) podemos exigir que Tr(α) = 0, con lo que
α2 < 0 y Q(α) es un cuerpo cuadrático imaginario. Si A = Q(α) ya no hay
nada que probar. En caso contrario existe β ∈ A \ Q(α). Podemos reemplazarlo
por
1 Tr(αβ)
β − Tr(β) − α,
2 2α2
lo que garantiza que Tr(β) = Tr(αβ) = 0. En particular β 2 < 0. El hecho de
que las trazas se anulen equivale a

α = −α̂, β = −β̂, αβ = −β̂ α̂,

y al sustituir las dos primeras igualdades en la tercera obtenemos que αβ = −βα.


Si probamos que 1, α, β y γ = αβ son linealmente independientes, tendrá
que ser A = 1, α, β, γ, luego A será un álgebra de cuaternios. Supongamos
que
a + bα + cβ + dγ = 0, a, b, c, d ∈ Q.
Tomando trazas obtenemos que 2a = 0, luego a = 0. Multiplicamos por α
por la izquierda y por β por la derecha:

bα2 β + cβ 2 α + dα2 β 2 = 0,

pero esto implica que β ∈ Q(α) salvo si b = 0, pero entonces α ∈ Q salvo si


c = 0, lo que obliga también a que d = 0.
Como consecuencia inmediata:

Teorema 3.35 El anillo de endomorfismos de una curva elı́ptica es isomorfo a


Z, a un orden en un cuerpo cuadrático imaginario o a un orden en un álgebra
de cuaternios.

En efecto, si E es una curva elı́ptica hemos probado que el anillo End(E)


satisface todas las hipótesis del teorema 3.34. Observemos que la norma y la
traza de una isogenia en el sentido definido en la prueba de 3.34 coinciden con
las del teorema 3.32.
Es conocido que el grupo de unidades de un orden cuadrático tiene orden
2, 4 o 6, por lo que en los casos en los que el teorema 2.12 afirma que el grupo
de automorfismos tiene orden 12 o 24 (es decir, las curvas de invariante j = 0
en caracterı́stica 2 y 3), podemos concluir que el anillo de endomorfismos tiene
rango 4.
Terminamos la sección con una última propiedad:
98 Capı́tulo 3. El álgebra de las curvas elı́pticas

Teorema 3.36 Dos curvas isógenas tienen anillos de endomorfismos del mismo
rango.

Demostración: Sea λ : E1 −→ E2 una isogenia de grado n > 0 entre dos


curvas elı́pticas. Entonces podemos definir un monomorfismo de anillos

φ : Q ⊗ End(E1 ) −→ Q ⊗ End(E2 )

mediante φ(α) = n1 (λ̂αλ). Es fácil ver que efectivamente es un homomorfismo


(teniendo en cuenta que λλ̂ = n). Si φ(α) = 0 entonces λ̂αλ = 0, luego λ̂α toma
valores en el núcleo de λ, que es finito, lo cual sólo es posible si α es la isogenia
nula.
Esto prueba que el rango de End(E1 ) es menor o igual que el de End(E2 ),
pero como la relación de isogenia es simétrica se ha de dar la igualdad.
Capı́tulo IV

Curvas elı́pticas sobre


cuerpos finitos

Nos ocupamos ahora de las curvas elı́pticas definidas sobre cuerpos finitos.
Cuando tenemos una curva elı́ptica definida mediante una ecuación con coe-
ficientes enteros (o, más en general, enteros algebraicos) podemos tomar con-
gruencias módulo un primo para pasar a una ecuación definida en un cuerpo
finito. Si el primo no divide al discriminante de la curva, el resultado será
de nuevo una curva elı́ptica y podremos aplicarle los resultados que vamos a
obtener aquı́.

4.1 Puntos racionales


En general, una curva elı́ptica E/k definida sobre un cuerpo k no algebrai-
camente cerrado no tiene por qué tener puntos racionales (distintos de O). Sin
embargo, vamos a probar que si k es un cuerpo finito con |k| > 4 entonces
E/k tiene al menos un punto racional no trivial. Más aún, vamos a dar una
estimación del número de puntos racionales de E/k.
Lo primero que observamos es que, si k tiene m elementos, entonces los
coeficientes de una ecuación de E/k quedan invariantes al elevarlos a m, por lo
que la imagen de la aplicación de Frobenius φm es la propia curva E y por lo
tanto φm resulta ser un endomorfismo. Explı́citamente, φm (X, Y ) = (X m , Y m ),
luego un punto P ∈ E está en E(k) si y sólo si φ(P ) = P . En otros términos:

E(k) = N(1 − φm ).

Vamos a probar que 1 − φm es separable, con lo que el orden del núcleo será
el grado. Más en general:

Teorema 4.1 Sea E/k una curva elı́ptica definida sobre un cuerpo k de m
elementos. Sea φm : E −→ E la aplicación de Frobenius de orden m y sean r,
s ∈ Z. Entonces la aplicación r + sφm es separable si y sólo si p
r.

99
100 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

Demostración: Vamos a aplicar el teorema 1.19. Para ello tomamos una


diferencial invariante ω en E y calculamos (usando 3.2 y 3.3)

r + sφ(ω) = rω + sφ(ω) = rω.

(Notemos que φ(ω) = 0 por 1.19, ya que φ es puramente inseparable.) Ası́ pues,
concluimos que r + sφ es separable si y sólo si rω = 0, si y sólo si p
r.
De este modo nos encontramos con que el número de puntos racionales de
una curva E/k es

|E(k)| = | N(1 − φm )| = grad(1 − φm ).

A menudo es conveniente expresar esto en los términos siguientes:

Definición 4.2 Sea E/k una curva elı́ptica definida sobre un cuerpo k de m
elementos. La traza de Frobenius de E/k es

T (E/k) = m + 1 − grad(1 − φm ) ∈ Z,

donde φm es la aplicación de Frobenius de orden m en E.

Según el teorema 3.32, tenemos que T (E/k) es la traza del endomorfismo


inducido por φm en cualquier módulo de Tate Tl (E) para cualquier primo l
distinto de la caracterı́stica de k.
Si llamamos Nk = |E(k)|, hemos probado la relación

Nk = m + 1 − T (E/k).

El teorema siguiente nos permitirá estimar T (E/k), y con ello el número de


puntos racionales de E/k.

Teorema 4.3 Bajo las hipótesis del teorema 3.7, si φ, ψ ∈ End E, se cumple

|(φ, ψ)| ≤ (φ, φ)(ψ, ψ).

Demostración: Si m, n ∈ Z, se cumple que

0 ≤ grad(mφ + nψ) = m2 (φ, φ) + 2mn(φ, ψ) + n2 (ψ, ψ).

En particular, tomando m = (φ, ψ), n = −(φ, φ) queda

0 ≤ −(φ, ψ)2 (φ, φ) + (φ, φ)2 (ψ, ψ).

Podemos suponer φ = 0 y simplificar (φ, φ), con lo que (φ, ψ)2 ≤ (φ, φ)(ψ, ψ).

Volviendo al caso en de la aplicación de Frobenius φm de E/k, tenemos que

grad(1 − φm ) = grad 1 + grad φm − 2(1, φm ) = 1 + m − 2(1, φm ),


4.1. Puntos racionales 101

luego
T (E/k) = m + 1 − grad(1 − φm ) = 2(1, φm )
y por el teorema anterior
 √
|T (E/k)| ≤ 2 grad 1 grad φ = 2 m.

En resumen:

Teorema 4.4 (Hasse) Sea E una curva elı́ptica definida sobre el cuerpo k de
m elementos. Entonces1
  √
|E(k)| − m − 1 ≤ 2 m.

En particular, el número de puntos de E en el cuerpo de m elementos es


asintóticamente igual a m.

Ahora es inmediato que si |k| > 4 entonces toda curva elı́ptica definida sobre
k tiene al menos un punto racional no trivial.
Otra consecuencia notable de la relación |E(k)| = grad(1 − φm ) es que el
número de puntos racionales se conserva por isogenias. En efecto:

Teorema 4.5 Dos curvas elı́pticas definidas sobre un mismo cuerpo finito k e
isógenas sobre k tienen el mismo número de puntos racionales.

Demostración: Sea λ : E1 −→ E2 una isogenia no nula entre dos curvas


elı́pticas definidas sobre k y sean φ1 y φ2 las correspondientes aplicaciones de
Frobenius de grado m. El hecho de que λ esté definida sobre k hace que conmute
el diagrama siguiente:
E1
λ  E2

φ1 φ2
 
E1  E2
λ

Por consiguiente, también conmuta el diagrama

E1
λ  E2

1−φ1 1−φ2
 
E1  E2
λ

Por consiguiente, grad(1 − φ1 ) grad λ = grad λ grad(1 − φ2 ) y simplificando


el grado de λ tenemos el teorema.
1 Esto es un caso particular de la Hipótesis de Riemann. Ver el Apéndice A.
102 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

Si conocemos cuántos puntos racionales tiene una curva elı́ptica E sobre el


cuerpo k de m elementos, podemos calcular cuántos tiene sobre el cuerpo K de
md elementos. Se trata de encontrar la relación entre las trazas de Frobenius

t = T (E/k) = φm + φ̂m , t = T (E/K) = φdm + φ̂dm .

Ahora bien, φm y φ̂m son las raı́ces del polinomio X 2 − tX + m, luego


 √ d  √ d
 t+ t2 − 4m t− t2 − 4m
t = + .
2 2

Para terminar vamos a dar una fórmula útil para contar los puntos racionales
de una curva elı́ptica definida sobre un cuerpo k de caracterı́stica p = 2. El grupo
multiplicativo k ∗ es cı́clico, luego tiene un único subgrupo de ı́ndice 2 que define
un único carácter no trivial χ : k ∗ −→ {±1}. Si x ∈ K ∗ , entonces χ(x) = 1 si y
sólo si x es un cuadrado en k ∗ . Extendemos χ a k tomando χ(0) = 0.
Consideremos ahora una curva elı́ptica E/k dada por una ecuación de Weiers-
trass de la forma Y 2 = F (X), donde F (X) ∈ k[X] tiene raı́ces simples en k.
Entonces, cada x ∈ k dará lugar a un punto de E si F (x) = 0, a dos puntos si
F (x) es un cuadrado no nulo y a ninguno en otro caso. Añadiendo además el
punto infinito vemos que
 
|E(k)| = 1 + (χ(F (x)) + 1) = m + 1 + χ(F (x)),
x∈k x∈k

donde m es el número de elementos de k. Equivalentemente,



T (E/k) = − χ(F (x)). (4.1)
x∈k

4.2 Curvas supersingulares


En esta sección calcularemos el número de curvas elı́pticas supersingulares
(salvo isomorfismo) definidas sobre un cuerpo finito. En primer lugar daremos
una caracterización sencilla de las curvas supersingulares:

Teorema 4.6 Una curva elı́ptica E/k definida sobre un cuerpo finito k de ca-
racterı́stica p es supersingular si y sólo si p | T (E/k).

Demostración: Sea m el número de elementos de k y sea φm la aplicación


de Frobenius de grado m. Entonces, como endomorfismos, φ̂m = T (E/k) − φm .
Según el teorema 4.1 tenemos que m | T (E/k) si y sólo si φ̂m es inseparable,
lo que equivale a que E sea supersingular.
Ası́ pues, podemos determinar si una curva es supersingular sin más que
contar sus puntos racionales. Para curvas definidas sobre un cuerpo primo el
criterio anterior se puede refinar:
4.2. Curvas supersingulares 103

Teorema 4.7 Sea p > 3 un número primo y E/k una curva definida sobre el
cuerpo de p elementos. Entonces E es supersingular si y sólo si T (E/k) = 0, si
y sólo si |E(k)| = p + 1.

Demostración: Una implicación es el teorema anterior. Supongamos que


E es supersingular. Entonces la multiplicación por p es puramente inseparable,
luego p = φ2 h, donde φ es la aplicación de Frobenius de grado p y h tiene
grado 1, luego es un isomorfismo. Sea t = T (E/k). Por el teorema anterior
t = pr, para cierto r ∈ Z. Supongamos que r = 0.
Por la unicidad de la isogenia dual ha de ser φ̂ = φh. Tenemos que

t = pr = φ2 hr = φ + φ̂ = φ + φh = φ(1 + h).

Como φ es biyectiva podemos simplificar φhr = 1 + h. Sea ω la diferencial


invariante de E. Por el teorema 1.19 tenemos que (1 + h)(ω) = 0, y por 3.2 esto
equivale a h(ω) = −ω. En particular h = 1.
Podemos suponer que E viene dada por una ecuación canónica

E : Y 2 = X 3 + a4 X + a6 ,

y entonces el teorema 2.12 nos da que h es de la forma

h(X, Y ) = (u2 X, u3 Y ),

donde u es una raı́z de la unidad, y queremos probar que es u = −1. Según la


definición 2.13,
dx
ω= ,
2y
luego
d(u2 x)
h(ω) = = u−1 ω = −ω,
2u3 y
luego u−1 = −1 y, por lo tanto, u = −1, lo que prueba que h es el automorfismo
de orden 2, o sea, h = −1. Concluimos que t = φ + φ̂ = φ + φ(−1) = 0, en
contra de lo supuesto.

Ejercicio: Mostrar que el teorema anterior es falso en caracterı́stica 2 o 3.

Pasemos ya a la cuestión de determinar si una curva es supersingular.

Teorema 4.8 Sea k un cuerpo finito de caracterı́stica p > 2.

a) Si E/k es una curva elı́ptica dada por una ecuación de Weierstrass de


la forma Y 2 = F (X), donde F (X) ∈ k[X] es un polinomio con raı́ces
simples en k. Entonces E es supersingular si y sólo si el coeficiente de
X p−1 en F (X)(p−1)/2 es nulo.
104 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

b) Sea r = (p − 1)/2. El polinomio


r  2
 r
Hp (T ) = i Ti
i=0

tiene raı́ces distintas en k y si λ ∈ k, λ = 0, 1, entonces la curva elı́ptica

Eλ : Y 2 = X(X − 1)(X − λ)

es supersingular si y sólo si Hp (λ) = 0.


c) El número de invariantes supersingulares en caracterı́stica p es

1 + [p/12] + Kp ,

donde [ ] denota la parte entera y



−1 si p ≡ 1 (mód 12),
Kp = 1 si p ≡ −1 (mód 12),
0 en otro caso.

Demostración: a) Sea χ : k ∗ −→ {±1} el único carácter no trivial de


orden 2 de k ∗ , extendido con χ(0) = 0. Según hemos visto al final de la sección
anterior, 
|E(k)| = 1 + m + χ(F (x)),
x∈k

donde m es el número de elementos de k. Ahora bien, como k ∗ es un grupo


cı́clico de orden m − 1, tenemos que χ(x) = x(m−1)/2 (entendiendo que χ toma
sus valores en k). Por lo tanto, viendo a |E(k)| como elemento de k (es decir,
identificándolo con su resto módulo p) tenemos que

|E(k)| = 1 + m + F (x)(m−1)/2 .
x∈k

Observemos ahora que si x0 es un generador de k ∗ tenemos

 
m−2 (m−1)i
x0 −1
xi = xij
0 = =0
x∈k j=0 xi0 − 1

salvo si m − 1 | i > 0, en cuyo caso xi0 = 1 y la suma da m − 1 = −1. (Notemos


que si i = 0 entonces no podemos eliminar el sumando correspondiente a x = 0
y la suma da m = 0.)
Como F (X) tiene grado 3, al multiplicar F (X)(m−1)/2 obtenemos un poli-
nomio de grado 3(m − 1)/2. Al aplicar lo anterior a cada monomio cuando x
recorre k, el único monomio de grado i > 0 múltiplo de m − 1 es el de grado
m − 1, luego si llamamos Tm al coeficiente de grado m − 1 en F (X)(m−1)/2 ,
entonces (en k) |E(k)| = 1 − Tm .
Esto significa que Tm es T (E/k) (como elemento de k). Ası́ pues, E es
supersingular si y sólo si T (E/k) ≡ 0 (mód p) si y sólo si T (E/k) = 0 en k, si y
sólo si Tm = 0.
4.2. Curvas supersingulares 105

Falta probar que Tm = 0 si y sólo si Tp = 0 (pues el enunciado del teorema


hace referencia a Tp ). Para ello observamos que
n+1
−1)/2 n
−1)/2 n
F (X)(p = F (X)(p (F (X)(p−1)/2 )p .
n
Al igualar coeficientes obtenemos la relación Tpn+1 = Tpn Tpp . En efecto, el
segundo factor es un polinomio cuyos monomios tienen grado múltiplo de pn .
n
El coeficiente de grado (p − 1)pn es Tpp , que multiplicado por el coeficiente de
grado pn − 1 del primer factor (que es Tpn ) proporciona un término de grado
pn+1 − 1 en el producto, pero ya no hay más, pues el siguiente término del
segundo factor tiene grado pn+1 , que excede a pn+1 − 1, y el término anterior
tiene grado (p − 2)pn , pero en el primer factor no hay ya términos de grado
2pn − 1 > 3(pn − 1)/2.
A partir de la relación obtenida, un simple argumento inductivo nos da la
conclusión.
b) Vamos a aplicar el apartado anterior a F (X) = X(X − 1)(X − λ). Bus-
camos el coeficiente de X p−1 en (X(X − 1)(X − λ))r , que es el coeficiente de
X r en (X − 1)r (X − λ)r . Dicho coeficiente es
r  
  
r r
i (−λ)i r−i (−1)r−i = (−1)r Hp (λ).
i=0

Falta probar que Hp (T ) tiene raı́ces simples. Para ello comprobaremos la


identidad siguiente:
d 2 Hp dHp
4T (1 − T ) + 4(1 − 2T ) − Hp (T ) = 0. (4.2)
dT 2 dT
En efecto, tenemos que
dHp   2
r
d 2 Hp   2r

i i(i − 1)T
r i−1 r i−2
= i iT , 2
= ,
dT i=1
dT i=2

dHp 
r
 r 2 
r
r  2
4(1 − 2T ) = i 4iT i−1 − i 8iT i
dT i=1 i=1

r−1
  
r
r  2
r 2
= i+1 4(i + 1)T i − i 8iT i ,
i=0 i=0

d 2 Hp 
r
 r 2 r
r  2
4T (1 − T ) = i 4i(i − 1)T i−1 − i 4i(i − 1)T i
dT 2 i=2 i=2

r−1
  
r
r 2
r 2
= i+1 4i(i + 1)T i − i 4i(i − 1)T i .
i=0 i=0
 r
 
r−i r
Ahora hacemos i+1 = i+1 i , y queda

dHp r
r2 (r − i)2 i  r
r  2
4(1 − 2T ) = i 4T − i
i 8iT ,
dT i=0
i + 1 i=0
106 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

d 2 Hp r
r2 (r − i)2 r
r 2
4T (1 − T ) 2
= i 4iT i
− i 4i(i − 1)T .
i
dT i=0
i + 1 i=0
r  2
 r
El miembro izquierdo de (4.2) es de la forma i Ci T i , donde
i=0

(r − i)2 (r − i)2
Ci = 4i + 4 − 4i(i − 1) − 8i − 1
i+1 i+1
= 4(r − i)2 − 4i2 − 4i − 1 = 4r2 − 8ri − 4i − 1
= p2 − 2p − 4pi = 0,
pues k tiene caracterı́stica p. Esto prueba (4.2). Derivando sucesivamente esta
expresión obtenemos identidades de la forma
d n Hp
4T (1 − T ) = polinomio en las derivadas de orden < n,
dT n
para n ≥ 2. Si Hp (T ) tuviera una raı́z t = 0, 1 de orden n ≥ 2, entonces la deri-
vada n-sima de H deberı́a ser no nula en t, mientras que las derivadas de orden
inferior deberı́an ser todas nulas, pero esto contradice la relación precedente.
Por lo tanto, sólo falta justificar que 0 y 1 no son raı́ces de Hp (T ). Ahora bien,

r
r 2 p−1
Hp (0) = 1, Hp (1) = i = r ≡ 0 (mód p).
i=0

(La suma de cuadrados puede evaluarse ası́: para escoger r objetos de entre
2r,
r podemos partir los 2r en dos grupos de r, escoger i del primer grupo — de
i formas distintas— y r − i del segundo —también de r
i formas distintas—.)
c) Por el teorema 2.16, sabemos que toda curva elı́ptica admite una ecuación
de Weierstrass Eλ en forma de Legendre, cuyo invariante es
(λ2 − λ + 1)3
j(Eλ ) = 28 .
λ2 (λ − 1)2
Ahora bien, cada invariante j se corresponde con 6 valores de λ, excepto
j = 0, que se corresponde con 2 y j = 1728, que se corresponde con 3, esto
último salvo si p = 3, caso que tratamos aparte. Vemos que
H3 (T ) = 1 + T,
luego el único invariante supersingular es el correspondiente a λ = −1, que a su
vez se corresponde con el invariante j = 0.
Si p ≥ 5 definimos δp (j) = 1 si la curva elı́ptica de invariante j es supersin-
gular en caracterı́stica p y δp (j) = 0 si es ordinaria. Entonces, para p ≥ 5, el
número de invariantes supersingulares es
 
1 p−1
− 2δp (0) − 3δp (1728) + δp (0) + δp (1728)
6 2
p−1 2 1
= + δp (0) + δp (1728).
12 3 2
4.2. Curvas supersingulares 107

Falta por determinar los valores de δp (0) y δp (1728), es decir, cuándo los
invariantes j = 0 y j = 1728 son supersingulares. Como el resultado tiene in-
terés en sı́ mismo lo enunciamos como teorema independiente a continuación.
Observemos que el criterio depende únicamente del resto de p módulo 12. Lle-
vando los cuatro casos posibles a la fórmula anterior se obtiene el criterio del
enunciado.

Teorema 4.9 El invariante j = 0 es supersingular en caracterı́stica p > 3 si y


sólo si p ≡ −1 (mód 3), mientras que el invariante j = 1728 es supersingular si
y sólo si p ≡ −1 (mód 4).

Demostración: Consideramos la curva Y = X 3 + 1, cuyo invariante es


j = 0 en cualquier caracterı́stica. Aplicamos el apartado a) del teorema anterior,
para lo cual necesitamos el coeficiente de X (p−1)/2 en (X 3 + 1)(p−1)/2 . Éste será
 
nulo salvo si p ≡ 1 (mód 3), en cuyo caso vale (p−1)/2
(p−1)/3
, que no es nulo módulo p
(pues se obtiene como productos y cocientes de elementos no nulos).
Para j = 1728 consideramos la curva Y 2 = X 3 + X. Buscamos el coeficiente
de X (p−1)/2 en (X 2 + 1)(p−1)/2 . Como antes, será nulo salvo si p ≡ 1 (mód 4),
 
en cuyo caso vale (p−1)/2
(p−1)/4
, que no es cero módulo p.
Para terminar demostramos que el carácter ordinario o supersingular de una
curva elı́ptica está muy relacionado con la estructura de su anillo de endomor-
fismos:

Teorema 4.10 Sea E/k una curva elı́ptica definida sobre un cuerpo finito k.
Si E es supersingular entonces End(E) tiene rango 4 como Z-módulo y si E es
ordinaria entonces tiene rango 2.

Demostración: Supongamos primeramente que E es ordinaria, digamos


que |k| = pe y sea φpe la aplicación de Frobenius de grado pe . Veamos que
φpe ∈/ Z. En caso contrario, comparando grados habrı́a de ser φpe = ±pe/2 (con
e par), pero entonces pe/2 serı́a inseparable y E serı́a supersingular, en contra
de lo supuesto.
Con esto tenemos que el rango de End(E) es 2 o 4. Si probamos que End(E)
es conmutativo, el rango tendrá que ser 2. Observemos que el homomorfismo na-
tural End(E) −→ End(Tp (E)) es inyectivo, pues si una isogenia φ tiene imagen
nula entonces se anula sobre todos los subgrupos E[pr ], y como E es ordina-
ria cada uno de ellos tiene pr elementos, luego φ tiene núcleo infinito y, por
consiguiente, es nula.
Por otra parte, como E es ordinaria tenemos que Tp (E) ∼ = Zp , luego hemos
probado que End(E) es isomorfo a un subanillo de End(Zp ) ∼ = Zp . (Notemos que
End(Zp ) es el anillo de los homomorfismos de Zp -módulos de Zp en sı́ mismo, y
que Zp es un Zp -módulo libre de base 1.)
Consideremos ahora el caso en que E es supersingular y sea A = Q⊗End(E).
Supongamos, por reducción al absurdo, que el álgebra A tiene rango menor
que 4, con lo que es isomorfa a Q o a un cuerpo cuadrático imaginario. Por el
108 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

teorema 3.18 toda curva isógena a E es supersingular, por 3.17 sólo hay (salvo
isomorfismo) una cantidad finita de tales curvas y en la prueba de 3.36 vemos
que el anillo de endomorfismos de cualquiera de ellas es isomorfo a un orden de
A.
Si A = Q tomamos un primo cualquiera l = p, mientras que si A es un cuerpo
cuadrático, exigimos además que l se conserve primo en todos los órdenes de A
correspondientes a curvas isógenas a E. Precisemos esto:
Si el orden maximal de A es Z[α], entonces los demás órdenes son de la
forma Z[f α], donde al entero f se le llama conductor del orden correspondiente.
Hay infinitos primos racionales l que se conservan primos en el orden maximal.
De entre ellos, tomamos uno que no divida a ninguno de los conductores de los
órdenes indicados.
Puesto que E[li ] ∼
= Z/li Z×Z/li Z, podemos tomar una sucesión de subgrupos

H1 ≤ H2 ≤ · · · ≤ E, Hi ∼
= Z/li Z.

Por el teorema 2.37 existen curvas elı́pticas Ei junto con isogenias separables
λi : E −→ Ei de núcleo Hi . Según hemos comentado, hay un número finito de
posibles curvas Ei , luego dos de ellas han de ser isomorfas, Ei ∼ = Ei+j . Por otra
parte, el teorema 2.36 nos da una isogenia Ei+j −→ Ei tal que λi+j ◦ λ = λi ,
luego el núcleo de λ es isomorfo a Hi+j /Hi ∼ = Z/lj Z. Al componer λ con el
isomorfismo obtenemos una isogenia separable λ : Ei −→ Ei cuyo núcleo es
cı́clico de orden lj . Por consiguiente, λ tiene grado lj y λλ̂ = lj .
Si End(Ei ) ∼= Z la factorización única implica que j es par y λ = Klj/2 ,
donde K = ±1. Si End(Ei ) es un orden cuadrático podemos llegar a la misma
conclusión (ahora con K ∈ Aut(Ei )) gracias a la elección de l. En efecto, tenemos
que l es primo con el conductor del orden, y todo ideal de un orden cuadrático
de norma prima con el conductor se descompone de forma única como producto
de ideales primos. Como (l) es primo, la factorización de λ ha de ser λ = Klr y,
aplicando la involución, de hecho λ = Klj/2 .
Esto nos lleva a que el núcleo de lj/2 es cı́clico, pero por otra parte sabemos
que es producto de dos grupos cı́clicos, lo que nos da una contradicción.

4.3 El número de curvas sobre un cuerpo


Según el teorema 2.46, si E/k es una curva elı́ptica de invariante j = 0, 1728,
hay tantas clases de k-isomorfı́a de curvas conjugadas con E/k como elementos
en k ∗ /k ∗2 . En general esto nos da infinitas clases, pero si k es un cuerpo finito
k ∗2 tiene ı́ndice 2, luego a cada invariante j le corresponden sólo 2 clases de
conjugación de curvas con invariante j. En esta sección calcularemos el número
de clases de k-isomorfı́a de curvas conjugadas a una dada a partir de una fórmula
sobre grupos finitos, que nos permitirá considerar incluso las caracterı́sticas 2 y
3, exceptuadas en 2.46.
Recordemos que un grupo G actúa sobre un conjunto X si cada elemento de
G tiene asociada una permutación de X de forma consistente con la operación
4.3. El número de curvas sobre un cuerpo 109

en G, es decir, si tenemos un homomorfismo ρ : G −→ ΣX , donde ΣX denota el


grupo de las permutaciones de X. En lugar de ρ(g)(x) escribimos simplemente
xg. Si G actúa sobre X, a cada g ∈ G le podemos asociar el conjunto fijado
F (g) = {x ∈ X | xg = x},
y a cada x ∈ X le podemos asociar su estabilizador:
Gx = {g ∈ G | xg = x}.
Por otra parte, en X podemos establecer la relación de equivalencia en virtud
de la cual dos elementos x, y están relacionados si existe un g ∈ G tal que xg = y.
Las clases de equivalencia se llaman órbitas y el conjunto cociente se representa
por X/G. El resultado que necesitamos es el siguiente:
Teorema 4.11 (Fórmula de Burnside) Si un grupo finito G actúa sobre un
conjunto finito X, entonces
1 
|X/G| = |F (g)|.
|G|
g∈G

Demostración: Veamos primeramente que la fórmula se cumple cuando


|X/G| = 1. Se dice entonces que la acción es transitiva. Consideramos el
conjunto A = {(x, g) ∈ X × G | xg = x}.
Agrupando los pares de A según su primera o su segunda componente obte-
nemos que  
|F (g)| = |Gx |.
g∈G x∈X

Ahora bien, si x ∈ X, la aplicación φ : G −→ X dada por φ(g) = xg es


suprayectiva (porque sólo hay una órbita) y φ(g) = φ(h) si y sólo si xg = xh,
si y sólo si xhg −1 = x, si y sólo si hg −1 ∈ Gx . Por lo tanto, cada x ∈ X tiene
exactamente |Gx | antiimágenes por φ y concluimos que |G| = |X||Gx |. Esto nos
da que  
|F (g)| = |G|/|X| = |G|,
g∈G x∈X

como habı́a que probar.


En el caso general, si X/G = {X1 , . . . , Xn }, entonces G actúa sobre cada
órbita Xi y por la parte ya probada

|G| = |Fi (g)|,
g∈G

donde Fi (g) = {x ∈ Xi | xg = x}. Al sumar sobre i obtenemos



n|G| = |F (g)|,
g∈G

lo que prueba el teorema.


Como aplicación de esta fórmula vamos a demostrar lo siguiente:
110 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

Teorema 4.12 Sea ν = ν(m, j) el número de curvas elı́pticas salvo k-isomor-


fismo definidas sobre el cuerpo k de m elementos con invariante j. Entonces
ν = 2 excepto en los casos indicados en la tabla siguiente:
m j ν
1, 5 (mód 12) 1728 4
1 (mód 6) 0 6
32r+1 0 4
32r 0 6
22r+1 0 3
22r 0 7

Demostración: Sea m = pn . Supongamos en primer lugar que p > 3 y que


j = 0, 1728. Entonces toda curva elı́ptica definida sobre k admite una ecuación
canónica según el teorema 2.7, es decir, de la forma Y 2 = X 3 + a4 X + a6 con
4a34
j = 1728 .
4a34 + 27a26
Observemos que a4 = 0 = a6 , o de lo contrario serı́a j = 0, 1728. El
número total de ecuaciones correspondientes a un j dado es el número de pares
(a4 , a6 ) ∈ k ∗ × k ∗ que cumplen la ecuación

(1728 − j)(a4 /3)3 = (a6 /2)2 .

Hay (m − 1)/2 valores de a4 para los que el miembro izquierdo tiene raı́z
cuadrada en k. (Serán los valores para a4 con o sin raı́z cuadrada, según si 3 y
1728 − j tienen o no raı́z cuadrada en k.) Para cada valor de a4 hay dos valores
para a6 . En total hay m − 1 ecuaciones con invariante j.
Dos ecuaciones corresponden a curvas k-isomorfas si y sólo si existe una
transformación del tipo dado por el teorema 2.3 que transforma una en la otra.
Del teorema 2.6 (comparar con la prueba del teorema 2.12) se sigue que las
transformaciones que convierten una ecuación del tipo considerado en otra del
mismo tipo son las de la forma

X = u2 X  , Y = u3 Y  , u ∈ k∗ .

Estas transformaciones constituyen un grupo G de orden m − 1 y una trans-


formación dada fija a una ecuación si y sólo si u2 = 1, en cuyo caso las fija a
todas. Por lo tanto, hay dos transformaciones que fijan a las m − 1 ecuaciones
y m − 3 que no fijan a ninguna. La fórmula de Burnside nos da que
1
ν= (m − 1 + m − 1) = 2.
m−1
Los demás casos se tratan de forma similar. Como ilustración detallaremos
el más complicado, el correspondiente a m = 2n , n par, j = 0. Según el
teorema 2.7, las curvas en estas condiciones admiten ecuaciones de la forma

Y 2 + a3 Y = X 3 + a4 X + a6 , a3 = 0.
4.3. El número de curvas sobre un cuerpo 111

Hay un total de (m − 1)m2 = (2n − 1)22n ecuaciones. Del teorema 2.6 se


sigue que las transformaciones que conservan la forma canónica de la ecuación
son las del tipo

X = u2 X  + s2 , Y = u3 Y  + su2 X  + t, u = 0.

Éstas forman un grupo G de orden (m − 1)m2 = (2n − 1)22n . Además, las


que fijan a una ecuación dada son las que cumplen

u3 = 1, (u − 1)a4 + sa3 + s4 = 0, s2 a4 + s6 + ta3 + t2 = 0.

Hemos de calcular |F (g)| para cada g = (u, s, t). Distinguimos casos:

a) u = 1, s = 0.

• t = 0. Entonces g es la identidad y |F (g)| = (2n − 1)22n .


• t = 0. Entonces g fija a las ecuaciones que cumplen ta3 +t2 = 0, lo que
determina completamente a a3 , mientras que a4 y a6 son arbitrarios.
Por consiguiente, |F (g)| = m2 = 22n . Hay m − 1 transformaciones g
en este caso, luego la contribución total a la fórmula de Burnside es
(2n − 1)22n .

b) u = 1, s = 0. Las ecuaciones son sa3 + s4 = 0, s2 a4 + s6 + ta3 + t2 = 0. La


primera determina a a3 y la segunda a a4 , mientras que a6 es arbitrario.
Ası́ pues, |F (g)| = m = 2n . Hay (m − 1)m = (2n − 1)2n transformaciones
de este tipo, luego la contribución total a la fórmula es (2n − 1)22n .

c) u = 1. Aquı́ usamos que n es par, pues de lo contrario este caso no


podrı́a darse. En efecto, el menor cuerpo de caracterı́stica 2 que contiene
a las raı́ces cúbicas de la unidad es el de 4 elementos, luego éstas están
contenidas en los cuerpos de 2n elementos con n par.

• s = 0, t = 0. Las condiciones se reducen a a4 = 0, luego concluimos


que |F (g)| = (m − 1)m = (2n − 1)2n . Hay 2 transformaciones en
este caso (correspondientes a los dos valores de u), luego en total la
contribución es de (2n − 1)2n+1 .
• s = 0, t = 0. A la condición a4 = 0 hay que añadir a3 = −t,
lo que reduce las ecuaciones a |F (g)| = m = 2n . El número de
transformaciones es 2(2n −1), luego la contribución es de (2n −1)2n+1 .
• s = 0. Las condiciones son

(u − 1)a4 + sa3 + s4 = 0, s2 a4 + s6 + ta3 + t2 = 0.

Despejamos a4 en la primera (notemos que 1/(u − 1) = u) y susti-


tuimos en la segunda:

a3 (us3 + t) + (u + 1)s6 + t2 = 0,
112 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

o también
a3 (us3 + t) + (us3 + t)2 = 0.
— Si t = us3 se cumplen las condiciones para cualquier a3 y cualquier
a6 , mientras que a4 está determinado. Esto nos da

|F (g)| = (m − 1)m = (2n − 1)2n ,

y el número de transformaciones es 2(m − 1). La contribución es de


(2n − 1)2 2n+1 .
— Si t = us2 entonces a3 está fijo, al igual que a4 , luego |F (g)| = 2n
y el número de transformaciones es 2(m − 1)2 . La contribución es de
(2n − 1)2 2n+1 .

La fórmula de Burnside nos da, finalmente,


1
ν = (3(2n − 1)22n + 2(2n − 1)2n+1 + 2(2n − 1)2 2n+1 )
(2n − 1)22n
1
= (3 · 22n + 2n+2 + 4 · 22n − 2n+2 ) = 7.
22n

A partir de aquı́ es fácil calcular el número total de curvas elı́pticas sobre un


cuerpo dado:

Teorema 4.13 El número N de curvas elı́pticas salvo k-isomorfismo sobre el


cuerpo k de m elementos viene dado por la tabla siguiente:

m N
2r+1
2 22r+2 + 1
22r 22r+1 + 5
32r+1 2(32r+1 + 1)
32r 2(32r 1 + 3)
1 (mód 12) 2m + 6
5 (mód 12) 2m + 2
7 (mód 12) 2m + 4
11 (mód 12) 2m

Demostración: Es una comprobación sencilla. Veamos por ejemplo el


primer caso: hay 22r+1 invariantes posibles, cada uno de los cuales da lugar a 2
curvas, excepto j = 0, que aporta 3. En total:

N = 2(22r+1 − 1) + 3 = 22r+2 + 1.

Dada una curva


E : Y 2 = X 3 + a4 X + a6
4.3. El número de curvas sobre un cuerpo 113

definida sobre un cuerpo finito de caracterı́stica > 3, el teorema 4.12 afirma


que —salvo casos excepcionales— sólo hay dos clases de conjugación de curvas
isomorfas a E. El teorema 2.46 nos da que un representante de la otra clase es
la curva dada por
E  = Y 2 = X 3 + d2 a4 X + d3 a6 ,
donde d no es un cuadrado en k ∗ .
Vamos a determinar la relación entre las trazas de E y E  . Para ello con-
sideramos el carácter cuadrático χ : k ∗ −→ {±1}, aplicamos la fórmula (4.1) y
usamos que cuando x recorre k lo mismo hace dx:
 
T (E  /k) = − χ(x3 + d2 a4 x + d3 a6 ) = − χ(d3 x3 + d3 a4 x + d3 a6 )
x∈k x∈k

= χ(d) T (E/k) = −T (E/k).


3

(Notemos que χ(d) = −1 porque hemos tomado d sin raı́z cuadrada en k.)
Vemos ası́ que E y E  tienen traza distinta supuesto que ésta sea no nula
(en particular si son curvas ordinarias). Con esto tenemos casi demostrado el
teorema siguiente:

Teorema 4.14 Dos curvas elı́pticas ordinarias sobre un cuerpo finito k son k-
isomorfas si y sólo si tienen el mismo invariante y el mismo número de puntos
racionales.

Demostración: Las condiciones son obviamente necesarias. Si se cumplen


y j = 0, 1728, entonces sólo hay dos clases de curvas k-isomorfas con invariante
j. Si las dos curvas no fueran k-isomorfas, una de ellas serı́a k-isomorfa a una
curva E y otra a la correspondiente curva E  en las condiciones de la discusión
precedente, pero ya hemos visto que en tal caso tendrı́an trazas opuestas (no
nulas, por ser ordinarias), luego no tendrı́an el mismo número de puntos racio-
nales.
Falta considerar los casos j = 0 y j = 1728. Estos invariantes son supersin-
gulares en las caracterı́sticas 2 y 3, luego podemos suponer que car k > 3. Si
j = 1728 ambas curvas admiten ecuaciones de la forma

E : Y 2 = X 3 + a4 X, E  : Y 2 = X 3 + a4 X.

Por 4.9 sabemos además que p ≡ 1 (mód 4), luego también m ≡ 1 (mód 4).
Como de costumbre, llamamos m al cardinal de k. Trabajando en k, se cumple
  3
T (E/k) = − χ(x3 + a4 x) = − (x + a4 x)(m−1)/2
x∈k x∈k∗
 

(m−1)/2  (m − 1)/2 2i+(m−1)/2 (m−1)/2−i
=− x a4 .
i=0 x∈k∗ i
Ahora usamos la relación

 i −1 si m − 1 | i,
x =
x∈k∗ 0 en caso contrario,
114 Capı́tulo 4. Curvas elı́pticas sobre cuerpos finitos

que ya nos ha aparecido en la prueba del teorema 4.8. El único exponente


múltiplo de m − 1 en nuestra suma corresponde a i = (m − 1)/4, luego
 
(m − 1)/2 (m−1)/4
T (E/k) = a .
(m − 1)/4 4

Como las curvas son ordinarias, las trazas son no nulas módulo p, luego el
número combinatorio es no nulo en k. La misma relación vale para T (E  /k), y
(m−1)/4 (m−1)/4
simplificando los números combinatorios concluimos que a4  = a4
o, lo que es lo mismo, (a4 /a4 )(m−1)/4 = 1. Esto implica que 4 a4 /a4 ∈ k. (En
general, si k ∗ = g y (g i )(m−1)/4 = 1, entonces m − 1 | i(m − 1)/4, luego
4 | i, luego g i tiene raı́z cuarta g i/4 .) Por el teorema 2.47, las dos curvas son
k-isomorfas.
Si j = 0 hemos de considerar ecuaciones de la forma Y 2 = X 3 + a6 . El
razonamiento es análogo. Ahora tenemos que m ≡ 1 (mód 3), y la expresión
para la traza resulta ser
 
(m − 1)/2 (m−1)/6
T (E/k) = a ,
(m − 1)/3 6

de donde concluimos que (a6 /a6 )(m−1)/6 = 1 y de aquı́ que 6 a6 /a6 ∈ k.

Ejercicio: Razonar que el teorema anterior es falso para curvas supersingulares.


Capı́tulo V

Grupos formales

En este capı́tulo introducimos una nueva técnica para estudiar las curvas
elı́pticas. Esencialmente consiste en estudiar el desarrollo en serie de Taylor de
la suma en un entorno del punto (O, O). Esto nos llevará a la noción de grupo
formal, que es una serie de potencias en dos variables que satisface las condi-
ciones necesarias obvias para poder ser una serie de Taylor de una operación de
grupo. Antes de introducir la noción general de grupo formal dedicaremos la
primera sección a ver con detalle cómo aparecen estos grupos en el estudio de
las curvas elı́pticas.

5.1 Desarrollos de Taylor en O


Consideremos una curva elı́ptica E definida por una ecuación de Weierstrass

Y 2 + a1 XY + a3 Y = X 3 + a2 X 2 + a4 X + a6 .

Puesto que queremos estudiar desarrollos de Taylor alrededor del punto O,


conviene hacer un cambio de sistema de referencia para que sus coordenadas
pasen a ser (0, 0). Dado que O = [0, 1, 0], basta con homogeneizar respecto de
Z y deshomogeneizar respecto de Y . La ecuación pasa a ser

Z + a1 XZ + a3 Z 2 = X 3 + a2 X 2 Z + a4 XZ 2 + a6 Z 3 .

Para eliminar signos conviene hacer el cambio Z  = −Z, X  = −X, con lo


que la ecuación se convierte en

Z = X 3 + a1 XZ + a2 X 2 Z + a3 Z 2 + a4 XZ 2 + a6 Z 3 .

Si las coordenadas afines originales eran x = X/Z, y = Y /Z, las nuevas son
t = −X/Y , z = −Z/Y , luego

t = −x/y, z = −1/y,

115
116 Capı́tulo 5. Grupos formales

y están ligadas por la ecuación

z = t3 + (a1 t + a2 t2 )z + (a3 + a4 t)z 2 + a6 z 3 .

Sabemos que x tiene un polo doble en O, mientras que y tiene un polo triple.
Por consiguiente, t y z tienen ceros en O de órdenes 1 y 3, respectivamente. En
particular t es un parámetro local de E en O y podemos considerar el desarrollo
de z en potencias de t, que será de la forma

z = t3 (A0 + A1 t + A2 t2 + · · · ), Ai ∈ k.

Vamos a demostrar que en realidad An ∈ Z[a1 , . . . , a6 ]. Esto es una conse-


cuencia de un resultado general:

Teorema 5.1 Sea A un dominio ı́ntegro y A[[T ]] su anillo de series formales


de potencias. Sean F ∈ A[[T ]][Z] y n ≥ 1 tales que

F (0) ≡ 0 (mód T n ), F  (0) ≡ 1 (mód T ).

Entonces la sucesión

z0 = 0, zm+1 = zm − F (zm )

converge a una serie z ∈ A[[T ]], que es la única que cumple

F (z) = 0, z ≡ 0 (mód T n ).

Demostración: Llamemos m = (T ) al ideal maximal de A[[T ]]. Estamos


suponiendo que el término independiente de F está en mn , luego si zm ∈ mn ,
también F (zm ) ∈ mn , luego zm+1 ∈ mn . Ası́ pues, concluimos que zm ∈ mn
para todo m.
Veamos ahora que zm ≡ zm+1 (mód mm+n ). Para m = 0 esto significa
que F (0) ≡ 0 (mód mn ), lo cual es cierto por hipótesis. Supongamos que la
congruencia se cumple para naturales menores que m.
Consideremos dos indeterminadas Z1 e Z2 . Claramente

F (Z1 ) − F (Z2 ) = (Z1 − Z2 )(F  (0) + Z1 G(Z1 , Z2 ) + Z2 H(Z1 , Z2 )),

con G, H ∈ A[[T ]][Z1 , Z2 ]. Por lo tanto,

zm+1 −zm = zm −F (zm )−(zm−1 −F (zm−1 )) = zm −zm−1 −(F (zm )−F (zm−1 ))

= (zm − zm−1 )(1 − F  (0) − zm G(zm , zm−1 ) − zm−1 H(zm , zm−1 )).

Por hipótesis de inducción zm −zm−1 ∈ mm+n−1 , por la hipótesis del teorema


1 − F  (0) ∈ m y, según hemos visto antes, zm−1 , zm ∈ mn , luego podemos
concluir que zm+1 − zm ∈ mm+n .
Con esto hemos probado que la sucesión zm+1 − zm tiende a 0, luego la
sucesión zm es de Cauchy en A[[T ]], luego converge a una serie z. Tomando
5.1. Desarrollos de Taylor en O 117

lı́mites en la relación recurrente que define a zm obtenemos que F (z) = 0.


Como cada zm ∈ mn , la continuidad de la valoración implica que z ∈ mn .
Por último, si z  ∈ A[[T ]] es otra serie que cumple F (z  ) = 0 y z  ∈ mn ,
entonces
0 = F (z) − F (z  ) = (z − z  )(F  (0) + zG(z, z  ) + z  H(z, z  )).
Si fuera z = z  entonces F  (0) + zG(z, z  ) + z  H(z, z  ) = 0, de donde
podrı́amos concluir que F  (0) ∈ m, contradicción.
Volviendo a la discusión previa al teorema, tomamos A = Z[a1 , . . . , a6 ] y
F (Z) = Z − T 3 − (a1 T + a2 T 2 )Z − (a3 + a4 T )Z 2 − a6 Z 3 .
Ciertamente
F (0) = T 3 ≡ 0 (mód T 3 ), F  (0) = 1 − (a1 T + a2 T 2 ) ≡ 1 (mód T ),
luego la serie de potencias S(T ) ∈ Z[a1 , . . . , a6 ][[T ]] que nos da el teorema
cumple la ecuación
S(T ) = T 3 + (a1 T + a2 T 2 )S(T ) + (a3 + a4 T )S(T )2 + a6 S(T )3 ,
ası́ como que T 3 | S(T ). Ahora bien, si aplicamos el teorema con A = k
obtenemos la misma serie S(T ), pero ahora la serie de Taylor de z cumple las
mismas propiedades, luego por la unicidad concluimos que S(T ) es dicha serie
de Taylor.
Más aún, podemos aplicar el teorema con A = A[a1 , . . . , a6 ], considerando
ahora los ai ’s como indeterminadas. Ası́ obtenemos una única serie
S(T ) ∈ Z[a1 , . . . , a6 ][[T ]]
con la propiedad de que cuando sustituimos las indeterminadas ai por valores
concretos en un cuerpo k, la serie S(T ) se particulariza a la serie de Taylor de
z respecto de t correspondiente a la curva elı́ptica determinada por la ecuación
de Weierstrass de coeficientes ai . Pongamos que
S(T ) = T 3 (A0 + A1 T + A2 T 2 + · · · ),
con Ai ∈ Z[a1 , . . . , a6 ]. Es fácil calcular explı́citamente los polinomios Am . Por
ejemplo:
A0 = 1, A1 = a1 , A2 = a21 + a2 , A3 = a31 + 2a1 a2 + a3 ,
A4 = a41 + 3a21 a2 + 3a1 a3 + a22 + a4 , . . .
Vamos a demostrar que, tal y como se observa, la suma de los ı́ndices de cada
monomio de Am es igual a m. Para ello definimos el grado de un monomio de
Z[a1 , . . . , a6 ] como la suma de sus ı́ndices y llamamos Gr al Z-módulo generado
por los monomios de grado r. De este modo,


Z[a1 , . . . , a6 ] = Gr
r=0

y Gr Gs ⊂ Gr+s . Vamos a demostrar que Am ∈ Gm .


118 Capı́tulo 5. Grupos formales

Para ello observemos cómo se construye concretamente la serie S(T ). Si


llamamos
P (T, Z) = T 3 + (a1 T + a2 T 2 )Z + (a3 + a4 T )Z 2 + a6 Z 3 ,
la sucesión zn construida en 5.1 es
z0 = 0, zm+1 = P (T, zm ).
Más detalladamente:
z1 = P (T, 0), z2 = P (T, P (T, 0)), z3 = P (T, P (T, P (T, 0))), . . .
Si definimos
P1 (T, Z) = P (T, Z), Pm+1 (T, Z) = P (Z, Pm (T, Z)),
entonces zm = Pm (T, 0).
Extendamos la aplicación grado a Z[a1 , . . . , a6 , T, Z] estableciendo que T
tiene grado −1 y Z tiene grado −3. Ahora

+∞
Z[a1 , . . . , a6 , T, Z] = Gr .
r=−∞

Es claro que P (T, Z) ∈ G−3 . Más aún, una simple inducción prueba que
Pm (T, Z) ∈ G−3 para todo m ≥ 1. Por consiguiente,
Pm (T, 0) = T 3 (1 + B1m T + B2m T 2 + · · · + BN
m N
T ),
con Brm ∈ Gr . Como S(T ) = lı́m Pm (T, 0), tenemos que Ar = Brm para m
m
suficientemente grande, luego Ar tiene grado r.
El teorema siguiente resume lo que hemos obtenido hasta aquı́:
Teorema 5.2 Existe una serie formal de potencias
S(T ) = T 3 (1 + A1 T + A2 T 2 + · · · ) ∈ Z[a1 , . . . , a6 ][[T ]]
tal que si E es una curva elı́ptica determinada por una ecuación de Weierstrass
con coeficientes a1 , . . . , a6 , entonces la serie de Taylor de z = −1/y en O alre-
dedor del parámetro t = −x/y es S(T ). Además, los ı́ndices de cada monomio
de Am ∈ Z[a1 , . . . , a6 ] suman m.
Ahora podemos volver a las coordenadas de Weierstrass: observemos que la
serie 1 + A1 T + A2 T 2 + · · · es una unidad de Z[a1 , . . . , a6 ][[T ]], luego las series
de Laurent de x = t/z e y = −1/z alrededor de O tienen sus coeficientes en el
anillo Z[a1 , . . . , a6 ]. Un cálculo rutinario muestra que
1 a1
x = 2
− − a2 − a3 t − (a4 + a1 a3 )t2 + · · ·
t t
1 a1 a2
y = − + 2 + + a3 t + (a4 + a1 a3 )t2 + · · ·
t3 t t
5.1. Desarrollos de Taylor en O 119

Consideramos ahora el producto E × E. Sean pi las proyecciones, ti = pi ◦ t,


zi = pi ◦ z, para i = 1, 2. Las funciones t1 , t2 forman un sistema local de
parámetros en (O, O). Sea S : E × E −→ E la suma en E y sea s = S ◦ t.
Entonces s ∈ k(E × E). Vamos a estudiar su desarrollo en serie de Taylor
alrededor del punto (O, O).
Consideremos el plano afı́n determinado por Y = 0, en el cual podemos
tomar a t y z como coordenadas afines. Fijados dos puntos distintos P1 , P2 ∈ E,
de coordenadas (t1 , z1 ), (t2 , z2 ), la pendiente de la recta que los une es

z2 − z 1
λ= .
t2 − t 1

Podemos ver a λ como una función racional en la superficie E × E. Su


desarrollo en serie alrededor de (O, O) es1


+∞
T2n − T1n
λ(T1 , T2 ) = An−3 ∈ Z[a1 , . . . , a6 ][[T1 , T2 ]].
n=3
T2 − T1

Observemos que λ no tiene términos de grado 0 o 1. La recta que pasa por


P1 y P2 viene dada por la ecuación Z = λT + µ, donde µ = z1 − λt1 . Si vemos a
µ como función racional en E × E, tenemos también que su desarrollo en serie
es µ(T1 , T2 ) = z1 (T1 ) − λ(T1 , T2 )T1 ∈ Z[a1 , . . . , a6 ][[T1 , T2 ]].
Sustituyendo la ecuación Z = λT + µ en la ecuación de Weierstrass (más
exactamente, en su transformada en términos de T y Z) obtenemos una ecuación
cúbica en T , dos de cuyas raı́ces son t1 y t2 . El cociente de los coeficientes de
grado 2 y 3 será la suma de las raı́ces cambiada de signo, luego la tercera raı́z
es
a1 λ + a3 λ2 + a2 µ + 2a4 λµ + 3a6 λ2 µ
t3 = −t1 − t2 − .
1 + a2 λ + a4 λ2 + a6 λ3
Ası́, t3 es la coordenada t del tercer punto donde la recta corta a E. Dicho
punto es −P1 − P2 . Si consideramos a t3 como función racional en E × E,
tenemos que t3 es la composición de la función (P1 , P2 ) → −P1 − P2 con la
función t ∈ k(E). La expresión anterior muestra que su desarrollo en serie
alrededor de (O, O) cumple t3 (T1 , T2 ) ∈ Z[a1 , . . . , a6 ][[T1 , T2 ]], pues el desarrollo
en serie del denominador es una unidad del anillo de series de potencias (porque
λ no tiene término independiente). Más aún, como λ no tiene términos de
grado 1, vemos que
t3 (T1 , T2 ) = −T1 − T2 + · · ·

En términos de las coordenadas de Weierstrass, el opuesto de un punto


(x, y) viene dado por (x, −y − a1 x − a3 ). Teniendo en cuenta que t = −x/y, la
1 En principio no sabemos si λ es regular en (O, O), pero el monomorfismo de anillos

O(O,O) (E × E) −→ k[[T1 , T2 ]] se extiende a un monomorfismo de cuerpos de k(E × E) en el


cuerpo de cocientes de k[[T1 , T2 ]], y en este caso vemos que la imagen de λ es entera.
120 Capı́tulo 5. Grupos formales

coordenada t de dicho opuesto es i = x/(y + a1 x + a3 ). Viendo a i como función


racional en E, su desarrollo en serie alrededor de O es
x(T ) T −2 − a1 T −1 − · · ·
i(T ) = = ,
y(T ) + a1 x(T ) + a3 −T −3 + a1 T −2 + · · ·
luego
i(T ) = −T + · · · ∈ Z[a1 , . . . , a6 ][[T ]].
Claramente s = t3 ◦ i, luego2
s(T1 , T2 ) = i(t3 (T1 , T2 )) = T1 + T2 + · · · ∈ Z[a1 , . . . , a6 ][[T1 , T2 ]].
Con esto tenemos probada una parte del teorema siguiente:
Teorema 5.3 Sea E una curva elı́ptica definida por una ecuación de Weiers-
trass con coeficientes a1 , . . . , a6 . Sean x, y las coordenadas de Weierstrass y
t = −x/y. Sean s(P1 , P2 ) = t(P1 + P2 ), i(P ) = t(−P ), consideradas como
funciones en k(E × E) y k(E) respectivamente. Entonces sus series de Taylor
tienen sus coeficientes en Z[a1 , . . . , a6 ] y son de la forma
s(T1 , T2 ) = T1 + T2 + · · · , i(T ) = −T + · · ·
Además cumplen las propiedades siguientes:
a) s(T1 , s(T2 , T3 )) = s(s(T1 , T2 ), T3 ),
b) s(T1 , 0) = T1 , s(0, T2 ) = T2 ,
c) s(T1 , i(T1 )) = 0,
d) s(T1 , T2 ) = s(T2 , T1 ).
Demostración: Falta demostrar las cuatro propiedades. Para la pri-
mera consideramos la función u ∈ O(O,O,O) (E × E × E) definida mediante
u(P1 , P2 , P3 ) = t(P1 + P2 + P3 ).
Si φ1 : E × E × E −→ E × E viene dada por φ1 (P1 , P2 , P3 ) = (P1 + P2 , P3 ),
tenemos que u = φ1 ◦ s, luego la serie de Taylor de u en (O, O, O) es
τ (u) = τ (s)(τ (φ1 (t1 )), τ (φ1 (t2 ))) = s(s(T1 , T2 ), T3 ),
pero igualmente podemos probar que
τ (u) = s(T1 , s(T2 , T3 )),
luego ambas series coinciden.
Para las otras propiedades se razona análogamente. Ası́, para probar b) con-
sideramos φ(P ) = (P, O), para c) tomamos φ(P ) = (P, −P ) y para d) tomamos
φ(P1 , P2 ) = (P2 , P1 ).
2 Aquı́ usamos que si φ : V −→ W es regular y α ∈ O
φ(P ) (W ), la serie de Taylor de φ ◦ α en
P es la composición de la serie de Taylor de α en φ(P ) con las series de Taylor de φ ◦ ti , donde
t1 , . . . , tn es el sistema de parámetros locales considerado en φ(P ). Concretamente, tomamos
φ(P1 , P2 ) = −P1 − P2 y α = i, con lo que φ(t) = t3 .
5.2. Grupos formales 121

5.2 Grupos formales


Los resultados de la sección anterior nos llevan a esta definición:
Definición 5.4 Un grupo formal (abeliano) sobre un dominio ı́ntegro A es una
serie de potencias F ∈ A[[X, Y ]] que satisface las propiedades siguientes:
a) F (X, Y ) = X + Y + · · ·
b) F (X, F (Y, Z)) = F (F (X, Y ), Z),
c) F (X, 0) = X, F (0, Y ) = Y ,
d) Existe una serie i(X) ∈ A[[X]] tal que F (X, i(X)) = 0,
e) F (X, Y ) = F (Y, X).
Observemos que la serie i(X) cuya existencia postula la definición es única,
pues si j(X) cumple lo mismo, entonces
j(X) = F (j(X), 0) = F (j(X), F (X, i(X))) = F (F (j(X), X), i(X))
= F (F (X, j(X)), i(X)) = F (0, i(X)) = i(X).
En estos términos, lo que hemos demostrado en la sección anterior es que
la serie de Taylor en (O, O) de la suma de una curva elı́ptica dada por una
ecuación de Weierstrass con coeficientes a1 , . . . , a6 es un grupo formal sobre el
anillo Z[a1 , . . . , a6 ].
Dos ejemplos más elementales de grupos formales son los siguientes:

El grupo formal aditivo Se trata del grupo dado por


F (X, Y ) = X + Y.
Obviamente cumple todas las propiedades que exige la definición. La serie
inversa es i(X) = −X.

El grupo formal multiplicativo Se trata del grupo dado por


F (X, Y ) = X + Y + XY = (1 + X)(1 + Y ) − 1.
∞
1
La serie inversa es i(X) = −1= (−1)n X n .
1+X n=1

Vemos que un grupo formal es una serie de potencias que “definirı́a” una
operación de grupo en caso de converger. Más adelante veremos que en algunos
casos podemos garantizar la convergencia y obtenemos ciertamente estructuras
de grupo. Para no llegar a expresiones forzadas conviene usar letras distintas
cuando pensamos en un grupo formal como tal y cuando lo usamos como la
serie de potencias que es. Ası́ hablaremos de un grupo formal G con suma
F ∈ A[X, Y ], si bien, conjuntistamente G = F .
122 Capı́tulo 5. Grupos formales

Definición 5.5 Un homomorfismo h : G1 −→ G2 entre dos grupos formales


sobre un dominio ı́ntegro A es una serie de potencias h = H ∈ A[[T ]] sin
término independiente tal que

H(F1 (X, Y )) = F2 (H(X), H(Y )).

Observemos que si G es un grupo formal, entonces la serie H(T ) = T define


un homomorfismo formal 1 : G −→ G (la identidad en G). Ası́ mismo, dados
dos homomorfismos formales h1 : G1 −→ G2 y h2 : G2 −→ G3 podemos definir
h1 ◦ h2 : G1 −→ G3 mediante la composición de series H2 (H1 (T )).
Diremos que h : G1 −→ G2 es un isomorfismo si existe otro homomorfismo
h : G2 −→ G1 tal que h ◦ h = h ◦ h = 1.

Ejemplo Consideremos una isogenia φ : E1 −→ E2 entre dos curvas elı́pticas


sobre un cuerpo k con coordenadas de Weierstrass x1 , y1 y x2 , y2 respecti-
vamente. Sean ti = −xi /yi ∈ k(Ei ) y consideremos los grupos formales Gi
determinados por las series de Taylor si (X, Y ) según el teorema 5.3. Sea H(T )
la serie de Taylor en O de la función φ ◦ t2 . Vamos a comprobar que define un
homomorfismo formal h : G1 −→ G2 .
Ante todo, como t2 (φ(O)) = O, es claro que H no tiene término indepen-
diente. Ahora basta observar la coincidencia de las funciones
+ φ t φ×φ + t
E1 × E1 −→ E1 −→ E1 −→
2
k, E1 × E1 −→ E1 × E1 −→ E2 −→
2
k

La serie de Taylor en (O, O) de la primera es s1 (H(X), H(Y )), mientras que


la de la segunda es H(s2 (X, Y )).
Si tenemos isogenias φ1 : E1 −→ E2 y φ2 : E2 −→ E3 , entonces el homomor-
fismo formal asociado a φ1 ◦ φ2 es la composición h1 ◦ h2 de los homomorfismos
formales asociados a cada φi . En efecto, se trata del homomorfismo formal de-
terminado por la serie de Taylor de φ1 ◦ φ2 ◦ t3 , que es la composición de la serie
de Taylor de φ2 ◦ t3 (o sea, H2 (T )), con la serie de Taylor de φ1 ◦ t2 (que es
H1 (T )).
Es obvio que la isogenia identidad induce el homomorfismo formal identi-
dad, luego si una isogenia es un isomorfismo, su homomorfismo formal inducido
también lo es.
Si G es un grupo formal y m ∈ Z, podemos definir inductivamente homo-
morfismos m : G −→ G mediante

0(T ) = 0, m + 1(T ) = F (m(T ), T ), m − 1(T ) = F (m(T ), i(T )).

Una inducción rutinaria muestra que realmente son homomorfismos. Para


estudiarlos conviene demostrar un resultado general:

Teorema 5.6 Sea A un dominio ı́ntegro y a ∈ A una unidad. Entonces, para


toda serie de potencias F (T ) = aT + · · · existe una única serie G(T ) ∈ A[T ] tal
que F (G(T )) = T . Dicha serie cumple también que G(F (T )) = T .
5.2. Grupos formales 123

Demostración: Vamos a construir una sucesión Gn (T ) ∈ A[T ] tal que


F (Gn (T )) ≡ T (mód T n+1 ), Gn+1 (T ) = Gn (T ) (mód T n+1 ).
La segunda condición implica que la sucesión Gn (T ) es de Cauchy en A[[T ]],
luego converge a una serie G(T ) que, en virtud de la primera condición, cumple
F (G(T )) = T (la aplicación G → F (G) es claramente continua).
En primer lugar tomamos G1 (T ) = a−1 T . Supuesta definida Gn (T ), vamos a
probar que podemos tomar Gn+1 (T ) = Gn (T ) + cT n+1 para cierto c ∈ A. Esto
garantiza la segunda propiedad cualquiera que sea c. Respecto a la primera,
calculamos
F (Gn+1 (T )) = F (Gn (T ) + cT n+1 ) ≡ F (Gn (T )) + acT n+1
≡ T + bT n+1 + acT n+1 (mód T n+2 ),
para cierto b ∈ A, por hipótesis de inducción. Basta tomar c = −b/a.
Ası́ tenemos la existencia de una serie G tal que F (G(T )) = T . Ahora
bien, la construcción muestra que G(T ) = a−1 T + · · · luego podemos aplicar la
parte ya probada a G y obtener una serie H tal que G(H(T )) = T . Entonces
F (G(H(T ))) = F (T ), luego H(T ) = F (T ) y, por consiguiente, G(F (T )) = T .
Finalmente, si G es cualquier otra serie que cumpla F (G (T )) = T , entonces
G(T ) = G(F (G (T ))) = G (T ).

Veamos ahora un par de propiedades sobre la multiplicación por un entero


en un grupo formal que serán importantes después.
Teorema 5.7 Sea G un grupo formal sobre un dominio ı́ntegro A y m ∈ Z.
a) La multiplicación por m en G cumple m(T ) = mT + · · ·
b) Si m es una unidad en A, entonces m : G −→ G es un isomorfismo.
Demostración: El apartado a) se demuestra fácilmente por inducción so-
bre m. Para m < 0 observamos que
0 = F (T, i(T )) = T + i(T ) + · · · ,
luego i(T ) = −T + · · ·
Para probar b) usamos el teorema anterior, que nos da una serie G(T ) tal que
m(G(T )) = G(m(T )) = T . Sólo hemos de probar que G es un homomorfismo.
En efecto,
m(F (G(X), G(Y ))) = F (m(G(X)), m(G(Y ))) = F (X, Y ),
luego
F (G(X), G(Y )) = G(m(F (G(X), G(Y )))) = G(F (X, Y )).
124 Capı́tulo 5. Grupos formales

Diferenciales invariantes Ahora vamos a demostrar que todo grupo formal


tiene una forma diferencial invariante por traslaciones. El espacio de formas
diferenciales sobre A[[X]] puede identificarse con el propio A[[X]], pues una
forma diferencial es simplemente una expresión de tipo ω = H(X) dX, con
H(X) ∈ A[[X]].
Por otra parte, la traslación en un grupo formal G es simplemente su suma
vista como función de una variable, es decir, τY (X) = F (X, Y ).
La transformada de una forma ω por la traslación de G es la forma diferencial

∂F
τ Y (ω) = H(F (X, Y )) dT ∈ A[[X, Y ]]
∂X
Diremos que una forma diferencial ω sobre A[[X]] es invariante respecto de
un grupo formal G sobre A si τ Y (ω) = ω. Diremos que ω = H(X) dX está
normalizada si H(0) = 1.

Ejemplo Es fácil ver que una diferencial invariante para el grupo formal adi-
tivo F (X, Y ) = X + Y es ω = dX, mientras que una diferencial invariante para
el grupo formal multiplicativo F (X, Y ) = (1 + X)(1 + Y ) − 1 es

dX
ω= = (1 − X + X 2 − X 3 + · · ·) dX.
1+X

Teorema 5.8 Si G es un grupo formal sobre un dominio ı́ntegro A, entonces


existe una única diferencial invariante normalizada, dada por la fórmula
  −1
∂F 
ω= dX.
∂X (0,X)

Cualquier otra diferencial invariante es de la forma aω, con a ∈ A.

Demostración: Supongamos que ω = H(X) dX es una diferencial inva-


riante para G. Entonces

∂F
H(F (X, Y )) = H(X).
∂X
En particular, haciendo X = 0 tenemos que

∂F 
H(Y ) = H(0).
∂X (0,Y )

Cambiando la Y por la X queda



∂F 
H(X) = H(0).
∂X (0,X)
5.2. Grupos formales 125

La derivada de F tiene término independiente 1, luego H(X) está comple-


tamente determinado por H(0) y ha de ser
  −1
∂F 
H(X) = H(0).
∂X (0,X)

Basta probar que la diferencial del enunciado es invariante. Esto equivale a


demostrar que
  −1   −1
∂F  ∂F ∂F 
= .
∂X (0,F (X,Y )) ∂X ∂X (0,X)

Para ello derivamos respecto de Z (aplicando la regla de la cadena) la igual-


dad F (Z, F (X, Y )) = F (F (Z, X), Y ), con lo que obtenemos la relación
  
∂F  ∂F  ∂F 
= .
∂X (Z,F (X,Y )) ∂X (F (Z,X),Y ) ∂X (Z,X)

Ahora hacemos Z = 0, con lo que la expresión se reduce a


 
∂F  ∂F ∂F 
= ,
∂X (0,F (X,Y )) ∂X ∂X (0,X)

que es la relación que necesitábamos.

Teorema 5.9 Sea E una curva elı́ptica sobre un cuerpo k con coordenadas
de Weierstrass x, y, sea t = −x/y, sea ω = h dt una diferencial invariante
de E y sea H(T ) la serie de Taylor de h respecto del parámetro t. Entonces
ω  = H(T ) dT es una diferencial invariante del grupo formal asociado a E.
Demostración: Sabemos que ω es una diferencial de primera clase de E,
es decir, no tiene ceros ni polos, por lo que podemos suponer que h(O) = 1.
Para cada punto P ∈ E tenemos que
dτP
h = (h ◦ τP ) ,
dt
luego 
dτP 
1 = h(O) = h(P ) .
dt O
La derivada de τP es, por definición, la única función en k(E) cuya serie de
Taylor en O es la derivada de la serie de Taylor de τP . Ası́ pues, la serie de
Taylor de h es
  −1
∂s 
H(T ) = ,
∂X  (0,X)

donde s(X, Y ) es la serie de Taylor de la suma en E. Según el teorema anterior,


H(T ) dT es la diferencial invariante normalizada del grupo formal de E.
126 Capı́tulo 5. Grupos formales

Si h : G1 −→ G2 es un homomorfismo entre grupos formales sobre un


dominio ı́ntegro A, a cada forma diferencial ω = G(X) dX sobre A[[X]] le
podemos asignar otra dada por
dH
h(ω) = G(H(x)) dX.
dX
Esta transformación relaciona de forma natural las diferenciales invariantes:
Teorema 5.10 Si h : G1 −→ G2 es un homomorfismo entre grupos forma-
les, entonces las diferenciales invariantes normalizadas ωG1 y ωG2 verifican la
relación
h(ωG2 ) = H  (0) ωG1 .
Demostración: Vamos a ver que h(ωG2 ) es una diferencial invariante para
G1 . En efecto, si ωG2 = G(X) dX, entonces
 
dH
τ Y (h(ωG2 )) = τ Y G(H(X)) dX
dX

dH  ∂F1
= G(H(F1 (X, Y ))) dX
dX F1 (X,Y ) ∂X
∂H(F1 (X, Y ))
= G(F2 (H(X), H(Y ))) dX
∂X
∂F2 (H(X), H(Y ))
= G(F2 (H(X), H(Y ))) dX
 ∂X
∂F2  dH
= G(F2 (H(X), H(Y ))) dX
∂X (H(X),H(Y )) dX
dH
= G(H(X)) dX = h(ωG2 ).
dX
El término independiente de
dH
G(H(X))
dX
es H  (0), luego el teorema anterior implica la igualdad del enunciado.
Veamos otra aplicación de la diferencial invariante que nos será útil un poco
más adelante:
Teorema 5.11 Si G es un grupo formal sobre un dominio ı́ntegro A y p ∈ Z
es un primo, entonces existen series de potencias f (T ), g(T ) ∈ A[[T ]] tales que
f (0) = g(0) = 0 y p(T ) = pf (T ) + g(T p ).
Demostración: Sea ω(T ) = H(T ) dT la diferencial invariante normalizada
de G. Según el teorema 5.7 tenemos que p(T ) = pT + · · ·, luego el teorema
anterior implica que
pH(T ) dT = pω(T ) = H(p(T ))p (T ) dT.
La serie H(p(T )) tiene término independiente igual a 1, luego tiene inversa
en A[[T ]], luego p (T ) ∈ pA[[T ]]. Esto significa que cada término an T n en p(T )
cumple p | an o bien p | n.
5.2. Grupos formales 127

Logaritmos y exponenciales En este apartado trabajaremos con grupos


formales sobre un dominio ı́ntegro A de caracterı́stica 0 y llamaremos K = A⊗Q.
Podemos identificar a K con el subanillo del cuerpo de cocientes de A formado
por las fracciones con denominador entero.

Definición 5.12 Sea G un grupo formal sobre un dominio ı́ntegro A de carac-


terı́stica 0, sea K = A ⊗ Q y sea ω = (1 + c1 X + c2 X 2 + · · ·)dX la diferencial
invariante normalizada. El logaritmo formal de G es la serie de potencias

c1 c2
logG (X) = ω = X + X 2 + X 3 + · · · ∈ K[[X]].
2 3
La exponencial formal de G es la única serie de potencias expG (X) ∈ K[[X]]
que cumple (según 5.6)

logG (expG (X)) = expG (logG (x)) = X.

Por ejemplo, si G es el grupo formal multiplicativo, sabemos que su diferen-


cial invariante normalizada es

ω = (1 − X + X 2 − X 3 + · · ·) dX,

luego
X2 X3 X4
logG (X) = X − + − + ···
2 3 4
Observemos que si A = C ésta es la serie de potencias de la función holomorfa
log(1 + X), cuya inversa es la función eX − 1, cuya serie de potencias es a su
vez
∞
Xn
expG (X) = .
n=1
n!

Vamos a probar que esta serie es realmente expG (X) (para cualquier anillo
de coeficientes A). Lo que sabemos es que, como series en C[[X]], se cumple

expG (logG (X)) = X,

luego esta identidad se cumple también en Q[[X]], luego en K[[X]].


El interés de los logaritmos formales se debe en gran parte al teorema si-
guiente:

Teorema 5.13 Sea G un grupo formal sobre un dominio ı́ntegro A de carac-


terı́stica 0 y sea Ga el grupo formal aditivo sobre A. Si consideramos a ambos
como grupos formales sobre K = A ⊗ Q, entonces logG : G −→ Ga es un
isomorfismo.

Demostración: Sea ω = P (X) dX la diferencial invariante normalizada


de G. Entonces
∂F
P (F (X, Y )) = P (X).
∂X
128 Capı́tulo 5. Grupos formales

Equivalentemente,
∂ ∂
logG F (X, Y ) = logG (X).
∂X ∂X
Esto implica que
logG F (X, Y ) = logG (X) + H(Y ),
para cierta H(Y ) ∈ K[[Y ]]. Haciendo X = 0 vemos que H(Y ) = logG Y , luego
logG F (X, Y ) = logG (X) + logG (Y ).
Esto demuestra que logG es un homomorfismo. Cambiando X e Y por
expG (X) y expG (Y ) obtenemos
logG F (expG (X), expG (Y )) = X + Y,
y tomando exponenciales en ambos miembros
F (expG (X), expG (Y )) = expG (X + Y ),
luego expG también es un homomorfismo y es el inverso de logG , luego el loga-
ritmo es un isomorfismo.

Nota Es fácil ver que en la construcción de las funciones exponencial y lo-


garı́tmica de un grupo formal G no hemos usado en ningún momento la con-
mutatividad de G (es decir, la propiedad F (X, Y ) = F (Y, X)), pero tenemos la
relación
F (X, Y ) = expG (logG (X) + logG (Y )),
de donde se sigue que todo grupo formal sobre un dominio ı́ntegro de carac-
terı́stica 0 es necesariamente abeliano. Esto no es cierto en caracterı́stica prima.

La restricción a caracterı́stica nula es obviamente necesaria para trabajar con


logaritmos debido a que en la definición aparecen necesariamente denominadores
enteros. Dichos denominadores los conocemos explı́citamente en el caso de la
función logaritmo, pero no sucede lo mismo con su inversa, la exponencial. El
teorema siguiente nos permitirá obtener una estimación.
Teorema 5.14 Sea A un dominio ı́ntegro de caracterı́stica 0 y sea
∞
an n
F (X) = X
n=1
n!

una serie de potencias con an ∈ A y de modo que a1 sea una unidad. Entonces
la serie inversa G(X) determinada por F (G(X)) = X es de la forma
∞
bn n
G(X) = X ,
n=1
n!

con bn ∈ A.
5.3. Grupos formales sobre cuerpos métricos 129

Demostración: Derivando en F (G(X)) = X obtenemos que



dF  dG
 = 1,
dX G(X) dX

y haciendo X = 0 vemos que a1 b1 = 1. Como a1 es una unidad de A, concluimos


que b1 ∈ A. Derivando de nuevo queda
  2 
d2 F  dG dF  d2 G
2  +  = 0.
dX G(X) dX dX G(X) dX 2

Una simple inducción muestra que para todo n ≥ 2 podemos expresar



dF  dn G

dX G(X) dX n

como polinomio con coeficientes enteros de las series



di F  dj G
i  , i = 1, . . . , n, , j = 1, . . . , n − 1.
dX G(X) dX j

Al evaluar en X = 0 obtenemos a1 bn como polinomio con coeficientes enteros


de los ai y los bj , luego otra inducción nos da que bn ∈ A.
En particular:

Teorema 5.15 Sea G un grupo formal sobre un dominio ı́ntegro A de carac-


terı́stica 0. Entonces
∞ ∞
an n bn n
logG (X) = X , expG (X) = X ,
n=1
n n=1
n!

con an , bn ∈ A, a1 = b1 = 1.

5.3 Grupos formales sobre cuerpos métricos


En esta sección K será un cuerpo métrico discreto completo, O será su
anillo de enteros, P el ideal maximal de O y k = O/P y G será un grupo formal
sobre O. La peculiaridad de este contexto es que cualquier serie de potencias
H(X1 , . . . , Xn ) ∈ O[[X1 , . . . , Xn ]] converge obviamente en P × · · · × P.
Por consiguiente podemos definir el grupo G(P) formado por el conjunto P
con la suma determinada por α +G β = F (α, β) (y el inverso −G α = i(α)). Más
aún, es claro que G(Pn ) = Pn es un subgrupo de G(P).
También es claro que todo homomorfismo h : G1 −→ G2 entre grupos for-
males sobre O induce un homomorfismo de grupos h : G1 (Pn ) −→ G2 (Pn ), que
será un isomorfismo si y sólo si h lo es. Si m ∈ Z, la multiplicación m : G −→ G
induce la multiplicación por m en G(Pn ).
130 Capı́tulo 5. Grupos formales

Observemos que si Ga es el grupo formal aditivo, entonces Ga (Pn ) es simple-


mente Pn con la estructura de grupo que posee como ideal de O. Por otra parte,
si Gm es el grupo formal multiplicativo, entonces el grupo (aditivo) Gm (Pn ) es
isomorfo al grupo (multiplicativo) de unidades Un = 1 + Pn , a través del iso-
morfismo natural dado por a → 1 + a.
No podemos usar el teorema 5.13 para probar que todos los grupos G(P) son
isomorfos a P porque el isomorfismo formal entre G y el grupo aditivo Ga está
definido sobre un anillo mayor que O, sobre el cual no convergen necesariamente
las series exponencial y logarı́tmica. Luego veremos que, bajo ciertas hipótesis,
ambas series convergen sobre subgrupos suficientemente pequeños, con lo que lo
máximo que tendremos será un isomorfismo G(Pr ) ∼ = Pr , para r suficientemente
grande. De momento observemos que si G es un grupo formal arbitrario, el
grupo cociente
G(Pn )/G(Pn+1 )
es independiente de G. En efecto, si x, y ∈ Pn , entonces
x +G y = F (x, y) = x + y + · · · ≡ x + y (mód Pn+1 ),
luego la identidad es un isomorfismo G(Pn )/G(Pn+1 ) ∼
= Pn /Pn+1 .
Ahora vamos a estudiar los elementos de torsión de los grupos G(Pn ). El teo-
rema siguiente representará un papel importante en el estudio de la aritmética
de las curvas elı́pticas.
Teorema 5.16 Sea p ≥ 0 la caracterı́stica del cuerpo de restos k. Entonces
todo elemento de torsión de G(P) tiene orden potencia de p. (En particular, si
p = 0 no hay elementos de torsión).
Demostración: Basta probar que no existen elementos de torsión en G(P)
de orden primo con p (lo cual no es ninguna restricción si p = 0). En efecto,
si existe un elemento de torsión x ∈ G(P) y su orden m no es potencia de p,
entonces, o bien p = 0 y entonces m es primo con p, o bien multiplicando x por
la mayor potencia de p que divide a m obtenemos un nuevo elemento de torsión
de orden primo con p.
Supongamos, pues, que x ∈ G(P) cumple mx = 0, con (m, p) = 1, y hemos
de probar que x = 0. Como p es la caracterı́stica de k, el hecho de que m sea
primo con p equivale a que m ∈ / P, luego es una unidad de O y el teorema 5.7
nos da que la multiplicación (formal) por m es un isomorfismo formal de G en
sı́ mismo. Por consiguiente, la multiplicación por m es también un isomorfismo
m : G(P) −→ G(P). Esto nos permite concluir que x = 0.
Estudiemos ahora con más detalle el caso en que k tiene caracterı́stica prima.
Teorema 5.17 Supongamos que K tiene caracterı́stica 0 pero que la carac-
terı́stica del cuerpo de restos k es un primo p. Sea x ∈ G(P) un elemento de
torsión de orden pn . Entonces
v(p)
v(x) ≤ .
pn − pn−1
5.3. Grupos formales sobre cuerpos métricos 131

Demostración: Por el teorema 5.11 sabemos que p(T ) = pf (T ) + g(T p ),


con f (0) = g(0) = 0, y por 5.7 ha de ser f (T ) = T + · · ·
Demostramos el teorema por inducción sobre n. Si x = 0 pero p(x) = 0,
entonces 0 = pf (x) + g(xp ). Esto implica que
v(px) = v(pf (x)) = v(g(xp )) ≥ v(xp ) = pv(x),
luego v(p) ≥ (p − 1)v(x), como tenı́amos que probar.
Supongamos que el teorema es cierto para n y que x tiene orden n + 1.
Entonces
v(p(x)) = v(pf (x) + g(xp )) ≥ mı́n{v(px), v(xp )}.
Como p(x) tiene orden n, por hipótesis de inducción
v(p)
v(p(x)) ≤ ,
pn − pn−1
luego
v(p)
mı́n{v(px), v(xp )} ≤ ,
pn − pn−1
pero no puede ser que
v(p)
v(px) = v(p) + v(x) ≤ ,
pn − pn−1
luego ha de ser
v(p)
v(xp ) = pv(x) ≤ ,
pn − pn−1
como habı́a que probar.
Ası́, por ejemplo, un grupo formal sobre Zp no puede tener elementos de
torsión si p ≥ 3, y si p = 2 tendrá a lo sumo elementos de orden 2.
Vamos a estudiar ahora la convergencia de las series exponencial y logarı́tmica.
Nos apoyaremos en dos resultados técnicos.
Teorema 5.18 Sea p ∈ Z un primo tal que v(p) ≥ 1. Entonces, para cada
natural n ≥ 1 se cumple
(n − 1)v(p)
v(n!) ≤ .
p−1
Demostración: En efecto:


v(n!) = E(n/pi )v(p),
i=1

donde E(x) denota la parte entera (observemos que E(n/pi ) es el número de


múltiplos de pi menores o iguales que n). Por consiguiente

E(logp n)
nv(p) (n − 1)v(p)
v(n!) ≤ nv(p)/pi = (1 − p−E(logp n) ) ≤ ,
i=1 p−1 p−1
donde usamos que np−E(logp n) ≥ 1, pues equivale a que E(logp n) ≤ logp n.
132 Capı́tulo 5. Grupos formales

Teorema 5.19 Supongamos que K tiene caracterı́stica 0 y sea p ∈ Z un primo


tal que v(p) > 0.
a) Toda serie de la forma
∞
an n
f (T ) = T , an ∈ O
n=1
n

converge en la bola abierta de centro 0 y radio 1 (esto es, sobre los puntos
x ∈ O que cumplen v(x) > 0).
b) Toda serie de la forma
∞
bn n
g(T ) = T , bn ∈ O
n=1
n!

converge en la bola abierta de centro 0 formada por los puntos x ∈ O tales


que v(x) > v(p)/(p − 1). Además v(g(x)) = v(x).
Demostración: Para la serie f (T ) basta observar que
v(an xn /n) = v(an ) + nv(x) − v(n) ≥ nv(x) − v(p) logp n,
luego
lı́m v(an xn /n) = +∞,
n

lo que implica la convergencia de f (x).


Igualmente,
(n − 1)v(p)
v(bn xn /n!) = v(bn ) + nv(x) − v(n!) ≥ nv(x) −
p−1
 
v(p)
= v(x) + (n − 1) v(x) − .
p−1
Si x cumple la hipótesis de b), entonces
lı́m v(bn xn /n!) = +∞
n

y g(x) converge. Más aún, tenemos que si n ≥ 2 entonces


v(bn xn /n!) > v(x),
luego el valor de todas las sumas parciales de g(x) es v(x), de donde podemos
concluir que v(g(x)) = v(x).
Con esto podemos probar el siguiente resultado sobre logaritmos:
Teorema 5.20 Si K tiene caracterı́stica 0 y p ≥ 2 es un primo tal que v(p) > 0,
entonces el logaritmo formal induce un homomorfismo logG : G(P) −→ K.
Si r es un natural r > v(p)/(p − 1), entonces el logaritmo se restringe a un
isomorfismo logG : G(Pr ) −→ Ga (Pr ) (donde Ga es el grupo formal aditivo).
5.4. Grupos formales en caracterı́stica prima 133

Demostración: El teorema anterior se aplica claramente a la serie de po-


tencias logG T , luego ésta converge en G(P). El hecho de que la serie sea un
homomorfismo de grupos formales se traduce inmediatamente en que la apli-
cación inducida sobre G(P) es un homomorfismo de grupos. Veamos ahora que
se restringe a un homomorfismo logG : G(Pr ) −→ Ga (Pr ).
Si x ∈ G(Pr ) y n ≥ 1, o bien 1 ≤ n ≤ p − 1, en cuyo caso

v(xn /n) = nv(x) ≥ nr ≥ r,

o bien 2 ≤ p ≤ n, en cuyo caso


 n
x
v − r ≥ nv(x) − v(n) − r ≥ (n − 1)r − v(p) logp n
n
n−1 log n
> v(p) − v(p)
p−1 log p
 
v(p)(n − 1) log p log n
= − ≥ 0,
log p p−1 n−1

donde usamos que la función log t/(t − 1) es monótona decreciente para t ≥ 2.


Esto prueba que cada término de la serie logG x está en Pr , luego lo mismo
le sucede a la suma.
El teorema anterior implica también que serie exponencial expG (T ) define
un homomorfismo
expG : Ga (Pr ) −→ G(Pr ).
El hecho de que expG (T ) y logG (T ) sean formalmente inversos se traduce en
que las aplicaciones inducidas también lo son.

5.4 Grupos formales en caracterı́stica prima


En esta sección A será un dominio ı́ntegro de caracterı́stica prima p.

Definición 5.21 Sea h : G1 −→ G2 un homomorfismo formal entre dos grupos


formales sobre A. La altura de h (representada por alt h) es el mayor número
natural a tal que H(T ) = H ∗ (T p ), para cierta serie H ∗ (T ) ∈ A[[T ]]. Conveni-
a

mos que si h = 0 entonces alt h = +∞. La altura de un grupo formal G es la


altura de la multiplicación por p en G.

Por ejemplo, el teorema 5.7 implica que si (m, p) = 1 entonces alt m = 0,


mientras que el teorema 5.11 implica que alt p ≥ 1. Por lo tanto, la altura de
un grupo formal (sobre un dominio de caracterı́stica prima) es siempre mayor o
igual que 1.
El teorema siguiente es útil para calcular alturas:

Teorema 5.22 Sea h : G1 −→ G2 un homomorfismo formal entre grupos for-


males sobre A.
134 Capı́tulo 5. Grupos formales

a) Si H  (0) = 0 entonces H(T ) = H ∗ (T p ), para cierto H ∗ (T ) ∈ A[[T ]].


b) Si H(T ) = H ∗ (T p ), con a = alt h, entonces (H ∗ ) (0) = 0.
a

Demostración: a) Sean ω1 y ω2 las diferenciales invariantes normalizadas


de G1 y G2 . Entonces, por el teorema 5.10,
0 = H  (0) ω1 = h(ω2 ) = (1 + · · ·)H  (T ) dT,
luego H  (T ) = 0, de donde se sigue claramente que H(T ) = H ∗ (T p ).

b) Llamemos q = pa . Sea F1 (X, Y ) = aij X i Y j la suma en G1 y definamos
(q) 
F1 (X, Y ) = aqij X i Y j . Vamos a ver que esta serie determina un grupo formal
(q)
G1 . En efecto, consideremos unas nuevas indeterminadas S, T y llamemos
X = S q , Y = Y q , de modo que podemos identificar A[[X, Y ]] = A[[S q , T q ]]. En
(q)
estos términos, F1 (X, Y ) = F1 (S, T )q .
Igualmente podemos llamar Z = U q . Ası́, elevando a q la identidad
F1 (F1 (S, T ), U )) = F1 (S, F1 (T, U ))
(q)
obtenemos la identidad correspondiente para F1 . Igualmente se comprueban
las propiedades restantes.
Veamos ahora que H ∗ determina un homomorfismo h∗ : G1 −→ G2 . En
(q)

efecto,

H ∗ (F1 (X, Y )) = H ∗ (F1 (S, T )q ) = H(F1 (S, T )) = F2 (H(S), H(T ))


(q)

= F2 (H ∗ (S q ), H ∗ (T q )) = F2 (H ∗ (X), H ∗ (Y )).
Por lo tanto, si (H ∗ ) (0) = 0, el apartado anterior nos da que podemos
expresar H ∗ (T ) = H ∗∗ (T p ), pero entonces H(T ) = H ∗∗ (T p ) y a no serı́a la
a+1

altura de h, contradicción.
Con esto podemos probar que las alturas se comportan bien con la compo-
sición de homomorfismos:
h h
Teorema 5.23 Sean G1 −→ 1
G2 −→ 2
G3 dos homomorfismos formales entre
grupos formales sobre A. Entonces alt(h1 ◦ h2 ) = alt h1 + alt h2 .
Demostración: Sean H1 (T ) = H1∗ (T p ), H2 (T ) = H2∗ (T p ), donde a1 y
a1 a2

a2 son las alturas correspondientes. Entonces

H2 (H1 (T )) = H2∗ (H̃1∗ (T p


a1 +a2
)),
donde H̃1∗ resulta de elevar a pa2 los coeficientes de H1∗ . Por el teorema anterior
los coeficientes de grado 1 de H1∗ y H2∗ son no nulos, luego lo mismo sucede con
el de H̃1∗ y el de la composición H2∗ (H̃1∗ (T )) (notemos que las series no tienen
término independiente por la definición de homomorfismo formal). El apartado
a) del teorema anterior implica entonces que alt(h1 ◦ h2 ) = a1 + a2 .
Ahora probamos que la noción de altura se corresponde con el grado de
inseparabilidad de una isogenia:
5.4. Grupos formales en caracterı́stica prima 135

Teorema 5.24 Sea φ : E1 −→ E2 una isogenia entre dos curvas elı́pticas defi-
nidas por ecuaciones de Weierstrass sobre un cuerpo de caracterı́stica prima p
y sea h : G1 −→ G2 el homomorfismo inducido entre los grupos formales de las
curvas. Entonces el grado de inseparabilidad de φ es palth .

Demostración: Del teorema 1.22 se sigue que toda isogenia se descompone


como composición de una aplicación de Frobenius y una isogenia separable.
Como el grado de inseparabilidad es multiplicativo y la altura es aditiva, basta
demostrar el teorema cuando φ está en uno de estos dos casos.
Si φ es la aplicación de Frobenius de grado pr , entonces su grado de inse-
parabilidad es pr . Por otra parte,
r
el homomorfismo h es el determinado por la
r
serie de Taylor de φ ◦ t2 = tp1 , que es T p , luego alt h = r.
Si φ es separable, sea ω = h dt una diferencial invariante de E2 y sea ω(T )
la diferencial correspondiente del grupo formal de E2 . El teorema 5.10 nos da
que una diferencial invariante del grupo formal de E1 es

h̄(ω(T )) = H  (0) ω.

Por otra parte, de la definición de h̄(ω(T )) se sigue fácilmente que es la


diferencial formal asociada a φ̄(ω), que es una forma no nula por el teorema
1.19. Ası́ pues, H  (0) = 0, luego alt h = 0.
En particular, la altura del grupo formal de una curva elı́ptica sobre un
cuerpo de caracterı́stica p (es decir, la altura de la multiplicación por p) sólo
puede ser 1 o 2, ya que el grado de la multiplicación por p es p2 , luego su grado
de inseparabilidad ha de ser p o p2 . Según el teorema 3.15 esta altura será 1 si
la curva es ordinaria y 2 si es supersingular.
Capı́tulo VI

Curvas elı́pticas sobre


cuerpos locales

Si tenemos una curva elı́ptica E definida mediante una ecuación de Weiers-


trass con coeficientes enteros, una forma de estudiarla es considerar las curvas
(más simples) definidas por la misma ecuación sobre el cuerpo Z/pZ, para cada
primo p. La curva obtenida de este modo se llama reducción módulo p de la
curva E. Lo primero que hemos de tener presente es que no tiene por qué ser
una curva elı́ptica, pero ello dependerá únicamente de si p divide o no al discri-
minante de la ecuación. En particular, los primos con “mala reducción” serán
siempre un número finito.
Este proceso de reducción presenta otros inconvenientes que hemos de consi-
derar. Por ejemplo, una misma curva elı́ptica puede admitir distintas ecuaciones
de Weierstrass con coeficientes enteros, cada una con un discriminante diferente,
por lo que la buena o mala reducción en un primo puede depender de la ecuación
que elijamos.
Para tratar estas cuestiones conviene considerar primero las curvas definidas
sobre los cuerpos p-ádicos Qp como paso intermedio de la reducción, es decir, una
ecuación con coeficientes enteros puede verse también como una ecuación con
coeficientes en el anillo de enteros p-ádicos Zp , la cual a su vez puede reducirse
a una ecuación en el cuerpo Zp /(p) ∼ = Z/pZ.
Más en general, ahora nos proponemos estudiar las curvas elı́pticas definidas
sobre un cuerpo métrico discreto completo. En todo el capı́tulo, salvo que se
indique lo contrario, K denotará un cuerpo métrico completo1 respecto de una
valoración v, llamaremos O a su anillo de enteros, U a su grupo de unidades,
P a su ideal primo, k = O/P a su cuerpo de restos y π denotará un primo de
O, de modo que P = (π). Supondremos además que K y k son perfectos. En
todos los casos de interés el cuerpo K tendrá caracterı́stica 0 y k será finito,
luego estas hipótesis no son restrictivas.

1 En realidad la completitud no es necesaria en la primera sección.

137
138 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

6.1 Ecuaciones minimales


Sea E/K una curva elı́ptica y sean x, y ∈ K(E) dos generadores que satis-
fagan una ecuación de Weierstrass

y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , ai ∈ K.

Si u ∈ K, el teorema 2.6 nos da que los generadores (u−2 x, u−3 y) satisfacen


una ecuación similar con coeficientes ui ai . Ası́, si tomamos v(u) suficientemente
grande podemos obtener una ecuación de Weierstrass para E con coeficientes
en O. En consecuencia, el discriminante ∆ también será entero.

Definición 6.1 Una ecuación de Weierstrass es entera si sus coeficientes están


en O. Un cambio de variables de la forma

X = u2 X  + r, Y = u3 Y  + su2 X  + t, u = 0

es semientero si u, r, s, t ∈ O. Diremos que es entero si además u ∈ U (lo que


equivale a que el cambio inverso sea también semientero).

Acabamos de ver que toda curva elı́ptica admite una ecuación de Weiers-
trass entera. Es obvio que un cambio de variables semientero transforma una
ecuación de Weierstrass entera en otra ecuación de Weierstrass entera. Respecto
al recı́proco, tenemos el teorema siguiente:

Teorema 6.2 Consideremos dos curvas elı́pticas K-isomorfas E/K y E  /K


definidas por ecuaciones de Weierstrass enteras con discriminantes ∆ y ∆ tales
que v(∆) ≥ v(∆ ). Entonces existe un cambio de variables, necesariamente
semientero, que transforma la ecuación de E en la de E  . El cambio será entero
si y sólo si v(∆) = v(∆ ).

Demostración: Por el teorema 2.3, existen u, r, s, t ∈ K, con u = 0 que


determinan un cambio de variables que transforma E en E  . El teorema 2.6 nos
da que sus discriminantes satisfacen la relación u12 ∆ = ∆, luego tenemos que
v(∆) = v(∆ ) + 12v(u), de donde v(u) ≥ 0 y v(u) = 0 si y sólo si v(∆) = v(∆ ).
Falta probar que r, s, t ∈ O.
De la relación u4 b6 = b6 + 2rb4 + r2 b2 + 4r3 deducimos que

v(r) + v(2b4 + rb2 + 4r2 ) ≥ 0.

Si fuera v(r) < 0 tendrı́amos que tener v(2b4 + rb2 + 4r2 ) ≥ 0, luego

v(rb2 + 4r2 ) = v(r) + v(b2 + 4r) ≥ 0,

luego v(b2 + 4r) ≥ 0 y, en cualquier caso, tendrı́a que ser v(4r) ≥ 0. Razonando
igualmente con la transformación de b8 concluimos que v(3r) ≥ 0. Ahora bien,
como ha de ser v(2) = 0 o v(3) = 0, podemos afirmar que v(r) ≥ 0. La
transformación de a2 nos da que v(s) ≥ 0 y la de a6 nos permite concluir que
v(t) ≥ 0.
6.1. Ecuaciones minimales 139

Dada una ecuación de Weierstrass entera, tiene sentido considerar su re-


ducción módulo p, que determinará una curva elı́ptica sobre k si y sólo si
v(∆) = 0. Si no es ası́, tenemos dos posibilidades: que la reducción tenga
una cúspide o que tenga un nodo, el cual a su vez puede ser racional o irra-
cional. Demostraremos que si elegimos la ecuación con v(∆) mı́nimo no sólo
tenemos más posibilidades de que el resultado sea una curva elı́ptica, sino que,
cuando no lo es, el tipo de la curva resultante no depende de la elección de
la ecuación. Esto lo veremos más adelante. Ahora discutiremos la noción de
ecuación minimal:

Definición 6.3 Si E/K es una curva elı́ptica, una ecuación de Weierstrass


minimal para E es una ecuación de Weierstrass entera para E tal que v(∆) es
el menor posible. Representaremos por δP a dicho valor mı́nimo.

Del teorema anterior se desprende que toda ecuación de Weierstrass entera


de una curva elı́ptica se puede transformar en una ecuación minimal mediante
un cambio de variables semientero, ası́ como que dos ecuaciones minimales de
una misma curva elı́ptica están relacionadas por un cambio de variables entero.
En general, para determinar si una ecuación entera es o no minimal hemos de
considerar su terna de valores covariantes (v(c4 ), v(c6 ), v(∆)). (Las cantidades
c4 , c6 y, a veces, ∆ se llaman covariantes de la ecuación.) Notemos que v(c4 ) y
v(c6 ) son números naturales o bien +∞.
El teorema siguiente muestra que es muy fácil decidir si una ecuación dada
es o no minimal, salvo si el cuerpo de restos cumple car k ≤ 3. En tal caso
necesitaremos un análisis más detallado, pero el teorema siguiente será de todos
modos el punto de partida.

Teorema 6.4 Sea E/K una curva elı́ptica definida por una ecuación entera
con valores covariantes (a, b, c) = (v(c4 ), v(c6 ), v(∆)).

a) La ecuación es minimal si y sólo si E no admite otra ecuación entera con


valores covariantes (a − 4, b − 6, c − 12). En particular esto sucede si a < 4
o bien b < 6 o bien c < 12.

b) Si car K > 3, entonces la ecuación es minimal si y sólo si no existe una


ecuación de Weierstrass entera con covariantes c4 = c4 π −4 , c6 = c6 π −6 .

c) Si car k > 3, entonces la ecuación es minimal si y sólo si se cumple una


de las tres desigualdades v(c4 ) < 4, v(c6 ) < 6, v(∆) < 12.

Demostración: a) Si existe tal ecuación, entonces la ecuación dada no es


minimal, pues la nueva cumple v(∆ ) = v(∆) − 12 < v(∆). Recı́procamente, si
la ecuación dada no es minimal, se puede transformar en una minimal mediante
un cambio de variables semientero, pero entonces los covariantes de la ecuación
minimal cumplen

v(c4 ) = v(c4 ) − 4v(u), v(c6 ) = v(c6 ) − 6v(u), v(∆ ) = v(∆) − 6v(u).


140 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Como la ecuación de partida no es minimal, la tercera igualdad implica que


v(u) > 0, luego v(c4 ) ≥ 4, v(c6 ) ≥ 6, v(∆) ≥ 12. Por consiguiente, el cambio
Y = π 2 Y  , X = π 3 X  transforma la ecuación de partida en otra con valores
covariantes (a − 4, b − 6, c − 12).
b) Supongamos que existe una ecuación con los covariantes indicados. En-
tonces su discriminante es ∆ = ∆π −12 y su invariante es j  = j, luego dicha
ecuación define una curva elı́ptica E  isomorfa a E. Por otra parte, E y E 
son k-isomorfas a curvas definidas por las ecuaciones de tipo b dadas por (2.5).
Estas ecuaciones no necesariamente enteras, pero que satisfacen las hipótesis del
teorema 2.47, luego las curvas E y E  son K-isomorfas. Vemos, pues, que E es
K-isomorfa a una curva elı́ptica definida por una ecuación de Weierstrass con
discriminante v(∆ ) < v(∆), luego la ecuación de E no es minimal.
Recı́procamente, si la ecuación de E no es minimal, por a) sabemos que ha
de ser v(c4 ) ≥ 4 y v(c6 ) ≥ 6, y entonces el cambio X = π 2 X  , Y = π 3 Y  nos da
una ecuación con los covariantes requeridos.
c) El apartado a) muestra que la condición es suficiente. Supongamos que
v(c4 ) ≥ 4, v(c6 ) ≥ 6, v(∆) ≥ 12. Entonces c4 = c4 π −4 y c6 = c6 π −6 son enteros.
La hipótesis car k = 2, 3 equivale a que car K = 2, 3 (lo que nos permite
usar el apartado anterior) y además v(2) = v(3) = 0. Ahora bien, si car K > 3
cualquier par de valores c4 , c6 son los covariantes de una ecuación de Weierstrass
—la dada por (2.5)—, que en nuestro caso es entera y con discriminante no nulo,
luego por b) concluimos que la ecuación dada no es minimal.
Observemos que la relación ∆ = (c34 − c26 )/123 hace que si car k > 3 las
condiciones v(∆) ≥ 12, v(c4 ) ≥ 4 impliquen v(c6 ) ≥ 6, luego la minimalidad
equivale de hecho a que v(∆) < 12 o v(c4 ) < 4.

Ejemplo La ecuación Y 2 + XY + Y = X 3 + X 2 + 22X − 9 sobre el cuerpo Qp


de los números p-ádicos tiene discriminante ∆ = −215 · 52 y c4 = −5 · 211. Por
lo tanto, el teorema anterior garantiza que es minimal para todo primo p.

Ejemplo Si p > 3 es un primo, la ecuación Y 2 = X 3 − 3(1 + pN )X − 2(1 + pN )


sobre el cuerpo Qp cumple ∆ = 26 · 33 · (1 + pN ) · pN , luego vp (c4 ) = 0 y
vp (∆) = N . La primera condición implica que es minimal, y de este modo
vemos que existen curvas elı́pticas con δp arbitrariamente grande.
Nos falta encontrar un criterio para decidir si una ecuación dada es minimal
cuando car k ≤ 3. Abordaremos el problema a través del apartado b) del teo-
rema anterior (limitándonos al caso en que car K = 0). La cuestión es, pues,
determinar bajo qué condiciones existe una curva elı́ptica con unos covariantes
dados c4 , c6 ∈ O.
Si car k > 3 la condición necesaria y suficiente es que c34 − c26 = 0. La
condición es necesaria porque el discriminante de la ecuación correspondiente
ha de ser ∆ = (c34 − c26 )/1728, y es suficiente porque basta tomar la curva dada
por la ecuación (2.5). Ahora bien, el caso que necesitamos resolver es justo el
opuesto: car k ≤ 3.
6.1. Ecuaciones minimales 141

Teorema 6.5 (Kraus) Supongamos que car K = 0 y que car k = p ≤ 3. Sean


c4 , c6 , ∆ ∈ O tales que c34 − c26 = 1728∆ = 0. Consideramos los polinomios

Ψ2 (X) = X 3 − 3c4 X − 2c6 , Ψ3 (X) = X 4 − 6c4 X 2 − 8c6 X − 3c24 .

Entonces, c4 y c6 son los covariantes de una ecuación de Weierstrass entera


si y sólo si se cumple una de las dos condiciones siguientes:
a) p = 3 y existe θ ∈ O tal que Ψ2 (θ) ≡ 0 (mód 27).
b) p = 2 y existen θ, τ ∈ O tales que

Ψ3 (θ2 ) ≡ 0 (mód 256), Ψ2 (θ2 ) ≡ −16τ 2 (mód 64).

Demostración: a) Supongamos que existe una ecuación con covariantes


c4 y c6 . Entonces basta tomar θ = b2 , pues entonces

Ψ2 (θ) = 27 · 16b6 ≡ 0 (mód 27).

Supongamos ahora que existe θ ∈ O tal que Ψ2 (θ) ≡ 0 (mód 27). La ecuación
(2.5) tiene covariantes c4 y c6 , pero no es necesariamente entera. Si le aplicamos
el cambio X = X  + θ/12 se convierte en

θ θ2 − c4 Ψ2 (θ)
Y 2 = X3 + X2 + X+ .
4 48 1728
Los covariantes de esta ecuación son los mismos. Vamos a probar que los
coeficientes son enteros, para lo cual sólo hemos de ver que θ2 ≡ c4 (mód 3).
Tenemos que θ3 ≡ 3c4 θ + 2c6 (mód 27) (por la hipótesis sobre Ψ2 (θ)) y por
la relación entre c4 , c6 y ∆ se cumple también que c34 ≡ c26 (mód 27). De aquı́
se sigue que
(c4 θ + c6 )3 ≡ 3c6 (c4 θ + c6 )2 (mód 27).
(Basta desarrollar el cubo y sustituir las dos congruencias precedentes.) Por
consiguiente c4 θ + c6 ≡ 0 (mód 3). Por último, una comprobación rutinaria nos
da la identidad

(X 2 − c4 )3 = Ψ2 (X)(X 3 + 2c6 ) + 3(c4 X + c6 )2 + 1728∆,

que al ser evaluada en X = θ nos da la congruencia buscada: θ2 ≡ c4 (mód 3).


b) Si existe la ecuación, aplicando si es necesario el cambio de variables
entero X = X  − a2 /3 podemos suponer que a2 = 0. Tomamos θ = a1 , τ = a3 .
Entonces

Ψ3 (θ2 ) = 26 · 33 (b6 θ2 − b24 ) = 28 · 33 · b8 ≡ 0 (mód 256).

(Para comprobar la primera igualdad sustituimos c4 y c6 por sus valores en


términos de b2 , b4 , b6 y hacemos b2 = θ2 , para la segunda sustituimos b6 y b4
por sus valores en términos de los ai .) Por otra parte,

Ψ2 (θ2 ) = 24 · 33 · b6 ≡ −16τ 2 (mód 64).


142 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Supongamos ahora que ciertos enteros θ y τ cumplen las congruencias. Ele-


gimos a1 = θ, a2 = 0 y a3 = τ , con lo que basta probar que existen enteros a4 ,
a6 tales que

c4 = θ4 − 24(τ θ + 2a4 ), c6 = −θ6 + 36θ2 (τ θ + 2a4 ) − 216(τ 2 + 4a6 ). (6.1)

La primera ecuación nos da que

θ4 − c4 − 24τ θ
a4 = .
48
Hemos de probar que a4 es entero, para lo cual basta ver que

θ4 − c4 − 8τ θ ≡ 0 (mód 16).

Usamos la identidad Ψ3 (X) = 4XΨ2 (X) − 3(X 2 − c4 )2 , de la que obtenemos

4θ2 Ψ2 (θ2 ) − 3(θ4 − c4 )2 ≡ 0 (mód 256). (6.2)

Por otro lado, las hipótesis implican que

4Ψ2 (θ2 ) ≡ −64τ 2 (mód 256), (6.3)

luego
(θ4 − c4 )2 − (8τ θ)2 ≡ 4(θ4 − c4 )2 (mód 256).
Ahora bien, (6.2) y (6.3) implican que 64 | (θ4 − c4 )2 , luego el miembro
derecho de la última congruencia es 0. En definitiva:

(θ4 − c4 + 8τ θ)(θ4 − c4 − 8τ θ) ≡ 0 (mód 256).

Uno de los dos factores ha de ser 0 módulo 16, pero como 8 ≡ −8 (mód 16),
en realidad han de serlo los dos, lo que prueba la integridad de a4 .
La segunda ecuación de (6.1) determina el valor de a6 . Falta probar que
también éste es entero. Multiplicándola por 2 queda

1728a6 = −2c6 − 2θ6 + 72τ θ3 + 3θ2 (θ4 − c4 − 24τ θ) − 432τ 2


≡ Ψ2 (θ2 ) + 16τ 2 ≡ 0 (mód 64).

De aquı́ se sigue que v(a6 ) ≥ 0.


Las condiciones del teorema de Kraus se simplifican notablemente cuando
v(p) = 1 (por ejemplo, si K = Q2 o K = Q3 ). En efecto:

Teorema 6.6 Supongamos que car K = 0, car k = p ≤ 3 y que v(p) = 1.


Sean c4 , c6 , ∆ ∈ O tales que c34 − c26 = 1728∆ = 0. Entonces, c4 y c6 son los
covariantes de una ecuación de Weierstrass entera si y sólo si se cumple una
de las dos condiciones siguientes:
a) p = 3 y v(c6 ) = 2.
6.1. Ecuaciones minimales 143

b) p = 2 y se cumple una de las dos condiciones siguientes:


• v(c4 ) = 0 y existe x ∈ O tal que c6 ≡ −x2 (mód 4),
• v(c4 ) ≥ 4 y existe x ∈ O tal que c6 ≡ 8x2 (mód 32).

Demostración: Consideremos p = 3. La relación c34 − c26 = 1728∆ = 0


implica v(c4 ) = v(c6 ) = 0 o bien v(c6 ) ≥ 2 (pues si 3 divide a uno de los dos
covariantes, entonces los divide a ambos y 33 | c26 , luego 32 | c6 ).
Si v(c4 ) = 0 entonces θ = −c6 /c4 cumple

Ψ2 (θ2 ) = 1728∆c6 /c34 ≡ 0 (mód 27),

luego por el teorema anterior existe una ecuación entera con los invariantes
dados. Si v(c6 ) ≥ 3 basta tomar θ = 0. Supongamos ahora que v(c6 ) = 2 (con lo
que v(c4 ) ≥ 1) y veamos que no hay enteros θ y z tales que θ3 −3c4 θ −2c6 = 27z.
En efecto, tendrı́a que ser v(θ3 ) ≥ 2, luego v(θ) ≥ 1, pero entonces v(c6 ) ≥ 3,
contradicción.
Consideremos ahora p = 2. Como antes, ha de ser v(c4 ) = 0 o bien v(c4 ) ≥ 2.
Si v(c4 ) = 0 y existe una ecuación entera con los invariantes dados, entonces

−c6 ≡ b32 ≡ a61 (mód 4).

Recı́procamente, si existe x ∈ O tal que x2 ≡ −c6 (mód 4), en particular c6


es una unidad de O, luego podemos expresar la congruencia en la forma

x2 = −c6 (1 + 4a), a ∈ O.

Similarmente, la relación entre c4 , c6 y ∆ puede expresarse en la forma

c34 = c26 (1 + 64b), b ∈ V.

Tomamos θ = c4 /x, con lo que

θ4 (1 + 4a)2 θ6 (1 + 4a)3
c4 = , c6 = − .
1 + 64b (1 + 64b)2

Al sustituir estas dos expresiones en las definiciones de Ψ2 (X) y Ψ3 (X)


obtenemos que

Ψ3 (θ2 ) ≡ 0 (mód 256), Ψ2 (θ2 ) ≡ −16a2 θ6 (mód 64),

luego basta tomar τ = aθ3 y el teorema de Kraus garantiza la existencia de la


ecuación.
Si v(c4 ) ≥ 4 y existe la ecuación, entonces la definición de c4 implica que
v(b2 ) ≥ 2 y v(b4 ) ≥ 1, luego

c6 ≡ −216b6 ≡ 8a23 (mód 32).

Recı́procamente, si c6 ≡ 8x2 (mód 32), basta tomar θ = 0 y τ = x.


144 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Falta probar que si v(c4 ) ≥ 2 y existe ecuación, entonces v(c4 ) ≥ 4. En


efecto, tiene que ser v(c3 ) ≥ 3 y de la relación

θ8 − 6c4 θ4 − 8c6 θ2 − 3c24 = 256z

se sigue que v(θ) ≥ 1 y de aquı́ que v(c24 ) ≥ 7, luego v(c4 ) ≥ 4.


Notemos que Z2 /(4) = ∼ Z/4Z y Z2 /(32) = ∼ Z/32Z, luego las condiciones del
teorema anterior se reducen a resolver congruencias de enteros (racionales). Más
aún, si v2 (c4 ) = 0 entonces c6 es impar, y la congruencia de este caso equivale
a c6 ≡ −1 (mód 4). Similarmente, si v2 (c4 ) ≥ 4 la congruencia se reduce a
c6 ≡ 0, 8 (mód 32).

Ejemplo La curva E/Q3 dada por la ecuación

Y 2 = X 3 − 324X − 243

cumple c4 = 24 · 35 , c6 = 25 · 38 , ∆ = 24 · 312 · 11 · 23. Vemos que v3 (c4 ) = 5 ≥ 4,


v3 (c6 ) = 8 ≥ 6, v3 (∆) = 12 ≥ 12, luego no cumple la condición 6.4 c), pero a
pesar de ello es minimal por el apartado b) de dicho teorema. En efecto, hemos
de ver que no existe ninguna ecuación de Weierstrass entera con covariantes
c4 = 24 · 3, c6 = 25 · 32 , lo cual es cierto por el teorema anterior, ya que
v3 (c6 ) = 2.

Ejercicio: Usar el teorema anterior para construir una ecuación de Weierstrass entera
sobre Q2 tal que v2 (c4 ) = 6, v2 (c6 ) = 10, v2 (∆) = 12. Probar que es minimal.

6.2 Reducción de curvas elı́pticas


Definición 6.7 Sea E/K una curva elı́ptica en P2 (K) definida por una ecuación
de Weierstrass entera. Llamaremos reducción de E/K módulo P a la curva (tal
vez singular) en P2 (k) definida por la ecuación resultante de tomar restos módulo
P en los coeficientes de la ecuación de E/K. La representaremos por Ẽ/k.

Aquı́ es crucial observar que la reducción Ẽ/k depende de la ecuación de


Weierstrass considerada, de modo que dos curvas elı́pticas isomorfas sobre K
pueden tener reducciones no isomorfas sobre k. Sin embargo, el teorema 6.2
garantiza que si tomamos dos ecuaciones de Weierstrass minimales para una
misma curva elı́ptica E/K, una se transforma en la otra mediante un cambio
de coordenadas entero, el cual induce un cambio de coordenadas en P2 (k) que
hace corresponder las dos reducciones.
En definitiva, para una curva elı́ptica arbitraria E/K, definimos la reducción
Ẽ/k de E/K módulo P como la reducción de cualquier curva elı́ptica K-isomorfa
a E/K definida por una ecuación de Weierstrass minimal, de modo que la re-
ducción no depende (salvo k-isomorfismo) de la elección de la ecuación minimal.
No obstante, conviene tener presente que cualquier ecuación de Weierstrass en-
tera, minimal o no, admite una reducción.
6.2. Reducción de curvas elı́pticas 145

En la práctica, cuando hablemos de la reducción de una curva elı́ptica de-


finida por una ecuación de Weierstrass entera entenderemos que se trata de la
reducción asociada a dicha ecuación, mientras que si no hablamos de ninguna
ecuación en particular entenderemos que se trata de la reducción respecto a una
ecuación minimal cualquiera de la curva dada.
Consideremos una curva E/K definida por una ecuación de Weierstrass en-
tera. Multiplicando las coordenadas homogéneas de un punto de P2 (K) por
una potencia adecuada de π podemos hacer que todas sean enteras y al menos
una de ellas unitaria. Esto se traduce en que los restos módulo P de estas
coordenadas forman una terna no nula en k 3 y, en definitiva, tenemos una apli-
cación natural P2 (K) −→ P2 (k), la cual se restringe a su vez a una aplicación
E(K) −→ Ẽ(k). A esta aplicación la llamaremos también reducción módulo P
y la representaremos por P → P̃ .
Llamaremos Ẽr (k) al conjunto de puntos regulares de Ẽ/k con coordenadas
en k. Sabemos que puede ser todo Ẽ(k) o bien Ẽ(k) menos un punto (que
en ningún caso podrá ser el neutro). El teorema 2.30 nos da que Ẽr (k) tiene
estructura de grupo aunque la curva Ẽ/k sea singular. Definimos

E0 (K) = {P ∈ E(K) | P̃ ∈ Ẽr (k)}, E1 (K) = {P ∈ E(K) | P̃ = O}.

El conjunto E0 (K) es el de los puntos con reducción regular, mientras que


E1 (K) es el núcleo de la reducción.

Teorema 6.8 Dada una curva E/K definida por una ecuación de Weierstrass
entera, la reducción módulo P determina una sucesión exacta de grupos abelia-
nos:
0 −→ E1 (K) −→ E0 (K) −→ Ẽr (k) −→ 0.

Demostración: Hemos de probar que E0 (K) es un subgrupo de E(K) y


que la reducción es un epimorfismo de grupos. Evidentemente Õ = O, luego
O ∈ E0 (K). La fórmula

−(x, y, z) = (x, −y − a1 x − a3 z, z)

prueba que −P = −P̃ , de donde concluimos que si P ∈ Er (K) entonces también


P̃ ∈ Er (K).
Consideremos ahora tres puntos P , Q, R ∈ E(K) tales que P + Q + R = O.
Esto significa que son la intersección con E de una recta r. Pongamos que la
ecuación de E/K es F (X, Y, Z) = 0.
Representamos cada uno de los tres puntos por una terna de coordenadas
homogéneas enteras y al menos una de ellas unitaria. Consideremos en primer
lugar el caso en que dos de los puntos son distintos, por ejemplo P = Q. Sea
Q − P = π r v, donde r ≥ 0 y v tiene coordenadas enteras, al menos una unitaria.
Entonces la recta r está formada por los puntos L = P + tv, con t ∈ K y se
cumple que
F (P + T v) = aT (T − π r )(T − t1 ),
146 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

donde t1 ∈ K es el parámetro que cumple R = P + t1 v. Despejándolo a partir


de la coordenada unitaria de v vemos que t1 ∈ O.
La reducción módulo P del polinomio F (P + T v) tiene por raı́ces a los
parámetros de los puntos donde la recta r̃ corta a Ẽ. En particular no puede
ser idénticamente nula (a ∈ / P) y vemos entonces que dicha intersección la
forman los puntos P̃ , Q̃, R̃.
Llegamos a la misma conclusión si los tres puntos de partida son iguales.
En tal caso tenemos que 3P = O. Llamamos r a la tangente a E por P , cuyos
puntos serán de la forma L = P + tv, para cierto vector v que podemos tomar
de coordenadas enteras y al menos una unitaria. Ahora F (P + T v) = aT 3 y
como antes razonamos que P̃ es el único punto de intersección de r̃ con Ẽ.
En cualquier caso, si suponemos que P , Q ∈ Er (K), podemos concluir que
P̃ + Q̃ + R̃ = O, luego R̃ ∈ Ẽ(k), R ∈ Er (K) y

P
+ Q = −R = −R̃ = P̃ + Q̃.
Con esto queda probado que Er (K) es un subgrupo y que la reducción es
un homomorfismo. Veamos que es suprayectivo.
Sea f (X, Y ) = Y 2 + a1 XY + a3 Y − X 3 − a2 X 2 − a4 X − a6 = 0 una ecuación
de Weierstrass minimal para E/K. Tomemos un punto en Ẽr (k), que podemos
suponer distinto de Õ. Digamos que sus coordenadas de Weierstrass son (α, β).
Entonces f˜(α, β) = 0 y la regularidad se traduce —por ejemplo— en que
∂ f˜
(α, β) = 0.
∂X
(La alternativa es que la derivada respecto de Y sea no nula.) Fijemos y0 ∈ O
tal que ỹ0 = β y consideremos el polinomio f (X, y0 ) ∈ O[X]. Su imagen en k[X]
tiene una raı́z simple en α, luego el lema de Hensel implica que existe x0 ∈ O
tal que f (x0 , y0 ) = 0 y x̃0 = α. El punto P = (x0 , y0 ) está en E/K y P̃ ∈ Ẽr (k)
es el punto de partida, luego la reducción es suprayectiva.
Las curvas elı́pticas se pueden clasificar por su tipo de reducción módulo P:
Definición 6.9 Consideremos una curva elı́ptica E/K dada por una ecuación
de Weierstrass entera.
a) E tiene buena reducción sobre K si Ẽ/k es regular. En caso contrario se
dice que tiene mala reducción sobre K.
b) E tiene reducción multiplicativa sobre K si Ẽ/k tiene un nodo. En tal
caso la reducción puede ser racional o irracional según lo sea dicho nodo.
c) E tiene reducción aditiva si Ẽ/k tiene una cúspide.
Los términos “reducción multiplicativa” y “reducción aditiva” hacen refe-
rencia al teorema 2.30. Cuando hablemos del tipo de reducción de una curva
elı́ptica en general, se entenderá que nos referimos al tipo de reducción de cual-
quiera de sus ecuaciones minimales.
Es fácil saber el tipo de reducción de una curva elı́ptica. El teorema siguiente
es una consecuencia inmediata de 2.28 y 2.30.
6.2. Reducción de curvas elı́pticas 147

Teorema 6.10 Sea E/K una curva elı́ptica determinada por una ecuación de
Weierstrass entera. Entonces:
a) E tiene buena reducción si y sólo si v(∆) = 0.
b) E tiene reducción multiplicativa si y sólo si v(∆) > 0 y v(c4 ) = 0.
c) E tiene reducción aditiva si y sólo si v(∆) > 0 y v(c4 ) > 0.

Ejemplo Si p ≥ 5 es un número primo, las curvas siguientes tienen las pro-


piedades indicadas:

Ecuación minimal ∆ c4 Reducción en Qp


2 3
Y = X + pX + 1 2
−2 · 3
4 3
2 ·p
8 2
buena
2 3
Y =X +X +p 2
−2 · 3 · p
4 3 2
2 8
multiplicativa
Y 2 = X3 + p −24 · 33 · p2 0 aditiva

Observemos que si K  /K es una extensión no ramificada entonces la valo-


ración de K  extiende a la de K y la reducción E0 (K  ) −→ Ẽr (k  ) extiende a la
reducción E0 (K) −→ Ẽr (k). Estas reducciones determinan una única aplicación
E0 (Knr ) −→ Ẽr , donde Knr es la máxima extensión no ramificada de K y no
indicamos el cuerpo de restos en Ẽr porque éste es k, la clausura algebraica de
k, luego Ẽr (k) es en realidad toda la curva Ẽ (salvo el punto singular si lo hay).
Tenemos que Knr es un cuerpo métrico discreto no necesariamente completo,
pero las propiedades de las reducciones sobre los grupos E0 (K  ) implican las
propiedades análogas sobre E0 (Knr ). Por ejemplo, la reducción es suprayec-
tiva. Ası́, al extender K hasta Knr obtenemos todos los puntos de Ẽr . Esto es
necesario para tener la unicidad en el teorema siguiente:

Teorema 6.11 Sean E/K y E  /K dos curvas elı́pticas definidas mediante ecua-
ciones de Weierstrass enteras con buena reducción módulo P y φ : E −→ E 
una isogenia definida sobre K. Entonces existe una única isogenia φ̃ : Ẽ −→ Ẽ 
).
definida sobre k tal que para todo punto P ∈ E(Knr ) se cumple φ̃(P̃ ) = φ(P

Demostración: La unicidad es evidente. Sólo hemos de probar la existen-


cia. Sea π ∈ O tal que vP (π) = 1. Digamos que φ viene definida por

φ(X, Y, Z) = [F1 (X, Y, Z), F2 (X, Y, Z), F3 (X, Y, Z)],

para ciertas formas Fi ∈ O[X, Y, Z] del mismo grado. Llamemos F̃i ∈ k[X, Y, Z]
a la reducción de Fi . Si las tres reducciones son idénticamente nulas sobre Ẽ,
entonces F̃i = H̃i F̃ , donde F (X, Y, Z) = 0 es la ecuación de Weierstrass que
define a E/K. Por lo tanto Fi = Hi F +πGi , para ciertas formas Gi ∈ O[X, Y, Z].
En tal caso φ(X, Y, Z) = [G1 (X, Y, Z), G2 (X, Y, Z), G3 (X, Y, Z)] es una defi-
nición alternativa de φ. Ahora bien, si llamamos N al menor natural tal que π N
148 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

divide a todos los Fi (P ) cuando P recorre E(Knr ) (y consideramos coordenadas


homogéneas enteras para P ), vemos que el N correspondiente a las formas Gi es
una unidad menor que el correspondiente a las formas Fi , luego tras un número
finito de pasos llegaremos a unas formas que definen a φ con N = 0. Conser-
vando la notación original Fi , lo que hemos probado es que podemos suponer
que una de las formas F̃i no es idénticamente nula en Ẽ. Esto hace que

φ̃(X, Y, Z) = [F̃1 (X, Y, Z), F̃2 (X, Y, Z), F̃3 (X, Y, Z)]

define una aplicación racional φ̃ : Ẽ −→ Ẽ  . Como las curvas son elı́pticas, será
—de hecho— una aplicación regular. En principio no podemos asegurar que sea
una isogenia, pues para ello hace falta que φ̃(O) = O. El diagrama

E(Knr )
φ
 E  (Knr )

 
Ẽ  Ẽ 
φ̃

será conmutativo sobre todos los puntos P ∈ E(Knr ) tales que F̃i (P̃ ) = 0 para
algún i. Esto lo cumplen todos los puntos P̃ salvo a lo sumo un número finito
de ellos. Fijamos uno P̃ y observamos que cuando Q̃ recorre los infinitos puntos
que no anulan a alguna de las formas F̃i , la suma P̃ + Q̃ toma infinitos valores
distintos, luego para alguno de ellos se cumplirá que P̃ + Q̃ tampoco anula a
alguna de las formas. Esto implica que el diagrama conmuta en P , en Q y en
P + Q. Por consiguiente:


φ̃(P̃ + Q̃) = φ(P ) + φ(Q)
+ Q) = φ(P = φ̃(P̃ ) + φ̃(Q̃).

Ahora bien, si φ̃(O) = U , tenemos que φ∗ = φ̃ − U es una aplicación regular


que cumple φ∗ (O) = O, luego es una isogenia, luego φ∗ (P̃ + Q̃) = φ∗ (P̃ )+φ∗ (Q̃).
Explı́citamente:

φ̃(P̃ + Q̃) − U = φ̃(P̃ ) − U + φ̃(Q̃) − U,

pero esto implica que U = 0, luego φ̃ es una isogenia. Sólo falta demostrar que
el diagrama conmuta sobre todos los puntos de E(Knr ). Fijado P ∈ E(Knr ),
como antes podemos encontrar un punto Q tal que ni Q̃ ni P̃ + Q̃ anulen a las
tres formas F̃i . Esto significa que el diagrama conmuta sobre P + Q y sobre Q.
Por consiguiente:


φ̃(P̃ ) + φ̃(Q̃) = φ̃(P̃ + Q̃) = φ(P ) + φ(Q)
+ Q) = φ(P = φ(P
) + φ̃(Q̃),

), y el diagrama conmuta en P .
luego φ̃(P̃ ) = φ(P
De este teorema no se sigue que si las curvas E y E  son isógenas entonces
sus reducciones también lo son, pues para ello faltarı́a justificar que la reducción
6.2. Reducción de curvas elı́pticas 149

de una isogenia no nula es no nula. Esto es cierto, pero lo demostraremos en la


sección siguiente.
Volvamos ahora al ejemplo de la página 147. Consideramos las curvas en
sentido abstracto, es decir, sin prefijar ninguna ecuación de Weierstrass. Ob-
servemos que la tercera curva Y 2 = X 3 + p tiene reducción aditiva en Qp , pero

tiene buena reducción sobre K = Qp ( 6 p). En efecto, sobre K la ecuación ya
no es minimal, sino que el cambio
√ √
X= 3
p X , Y = pY 

la transforma en Y 2 = X 3 + 1, con discriminante ∆ = −24 · 33 , y ası́ v(∆) = 0.


Esto no es casual, sino que ilustra el teorema siguiente, para el que conviene
introducir una clasificación alternativa de los tipos de reducción:

Definición 6.12 Diremos que una curva elı́ptica E/K tiene reducción estable
módulo P si tiene buena reducción módulo P. Diremos que tiene reducción
semiestable si tiene buena reducción o bien reducción multiplicativa. Diremos
que la reducción es inestable si es aditiva.

El teorema siguiente explica por qué conviene agrupar bajo un mismo con-
cepto la buena reducción y la reducción multiplicativa:

Teorema 6.13 Sea E/K una curva elı́ptica.

a) Si E tiene reducción semiestable sobre K, entonces tiene el mismo tipo de


reducción (buena o multiplicativa) sobre cualquier extensión finita de K.

b) Si E tiene reducción inestable sobre K, entonces existe una extensión finita


de K sobre la que E tiene reducción semiestable.

Demostración: a) Sea K  una extensión finita de K. Fijemos una ecuación


de Weierstrass minimal para E sobre K y consideremos un cambio de variables
semientero

X = u2 X  + r, Y = u3 Y  + su2 X  + t, u, r, s, t ∈ O

que la transforme en una ecuación minimal sobre K  . Entonces

0 ≤ v  (∆ ) = v  (u−12 ∆), 0 ≤ v  (c4 ) = v  (u−4 c4 ).

Por consiguiente,

0 ≤ v  (u) ≤ mı́n{v  (∆)/12, v  (c4 )/4}.

Si E tiene reducción semiestable, entonces tenemos que v(∆) = 0 o bien


v(c4 ) = 0, luego también v  (∆) = 0 o bien v  (c4 ) = 0 y en ambos casos v  (u) = 0.
Ası́ pues, v  (∆ ) = v  (∆) y v  (c4 ) = v  (c4 ). Esto nos permite concluir que la
reducción de E/K  es la misma que la de E/K.
150 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

b) Supongamos primeramente que car k = 2. Entonces podemos aplicar el


teorema 2.16, que nos permite sustituir a K por una extensión finita sobre la
que E admita una ecuación de Weierstrass en forma normal de Legendre:

Y 2 = X(X − 1)(X − λ), λ = 0, 1.

Es fácil ver que ∆ = 16λ2 (λ − 1)2 , c4 = 16(λ2 − λ + 1). Distinguimos tres


casos:

Caso 1: λ ∈ O, λ ≡ 0, 1 (mód P). Entonces v(∆) = 0, por lo que la ecuación


es minimal y E tiene buena reducción.

Caso 2: λ ∈ O, λ ≡ 0, 1 (mód P). Entonces v(∆) > 0 y v(c4 ) = 0, luego la


ecuación es minimal y su reducción es multiplicativa.

Caso 3: λ ∈/ O. Sea r = −v(λ), de modo que v(π r λ) = 0. Adjuntando a K


si es necesario el elemento π 1/2 podemos hacer el cambio X = π −r X  ,
Y = π −3r/2 Y  , lo que nos da la ecuación

Y 2 = X(X − π r )(X − π r λ).

Esta ecuación tiene coeficientes enteros y cumple v(∆) > 0, v(c4 ) = 0,


luego es minimal y su reducción es multiplicativa.

Si car k = 2 razonamos igualmente con la forma normal de Deuring. En una


extensión de K la curva E admite una ecuación de la forma

Y 2 + αXY + Y = X 3 , α3 = 27.

Se cumple que ∆ = α3 − 27, c4 = α(α3 − 24). De nuevo distinguimos tres


casos:

Caso 1: α ∈ O, α ≡ 27 (mód P). Entonces v(∆) = 0, luego la ecuación es


minimal y tiene buena reducción.

Caso 2: α ∈ O, α ≡ 27 (mód P). Entonces v(∆) > 0, c4 ≡ 81 ≡ 0 (mód P),


luego v(c4 ) = 0 y ası́ la ecuación es minimal y la reducción multiplicativa.

/ O. Tomamos r = −v(α) y hacemos el cambio X = π −2r X  ,


Caso 3: α ∈
−3r 
Y =π Y , con lo que la nueva ecuación es

Y 2 + π r αXY + π 3r Y = X 3 ,

que cumple ∆ = π 9r ((π r α)3 − 27π 3r ) ≡ 0 (mód P) y

c4 = π r α((π r α)3 − 24π 3r ) ≡ (π r α)4 ≡ 0 (mód P).

Ası́ pues, v(∆) > 0, v(c4 ) = 0, la ecuación es minimal y su reducción es


multiplicativa.
6.2. Reducción de curvas elı́pticas 151

Todavı́a podemos decir más sobre el tipo de reducción de una curva en una
extensión:

Teorema 6.14 Una curva elı́ptica E/K tiene reducción estable en una ex-
tensión finita de K si y sólo si j(E) ∈ O.

Demostración: Supongamos que E tiene reducción estable en una ex-


tensión K  de K. Entonces v  (∆ ) = 0 y v  (c4 ) ≥ 0, luego v  (j(E)) ≥ 0 y esto
implica que v(j(E)) ≥ 0.
Recı́procamente, supongamos que j(E) ∈ O. Consideremos primeramente el
caso en que car k = 2. Entonces podemos extender K de modo que E admita
una ecuación en forma normal de Legendre Eλ . Entonces

(λ2 − λ + 1)3
j(E) = 28 .
λ2 (λ − 1)2

Ası́ pues, λ cumple

(λ2 − λ + 1)3 − 2−8 λ2 (λ − 1)2 = 0.

De aquı́ se sigue que λ ∈ O, λ ≡ 0, 1 (mód P) y como en el teorema anterior


concluimos que E tiene reducción estable.
Si car k = 2 consideramos una ecuación en forma normal de Deuring, de
forma que
α3 (α3 − 24)3
j(E) = .
α3 − 27
Razonando análogamente vemos que α ∈ O y α3 ≡ 27 (mód P), luego la
ecuación es minimal y su reducción es estable.
Por último observamos que para que cambie el tipo de reducción de una
curva con reducción inestable es necesario que la extensión de K sea ramificada:

Teorema 6.15 Sea E/K una curva elı́ptica dada por una ecuación de Weiers-
trass minimal y sea K  /K una extensión no ramificada. Entonces la ecuación
de E sigue siendo minimal sobre K  y, en consecuencia, el tipo de reducción es
el mismo sobre ambos cuerpos.

Demostración: Supongamos que car k = 2, 3. Entonces el teorema 6.4 nos


da que la ecuación de E/K cumple v(∆) < 12 o v(c4 ) < 4 (ver la observación
tras el teorema). Como la extensión K  /K es no ramificada, la valoración de
K  extiende a la de K, luego la ecuación también es minimal sobre K  .
Supongamos ahora que car k = 3. Supongamos que existe un cambio de
variables semientero (respecto de O ) que transforma la ecuación minimal (sobre
K) en otra ecuación entera con menor δP . Diremos que tal cambio es reductor
y vamos a probar que entonces existe un cambio de variables reductor definido
sobre O, lo que contradice la minimalidad sobre K de la ecuación de partida.
152 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Como car k = 2, podemos aplicar cambios de variables enteros para trans-


formar tanto la ecuación minimal de partida como la ecuación reducida en ecua-
ciones de Weierstrass de tipo b. La composición del cambio reductor con estos
dos cambios enteros sigue siendo un cambio reductor, luego podemos suponer
que éste pasa de una ecuación de tipo b en otra de tipo b.
Si el cambio reductor está determinado por u, r, s, t ∈ O, el teorema 2.6
muestra que el hecho de que sea reductor equivale a que v(u) > 0. Más aún,
dicho teorema implica que podemos hacer u = π, pues con ello estamos multi-
plicando cada coeficiente ai por un entero, luego los ai siguen estando en O y
el cambio sigue cumpliendo v(u) > 0, luego sigue siendo reductor.
La ecuación de a1 implica que s = 0 y la de a3 que t = 0. El cambio se
reduce, pues, a

X = π 2 X  + r, Y = π3 Y  , r ∈ O .

Sea S ⊂ O un conjunto de representantes de las clases de k, de modo que


todo elemento de O se expresa de forma única como si π i . Podemos extender
 
S a un conjunto similar S para O . i≥0

Vamos a probar que si ρ ∈ O podemos sustituir r por r + ρπ 2 de modo que


el cambio de variables sigue siendo reductor. Esto implica que podemos suponer
que r = r0 + r1 π, con r0 , r1 ∈ S  .
En efecto, nos basamos en las ecuaciones

π 2 b2 = b2 + 12r,
π 4 b4 = b4 + rb2 + 6r2 ,
π 6 b6 = b6 + 2rb4 + r2 b2 + 4r3 .

Llamamos g2 (r), g4 (r), g6 (r) a los miembros derechos. Hemos de probar


que π i | gi (r + ρπ 2 ), para i = 2, 4, 6, lo que justifica que los coeficientes de la
ecuación transformada siguen siendo enteros. Ahora bien:

g2 (r + ρπ 2 ) = g2 (r) + 12ρπ 2 = (b2 + 12ρ)π 2 ,


g4 (r + ρπ 2 ) = g4 (r) + ρπ 2 (b2 + 12r) + 6ρ2 π 4
= (b4 + ρb2 + 6ρ2 )π 4 ,
g6 (r + ρπ 2 ) = (b6 + 2b4 ρ + b2 ρ2 + 4ρ3 )π 6 .

Ahora demostramos que r0 , r1 ∈ S, con lo que r ∈ O y tenemos que el cambio


de variables está definido sobre O, que es la contradicción que buscábamos.
La ecuación de b2 muestra que v(b2 ) ≥ 1, luego b2 = β2 π, con β2 ∈ O, y
ahora la ecuación de b4 nos permite concluir que b4 = β4 π con β4 ∈ O. De aquı́
se sigue que
g6 (r) ≡ 4r03 + b6 ≡ 0 (mód π)
(la última congruencia porque π 6 | g6 (r)). Esto implica que r̃0 es puramente
inseparable sobre k, luego r̃0 ∈ k y por la unicidad de los desarrollos en serie
6.2. Reducción de curvas elı́pticas 153

r0 ∈ S. (Existe un α ∈ O tal que α̃ = r̃0 , luego r0 es el primer coeficiente del


desarrollo en serie de α.)
Factoricemos 3 = κπ, con κ ∈ O (si car K = 3 es κ = 0). Un simple cálculo
nos da que

g4 (r) = b4 + r0 b2 + 6r02 + π 2 (r1 β2 + 4κr0 r1 + 6r12 ),

g6 (r) = (b6 +2r0 b4 +r02 b2 +4r03 )+2πr1 (b4 +b2 r0 +6r02 )+π 3 (r12 β2 +4κr0 r12 +4r13 ).
Sustituyendo la primera ecuación en la segunda obtenemos

π 6 b6 = (b6 + 2r0 b4 + r02 b2 + 4r03 ) + 2r1 b4 π 5 − π 3 (8r13 + r12 (4κr0 + β2 )).

De aquı́ deducimos que el primer paréntesis del segundo miembro ha de ser


de la forma βπ 3 , con β ∈ O. Dividiendo entre π 3 pasamos a que

8r13 + r12 (4κr0 + β2 ) ≡ −β (mód π),

pero por otra parte π 2 b2 = (β2 + 4κr0 )π + 4κr1 π 2 , de donde

4κr0 + β2 ≡ 0 (mód π).

En definitiva, llegamos a la congruencia r13 ≡ β (mód π), de la que se sigue


que r̃1 es puramente inseparable sobre k, luego está en k y r1 ∈ S.
El caso car k = 2 es análogo, sólo que requiere más cálculos. El planteamiento
es el mismo, pero ahora no podemos suponer que las ecuaciones sean de tipo b
y hemos de trabajar con las fórmulas para los ai en lugar de los bi . De todos
modos, mediante un cambio entero con u = 1 y s = t = 0 podemos transformar
la ecuación para exigir que a2 = 0. Como antes, podemos suponer que u = π,
si bien s y t no tienen por qué ser nulos.
Ahora demostramos que, para todo ρ, σ, τ ∈ O , si cambiamos

r → r + ρπ 3 , s → s + σπ, t → t + τ π 3 ,

el nuevo cambio de variables sigue siendo reductor, lo que nos permite suponer
que
r = r0 + r1 π + r2 π 2 , s = s0 , t = t0 + t1 π + t2 π 2 ,
donde todas las variables con subı́ndices representan elementos de S  .
Ahora las ecuaciones son:
πa1 = a1 + 2s,
π 2 a2 = −sa1 + 3r − s2 ,
π 3 a3 = a3 + ra1 + 2t,
π 4 a4 = a4 − sa3 − (t + rs)a1 + 3r2 − 2st,
π 6 a6 = a6 + ra4 + r3 − ta3 − t2 − rta1 .

Llamamos fi (r, s, t) a los miembros derechos. Las tres primeras ecuaciones


implican que a1 = α1 π, a3 = α3 π, con αi ∈ O, ası́ como que r ≡ s2 (mód π).
Expresamos 2 = κπ, con κ ∈ O.
154 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Realizamos las sustituciones una a una. Primero cambiamos s → s + σπ.


Hemos de probar que los coeficientes ai siguen siendo enteros o, lo que es lo
mismo, que π i | fi (r, s + σπ, t). Por ejemplo,

f4 (r, s + σπ, t) = f4 (r, s, t) − σπ 2 (α3 + rα1 + κt) = π 4 a4 − σπ 4 a3 .

Ahora cambiamos r → r + ρπ 3 . Detallamos por ejemplo el caso i = 6:

f6 (r + ρπ 3 ) = π 6 a6 + ρπ 3 a4 + 3r2 ρπ 3 + 3rρ2 π 6 + ρ3 π 9 − ta1 ρπ 3


≡ ρπ 3 (a4 + 3r2 − ta1 )
≡ ρπ 3 (π 4 a4 + s(a3 + ra1 + 2t))
≡ ρπ 3 sπ 3 a3 ≡ 0 (mód π 6 ).

El cambio t → t + τ π 3 se trata similarmente.


A continuación demostramos que r0 , r1 , s0 , t0 , t1 ∈ S. La ecuación de a4
nos da que 3r2 + a4 ≡ 0 (mód π), luego r02 + a4 ≡ 0 (mód π). Esto implica que
r̃0 es puramente inseparable sobre k, luego r0 ∈ S.
La ecuación de a6 implica que a6 + ra4 + r3 − t2 ≡ 0 (mód π), con lo que
a6 + r0 a4 + r03 − t20 ≡ 0 (mód π). Esto prueba que t̃0 es puramente inseparable
sobre k, luego t0 ∈ S. De la ecuación de a2 obtenemos que s0 ∈ S.
Ahora reducimos la ecuación de a2 módulo π 2 :

−sα1 π + 3r1 π + (3r0 − s0 ) ≡ 0 (mód π 2 ).

La congruencia r ≡ s2 (mód π) implica 3r0 − s20 ≡ 0 (mód π). Pongamos


que 3r0 − s20 = λπ, con λ ∈ O. Entonces

−sα1 + r1 + λ ≡ 0 (mód π).

Esto implica que r̃1 ∈ k, luego r1 ∈ S. Por último reducimos la ecuación de


a6 módulo π 3 :

π 2 (r2 (a4 + 3ρ2 ) − t1 (α3 + κt0 + ρα1 ) − t21 ) ≡ γ (mód π 3 ),

donde ρ = r0 + r1 π y γ ∈ O. Esto implica que γ = π 2 γ0 , con γ0 ∈ O, con lo que

r2 (a4 + 3ρ2 ) − t1 (α3 + κt0 + ρα1 ) − t21 ≡ γ0 (mód π).

La ecuación de a4 implica que el primer paréntesis es nulo módulo π, y la de


a3 implica lo mismo para el segundo. Ası́ pues, t21 +γ0 ≡ 0 (mód π) y concluimos
como siempre que t1 ∈ S.
Por el contrario, no podemos asegurar que r2 y t2 estén en S. Veamos lo
máximo que podemos decir. En la ecuación de a6 sustituimos r = ρ + r2 π 2 ,
t = τ + t2 π 2 (con ρ, τ ∈ O), tomamos congruencias módulo π 6 y agrupamos en
un único término δ todos los sumandos que están en O:

δ ≡ r2 π 2 (a4 − ta1 + sρr2 π 2 + 3ρ2 ) − t2 π 3 (ρα1 + α3 + κτ ) − t22 π 4 (mód π 6 ).


6.2. Reducción de curvas elı́pticas 155

Sustituimos a4 por la fórmula de a4 y α3 + κτ por la de a3 :

δ ≡ r2 π 2 (sa3 + 2st + rsa1 − 3r2 + 3ρr2 π 2 + 3ρ2 ) − t2 π 3 (ρα1 + π 2 a3 − rα1 ) − t22 π 4 .

Volvemos a sustituir r = ρ + r2 π 2 :

δ ≡ r2 π 2 (sa3 + 2st + rsa1 − 3ρr2 π 2 ) − t2 π 3 (π 2 a3 − r2 α1 π 2 ) − t22 π 4 (mód π 6 ).

Equivalentemente:

δ ≡ r2 π 2 s(a3 + 2t + ra1 ) − 3ρr22 π 4 − t2 π 5 (a4 − r2 α1 ) − t22 π 4 (mód π 6 ).

Aplicamos de nuevo la ecuación de a3 :

δ ≡ r2 sa3 π 5 − 3ρr22 π 4 − t2 π 5 (a4 − r2 α1 ) − t22 π 4 (mód π 6 ).

De aquı́ se sigue que δ = Kπ 4 , con K ∈ O. Dividiendo entre π 4 queda

K ≡ −3ρr22 − t22 ≡ r0 r22 + t22 (mód π).

Ahora usamos que r ≡ s2 (mód π), de donde r0 ≡ s20 (mód π):

K ≡ (s0 r2 + t2 )2 (mód π).

El argumento usual de inseparabilidad nos da que s̃0 r̃2 + t̃2 ∈ k. En otros


términos, existe un u ∈ O tal que s0 r2 + t2 ≡ u (mód π). Más explı́citamente,
digamos que t2 + s0 r2 = u + vπ, con v ∈ O .

El teorema quedará probado si justificamos que podemos cambiar

r → r − r2 π 2 = r0 + r1 π, t → t + s0 r2 π 2 = t0 + t1 π + uπ 2 + vπ 3

de modo que el cambio de variables sigue siendo reductor, pues en tal caso
sabemos que el término vπ 3 también puede eliminarse, con lo que llegamos
finalmente a un cambio definido sobre O.

En la práctica hemos de probar que π i | fi (r − r2 π 2 , s0 , t + s0 r2 π 2 ), para


todo ı́ndice i. Veámoslo por ejemplo para i = 4.

f4 (r − r2 π 2 , s0 , t + s0 r2 π 2 ) = f4 (r, s0 , t) − 6rr2 π 2 + 3r22 π 4 − 2s20 r2 π 2


≡ −κr2 π 3 (3r + s20 ) ≡ −κr2 π 3 2s20
≡ −κ2 r2 s20 π 4 ≡ 0 (mód π 4 ).

(Aquı́ hemos usado que 3r ≡ r0 (mód π).)


156 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

6.3 Puntos enteros y puntos de torsión


En esta sección extraeremos numerosas consecuencias del teorema siguiente,
que es el motivo que nos ha llevado a estudiar los grupos formales en el capı́tulo
anterior:

Teorema 6.16 Sea E/K una curva elı́ptica dada por una ecuación de Weiers-
trass entera, sea G el grupo formal de E (que por 5.3 es un grupo formal sobre el
anillo O) y sea z(T ) la serie de Taylor de z = −1/y en O respecto del parámetro
t = −x/y (que por 5.2 está en O[[T ]]). Entonces la aplicación G(P) −→ E1 (K)
dada por t → (t/z(t), −1/z(t)) (entendiendo que la imagen de 0 es O) es un
isomorfismo de grupos.

Demostración: Observemos en primer lugar que

E1 (K) = {P ∈ E(K) | v(t(P )) ≥ 1, v(z(P )) ≥ 1}.

En efecto, si P̃ = [0, 1, 0], entonces P = [a, b, c], donde v(a) ≥ 1, v(b) = 0,


v(c) ≥ 1, y entonces t(P ) = −a/b, z(P ) = −c/b son enteros no unitarios. El
recı́proco se prueba igualmente.
Llamemos φ : G(P) −→ P2 (K) a la aplicación dada por

φ(t) = [t, −1, z(t)].

La definición es correcta, pues la serie z(T ) tiene coeficientes enteros, y esto


implica que converge en los puntos de G(P).
Sabemos que z(T ) = T 3 (1+· · · ), de donde se sigue que z(T ) sólo se anula en
t = 0. Por lo tanto, en términos de las coordenadas de Weierstrass tenemos que
φ(0) = O y, para los demás puntos, φ es la aplicación descrita en el enunciado.
La serie z(T ) cumple la ecuación

z = T 3 + (a1 T + a2 T 2 )z + (a3 + a4 T )z 2 + a6 z 3 ,

donde los coeficientes ai son los de la ecuación de Weierstrass minimal que


estamos considerando. Se aquı́ se sigue que si t ∈ G(P), entonces el punto φ(t)
cumple la ecuación de Weierstrass, luego φ : G(P) −→ E(K). Más aún, como
z(t) ∈ P3 , es obvio que φ(t) se reduce al punto Õ, luego φ : G(P) −→ E1 (K).
Vamos a ver que φ tiene por inversa a la aplicación t : E1 (K) −→ G(P). Es
inmediato que t(φ(t0 )) = t0 , para todo t0 ∈ G(P). Tomemos ahora un punto
P ∈ E1 (K) y hemos de probar que φ(t(P )) = P . Podemos suponer que P = O,
y entonces P = (x(P ), y(P )) = (t(P )/z(P ), −1/z(P )), luego basta demostrar
que z(t(P )) = z(P ). (Notemos que la z del miembro izquierdo es la serie z(T ),
mientras que la del miembro derecho es la función z ∈ K(E)).
Si llamamos t0 = t(P ) ∈ P, los dos números z(t0 ) y z(P ) están en P y
cumplen la ecuación

z = t30 + (a1 t0 + a2 t20 )z + (a3 + a4 t0 )z 2 + a6 z 3 .


6.3. Puntos enteros y puntos de torsión 157

Por consiguiente, la diferencia z(t0 ) − z(P ) es

(a1 t0 + a2 t20 )(z(t0 ) − z(P )) + (a3 + a4 t0 )(z(t0 )2 − z(P )2 ) + a6 (z(t0 )3 − z(P )3 ).

Si fuera z(t0 ) = z(P ) podrı́amos dividir:

1 = a1 t0 + a2 t20 + (a3 + a4 t0 )(z(t0 ) + z(P )) + a6 (z(t0 )2 + z(t0 )z(P ) + z(P )2 ),

y de aquı́ se concluye que 1 ∈ P, lo cual es absurdo.


Con esto tenemos probado que φ y t son mutuamente inversas. Vamos a
probar, por último, que t es un homomorfismo de grupos. Sea s : E × E −→ K
la composición de la suma en E con la función t. Se trata de una función racional
en E × E, luego s = R(t1 , z1 , t2 , z2 ), para cierta R ∈ K[T1 , Z1 , T2 , Z2 ]. Entonces
su serie de Taylor en (O, O) respecto de los parámetros t1 , t2 es claramente
s(T1 , T2 ) = R(T1 , z(T1 ), T2 , z(T2 )). Por lo tanto, si P , P  ∈ E1 (K), se cumple

t(P + P  ) = R(t(P ), z(P ), t(P  ), z(P  )) = R(t(P ), z(t(P )), t(P  ), z(t(P  )))
= s(t(P ), t(P  )) = t(P ) + t(P  ).

Esto demuestra que t es un isomorfismo de grupos y, por consiguiente, φ


también lo es.
El isomorfismo dado por el teorema anterior nos permite definir una cadena
de subgrupos de E1 (K), correspondientes a los subgrupos G(Pn ). Vamos a ver
que éstos tienen una interpretación natural.

Definición 6.17 Sea E/K una curva elı́ptica definida por una ecuación de
Weierstrass entera F (X, Y, Z) = 0, donde

F (X, Y, Z) = Y 2 Z + a1 XY Z + a3 Y Z 2 − X 3 − a2 X 2 Z − a4 XZ 2 − a6 Z 3 .

Definimos como sigue una aplicación v : E(K) −→ N ∪ {+∞} (que no hay


que confundir con la valoración en K, pese a que usamos la misma notación).
Para cada punto P ∈ E(K), fijamos unas coordenadas homogéneas (x, y, z) que
sean enteras y al menos una de ellas unitaria. (Ası́, v(x), v(y), v(z) ≥ 0 no
dependen de la elección de la terna.)
• Si v(z) = 0 diremos que el punto P es entero y definimos v(P ) = 0.
• Si v(z) > 0, despejando x3 en la ecuación vemos que v(x) > 0, luego por
la elección de la terna ha de ser v(y) = 0 y al despejar x3 el término y 2 z
tiene valor P-ádico estrictamente menor que cualquier otro de su miembro,
luego 3v(x) = v(z). En este caso definimos v(P ) = v(x).

Para comprender el significado de v observamos en primer lugar que

v(P ) = +∞ si y sólo si P = O.

En efecto, O = [0, 1, 0] está en el caso v(z) = +∞ > 0 y entonces tenemos


que v(O) = v(x) = v(0) = +∞. Recı́procamente, si v(P ) = +∞ es porque
v(z) > 0 y v(x) = +∞. Más aún, v(z) = 3v(x) = +∞, luego P = [0, y, 0] = O.
158 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Para un punto finito P = (x, y) = [x, y, 1], tenemos que

v(P ) = 0 si y sólo si x, y ∈ O.

En otras palabras, los puntos enteros son los que tienen coordenadas afines
enteras. Finalmente, si v(P ) > 0, tenemos que P = (x, y) = [x , y  , z  ], donde
x = x /z  , y = y  /z  y

v(x) = v(x ) − v(z  ) = −2v(P ),

v(y) = v(y  ) − v(z  ) = −3v(P ).


Podemos decir, pues, que v(P ) mide lo que dista P de tener coordenadas
afines enteras. Notemos ahora que de la propia definición de E1 (K) se sigue que

E1 (K) = {P ∈ E(K) | v(P ) ≥ 1}.

Para cada natural m ≥ 1 definimos

Em (K) = {P ∈ E(K) | v(P ) ≥ m}.

No es evidente en absoluto que los conjuntos Em (K) sean subgrupos de


E(K), pero lo cierto es que lo son, como se deduce del teorema siguiente:

Teorema 6.18 Sea E/K una curva elı́ptica dada por una ecuación de Weiers-
trass entera, sea G su grupo formal y sea φ : G(P) −→ E1 (K) el isomor-
fismo dado por el teorema 6.16. Entonces, para todo t ∈ G(P) se cumple que
v(t) = v(φ(t)).

Demostración: Basta observar que


1 1
v(φ(t)) = − v(−1/z(t)) = v(z(t)) = v(t).
3 3

Esto prueba que, en efecto los conjuntos Em (K) son las imágenes por el
isomorfismo de los subgrupos G(Pm ) = Pm = {t ∈ K | v(t) ≥ m}, luego
tenemos una cadena de subgrupos


E(K) ≥ E0 (K) ≥ E1 (K) ≥ · · · ≥ Em (K) ≥ · · · ≥ Em (K) = 0.
m=1

Otra consecuencia inmediata es que si P , Q ∈ E(K), entonces

v(P + Q) ≥ mı́n{v(P ), v(Q)},

y se da la igualdad si v(P ) = v(Q). (Observemos que esto es trivial si alguno


de los puntos es entero o infinito, y en los casos restantes es consecuencia del
teorema anterior.)
6.3. Puntos enteros y puntos de torsión 159

Otra observación sobre los subgrupos Em (K) es que el cociente de dos con-
secutivos es isomorfo a k + o, en otros términos, que tenemos sucesiones exactas
(para m ≥ 1):
0 −→ Em+1 (K) −→ Em (K) −→ k + .
En efecto (ver las observaciones de la página 5.3):
Em (K)/Em+1 (K) ∼
= G(Pm )/G(Pm+1 ) ∼
= Pm /Pm+1 ∼
= k+ .
El último isomorfismo es el inducido por el epimorfismo Pm −→ k + dado
por α → [απ −m ].
Para m = 0 también tenemos una sucesión exacta, pero su último grupo no
es k + , sino Ẽr (k), tal y como hemos demostrado en 6.8.
Finalmente, el teorema 5.20 nos da que si car K = 0 entonces, para todo
natural m suficientemente grande se cumple que
Em (K) ∼
= G(Pm ) ∼
= Pm ∼
= O+ .
El último isomorfismo es el dado por α → απ −m . De hecho, si p = car k y
v(p) = 1, tenemos el isomorfismo para m = 2, e incluso para m = 1 si p > 2.
La consecuencia más importante que vamos a extraer del teorema 6.16 es la
siguiente:
Teorema 6.19 Sea E/K una curva elı́ptica dada por una ecuación de Weiers-
trass entera y m ≥ 2 un número natural primo con car k. Entonces E1 (K)
no tiene elementos de orden m y, si Ẽ/k es regular, entonces la reducción
E(K)[m] −→ Ẽ(k) es inyectiva.
Demostración: Sea G el grupo formal de E. Por el teorema 5.16 sabemos
que G(P) no tiene elementos de orden m. Por 6.16 lo mismo vale para E1 (K).
Si Ẽ/k es regular entonces E0 (K) = E(K) y Ẽr (k) = Ẽ(k). La restricción a
E(K)[m] de la reducción módulo P tiene núcleo trivial, luego es inyectiva.
Este teorema permite en muchos casos determinar los elementos de torsión de
una curva elı́ptica definida sobre Q o, más en general, sobre un cuerpo numérico.

Ejemplo Consideremos la curva elı́ptica E/Q dada por


Y 2 + Y = X 3 − X + 1.
Su discriminante es ∆ = −13 · 47. Esta ecuación define también una curva
elı́ptica sobre Qp con el mismo determinante, de modo que E(Q) es un subgrupo
de E(Qp ). Además v2 (∆) = v3 (∆) = 0, luego la ecuación es minimal para
Q2 y Q3 y la reducción es regular. Una simple comprobación muestra que
Ẽ(Z/2Z) = {Õ} y Ẽ(Z/3Z) = {Õ} (la ecuación no tiene soluciones en Z/2Z
ni en Z/3Z), luego el teorema anterior implica que E(Q)[m] = 0 para todo
m primo con 2 o con 3. En particular, E(Q) no tiene elementos de torsión de
orden primo, luego no tiene elementos de torsión en absoluto. En otras palabras,
E(Q) = {O}.
160 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

Ejemplo Consideremos ahora la curva E/Q dada por Y 2 = X 3 + 3, cuyo


discriminante es ∆ = −24 · 35 . Esta misma ecuación determina curvas elı́pticas
sobre Qp para todo primo p y como vp (∆) < 12 es minimal. Además la reducción
módulo p es regular si p ≥ 5.
Se comprueba fácilmente que |Ẽ(Z/5Z)| = 6, |Ẽ(Z/7Z)| = 13. Si p es un
primo distinto de 5 y de 7, el teorema anterior implica que E(Q)[p] puede verse
como subgrupo de Ẽ(Z/5Z) y Ẽ(Z/7Z), lo que obliga a que E(Q)[p] = 0. Por
otra parte, E(Q)[5] es subgrupo de Ẽ(Z/7Z), pero este último grupo no puede
tener elementos de orden 5, luego E(Q) tampoco tiene elementos de orden 5.
Igualmente se concluye que no hay elementos de orden 7. Concluimos que E(Q)
no tiene elementos de torsión.
Puesto que (1, 2) ∈ E(Q), este punto ha de tener orden infinito, luego po-
demos afirmar que la ecuación Y 2 = X 3 + 3 tiene infinitas soluciones en Q2 , lo
cual no es evidente en absoluto.

Ejemplo Consideremos ahora la curva E/Q dada por Y 2 = X 3 + X, cuyo


discriminante es ∆ = −26 . Es fácil ver que (0, 0) ∈ E(Q)[2]. Vamos a ver que
es el único elemento de torsión de E(Q) (aparte de O).
Es fácil comprobar que los grupos Ẽ(Z/3Z) y Ẽ(Z/5Z) tienen orden 4. Esto
implica que E(Q) todo elemento de torsión de E(Q) no trivial ha de tener orden
2 o 4. Más concretamente, vemos que

Ẽ(Z/3Z) = {O, (0, 0), (2, 1), (2, 2)}, Ẽ(Z/5Z) = {O, (0, 0), (2, 0), (3, 0)}.

En ambas curvas, los elementos de orden 2 son los que cumplen Y = 0, luego

Ẽ(Z/3Z) ∼
= Z/4Z, Ẽ(Z/5Z) ∼
= Z/2Z × Z/2Z.

El segundo grupo nos muestra que E(Q) no tiene elementos de orden 4 y el


primero que a lo sumo hay un elemento de orden 2. Ası́ pues, (0, 0) es el único
elemento de torsión (no nulo) de E(Q).

Ejercicio: Probar que si K es un cuerpo numérico y E/K es una curva elı́ptica,


entonces E(K) tiene un número finito de elementos de torsión.

Los puntos de orden finito están muy cerca de tener coordenadas enteras.
El teorema siguiente describe la situación general:

Teorema 6.20 Supongamos que K tiene caracterı́stica 0 y que k tiene carac-


terı́stica prima p. Sea E/K una curva elı́ptica determinada por una ecuación
de Weierstrass entera y sea P ∈ E(K) un punto de orden m ≥ 2.

a) Si m no es potencia de p, entonces v(P ) = 0, es decir, x(P ), y(P ) ∈ O.

b) Si m = pn , entonces v(P ) ≤ v(p)/(pn − pn−1 ).


6.4. La topologı́a métrica 161

Demostración: a) Sea G el grupo formal de E. El teorema 5.16 implica


que G(P) no tiene elementos de torsión de orden m, luego P ∈
/ E1 (K), es decir,
v(P ) = 0.
b) O bien v(P ) = 0 o bien P ∈ E1 (K), en cuyo caso el teorema 5.17 nos da
la desigualdad del enunciado.
En las condiciones del teorema anterior, si v(p) = 1 el apartado b) implica
también v(P ) = 0 salvo si p = 2 y n = 1, luego concluimos que todos los puntos
de torsión de E(K) tienen coordenadas enteras salvo a lo sumo los de orden 2
(cuando car k = 2), que pueden cumplir v(P ) = 1, con lo que serán de la forma
(a/4, b/8), con a, b ∈ O.

Ejemplo El punto (−1/4, 1/8) tiene orden 2 en la curva E/Q2 dada por la
ecuación Y 2 + XY = X 3 + 4X + 1.
Por último probamos que curvas isógenas tienen reducciones isógenas. Con-
viene introducir la notación siguiente:

Definición 6.21 Si E/K y E  /K son dos curvas elı́pticas definidas sobre K,


representaremos por HomK (E, E  ) al grupo de las isogenias de E en E  definidas
sobre K. Igualmente, EndK (E) será el anillo de las isogenias de E en sı́ misma
definidas sobre K.

Teorema 6.22 Sean E/K y E  /K dos curvas elı́pticas con buena reducción
módulo P. Entonces la reducción de isogenias dada por el teorema 6.11 es un
monomorfismo de grupos HomK (E, E  ) −→ Homk (E, E  ) (y también de anillos
cuando E = E  ).

Demostración: Es inmediato que la reducción es un homomorfismo. Sólo


hemos de probar que es inyectiva. Ahora bien, si φ ∈ HomK (E, E  ) cumple
φ̃ = 0, fijamos un primo p = car k, y observamos que si P ∈ E[pn ], entonces
P ∈ E(L)[pn ], para cierta extensión finita L de K, luego φ(P ) ∈ E  (L)[pn ] y

) = φ̃(P̃ ) = O.
φ(P

Por el teorema 6.19 podemos concluir que φ(P ) = O, luego E[pn ] está en el
núcleo de φ para todo n, luego dicho núcleo es infinito y φ = 0.

6.4 La topologı́a métrica


En esta sección mostraremos que la métrica de K induce una topologı́a
sobre las variedades algebraicas definidas sobre K exactamente igual que en
el caso complejo. Empezamos definiendo la topologı́a métrica sobre el espacio
proyectivo Pn (K). Para ello definimos

Ai = {P ∈ Pn (K) | xi (P ) = 0}
162 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

y llamamos pi : Ai −→ K n a la aplicación que a cada P ∈ Ai le asigna la n-tupla


resultante de eliminar xi en la única n+1-tupla de coordenadas homogéneas de P
que cumple xi = 1. Se comprueba inmediatamente que las composiciones p−1 i ◦pj
son homeomorfismos de K n en sı́ mismo (dotado de la topologı́a producto),
lo cual permite definir una única topologı́a en Pn (K) respecto a la cual los
conjuntos Ai son abiertos y las aplicaciones pi son homeomorfismos.

Definición 6.23 Llamaremos topologı́a métrica en Pn (K) a la única topologı́a


respecto a la cual los conjuntos Ai son abiertos y las funciones pi : Ai −→ K n
son homeomorfismos.

Notemos que todo el razonamiento precedente es válido si K es un cuerpo


métrico arbitrario, no necesariamente discreto. Es obvio que si L es una ex-
tensión algebraica de K considerada como cuerpo métrico con la única extensión
posible del valor absoluto de K, entonces la topologı́a inducida en Pn (L) ex-
tiende a la de Pn (K). En particular esto se aplica cuando L es la clausura
algebraica K de K.
Si V ⊂ Pn (K) es una variedad proyectiva, llamaremos topologı́a métrica en
V a la restricción de la topologı́a métrica de Pn (K). En particular, si V está
definida sobre K, la restricción a V (K) de la topologı́a métrica de V coincide
con la restricción a V (K) de la topologı́a métrica de Pn (K).
Si F ∈ K[X1 , . . . , Xn+1 ] es una forma, entonces el conjunto

V (F ) = {P ∈ Pn (K) | F (P ) = 0}

es cerrado para la topologı́a métrica, pues V (F ) ∩ An+1 se corresponde a través


n
de la aplicación pn+1 con el cerrado {X ∈ K | F (X, 1) = 0}, y lo mismo vale
para los demás abiertos Ai .
Como consecuencia, todo subconjunto algebraico de Pn (K) es cerrado para
la topologı́a métrica o, equivalentemente, todo abierto para la topologı́a de
Zariski es abierto para la topologı́a métrica (en Pn (K) y, por consiguiente, en
cualquier variedad proyectiva).
n+1
Se comprueba inmediatamente que la aplicación p : K p \ {0} −→ Pn (K)
que a cada n + 1-tupla le asigna el punto con tales coordenadas homogéneas es
continua. De aquı́ se sigue a su vez que toda aplicación regular φ : V −→ W
entre variedades proyectivas en K es continua respecto de la topologı́a métrica.
En efecto, es claro que no perdemos generalidad si consideramos

φ : V −→ Pm (K).

En un entorno de P para la topologı́a de Zariski, la aplicación φ viene dada


por φ(Q) = [F1 (Q), . . . , Fm+1 (Q)], donde los Fi ∈ K[X1 , . . . , Xm+1 ] son formas
del mismo grado que no se anulan simultáneamente en P . Supongamos sin
pérdida de generalidad que x1 (P ) = 0 y Fm+1 (P ) = 0. Entonces, el conjunto

U = {Q ∈ V (K) | x1 (Q) = 0, Fm+1 (Q) = 0}


6.4. La topologı́a métrica 163

es un entorno de P para la topologı́a de Zariski, luego también para la to-


pologı́a métrica. Sobre este entorno U , la aplicación φ puede obtenerse como
composición de tres funciones continuas:
n
a) La aplicación U −→ K dada por [X1 , . . . , Xn ] → (X2 /X1 , . . . , Xn /X1 )
n
(que es la restricción del homeomorfismo A1 −→ K ).
b) La aplicación polinómica X → (F1 (1, X), . . . , Fm+1 (1, X)),
m+1
c) La aplicación p : K \ {0} −→ Pm (K).
Ahora es fácil ver que la topologı́a métrica en un producto V × W es el
producto de las topologı́as métricas. En efecto, basta demostrarlo para el caso
de Pn (K) × Pm (K), y a su vez basta probar que la topologı́a métrica en un
abierto Ai × Aj es la topologı́a producto. Ahora bien, la aplicación natural
Ai × Aj −→ K n+m es un homeomorfismo para la topologı́a métrica (porque es
regular con inversa regular) y también para la topologı́a producto.
Por último, observemos que si K es localmente compacto y V /K es una
variedad proyectiva definida sobre K, entonces el conjunto de puntos racionales
V (K) es compacto respecto a la topologı́a métrica. Como V (K) es cerrado
en un espacio proyectivo Pn (K), basta probar que éste es compacto, pero ello
es evidente, ya que es espacio Pn (K) es la imagen por la aplicación continua
p : K n+1 \ {0} −→ Pn (K) del compacto

C = {x ∈ K n+1 | |xi | = 1}.
i

Como primera aplicación demostramos el teorema siguiente:

Teorema 6.24 Si K es localmente compacto y E/K es una curva elı́ptica,


entonces el núcleo E1 (K) de la reducción módulo P tiene ı́ndice finito en E(K).

Demostración: En efecto, observemos que E(K) es un grupo topológico


compacto respecto de la topologı́a métrica (es decir, la suma y la aplicación
P → −P son continuas, porque son regulares). En la prueba de 6.16 hemos
visto que
E1 (K) = {P ∈ E(K) | v(t(P )) ≥ 1, v(z(P )) ≥ 1}.
Si llamamos U al abierto en E(K) donde están definidas t y z, tenemos que
E1 (K) ⊂ U y las funciones t, z : U −→ K son continuas, al igual que lo es la
valoración v : K −→ Z ∪ {+∞}. De aquı́ concluimos que E1 (K) es abierto en
E(K).
Aunque no nos va a hacer falta, notemos que todo subgrupo abierto de un
grupo topológico es también cerrado, ya que su complementario es una unión
de trasladados, que también son abiertos. Ası́ pues, E1 (K) es abierto y cerrado
en E(K).
La conclusión del teorema es ahora inmediata, pues el compacto E(K) se
descompone en unión disjunta de las clases (abiertas) módulo E1 (K), luego ha
de haber un número finito de clases.
164 Capı́tulo 6. Curvas elı́pticas sobre cuerpos locales

La compacidad local de K equivale a que el cuerpo de restos k sea finito.


Notemos que en tal caso el ı́ndice |E0 (K) : E1 (K)| = |Er (k)| es claramente
finito, luego el teorema anterior equivale a la finitud de |E(K) : E0 (K)|. Cuando
k no es finito el ı́ndice |E(K) : E1 (K)| ya no tiene por qué ser finito, pero
sucede que |E(K) : E0 (K)| lo es igualmente. Este hecho tiene consecuencias
muy importantes sobre las reducciones de las curvas elı́pticas, pero aquı́ no
estamos en condiciones de probarlo.2 Como ejemplo de dichas consecuencias,
enunciamos sin demostración el teorema siguiente:3

Teorema 6.25 Sea φ : E1 −→ E2 una isogenia no nula definida sobre K entre


dos curvas elı́pticas definidas sobre K. Entonces E1 y E2 tienen el mismo tipo
de reducción (buena, multiplicativa o aditiva) sobre K.

(Este teorema sólo lo usaremos en la prueba del teorema 9.25, el cual, a su


vez, no se usará en ningún otro lugar de este libro.)

2 Véase mi libro sobre Superficies aritméticas, teorema 10.42.


3 Para la demostración véase el teorema 13.7 de mi libro sobre Superficies aritméticas.
Capı́tulo VII

Curvas elı́pticas sobre


cuerpos numéricos

Nos ocupamos ahora de las curvas elı́pticas definidas sobre cuerpos numéricos,
en particular sobre Q. En todo el capı́tulo, K será un cuerpo numérico, O será
su anillo de enteros algebraicos y, para cada divisor primo no arquimediano P
de K, representaremos por KP la compleción de K respecto de la valoración
vP , por OP el anillo de enteros de KP , por kP el cuerpo de restos, etc.

Si E/K es una curva elı́ptica definida sobre K mediante una ecuación de


Weierstrass, para cada divisor primo no arquimediano P de K podemos consi-
derar la curva elı́ptica E/KP definida mediante la misma ecuación. Es obvio
que un cambio de variables sobre K que haga corresponder dos ecuaciones de
Weierstrass para una misma curva E puede verse también como un cambio de
variables sobre KP . Por lo tanto, a cada curva elı́ptica E/K le podemos asociar
una extensión E/KP a través de una ecuación de Weierstrass, sin que importe
la elección de ésta (dos ecuaciones para la misma curva dan lugar a extensiones
isomorfas). Más aún, toda isogenia no nula entre dos curvas elı́pticas se extiende
(mediante las mismas ecuaciones) a una isogenia no nula entre las extensiones,
luego curvas isógenas sobre K se extienden a curvas isógenas sobre KP .
A su vez, a partir de la extensión a KP podemos construir la reducción
Ẽ(kP ), que es una curva (tal vez singular) definida sobre el cuerpo finito kP .
Podemos distinguir entre primos P sobre los que E/K tiene buena reducción,
reducción multiplicativa o reducción aditiva.

7.1 El discriminante mı́nimo


Diremos que una ecuación de Weierstrass para una curva elı́ptica E/K es
entera si tiene sus coeficientes en O, de modo que también es una ecuación entera
para todas las extensiones E/KP . Es claro que toda curva elı́ptica E/K admite
una ecuación de Weierstrass de tipo c que, mediante un cambio X = u2 X  ,

165
166 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Y = u3 Y  para un u ∈ K ∗ adecuado, se transforma en una ecuación entera.


Toda ecuación entera cumple obviamente que ∆ ∈ O.
Fijada una ecuación de Weierstrass entera para una curva elı́ptica E/K, una
condición necesaria que E/K tenga mala reducción módulo un primo P es que
P | ∆, luego el conjunto de primos con mala reducción es siempre finito. Sin
embargo, la condición no es suficiente, pues la ecuación no tiene por qué ser
minimal sobre P. En esta sección vamos a estudiar si es posible encontrar una
ecuación de Weierstrass para E/K que sea minimal para todos los divisores
primos no arquimedianos de K, de modo que los primos con mala reducción
sean exactamente los que dividen al discriminante de la ecuación.
En principio, para cada divisor primo no arquimediano P de K, podemos
encontrar una ecuación de Weierstrass minimal sobre KP . Si su discriminante
es ∆, entonces el natural δP = vP (∆) es un invariante de E/K, de modo que
E/K tiene buena reducción módulo P si y sólo si δP = 0. Esto nos lleva a la
definición siguiente:

Definición 7.1 Llamamos discriminante mı́nimo de una curva E/K al ideal


de K dado por 
DE/K = PδP ,
P

donde P recorre los primos no arquimedianos de K.

En estos términos, E/K tiene mala reducción módulo un primo no arquime-


diano P de K si y sólo si P | DE/K . Naturalmente, esta definición no resuelve
nuestro problema. La cuestión es si E/K admite una ecuación minimal global
en el sentido siguiente:

Definición 7.2 Una ecuación de Weierstrass minimal para una curva elı́ptica
E/K es una ecuación de Weierstrass entera para E cuyo discriminante ∆ cumpla
(∆) = DE/K , es decir, una ecuación que sea minimal para todas las curvas
E/KP , para todo primo no arquimediano P de K.

En principio, si E/K es una curva elı́ptica definida por una ecuación de


Weierstrass

Y 2 + a1 XY + a3 Y = X 3 + a2 X 2 + a4 X + a6 , ai ∈ O,

para cada primo no arquimediano P de K existe un cambio de variables

X  = u2P X + rP , Y = u3P Y + sP u2P X + tP , uP , sP , tP ∈ OP ,

que transforma la ecuación en una ecuación minimal para E/KP . La relación


entre los discriminantes será ∆ = u12
P ∆P . Para todos los primos P salvo a lo
sumo un número finito de ellos tendremos vP (∆) = vP (∆P ) = 0, luego también
vP (uP ) = 0 y podemos definir el ideal

a∆ = PvP (uP ) ,
P
7.1. El discriminante mı́nimo 167

de modo que DE/K = (∆)/a12 ∆ . Ahora observamos que la clase [a∆ ] no de-
pende de ∆. En efecto, si consideramos otra ecuación de Weierstrass entera con
discriminante ∆ , entonces ∆ = u12 ∆ , para cierto u ∈ K ∗ , luego

(∆ )a12 
∆ = DE/K = (∆)a∆ = (∆ )(ua∆ ) ,
12 12

con lo que a∆ = (u)a∆ .

Definición 7.3 Llamaremos clase de Weierstrass de una curva elı́ptica E/K


sobre un cuerpo numérico K a la clase de ideales de K determinada por cual-
quier ideal a∆ correspondiente a cualquier ecuación de Weierstrass para E. La
representaremos por WE/K .

Teorema 7.4 Una curva elı́ptica E/K sobre un cuerpo numérico K tiene una
ecuación de Weierstrass minimal si y sólo si la clase de Weierstrass WE/K es
la clase principal.

Demostración: Si E/K tiene una ecuación minimal con discriminante ∆,


entonces (∆) = DE/K = (∆)/a12
∆ , luego a∆ = 1 y W = 1.

Recı́procamente, supongamos que W = 1. Tomemos una ecuación de Weiers-


trass entera para E y discriminante ∆. Para cada divisor primo no arquimediano
P de K consideremos un cambio de variables

X = u2P X  + rP , Y = u3P Y  + sP u2P XP + tP

que la transforme en una ecuación minimal para P, digamos con coeficientes


aiP y con discriminante ∆P . La ecuación de partida será ya minimal para todos
los primos P salvo un número finito de ellos. Si llamamos S al conjunto de estos
primos, podemos suponer que uP = 1 y rP = sP = tP = 0 para todo P ∈ / S.
En cualquier caso, uP , rP , sP y tP son P-enteros.
 vP (uP )
Por hipótesis, existe u ∈ K ∗ tal que P = (u). Esto significa que
vP (uP ) = vP (u), para todo P. P

Por el teorema chino del resto podemos tomar r, s, t ∈ O tales que para
todo P ∈ S se cumpla que

vP (r − rP ), vP (s − sP ), vP (t − tP ) > máx{vP (uiP aiP )}.


i

Consideremos ahora la ecuación de Weierstrass para E determinada por el


cambio de variables

X = u2 X  + r, Y = u3 Y  + su2 X  + t.

Vamos a comprobar que tiene coeficientes enteros (llamémoslos ai ). Basta


probar que vP (ai ) ≥ 0 para todo primo P. Si P ∈ / S, entonces u ∈ UP , luego la
conclusión es clara. Supongamos que P ∈ S y consideremos, por ejemplo, a2 ,
que cumple
u2 a2 = a2 − sa1 + 3r − s2 .
168 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

También tenemos que u2P a2P = a2 − sP a1 + 3rP − s2P , luego

vP (u2 a2 ) = vP (u2P a2P − (s − sP )a1 − 3(r − rP ) − (s2 − s2P ))

= vP (u2P a2P − (s − sP )(a1 + s + sP ) − 3(r − rP )) = vP (u2P a2P ),


por la elección de r y s. Concluimos que vP (a2 ) = vP (a2P ) ≥ 0.
Con los coeficientes restantes se razona de forma similar. El discriminante
de la nueva ecuación es ∆ = u−12 ∆, luego
vP (∆ ) = vP (u−12 ∆) = vP ((uP /u)12 ∆P ) = vP (∆P ).
Ası́ pues, hemos encontrado una ecuación minimal para E/K.
Como consecuencia inmediata tenemos el teorema siguiente:
Teorema 7.5 Si K es un cuerpo numérico con número de clases h = 1, enton-
ces toda curva elı́ptica E/K admite una ecuación de Weierstrass minimal.
Puede probarse que el recı́proco es cierto, es decir, que si h > 1 entonces
existen curvas elı́pticas que no admiten ecuaciones minimales.

Ejemplo Consideremos el cuerpo K = Q( −10), que tiene número de clases
h = 2 y consideremos la curva E/K dada por
Y 2 = X 3 + 125.
Su discriminante es ∆ = −24 33 56 . Es fácil ver que en (el anillo de enteros
de) K se cumple que 2 = p2 , 5 = q2 , mientras que 3 se conserva primo. Esto
hace que la ecuación de E sea minimal para todo primo de K salvo quizá para
el primo q. El cambio de coordenadas
√ 2 √ 3
X = −10 X  , Y = −10 Y 
transforma la ecuación en Y 2 = X 3 − 1/8, que es minimal y tiene buena re-
ducción en q. Por consiguiente, DE/K = (24 33 ) y WE/K12
= [56 ], con lo que
WE/K = [q].

Es claro que Z[ −10] no tiene elementos de norma 5, luego el ideal q no es
principal, WE/K = 1 y ası́ E/K no tiene una ecuación minimal global.
Los teoremas siguientes nos permitirán calcular ecuaciones minimales para
curvas elı́pticas definidas sobre Q. En realidad el método puede generalizarse
para cuerpos numéricos arbitrarios (es decir, a un método para decidir si existe
ecuación minimal y que permite calcularla en caso afirmativo), pero el caso de Q
es mucho más sencillo. Empezamos por probar una versión global del teorema
de Kraus:
Teorema 7.6 Sean c4 , c6 , ∆ ∈ Z tales que c34 − c26 = 1728∆ = 0. Entonces
existe una curva elı́ptica E/Q con una ecuación de Weierstrass entera con co-
variantes c4 y c6 (y discriminante ∆) si y sólo si v3 (c6 ) = 2 y se cumple una
de las dos condiciones siguientes:
7.1. El discriminante mı́nimo 169

a) c6 ≡ −1 (mód 4),
b) c4 ≡ 0 (mód 16) y c6 ≡ 0, 8 (mód 32).
Demostración: Si existe tal ecuación ha de cumplir el teorema 6.6 para
K = Q2 y K = Q3 , luego cumple las condiciones del enunciado (ver la obser-
vación tras 6.6).
Recı́procamente, si se cumplen estas condiciones, el teorema 6.6 nos da que
existen curvas elı́pticas E2 /Q2 y E3 /Q3 que admiten ecuaciones de Weierstrass
enteras con covariantes c4 y c6 . Mediante un cambio de variables adecuado con
u = 1, ambas se transforman en la misma ecuación de tipo c:
c4 c6
Y 2 = X3 − X − . (7.1)
48 864
Equivalentemente, para p = 2, 3, existen cambios de variable determinados
por rp , sp , tp ∈ Qp y u = 1 que transforman esta ecuación en dos ecuaciones
enteras sobre Qp . Vamos a ver que dado un número natural arbitrariamente
grande N existen r, s, t ∈ Q tales que
vp (r − rp ) ≥ N, vp (s − sp ) ≥ N, vp (s − sp ) ≥ N para p = 2, 3
y vp (r), vp (s), vp (t) ≥ 0 para todo primo p > 3.
En efecto, por la densidad de Q en Qp podemos aproximar rp por rp ∈ Q
y por el teorema de aproximación podemos aproximar r2 y r3 por un mismo
número r ∈ Q. Sólo falta probar que podemos aproximar r respecto a v2 y v3
mediante un r ∈ Q que sea entero respecto de los demás primos. Pongamos que
r = a/b. Por el teorema chino del resto existe un m ∈ Z tal que
vp (a − m) ≥ N + vp (b), para p = 2, 3,
vp (m) ≥ vp (b) para todo primo p | b, p > 3.
Entonces r = m/b cumple lo pedido. Igualmente se construyen s y t. Ahora
basta observar que si tomamos N suficientemente grande, el cambio de variables
determinado por r, s, t y u = 1 transforma la ecuación (7.1) en una ecuación
entera (que obviamente tendrá también covariantes c4 y c6 ). En efecto, las
fórmulas de 2.6 (teniendo en cuenta que los polinomios son funciones continuas)
muestran que los coeficientes de esta ecuación estarán cerca de los de las ecua-
ciones obtenidas con rp , sp , tp , y todo número racional suficientemente próximo
a un entero p-ádico es un entero p-ádico. En conclusión, el cambio de variable
lleva a una ecuación con coeficientes enteros diádicos y triádicos. Obviamente
también son enteros para los demás primos, luego están en Z.
Con esto podemos calcular fácilmente los covariantes (y el discriminante) de
las ecuaciones minimales de una curva dada:
Teorema 7.7 Sea E/Q una curva elı́ptica dada por una ecuación de Weiers-
trass entera con covariantes c4 y c6 y discriminante ∆. Sea u el mayor número
natural tal que c4 = u−4 c4 y c6 = u−6 c6 son enteros y satisfacen las condicio-
nes del teorema anterior. Entonces toda ecuación de Weierstrass entera con
covariantes c4 y c6 es una ecuación minimal para E/Q.
170 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Demostración: El cambio de variables X = u2 X  , Y = u3 Y  transforma


la ecuación de E/Q en una ecuación (no necesariamente entera) de covariantes
c4 , c6 , la cual puede transformarse a su vez en la ecuación (7.1) (con ci en lugar
de ci ).
Por otra parte, cualquier ecuación entera de covariantes ci —y existe al me-
nos una por el teorema anterior— puede transformarse en esa misma ecuación,
luego también en la ecuación de partida.
En definitiva, hemos probado que la curva E/Q admite una ecuación de
Weierstrass entera de covariantes c4 , c6 (y discriminante ∆ ). La maximalidad
de u hace que dicha ecuación sea necesariamente minimal.
Ası́ pues, para encontrar una ecuación minimal a una curva dada sólo nos
falta encontrar una ecuación entera con unos covariantes dados.

Definición 7.8 Una ecuación de Weierstrass con coeficientes en Z está reducida


si a1 , a3 ∈ {0, 1} y a2 ∈ {−1, 0, 1}.

Teorema 7.9 Toda ecuación de Weierstrass con coeficientes en Z se trans-


forma mediante un cambio de variables entero en una única ecuación reducida.
Dados c4 , c6 , ∆ ∈ Z en las condiciones del teorema anterior, la ecuación redu-
cida con tales covariantes tiene los coeficientes siguientes:

a1 ≡ c4 (mód 2), [a1 ∈ {0, 1}],


a2 ≡ −c6 − a1 (mód 3), [a2 ∈ {−1, 0, 1}],
a3 ≡ (b32 − 3c4 b2 − 2c6 )/16 (mód 2), [a3 ∈ {0, 1}, b2 = a1 + 4a2 ],
a4 = (b2 − 24a1 a3 − c4 )/48,
a6 = (−b32 − c6 + 36b2 (a1 a3 + 2a4 ) − 216a3 )/864.

Demostración: Consideremos una ecuación de Weierstrass entera con coe-


ficientes a1 , . . . , a6 y vamos a construir una nueva ecuación reducida con coefi-
cientes a1 , . . . , a6 , al mismo tiempo que construimos un cambio de variables con
u = 1 y r, s, t ∈ Z que transforme una en la otra. Según el teorema 2.6, ha
de ser a1 = a1 + 2s, luego para que la ecuación que obtengamos sea reducida
hemos de tomar necesariamente

a1 ≡ a1 (mód 2), a1 ∈ {0, 1}, s = (a1 − a1 )/2.

Similarmente, ha de ser

a2 ≡ a2 − a1 − s2 (mód 3), a2 ∈ {−1, 0, 1}, r = (a2 − a2 + a1 + s2 )/3,


a3 ≡ a3 + ra1 (mód 2), a3 ∈ {0, 1}, t = (a3 − a3 − ra1 )/2,
a4 = a4 − sa3 + 2ra2 − (t + rs)a1 + 3r − 2st,
2

a6 = a6 + ra4 + r2 a2 + r3 − ta3 − t2 − rta1 .

Esto prueba la existencia de la ecuación. Ahora vamos a probar que toda


ecuación de Weierstrass reducida puede recuperarse a partir de los covariantes
c4 y c6 como indica el enunciado, lo que en particular nos dará la unicidad. Para
adecuarnos a la notación del enunciado, a partir de aquı́ los coeficientes de la
ecuación reducida serán ai en lugar de ai .
7.1. El discriminante mı́nimo 171

Como a1 = a21 , tenemos que

a1 ≡ b2 ≡ b22 ≡ c4 (mód 2),

luego a1 ha de ser el que indica el enunciado. Igualmente,

a2 = b2 − a21 − 3a2 ≡ b2 − a21 = b2 − a1 ≡ b32 − a1 ≡ −c6 − a1 (mód 3),

(b32 − 3c4 b2 − 2c6 )/16 = 27b6 ≡ b6 ≡ a23 ≡ a3 (mód 2),


b22 − 24a1 a3 − c4 −24a1 a3 + 24b4 −a1 a3 + b4
= = = a4 ,
48 48 2
e igualmente se justifica la fórmula para a6 .
Como consecuencia inmediata:

Teorema 7.10 Toda curva elı́ptica E/Q admite una única ecuación de Weiers-
trass minimal reducida.

Demostración: Cuando transformamos una ecuación minimal en una


ecuación reducida según el teorema anterior, la ecuación que obtenemos sigue
siendo minimal, pues el cambio de variables tiene u = 1. Una ecuación minimal
se transforma en otra mediante un cambio de variables entero con u = 1 (por
el teorema 6.2 aplicado a todos los primos). Por consiguiente ambas tienen los
mismos covariantes, luego si ambas son reducidas han de ser la misma.
En definitiva, dada una curva elı́ptica E/Q dada por una ecuación de Weiers-
trass, podemos aplicar un cambio de variables X = u2 X  , Y = u3 Y  para pasar
a una ecuación entera con covariantes c4 y c6 , luego calculamos los covariantes
minimales c4 y c6 según el teorema 7.7 y construimos la ecuación minimal según
el teorema anterior.
Resulta natural preguntarse si puede existir una curva elı́ptica E/K con
DE/K = 1, es decir, una curva con buena reducción módulo todos los primos no
arquimedianos de K. El teorema siguiente muestra que la respuesta es negativa
cuando K = Q:

Teorema 7.11 Sea E/Q una curva elı́ptica dada por una ecuación de Weiers-
trass entera de discriminante ∆ ∈ Z. Entonces ∆ no puede ser de la forma
d3 , donde d es un entero cuyos divisores primos sean todos congruentes con 1
módulo 8. En particular no puede ser ∆ = ±1.

Demostración: En caso contrario ∆ = d3 , con d ≡ ±1 (mód 8). Veamos


que a1 ha de ser impar. En caso contrario v2 (b2 ) ≥ 2, v2 (b4 ) ≥ 1, v2 (c4 ) ≥ 4, y
la relación
c26 = c34 + 1728d3 (7.2)
implica que c6 = 8c, pero entonces c2 ≡ 27d3 ≡ ±3 (mód 8), y esta congruencia
no tiene solución.
172 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Ası́ pues, a1 es impar, luego b2 también y c4 ≡ b22 ≡ 1 (mód 8). Sustituyendo


en (7.2) x = c4 + 12d, y = c6 obtenemos

y 2 = x(x2 − 36dx2 + 432d2 ),

donde x ≡ 5 (mód 8). En particular, x = 0. Ahora observamos que

Q = x2 − 36dx2 + 432d2 = (x − 18d)2 + 108d2 > 0,

luego también x = y 2 /Q > 0. Descompongamos


 
x = 3u pvp q vq ,
p q

donde p recorre los primos que dividen al mcd(x, d) y q los divisores de x distintos
de 3 y que no dividen a d. Claramente vq (Q) = 0, luego vq = vq (y 2 ) es par,
luego q vq ≡ 1 (mód 8). Por hipótesis también p ≡ 1 (mód 8), luego

x ≡ 3u ≡ 1, 3 (mód 8),

cuando tenı́amos que x ≡ 5 (mód 8).

Ejemplo Las curvas siguientes muestran que la restricción sobre los divisores
primos de ∆ es necesaria en el teorema anterior:

Y 2 = X 3 − X, ∆ = 26 ,
2
Y +Y =X , 3
∆ = −33 ,
Y + XY = X − X − 2X − 1, ∆ = −73 .
2 3 2

√ √
Por el contrario, si K = Q( 29 ) y K = (5+ 29)/2 es la unidad fundamental
de K, la curva Y 2 + XY + K2 Y = X 3 cumple ∆ = −K10 , luego tiene buena
reducción módulo todos los primos de K.
Terminaremos la sección justificando la existencia de ecuaciones minimales
en un sentido más débil que no requiere ninguna hipótesis sobre el número de
clases de K. Para ello recordamos previamente algunos resultados sobre cuerpos
numéricos:

Teorema 7.12 Sea K un cuerpo numérico y S un conjunto finito de divisores


primos de K que contenga a todos los primos arquimedianos y sea

KS = {α ∈ K | vP (α) ≥ 0 para todo P ∈


/ S}.

Entonces:
a) KS es la localización del anillo de enteros OK respecto del conjunto mul-
tiplicativo formado por los enteros divisibles a lo sumo entre primos de S,
es decir:

KS = {a/b | a, b ∈ OK , vP (b) = 0 para todo P ∈


/ S}.
7.1. El discriminante mı́nimo 173

b) KS es un dominio de Dedekind (en particular es ı́ntegramente cerrado) y


S puede extenderse a un conjunto finito mayor de modo que KS sea un
dominio de ideales principales.

Demostración: a) Una inclusión es obvia y para probar la contraria usa-


mos que todo ideal de OK elevado al número de clases h es principal. Ası́, si
α ∈ KS , el ideal fraccional (α) admite una descomposición
a
(α) = ,
qh1 · · · qhs

donde qi ∈ S y a es un ideal de K. Ahora bien, los ideales qhi son principales


y a también tiene que serlo. En definitiva, α = a/b, con a, b ∈ OK y b sólo es
divisible entre primos de S.
b) En general, toda localización de un dominio de Dedekind es un dominio
de Dedekind. Además, los ideales de KS son de la forma aS = aKS , donde a es
un ideal de O.
Fijamos un conjunto de representantes a1 , . . . , ah de las clases de ideales de
K, en cada uno de ellos tomamos un elemento αi ∈ ai no nulo y añadimos a S
los primos que lo dividen. Esto hace que αi sea una unidad en KS y que, por
consiguiente, aiS = 1.
Para cada ideal aS de KS existe un i tal que (α)a = (β)ai , para ciertos α,
β ∈ OK , de donde (α)aS = (β), lo que implica que aS es principal.

Teorema 7.13 Sea K un cuerpo numérico y S un conjunto finito de valores


absolutos de K que contenga a todos los primos arquimedianos y a todos los
divisores de 2 y 3. Supongamos además que la localización KS es un dominio de
ideales principales. Entonces toda curva elı́ptica E/K admite una ecuación de
Weierstrass Y 2 = X 3 +AX +B con A, B ∈ KS , tal que, en KS , (DE/K ) = (∆),
donde el discriminante es ∆ = −16(4A3 + 27B 2 ).

Demostración: Tomemos cualquier ecuación de Weierstrass para E/K de


la forma indicada en el enunciado con coeficientes enteros y discriminante ∆.
Para cada primo p ∈/ S podemos conseguir una ecuación minimal mediante un
cambio de la forma

X = u2p X  , Y = u3p Y  , up ∈ K ∗ .

En efecto, con este cambio la ecuación se transforma en

Y 2 = X 3 + u−4 −6
p Ax + up B,

y por 6.4 la ecuación será minimal si vp (u−4 −6


p A) ≥ 0, vp (up B) ≥ 0 y o bien
−4 −6
vp (up A) < 4 o bien vp (up B) < 6. Ası́, basta tomar up de modo que vp (up )
sea el máximo que respete las dos primeras condiciones y necesariamente se
cumplirá una de las dos últimas.
174 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Para los posibles primos no arquimedianos en S el cambio necesario puede


ser más complicado, pero en cualquier caso determina unos números up con los
que podemos formar el ideal
 vp (up )
a∆ = p
p∞

que verifica
DE/K = (∆)/a12
∆.

Si consideramos estos ideales como ideales de KS , entonces los primos de S


se vuelven triviales, con lo que tenemos

DE/K = (∆)/ p12vp (up )
p∈S
/

Como KS es un dominio de ideales principales, existe un u ∈ KS tal que


 vp (up )
p = (u).
p∈S
/

Esto significa que vp (u) = vp (up ) para todo primo p ∈


/ S, luego la ecuación

Y 2 = X 3 + u−4 Ax + u−6 B

tiene sus coeficientes en KS y es minimal para todos los primos p ∈


/ S. Su
discriminante es ∆ = u−12 ∆, luego en KS tenemos

DE/K = (∆)/(u)12 = (∆ ).

7.2 El subgrupo de torsión


Estudiamos ahora los puntos de torsión de una curva elı́ptica E/K, es decir,
del subgrupo de torsión Etor (K) del grupo E(K). El teorema siguiente es una
consecuencia directa de 6.20:

Teorema 7.14 Sea E/K una curva elı́ptica determinada por una ecuación de
Weierstrass entera y sea P ∈ E(K) un punto de orden m ≥ 2.
a) Si m no es potencia de primo, entonces x(P ), y(P ) ∈ O.
b) Si m = pn , para cada divisor primo no arquimediano P de K, sea rP la
parte entera de vP (p)/(pn − pn−1 ). Entonces

vP (x(P )) ≥ −2rP , vP (y(P )) ≥ −3rP .

Para K = Q el teorema anterior implica que los puntos de torsión tienen


coordenadas enteras salvo quizá por un denominador 4 en la x y un denominador
8 en la y (y en tal caso el punto tiene orden 2). Más precisamente:
7.2. El subgrupo de torsión 175

Teorema 7.15 Sea E/Q una curva elı́ptica dada por una ecuación de Weiers-
trass entera. Entonces todo punto de torsión de E(Q) (distinto de O) tiene
coordenadas enteras, salvo quizá un único punto de orden 2 con coordenadas
(a/4, b/8), con a, b ∈ Z impares. Para que pueda existir tal punto es necesario
que a1 sea impar.

Demostración: Si existe un punto P = (x, y) de orden 2, entonces la


tangente a la curva en dicho punto ha de ser vertical, luego la derivada respecto
de Y de la ecuación de Weierstrass se ha de anular. Esto significa que
a1 x + a3
y=− .
2
El teorema anterior afirma que v2 (P ) ≤ 1, donde v2 es la aplicación definida
en 6.17 para la curva E/Q2 definida por la misma ecuación de Weierstrass.
Para que P sea fraccionario es necesario que v2 (P ) = 1, con lo que v2 (x) = −2
y v2 (y) = −3. Entonces

−2 = v2 (2y) = v2 (a1 x + a3 ) ≥ mı́n{v2 (a1 x), v2 (a3 )}.

Como v2 (a3 ) ≥ 0, el mı́nimo se alcanza en v2 (a1 x) = v2 (a1 ) + v2 (x) = −2,


luego v2 (a1 ) = 0 y ası́ a1 es impar.
Si E(K) contiene otro punto de orden 2, de hecho ha de contener a los tres
que hay en E(K), digamos Pi = (xi , yi ), para i = 1, 2, 3. Vamos a probar que
en tal caso sólo uno de ellos es fraccional. Si lo fueran dos de ellos, también lo
serı́a el tercero, pues los puntos con coordenadas no enteras diádicas forman un
subgrupo de E(Q2 ) (el núcleo de la reducción módulo 2). El cambio
a1  a3
Y =Y− X −
2 2
transforma la ecuación en una de tipo b. Los puntos de orden 2 de esta ecuación
se caracterizan por tener la segunda coordenada nula, y han de corresponderse
con los puntos de orden 2 de la ecuación original, luego serán (xi , 0). Esto
implica que x1 , x2 , x3 son las raı́ces del miembro derecho de la ecuación de
Weierstrass de tipo b. En particular
b6 a2
x1 x2 x3 = = a6 + 3 .
4 4
Por una parte, v2 (x1 x2 x3 ) = −6, mientras que por otra v2 (a6 + a23 /4) ≥ −2,
y esta contradicción prueba el teorema.

Ejemplo La curva Y 2 = X 3 + 8 contiene los puntos de coordenadas enteras


(1, ±3) y (2, ±4) que, no obstante, tienen orden infinito, pues, por ejemplo

2(1, 3) = (−14/8, −13/8), 2(2, 4) = (−14/8, 13/8),

y esta curva no puede tener puntos de torsión con coordenadas fraccionarias.


176 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

El teorema siguiente generaliza un resultado obtenido independientemente


por Lutz y Nagell y permite en muchos casos calcular el subgrupo de torsión de
una curva elı́ptica E/Q:

Teorema 7.16 Sea E/Q una curva elı́ptica dada por una ecuación de Weiers-
trass entera, sea P = (x, y) un punto de torsión no nulo y llamemos

y  = y + (a1 x + a3 )/2.

Entonces y  = 0 si y sólo si P tiene orden 2. En caso contrario 2y  ∈ Z y


(2y ) | 4∆. Si además a1 es par entonces (2y  )2 | ∆ y si a3 también es par
 2

entonces y  ∈ Z y 16y 2 | ∆.

Demostración: Observemos que el cambio de variables que transforma la


ecuación de E/Q en una ecuación de tipo b hace corresponder el punto P con
el punto P  = (x, y  ). El punto P tiene orden 2 si y sólo si lo tiene P  , lo que
ciertamente equivale a que y  = 0.
Si P no tiene orden 2, el teorema anterior nos da que x, y ∈ Z, luego
también 2y  = 2y + a1 x + a3 ∈ Z. El punto 2P también es de torsión, luego
sus coordenadas son enteras salvo quizá si tiene orden 2, pero en cualquier caso
4x(2P ) ∈ Z.
Ahora necesitamos algunos cálculos. Recordemos la fórmula de duplicación
del teorema (2.21):

x4 − b4 x2 − 2b6 x − b8
x(2P ) = .
4x3 + b2 x2 + 2b4 x + b6

Observemos que el denominador es (2y  )2 . Por otra parte, una comprobación


rutinaria nos da la siguiente identidad de polinomios:

u(X)(4X 3 + b2 X 2 + 2b4 X + b6 ) − v(X)(X 4 − b4 X 2 − 2b6 X − b8 ) = ∆, (7.3)

donde

u(X) = 12X 3 − b2 X 2 − 10b4 X + b2 b4 − 27b6 ,


v(X) = 48X 2 + 8b2 X + 32b4 − b22 .

Combinando ambas relaciones obtenemos que

(2y  )2 (u(x) − x(2P )v(x)) = ∆.

Multiplicando por 4 ambos miembros, el segundo factor es entero, con lo


que (2y  )2 | 4∆. Si a1 es par entonces x(2P ) ha de ser entero y no hace falta
multiplicar por 4.
Finalmente, si a3 también es par vemos que 4 | b2 , 2 | b4 , 4 | b6 , luego 4 | u(x)
y 4 | v(x), de donde concluimos que 16y 2 | ∆.
7.2. El subgrupo de torsión 177

Ejemplo Consideremos la curva E/Q dada por la ecuación

Y 2 + XY + Y = X 3 , ∆ = −2 · 1.

Si (x, y) es un punto de torsión de orden > 2 entonces (2y  )2 | 2 · 13, con lo


que 2y  = ±1. La ecuación en forma b es
1 1 1
Y 2 = X 3 + X 2 + X + ,
4 2 4
y al hacer Y  = ±1/2 obtenemos
1 1
X 3 + X 2 + X = 0,
4 2
cuya única raı́z entera es x = 0. La relación 2y  = 2y + x + 1 nos da los puntos
(0, 0) y (0, −1).
Por otra parte, si (x, y) fuera un punto de orden 2, la coordenada x cumplirı́a
la ecuación
1 1 1
X 3 + X 2 + X + = 0,
4 2 4
y 4x serı́a una raı́z entera de la ecuación

X 3 + X 2 + 8X + 16 = 0.

Se comprueba que no existen raı́ces enteras, luego E(Q) = {O, (0, 0), (0, −1)}.

Ejemplo Consideremos la curva E/Q dada por la ecuación

Y 2 = X 3 − 43X + 166, ∆ = −219 · 13.

El polinomio de la derecha no tiene raı́ces enteras, por lo que no hay puntos


de orden 2. Si (x, y) es un punto de torsión, se ha de cumplir que y 2 | 215 · 13,
luego y | 128.
Esto nos da un máximo de seis posibles puntos de torsión (además de O):

(3, ±8), (−5, ±16), (11, ±32).

Usando la fórmula de duplicación del teorema 2.21 comprobamos que si


P = (3, 8) entonces

x(P ) = 3, x(2P ) = −5, x(4P ) = 11, x(8P ) = 3,

luego 8P = ±P , lo que implica que P tiene orden 7, 3 o 9. No puede tener


orden 9 porque a lo sumo hay 7 puntos de torsión y si tuviera orden 3 serı́a
x(2P ) = x(−P ) = 3, luego P tiene orden 7 y concluimos que Etor (Q) es un
grupo cı́clico de orden 7.
Del teorema anterior se sigue que si E/Q es una curva elı́ptica, entonces
Etor (Q) es un grupo finito. En realidad esto es también una consecuencia sencilla
del teorema 6.19. A continuación damos una versión más cómoda en la práctica:
178 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Teorema 7.17 Sea E/Q una curva elı́ptica dada por una ecuación de Weiers-
trass entera y sea S el conjunto de los primos con buena reducción. Entonces
el orden de Etor (Q) divide a

mcd(Kp |Ẽ(Z/pZ)|),
p∈S

donde Kp = 1 salvo si p = 2 y E(Q) tiene un punto fraccional de orden 2, en


cuyo caso K2 = 2.

Demostración: Consideramos la curva E/Qp definida por la misma ecua-


ción. El núcleo de la reducción módulo p es E1 (Qp ), que está formado por los
puntos de coordenadas no enteras p-ádicas. Como los puntos de torsión tienen
coordenadas enteras (racionales), vemos que la reducción módulo p es inyectiva
en Etor (Q), salvo si p = 2 y hay un punto fraccionario de orden 2, en cuyo caso
el núcleo de la reducción tiene orden 2 y |Etor (Q)| divide a 2|Ẽ(Z/2Z)|.
La tabla siguiente contiene 15 ejemplos de curvas elı́pticas sobre Q con la
estructura de su grupo de torsión. Un notable teorema debido a Mazur asegura
que el grupo de torsión de una curva elı́ptica sobre Q ha de ser necesariamente
uno de los 15 grupos que aparecen en la tabla.

Ecuación ∆ Etor (Q) Generadores


Y2 = X3 − 2 −26 · 33 1 O
Y2 = X3 + 8 −210 · 33 C2 (−2, 0)
Y2 = X3 + 4 −28 · 33 C3 (0, 2)
Y2 = X 3 + 4X −212 C4 (2, 4)
Y2 − Y = X3 − X2 −11 C5 (0, 0)
Y2 = X3 + 1 −24 · 33 C6 (2, 3)
Y2 = X 3 − 43X + 166 −219 · 13 C7 (3, 8)
Y2 + 7XY = X 3 + 16X 28 · 34 · 17 C8 (−2, 4)
Y2 + XY + Y = X 3 − X 2 − 14X + 29 −29 · 35 C9 (3, 1)
Y2 + XY = X 3 − 45X + 81 210 · 35 · 11 C10 (0, 9)
Y2 + 43XY − 210Y = X 3 − 210X 2 212 · 36 · 53 · 74 · 13 C12 (0, 0)
Y2 = X 3 − 4X −212 C2 ⊕ C2 (0, 0), (0, 2)
Y2 = X 3 + 2X 2 − 3X 28 · 3 2 C2 ⊕ C4 (−3, 0), (−1, 2)
Y2 + 5XY − 6Y = X 3 − 3X 2 22 · 36 · 5 2 C2 ⊕ C6 (2, −2), (0, 0)
Y2 + 17XY − 120Y = X 3 − 60X 2 28 · 38 · 54 · 7 2 C2 ⊕ C8 (−40, 400), (0, 0)

Ejemplo Veamos cómo se calcula el grupo de torsión de la última curva de la


tabla. Es claro que (0, 0) está en la curva, y aplicando la fórmula de duplicación
se observa que su orden es exactamente 8. Ası́ tenemos ya un subgrupo C8 de
Etor (Q). Por otro lado, resolviendo el sistema de ecuaciones F (X, Y ) = 0 y
FY (X, Y ) = 0 encontramos todos los puntos de orden 2, que son (24, −144),
(−40, 400) y (15/4, 225/8). El primero es 4 · (0, 0), mientras que con el segundo
obtenemos un nuevo subgrupo C2 , con lo que en total tenemos un subgrupo
C2 ⊕ C8 . Ahora hemos de probar que no hay más elementos de torsión.
Como E tiene buena reducción módulo 11, sabemos que E(Q) se sumerge en
Ẽ(Z/11Z). Ahora bien, el número de puntos de esta reducción es a lo sumo 23
(cada valor de x da a lo sumo dos valores posibles para y, luego hay a lo sumo
22 puntos finitos). Por otra parte, dicho número ha de ser múltiplo de 16, luego
|Ẽ(Z/11Z)| = 16 y también |Etor (Q)| = 16.
7.2. El subgrupo de torsión 179

Finalmente vamos a determinar los grupos de torsión sobre Q de dos familias


de curvas elı́pticas especialmente simples, las de la forma Y 2 = X 3 + AX y las
de la forma Y 2 = X 3 + B.
Observemos que para estudiar la torsión de Y 2 = X 3 +AX podemos suponer
que A está libre de potencias cuartas, pues si A = m4 A , el cambio X = m2 X,
Y = m3 Y  transforma la curva en Y 2 = X 3 + AX y la estructura del grupo de
torsión no varı́a.

Teorema 7.18 Sea E/Q la curva dada por Y 2 = X 3 + AX, con A ∈ Z (de
modo que ∆ = −26 A3 y j = 1728). Supongamos que A está libre de potencias
cuartas. Entonces

C2 ⊕ C2 si −A es un cuadrado,
Etor (Q) ∼
= C4 si A = 4,
C2 en otro caso.

Demostración: Sea p ≡ −1 (mód 4) un primo que no divida a ∆. (Existe


por el teorema de Dirichlet sobre primos en progresiones aritméticas.) Por el
teorema 7.17 tenemos que |Etor (Q)| divide a |Ẽ(Z/pZ)| = p + 1, donde hemos
usado el teorema 4.9, según el cual la reducción módulo p es supersingular.
Si en particular tomamos p ≡ 3 (mód 8) vemos que 8
|Etor (Q)|, pues en
caso contrario tendrı́amos que 8 | p + 1.
Si elegimos p ≡ 7 (mód 12) vemos que 3
|Etor (Q)|.
Si q > 3 es primo, podemos tomar p ≡ 3 (mód 4q), de donde se sigue que
q
|Etor (Q)|, ya que en caso contrario q | p + 1 ≡ 4 (mód q) y q | 4.
Con esto podemos concluir que |Etor (Q)| | 4.
En cualquier caso, E(Q) tiene un punto de orden 2, a saber, (0, 0). Tendrá
tres puntos de orden 2 si y sólo si X 3 + AX se escinde en Q[X], es decir, si y
sólo si −A es un cuadrado.
Sólo falta ver que E(Q) tiene un punto de orden 4 si y sólo si A = 4. Cier-
tamente, para A = 4 está el punto (2, 4). En general, la fórmula de duplicación
nos da que si existe un punto (x, y) que cumple 2(x, y) = (0, 0), entonces

x4 − 2Ax2 + A2 = (x2 − A)2 = 0.

Ası́ pues, ha de ser x2 = A y, como A no tiene potencias cuartas, x ha de


ser libre de cuadrados. Ahora bien, x cumple la ecuación

y 2 = x3 + Ax = 2x3 .

De aquı́ se sigue que x no puede ser divisible entre primos impares, y la única
posibilidad resulta ser x = 2, luego A = 4.
Para estudiar la torsión de Y 2 = X 3 + B podemos suponer que B está libre
de potencias sextas.

Teorema 7.19 Sea E/Q la curva dada por Y 2 = X 3 + B, con B ∈ Z (de modo
que ∆ = −24 · 33 · B 2 , j = 0). Supongamos que B está libre de potencias sextas.
180 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

Entonces

 C si B = 1,
 6
C3 si B = −24 · 33 o B es un cuadrado B = 1,
Etor (E) ∼
=

 C2 si B es un cubo, B = 1,
0 en otro caso.

Demostración: Si p ≡ −1 (mód 3) es un primo que no divide a ∆, entonces


los teoremas 7.17 y 4.9 nos dan que |Etor (Q)| divide a | p + 1.
Si tomamos p ≡ 5 (mód 12) vemos que 4 no puede dividir a |Etor (Q)|. Si
p ≡ 2 (mód 9) vemos que 9 tampoco divide a |Etor (Q)|. Por último, para todo
primo q > 3, podemos tomar p ≡ 2 (mód 3q) y concluir que q no divide a
|Etor (Q)|.
En definitiva, tenemos que |Etor (Q)| | 6. Claramente E/Q tiene un punto
de orden 2 si y sólo si X 3 + B tiene una raı́z en Q, si y sólo si B es un cubo. La
cuestión es cuándo existe un punto de orden 3. Un punto P tiene orden 3 si y
sólo si 2P = −P , si y sólo si x(2P ) = x(P ), pues esta última condición implica
2P = ±P , pero 2P = P sólo lo cumple P = O. La fórmula de duplicación nos
da
x4 − 8Bx
= x.
4(x3 + B)

Equivalentemente, x4 = −4Bx. Una solución es x = 0, y = B 2 . Ası́ pues, si


B es un cuadrado hay un elemento de orden 3. La otra posibilidad es x3 = −4B,
con lo que y 2 = −3B. En particular B < 0. Como B es libre de potencias sextas,
sólo puede ser divisible entre los primos 2 y 3. Más concretamente, ha de ser
B = −24 · 33 . En resumen, E/Q tiene un punto de orden 3 si y sólo si B es un
cuadrado o B = −24 · 33 . A partir de aquı́ el teorema es inmediato.

Observemos que la curva Y 2 = X 3 −24 ·33 = X 3 −432 que aparece como caso
excepcional en el teorema anterior es precisamente la curva que consideramos
en el capı́tulo II en relación con el último teorema de Fermat para exponente 3.
Es fácil ver que sus puntos de torsión son precisamente los puntos (12, ±36) y
O que allı́ llamábamos soluciones triviales.

7.3 El teorema débil de Mordell-Weil


Esta sección está dedicada a demostrar el teorema siguiente:

Teorema 7.20 (Teorema débil de Mordell-Weil) Si K es un cuerpo nu-


mérico, E/K es una curva elı́ptica y m ≥ 2 es un número natural, entonces el
grupo E(K)/mE(K) es finito.

Se trata de un paso intermedio para demostrar uno de los resultados básicos


sobre la aritmética de las curvas elı́pticas sobre cuerpos numéricos: que el grupo
de puntos racionales es finitamente generado.
7.3. El teorema débil de Mordell-Weil 181

Cohomologı́a continua Necesitaremos algunos resultados sobre cohomologı́a


de grupos. Llamaremos A a la clausura algebraica de Q. El grupo de Galois
G(A/K) es un grupo topológico con la topologı́a de Krull, respecto a la cual
una base de entornos del neutro la forman los subgrupos (normales) de ı́ndice
finito.
Sea M un grupo abeliano sobre el que G(A/K) actúa de forma continua
cuando en M consideramos la topologı́a discreta, es decir, de modo que la acción

M × G(A/K) −→ M

sea una aplicación continua. Esto equivale a que las aplicaciones σ → mσ sean
continuas en G(A/K) para cada m ∈ M prefijado. En particular la antiimagen
de {m} ha de ser abierta, lo cual significa que existe una extensión finita normal
L de K tal que G(A/L) fija a m. Ası́ pues, si llamamos

M L = {m ∈ M | mσ = m para todo σ ∈ G(A/L)},

tenemos que M es la unión de los submódulos M L . Recı́procamente, esta pro-


piedad implica la continuidad de la acción, pues cada aplicación σ → mσ es
constante en un entorno G(A/L)σ de cada automorfismo σ.
Vamos a considerar los grupos de cohomologı́a de orden 0 y 1 de G(A/K)
sobre M . Recordemos que el grupo de cohomologı́a de orden 0 es simplemente
H 0 (A/K, M ) = M K . El grupo H 1 (A/K, M ) es el cociente del grupo de cociclos,
es decir, aplicaciones a : G(A/K) −→ M tales que

aστ = aτσ + aτ ,

sobre el grupo de cofronteras, aplicaciones de la forma ∂m para m ∈ M dadas


por (∂m)σ = mσ − m.
La continuidad de la acción de G(A/K) sobre M implica claramente que
todas las cofronteras son continuas. Sin embargo, dentro del grupo de coci-
clos podemos considerar el subgrupo formado por los cociclos continuos, cuyo
cociente sobre las cofronteras determina lo que llamaremos el grupo de cohomo-
logı́a continua Hc1 (A/K, M ) ≤ H 1 (A/K, M ).
La ecuación de los cociclos implica que a1 = 0, y si es continuo existe una
extensión finita normal L de K tal que a toma el valor 0 sobre G(A/L), luego a
es constante sobre cada clase G(A/L)σ. En particular, a toma un número finito
de valores, luego eligiendo L suficientemente grande podemos exigir que todos
ellos estén en M L , con lo que aσ = ãσ|L , para un cierto cociclo de G(L/K) sobre
M L . Recı́procamente, todo cociclo de esta forma es continuo, pues es constante
sobre cada clase G(A/L)σ.
Para cada extensión finita normal L de K podemos considerar la inflación

InfL : H 1 (L/K, M L ) −→ H 1 (A/K, M )

dada por InfL ([ã]) = [a], donde aσ = ãσ|L .


182 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

En estos términos, hemos probado que Hc1 (A/K, M ) es la unión de las


imágenes de todas las inflaciones InfL . Es conocido que las inflaciones

InfL /L : H 1 (L/K, M L ) −→ H 1 (L /K, M L )
son inyectivas, luego las inflaciones InfL también lo son. Si las identificamos con
inclusiones, podemos considerar que Hc1 (A/K, M ) es la unión de los subgrupos
H 1 (L/K, M ) (más precisamente, es su lı́mite inductivo).
Si L es una extensión finita normal de K, también podemos considerar la
restricción ResL : H 1 (A/K, M ) −→ H 1 (A/L, M ) definida restringiendo los co-
ciclos de G(A/K) a G(A/L). Claramente se restringe a un homomorfismo
ResL : Hc1 (A/K, M ) −→ Hc1 (A/L, M )
que conmuta con las restricciones

ResL /L : H 1 (L /K, M L ) −→ H 1 (L /L, M L ).
La exactitud de las sucesiones
Inf Res
1 −→ H 1 (L/K, M L ) −→ H 1 (L /K, M ) −→ H 1 (L /L, M ).
implica inmediatamente la de la sucesión
Inf Res
1 −→ H 1 (L/K, M L ) −→ Hc1 (A/K, M ) −→ Hc1 (A/L, M ).
Por último, sabemos que toda sucesión exacta de G(A/K)-módulos
f g
0 −→ S −→ M −→ N −→ 0
induce una sucesión exacta
0 −→ H 0 (A/K, S) −→ H 0 (A/K, M ) −→ H 0 (A/K, N )
δ
−→ H 1 (A/K, S) −→ H 1 (A/K, M ) −→ H 1 (A/K, N ).
Vamos a ver que todos los homomorfismos se restringen a una sucesión exacta
0 −→ H 0 (A/K, S) −→ H 0 (A/K, M ) −→ H 0 (A/K, N )
δ
−→ Hc1 (A/K, S) −→ Hc1 (A/K, M ) −→ Hc1 (A/K, N ).
De hecho sólo hay que probar que la imagen de δ está en Hc1 (A/K, S), pues f
y g son trivialmente continuas, luego transforman cociclos continuos en cociclos
continuos (y la exactitud de la sucesión restringida es trivial).
Si n ∈ N K = H 0 (A/K, N ), tomamos m ∈ M tal que g(m) = n y entonces
δ(n) = [aσ ] está determinado por que f (aσ ) = ∂mσ = mσ −m. Es claro entonces
que si m ∈ M L se cumple también que δ(n) ∈ H 1 (L/K, M L ), pues si σ|L = τ |L
entonces f (aσ ) = f (aτ ) y aσ = aτ . Ası́ pues, δ(n) ∈ Hc1 (A/K, M ).
A partir de aquı́ trabajaremos únicamente con los grupos de cohomologı́a
continua, por lo que suprimiremos el subı́ndice c.
7.3. El teorema débil de Mordell-Weil 183

El producto de Kummer Sea E/K una curva elı́ptica, m ≥ 2 y considere-


mos la sucesión exacta
m
0 −→ E[m] −→ E(A) −→ E(A) −→ 0

Sabemos que G(A/K) actúa sobre E(A), y la acción es continua, pues para
todo P ∈ E(A) podemos tomar una extensión finita L de K tal que las coorde-
nadas de P estén en L, y entonces G(A/L) fija a P . Por consiguiente podemos
formar la sucesión exacta de cohomologı́a
m
0 −→ E(K)[m] −→ E(K) −→ E(K)

δ m
−→ H 1 (A/K, E[m]) −→ H 1 (A/K, E(A)) −→ H 1 (A/K, E(A)).

De aquı́ podemos extraer la llamada sucesión exacta de Kummer para E/K:


δ
0 −→ E(K)/mE(K) −→ H 1 (A/K, E[m]) −→ H 1 (A/K, E(A))[m] −→ 0,

donde el último módulo es el conjunto de los elementos de H 1 (A/K, E(A)) de


orden divisor de m.
Nuestro objetivo es demostrar que el grupo E(K)/mE(K) es finito. Tome-
mos una extensión finita normal L de K tal que E[m] ⊂ E(L) y llamemos F al
núcleo de la aplicación natural

E(K)/mE(K) −→ E(L)/mE(L).

Si demostramos que F es finito, bastará probar que E(L)/mE(L) es también


finito o, equivalentemente, podremos suponer que E[m] ⊂ E(K). Consideramos
el diagrama conmutativo con filas exactas

0 F  E(K)/mE(K)  E(L)/mE(L)

δ δ
  
0  H 1 (L/K, E[m]) inf  H 1 (A/K, E[m]) res  H 1 (A/L, E[m])

Notemos que el segundo cuadrado es claramente conmutativo, lo que implica


que δ hace corresponder el núcleo de la fila superior con el de la fila inferior,
es decir, se restringe a un homomorfismo de F en H 1 (L/K, E[m]). Como los
grupos G(L/K) y E[m] son finitos, concluimos que H 1 (L/K, E[m]) también lo
es, al igual que F .
En lo que sigue supondremos que E[m] ⊂ E(K). Esto significa que G(A/K)
actúa trivialmente sobre E[m], luego las cofronteras son nulas y los cociclos son
homomorfismos de grupos. En definitiva,

H 1 (A/K, E[m]) = Hom(G(A/K), E[m]),


184 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

y tenemos una inclusión

δ : E(K)/mE(K) −→ Hom(G(A/K), E[m]).

Definimos el producto de Kummer

κ : E(K) × G(A/K) −→ E[m]

mediante κ(P, σ) = δ([P ])(σ). Claramente κ es una aplicación bilineal cuyo


núcleo izquierdo es mE(K). Vamos a calcular su núcleo derecho. Para ello
observamos que κ(P, σ) = Qσ − Q, donde Q ∈ E(A) es cualquier punto que
cumpla mQ = P . (Esto se sigue de la definición de los homomorfismos de
conexión.)

Ahora es fácil ver que el núcleo derecho de κ es G(A/L), donde L es la


adjunción a K de las coordenadas de todos los puntos Q ∈ E(A) tales que
mQ ∈ E(K). En efecto, si σ ∈ G(A/K) cumple que κ(P, σ) = 0 para todo
P ∈ E(K), entonces, para todo Q ∈ E(A) tal que mQ ∈ E(K) tenemos que

0 = κ(mQ, σ) = Qσ − Q,

luego σ ∈ G(A/L). La otra inclusión es análoga.

Observemos que L es una extensión normal de K (no sabemos si finita), pues


σ[L] = L para todo σ ∈ G(A/K). Esto nos permite concluir que el producto de
Kummer induce una forma bilineal regular

κ : E(K)/mE(K) × G(L/K) −→ E[m].

Si probamos que la extensión L/K es finita, podremos concluir que el grupo


E(K)/mE(K) también lo es.

La extensión L/K Lo primero que podemos decir de la extensión L/K es que


es abeliana de exponente m (es decir, todos los elementos de G(L/K) tienen
orden divisor de m). En efecto, basta tener en cuenta que el producto de
Kummer induce un monomorfismo de grupos

G(L/K) −→ Hom(E(K), E[m]).

Llamemos S al conjunto (finito) de los divisores primos p de K que cumplan


alguna de las condiciones siguientes:

a) E tiene mala reducción en p,

b) vp (m) = 0,

c) p es arquimediano.
7.3. El teorema débil de Mordell-Weil 185

Vamos a demostrar que si p ∈ / S, entonces la extensión L/K es no ramificada


en p, es decir, que p no se ramifica en ninguna extensión finita intermedia K  .
Como el producto de extensiones no ramificadas es no ramificada, no perde-
mos generalidad si suponemos que K  es la adjunción a K de las coordenadas
de un punto Q ∈ E(A) tal que P = mQ ∈ E(K).
Sea P un divisor de p en K  . Hemos de probar que la extensión KP 
/Kp es
no ramificada. El ı́ndice de ramificación de la extensión es el orden del grupo de

inercia de P (el grupo de los Kp -automorfismos de KP que inducen la identidad

sobre el cuerpo de restos kP ), luego basta ver que este grupo es trivial.

Como E/Kp tiene buena reducción en p, tenemos que E/KP tiene buena
reducción en P (podemos tomar la misma ecuación de Weierstrass), luego pode-
mos considerar la reducción E(K  ) −→ E(kP 
). Por otra parte, como vp (m) = 0
y E tiene buena reducción módulo p, el teorema 6.19 nos da que la reducción
E(K)[m] −→ E(kp ) es inyectiva.
Tomemos σ en el grupo de inercia. Esto significa que Q̃σ = Q̃, luego la

reducción de Qσ − Q en kP es nula.
Pero m(Q −Q) = (mQ)σ −mQ = P σ −P = 0, pues P ∈ E(K). Concluimos
σ

que Qσ − Q ∈ E[m] ⊂ E(K), luego Qσ − Q ∈ E(K)[m] y tiene reducción nula



en E(kP ), luego también en E(kp ). Por la inyectividad de la reducción tenemos
que Q − Q = 0.
σ

Acabamos de probar que el grupo de inercia deja fijo a Q, luego deja fijas

a sus coordenadas y, por consiguiente, a todo KP . En suma, dicho grupo de
inercia es trivial.

Extensiones de Kummer El teorema débil de Mordell-Weil quedará pro-


bado si demostramos que toda extensión abeliana de exponente m de K no
ramificada fuera de un conjunto finito S de primos de K que contenga al menos
a los primos no arquimedianos es finita. (Pues la extensión L/K cumple estas
propiedades.)
En primer lugar observamos que si el resultado es cierto para una extensión
finita K  de K, entonces también es cierto para K, pues si L es una extensión
abeliana de K de exponente m no ramificada fuera de un conjunto finito S
de primos, entonces LK  /K  es una extensión abeliana de exponente m de K 
no ramificada fuera del conjunto S  formado por los divisores de los primos de
S en K  . Ası́ pues, LK  /K  es finita, LK  /K también y L/K también. Por
consiguiente podemos extender el cuerpo K y suponer que contiene las raı́ces
m-simas de la unidad.
En segundo lugar, tampoco perdemos generalidad si extendemos el conjunto
de primos S. Podemos hacerlo de tal modo que vp (m) = 0 para todo primo p ∈ /
S. Por último, el teorema 7.12 nos permite suponer además que la localización
KS es un dominio de ideales principales.
El grupo de unidades de KS es

US = {α ∈ K | vp (α) = 0 para todo p ∈


/ S}.
186 Capı́tulo 7. Curvas elı́pticas sobre cuerpos numéricos

El teorema de las unidades de Hasse afirma que US es un Z-módulo finita-


mente generado.
Si un cuerpo K tiene caracterı́stica 0 y contiene a la raı́ces m-simas de la
unidad, las extensiones abelianas de K de exponente m se llaman extensiones
de Kummer de K y se obtienen adjuntando
√ a K raı́ces m-simas de elementos
de K ∗ . Además, una extensión K( m a) es no ramificada en un primo p que no
divida a m si y sólo si a = bm u, donde b, u ∈ K ∗ , vp (u) = 0.

Equivalentemente, K( m a)/K es no ramificada en un primo p ∈ / S si y sólo
si m | vp (a). En efecto, una implicación es obvia y si vp (a) = mr, tomamos
π ∈ K tal que vp (π) = 1, b = π r , u = a/bm . Ası́ a = bm u tiene la forma
requerida para que la extensión sea no ramificada.
Teniendo en cuenta que si dos elementos de K ∗ se diferencian en un factor
de K ∗m sus raı́ces m-simas determinan la misma extensión, el teorema quedará
demostrado si probamos la finitud del grupo
!  "
K(S, m) = [α] ∈ K ∗ /K ∗m  m | vp (α) para todo p ∈ /S .

Veamos que la aplicación natural US −→ K(S, m) es suprayectiva. En efecto,


si [α] ∈ K(S, m), entonces el ideal fraccional (α) en KS es una potencia m-
sima. Como KS es un dominio de ideales principales, existe β ∈ K ∗