Il 0% ha trovato utile questo documento (0 voti)
18 visualizzazioni81 pagine

Zannie R

Il documento presenta una serie di problemi di teoria dei numeri, con esempi di risoluzione di equazioni diofantee come x² + y² = z² e x⁴ + y⁴ = z². Viene discusso anche il problema di Fermat nell'anello dei polinomi e la teoria di Galois, introducendo concetti chiave come estensioni di corpi e polinomi algebrici. Infine, si conclude con la dimostrazione che le uniche soluzioni intere di alcune equazioni specifiche sono limitate a casi particolari.

Caricato da

Angelo Oppio
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
18 visualizzazioni81 pagine

Zannie R

Il documento presenta una serie di problemi di teoria dei numeri, con esempi di risoluzione di equazioni diofantee come x² + y² = z² e x⁴ + y⁴ = z². Viene discusso anche il problema di Fermat nell'anello dei polinomi e la teoria di Galois, introducendo concetti chiave come estensioni di corpi e polinomi algebrici. Infine, si conclude con la dimostrazione che le uniche soluzioni intere di alcune equazioni specifiche sono limitate a casi particolari.

Caricato da

Angelo Oppio
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd

UMBERTO ZANNIER

Corso di Teoria dei Numeri


Anno Accademico 1996/97
Note raccolte da Maurizio Candilera

Dipartimento di Matematica Pura e Applicata - Via Belzoni, 7 - 35100 PADOVA


I
Interi algebrici

1. Esempi introduttivi
In questa sezione vogliamo dare alcuni esempi di risoluzione con metodi elementari di alcuni problemi
diofantei .
1.1 Problema 1. Cominciamo occupandoci del classico problema di costruzione dei numeri pitagorici,
ovvero di determinare le soluzioni intere dell’equazione x2 + y 2 = z 2 .

Si verifica direttamente che ciò è equivalente a


determinare le soluzioni razionali dell’equazione
x2 + y 2 = 1 e tale problema può essere facilmente
risolto per ‘via geometrica’ osservando che la cir-
Xt conferenza è una curva razionale, ovvero le coor-
dinate di tutti i suoi punti, eccetto un numero
finito, possono essere espresse come valori di fun-
zioni razionali in Q(t). Infatti, fissato il punto
P = (0, −1), vi è corrispondenza biunivoca tra
i punti della circonferenza (ad eccezione di P )
e le rette per P (ad eccezione della tangente al
circolo) e tale corrispondenza
 associa alla retta
2t 
P x = t(y + 1) il punto Xt = 1+t2
.
1−t2
1+t2

Passando a coordinate omogenee e ritornando al problema iniziale, si ottiene che i numeri pitagorici
sono tutti della forma 
 x = 2abc

y = (b2 − a2 )c al variare di (a, b, c) ∈ Z3 . (1.2)

z = (b2 + a2 )c

Era possibile un approccio allo stesso problema un po’ meno geometrico, ma basato su argomenti
di fattorizzazione in Z. Cerchiamo quindi soluzioni intere dell’equazione x2 + y 2 = z 2 e soggette alla
condizione Mcd(x, y, z) = 1, che non è restrittiva, trattandosi di un’equazione omogenea. Se (x, y, z) è una
tale soluzione, si osserva facilmente che x ed y non possono essere né entrambo pari, né entrambo dispari;
infatti, nel primo caso si avrebbe che anche z dovrebbe essere pari, contro l’ipotesi Mcd(x, y, z) = 1, mentre
nel secondo caso, si avrebbe x2 + y 2 ≡ 2 (mod 4), contro l’ipotesi che questa somma sia un quadrato.
2
Supponiamo allora che x = 2x′ sia pari e quindi che y e z siano dispari e scriviamo x′ = z+y 2
z−y
2 , ove si
osserva che, essendo Mcd(x, y, z) = 1, i due fattori sono coprimi e quindi ciascuno dei fattori deve essere
un quadrato in Z. Si ottiene quindi
z − y = 2a2


z + y = 2b2
da cui si deducono facilmente le formule (I.1.2).
1.3 Problema 2. Ora vogliamo mostrare che non esistono soluzioni intere non-triviali (cioè con xyz 6= 0)
dell’equazione x4 + y 4 = z 4 ; più precisamente, faremo vedere che non esistono soluzioni intere non-triviali

1
2 Interi algebrici I §.1

(cioè con xyz 6= 0) dell’equazione x4 + y 4 = z 2 , soggette alla condizione Mcd(x, y, z) = 1.(∗) Supponiamo
che (x, y, z) sia una soluzione non-triviale di tale equazione. Da quanto visto per i numeri pitagorici,
possiamo dedurre  2
x = 2ab
y 2 = b 2 − a2
ove a e b sono interi non nulli che non possono essere né entrambo pari, né entrambo dispari. Possiamo
quindi scrivere  ′
′ x = rb
a = 2r, x = 2x , ,
y 2 = b2 − 4r2
ove b ed r sono coprimi ed il loro prodotto è un quadrato. Se ne deduce

r = s2 , b = c2 , e b2 = y 2 + 4r2 ,

e questa è ancora un’equazione pitagorica, per cui, da (I.1.2) si ottiene



 2r = 2tu

y = t2 − u 2 ,

b = t2 + u 2

ove t ed u sono ancora coprimi ed il loro prodotto è un quadrato, per cui si ha

t = v2 , u = w2 , con c2 = v 4 + w 4 .

Dunque, se (x, y, z) è una soluzione non-triviale dell’equazione x4 + y 4 = z 2 , abbiamo costruito una


soluzione non-triviale (v, w, c) della stessa equazione con |c| < |z|, essendo z = a2 +b2 e c2 = b. Utilizzando
lo stesso procedimento con la nuova soluzione (v, w, c) ed alle soluzioni cosı̀ costruite da quest’ultima, si
otterrebbe una successione di numeri interi diversi da zero e di valore assoluto strettamente decrescente,
che non può chiaramente esistere.
1.4 Problema 3. Vogliamo mostrare ora che le sole soluzioni intere dell’equazione y 2 = x3 − 2 sono
{(3, −5), (3, 5)}. Possiamo usare un approccio simile a quello usato nei casi precedenti, scrivendo
√ √
x3 = y 2 + 2 = (y + −2)(y − −2)

ed utilizzando degli argomenti di fattorizzazione unica nell’anello Z[ −2] che, come vedremo nel seguito,

è un anello a fattorizzazione unica. Cominciamo
√ osservando
√ che gli unici elementi invertibili di Z[ −2]
sono 1 e −1. Infatti, dall’uguaglianza (a + b −2)(c + d −2) = 1, si ottengono le condizioni

ad + bc = 0

.
ac − 2bd = 1

Allora, a | bc in base alla prima condizione ed Mcd(a, b) = 1 per la seconda delle due; da ciò si deduce che
a | c ed allo stesso modo d | ad ed Mcd(c, d) = 1, da cui si deduce che c | a e quindi a = ±c. Ragionando
analogamente, si vede che b = ±d e si verifica che deve aversi

a=c

b = −d

 2
a + 2b2 = 1

(∗)
Si osservi che, ponendo u = x
y
e v = yz2 , si vede che i punti cercati sono in corrispondenza biunivoca con i punti
2 4
razionali della curva v = u + 1, che non è una curva razionale e quindi i ragionamenti geometrici fatti per i numeri
pitagorici sono inapplicabili al caso presente.
I §.2 Richiami di Teoria di Galois. 3

e ciò può accadere√solo se a = ±1 e b = 0. Con analoghe considerazioni, si può dimostrare che −2
è irriducibile
√ in√Z[ −2]. Lasciamo questo compito al lettore e torniamo all’equazione x3 = y 2 + 2 =
(y + −2)(y − −2). Osserviamo
√ che i due fattori a destra devono essere coprimi; infatti, se vi fosse un
fattore irriducibile α ∈ Z[ −2] in comune, ovvero

y+ −2 = αq1

√ ,
y − −2 = αq2

prendendo la differenza tra le due uguaglianze, si ottiene che α deve dividere −2, che è irriducibile.
Quindi, sommando le due uguaglianze e ricordando che y ∈ Z, si ottiene che 2 | y, e quindi, ricordando
che x3 = y 2 + 2, si ottiene che x è pari e x3 ≡ 2 (mod 4), che è assurdo.
Dunque, se i due fattori sono coprimi ed il loro prodotto è un cubo, devono essere entrambo dei cubi
e deve quindi aversi
√ √ √ √
y+ −2 = (a + b −2)3 e y− −2 = (c + d −2)3 , con a, b, c, d ∈ Z. (1.5)

Considerando il coefficiente di −2, dalla prima uguaglianza si ottiene la condizione b(3a2 − 2b2 ) = 1, che
si ha solo se a = ±1 e b = 1 che applicate a (I.1.5), permettono di dedurre che gli unici valori possibili.
per x ed y sono quelli indicati sopra.
1.6 Problema 4. Vogliamo concludere questo numero considerando il problema di Fermat nell’anello
dei polinomi C[t]. Trattandosi di un anello euclideo, e quindi a fattorizzazione unica, si potranno usare
anche in questo caso degli argomenti di divisibilità. Precisamente, vogliamo mostrare il seguente
Teorema. Sia n un intero maggiore di 2. Gli unici polinomi X, Y, Z ∈ C[t] soddisfacenti alle condizioni
 n n n
 X +Y =Z

XY Z 6= 0

Mcd(X, Y, Z) = 1

sono costanti.

dim. Possiamo quindi scrivere Y


Xn = (Z − ξY ),
ξ n =1

ove i fattori di questo prodotto sono a due a due coprimi. Allora, ognuno dei fattori è una potenza n-esima
in C[t] e quindi, al variare di ξ tra le radici n-esime di 1, si ha Z − ξY = Uξn , per un opportuno Uξ ∈ C[t].
Prese quindi tre radici distinte ξ, η, ζ, si ottengono le relazioni
 n
 Z − ξY − Uξ = 0 Uξn
 
 1 −ξ
Z − ηY − Uηn = 0 e quindi det  1 −η Uηn  = 0,
1 −ζ Uζn

Z − ζY − Uζn = 0

e ciò produce una relazione lineare a coefficienti costanti tra Uξn , Uηn ed Uζn . Poichè tutte le costanti in
C sono potenze n-esime, esistono delle costanti a, b, c tali che i polinomi aUξn , bUηn e cUζn siano di nuovo
soluzioni del problema posto nell’enunciato, con grado positivo e strettamente più piccolo del grado delle
soluzioni di partenza, se queste avevano grado positivo. Iterando il procedimento, si ottiene un assurdo
come nel caso del Problema 2. . CVD 

Questo conclude la discussione del problema di Fermat nell’anello dei polinomi e la serie di esempi
introduttivi.
4 Interi algebrici I §.2

2. Richiami di Teoria di Galois.


In questa sezione, raccogliamo alcuni richiami di teoria dei corpi, al solo scopo di fissare le notazioni
che saranno utilizzate nel seguito e senza alcuna pretesa di dare una trattazione dell’argomento.
Siano K ⊂ L due corpi –che supporremo sempre commutativi– allora L è uno spazio vettoriale su
K. In tal caso, diremo che L è un’estensione di K e chiameremo grado dell’estensione la dimensione del
K-spazio vettoriale L. Scriveremo [L : K] per indicare il grado dell’estensione.
Se K ⊂ L e K ⊂ L′ sono due estensioni di K, un omomorfismo φ : L → L′ è un K-omomorfismo
se induce l’identità sugli elementi di K; ovvero, indicate con j : K → L e j ′ : K → L′ le inclusioni, se il
diagramma
φ
L - L′
6 
.
j ′
j

K
è commutativo.
Se K ⊂ L ⊂ M sono estensioni di grado finito, vale l’uguaglianza

(2.1) [M : K] = [M : L][L : K] [Regola dei gradi],

che si può dimostrare osservando che se {l1 , . . . , lr } è una base di L su K ed {m1 , . . . , ms } è una base di
M su L, allora { mi lj | 1 ≤ j ≤ r, 1 ≤ i ≤ s } è una base di M su K.
La regola dei gradi si può facilmente estendere al caso di estensioni di grado infinito.
Sia K ⊂ L un’estensione, un elemento y ∈ L si dice algebrico su K se esiste un polinomio P (X) ∈
K[X], diverso da zero, tale che P (y) = 0; ovvero se gli elementi 1, y, y 2 , . . . di L sono linearmente
dipendenti su K. Un’estensione K ⊂ L si dirà algebrica se ogni elemento di L è algebrico su K. Ad
esempio, un’estensione di grado finito è necessariamente algebrica.
Un corpo Ω si dice algebricamente chiuso se ogni estensione algebrica di Ω coincide con Ω stesso.
Una chiusura algebrica del corpo K è un’estensione algebrica K ⊂ Ω, con Ω algebricamente chiuso.
Si dimostra che, per ogni corpo K, esiste una chiusura algebrica e che questa è unica, a meno di
isomorfismo (cf. Bourbaki, Algèbre, Chap. V, §.4, n.2, Théorèmes 1 e 2).
Sia K ⊂ L un’estensione, dato un elemento y ∈ L, algebrico su K, si chiama polinomio minimo di y su
K il generatore monico dell’ideale Iy = { f (X) ∈ K[X] | f (y) = 0 }. Poichè Iy è il nucleo dell’omomorfismo
di anelli εy : K[X] → L, che manda g(X) 7→ g(y), ed L è un corpo, si ha che Iy è un ideale primo e
quindi massimale in K[X], che ogni generatore di Iy è un polinomio irriducibile in K[X], che l’immagine
di εy è un sottocorpo K(y) ⊂ L e infine, che il grado del polinomio minimo di y è uguale a [K(y) : K]. In
particolare, se L ha grado finito su K, dalla regola dei gradi, si deduce che il grado del polinomio minimo
di y ∈ L divide [L : K].
Un elemento y ∈ L, algebrico su K, si dice separabile se il polinomio minimo di y su K è privo di
radici multiple. Indicando con f (X) il polinomio minimo di y su K, si ha che y è separabile se, e solo se,
f (X) ed il suo derivato f ′ (X) non hanno radici comuni.
Un’estensione algebrica K ⊂ L si dice separabile se ogni elemento di L è separabile su K. Si dimostra
che, se K è un corpo perfetto(∗) allora ogni estensione algebrica di K è separabile (cf. Bourbaki, Algèbre,
Chap. V, §.7, n.3, Proposition 4).
Per le estensioni separabili, vale il seguente risultato (cf. Bourbaki, Algèbre, Chap. V, §.7, n.7,
Proposition 12, ove è dimostrato per i corpi infiniti e §.11, n.4, ove il risultato si generalizza ai corpi finiti)
(∗)
Un corpo K è perfetto se, e solo se, K ha caratteristica 0, oppure charK = p > 0 e l’omomorfismo x 7→ xp è un
isomorfismo di K in sé. Si osservi che, se K è un corpo finito, dall’iniettività dell’omomorfismo x 7→ xp , discende che K è
perfetto.
I §.2 Richiami di Teoria di Galois. 5

2.2 Proposizione. (Teorema dell’elemento primitivo) Se L è un estensione finita e separabile di K,


allora esiste un elemento y ∈ L tale che L = K(y); ogni tale y si dice un elemento primitivo per
l’estensione L.
Un altro risultato sulle estensioni separabili che utilizzeremo nel seguito è dato dalla seguente Propo-
sizione (cf. Bourbaki, Algèbre, Chap. V, §.7, n.5, Proposition 8),
2.3 Proposizione. Sia Ω un’estensione algebricamente chiusa del corpo K e sia E una sottoestensione
di Ω, di grado finito su K. Il numero dei K-omomorfismi di E in Ω è al più uguale a [E : K] e vale
l’uguaglianza se, e solo se, E è separabile su K.
Siano K, E ed Ω come nella Proposizione I.2.3, ed indichiamo con σ1 , . . . , σr i K-omomorfismi (dis-
tinti) di E in Ω. Allora, dato un elemento x ∈ E, chiameremo coniugati di x gli elementi σ1 (x), . . . , σr (x)
di Ω(†) . Osserviamo che, poichè σ1 , . . . , σr sono K-omomorfismi, i coniugati di x ∈ E devono avere lo
stesso polinomio minimo di x su K.
Vogliamo ricordare un risultato spesso utile sui caratteri di un gruppo G, ovvero sugli omomorfismi
di G a valori nel gruppo moltiplicativo di un campo.
2.4 Proposizione. (Teorema di indipendenza dei caratteri) Siano G un gruppo ed L un corpo. Se
σ1 , . . . , σn sono omomorfismi distinti da G sul gruppo moltiplicativo L× , allora σ1 , . . . , σn sono linearmente
indipendenti su L.

dim. Se σ1 , . . . , σn non fossero linearmente indipendenti su L, esisterebbe una relazione di dipendenza di


lunghezza minima; ovvero, a meno di riordinare i caratteri, si ha che esistono delle costanti z1 , . . . , zm in
L, tutte diverse da zero e con m ≥ 2 e minimo rispetto alla condizione
(*) z1 σ1 (g) + · · · + zm σm (g) = 0, per ogni g ∈ G.
Poichè i caratteri sono distinti, sia g0 ∈ G tale che σ1 (g0 ) 6= σ2 (g0 ). Fissato comunque g ∈ G, consideriamo
la relazione (∗), sia applicata al prodotto gg0 che applicata a g e moltiplicata per σ1 (g0 ). Facendo la
Xm
differenza tra le due si ottiene la relazione zi (σi (g0 ) − σ1 (g0 ))σi (g) = 0 il che è in contrasto con la
i=2
minimalità di m. CVD 
Diamo la definizione di alcune importanti classi di estensioni
Un’estensione algebrica K ⊂ L si dice normale (su K) se ogni polinomio irriducibile in K[X], che
abbia almeno una radice in L, si decompone come prodotto di fattori lineari (non necessariamente distinti)
in L[X].
Se K ⊂ L è un’estensione, i K-isomorfismi del corpo L in sé formano un gruppo che è detto il Gruppo
di Galois di L su K e che indicheremo col simbolo Gal(L/K). È facile verificare che il sottoinsieme
LG = { x ∈ L | σ(x) = x, ∀σ ∈ Gal(L/K) }
è un sottocorpo di L e si ha K ⊂ LG ⊂ L.
Diremo che un’estensione algebrica K ⊂ E è di Galois se K = E G .
Le estensioni di Galois si possono caratterizzare nel modo seguente (cf. Bourbaki, Algèbre, Chap. V,
§.10, n.1, Proposition 1).
2.5 Proposizione. Sia K ⊂ E un’estensione algebrica, sono equivalenti:
(i) E è estensione di Galois;
(ii) E è un’estensione normale e separabile;
(iii) il polinomio minimo su K di ogni elemento x ∈ E è prodotto di fattori lineari distinti in E[X].
La seguente proposizione descrive le sottoestensioni di un’estensione di Galois in termini dei loro
gruppi di Galois (cf. Bourbaki, Algèbre, Chap. V, §.10, n.2, Propositions 2 e 4).
(†)
Una definizione più generale di elementi coniugati, valida per estensioni qualunque, si può trovare in Bourbaki, Algèbre,
Chap. V, §.6, n.2.
6 Interi algebrici I §.2

2.6 Proposizione. Siano K ⊂ E un’estensione di Galois e K ⊂ L ⊂ E. Allora


(i) E è un’estensione di Galois su L e si ha Gal(E/L) ⊂ Gal(E/K);
(ii) L è estensione di Galois su K se, e solo se, Gal(E/L) è un sottogruppo normale di Gal(E/K) ed in
tal caso si ha Gal(L/K) = Gal(E/K)/Gal(E/L).
Ogni estensione di Galois K ⊂ E è unione di sottoestensioni di Galois di grado finito (cf. Bourbaki,
Algèbre, Chap. V, §.10, n.1, Corollaire) e per le estensioni di Galois di grado finito vale il seguente Teorema
(cf. Bourbaki, Algèbre, Chap. V, §.10, n.5, Théorème 3).
2.7 Teorema. [Teorema fondamentale della teoria di Galois] Sia K ⊂ E un’estensione di Galois di grado
finito. Per ogni sottogruppo H ⊂ Gal(E/K), indichiamo con

E H := { x ∈ E | σ(x) = x, ∀σ ∈ H }

il sottocorpo degli elementi di E invarianti rispetto ad H. Allora, Gal(E/K) è un gruppo finito e la


corrispondenza che ad ogni corpo intermedio K ⊂ L ⊂ E associa il sottogruppo Gal(E/L) ⊂ Gal(E/K)
è biiettiva e si ha
E Gal(E/L) = L per ogni corpo intermedio K ⊂ L ⊂ E,
Gal(E/E H ) = H per ogni sottogruppo H ⊂ Gal(E/K).
Inoltre,
#(Gal(E/L)) = [E : L] e (Gal(E/K) : Gal(E/L)) = [L : K],
ove (Gal(E/K) : Gal(E/L)) denota l’indice del sottogruppo Gal(E/L) in Gal(E/K) e #(Gal(E/L))
indica il numero di elementi del gruppo finito Gal(E/L).
2.8 Remark. Nel caso di estensioni di Galois di grado infinito (ad es. la chiusura algebrica di Q o di
un corpo primo Fp ) non vi è più (in generale) corrispondenza biunivoca tra sottogruppi del gruppo di
Galois e corpi intermedi dell’estensione. Per ottenere un risultato analogo al Teorema I.2.7, è necessario
introdurre una topologia sul gruppo di Galois.
Precisamente, data un’estensione di Galois K ⊂ E, di grado infinito, sia G = Gal(E/K) il suo
gruppo di Galois. Allora, al variare di L tra le sottoestensioni di Galois di E, di grado finito su K,
i sottogruppi Gal(E/L) ⊂ Gal(E/K) sono sottogruppi normali e formano un sistema fondamentale di
intorni dell’elemento neutro, che rendono Gal(E/K) un gruppo topologico. Vale quindi il seguente
2.9 Teorema. Sia K ⊂ E un’estensione di Galois. Per ogni sottogruppo chiuso H ⊂ Gal(E/K),
indichiamo con
E H := { x ∈ E | σ(x) = x, ∀σ ∈ H }
il sottocorpo degli elementi di E invarianti rispetto ad H. Allora, la corrispondenza che ad ogni corpo
intermedio K ⊂ L ⊂ E associa il sottogruppo chiuso Gal(E/L) ⊂ Gal(E/K) è biiettiva e si ha

E Gal(E/L) = L per ogni corpo intermedio K ⊂ L ⊂ E,


H
Gal(E/E ) = H per ogni sottogruppo chiuso H ⊂ Gal(E/K).

Per dettagli ed approfondimenti, rimandiamo il lettore a Bourbaki, Algèbre, Chap. V, Appendice II

Richiamiamo ora le proprietà fondamentali di traccia e norma per gli elementi di estensioni finite.
Sia L un’estensione finita del corpo K e sia n = [L : K] := dimK L. Allora, dato un elemento x ∈ L
si può considerare l’endomorfismo (di K-spazi vettoriali) µx : L → L, definito ponendo µx (y) = xy al
variare di y ∈ L. Si definiscono quindi la norma e la traccia di x ponendo

(2.10) NL/K (x) := det µx , T rL/K (x) := tr µx .

Richiamiamo le proprietà elementari di traccia e norma nella seguente


I §.2 Richiami di Teoria di Galois. 7

2.11 Proposizione. Siano L′ un’estensione finita del corpo L ed L un’estensione finita del corpo K, di
gradi [L′ : L] = m ed [L : K] = n. Allora, dati comunque x, y ∈ L, si ha
(i) NL/K (xy) = NL/K (x)NL/K (y), e T rL/K (x + y) = T rL/K (x) + T rL/K (y);
(ii) NL/K (a) = an e T rL/K (a) = na per ogni a ∈ K;
(iii) NL′ /K (x) = NL′ /L (NL/K (x)) = NL/K (x)m e T rL′ /K (x) = T rL′ /L (T rL/K (x)) = mT rL/K (x).
(iv) Sia p(X) = a0 +a1 X +· · ·+ar−1 X r−1 +X r il polinomio minimo di x su K, allora si ha NK(x)/K (x) =
(−1)r a0 e T rK(x)/K (x) = −ar−1 .

dim. Le proprietà (i) e (ii) sono conseguenza diretta delle proprietà del determinante e della traccia degli
endomorfismi di K-spazi vettoriali di dimensione finita. La proprietà (iii) si può dedurre dal fatto che
è possibile costruire una base di L′ su K del tipo { si lj | 1 ≤ i ≤ m, 1 ≤ j ≤ n }, ove { si | 1 ≤ i ≤ m } è
una base di L′ su L ed { lj | 1 ≤ j ≤ n } è una base di L su K ed utilizzando tale base per scrivere la
matrice di µx : L′ → L′ , si ottengono le relazioni enunciate tra NL′ /K (x) e NL/K (x) e tra T rL′ /K (x) e
T rL/K (x). Infine, la proprietà (iv) si ottiene con un calcolo diretto dalla matrice di µx rispetto alla base
{ 1, x, . . . , xr−1 } di K(x) su K, che è la matrice compagna del polinomio p(X). CVD 
Sia ora L un’estensione finita e separabile del corpo K. Allora, in base alla Proposizione I.2.3, vi
sono n = [L : K] immersioni distinte σ1 , . . . , σn di L in una chiusura algebrica di K. Dato un elemento
x ∈ L ed indicato con p(X) = a0 + a1 X + · · · + ar−1 X r−1 + X r il polinomio minimo di x su K, vogliamo
mostrare che si ha
n n
Y n X
NL/K (x) = (−1)n (a0 )n/r = σj (x) e T rL/K (x) = − ar−1 = σj (x). (2.12)
j=1
r j=1

Poichè x è separabile, in una chiusura algebrica Ω di K vi sono r radici distinte di p(X); inoltre, poichè
L è separabile su K(x) ed [L : K(x)] = n/r, fissata una radice u ∈ Ω di p(X), si deduce dalla Propo-
sizione I.2.3, che vi sono al più n/r K-omomorfismi di L in Ω che mandano x su u. Ripetendo il discorso
per tutte le radici di p(X) si ottiene che ognuna delle radici di questo polinomio compare esattamente n/r
volte tra i coniugati di x. Ricordando che −ar−1 e (−1)r (a0 ) sono esattamente la somma ed il prodotto
delle radici del polinomio p(X) si ottiene la formula (I.2.12).
Vi è una facile conseguenza delle proprietà della traccia, che ci sarà utile nel seguito.
2.13 Corollario. Sia L un’estensione finita e separabile del corpo K, allora l’applicazione

L×L → K
(x, y) 7→ T rL/K (xy)

è un’applicazione K-bilineare, simmetrica e non-degenere.

dim. Fissato comunque un elemento 0 6= x ∈ L, l’applicazione y 7→ xy è una biiezione di L in sé e quindi


è sufficiente dimostrare che esiste un elemento u ∈ L per cui si abbia T rL/K (u) 6= 0.
Se fosse T rL/K (y) = 0 per ogni y ∈ L, in base a I.2.12 si otterrebbe una relazione di dipendenza
lineare tra i K-omomorfismi σ1 , . . . , σn e ciò contraddice il teorema di indipendenza dei caratteri (cf.
Proposizione I.2.4). CVD 

Concludiamo questa sezione richiamando un risultato elementare sui polinomi simmetrici. Sia A
un anello (commutativo con 1); un polinomio f (X1 , . . . , Xn ) ∈ A[X1 , . . . , Xn ] è simmetrico se, per ogni
permutazione σ ∈ Σn , si ha f σ = f , ove f σ := f (Xσ(1) , . . . , Xσ(n) ).
Ad esempio, i polinomi
X
s1 = X1 + · · · + Xn , . . . sk = Xi1 · · · Xik , . . . sn = X1 · · · Xn
i1 <···<ik
8 Interi algebrici I §.3

sono polinomi simmetrici e sono detti i polinomi simmetrici elementari (∗) I polinomi simmetrici ele-
mentari svolgono un ruolo fondamentale nella costruzione dei polinomi simmetrici; infatti, è immediato
verificare che, dato comunque un polinomio h(X1 , . . . , Xn ) ∈ A[X1 , . . . , Xn ], il polinomio h(s1 , . . . , sn ) è
un polinomio simmetrico. Mostreremo che ogni polinomio simmetrico si scrive in questo modo.
Sia f (X1 , . . . , Xn ) ∈ A[X1 , . . . , Xn ] un polinomio simmetrico non nullo, e sia M un monomio monico,
che compare in f con un coefficiente non nullo. Allora, poichè f è simmetrico anche tutti i monomi M σ ,
al variare di σ ∈ Σn compaiono in f con lo stesso coefficiente; dunque, posto
X
τ (M ) = M σ, ove IM è l’insieme dei monomi distinti che compaiono in { M σ | σ ∈ Σn } ,
M σ ∈IM

X
possiamo scrivere f (X) = cM τ (M ) ove J è un insieme finito di monomi monici nelle indeterminate
M∈J
X 1 , . . . , Xn .
Il risultato fondamentale sui polinomi simmetrici può essere cosı̀ enunciato.
2.14 Teorema. Sia M un monomio monico in A[X1 , . . . , Xn ], allora esiste un polinomio φ(Y1 , . . . , Yn ) ∈
Z[Y1 , . . . , Yn ] tale che τ (M ) = φ(s1 , . . . , sn ), ove s1 , . . . , sn ) sono i polinomi simmetrici elementari.

dim. Poichè il grado del polinomio simmetrico elementare sj è uguale a j, introduciamo un peso per i
polinomi in Z[Y1 , . . . , Yn ], attribuendo peso j all’indeterminata Yj per j = 1, . . . , n. Mostreremo quindi
che, se M è un monomio nelle indeterminate X1 , . . . , Xn , di grado k, allora il corrispondente polinomio
φ(Y1 , . . . , Yn ) ∈ Z[Y1 , . . . , Yn ] dell’enunciato, deve avere peso k.
Facciamo induzione sul numero delle variabili n, osservando che, per n = 1 la tesi è banalmente vera.
Inoltre, se n è qualunque e k = 0 o k = 1, ancora una volta la tesi è banalmente vera; dunque faremo
induzione anche sul grado k.
Sia quindi τ (M ) = f (X1 , . . . , Xn ) e si consideri il polinomio f (X1 , . . . , Xn−1 , 0). Essendo quest’ulti-
mo un polinomio simmetrico in n − 1 indeterminate, possiamo applicare l’ipotesi induttiva e scrivere

f (X1 , . . . , Xn−1 , 0) = ψ(s′1 , . . . , s′n−1 ),

ove ψ(Y1 , . . . , Yn−1 ) ∈ Z[Y1 , . . . , Yn−1 ] ed s′j = sj (X1 , . . . , Xn−1 , 0), per j = 1, . . . , n − 1, sono i polinomi
simmetrici elementari in n − 1 indeterminate.
Consideriamo ora il polinomio

g(X1 , . . . , Xn ) = f (X1 , . . . , Xn ) − ψ(s1 , . . . , sn−1 ).

Poichè Xn divide g, e g è un polinomio simmetrico, si conclude che sn = X1 · · · Xn divide g(X1 , . . . , Xn )


e quindi, se g 6= 0, si ha g = sn h, ove h(X1 , . . . , Xn ) 6= 0 è un polinomio simmetrico di grado minore del
grado di f e quindi, si può applicare l’ipotesi induttiva sul grado per concludere. CVD 

(∗)
Un modo semplice per ricordare la definizione dei polinomi simmetrici elementari e verificarne la simmetria è il seguente.
Si introduca un’ulteriore indeterminata T e si osservi che in A[X1 , . . . , Xn , T ] si ha

n n
Y X
(T − Xi ) = T n + (−1)j sj T n−j .
i=1 j=1
I §.3 Interi di un’estensione algebrica. 9

3. Interi di un’estensione algebrica.


Cominciamo con una definizione
3.1 Definizione. Sia L un campo ed A ⊂ L un sottoanello. Un elemento x ∈ L si dice intero su
A se soddisfa ad un’equazione monica a coefficienti in A; ovvero se esistono a0 , . . . , an−1 ∈ A tali che
a0 + a1 x + · · · + an−1 xn−1 + xn = 0.
Un anello B ⊃ A è intero su A, se ogni elemento di B è intero su A.
Vi è una semplice caratterizzazione degli elementi interi che sarà utile nel seguito
3.2 Proposizione. Sia L un campo ed A ⊂ L un sottoanello. Sono equivalenti
(i) x è intero su A;
(ii) l’anello A[x] è un A-modulo finitamente generato;
(iii) esiste un A-modulo (0) 6= M ⊂ L, finitamente generato su A e tale che xM ⊆ M .

dim. (i) ⇒ (ii) ⇒ (iii). Sia a0 + a1 x + · · · + an−1 xn−1 + xn = 0, con a0 , . . . , an−1 ∈ A; allora A[x] =
A + Ax + · · · + Axn−1 ⊂ L e ciò è sufficiente per concludere.
(iii) ⇒ (i). Sia {e1 , . . . , en } un insieme di generatori l’A-modulo M . Essendo xM ⊆ M , esiste una matrice
A = (ai,j )1≤i,j≤n ad elementi in A tale che
n
X
xej = ai,j ei per j = 1, . . . , n.
i=1

Se ne deduce che x è una radice del polinomio caratteristico di A, det(X1n − A), che è un polinomio
monico, di grado n, a coefficienti in A. CVD 
3.3 Corollario. Siano L un campo ed A ⊂ B ⊂ C ⊂ L sottoanelli, con B intero su A e C intero su B.
Allora C è intero su A.

dim. Sia x ∈ C e sia b0 + b1 x + · · · + bn−1 xn−1 + xn = 0, con b1 , . . . , bn ∈ B. Allora x è intero sull’anello


B0 = A[b0 , . . . , bn ], che è un A-modulo finitamente generato, per Proposizione I.3.2.(ii). Dunque, B0 [x]
è un modulo finitamente generato su B0 , che, a sua volta è finitamente generato su A. Si conclude che
B0 [x] è un A-modulo finitamente generato, chiuso rispetto alla moltiplicazione per x e quindi, per la
Proposizione I.3.2, x è intero su A. CVD 
3.4 Remark. Da quanto abbiamo dimostrato discende che gli elementi di L interi su A formano un
sottoanello di L, detto la chiusura integrale (o chiusura aritmetica) di A in L. Infatti, se x ed y sono
interi su A tali sono anche x + y ed xy, perchè l’algebra A[x, y] è un modulo finitamente generato su A[x]
e quindi su A, ed A[x, y] è chiuso rispetto alla moltiplicazione per x + y ed xy.
Diamo un’altra dimostrazione più ‘classica’ del fatto che gli interi su Z formano un anello, basata sul
teorema fondamentale sui polinomi simmetrici (cf. Teorema I.2.14). Siano α1 e β1 due elementi interi su
Z, e si decompongano le loro equazioni intere nella forma

f (X) = (X − α1 ) · · · (X − αn ) e g(X) = (X − β1 ) · · · (X − βn ).

I polinomi Y Y
h(X) = (X − αi − βj ) e k(X) = (X − αi βj )
1≤i≤n 1≤i≤n
1≤j≤m 1≤j≤m

sono polinomi a coefficienti in Z, perchè tali coefficienti sono polinomi simmetrici nelle αi e βj , e
quindi polinomi a coefficienti interi nelle funzioni simmetriche elementari di α1 , . . . , αn e β1 , . . . , βm ,
e quest’ultime coincidono con i coefficienti dei polinomi f (X) e g(X), che appartengono a Z.
3.5 Definizione. Sia B un dominio ed A ⊂ B. Si dice che A è integralmente chiuso in B se non vi sono
elementi di B, interi su A, e non appartenenti ad A.
10 Interi algebrici I §.3

Un dominio A è integralmente chiuso se è integralmente chiuso nel suo corpo dei quozienti.
La Proposizione che segue mette in evidenza un’importante classe di domini integralmente chiusi. A
tale scopo, ricordiamo che si chiama dominio fattoriale un dominio di integrità su cui valga il teorema di
fattorizzazione unica; ovvero un dominio in cui ogni elemento x 6= 0 si scriva come prodotto di elementi
irriducibili, determinati da x a meno di moltiplicazione per unità dell’anello.
Ricordiamo che l’anello degli interi razionali Z e, più in generale, ogni dominio ad ideali principali è un
dominio fattoriale. Inoltre, se A è un dominio fattoriale, allora anche l’anello dei polinomi A[X1 , . . . , Xn ]
è fattoriale (cf.[...]).
3.6 Proposizione. Sia A un dominio fattoriale e K il suo corpo delle frazioni. Allora
(i) A è integralmente chiuso.
(ii) Sia L un’estensione di K. Un elemento x ∈ L è intero su A se, e solo se, il suo polinomo minimo
p(X) ∈ K[X] ha i coefficienti nell’anello A.

dim. (i) Sia x ∈ K un elemento intero su A e supponiamo che x = ab , con a e b elementi di A privi
di fattori irriducibili comuni. Moltiplicando per bn la relazione a0 + a1 x + · · · + an−1 xn−1 + xn = 0, si
ottiene che −a0 bn − a1 abn−1 − · · · − an−1 an−1 b = an e quindi che b | an . Poichè a e b non hanno fattori
irriducibili in comune, ciò è possibile solo se b è un’unità, ovvero se x ∈ A.
(ii) Sia g(X) ∈ A[X] un polinomio monico, di grado minimo rispetto alla condizione g(x) = 0. Allora il
polinomio minimo p(X) divide g(X), ma, per il Lemma di Gauss (cf. [...]), se vi fossero due fattori di
grado positivo in K[X], g si decomporrebbe anche in A[X], contro l’ipotesi che g sia di grado minimo.
Dunque, essendo entrambi polinomi monici, deve aversi p(X) = g(X)(∗) . CVD 

Nel seguito di questa sezione daremo due dimostrazioni del fatto che la chiusura integrale B di
un dominio integralmente chiuso A, in un’estensione finita e separabile L del corpo dei dei quozienti
K = F rac A, è un A-modulo finitamente generato.
Cominciamo con un lemma
3.7 Lemma. Siano A un dominio ed L un’estensione finita del corpo dei quozienti K = F rac A. Allora,
(i) Se x ∈ L, esiste una costante 0 6= c ∈ A tale che cx sia intero su A.
(ii) Esiste una base di L su K fatta da elementi interi su A.

dim. (i). Moltiplicando per il prodotto dei denominatori dei coefficienti del polinomio minimo di x su
K, si ottiene una relazione del tipo a0 + a1 x + · · · + an−1 xn−1 + an xn = 0, con i coefficienti in A ed
an 6= 0. Moltiplicando quest’ultima relazione per an−1 n , si ottiene un’equazione monica, a coefficienti in
A, soddisfatta dall’elemento an x che è perciò intero su A.
(ii). Discende banalmente dal punto precedente. CVD 

Possiamo quindi enunciare e dimostrare il risultato annunciato.


3.8 Teorema. Sia A un dominio noetheriano, integralmente chiuso e sia L un’estensione finita e sepa-
rabile del campo dei quozienti K = F rac A. Allora la chiusura integrale B di A in L è un A-modulo
finitamente generato.

dim. Sia ω1 , . . . , ωn una base di L su K fatta da elementi interi su A (cf. Lemma I.3.7); vogliamo mostrare
che tutti gli x ∈ B si scrivono nella forma
a1 an
x= ω1 + · · · + ωn , con aj ∈ A e c indipendente da x.
c c
(∗)
Più in generale, osserviamo che, se x è intero su A, allora i coefficienti del polinomio minimo di x sono in K e sono
interi su A, perchè sono funzioni simmetriche nei coniugati di x, che sono tutti interi; dunque, se A è integralmente chiuso,
i coefficienti del polinomio minimo di x appartengono ad A.
I §.3 Interi di un’estensione algebrica. 11

Se ciò è vero si ha che B è un sottomodulo del modulo finitamente generato A ωc1 + · · · + A ωcn e quindi,
poichè A è noetheriano si conclude.
Per quanto visto nel Corollario I.2.13, l’applicazione bilineare su L (x, y) 7→ T rL/K (xy) è non de-
genere e quindi esistono degli elementi ω1∗ , . . . , ωn∗ di L che formino una base duale della base data. Si ha
quindi B ∋ x = b1 ω1 + · · · + bn ωn , con bj = T rL/K (xωj∗ ), per j = 1, . . . , n.
Per il Lemma I.3.7, esiste una costante 0 6= c ∈ A tale che ciascuno degli elementi cω1∗ , . . . , cωn∗ sia
cbj
intero su A; ne consegue che bj = , per j = 1, . . . , n, e che cbj = T rL/K (xcωj∗ ) ∈ B ∩ K perchè è una
c
somma di coniugati di elementi interi su A (cf. (I.2.12)). Poichè A è integralmente chiuso, si conclude
che B ∩ K = A e quindi c è il denominatore cercato. CVD 
Nel seguito daremo un’altra dimostrazione del Teorema precedente, ove sia descritto in modo più
esplicito il denominatore c che compare nella dimostrazione precedente; prima di fare questo, vogliamo
enunciare alcune conseguenze del risultato appena dimostrato.
3.9 Corollario. Siano A un dominio ad ideali principali, K il suo corpo dei quozienti ed L un’estensione
finita di K. Allora la chiusura integrale B di A in L è un modulo libero finito sull’anello A, di rango
uguale al grado [L : K].

dim. In base alla Proposizione I.3.6.(i), valgono tutte le ipotesi del Teorema I.3.8 e quindi B è un A-
modulo finitamente generato, inoltre, essendo contenuto nel corpo L, B è un modulo senza torsione e
quindi libero su A.
Per quanto riguarda il rango di tale modulo, è sufficiente osservare che B contiene una base di L su
K (cf. Lemma I.3.7). CVD 
3.10 Definizione. Siano A un dominio ad ideali principali, K il suo corpo dei quozienti, L un’estensione
finita di K e B la chiusura integrale di A in L. Si chiama base intera di B ogni sistema libero di generatori
di B come A-modulo.
Possiamo quindi dare un’altra dimostrazione del teorema sulla struttura della chiusura integrale.
dim. (seconda dimostrazione del Teorema I.3.8) Sia ω1 , . . . , ωn una base di L su K fatta da elementi
interi su A (cf. Lemma I.3.7); e sia x ∈ B. Scriviamo quindi

(*) x = b1 ω1 + · · · + bn ωn , ove b1 , . . . , bn ∈ K.

Dalla Proposizione I.2.3, sappiamo che esistono n = [L : K] K-omomorfismi distinti σ1 , . . . , σn di L verso


una chiusura algebrica K̄ di K. Applicando questi omomorfismi alla relazione (∗), possiamo scrivere
n
X
σi (x) = bj σi (ωj ), i = 1, . . . , n,
j=1

poichè b1 , . . . , bn ∈ K.
Osserviamo che det(σi (ωj ))1≤i,j≤n 6= 0. Infatti, se esistessero delle costanti z1 , . . . , zn ∈ K̄ tali che
Xn
zi σi (ωj ) = 0, per i = 1, . . . , n, sfruttando la K-linearità degli omomorfismi σ1 , . . . , σn , si dedurrebbe
i=1
n
X
zi σi (y) = 0, per ogni y nel gruppo moltiplicativo L× , e ciò non può aversi in base al Teorema di
i=1
indipendenza dei caratteri (cf. Proposizione I.2.4).
Allora, tramite l’usuale regola di Cramer per i sistemi lineari, possiamo scrivere i coefficienti bj nella
forma  
σ1 (ω1 ) . . . σ1 (ωn )
Nj .. ..
bj = 2 , ove D = det 
 
D . . 
σn (ω1 ) . . . σn (ωn )
12 Interi algebrici I §.3

ed Nj è un polinomio a coefficienti in Z negli elementi σh (ωk ) (per tutti gli h e k 6= j), D e σh (x).
Osserviamo che si ha D2 = σj (D2 ) per ogni j = 1, . . . , n e perciò D2 ∈ K, ed essendo Nj = D2 bj , si ha
anche Nj ∈ K. Inoltre, tutte le entrate della matrice che definisce D sono elementi interi su A e quindi
lo stesso possiamo dire del determinante D. Ed, analogamente, sono interi su A anche i numeratori Nj
in quanto funzioni polinomiali a coefficienti interi calcolate su elementi interi su A. Dunque, poichè A è
integralmente chiuso, possiamo concludere che D2 ∈ A ed Nj ∈ A, per j = 1, . . . , n; ovvero che

ω1 ωn
B⊂A + ···+ A 2,
D2 D

ed essendo A noetheriano, si conclude. CVD 

Diamo quindi la seguente


3.11 Definizione. Siano A un dominio noetheriano ed integralmente chiuso, K il suo corpo dei quozi-
enti, L un’estensione finita e separabile di K e B la chiusura integrale di A in L. Fissata una base
ω1 , . . . , ωn una base di L su K fatta da elementi interi su A (cf. Lemma I.3.7), si chiama discriminante
della base fissata l’elemento
 2
σ1 (ω1 ) ... σ1 (ωn )
2
D = ∆(ω1 , . . . , ωn ) = det  .. ..
 ∈ A,
 
. .
σn (ω1 ) ... σn (ωn )

ove σ1 , . . . , σn sono i K-omomorfismi distinti di L verso una chiusura algebrica K̄ di K (cf. Propo-
sizione I.2.3).
La seguente proposizione chiarisce le relazioni tra le due dimostrazioni del Teorema I.3.8.
3.12 Proposizione. Siano A un dominio noetheriano ed integralmente chiuso, K il suo corpo dei quozi-
enti, L un’estensione separabile di K, di grado n, e B la chiusura integrale di A in L. Fissata una base
ω1 , . . . , ωn una base di L su K fatta da elementi di B, si ha

∆(ω1 , . . . , ωn ) = det(T rL/K (ωi ωj ))1≤i,j≤n ,

ove ∆(ω1 , . . . , ωn ) indica il discriminante della base fissata (cf. Definizione I.3.11).

dim. Siano σ1 , . . . , σn i K-omomorfismi distinti di L verso una chiusura algebrica K̄ di K (cf. Propo-
sizione I.2.3) e si consideri la matrice M = (σi (ωj ))1≤i,j≤n . Allora, in base alla definizione di discrimi-
nante, si ha
∆(ω1 , . . . , ωn ) = det(tM M )
e l’elemento di posto (i, j) della matrice tM M è uguale a (cf. I.2.12)
n
X n
X
σh (ωi )σh (ωj ) = σh (ωi ωj ) = T rL/K (ωi ωj ),
h=1 h=1

che conclude la discussione. CVD 

Concludiamo con un ultima osservazione sul discriminante.


3.13 Remark. Osserviamo che se A è un dominio ad ideali principali, e B è la chiusura integrale di
A in un’estensione finita separabile di K = F rac A, allora B è un A-modulo libero e, fissato un sistema
libero di generatori β1 , . . . , βn di B su A (cf. Definizione I.3.10), si può considerare il discriminante
∆(β1 , . . . , βn ). Si osservi che
I §.4 Corpi quadratici e corpi ciclotomici 13

• l’ideale di A generato da ∆(β1 , . . . , βn ) è indipendente dalla scelta della base intera ed è quindi detto
il discriminante di B su A.
Se β1′ , . . . , βn′ è un’altra base intera di B, si ha (β1′ , . . . , βn′ ) = (β1 , . . . , βn )T , ove T ∈ GL(n, A); quindi,
scelto comunque un K-omomorfismo σ di L verso una (fissata) chiusura algebrica K̄ di K, si ha

(σ(β1′ ), . . . , σ(βn′ )) = (σ(β1 ), . . . , σ(βn ))T.

Si conclude perciò che

∆(β1′ , . . . , βn′ ) = ∆(β1 , . . . , βn )(det T )2 , e det T ∈ A× .

In particolare, da quanto osservato discende che, se A = Z, allora il discriminante stesso (e non


solo l’ideale generato) è indipendente dalla scelta della base intera e viene perciò detto il discriminante
dell’estensione L di Q (o del suo anello di interi).

4. Corpi quadratici e corpi ciclotomici

In questa sezione ci occupiamo delle grandezze introdotte nella sezione precedente, nel caso di alcune
particolari estensioni di √
Q. Cominciamo quindi ad occuparci dei corpi quadratici, ovvero delle estensioni
di Q del tipo K = Q( d), ove d è un intero, non quadrato e square-free, ovvero, soddisfacente alla
condizione f 2 | d, f ∈ Z ⇒ f = ±1. Sia B l’anello degli interi di K, ovvero la chiusura integrale di Z
in K, e cerchiamo di caratterizzare gli elementi di B ed una sua base intera (cf. Definizione I.3.10). Sia
quindi √
a+b d
x= ∈ B,
q
con a, b, q ∈ Z, q 6= 0 ed Mcd(a, b, q) = 1 e supponiamo inoltre che sia b 6= 0, ovvero che x abbia grado
2 su Q, perchè già sappiamo che B ∩ Q = Z, perchè Z è integralmente chiuso (cf. Proposizione I.3.6).
Allora x deve soddisfare alla relazione (qx − a)2 = b2 d, da cui si deduce che

2a a2 − b 2 d
p(X) = X 2 − X+
q q2

è il polinomio minimo di x su Q e, quindi, per il risultato già citato, p(X) ha i coefficienti in Z e perciò

q | 2a, q 2 | (a2 − b2 d). (4.1)

Ciò implica che q deve essere uguale ad 1 oppure a 2. Infatti, se p > 2 è un numero primo e p | q, dalla
prima delle (I.4.1) discende che p | a e quindi, utilizzando la seconda, che p2 | b2 d. Poichè d è square-free,
si ha che p | b e ciò non è possibile perchè Mcd(a, b, q) = 1. Dunque q non ha fattori primi diversi da 2 e
inoltre, da 4 | q, si deduce che 2 divide anche a e b, e ciò contrasta di nuovo con l’ipotesi Mcd(a, b, q) = 1.
Supponiamo ora q = 2 ed osserviamo che, sempre in base a (I.4.1), se d fosse pari, si avrebbe 4 | (a2 − b2 d)
e quindi che 2 dovrebbe dividere sia a che b e ciò è sempre in contrasto con l’ipotesi che i tre interi a, b e
q siano primi tra loro.
Sia dunque d un numero dispari ed osserviamo che, se d ≡ 3 (mod 4), allora q = 1. Perchè, se fosse
q = 2, si avrebbe
0 ≡ a2 − b2 d ≡ a2 + b2 (mod 4)
e ciò è impossibile, perchè, essendo (a, b, q) = 1, a e b devono essere entrambi dispari e ciò è assurdo.

Infine, osserviamo che, se d ≡ 1 (mod 4), può aversi q = 2, con a ≡ b ≡ 1 (mod 2); infatti, in tal caso
1+ d
2 è un intero di K. Possiamo quindi riassumere le considerazioni precedenti nella seguente
14 Interi algebrici I §.4

4.2 Proposizione. Sia K = Q( d), ove d è un intero, non quadrato e square-free e sia B la chiusura
integrale di Z in K. Allora √ √
(i) se d ≡ 2 (mod 4) o d ≡ 3 (mod 4) una base di B come Z-modulo è {1, d}, e quindi√B = Z[ d];
√ √
(ii) se d ≡ 1 (mod 4) una base di B come Z-modulo è {1, 1+2 d }, e quindi Z[ d] ⊂ Z[ 1+2 d ] = B.
Si deduce quindi, con un calcolo di determinanti.

4.3 Corollario. Sia K = Q( d), ove d è un intero, non quadrato e square-free e sia B la chiusura
integrale di Z in K. Allora, indicato con ∆ il discriminante di B (cf. Remark I.3.13), si ha
(i) se d ≡ 2 (mod 4) o d ≡ 3 (mod 4), allora ∆ = 4d;
(ii) se d ≡ 1 (mod 4), allora ∆ = d.

Ora vogliamo occuparci dei corpi ciclotomici, che sono i sottocorpi di Q(ζn ), ove ζn è una radice
n-esima primitiva di 1. In questo primo approccio ci occuperemo solo dei corpi ciclotomici principali,
ovvero del tipo di Q(ζn ); e cominciamo osservando che, poichè ζn è una radice n-esima primitiva di 1,
Q(ζn ) è il corpo di decomposizione del polinomio

n−1
Y
Xn − 1 = (X − ζnj ).
j=0

Il grado dell’estensione [Q(ζn ) : Q], è il grado del polinomio minimo φn (X) ∈ Z[X] di ζn (polinomio
n
ciclotomico di ordine n), che è un divisore di XX−1 −1
= 1 + X · · · + X n−1 . Per determinare il grado di
φn (X), possiamo contare il numero dei Q-automorfismi di Q(ζn ) in sé (cf. Proposizione I.2.3), e per fare
ciò, osserviamo che i Q-automorfismi di Q(ζn ) sono completamente inviduati dall’immagine dell’elemento
ζn , che deve essere ancora una radice n-esima primitiva di 1, quindi, deve aversi ζn 7→ ζna , per un
qualche a ∈ (Z/nZ)× , e la corrispondenza cosı̀ costruita tra Gal(Q(ζn )/Q) e (Z/nZ)× è chiaramente un
isomorfismo di gruppi.
Dunque, si ha
Y
(4.4) deg φn (X) = [Q(ζn ) : Q] = #(Gal(Q(ζn )/Q)) = #((Z/nZ)× ) = ϕ(n) = n (1 − p1 ),
p primo
p|n

ove ϕ : N → N è la funzione di Eulero, ovvero la funzione che conta gli interi minori di n e primi con n
(che rappresentano perciò gli invertibili dell’anello Z/nZ)(†) .
(†)
La formula Y
1
ϕ(n) = n (1 − p
)
p primo
p|n

si può dimostrare nel modo seguente. Dapprima si verifica che è vera quando n = p è un numero primo, perchè vi sono
esattamente p − 1 elementi invertibili nel campo Z/pZ. Poi, si osserva che, sempre se p è un numero primo, si ha la sequenza
esatta
0 → pn Z/pn+1 Z → Z/pn+1 Z → Z/pn Z → 0

da cui si deduce che la controimmagine di ogni elemento invertibile in Z/pn Z è invertibile in Z/pn+1 Z, e quindi ϕ(pk+1 ) =
pϕ(pk ); per cui la formula è vera anche per le potenze di un primo. Infine, si conclude osservando che, se n ed m sono
coprimi, si ha l’isomorfismo di anelli (Teorema cinese del resto)

Z/nmZ ∼
= Z/nZ × Z/mZ

e quindi anche il gruppo degli elementi invertibili è prodotto diretto dei due gruppi di invertibili. Da cui si deduce che
se Mcd(n, m) = 1, allora ϕ(nm) = ϕ(n)ϕ(m) e ciò permette di concludere che la formula è vera in generale. Il lettore è
P
invitato a dimostrare che d|n
ϕ(d) = n.
I §.4 Corpi quadratici e corpi ciclotomici 15

4.5 Remark. Vi era un altro modo di dimostrare che deg φn (X) = ϕ(n), ovvero è sufficiente dimostrare
che
• Se ζ è una radice del polinomio ciclotomico di ordine n, φn (X), e p < n è un numero primo che non
divide n, allora φn (ζ p ) = 0.
Infatti, da questa osservazione si ottiene che tutte le potenze ζ a , con a < n e Mcd(a, n) = 1 sono
radici distinte del polinomio ciclotomico e quindi il grado di φn (x) deve essere maggiore o uguale di ϕ(n),
che è il numero delle radici n-esime primitive di 1. Dunque i due numeri devono essere uguali.
Passiamo quindi a dimostrare l’asserzione sulle radici del polinomio ciclotomico. Sia g(X) ∈ Z[X]
il polinomio minimo di ζ p ; deve quindi aversi φn (X) | g(X p ) in Q[X] e, per il Lemma di Gauss, si ha
g(X p ) = φn (X)G(X), per un opportuno G(X) ∈ Z[X]. Riducendo modulo p i coefficienti dei polinomi,
si ottiene la relazione
ḡ(X p ) = (ḡ(X))p = φ̄n (X)Ḡ(X) in Fp [X],

e quindi φ̄n (X) e ḡ(X) devono avere dei fattori in comune in F̄p [X]. Dunque, se φn (X) 6= g(X), essendo
entrambi polinomi irriducibili, deve aversi

X n − 1 = φn (X)g(X)H(X) in Z[X],

e quindi riducendo modulo p questa identità, si deduce che X n − 1 deve avere radici multiple in F̄p , e ciò
è assurdo, perchè il derivato di X n − 1 è nX n−1 6= 0 in Fp [X], perchè p non divide n. Deve quindi essere
φn (X) = g(X).

Vogliamo occuparci ora dell’anello degli interi di Q(ζp ) ove p è un primo razionale. In tal caso
ϕ(p) = p − 1 e quindi
Xp − 1
φp (X) = = 1 + X + · · · + X p−1 .
X −1
Osserviamo a margine che l’irriducibilità del polinomio 1 + X + · · · + X p−1 si può verificare in modo
p  
X p
(∗)
diretto applicando il Criterio di Eisenstein al polinomio φp (X + 1) = X j−1 .
j=1
j
Vogliamo quindi dimostrare la seguente

4.6 Proposizione. Sia p un primo razionale e ζ una radice p-esima primitiva di 1. Allora la chiusura
integrale di Z in K = Q(ζ) è uguale a Z[ζ].
Indicato con ∆ il discriminante di Z[ζ], (cf. Remark I.3.13), si ha

Y p−1
Y
∆= (ζ a − ζ b ) = φ′p (ζ j ).
1≤a6=b≤p−1 j=1

dim. Gli elementi 1, ζ, ζ 2 , . . . , ζ p−2 , formano una base di K fatta di elementi interi su Z, possiamo quindi
calcolare il discriminante ad essa associato (cf. Definizione I.3.11). Si ottiene cosı̀ il quadrato di un

(∗)
Il Criterio di irriducibilità di Eisenstein si può enunciare nel modo seguente

Teorema. Il polinomio f (X) = a0 + a1 X + · · · + an−1 X n−1 + X n ∈ Z[X] è irriducibile (in Q[X]) se esiste un primo
razionale p tale che p | aj per j = 0, . . . , n − 1, ma p2 non divide a0 .

La dimostrazione procede nel modo seguente. Se f fosse riducibile in Q[X], per il Lemma di Gauss, si avrebbe
f (X) = g(X)h(X) in Z[X] e quindi, riducendo i coefficienti dei polinomi modulo p, si otterrebbe una fattorizzazione di X n
in Fp [X]. Ciò implica che p dovrebbe dividere il termine noto sia di g che di h e quindi p2 | a0 contro l’ipotesi.
16 Interi algebrici I §.4

determinante di Van der Monde, ovvero


2
1 1 ... 1

ζ ζ2 ... ζ p−1
∆(1, ζ, ζ 2 , . . . , ζ p−2 ) = det 
 
 =
 .. .. ..
. . .

ζ p−2 ζ 2(p−2) ... ζ (p−2)(p−1)
 2
Y Y
= (ζ a − ζ b ) = (ζ a − ζ b ).
1≤a<b≤p−1 1≤a6=b≤p−1

Osservando poi che


p−1 p−1
Y X φp (X)
φp (X) = (X − ζ i ), e quindi φ′p (X) = ,
i=1 i=1
(X − ζ i )
p−1
Y
si ottiene φ′p (ζ a ) = (ζ a − ζ i ) e quindi
i6=a
p−1
Y
∆(1, ζ, ζ 2 , . . . , ζ p−2 ) = φ′p (ζ j ).
j=1

Si osservi poi che X − 1 = (X − 1)φp (X) e quindi, derivando ambo i membri si ottiene pX p−1 =
p

φp (X) + (X − 1)φ′p (X), e quindi, calcolando nelle varie potenze di ζ, si ha


pζ a(p−1) = (ζ a − 1)φ′p (ζ a )
e si conclude che p è l’unico primo che divide ∆ = ∆(1, ζ, ζ 2 , . . . , ζ p−2 ) ∈ Z.
Indichiamo con B la chiusura integrale di Z in K e ricordiamo che ogni elemento x ∈ B si scrive
nella forma
a0 a1 ap−2 p−2
x= + ζ + ···+ ζ , ove aj ∈ Z
∆ ∆ ∆
e, posto λ = ζ − 1, si ha Z[λ] = Z[ζ] ed
b0 b1 ab−2 p−2
x= + λ + ···+ λ , ove bj ∈ Z.
∆ ∆ ∆
L’unico fattore primo di ∆ è p, possiamo semplificare le frazioni che compaiono come coefficienti nella
scrittura di x. Supponiamo quindi di aver ridotto le frazioni e che i coefficienti che ne risultano non siano
interi. Questo significa che
c0 + c1 λ + · · · + cp−2 λp−2 = pr x ∈ pB
ove c0 , c1 , . . . , cp−2 ∈ Z, ma non sono tutti divisibili per p. Sia quindi s l’intero per cui
c0 ≡ c1 ≡ · · · ≡ cs−1 ≡ 0 (mod p)


cs 6≡ 0 (mod p)
s p−2
allora, si ha cs λ + · · · + cp−2 λ = py ∈ pB.
Si osservi che
p−1
p−2 p−1
Y 1 − ζa
p = φp (1) = (1 − ζ) . . . (1 − ζ )=λ ;
a=1
1−ζ
1−ζ a
ed inoltre, per ogni a, 1−ζ è invertibile in B, perchè, scelto un intero b tale che ab ≡ 1 (mod p), si ha
1−ζ 1 − ζ ab
a
= = 1 + ζ a + · · · + ζ a(b−1) ∈ B.
1−ζ 1 − ζa
Dunque p = λp−1 u in B e, dalla relazione cs λs + · · · + cp−2 λp−2 = py, si deduce che λ | cs in B, ma
cs ∈ Z e quindi p | cs che è una contraddizione. Si conclude che deve essere x = c0 + c1 λ + · · · + cp−2 λp−2 ,
ovvero che B = Z[λ] = Z[ζ]. CVD 
Concludiamo questo numero con un osservazione
I §.5 L’equazione di Pell 17

4.7 Remark. Se L è un’estensione finita di Q, per il Teorema dell’elemento primitivo (cf. Propo-
sizione I.2.2), si ha che L = Q(y), per un opportuno y ∈ L, allora può essere spontaneo chiedersi se anche
per la chiusura integrale B di Z in L, vale un analogo risultato, ovvero se B = Z[α] per un opportuno
intero α, come abbiamo visto accadere per i corpi quadratici e per i corpi ciclotomici (principali). Diciamo
subito che la risposta
√ √ è negativa, come si può vedere dal seguente esempio.
√ √ √
Sia K = Q( 10, 7), allora una base di K su Q è data da {1, 7, 10, 70}, che sono interi su Z
ed il discriminante associato a tale base è
2
√1 1 √1 1

√ √
 7 − √ 7 √7 −√ 7 
∆ = det  √ 2 10 2 2
 = (1120) = 2 5 7 .
√10 √10 − √ 10 −
√ 10
70 − 70 − 70 70

Sia ora
a b√ c√ d√
x= + 7+ 10 + 70 ∈ B
∆ ∆ ∆ ∆
γ
ed osserviamo che, poichè ∆ 6≡ 0 (mod 3), si ha x3 − x ∈ 3B e, con un calcolo diretto, x3 − x = 3 ∆ con
γ ∈ B. Dunque, se fosse B = Z[α], si avrebbe in particolare

3g(α)
α3 − α = , ove g(X) ∈ Z[X],

ciò è assurdo perchè, uguagliando le due espressioni, dovrebbe aversi che 3 | ∆.

5. L’equazione di Pell
In questa sezione ci occuperemo di determinare le soluzioni non-banali di un’equazione diofantea.
Precisamente, ci interessano le soluzioni intere, diverse da (±1, 0), dell’equazione di Pell , ovvero di

X 2 − dY 2 = 1 con 0 < d ∈ Z,

ove d non è il quadrato di un numero intero(†) . Cominciamo la discussione, osservando che un approccio
‘geometrico’, simile a quello usato per determinare i numeri pitagorici (cf. I, §.1), non porterebbe a
risultati utili.

La curva di equazione X 2 −dY 2 = 1 è una conica,


sia P = (1, 0) un suo punto razionale e si consideri
una generica retta passante per P , di equazione
Y = t(X − 1). Per quasi tutti i valori di t, questa
retta ha un’altra intersezione con la conica e pre-
cisamente, deve aversi 0 = X 2 − dt2 (X − 1)2 − 1 =
(X − 1)[X + 1 − dt2 (X − 1)], da cui si ottiene la
parametrizzazione della curva tramite le funzioni P
razionali ( 2
x = 1+dt
dt2 −1
2t
y= dt2 −1

ed in tal modo si possono determinare tutti i punti


a coordinate in Q.

(†)
Se fosse d = n2 , allora l’equazione assumerebbe la forma (X − nY )(X + nY ) = 1 che ha solo soluzioni banali.
18 Interi algebrici I §.5
p
Poniamo quindi t = , con Mcd(p, q) = 1, e si ottiene
q

q 2 + dp2 2pq
x= , y= .
dp2 − q 2 dp2 − q 2

La condizione che i punti abbiano coordinate intere può essere espressa nel modo seguente: posto N =
dp2 − q 2 ∈ Z, deve essere
N | 2pq e N | (q 2 + dp2 ) = N + 2q 2 .

Se ℓ 6= 2 è un fattore primo di N , allora ℓ deve dividere q 2 e quindi q ed inoltre, essendo q 2 ≡ dp2 (mod N ),
con Mcd(p, q) = 1, si ottiene ℓ | d. Inoltre, se ora ℓ è un primo qualsiasi ed ℓα | N , con α ≥ 2, allora
ℓα | q 2(∗) , ed essendo dp2 ≡ q 2 (mod N ), si conclude che ℓα | d.
Dunque i fattori primi di N sono da cercarsi tra i fattori primi di d, con molteplicità non maggiore
di quella con cui compaiono in d, con l’eccezione del fattore 2 che potrebbe comparire, con molteplicità
al più 1, anche quando d è dispari.
p
In particolare, dai calcoli fatti, si vede che per determinare i valori del parametro t = , con
q
Mcd(p, q) = 1, per cui i punti della conica hanno coordinate in Z, dobbiamo scegliere p e q tra le soluzioni
di equazioni del tipo N = dp2 − q 2 , ove N è legato a d nel modo descritto sopra. Queste condizioni sono
dello stesso ordine di difficoltà del problema di partenza, il che significa che la parametrizzazione della
curva X 2 − dY 2 = 1, non ci è d’aiuto nella soluzione dell’equazione di Pell.

Cerchiamo quindi un approccio diverso all’equazione di Pell ponendoci nel corpo quadratico Q( d).
Su questo corpo si ha √ √
X 2 − dY 2 = (X + dY )(X − dY )

e quindi, se (x, y) ∈ Z2 è una soluzione non-banale dell’Equazione di Pell con x ed y entrambi positivi,
deve aversi
√ 1 1 √ 1
|x − y d| = √ ≤ √ , che scriveremo brevemente |x − y d| < √ ,
x+y d 2y( d − ε) ≈ 2y d

ove | − | indica il valore assoluto


√ reale e ε è un opportuno numero reale 0 ≤ ε < 1. Ciò perchè la prima
uguaglianza dice che x e y d differiscono per un numero reale minore di 1 e quindi la loro somma è
maggiore del doppio del più piccolo tra i due addendi. In particolare, la disuguaglianza appena stabilita
significa che, se (x, y) ∈ Z2 è come sopra, si ha

x √ < 1
− d ≈ √ .
y 2
2y d

È chiaro che, se α è un qualsiasi numero irrazionale, si ha genericamente

x 1
min −α ≤ ;
x∈Z y 2y

quindi le soluzioni dell’equazione di Pell forniscono buone approssimazioni di d tramite numeri razionali.
Occupiamoci quindi in modo più approfondito del problema di trovare buone approssimazioni di numeri
irrazionali e cominciamo con il seguente

(∗)
Se ℓ = 2, si ha che 2α−1 | q 2 e 2α−1 | pq; quindi 2α−1 | q, perchè Mcd(p, q) = 1, e perciò 2α | 22(α−1) | q 2 , perchè
α ≥ 2.
I §.5 L’equazione di Pell 19

5.1 Teorema. (Dirichlet) Siano ξ ∈ R \ Q e Q un intero positivo. Allora, esistono degli interi x ed y
tali che
x 1
−ξ ≤ e 0 < y ≤ Q.
y yQ

dim. Si considerino i Q + 1 numeri reali

0, {ξ}, {2ξ}, . . . , {Qξ} ∈ [0, 1),

ove il simbolo {x} indica la parte frazionaria del numero reale x, ovvero {x} := x − [x], ove [x] =
max { n ∈ Z | n ≤ x }. Se si considerano i Q intervalli
 
n n+1
In = , , per n = 0, 1, . . . , Q − 1,
Q Q

allora esiste un indice n tale che {rξ}, {sξ} ∈ In , per due opportuni interi r < s. Si ha perciò

1
> |{rξ} − {sξ}| = |(s − r)ξ − ([sξ] − [rξ])|
Q

e quindi, posto x = [sξ] − [rξ] ∈ Z ed y = s − r ∈ Z>0 , si ha l’approssimazione richiesta nell’enunciato.


CVD 

Possiamo quindi ricavare una stima sulle ‘buone approssimazioni’ dei numeri irrazionali (che non vale
nel caso di numeri razionali).
x
5.2 Corollario. Se ξ ∈ R \ Q, esistono infinite frazioni ∈ Q, con Mcd(x, y) = 1, tali che
y

x 1
− ξ ≤ 2.
y y

x1 xn
dim. Se vi fosse un numero finito di tali approssimazioni, siano y1 , . . . , yn , si consideri

xi
0 < ε = min −ξ
1≤i≤n yi

1
(ove ε > 0 perchè ξ ∈/ Q). Allora, scelto Q > ε, ed applicato il Teorema di Dirichlet, si trova una
contraddizione con la minimalità di ε. CVD 

5.3 Remark. Facciamo una breve digressione, osservando che il risultato del Corollario precedente può essere
migliorato dalla disuguaglianza
x 1
−ξ ≤ √
y 2
y 5

che non è ulteriormente migliorabile. Il problema che√ci siamo posti, non è però la buona approssimazione di un
generico numero irrazionale, ma di numeri del tipo d con d ≥ 2, non quadrato in Z. In particolare, si tratta
di numeri algebrici e vogliamo ricordare un risultato fondamentale sulla ‘cattiva approssimabilità’ dei numeri
algebrici tramite numeri razionali, ovvero il seguente
20 Interi algebrici I §.6

Teorema. (Roth) Se α ∈ Q̄ ed ε > 0, vi è un numero finito di soluzioni alla disuguaglianza

x 1
− α ≤ 2+ε .
y y

Questo Teorema migliora risultati precedenti di Thue, Siegel e Dyson, ma non è un risultato effettivo, perchè
non dice come determinare le soluzioni e dà solo una stima sul loro numero.

Torniamo al problema iniziale, e consideriamo, in base al Corollario I.5.2, le infinite frazioni soddis-
facenti alla condizione
x √ 1
− d ≤ 2 con y > 0.
y y

Allora, moltiplicando per y|x + y d| > 0, si ottiene la disuguaglianza
√ √
2 2 |x + y d| 2y d + 1 √
|x − dy | ≤ ≤ ≤ 2 d + 1,
y y
ove si è utilizzata l’osservazione
√ 1 √
|x − y d| ≤ ⇒ x < 1 + y d.
y

Poichè x2 −dy 2 ∈ Z ed esiste un numero finito di interi soddisfacenti alla condizione n ≤ 2 d+1, possiamo
concludere che esiste un intero M per cui l’equazione X 2 − dY 2 = M ha infinite soluzioni (x, y) ∈ Z2 .
√Da questa osservazione possiamo√ricavare informazioni sulle soluzioni dell’equazione di Pell. Sia K =
Q( d) e si consideri il sottoanello Z[ d]; essendovi infinite soluzioni in Z2 dell’equazione X 2 − dY 2 = M
ed essendo Z/M Z × Z/M Z finito, esistono degli elementi
√ √ √ √
(x + y d)(x − y d) = M = (x′ + y ′ d)(x′ − y ′ d)

√ 

x + y d, √  x 6= x′

y y′
(5.4) √ in Z[ d] tali che .
′ ′
x +y d  x ≡ x′ (mod M )


y ≡ y ′ (mod M )

Allora si ha
√ √ √ √ √ √
(x + y d)(x′ − y ′ d) = A + B d ed (x′ + y ′ d)(x − y d) = A − B d

con (A, B) ∈ Z2 , perchè i fattori del secondo prodotto sono i coniugati dei fattori del primo; e quindi
2 2
(5.5) A2 − dB 2 = (x2 − dy 2 )(x′ − dy ′ ) = M 2 .
√ √
Inoltre, dalle ipotesi fatte su x + y d ed x′ + y ′ d, si ricava

A = xx′ − dyy ′ ≡ x2 − dy 2 ≡ 0 (mod M )




B = xy ′ − yx′ ≡ 0 (mod M )

e quindi A = M A′ , B = M B ′ , da cui si deduce, in base a (I.5.5), che (A′ , B ′ ) ∈ Z2 è una soluzione non
banale dell’equazione di Pell.
Possiamo quindi raccogliere le conseguenze della discussione sin qui fatta.
5.6 Proposizione. Fissato 0 < d ∈ Z non quadrato in Z, esistono infinite soluzioni non banali (x, y) ∈
Z2 dell’equazione X 2 − dY 2 = 1.
I §.6 Complementi. Unità di un corpo quadratico reale. 21

6. Complementi. Unità di un corpo quadratico reale.

Le soluzioni dell’equazione di Pell X 2 − dY 2√= 1 permettono di determinare delle unità dell’anello


degli interi Od del corpo quadratico (reale) Q( d), con d ≥ 2. Cominciamo con un’osservazione di
carattere generale sulle unità.
6.1 Proposizione. Sia K un’estensione finita di Q e sia B la chiusura integrale di Z in K. Un elemento
ξ ∈ B è invertibile in B se, e solo se, NK/Q (ξ) = ±1.

dim. Si osservi che NK/Q (ξ) ∈ Q ed è intero su Z, in quanto prodotto dei coniugati di ξ ∈ B e quindi,
essendo Z integralmente chiuso, si ha NK/Q (ξ) ∈ Z. Inoltre, l’applicazione NK/Q : K × → Q× è un
omomorfismo di gruppi moltiplicativi (cf. Proposizione I.2.11) e quindi NK/Q (B × ) ⊆ Z× = {±1}.
Viceversa, dato un elemento ξ ∈ B con NK/Q (ξ) = ±1, si ha che ξ −1 ∈ K è un prodotto di coniugati
di ξ, moltiplicato per ±1, e quindi ξ −1 è intero su Z e perciò appartiene a B. CVD 

Tornando all’anello Od , si ha quindi che l’elemento x + y d è invertibile se, e solo se,

NQ(√d)/Q (x + y d) = x2 − dy 2 = ±1;
√ √
in particolare, se (x, y) è soluzione dell’equazione di Pell, allora x + y d è invertibile in Z[ d] ⊆ Od .
Studiamo ora più in dettaglio la struttura del gruppo delle unità Od× e consideriamo perciò l’omo-
morfismo
Φ : Od× → R
.
ξ 7→ log |ξ|

Il nucleo di Φ è il sottogruppo {±1}, mentre l’immagine è un sottogruppo discreto (†) del gruppo additivo
−a a
dei numeri reali. Infatti, fissato a > 0, dalla condizione −a < log |ξ| < a si ricava
√ e < |ξ| < e e quindi
lo stesso vale per il coniugato ξ = ξ ; ovvero e < |ξ | < e . Ora ξ = r + s d ∈ Od e quindi r, s ∈ 21 Z
′ 1 −a ′ a

(cf. Proposizione I.4.2); inoltre, ξ ′ = r − s d, e perciò deve aversi

ξ + ξ′ ξ − ξ′ ea
|r| = < ea e |s| = √ <√ ; (6.2)
2 2 d d

ed in 21 Z vi è solo un numero finito di soluzioni per queste due disuguaglianze.


Dunque si ha la sequenza esatta

0 −−−−→ {±1} −−−−→ Od× −−−−→ Z −−−−→ 0

da cui si deduce (Z è un gruppo libero) che

Od× ∼
= {±1} × Z. (6.3)

Gli elementi di Od× che si proiettano sui generatori del gruppo ciclico sono dette le unità fondamentali
dell’anello Od . Le disuguaglianze (I.6.2) permettono di determinare in modo effettivo un’unità
√ fondamen-
tale, dovendo fare un numero finito di verifiche per determinare r ed s affinchè log |r + s d| sia minimo
(in valore assoluto).

Vogliamo ora raccogliere alcune osservazioni sull’equazione di Pell e sulle equazioni ad essa collegate.

(†)
Un sottogruppo H di (R, +) si dice discreto se, per ogni δ > 0, l’insieme H ∩ (−δ, δ) ha un numero finito di elementi.
In particolare, ogni sottogruppo discreto di (R, +) è ciclico ed è generato da un qualsiasi elemento di valore assoluto minimo
tra gli elementi non-nulli.
22 Interi algebrici I §.6

6.4 Remark. (Risoluzione esplicita dell’equazione


√ di Pell). Dalla discussione fatta in §.1, sappiamo che
esiste un numero intero positivo M ≤ 2 d + 1 per cui l’equazione X 2 − dY 2 = M ha infinite soluzioni
intere. Se prendiamo M 2 +1 soluzioni di questa equazione troviamo certamente due elementi soddisfacenti
alle condizioni (I.5.4), e quindi una soluzione dell’equazione di Pell. Ripercorriamo quindi la costruzione
del numero precedente al fine di ottenere un procedimento effettivo, che ci conduca a determinare una
soluzione non banale dell’equazione di Pell dopo un numero √ finito di passi.
Si considerino quindi delle buone approssimazioni di d, ovvero siano (xi , yi ) ∈ Z2 , tali che

xi √ 1
− d < 2, per i = 1, . . . , n, e sia 0 < y1 < y2 < · · · < yn .
yi yi

Vogliamo mostrare che si può fissare un intero positivo Q di modo che la buona approssimazione di d
costruita tramite il Teorema di Dirichlet (cf. Teorema I.5.1) sia diversa da quelle sin qui determinate.
Sia
xi √ 1
εi = − d < 2, per i = 1, . . . , n,
yi yi
ed osserviamo che, per ogni i = 1, . . . , n, si ha

1 ≤ |x2i − dyi2 | = |xi + yi d|yi εi ;

da cui si ottiene la disuguaglianza

1 xi √ √
≤ − d yi2 ≤ yi2 (2 d + 1)).
εi yi

In particolare, poichè gli yi sono crescenti, si ha che

1
√ < ε = min εi .
(1 + 2 d)yn2 i=1,...n


Dunque, se si fissa un intero Q > (1 + 2 d)yn2 , si ottiene tramite il Teorema di Dirichlet una coppia di
interi (xn+1 , yn+1 ) ∈ Z2 , con 1 ≤ yn+1 ≤ Q, tale che

xn+1 √ 1 ε
εn+1 = − d < < ≤ε
yn+1 yn+1 Q yn+1

e quindi si tratta di una√buona approssimazione di d, diversa dalle precedenti.
Q > (1 + 2 d)yn2 , deve essere un intero,
Poichè √ √ una scelta minimale può essere fatta prendendo
Q ≤ (2 + 2 d)yn2 ; ed essendo yn+1 ≤ Q ≤ (2 + 2 d)yn2 , otteniamo così una√limitazione effettiva per
la grandezza del denominatore yn+1 di una nuova buona approsimazione di d che può quindi essere
determinata dopo un numero finito di tentativi(∗) .

6.5 Remark. (Risoluzione dell’equazione X 2 − dY 2 = m). Ci occuperemo ora di descrivere un metodo


effettivo per determinare le soluzioni intere dell’equazione X 2 − dY 2 = m. Supponiamo che esista una
soluzione (x, y) ∈ Z2 e che (u, v) ∈ Z2 sia una soluzione non banale dell’equazione di Pell, con u > 0 < v.
Poniamo √ √
α = x+y d e ξ = u + v d,
(∗) √
Si è cosı̀ ottenuta una stima di tipo esponenziale della crescita dei denominatori delle buone approssimazioni di d,
√ 2n
ovvero yn ≤ (2 + 2 d) . Tale stima non è ottimale, ma ricordiamo che una possibile stima ottimale è ancora di tipo
esponenziale (cf. ???).
I §.6 Complementi. Unità di un corpo quadratico reale. 23
√ √
e ricordiamo che ξ è invertibile
√ in Z[ d] ed il suo inverso è il coniugato (algebrico) ξ ′ = u − v d; inoltre,
indicato con α′ = x − y d √ il coniugato di α, si ha per costruzione αα′ = m.
Si consideri l’anello Z[ d] immerso in R (d > 0) e sia k un intero per cui si abbia
s
|m| α p
≤ k < |m|ξ.
ξ ξ
√ √ √
Si ponga β = ξαk = x′ + y ′ d ∈ Z[ d] e, indicato con β ′ = x′ − y ′ d il suo coniugato algebrico, si ha
α′ m m
β′ = = ξk = ,
ξ ′k α β
e quindi ββ ′ = m, ovvero (x′ , y ′ ) è una soluzione dell’equazione X 2 − dY 2 = m e si ha
m p
|β ′ | ≤ q = |m|ξ,
|m|
ξ

da cui si ricava r
′ β + β′ p ′ β − β′ |m|ξ
|x | = ≤ |m|ξ ed |y | = √ ≤ . (6.6)
2 2 d d
Dunque, se esiste una soluzione dell’equazione X 2 − dY 2 = m esiste anche una soluzione della stessa
equazione, le cui coordinate sono limitate da una grandezza che dipende solo da m, d e da una qualsiasi
soluzione non banale dell’equazione di Pell. L’insieme delle soluzioni dell’equazione X 2 − dY 2 = m
soddisfacenti alle condizioni (I.6.6) è un insieme finito e dunque l’equazione X 2 − dY 2 = m ha soluzioni
in Z2 se, e solo se, vi sono soluzioni (x′ , y ′ ), soddisfacenti alle condizioni (I.6.6). Inoltre, ogni soluzione di
tale equazione
√ si ottiene da una di quelle soddisfacenti alle condizioni dette e da un’opportuna potenza
di ξ = u + v d, ove (u, v) ∈ Z2 è una soluzione non banale dell’equazione di Pell.

6.7 Remark. [Soluzioni intere e congruenze] Consideriamo l’equazione a coefficienti interi X 2 − dY 2 =


m. Per ogni intero positivo N , possiamo considerare la congruenza X 2 −dY 2 ≡ m (mod N ) e ci chiediamo
che relazioni ci siano tra eventuali soluzioni intere dell’equazione e le soluzioni delle congruenze, al variare
di N . È ovvio che, se (x, y) ∈ Z2 è una soluzione dell’equazione allora, riducendo modulo N , si ottiene
una soluzione a ciascuna delle congruenze. Però, l’esistenza di soluzioni alle congruenze per ogni N è una
condizione necessaria, ma non sufficiente per l’esistenza di soluzioni intere dell’equazione di partenza(∗) .
Infatti, si potrebbe mostrare (ma non lo faremo) che l’equazione X 2 − 82Y 2 = 2 non ha soluzioni intere,
mentre le congruenze ad essa associate sono risolubili per ogni intero N .
Dimostriamo quindi il seguente risultato sulla risoluzione di congruenze.
6.8 Proposizione. Siano d ed m ≥ 2 due interi. Allora esiste p0 = p0 (m, d) tale che
(i) se p > p0 , la congruenza x2 − dy 2 ≡ m (mod ph ) ha soluzione per ogni h;
(ii) se p ≤ p0 esiste un esponente h0 tale che la congruenza x2 − dy 2 ≡ m (mod ph ) ha soluzione per ogni
h se, e solo se la congruenza ha soluzione per h = h0 .

dim. Sia h = 1. e si osservi che in tal caso la congruenza x2 − dy 2 ≡ m (mod p) ha soluzione. Se p = 2,


è una verifica immediata; se p è dispari, si può osservare che le due funzioni x 7→ x2 ed y 7→ m + dy 2
assumono entrambe p+1 2 valori distinti in Fp ; quindi ci sono almeno due valori coincidenti, ovvero una
soluzione della congruenza. Inoltre, posto f (X, Y ) = X 2 − dY 2 − m ∈ Z[X], si ha
∂f ∂f
= 2X e = −2dY ;
∂X ∂Y
quindi il risultato è una conseguenza del lemma qui sotto, per enunciare il quale introduciamo la notazione
pr || n per indicare che pr è la massima potenza di p che divide l’intero n.
(∗)
Vedremo nella seconda parte del corso come la condizione diventi necessaria e sufficiente per i polinomi omogenei di
secondo grado (forme quadratiche) in forza del Teorema di Hasse-Minkowsky.
24 Interi algebrici I §.6

6.9 Lemma. Siano f (X) ∈ Z[X1 , . . . , Xn ] e p un primo razionale. Supponiamo che esista una n-upla
di interi a = (a1 , . . . , an ) ∈ Zn per cui
∂f ∂f
pc || Mcd( ∂x 1
(a), . . . , ∂x n
(a)), pb || f (a), b > 2c.

Allora la congruenza f (x) ≡ 0 (mod ph ) ha soluzioni per ogni esponente h.

dim. Per ipotesi, si ha f (a) ≡ 0 (mod p)b . Quindi supponiamo che per un intero positivo h, esista b ∈ Zn
tale che
• f (b) = ph δ, e p6 | δ;
∂f
• ∂x 1
(b) = pc ξi per i = 1, . . . , n, ove p6 | ξi per qualche i;
• h > 2c.
Sotto tali ipotesi, mostriamo che esistono degli interi q1 , . . . , qn ed un esponente µ tali che b∗ = b+pµ q
sia una soluzione della congruenza f (b∗ ) ≡ 0 per una potenza di p di esponente superiore ad h e che siano
ancora soddisfatte le condizioni scritte sopra con b∗ in luogo di b.
Applicando la Formula di Taylor al polinomio f calcolato in b∗ , si ottiene
n n
X ∂f X
f (b∗ ) ≡ f (b) + pµ qi (b) ≡ ph δ + pµ+c qi ξi (mod p2µ ).
i=1
∂Xi i=1

Quindi, posto µ = h− c > c, poichè gli ξi non sono tutti nulli modulo p, si possono trovare degli opportuni
qi per cui si abbia
n
!

X
h
f (b ) ≡ p δ + qi ξi ≡ 0 (mod p2µ )
i=1

e 2µ = 2h − 2c > 2h − h = h. Inoltre, poichè µ > c, si ha si ha

∂f ∗ ∂f
(b ) ≡ (b) (mod pc+1 ),
∂Xi ∂Xi

e quindi si ha ancora
∂f
pc || Mcd( ∂X 1
(b∗ ), . . . , ∂X
∂f
n
(b∗ ));
e 2µ > h > 2c. Quindi la costruzione può proseguire per esponenti arbitrariamente grandi di p. CVD

Ciò conclude anche la dimostrazione della Proposizione.

6.10 Remark. (Risoluzione della generica equazione di secondo grado). Nell’osservazione precedente,
abbiamo descritto un metodo esplicito per determinare se l’equazione X 2 − dY 2 = m abbia soluzioni
intere. Vogliamo ora occuparci di determinare soluzioni intere dell’equazione

(6.11) aX 2 + bXY + cY 2 + dX + eY + f = 0

a coefficienti interi e con a 6= 0 (a meno di facili cambiamenti di variabile, si vede che questa condizione
non è restrittiva). Se si considerano i polinomi

T = 2aX + bY + d


U = (b2 − 4ac)Y + bd − 2ae

e si pone
α = b2 − 4ac, β = bd − 2ae, γ = 4af − d2 ,
I §.6 Complementi. Unità di un corpo quadratico reale. 25

allora, le soluzioni intere (x, y) di (I.6.11), sono in corrispondenza con i numeri (u, t) ∈ Z2 soddisfacenti
alle condizioni  2 2 2
 u − αt = β + αγ

u ≡ β (mod α) .

αt ≡ b(u − β) + αd

Sappiamo dalla discussione precedente che, se α > 0 e non è un quadrato in √ Z, le soluzioni


√ (u, t)
2 2 2
dell’equazione
√ u − αt = β + αγ sono in corrispondenza con gli elementi u + t α ∈√ Z[ α] del tipo
u + t α = λi ξ k , ove λi varia in un opportuno insieme finito di soluzioni, e ξ = x0 + y0 α, soddisfa alla
condizione ξξ ′ = 1, ove con ξ ′ indichiamo il coniugato
√ algebrico di ξ.
Osserviamo che,√ modulo l’ideale J = 2aαZ[ d], vi è solo un numero finito di potenze di ξ distinte,
perchè l’anello Z[ d]/J è finito; quindi, devo verificare su un numero finito di soluzioni dell’equazione
u2 − αt2 = β 2 + αγ se sono soddisfatte le congruenze scritte sopra e quindi si ha cosı̀ una procedura
effettiva per verificare se la generica equazione di secondo grado ha soluzioni intere.
Notiamo a margine di questa discussione che, più in generale, non esistono analoghe procedure
per determinare le soluzioni intere di equazioni algebriche di grado elevato. In generale è vero che, se
f (X, Y ) ∈ Z[X, Y ] è un polinomio assolutamente irriducibile, allora l’equazione f (X, Y ) = 0 si può
risolvere in Z se, e solo se, il genere della curva è 0 oppure 1.
Concludiamo questa sezione osservando come le osservazioni fatte in questo numero per i corpi
quadratici reali si generalizzino ad estensioni finite di Q.
Sia dunque K un’estensione finita di Q, di grado n, e supponiamo che delle n immersioni di K in C
(cf. Proposizione I.2.3), ve ne siano r1 la cui immagine è contenuta in R, mentre le rimanenti 2r2 hanno
elementi non reali nell’immagine(∗) . Allora, se indichiamo con OK la chiusura integrale di Z in K, si ha
ancora che il gruppo delle unità è (cf. Proposizione I.6.1)
×

OK = x ∈ O | NK/Q (x) = 1 .

Inoltre, il Teorema di Dirichlet si può estendere(†) e mostrare che


× ∼
OK = µK × Zr1 +r2 −1 ove µK = { x ∈ K | xr = 1, ∃r ≥ 1 } . (6.12)

Osserviamo infine che, analogamente al caso dei corpi quadratici, dopo aver fissato una base intera di
O, la determinazione di elementi x ∈ O tali che NK/Q (x) = 1 oppure NK/Q (x) = 1 = m, si trasforma
nel problema di determinare le soluzioni intere di una certa funzione polinomiale a coefficienti interi in n
indeterminate e queste sono la generalizzazione dell’equazione di Pell e dell’equazione X 2 − dY 2 = m.

(∗)
Le immersioni non-reali sono in numero pari perchè per ogni tale immersione σ : K → C viè anche l’immersione σ̄,
ottenuta componendo σ con il coniugio di C; ed è ovviamente diversa da σ perchè σ(K) 6⊂ R.
(†)
Per una dimostrazione di (I.6.12) si veda ad esempio H. Hida Elementary Theory of L-functions and Eisenstein series,
Cambridge Univ. Press 1993, § 1.2.
26 Interi algebrici I §.7

7. Corpi finiti. Reciprocità quadratica.

In questa sezione vogliamo raccogliere alcune proprietà fondamentali dei corpi finiti e delle loro
estensioni. La prima osservazione è contenuta nel seguente
7.1 Teorema. (Wedderburn) Ogni corpo finito è commutativo.

dim. Sia F un corpo finito e sia Z il suo centro, ovvero Z = { x ∈ F | xy = yx ∀y ∈ F }. Allora Z è un


corpo commutativo (campo) con un numero finito di elementi, sia #(Z) = q. In particolare, F è uno
spazio vettoriale su Z e quindi si ha #(F ) = q n , ove n = dimZ F . Consideriamo su F × la relazione di
equivalenza (coniugio)
x ∼ y ⇐⇒ y = zxz −1 ∃z ∈ F ;
ed indichiamo con C1 , . . . , Cr le classi di coniugio in F × . In particolare, si ha
r
X
#(F × ) = q n − 1 = #(Ci ),
i=1

e quindi cerchiamo di stimare il numero di elementi contenuti in una classe di coniugio Ci . Ciò sig-
nifica, fissato qualunque elemento x di tale classe, determinare il numero di elementi distinti contenuti
nell’immagine dell’applicazione y 7→ yxy −1 ed è immediato verificare che yxy −1 = zxz −1 se, e solo se,
z = yt, per un qualche t ∈ Z ∗ (x), ove Z ∗ (x) = { u ∈ F × | ux = xu } è il centralizzatore di x. Ora
Z ∗ (x) ∪ (0) è un sottocampo di F che contiene Z, quindi

#(F × ) qn − 1
#(Ci ) = = ,
#(Z ∗ (x)) q δ(x) − 1

ove δ(x) = dimZ (Z ∗ (x) ∪ (0)) | n. Si conclude che, scelti dei rappresentanti x1 , . . . , xr in ogni classe di
coniugio, si ha
r r
X qn − 1 X qn − 1
qn − 1 = = q − 1 + ,
i=1
q δ(xi ) − 1 i=q
q δ(xi ) − 1

ove abbiamo supposto che le prime q − 1 classi siano quelle contenenti gli elementi non nulli del centro Z
di F .
Sia ora φn (X) il polinomio ciclotomico di ordine n, allora, φn (X) | (X n − 1), e (φn (X), X m − 1) = 1
ϕ(n)
Y
per m < n, perchè φn (X) = (X − ζi ) ove ζ1 , . . . , ζϕ(n) sono tutte e sole le radici n-esime primitive di
i=1
1 (cf. I.4.4). Dunque, se δ è uno qualunque dei δ(xi ), per i = q, . . . , r, poichè δ | n, si ha

Xn − 1
= φn (X)ψ(X) ove ψ(X) ∈ Z[X].
Xδ − 1
n
qn −1
Ciò è vero per ciascuno dei quozienti XX −1
δ(xi ) −1 e, perciò φn (q) divide ciascuno dei quozienti qδ −1
e divide
n
q − 1, si conclude che divide q − 1 e ciò è assurdo se n > 1, perchè

ϕ(n)
Y
|φn (q)| = |q − ζi | ≥ (q − 1)ϕ(n) ,
i=1

essendo, per ogni i. |q − ζi | ≥ |q| − |ζi | = q − 1. CVD 

Un’altra osservazione fondamentale è la seguente.


I §.7 Corpi finiti. Reciprocità quadratica. 27

7.2 Teorema. Sia F un campo finito. Il gruppo moltiplicativo F × è ciclico.

dim. Sia x ∈ F × un elemento di ordine massimo e sia N il suo ordine. Allora, preso comunque y ∈ F × ,
l’ordine M di y deve dividere l’ordine di x; infatti, se fosse M = ℓa M1 ed N = ℓb M1 , ove ℓ è un primo
b
razionale, ℓ6 | N1 e 0 ≤ b < a sono numeri interi; si avrebbe che l’ordine di y M1 xℓ sarebbe divisibile sia
per ℓa che per N1 , ed essendo coprimi, l’ordine dovrebbe essere divisibile per ℓa N1 > N , contro l’ipotesi
che N sia il massimo ordine.
Dunque, se N = M K, (K ∈ Z), allora sia y che xjK , per j = 0, . . . , M − 1, sono elementi di F che
soddisfano all’equazione X M = 1, e tale equazioni ha al più M radici distinte nel corpo F . Si conclude
che y = xjK , per qualche j = 0, . . . , M − 1, visto che le potenze di x con esponenti compresi tra 0 ed
N − 1 sono tutte distinte. Si conclude che x è un generatore di F × . CVD 

Possiamo trarre le prime conseguenze dei due Teoremi testé dimostrati sulla struttura dei corpi finiti.
7.3 Remark. Un campo finito F , di caratteristica p > 0, è uno spazio vettoriale di dimensione finita
sul campo primo Fp e quindi il numero di elementi di F è q = pn e tutti gli elementi di F × sono radici del
polinomio X q−1 − 1. Si conclude che gli elementi di F sono tutte e sole le radici dell’equazione X q − X
(a coefficienti in Fp ) e quindi, in una chiusura algebrica di Fp , vi è un unico campo finito con q elementi
e perciò F è un’estensione normale e separabile di Fp (cf. I.2.5).
D’ora in poi, indicheremo con Fq , il campo con q elementi. Osserviamo che Fq ⊂ Fqm , per ogni
intero m ≥ 1, ed un automorfismo di Fqm , che lasci fisso Fq è φq : x 7→ xq . Dunque φq ∈ Gal(Fqm /Fq ) e
questo gruppo ha ordine [Fqm : Fq ] = m (cf. I.2.7); poichè l’ordine di φq è esattamente m (come si verifica
applicandolo ripetutamente ad un generatore del gruppo ciclico F× qm ), si conclude che Gal(Fqm /Fq ) è un
gruppo ciclico, generato da φq .
La struttura dei campi finiti (e delle loro estensioni) ha delle interessanti applicazioni. Ad esempio,
da ciò si deduce che esistono polinomi irriducibili in Z[X] la cui √
riduzione ad Fp [X] è invece riducibile per

p >> 0. Infatti, se si considera l’estensione biquadratica Q( a, b), ove b, a e b/a√ non siano
√ quadrati in
Q, si verifica facilmente che un elemento primitivo per tale √ estensione
√ (cf. I.2.2) è a + b, che soddisfa
ad un polinomio irriducibile, di grado 4. Ma aggiungere a e b al campo Fp , per p >> 0, non produce
un’estensione di grado maggiore di 2, perchè vi è un’unica estensione di grado 2 in una chiusura algebrica
F̄p . Però ricordiamo che se f (X) ∈ Z[X] è irriducibile e di grado > 1, allora esistono infiniti primi p tali
che f non abbia radici in Fp .
Consideramo ora un’altra applicazione. Sia f (X) = X 3 + aX + b un polinomio irriducibile sul campo
K ed indichiamo con ∆ = −4a3 − 27b2 il suo discriminante. Se α1 , α2 , α3 sono le radici di f (X), ci
chiediamo quando accade che K(α1 ) sia il corpo di decomposizione di f (X). Ciò è equivalente a chiedere
che K(α1 ) sia normale su K e, ciò corrisponde a chiedere che u = (α1 − α2 )(α1 − α3 )(α2 − α3 ) sia in
K(α1 ) e, ricordando che u2 = ∆ ∈ K e che [K(α1 ) : K] = 3, si conclude u deve appartenere a K, ovvero
che K(α1 ) è normale se, e solo se, ∆ è un quadrato in K.
Ogni estensione di un corpo finito è normale e quindi possiamo enunciare il seguente
7.4 Corollario. Siano a e b due interi tali che la riduzione di X 3 + aX + b sia irriducibile in Fp [X].
Allora −4a3 − 27b2 è un quadrato in Fp .
Il seguito di questa sezione sarà dedicato alla determinazione dei quadrati nei corpi primi. Precisa-
mente, fissato un primo razionale p > 2, vogliamo determinare quando accade che un numero intero a è
un quadrato in Fp (†) . Cominciamo con una definizione.
7.5 Definizione. Diremo che l’intero a è un residuo quadratico modulo p, se si può risolvere la con-
gruenza x2 ≡ a (mod p).

(†)
È immediato verificare che ogni elemento di un corpo finito di caratteristica 2 è un quadrato, perchè, in tal caso,
l’applicazione x 7→ x2 è un omomorfismo iniettivo.
28 Interi algebrici I §.7

Al variare di a in Z si definisce la funzione



  
a 0 se a ≡ 0 (mod p)
[Simbolo di Legendre] = 1 se a è residuo quadratico modulo p .
p 
−1 se a non è residuo quadratico modulo p

Richiamiamo
  di seguito le proprietà
   del  simbolo
  di Legendre.
a p−1 a b
• p ≡ a 2 (mod p) e p p = abp , come si verifica direttamente dalla definizione
(∗)
. In
particolare, da quanto visto si deduce che

−1 se p ≡ 3 (mod 4)
  
−1 p−1
(7.6) = (−1) 2 =
p 1 se p ≡ 1 (mod 4)

e quindi non ci resta che calcolare il valore del simbolo di Legendre sui primi razionali. Per quanto
riguarda
  2, si può fare un calcolo diretto.
2
• p = 1 se, e solo se, p ≡ ±1 (mod 8). Per dimostrarlo possiamo ragionare come segue. Indichiamo
con i una radice quarta primitiva di 1 in F̄p ed osserviamo che (1 + i)2 = 2i e quindi in F̄p si ha
 
2 p−1 p−1
i 2 = (2i) 2 = (1 + i)p−1
p

e quindi, moltiplicando ambo i membri per (1 + i), si ottiene

1 + ip −1 se p ≡ ±3 (mod 8)
  
2
(7.7) = p−1 = .
p i 2 (1 + i) 1 se p ≡ ±1 (mod 8)

Resta quindi da calcolare il valore del simbolo di Legendre sui primi dispari ed il risultato fondamen-
tale in questo senso è dato dalla legge di reciprocità quadratica, ovvero
7.8 Teorema. [Gauss] Siano p ed ℓ due primi dispari allora
   
ℓ p−1 ℓ−1 p
= (−1) 2 2 .
p ℓ

dim. Sia φℓ (X) ∈ Z[X] il polinomio ciclotomico di ordine ℓ (cf. I,§.4) ed indichiamo con f (X) la sua
riduzione ad Fp [X]. Sia ζ una radice di φℓ (X) e si considerino
Y (ℓ−1)(ℓ−2) Y
D= (ζ a − ζ b ) e ∆ = D2 = (−1) 2 (ζ a − ζ b )
1≤b<a≤ℓ−1 1≤b6=a≤ℓ−1

(ℓ−1)(ℓ−2) ℓ−1
ed osserviamo che, essendo ℓ dispari, 2 ha la stessa parità di 2 e quindi si può semplificare
l’esponente di −1.
Supponiamo vero il seguente
   
Claim. ∆ p = pl

(∗)
Si può osservare che, si ha la sequenza esatta di gruppi moltiplicativi

ψ
1 −−−−−→ (F× 2 ×
p ) −−−−−→ Fp −−−−−→ {±1} −−−−−→ 1

p−1
ove ψ(x) = x 2 ; e inoltre, se Z ∋ a 6≡ 0 (mod p), il simbolo di Legendre di a coincide con l’immagine tramite ψ della
riduzione ā ∈ Fp di a.
I §.7 Corpi finiti. Reciprocità quadratica. 29

Ed osserviamo che da questa uguaglianza si deduce la tesi con un calcolo diretto; infatti, si ha

ℓ−1 ℓ−1
ℓ−1 Y ℓ−1 Y Y
∆ = (−1) 2 (ζ a − ζ b ) = (−1) 2 ζa (1 − ζ c )
1≤b6=a≤ℓ a=1 c=1
c6≡−a (mod ℓ)

e, moltiplicando e dividendo per uno stesso fattore, si ottiene

ℓ−1 ℓ−1
ℓ−1 Y ζa Y ℓ−1
∆ = (−1) 2
−a
(1 − ζ c ) = (−1) 2 ℓℓ−2
a=1
1 − ζ c=1

ove si osservi che


ℓ−1 ℓ−1 ℓ−1
Y Y Y ℓ(ℓ−1)
ℓ = φℓ (1) = (1 − ζ c ) = (1 − ζ −a ) e ζa = ζ 2 = 1.
c=1 a=1 a=1

   
∆ p
Dunque, dall’uguaglianza p = l , si deduce

ℓ−1
!  ℓ−1  ℓ−2
ℓℓ−2
    
p (−1) 2 −1 2
ℓ p−1 ℓ−1 ℓ
= = = (−1) 2 2 ,
l p p p p
  p−1
−1
perchè p = (−1) 2 ed ℓ − 2 è dispari.
 

Occupiamoci quindi di dimostrare il Claim e consideriamo p . Nelle notazioni dell’inizio della
dimostrazione, si ha che ∆ è un quadrato in Fp se, e solo se, D ∈ Fp , ovvero se, e solo se, φp (D) = D
ove φp è l’endomorfismo di Frobenius di Fp (cf. Remark I.7.3). Consideriamo quindi il polinomio ridotto
f (X) ∈ Fp [X], e sia Fq il suo campo di decomposizione, con q = pr . Ogni elemento di F× q , è una radice
del polinomio X q−1 − 1, e quindi deve aversi che ℓ | (pr − 1) ed r è il minimo esponente di p per cui si ha
questa divisibilità. Ciò significa che i fattori irriducibili di f (X) in Fp [X] sono tutti dello stesso grado r,
ovvero
f (X) = f1 (X) . . . fs (X), con deg fi (X) = r, per i = 1, . . . , s, ed rs = ℓ − 1.
L’endomorfismo φp agisce sui fattori di D come una permutazione e, per quanto visto, questa permutazione
deve essere il prodotto di s-cicli di ordine r, ovvero si ha

sgn φp = (−1)(r+1)s = (−1)(ℓ−1)+s = (−1)s

e dunque ∆ è un quadrato in Fp se, e solo se, s è pari, ovvero


 

= (−1)s ;
p
 
p
quindi dobbiamo dimostrare che ℓ = 1 se, e solo se, s è pari. Sia F× h
ℓ = hgi e sia p̄ = g ; dunque p è un
quadrato in Fℓ se, e solo se, h è pari. Ricordiamo che ℓ | (pr − 1) e quindi g hr = 1, da cui si deduce che
rs = ℓ − 1 | rh e quindi s | h. Dunque, se s è pari anche h lo è. Se s fosse dispari e h = ks pari, allora
anche r dovrebbe essere pari, perchè il prodotto rs = ℓ − 1 lo è, e quindi si avrebbe

rh r
ℓ − 1 = rs | = h,
2 2
30 Interi algebrici I §.7

contro l’ipotesi che r sia il minimo intero che soddisfa alla condizione g hr = 1. Ciò conclude la di-
mostrazione. CVD 
7.9 Remark. [Un’altra dimostrazione della reciprocità quadratica] Riportiamo un’altra possibile di-
mostrazione del Teorema I.7.8 basata sulla costruzione, tramite una somma di Gauss, di una radice di
±ℓ in una chiusura algebrica di Fp . Sia quindi F̄p una chiusura algebrica di Fp e sia ω ∈ F̄p una radice
ℓ-esima primitiva di 1. Si consideri l’elemento (somma di Gauss)
X x
y= ω x ∈ F̄p ;

x∈Fℓ

allora si ha
ℓ−1
(i) y 2 = (−1)
  ℓ;
2

p
(ii) y p−1 = ℓ ;
e da queste proprietà si deduce la legge di reciprocità quadratica con un calcolo diretto. Dimostriamo
quindi gli asserti enunciati sopra. Per quanto riguarda (i), dalla moltiplicatività del simbolo di Legendre,
si deduce " #2
X x X  xz  X X  u(t − u) 
2 x
y = ω = ω x+z = ωt .
ℓ ℓ ℓ
x∈Fℓ x,z∈Fℓ t∈Fℓ u∈Fℓ

Inoltre, possiamo supporre u ∈ F×ℓ e si ha

− u2 1 − u−1 t 1 − u−1 t
      
u(t − u) ℓ−1
= = (−1) 2 ;
ℓ ℓ ℓ ℓ
e
 X  
1

 =ℓ−1 se t = 0



X  u(t − u)  ℓ−1 X 1 − u−1 t
 
ℓ−1

 ×
u∈Fℓ
= (−1) 2 = (−1) 2 .
ℓ ℓ    X s
1
×
u∈Fℓ u∈F×


 − ℓ + = −1 se t =
6 0



 ×
s∈Fℓ

Dunque, possiamo concludere che


 
ℓ−1 X ℓ−1
y 2 = (−1) 2 ℓ − 1 − ω t  = (−1) 2 ℓ,
t∈F×

" #
X X
t t
essendo ω = ω − ω 0 = −1. Ciò conclude la dimostrazione di (i).
t∈F× t∈Fℓ

Per quanto riguarda (ii), basta ricordare che φp : a 7→ ap è un automorfismo in ogni estensione finita
di Fp per concludere che
X x X  zp−1   −1 
p
 
p
p xp z
y = ω = ω = y= y.
ℓ ℓ ℓ ℓ
x∈Fℓ z∈Fℓ

Dunque, mettendo insieme (i) e (ii), si conclude


 
p h ℓ−1
i p−1
2 ℓ−1 p−1
 

= y p−1 = (−1) 2 ℓ = (−1) 2 2 .
ℓ p
I §.7 Corpi finiti. Reciprocità quadratica. 31

Infine, vogliamo osservare che presa in luogo di ω ∈ F̄p , una radice ℓ-esima primitiva di 1, ζℓ ∈ Q̄, e
posto
X x
η= ζℓx ∈ Z[ζp ],

x∈Fℓ

si ottiene con calcoli analoghi a quelli fatti sopra, che Q( ℓ) ⊆ Q(ζp ) e questo è un caso particolare di
un importante risultato (cf. ??? per la dimostrazione):
Teorema. [Kronecker-Weber] Ogni estensione abeliana di Q è ciclotomica.
7.10 Remark. [Irriducibilità di φℓ (X) ∈ Z[X]] Possiamo usare alcune delle considerazioni fatte nella
dimostrazione del Teorema I.7.8 per ottenere un’altra dimostrazione dell’irriducibilità in Q[X] del poli-
nomio ciclotomico φℓ (X) = X ℓ−1 + X ℓ−2 + · · ·+ 1. Infatti, se fosse φℓ (X) = g(X)h(X) in Z[X], riducendo
modulo p, si avrebbe

φ̄ℓ (X) = f1 (X) . . . fs (X), con deg f1 (X) = · · · = deg f1 (X) = rp = min { α ∈ N | pα ≡ 1 (mod ℓ) } ,

ove ciascuno degli fi (X) è irriducibile in Fp [X]. Allora, rp deve dividere deg g(X) = γ < ℓ − 1. Dunque,
posto m = Mcd(γ, ℓ − 1), dovrebbe aversi che rp | m per ogni primo p. Invece possiamo mostrare(∗) che,
per ogni divisore proprio m di ℓ − 1, esistono infiniti primi p tali che rp 6 | m.
Fissato un tale m, osserviamo che gli elementi di F× ℓ il cui periodo divide m, formano un sottogruppo
proprio Γ ⊂ F×
ℓ , e quindi dobbiamo mostrare che esistono infiniti primi p ∈ Z, la cui classe modulo ℓ non
appartiene a Γ. Se p1 , . . . , ps sono primi la cui classe modulo ℓ non stà in Γ, scelto un intero a, tale che
s
Y
ā ∈
/Γ e Mcd(a, pi ) = 1,
i=1

s
Y
è sufficiente osservare che tra i fattori primi di ℓ pi + a c’è un primo diverso da p1 , . . . , ps .
i=1

7.11 Remark. [Soluzioni intere dell’equazione a2 + b2 = p] Abbiamo osservato (cf. I.7.6) che −1 è un
residuo quadratico modulo p se, e solo se, p ≡ 1 (mod 4). Vogliamo mostrare che, sotto tale ipotesi sul
primo p, possiamo dedurre dal Teorema di Dirichlet sulle approssimazioni diofantee (cf. Teorema I.5.1)
l’esistenza di soluzioni intere per l’equazione a2 + b2 = p.
Sia r un intero tale che r2 ≡ −1 (mod p) ed osserviamo che, se (a, b) ∈ Z2 è una soluzione dell’equzione
proposta, allora deve aversi a2 + b2 ≡ 0 (mod p) e quindi a ≡ rb (mod p); e non è restrittivo supporre

0 < a, b < p. Dunque, deve esistere un intero m tale che

√ r m 1
|rb − mp| < p ovvero − < √ .
p b b p

r √
Siamo quindi nelle condizioni per applicare il citato Teorema di Dirichlet, con ξ = p e Q = [ p] (parte

intera di p). Dunque, esistono degli interi x ed y tali che

r x 1 √
− < √ e 1 ≤ y ≤ [ p].
p y y[ p]

(∗)
La dimostrazione che verrà esposta si basa su un’osservazione elementare; ci limitiamo a menzionare il fatto che il
risultato in questione si poteva anche dedurre dal seguente
Teorema. [Dirichlet] Se Mcd(a, b) = 1, esistono infiniti primi p tali che p ≡ a (mod b).

La dimostrazione di questo risultato è però di gran lunga più difficile degli argomenti che esporremo.
32 Interi algebrici I §.7

Quindi |xp − ry| < √p e, posto z = xp − ry, deve aversi


[ p]

√ p2
y 2 + z 2 ≡ 0 (mod p) e 0 < y 2 + z 2 < [ p]2 + √ 2 < 3p,
[ p]

Dunque(†) o si ha y 2 + z 2 = p e cosı̀ si è determinata la soluzione, oppure y 2 + z 2 = 2p, in tal caso y e z


2 2
devono essere entrambi dispari e si ha y+z 2 + y−z
2 = p.  
Osserviamo infine che, in generale non è vero che, fissato d con dp = 1, esistano soluzioni dell’e-
quazione x2 − dy 2 = p, ma si potrebbe dimostrare che esiste un intero λ (dipendente da d, tale che
x2 − dy 2 = λp. Non dimostriamo questa affermazione.
Concludiamo questa sezione sui campi finiti, mostrando che questi fanno parte di una classe più
generale di campi.
7.12 Definizione. Un campo K si dice di classe C1 se, preso comunque un polinomio omogeneo f (X) ∈
K[X1 , . . . , Xn ], di grado minore di n, f (X) ha uno zero non banale in K n .
I campi finiti sono di classe C1 , come si deduce dal seguente
7.13 Teorema. [Chevalley-Warning] Siano p un primo razionale e q = pr . Dato f (X) ∈ Fq [X1 , . . . , Xn ],
di grado d < n, allora
Nf := # x ∈ Fnq | f (x) = 0 ≡ 0 (mod p).
 

dim. Dato x ∈ Fqn , si ha


1 se f (x) 6= 0

q−1
f (x) = ;
0 se f (x) = 0
quindi, la classe di Nf modulo p, è uguale a
X
N̄f = (1 − f (x)q−1 ) ∈ Fq .
x∈Fqn

Si tratta quindi di mostrare che la somma in questione è nulla in Fq .


q−1 d1 dn
È quindi sufficiente dimostrare che, dato
Xun monomio che compare in f (X) , sia X1 · · · Xn , con
d1 dn
d1 + · · · + dn ≤ (q − 1)d < (q − 1)n, si ha x1 · · · xn = 0. Si osservi che
x∈Fqn

X n X
Y
(7.14) xd11 · · · xdnn = xdi i ,
x∈Fqn i=1 xi ∈Fq

e quindi non è restrittivo supporre di > 0 per ogni i = 1, . . . , n, perchè altrimenti uno almeno dei fattori
del prodotto è nullo (in Fq ). Consideriamo quindi
X
xd , con d > 0.
x∈Fq

(†) √ p2 √ √
La disuguaglianza [ p]2 + √
[ p]2
< 3p è certamente vera per p = 5. Più in generale, posto n = [ p] ed u = p − n, la
disuguaglianza è equivalente a

n4 + (n + u)4 < 3n2 (n + u)2 , ovvero ((n + u)2 − n2 )2 < n2 (n + u)2 ;

e si ha ((n + u)2 − n2 )2 < (2n + 1)2 ed n4 < n2 (n + u)2 . Con le tecniche elementari del calcolo, è facile verificare che
n4 > (2n + 1)2 per n > 2 e dunque, per tutti i primi p > 5 tali che p ≡ 1 (mod 4).
I §.8 Ideali ed estensioni intere 33

Se g è un generatore di F×
q , possiamo scrivere

q−2
se g d = 1
(
X X X −1
d d dh
x = x = g = d q−1
(g ) −1 .
x∈Fq h=0 gd −1
= 0 se (q − 1)6 | d
x∈Fq×

Allora, uno almeno dei fattori nel prodotto (I.7.14) è uguale a zero perchè, se q − 1 dividesse tutti gli
esponenti di > 0, non potrebbe aversi d1 + · · · + dn < (q − 1)n. CVD 
Si deduce immediatamente il seguente
7.15 Corollario. I campi finiti sono di classe C1 .

dim. Nelle notazioni del Teorema precedente, preso comunque un polinomio omogeneo f (X) apparte-
nente ad Fq [X1 , . . . , Xn ] e di grado minore di n, si ha Nf ≥ 1, perchè f ha lo zero banale ed essendo
Nf ≡ 0 (mod p), devono esistere zeri non banali. CVD 
7.16 Remark. Molte delle proprietà dei campi finiti si estendono ai campi C1 ; ad esempio mostriamo
che non esistono estensioni finite non-commutative di campi C1 . Sia F un corpo (non-commutativo) con
centro k, di classe C1 . È noto che esiste un’estensione finita, di Galois k ′ di k, tale che F ⊗k k ′ , sia isomorfo
ad un’anello di matrici su k ′ (cf. ad esempio: Serre: Corps Locaux, Paris 1962, Ch. X, §.5, Proposition 7, e
vedi Bourbaki, Algebre, Ch.VIII,§.5, 10, per una dimostrazione). Dunque ogni elemento di F si identifica
con una matrice quadrata A, di ordine n ed il determinante di A è un polinomio omogeneo (a coefficienti
2
in Z) di grado n nelle n2 entrate della matrice. Poichè k è di classe C1 , vi è uno zero non banale in k n
per tale polinomio, contro l’ipotesi che ogni elemento di F sia invertibile.
Chiudiamo questa sezione, richiamando una famosa congettura
Congettura. [E. Artin] Il campo che si ottiene aggiungendo a Q tutte le radici di 1 è un campo C1 .

8. Ideali ed estensioni intere


Sia A un dominio integralmente chiuso, con corpo dei quozienti K, e sia B la chiusura integrale di
A in un’estensione finita e separabile di K. Siamo interessati a studiare le relazioni che intercorrono tra
gli ideali primi dei due anelli.
Più in generale ci occuperemo della situazione in cui A ⊆ B sono domini e B è intero su A; in
particolare, diremo che un ideale q di B sta sopra ad un ideale p di A se A ∩ q = p.
Iniziamo la discussione con un risultato preliminare che ci sarà utile nel seguito.
8.1 Lemma di Nakayama. Sia A un anello e sia M un A-modulo finitamente generato. Se a è un
ideale di A contenuto in tutti i massimali di tale anello, allora aM = M se, e solo se, M = (0).

dim. Siano m1 , . . . , mn dei generatori di M ; dalla relazione aM = M , si deduce che esistono degli elementi
a1 , . . . , an di a tali che m1 = a1 m1 + · · ·+ an mn . Poichè a è contenuto in tutti gli ideali massimali, 1− a1 è
invertibile in A e quindi M può essere generato da m2 , . . . , mn . Continuando allo stesso modo, si possono
eliminare tutti i generatori ed ottenere quindi M = (0). CVD 
Verifichiamo che esistono ideali primi di B sopra ad ogni dato primo di A.
8.2 Proposizione. Siano A un dominio e B un dominio intero su A. Dato un ideale primo p di A,
allora pB 6= B e quindi esiste un ideale primo q di B che sta sopra a p. Inoltre p è massimale in A se, e
solo se, q è massimale in B.

dim. Si consideri l’anello Bp = B ⊗A Ap , intero sull’anello locale Ap . Se fosse pBp = Bp , si avrebbe che

1 = x1 b1 + · · · + xn bn , con x1 , . . . , xn ∈ p e b1 , . . . , bn ∈ Bp .
34 Interi algebrici I §.8

Considerando ora l’anello B0 = Ap [b1 , . . . , bn ], si è nelle ipotesi del Lemma di Nakayama, da cui si
otterrebbe B0 = 0, che è assurdo. Quindi pBp 6= Bp ed esiste un ideale massimale m ⊂ Bp contenente
pBp . Sia quindi q = m ∩ B ed osserviamo che si tratta di un ideale primo(∗) di B, contenente pB e si ha
q ∩ A = m ∩ A = (m ∩ Ap ) ∩ A = pAp ∩ A = p.
Osserviamo che, se p è massimale in A allora ogni elemento y ∈ B/q è intero e quindi algebrico sul campo
A/p. Poichè A/p[y] è un campo, si conclude che ogni elemento di B/q è invertibile e quindi tale anello
è un campo. D’altra parte, se B/q è un campo, allora A/p è un sottoanello di tale campo e per ogni
elemento diverso da zero x ∈ A/p, esiste l’inverso x−1 ∈ B/q. Dunque x−1 è intero su A/p e quindi
esistono a1 , . . . , ar ∈ A/p, tali che
x−r + a1 x−r+1 + · · · + ar = 0;
da cui, moltiplicando per xr−1 , si deduce x−1 ∈ A/p. CVD 

8.3 Complementi. [Teoremi di going-up e going-down] Come facile conseguenza della Proposizione precedente,
si ottiene che, nelle ipotesi dette, è possibile ‘rialzare’ a B delle catene ascendenti di ideali primi di A. Precisamente,
si può enunciare il seguente
Teorema di going-up. Siano A ⊆ B due domini e B sia intero su A. Se p1 ⊆ · · · ⊆ pn è una catena di primi di
A e q1 ⊆ · · · ⊆ qm , con m < n, è una catena di primi di B tali che qi ∩ A = pi , per i = 1, . . . , m; allora la catena
q1 ⊆ · · · ⊆ qm si può estendere ad una catena q1 ⊆ · · · ⊆ qn tale che qi ∩ A = pi , per i = 1, . . . , n.

dim. È chiaro che è sufficiente dimostrare il Teorema nel caso in cui n = m + 1. In tal caso, basta osservare
che B/qm è intero su A/pm e quindi, per la Proposizione I.8.2, esiste un ideale q̄m+1 di B/qm che sta sopra
all’immagine di pm+1 in A/pm . Rialzando q̄m+1 a B si conclude. CVD 
La situazione è un po’ più complicata nel caso in cui si vogliano rialzare catene discendenti di ideali primi.
Vale però un risultato analogo nel caso in cui A sia integralmente chiuso (cf. Definizione I.3.5).
Teorema di going-down. Sia A un dominio integralmente chiuso e sia B ⊇ A un dominio, intero su A. Se
p1 ⊇ · · · ⊇ pn è una catena di primi di A e q1 ⊇ · · · ⊇ qm , con m < n, è una catena di primi di B tali che
qi ∩ A = pi , per i = 1, . . . , m; allora la catena q1 ⊇ · · · ⊇ qm si può estendere ad una catena q1 ⊇ · · · ⊇ qn tale
che qi ∩ A = pi , per i = 1, . . . , n.

dim. È chiaro che è sufficiente dimostrare il Teorema nel caso in cui m = 1 ed n = 2 ed, in particolare, si tratta
di mostrare che p2 Bq1 ∩ A = p2 . Ogni elemento x ∈ p2 Bq1 è della forma x = ys con y ∈ p2 B ed s ∈ B \ q1 . Poichè
A è integralmente chiuso, il polinomio minimo di y su K = F rac A, è del tipo
(*) y r + u1 y r−1 + · · · + ur ,
con u1 , . . . , ur ∈ p2 (†) . Se x ∈ p2 Bq1 ∩ A, allora si ha che il polinomio minimo di s = yx−1 su K, si ottiene da
(∗) moltiplicando per x−r ed, essendo s intero su A, si conclude che vi = ui x−i ∈ A, per i = 1, . . . , r. Se x ∈/ p2 ,
(∗)
Perchè B/q è un sottoanello del campo Bp /m e quindi è un dominio.
(†)
È chiaro che, il polinomio minimo di y ha i coefficienti in A, perchè y ∈ p2 B è intero su A ed A è integralmente chiuso.
In generale, se A ⊂ B sono due domini, ed a è un ideale di A, diremo che x ∈ B è intero su a se x soddisfa ad un’equazione
monica a coefficienti in a. Vale il seguente
Lemma. Siano A ⊂ B due domini, con A integralmente chiuso √ e B intero su A e sia a un ideale di A. Allora
(i) l’insieme degli elementi di B interi su a è il radicale aB di√aB;
(ii) il polinomio minimo di x su K ha i coefficienti nel radicale a di a.

n n−1 + · · · + a con a , . . . , a ∈ a e quindi x ∈



dim.√(i) Se x ∈ B è intero P su a, allora x = a1 x n 1 n aB. Viceversa, se
x ∈ aB, allora x = n ai xi , per qualche n > 0, con ai ∈ a ed xi ∈ B. Considerando l’A-modulo finitamente generato
M = A[x1 , . . . , xr ], si conclude che xn M ⊆ aM e perciò che xn (e quindi x) è intero su a.
(ii) I coefficienti del polinomio minimo sono funzioni simmetriche sui coniugati di x, che sono tutti interi su a e quindi, per
il punto precedente, i coefficienti del polinomio minimo sono in A e nel radicale di aB e quindi nel radicale di a. CVD

Poichè p2 è un ideale primo, il Lemma ci permette di concludere.
I §.8 Ideali ed estensioni intere 35

dalla relazione xi vi = ui ∈ p2 , si ottiene che tutti i coefficienti del polinomio minimo di s stanno in p2 e quindi
sr ∈ p2 B ⊂ p1 B ⊆ q1 , da cui si deduce che s ∈ q1 , il che è assurdo. Si conclude quindi che x ∈ p2 e dunque
p2 Bq1 ∩ A = p2 . CVD 
Da ultimo, vogliamo dare un esempio di come l’ipotesi che A sia integralmente chiuso sia essenziale per la
validità del Teorema di going-down.

Siano A = k[x, y, z]/(y 2 − x3 − x2 ) e B = k[m, t],


ove x, y, z, m, t sono indeterminate sul corpo k, che
supporremo algebricamente chiuso e di caratteristica q1
0. Si consideri l’omomorfismo iniettivo di k-algebre
f : A → B definito ponendo f (x) = m2 − 1, f (y) =
m(m2 − 1), f (z) = t e d’ora in poi supporremo A
contenuto in B, identificandolo con la sua immagine
tramite f .
Il disegno a fianco da un’interpretazione geome-
trica della situazione che andiamo a descrivere ed invi- Spec B
tiamo perciò il lettore a riferirsi ad esso. Nel disegno,
f
sperando di non creare confusione, indichiamo con lo
stesso simbolo gli ideali degli anelli in questione e le
sottovarietà affini che ad essi corrispondono. Spec A
Si considerino gli ideali primi

A ⊇ p1 = (x, y, z − 1) ⊃ p2 = (y − zx, z 2 − x − 1) p2 p1

e
B ⊇ q1 = (m + 1, t − 1)
e si osservi che q1 ∩ A = p1 . Si verifica con un cal-
colo diretto che l’immagine di p2 in Bq1 è l’ideale
massimale di tale anello e quindi che non può esistere
un ideale di B, contenuto in q1 , che stia sopra a p2 .
Ciò doverbbe essere evidente ’geometricamente’ os-
servando che non c’e’ nessuna sottovarietà di Spec B,
contenente q1 che si proietti sulla curva p2 di Spec A.

Ciò conclude la digressione sui teoremi di going-up e going-down di Cohen–Seidenberg. Il lettore che volesse
approfondire l’argomento può consultare, ad esempio, il libro: D. Eisenbud, Commutative Algebra with a view
toward Algebraic Geometry, Springer 1994.

Torniamo quindi a discutere delle relazioni tra gli ideali di un’estensione intera, occupandoci di un
esempio.
8.4 Esempio. Sia A un dominio integralmente chiuso, con corpo dei quozienti K, e sia B = A[α]
intero su A. Indichiamo con f (X) ∈ A[X] il polinomio minimo di α su K (cf. la Proposizione I.3.6 e
la nota a pie’ di pagina relativa alla sua dimostrazione). Dato un ideale massimale p di A, possiamo
considerare la riduzione f¯(X) ∈ A/p[X] del polinomio f (X) e la sua decomposizione in fattori irriducibili
f¯(X) = f¯1 (X)e1 · · · f¯r (X)er , ove f1 (X), . . . , fr (X) ∈ A[X] sono monici ed a due a due coprimi.
Mostriamo che gli ideali di B = A[α] che stanno sopra a p sono q1 , . . . , qr , ove qj = pB + (fj (α)),
per j = 1, . . . , r. Infatti se y ∈ qj ∩ A, allora y = h(α) + g(α)fj (α), con g(x) ∈ A[X] ed h(x) ∈ p[X] ed
y ∈ A. Riducendo modulo p, si ottiene ȳ ∈ (f¯j (X)) che è un ideale irriducibile non banale di A/p[X],
dunque, deve aversi y ∈ p.
Inoltre, osserviamo che
A/p[X]
B/qj = A[α]/qj ∼ = ¯
(fj (X))
36 Interi algebrici I §.9

e quest’ultimo è un corpo, perchè f¯j (X) è irriducibile. Quindi l’ideale qj è massimale.


L’esempio precedente descrive una situazione relativamente generale. Infatti, nel caso in cui B sia
l’anello degli interi di un campo di numeri, ci si trova nella situazione descritta se si localizza rispetto a
quasi tutti i primi di Z (con l’eccezione di un numero finito). Precisamente, sia L un’estensione finita di
Q, di grado n, e sia B la chiusura integrale di Z in L. Se consideriamo un elemento primitivo α per L che
sia intero su Z (cf. Proposizione I.2.2 e Lemma I.3.7); allora B ⊆ d1 Z[α], ove d = ∆(1, α, . . . , αn−1 ) è il
discriminante di B su Z (cf. Teorema I.3.8). Se p è un primo di Z che non divide d, localizzando rispetto
all’ideale (p), si ottiene B(p) = Z(p) [α] e si può ragionare come nell’esempio precedente per determinare i
primi B che stanno sopra a (p).
La situazione dell’esempio, si presenta anche nel caso dei corpi quadratici o dei corpi ciclotomici prin-
cipali, e sarebbe facile dare i dettagli in questi casi. Ritorneremo su questi esempi, dopo aver approfondito
alcune caratteristiche generali degli anelli di interi di estensioni algebriche.

9. Domini di Dedekind
Cominciamo occupandoci del caso locale: i domini di Dedekind locali sono gli anelli di valutazione
discreta.
9.1 Definizione. Un dominio d’integrità A si dice dominio di valutazione discreta (DVR) se è principale
ed ha un unico ideale primo p. Ogni generatore π del primo p è detto un uniformizzante per A.
Osserviamo che, come facile conseguenza del Lemma di Nakayama, per un DVR A, si ha
\
(9.2) pn = (0).
n≥0
\
Infatti, posto I = pn e ricordato che p è un ideale principale, è immediato verificare che pI = I;
n≥0
quindi, essendo p l’unico massimale di A, si conclude che I = (0) per il citato Lemma.
Siano A un DVR, K = F rac A e sia fissato un uniformizzante π di A. Ogni elemento x ∈ A, si
può scrivere (in modo unico) come x = π n u, ove u ∈ A× è invertibile e quindi n è l’unico intero non
negativo tale che x ∈ pn \ pn+1 . Dunque, l’intero n non dipende dalla scelta di π e si può estendere
la decomposizione x = π n u, con u ∈ A× ed n ∈ Z ad ogni elemento 0 6= x ∈ K. Sai definisce cosı̀
la valutazione discreta associata ad A, ovvero l’applicazione v : K × → Z, definita da v(x) = n, ove
n è determinato dalla decomposizione x + π n u descritta sopra. Si verifica immediatamente che v è un
omomorfismo suriettivo di gruppi, ovvero che v(xy) = v(x) + v(y) e v(π) = 1 ed inoltre che vale la
proprietà v(x + y) ≥ min{ v(x), v(y) }. Spesso l’applicazione v si estende a K ponendo v(0) = +∞,
mantenendo valide le proprietà dette.
A partire dall’applicazione v, si può ricostruire l’anello A osservando che
A = { x ∈ K | v(x) ≥ 0 } .
In particolare, tramite v, si verifica facilmente che ogni ideale J 6= (0) di A è del tipo π m A, ove m =
min v(x).
x∈I
Osserviamo infine che, a partire da v, si può definire un valore assoluto (ultrametrico) su K, fissando
un numero reale c ∈ (0, 1) e ponendo |x| = cv(x) . Tramite questo valore assoluto, si definisce una topologia
su K (che è indipendente dalla scelta di c) e si può considerare il completamento di K rispetto alla metrica
data, che è ancora un corpo con una valutazione discreta.
Esempi di DVR sono: il localizzato Z(p) dell’anello degli interi ad un suo ideale primo (p) 6= (0);
l’anello k[[X]] delle serie di potenze a coefficienti in un campo k; l’anello locale di un punto semplice P di
una curva algebrica (ad esempio, se la curva è contenuta nel piano, si può prendere come uniformizzante,
l’equazione di una qualsiasi retta non tangente alla curva nel punto P ).
Diamo ora alcune caratterizzazioni dei DVR che ci saranno utili nel seguito
I §.9 Domini di Dedekind 37

9.3 Proposizione. Sia A un dominio noetheriano. Le seguenti affermazioni sono equivalenti:


(i) A è un DVR;
(ii) A è un anello locale con il massimale p principale;
(iii) A è integralmente chiuso ed ammette un unico ideale primo p 6= (0).

dim. È immediato verificare che (i) ⇒ (ii); viceversa, basta osservare che, essendo A locale e p principale,
si dimostra con il Lemma di Nakayama che vale (I.9.2) e si può così definire una valutazione sul corpo
K = F rac A.
Per verificare che (i) ⇒ (iii), è sufficiente ricordare che un DVR è un anello ad ideali principali e
quindi un dominio fattoriale, che è integralmente chiuso in base alla Proposizione I.3.6.
Il resto della dimostrazione è dedicato alla verifica che (iii) ⇒ (ii), ovvero che, sotto le ipotesi di (iii),
p è un ideale principale. Sia dunque K = F rac A e si consideri

p′ = { x ∈ K | xp ⊆ A } ,

ed osserviamo che p′ è un ideale frazionario (cf. Definizione I.9.6) in K, perchè, per ogni y ∈ p \ {0}, si
1
ha yp′ ⊆ A, ovvero p′ ⊆ A, ed A è noetheriano. Dunque, si ha che pp′ è un ideale di A che contiene p
y
(1 ∈ p′ ), dunque, essndo p massimale, si conclude che

pp′ = p oppure pp′ = A.


n
X
Se fosse pp′ = A, potremmo scrivere 1 = xi yi , con xi ∈ p′ ed yi ∈ p, e poichè tutti gli addendi sono in
i=1
A, deve esistere un indice i per cui xi yi = u ∈ A× . Possiamo dunque supporre che, si abbia xy = 1 per
qualche x ∈ p′ ed y ∈ p e possiamo perciò concludere che y è un generatore di p, avendosi z = (zx)y per
ogni z ∈ p, con zx ∈ A, perchè x ∈ p′ .
Siamo quindi in grado di concludere se dimostriamo che non può aversi pp′ = p. Se cosı̀ fosse, dato
x ∈ p′ , si avrebbe xp ⊆ p e quindi che x è intero su A e quindi, poichè A è integralmente chiuso, si
concluderebbe che p′ = A. Si osservi poi che, dato un elemento x 6= 0 di p, si ha che l’anello Ax = A[ x1 ] è
uguale al compo K, perchè p è l’unico ideale primo di A. Dunque, fissato un elemento non nullo z ∈ p, in
corrispondenza ad ogni x ∈ p \ {0}, esiste un intero non negativo n, tale che z1 = xan , ovvero che xn ∈ (z).
Poichè A è noetheriano, si conclude che esiste un esponente N ≥ 1 tale che pN ⊆ (z), ma pN −1 6⊂ (z).
Ciò significa che esiste un elemento y ∈ pN −1 tale che y ∈/ (z) ovvero che y/z ∈ / A, ma ciò è assurdo,
perchè y/z ∈ p′ = A. CVD 
Possiamo quindi dare la definizione di dominio di Dedekind.
9.4 Definizione. Un dominio noetheriano A è un dominio di Dedekind se è soddisfatta una delle seguenti
proprietà, tra loro equivalenti:
(i) per ogni ideale primo p di A, il localizzato Ap è un DVR;
(ii) A è integralmente chiuso e di dimensione ≤ 1(†) .

dim. (dell’equivalenza delle due condizioni.)


(i) ⇒ (ii) Siano dati due primi di A, (0) ⊂ p ⊂ q, considerando il DVR Aq , si avrebbe pAq = (0), oppure
pAq = qAq . La prima possibilità non può darsi perchè A è un dominio. Dalla seconda uguaglianza, si

ottiene p = q, perchè, per ogni x ∈ q, si ha x = xy per opportuni x′ ∈ p ed y ∈ A \ q, e da questa
uguaglianza, si ottiene yx = x′ ∈ p e quindi x ∈ p.
(ii) ⇒ (i) In base alla Proposizione I.9.3 è sufficiente mostrare che, per ogni primo p, il localizzato Ap è
integralmente chiuso. Se x ∈ K = F rac A, è intero su Ap , si ha la relazione xn + c1 xn−1 + · · · + cn = 0,
(†)
un dominio A è di dimensione ≤ 1 se, e solo se, ogni ideale primo p 6= (0) è massimale in A.
38 Interi algebrici I §.9

con ci = abi ed ai ∈ A, b ∈ A \ p, per ogni i = 1, . . . , n. Moltiplicando per bn , si ottiene che bx è intero


su A e quindi appartiene ad A. Si conclude perciò che x ∈ Ap e quindi che il localizzato è integralmente
chiuso(∗∗) . CVD 
9.5 Osservazione. Sia A un dominio di Dedekind, di corpo di frazioni K, sia L un’estensione finita di
K e sia B la chiusura integrale di A in L. Allora B è ancora un dominio di Dedekind. Infatti, per ogni
primo q di B, il localizzato Bq è integralmente chiuso ed ha un unico ideale primo (se ciò non fosse si
potrebbe applicare il Teorema di going-down ed ottenere una contraddizione col fatto che A è un dominio
di Dedekind). Dunque, Bq è un DVR (cf. Proposizione I.9.3) e quindi B è un dominio di Dedekind. In
particolare osserviamo che Z è un dominio di Dedekind e quindi, per quanto appena osservato, tutti gli
anelli degli interi di corpi di numeri algebrici sono domini di Dedekind.
Il nostro primo obbiettivo è lo studio degli ideali frazionari di un anello di Dedekind; nozione che
generalizza ai corpi di numeri algebrici la nozione di numero primo nel corpo dei numeri razionali. Com-
inciamo con la definizione
9.6 Definizione. Sia A un dominio di integrità noetheriano e K il suo corpo delle frazioni. Si chiama
ideale frazionario ogni sotto-A-modulo finitamente generato di K.
Osserviamo che ogni ideale di A è un ideale frazionario e che, se I è un ideale frazionario, allora
(A : I) = { x ∈ K | xI ⊆ A } è un ideale frazionario. Infatti, se x ∈ I allora (A : I) ⊂ x1 A ed A è
noetheriano.. Un altro facile risultato sugli ideali frazionari è il seguente
9.7 Lemma. Sia A un dominio di integrità noetheriano e K il suo corpo delle frazioni. Siano I e J
ideali frazionari e sia p un ideale primo. Allora
(i) (IJ)p = Ip Jp ;
(ii) (A : I)p = (Ap , Ip ).

dim. Le inclusioni (IJ)p ⊆ Ip Jp e (A : I)p ⊆ (Ap : Ip ) discendono in modo ovvio dalle definizioni. Le
inclusioni inverse sono conseguenza del fatto che I e J sono A-moduli finitamente generati. Ad esempio,
se z ∈ (Ap : Ip ), allora, per ogni x ∈ I, si ha che zx ∈ Ap , ed essendo I finitamente generato, esiste
un elemento s ∈ A \ p, tale che szx ∈ A per ogni x ∈ I. Dunque sz ∈ (A : I) e quindi z ∈ (A : I)p .
Ciò conclude la dimostrazione di (ii). La dimostrazione di (i) si basa su considerazioni analoghe. CVD

Siamo quindi in grado di dimostrare la seguente
9.8 Proposizione. Sia A un dominio di Dedekind e K il suo corpo delle frazioni. Gli ideali frazionari
formano un gruppo rispetto all’operazione di prodotto.

dim. È chiaro che il prodotto di ideali frazionari è ancora un ideale frazionario e che l’anello A si com-
porta da elemento neutro rispetto a questa operazione. Dunque, è sufficiente dimostrare che ogni ideale
frazionario è invertibile. Mostreremo che, dato un ideale frazionario I, l’ideale frazionario I ′ = (A : I) è
il suo inverso. Infatti, per ogni ideale primo p di A si ha
(I I ′ )p = Ip (A : I)p = Ip (Ap : Ip ) = Ap
ove l’ultima uguaglianza è ovvia nel DVR Ap . Poichè l’uguaglianza (I I ′ )p = Ap vale per ogni primo p, si
conclude che I I ′ = A. CVD 
Il nostro prossimo obbiettivo è dimostrare che per gli ideali di un dominio di Dedekind vale l’analogo
della decomposizione in fattori primi degli interi razionali, ovvero che ogni ideale si scrive in modo unico
come prodotto di ideali primi.
(∗∗)
Più in generale, è vero per ogni dominio noetheriano A che A è integralmente chiuso se, e solo se, Ap è integralmente
chiuso, per ogni primo p di A. In un verso l’affermazione è stata appena dimostrata; nell’altro verso, si osservi che, se x ∈ K
T
è intero su A allora x è intero su ogni localizzato Ap , e dunque x ∈ p Ap = A. L’ultima uguaglianza, si ottiene facilmente
T
osservando che, dato un elemento y ∈ p Ap , l’insieme { s ∈ A | sy ∈ A } è un ideale di A diverso da zero e non contenuto
in nessun primo di A. Dunque { s ∈ A | sy ∈ A } = A e ciò permette di concludere.
I §.9 Domini di Dedekind 39

9.9 Lemma. Sia A un dominio di Dedekind. Ogni ideale I 6= (0) di A contiene un prodotto finito di
ideali primi non-nulli.

dim. Se l’insieme degli ideali che non verificano la tesi è diverso dal vuoto allora tale insieme contiene
un elemento massimale J, perchè A è noetheriano. Allora, J non è un ideale primo e perciò esistono
a, b ∈ A \ J tali che ab ∈ J. I due ideali J + (a) e J + (b), contengono propriamente J e quindi per essi
vale la tesi, ma allora J ⊇ (J + (a))(J + (b)) e quindi contiene un prodotto non nullo di ideali primi, il
che è assurdo. CVD 
Come conseguenza, possiamo osservare che ogni ideale I 6= (0) di un dominio di Dedekind è contenuto
in un numero finito di ideali primi. Infatti, in base al Lemma precedente, dalla relazione p1 · · · pn ⊆ I ⊆ p
si deduce che p deve essere uno degli ideali pj . Possiamo quindi concludere con il risultato a cui si faceva
cenno in precedenza
9.10 Proposizione. Sia A un dominio di Dedekind e K il suo corpo delle frazioni. Ogni ideale I 6= (0)
di A si scrive in modo unico come prodotto di ideali primi.

dim. Sia dunque I un ideale di A e sia p un ideale primo. Localizzando al primo p, ed indicando con vp
la valutazione di K relativa al primo p, si ottiene

Ip = pep Ap ove 0 ≤ ep = vp (I) = min { vp (x) | x ∈ I } .

Inoltre, per quanto visto sopra, vp (I) > 0 solo per un numero finito di primi. Dunque, si conclude che
Y
I= pvp (I) ,
p

perchè tale uguaglianza vale in Ap per ogni ideale primo p. CVD 


Il nostro ultimo obbiettivo è lo studio della fattorizzazione unica (degli elementi e non solo degli
ideali) nei domini di Dedekind. Il primo risultato in tale direzione è un Lemma di approssimazione
simultanea rispetto a varie valutazioni.
9.11 Proposizione. [Teorema Cinese] Siano A un dominio di Dedekind e K il suo corpo delle frazioni.
Siano v1 , . . . , vn valutazioni discrete di K corrispondenti a primi distinti p1 , . . . , pn . Siano x1 , . . . , xn degli
elementi di A ed h1 , . . . , hn degli interi positivi. Allora esiste un elemento x ∈ A tale che

vi (x − xi ) ≥ hi per i = 1, . . . , n.

dim. Non è restrittivo supporre x1 = 1 ed x2 = · · · = xn = 0, perchè se sappiamo risolvere questo


problema per ogni indice i = 1, . . . , n ed indichiamo con yi la soluzione, allora l’elemento x = y1 x1 + · · · +
yn xn soddisfa alle condizioni dell’enunciato. Dunque si tratta di mostrare che esiste un elemento y ∈ A
tale che
v1 (y − 1) ≥ h1 , e vi (y) ≥ hi , i = 2, . . . , n.
Per ogni j > 1, si ha p1 + pj = A e quindi, per ogni H > 0, si ha pH H
1 + pj = A. Fissato un intero
H H
H ≥ maxi (hi ), per ogni j ≥ 2, esistono degli elementi zj ∈ p1 e yj ∈ pj tali che zj + yj = 1 e si ha
Y Y
1= (zj + yj ) = z + y ove z ∈ pH
1 , y = y2 · · · yn ∈ pH
j .
2≤j≤n 2≤j≤n

Si conclude che y è l’elemento cercato. CVD 


Osserviamo a margine che, con una scelta più accurata degli elementi yi si può fare in modo che si
abbia vi (x − xi ) = hi per ogni i. Siamo quindi in grado di dimostrare il seguente
40 Interi algebrici I §.9

9.12 Teorema. Sia A un dominio di Dedekind. Allora A è fattoriale se, e solo se, A è un dominio ad
ideali principali.

dim. È ben noto che A P ID ⇒ A U F D, e quindi si tratta di dimostrare l’implicazione nel verso
opposto. Sia p 6= (0) un ideale primo di A e sia π ∈ p un elemento tale che vp (π) = 1 e supponiamo che
π sia irriducibile. Allora (π) = p1 · · · ph con p1 = p 6= pj per j ≥ 2. Se effettivamente apparisse un ideale
ph 6= p nella fattorizzazione dell’ideale (π), allora, per il Teorema Cinese, esisterebbe un elemento y ∈ A
tale che y ∈ pj per j ≥ 2, ma y ∈ / p. Allora (y) = p2 · · · ph q e q 6⊂ p e, preso un elemento z ∈ p tale che
z∈ / pj per j ≥ 2, si ha yz ∈ (π) e quindi yz = aπ per qualche a ∈ A senza che π divida né y né z, contro
l’ipotesi che A sia un anello fattoriale. CVD 

Dunque, per sapere se l’anello degli interi di un corpo di numeri è un anello fattoriale, basta studiare
il suo gruppo di classi di ideali.
9.13 Definizione. Sia A un dominio di Dedekind e sia K il suo corpo dei quozienti. Due ideali frazionari
I e J si dicono equivalenti, e si scrive I ∼ J, se esiste una costante α ∈ K × tale che I = αJ. Si verifica
facilmente che si tratta di una relazione di equivalenza e che è compatibile col prodotto di ideali frazionari.
Il gruppo di classi di ideali è il quoziente del gruppo degli ideali frazionari modulo questa relazione di
equivalenza e si denota col simbolo Cl(A) o Pic A.
Possiamo quindi concludere osservando che un dominio di Dedekind A è un anello fattoriale se, e
solo se, Cl A = {1}. Useremo tale criterio per decidere se gli interi di un dato un corpo di numeri formano
o meno un anello fattoriale. Prima di occuparci di questo problema, diamo un ultimo risultato generale
sulle relazioni tra ideali primi di estensioni intere; precisamente, dimostriamo il seguente
9.14 Teorema. Sia A un dominio di Dedekind con corpo delle frazioni K e siano L un’estensione finita
r
Y
e separabile di K e B la chiusura integrale di A in L. Dato un ideale primo p di A, sia pB = qei i , e si
i=1
indichi con fi il grado su A/p dell’estensione B/qi , per i = 1, . . . , r(∗) . Nelle ipotesi che tutte le estensioni
B/qi siano separabili su A/p, si ha
Xr
[L : K] = ei fi .
i=1

dim. Si consideri l’algebra B/pB sul corpo A/p. Allora

dimA/p B/pB = [L : K],

Infatti, se si sostituisce A con il suo localizzato Ap , non cambia il corpo residuo A/p = Ap /pAp e, posto
Bp = B ⊗A Ap , si ha B/pB = Bp /pBp . Basta quindi osservare che Bp è un modulo libero su Ap , di rango
uguale ad [L : K] (cf. Corollario I.3.9).
In base al Teorema Cinese (cf. Proposizione I.9.11), si ha
r
Y
B/pB = B/qei i .
i=1

Considerando la catena discendente di A/p-spazi vettoriali

B/qei i ⊃ qi /qei i ⊃ q2i /qei i ⊃ · · · ⊃ qei i −1 /qei i ,

ed osservando che qhi /qih+1 ∼


= B/qi , per ogni intero positivo h, si ottiene la tesi. CVD 

(∗)
L’intero ei è detto l’indice di ramificazione del primo qi su p, mentre l’intero fi è detto il grado residuo di qi su p.
I §.10 Applicazioni. 41

Poniamoci nelle ipotesi dell’Esempio I.8.4, e siano B = A[α], ed f (X) ∈ A[X] il polinomio minimo
di α. Dato un ideale p di A, si consideri la decomposizione in fattori irriducibili nell’anello A/p[X]:

f¯(X) = f¯1 (X)e1 · · · f¯r (X)er ,


′ ′
(9.15)

con i polinomi fi (X) ∈ A[X] monici, a due a due distinti (mod p). Come abbiamo già osservato
nell’esempio citato, gli ideali primi di B contenenti p, sono della forma qi = pB + fi (α)B, e si ha

A/p[X]
B/qi ∼
= ¯ e quindi fi = dimA/p B/qi = deg fi (X).
(fi (X))

Vogliamo mostrare che si ha ei = e′i . Dalla decomposizione (I.9.15), si ottiene che


r
X r
X
e′i fi = deg f (X) = [L : K] = ei fi
i=1 i=1

ed inoltre, essendo
r r
e′
Y Y
qi i ⊆ pB = qei i ,
i=1 i=1

si conclude che ei ≤ e′i per ogni i = 1, . . . , r, da cui si ottiene l’uguaglianza voluta.

10. Applicazioni.
In questa sezione vogliamo esporre alcune applicazioni dei risultati sin qui ottenuti allo studio dei
corpi di numeri e dei loro anelli di interi. Sia dunque A l’anello degli interi di un corpo di numeri K, di
grado n su Q, ed introduciamo una funzione degli ideali di A che generalizza la norma degli elementi.
10.1 Lemma. Notazioni come sopra.
(i) Preso comunque un ideale I 6= (0) di A, N (I) := #(A/I) è un numero intero positivo.
(ii) Per ogni coppia di ideali non-nulli I e J si ha N (IJ) = N (I) N (J).
(iii) Per ogni ideale principale (α) 6= (0), si ha N ((α)) = |NK/Q (α)|.

dim. (i). È sufficiente osservare che I ∩ Z è un ideale non-nullo di Z e che A è uno Z-modulo libero finito,
per concludere che #(A/I) è un numero intero positivo.
(ii). Se I e J sono coprimi, allora A/IJ ∼ = A/I × A/J e quindi la tesi è vera. Per dimostrarla in generale,
ricordando che ogni ideale di A si decompone in un prodotto di ideali primi, è sufficiente verificare la
tesi quando I = pr e J = ps per un qualche ideale primo p, e la verifica di viene immediata se si
localizza in p e si osserva che A/pn ∼ = Ap /(pAp )n per ogni intero n ≥ 0. (iii). La moltiplicazione per
α ∈ A è un endomorfismo iniettivo dello Z-modulo libero finito A e sia Mα ∈ Mn×n (Z) la matrice
di tale endomorfismo rispetto ad una base intera di A. Per il teorema dei divisori elementari, si ha
#(A/(α)) = | det Mα | e quindi la tesi (cf. I.2.10). CVD 
10.2 Osservazione. Osserviamo che, dalla definizione discende che N (I)x ∈ I per ogni x ∈ A e quindi
che N (I)Z ⊂ I. Dunque, i primi di A che dividono I sono da cercarsi tra i primi di A al di sopra dei primi
razionali che dividono N (I). Vogliamo mostrare che all’interno di ogni classe in Cl A esiste un ideale I
con N (I) < CA , ove CA è una costante dipendente solo da A. Da ciò si conclude che gli ideali primi di
A che stanno al di sopra dei primi razionali (positivi e) minori di CA sono sufficienti a generare tutti gli
elementi del gruppo Cl A. In particolare, ciò significa che è sufficiente conoscere questa famiglia finita di
primi per decidere se Cl A = (0) e quindi se A è o meno fattoriale.
Sia quindi {ω1 , . . . , ωn } una base intera di A su Z (cf. Definizione I.3.10), e si consideri un ideale
I 6= (0). Allora, esiste un elemento α = x1 ω1 + · · · + xn ωn 6= 0 di I per cui |xi | < N (I)1/n per ogni
42 Interi algebrici I §.10

i = 1, . . . , n. Infatti, vi sono [N (I)1/n ] + 1 numeri interi compresi tra 0 ed N (I)1/n , ed [N (I)1/n ] + 1 >
N (I)1/n . Considerando questi interi come coefficienti degli elementi della base intera {ω1 , . . . , ωn } di A,
si ottengono ([N (I)1/n ] + 1)n > N (I) elementi di A soddisfacenti alla condizione richiesta. Ciò significa
che almeno due tali elementi stanno nella stessa classe in A/I e quindi la loro differenza è un elemento
α = x1 ω1 + · · · + xn ωn 6= 0 di I per cui |xi | < N (I)1/n per ogni i = 1, . . . , n.
Sia quindi I un ideale di A ed α ∈ I soddisfacente alle condizioni dette; allora I divide (α) per cui
esiste un ideale J tale che (α) = IJ. In base al Lemma precedente, da ciò si deduce che

|NK/Q (α)| = N (α) = N (I)N (J).

Ora, se α = x1 ω1 + · · · + xn ωn , con |xi | < N (I)1/n per i = 1, . . . , n, i coniugati di α (in una chiusura
(µ) (µ)
algebrica Q̄ di Q) sono tutti del tipo α(µ) = x1 ω1 + · · · + xn ωn , al variare di µ tra le Q-immersioni di
K in Q̄. Da ciò si ottiene la disuguaglianza
n
(µ)
X
(µ) 1/n
|α | ≤ N (I) |ωi |
i=1

e, facendo il prodotto al variare di µ, si deduce la disuguaglianza


n
!
(µ)
Y X
(10.3) |NK/Q (α)| ≤ N (I)CA , ove CA = |ωi | .
µ i=1

Ciò permette di concludere che N (J) ≤ CA ed essendo I scelto ad arbitrio e J un rappresentante della
classe di I −1 in Cl A, si conclude che in ogni classe di ideali di A c’è un rappresentante J con N (J) ≤ CA .
Da questa osservazione discende che è sufficiente considerare tutti i primi razionali minori di CA e le
loro fattorizzazioni in A per ottenere un numero finito di ideali che genera tutto Cl A. In particolare, ciò
costituisce un test effettivo per decidere se A è o meno un anello a fattorizzazione unica. Useremo questo
criterio per discutere la fattorizzazione unica nei corpi quadratici immaginari.
10.4 Esempio. [Corpi quadratici immaginari]
√ Sia quindi d > 0 un intero square-free e consideriamo
il corpo quadratico immaginario
√ Q( √−d) ed il suo anello degli interi A. Se supponiamo che −d ≡
2, 3 (mod 4),
√ allora A = Z[ −d] e {1, −d} è una base intera di A (cf. Proposizione I.4.2). Il polinomio
minimo di −d è X 2 + d e, ragionando come nell’Esempio I.8.4, se p è un primo razionale, si ha
2
• l’ideale
  pA è primo in A se il polinomio X = d è irriducubile in Z/pZ[X] e quindi se, e solo se,
−d
p = −1.
 
−d
• l’ideale pA si spezza nel prodotto di due primi distinti in A se, e solo se, p = 1.
• l’ideale
  pA è il quadrato di un ideale primo di A se p divide il discriminante di A, ovvero se, e solo
−d
se, p = 0.
√ √
La√costante CA è uguale ad (1 + d)2 = 1 + d + 2 d ed osserviamo che, se d non è un primo, allora
A = Z[ −d] non è un anello a fattorizzazione unica. Infatti, se d = pd1 con d1 > 1 e p un primo√ razionale,
allora pA = p2 ed p non può essere un ideale principale di A. Se fosse p = (β), con β = x + y −d ∈ A,
si avrebbe pA = β 2 A e quindi p = ±β 2 (perchè in A non vi sono invertibili diversi da ±1). Da ciò si
dedurrebbe p2 = NK/Q (β)2 = (x2 + dy 2 )2 e quindi p = x2 + dy 2 > d e ciò è assurdo.

Si può mettere un’ulteriore restrizione ai primi d per cui A = Z[ −d] può essere un anello fattoriale.
Infatti, se d + 1 = 2pd1 , e quindi −d ≡ 1 (mod p), allora il primo p si spezza in A, ovvero pA = p1 p2
con f p1 e p2 primi distinti di A, tra loro coniugati. Allora, se i due ideali fossero principali, si avrebbe
f p1 = (β), f p2 = (β ′ ), e p = ±ββ ′ = ±NK/Q (β). Dunque, si avrebbe p = x2 + dy 2 , che è assurdo perchè
p ≤ d+12 .
I §.10 Applicazioni. 43

Supponiamo ora che d ≡ −1 (mod 4), allora A = Z[ω], ove ω = 1+ 2 −d e quindi {1, ω} è una base
intera (cf. Proposizione I.4.2) e, posto ∆ = ωω ′ = 1+d 2
4 , il polinomio minimo di ω è f (X) = X − X + ∆.
Allora, ragionando come nell’Esempio I.8.4, si verifica facilmente che
• l’ideale 2A è primo se il polinomio d ≡ 3 (mod 8), mentre è prodotto di due primi distinti se d ≡
−1 (mod 8).
Per quanto riguarda i primi p > 2 si ha, analogamente al caso precedente,
 
• l’ideale pA si spezza nel prodotto di due primi distinti in A se, e solo se, −d
p = 1.
 
• l’ideale pA ramifica se, e solo se, −d
p = 0.
Vogliamo mostrare che, se d è sufficientemente grande,

Cl(Z[ω]) = {1} ⇐⇒ f (x) è un numero primo se 0 ≤ x ≤ ∆ − 1. (10.5)

Supponiamo quindi che A sia un anello fattoriale ed osserviamo che, se per qualche primo p si ha f (x) =
x(x − 1) + ∆ = pq con p < q ed x ≤ ∆ − 1, si ricava la disuguaglianza p2 < pq ≤ (∆ − 1)(∆ − 2) + ∆.
Inoltre, poichè f (X) ha una radice modulo p, allora p è un primo che si spezza in A, si ha p = αα′
ove α = a − bω ed α′ è il coniugato di α. Da ciò si deduce la relazione p = a2 − ab + b2 ∆ e quindi
4p = (a + b)2 + db2 > d. Con un calcolo diretto, si verifica che le due disuguaglianze sono incompatibili e
quindi f (x) deve essere un numero primo.
Viceversa, supponiamo che per 0 < x ≤ ∆ − 1, f (x) = p sia un primo razionale. In particolare,√ciò
significa che p è un primo che si spezza in A = Z[ω] e supponiamo che si abbia p ≤ CA = 1 + ∆ + 2 ∆,
perchè sono questi i primi che ci interessano per conoscere Cl A. Osservando che per ogni intero y, si ha
f (y) ≡ 0 (mod p) ⇔ f (p + 1 − y) ≡ 0 (mod p), possiamo supporre √ che si abbia f (y) ≡ 0 (mod p) con
0 ≤ y ≤ p+1 2 . Si deduce quindi che deve aversi y ≤ ∆
2 + 1 + δ e, per d sufficientemente elevato (ad
esempio d > 40), ciò implica y ≤ ∆ − 1. Quindi deve aversi f (y) = p, ovvero p = (y − ω)(y − ω ′ ) e quindi
pA si spezza nel prodotto di due primi principali, che è quanto ci serviva per concludere la dimostrazione
di (I.10.5).
Osserviamo che, la condizione precedente si può migliorare, per d elevato, nel modo seguente
r
4
f (x) è un numero primo se 0 ≤ x ≤ ∆ − 1 ⇐⇒ f (x) è un numero primo se 0 ≤ x ≤ ∆.
3
q
4
Se d è elevato (ad esempio d > 11 e quindi ∆ > 3), allora 3 ∆ ≤ ∆ − 1 ed una delle implicazioni è
q
ovvia. Sia quindi f (x) un primo per 0 ≤ x ≤ 43 ∆ e sia

x0 = min { y ∈ Z≥0 | f (y) non è primo } .

Si avrà dunque p2 ≤ pq = x20 − x0 + ∆, ove p è un primo e q ≥ p. Scelto un minimo intero z ≤ p+1 2


tale che f (z) ≡ 0 (mod p), si avrà z = x0 , oppure ∆ ≤ f (z) = p. In quest’ultimo caso, si conclude che
∆2 ≤ p2 ≤ f (x0 ), e quindi che x0 ≥ ∆; se invece, z = x0 , allora si ottiene

p2 − 1
p2 ≤ x20 − x0 + ∆ ≤ +∆
4

e quindi p2 ≤ 43 ∆ − 14 .
Non ci occuperemo del gruppo di classi di ideali nel caso di corpi quadratici reali, ma mostreremo
come si possa migliorare la stima della costante CA che permetteva di determinare un insieme finito
di generatori per Cl A (cf. I.10.3). Ricordiamo che un reticolo (lattice) in uno spazio vettoriale reale
44 Interi algebrici I §.10

V è il sotto-Z-modulo libero Λ generato da una base di V . Fissato un sistema di generatori liberi


V = {v1 , . . . , vn } di Λ, si chiama dominio fondamentale del reticolo Λ il sottoinsieme chiuso di V

n
( )
X
F= xi vi | 0 ≤ xi ≤ 1, per i = 1, . . . , n .
i=1

10.6 Teorema. [Teorema di Minkowski] Sia Λ un reticolo in Rn con dominio fondamentale di volume
M . Se C è una regione compatta, convessa, simmetrica rispetto all’origine, e di volume maggiore o uguale
a 2n M , allora esiste un vettore 0 6= x ∈ Λ ∩ C.
La dimostrazione discenderà dal seguente
10.7 Lemma. Se D è una regione misurabile di volume maggiore di M , allora esistono due punti distinti
x, y ∈ D con x − y ∈ Λ.

dim. Sia F il dominio fondamentale di Λ e si considerino i sottoinsiemi del tipo x + F , al variare di x ∈ Λ.


Posto Dx = (x + F ) ∩ D, allora si ha
X X
Vol(F ) = M < Vol(D) = Vol(Dx ) = Vol(F ∩ (D − x)).
x∈Λ x∈Λ

Dunque devono esistere u, v ∈ D ed x 6= y in Λ tali che u − x = v − y, e quindi u − v = x − y ∈ Λ \ {0}.


CVD 
Possiamo quindi dedurre da ciò la dimostrazione del Teorema I.10.6
dim. [del Teorema di Minkowski]. Se Vol(C) > 2n M , siano α e β in 12 C con α − β ∈ Λ \ {0}. Dunque,
′ ′
se scriviamo α = α2 e β = −β ′ ′
2 con α , β ∈ C, poichè C è simmetrico rispetto all’origine e convesso,
′ ′
si conclude che α − β = α +β 2 ∈ Λ ∩ C. Per concludere nel caso in cui sia Vol(C) = 2n M , si possono
considerare gli insiemi Cn = (1 + n1 )C ed ottenere degli elementi 0 6= xn ∈ Λ ∩ Cn ed osservare che tali
elementi stanno in un insieme compatto, discreto e contenuto in una regione limitata. Dunque esiste una
sottosuccessione costante che perciò, converge ad un elemento di Λ ∩ C. CVD 
Applichiamo il Teorema di Minkovski ai corpi quadratici immaginari √ allo scopo di migliorare la
stima della costante CA che compare in (I.10.3). Sia quindi √ K = Q( −d) con d > 0, square-free e
d 6≡ 3 (mod 4). In tal caso l’anello degli interi di K è A = Z[ −d], ed un ideale I ⊆ A corrisponde
√ ad un
reticolo in C, il cui dominio fondamentale ha area uguale a N (I). Dato un elemento z = a + b −d ∈ A,
si ha NK/Q (x) = a2 + db2 , e quindi usiamo il teorema di Minkowski per determinare un valore minimo di
λ affinchè l’insieme
n √ o
Cλ = z ∈ C | z = x + y −d, (x, y) ∈ R2 , x2 + dy 2 ≤ λ

intersechi I in un elemento non nullo α, ed ottenere cosı̀ una stima della norma di α in funzione di N (I).
In base al Teorema di Minkovski, è sufficiente che si abbia Vol Cλ ≥ 4N (I) affinché vi sia 0 6= α ∈ I, di
λπ
norma NK/Q (α) = λ. Essendo Vol Cλ = √ d
, si deduce la relazione

4 d
(10.8) NK/Q (α) = N (I),
π

che migliora la stima (I.10.3).

Osserviamo infine che quest’ultima osservazione non si può applicare nel caso dei corpi quadratici
reali perchè, in tal caso, gli insiemi Cλ non sono convessi.
I §.11 Un’osservazione sui corpi quadratici immaginari 45

Concludiamo questa sezione ricordando due importanti stime per la costante C, per cui si abbia
NK/Q (α) ≤ C N (I), ove I è un qualsiasi ideale dell’anello degli interi del corpo di numeri K.
• Si può prendere
√ 22t d!
C = | ∆| t d , [stima di Minkovski]
πd
ove ∆ è il discriminante di K, d = [K : Q] e 2t è il numero di immersioni non-reali di K in C. Come
si vede facilmente, questa stima si riduce a (I.10.8) nel caso dei corpi quadratici immaginari.
• Si può prendere
 r d
C = |∆| , [stima di Siegel]
d
nel caso
  di un corpo totalmente reale, ove r è la parte intera di d/6 se d ≡ 1 (mod 6), mentre
r = d6 + 1 altrimenti.

11. Un’osservazione sui corpi quadratici immaginari


Si consideri la funzione zeta di Riemann, definita come

X 1
ζ(s) = se Re s > 1.
n=1
ns

Si osservi che la definizione è ben posta perchè, per valori dell’esponente s con parte reale maggiore di 1,
la serie data converge assolutamente. Infatti, se Re s = r, allora n1s = n1r e, per r > 1, si ha(∗)
+∞ ∞ Z +∞
1 dt X 1 dt 1
Z
= r
≤ r
≤1+ r
=1+ . (11.1)
r−1 1 t n=1
n 1 t p−1
P∞ 1
In particolare, da ciò si deduce che su ogni sottoinsieme compatto del semipiano Re s > 1, la serie n=1 ns
converge uniformemente ad una funzione analitica. Inoltre, sempre per Re s > 1, si ha
∞ ∞ Z n+1 ∞ Z
dt X n+1 1
 
1 X 1 X 1
ζ(s) − = − = − s dt. (11.2)
s − 1 n=1 ns n=1 n ts n=1 n
ns t

Se si mostra che la serie a destra converge uniformemente sui compatti del semipiano Re s > 0, si può
concludere che la funzione ζ(s), definita sopra, si estende ad una funzione meromorfa nel semipiano
Re s > 0, con un unico polo (semplice) per s = 1. Si osservi che per n ≤ t ≤ n + 1, in base al Teorema
del Valor Medio, si ha
 
1 1 d 1 1 s |s|
− s ≤ sup − s = sup ≤ 1+Re s .
ns t n≤t≤n+1 dt n s t n≤t≤n+1 t s+1 n

Da ciò si deduce la disuguaglianza


Z n+1   n+1
1 1 1 1 |s|
Z
− s dt ≤ − s dt ≤ 1+Re s .
n ns t n ns t n
Dunque in ogni sottoinsieme compatto del semipiano Re s > 0, la serie in questione è maggiorata da
un’opportuna serie (di costanti) a termini positivi, convergente. Il criterio di Weierstrass permette quindi
di concludere.
(∗)
Le disuguaglianze si possono ottenere identificando la somma della serie armonica generalizzata di esponente (reale) r
R +∞ dx
con l’integrale 1 [x]r
, ove [x] indica la parte intera del numero reale x. Infatti, in tal modo, le disuguaglianze discendono
dall’osservazione che per ogni numero reale x si ha [x]r ≤ xr < ([x] + 1)r .
46 Interi algebrici I §.11

11.3 Remark. [Formula del prodotto di Eulero] Sia Re s > 1 e verifichiamo che si ha l’identità

X 1 Y
s
= (1 − p−s )−1 (11.4)
n=1
n p

1 s 2s
ove p varia nell’insieme dei primi razionali. Infatti, ricordando che 1−ps = 1+p +p +· · · , e considerando
i termini iniziali delle serie che si ottengono calcolando il prodotto sui numeri primi minori di un certo
N , comunque fissato, si ottiene una somma parziale della serie a sinistra del segno di uguale. Quindi, per
ogni s fissato, i due membri dell’uguaglianza sono formalmente uguali. Essendo entrambi convergenti, si
conclude che vale l’identità annunciata.
Si osservi che da questa identità si può dedurre che vi sono infiniti primi razionali. Infatti, se questi
fossero in numero finito, considerando il prodotto a destra, si otterrebbe lim sup ζ(s) < ∞, che è in
s→1+
contraddizione col fatto che ζ(s) ha un polo semplice in s = 1.
Si consideri ora r reale e maggiore di 1. Dalla formula del prodotto, si ottiene
X X
log ζ(r) = − log(1 − p−r ) = (p−r + O(p−2r )),
p p

ove l’ultima uguaglianza deriva dall’osservazione elementare che log(1 − t) = −t + O(t2 ). Si osservi
X 1
che è maggiorata dalla somma della serie convergente ζ(2r), e quindi, la somma dei termini di
p
p2r
correzione è una funzione limitata della variabile r.
Ricordando poi la disuguaglianza (I.11.1), si può quindi scrivere
X 1 1
(11.5) r
= log + O(1), per r > 1,
p
p r−1

ove p varia tra tutti i primi razionali ed il simbolo O(1) stà ad indicare una funzione limitata.

Vogliamo introdurre delle nozioni analoghe a quelle sopra esposte quando a Q si sostituisca un corpo
di numeri. Sia quindi K un’estensione finita di Q e si indichi con O = OK il suo anello degli interi. La
funzione zeta di Dedekind del corpo K è definita come
X 1 Y
(11.6) ZK (s) = s
= (1 − N (p)−s )− 1,
N (I)
I p

ove I varia tra tutti gli ideali non-banali di O, e p varia tra gli ideali primi (non-banali) dello stesso anello, e
inoltre per ogni ideale I si indica con N (I) il numero di elementi dell’anello O/I (cf. Lemma I.10.1). Se p è
un primo di O e divide il primo razionale p (pO ⊆ p), allora N (p) = pf per un opportuno f ≤ n = [K : Q]
ed inoltre, sopra ogni primo razionale, vi è solo un numero finito di primi di O, limitato dal grado n
(cf. Teorema I.9.14); dunque, anche in questo caso la serie converge assolutamente ed uniformemente su
ogni compatto del semipiano Re s > 1.

Consideriamo ora il caso particolare in cui K è un corpo quadratico immaginario, ovvero K = Q( −d
con d ∈ Z>0 e square-free. All’infuori di un numero finito di primi razionali che sono ramificati in O,
possiamo distinguere i primi razionali in due grandi classi

A = { p | pO = p1 p2 } e B = { p | pO = p } ,

e si ha quindi N (p1 ) = p = n(p2 ) se pO = p1 p2 , e N (pO) = p2 se p ∈ B. possiamo quindi scrivere


Y∗ Y Y
(1 − N (p)−s )−1 = (1 − p−s )−2 (1 − p−2s )−1 ,
p p∈A p∈B
I §.11 Un’osservazione sui corpi quadratici immaginari 47

ove l’asterisco sul simbolo di prodotto sta ad indicare che il prodotto è preso su tutti i primi non-ramificati
di O.
Anche questa volta, limitiamoci a considerare in luogo di s una variabile reale r > 1. Ricordando che
i primi ramificati sono in numero finito e passando al logaritmo, possiamo quindi dedurre dall’espressione
soprastante (per r → 1+ )
X X
log ZK (r) = −2 log(1 − p−r ) − log(1 − p−2r ) + O(1).
p∈A p∈B

Da ciò, ricordando che log(1 − x) = −x + O(x2 ) e che p−2r converge per r = 1, si conclude che
P
p

X 1
log ZK (r) = 2 + O(1). (11.7)
pr
p∈A

Vogliamo utilizzare questa espressione per mostrare che vi sono infiniti primi razionali che non apparten-
1
gono ad A. Se ciò non fosse vero, in base alla stima (I.11.5), si avrebbe log ZK (r) = 2 log r−1 + O(1), ed
invece mostreremo che vale una stima più restrittiva per log ZK (r) in prossimità di 1.
Siano C1 , . . . , Ch le classi di ideali del corpo K (cf. I §.10), ed osserviamo che, in base alla convergenza
assoluta della serie (I.11.6), si ha

h
X 1 X X 1
ZK (r) = r
= .
N (I) i=1
N (I)r
I I∈Ci

Fissiamo per ogni classe Ci un suo rappresentante Ji , e si noti che I ∈ Ci se, e solo se, I = Ji (α) per
qualche α ∈ K con il denominatore limitato dal fatto di dover dividere Ji . Essendo K un corpo quadratico
immaginario, il suo gruppo degli invertibili è finito e quindi, per ogni ideale principale viè un numero
finito di generatori, limitato dall’ordine del gruppo degli invertibili. Quindi, ricordando il Lemma I.10.1,
possiamo scrivere
X 1 X 1
r
≈ µri ,
N (I) α
|N K/Q (α)|r
I∈Ci

1
ove µi = N (J i)
, l’indice α varia tra gli elementi di K il cui denominatore divide Ji ed infine, il simbolo ≈
sta ad indicare che il rapporto tra i due membri è una funzione limitata. Fissato un intero N , più grande
di tutti i divisori dell’ideale Ji , ed una opportuna costante µ, possiamo quindi scrivere
X 1 X Nr
≤µ .
N (I)r √ (a2 + db2 )r
I∈Ci a+b −d
06= N

Osservando che le costanti µ ed N possono essere scelte in modo uniforme per tutti gli ideali Ji (i =
1, . . . , h), e passando al logaritmo, possiamo quindi scrivere (sempre per r → 1+ )
 
X 1
log ZK (r) ≤ log   + O(1).
(a2 + db2 )r
(a,b)∈Z2 \{(0,0)}

La somma che compare nel secondo membro differisce per una funzione limitata dall’integrale

+∞ +∞
dx dy
Z Z
4
1 1 (x2 + dy 2 )r
48 Interi algebrici I §.11

e, dopo aver effettuato la sostituzione Y = y d ed il passaggio a coordinate polari (ρ, θ), è immediato
verificare che Z +∞ Z +∞ Z +∞ Z π/2
dx dy 1
2 + dy 2 )r
≤ dρ ρ1−2r dθ ≤ M ,
1 1 (x 1 0 r − 1
per un’opportuna costante M . Si può quindi concludere che

1
log ZK (r) ≤ log + O(1),
r−1

e quindi, applicando la stima (I.11.7), si ottiene


X 1 1 1
≤ log + O(1);
pr 2 r−1
p∈A

e ciò è compatibile con (I.11.5) solo se vi sono infiniti primi razionali che non appartengono ad A.
II
Il Teorema di Hasse e Minkowski

1. Valori assoluti

In questa sezione ci occuperemo dei valori assoluti –detti anche valutazioni di rango 1– sul corpo Q
dei numeri razionali e della loro classificazione.
1.1 Definizioni. Un valore assoluto sul corpo K è un omomorfismo di gruppi moltiplicativi f : K × →

>0 , soddisfacente alla condizione f (x + y) ≥ f (x) + f (y). Tale omomorfismo si estende a tutto K
ponendo f (0) = 0.
Ad un valore assoluto f su K resta associata una metrica, definita ponendo

df (x, y) := f (x − y) per ogni x, y ∈ K,

ed è facile verificare che tale metrica rende K un corpo topologico.


Infine, diremo che due valori assoluti sono equivalenti se le metriche associate inducono la stessa
topologia.
Si chiama valore assoluto banale il valore assoluto definito ponendo f (x) = 1 per ogni x ∈ K × . Si
verifica facilmente che tale valore assoluto induce la topologia discreta su K.
Vogliamo dare una facile caratterizzazione di valori assoluti tra loro equivalenti.
1.2 Proposizione. Siano f e g due valori assoluti sul corpo K. Allora f e g sono equivalenti se, e solo
se, esiste una costante positiva c ∈ R tale che f (x) = g(x)c per ogni x ∈ K.

dim. Si osservi che, se f e g sono due valori assoluti ed f (x) = g(x)c per ogni x ∈ K allora è facile
verificare che inducono la stessa topologia, considerando ad esempio delle sfere centrate nell’origine ed
osservando che Bf (0, rc ) = Bg (0, r) per ogni raggio positivo r.
Dimostriamo quindi l’implicazione nel verso contrario e cominciamo con il caso in cui uno dei valori
assoluti, sia g, è banale. Si osservi che, se f induce la topologia discreta su K, non può esistere un elemento
x ∈ K × con f (x) 6= 1, perchè, in tal caso una delle due successioni (xn )n∈N ed (x−n )n∈N convergerebbe
a zero senza annullarsi mai. Il che dimostra la tesi nel caso di valori assoluti banali.
Sia quindi f non banale e si fissi un elemento x0 ∈ K con 0 < f (x0 ) < 1 e si osservi che allora si
ha lim xk0 = 0 e quindi g(x0 ) < 1. Inoltre, fissato comunque x ∈ K esiste un esponente r ∈ R tale che
k→∞
f (x) = f (x0 )r e, a meno di sostituire x con x−1 , possiamo supporre che sia r ≥ 0. Analogamente, si avrà
g(x) = g(x0 )s , per qualche s ∈ R≥0 . Allora, se r < m n ∈ Q, si ha f (x0 )
m/n
< f (x0 )r = f (x) e quindi
f (xm
0 ) < f (x n
), ovvero f (xm
0 /x n
) < 1, da cui si deduce che la successione ((xm n k
0 /x ) )k∈N converge a zero
in K e deve quindi aversi g(xm 0 /x n
) < 1, ovvero g(x0 )m/n
< g(x). Dunque si ha s< m n , e poichè un
risultato analogo vale per ogni approssimazione razionale di r, si conclude che r = s. Si conclude quindi
che
log f (x) log g(x) log f (x0 )
r= = e quindi log f (x) = c log g(x), ove c = ,
log f (x0 ) log g(x0 ) log g(x0 )
che, data l’arbitrarietà di x, è ciò che dovevamo dimostrare. CVD 

Mettiamo in evidenza una classe importante di valori assoluti

49
50 Il Teorema di Hasse e Minkowski II §.1

1.3 Definizione. Un valore assoluto f : K → R si dice non-archimedeo se vale la condizione ulteriore


f (x + y) ≤ sup(f (x), f (y)), per ogni x, y ∈ K.
Sia f un valore assoluto ed osserviamo che, usualmente la propietà archimedea, che vale ad esempio
per l’usuale valore assoluto dei numeri reali, si esprime nella forma seguente:

dati comunque a, b ∈ K × esiste n ∈ N tale che f (na) > f (b). (1.4)

In realtà le due formulazioni sono equivalenti e, più in generale, vale la seguente


1.5 Proposizione. Sia f : K → R un valore assoluto non banale sul corpo K. Le seguenti condizioni
sono equivalenti:
(a) f è non-archimedeo;
(b) f (n) ≤ 1 per ogni intero positivo n;
(c) f (n) ≤ B per ogni intero positivo n;
(d) non vale la (II.1.4).

dim. La verifica che (a) ⇐ (b) ⇐ (c) è immediata. Per vedere che (c) ⇐ (d), si può ragionare cosı̀:
se vale la proprietà (II.1.4), preso comunque un elemento b ∈ K, esiste un numero naturale n tale che
f (b) < f (n) e quindi f (b) ≤ B per ogni b ∈ K e quindi f è imitato e perciò banale. Ma il valore assoluto
banale non può soddisfare ad (II.1.4) e ciò permette di concludere. D’altra parte, è facile vedere che
(d) ⇐ (c); infatti, se non vale la (II.1.4) devono esistere due elementi a, b ∈ K × , tali che f (na) ≤ f (b)
per ogni n ∈ N e perciò si conclude che f (n) ≤ B = ff (a)
(b)
per ogni n ∈ N.
Dunque, per concludere è sufficiente mostrare che (c) ⇐ (a). Infatti, dati x, y ∈ K e posto M =
sup(f (x), f (y)), si ha

n   n
!  
n
X n h n−h X n
f (x + y) = f x y ≤ f( ) M n ≤ BM n (n + 1).
h h
h=0 h=0

Se ne deduce quindi che, per ogni intero positivo n, vale la disuguaglianza f (x + y) ≤ (B(n + 1))1/n M
che, passando al limite per n → ∞, permette di concludere. CVD 

Vogliamo occuparci ora specificamente dei valori assoluti sul corpo Q dei numeri razionali. Ricor-
diamo che su Q, si possono porre il valore assoluto banale, l’usuale valore assoluto archimedeo, indotto
dall’ordinamento naturale, che indicheremo con |x|∞ per ogni x ∈ Q ed inoltre, per ogni numero primo p, il
valore assoluto p-adico, definito dalla posizione |x|p = p−v , ove l’intero v soddisfa alla condizione x = pv rs
con r ed s entrambi primi con p. Si può verificare che i valori assoluti p-adici sono tutti non-archimedei.
Vogliamo mostrare che quelli appena descritti sono, a meno di equivalenza, tutti i possibili valori
assoluti sul corpo Q.
1.6 Teorema. [Ostrowski] Ogni valore assoluto non banale su Q è equivalente al valore assoluto archi-
medeo oppure ad uno dei valori assoluti p-adici.

dim. Sia dunque f : Q → R un valore assoluto non banale e siano dati due numeri naturali m ≥ n > 1.
Scriviamo m in base n, nella forma

m = a0 + a1 n + · · · + ar n r , con 0 ≤ ai ≤ n − 1, per i = 0, . . . , r e ar 6= 0.

Applicando f si ottiene
r
X r
X
f (m) ≤ f (ai )f (n)i ≤ B f (n)i ≤ B(r + 1) sup(1, f (n)r ),
i=0 i=0
II §.1 Valori assoluti 51

ove B = max f (j).


j=0,...,n−1
log m
Dalla disuguaglianza nr < m, si deduce r ≤ log n e quindi
 
log m log m
f (m) ≤ B + 1 sup(1, f (n) log n ).
log n

Fissato un intero M e prendendo m = M k , si ottiene quindi


 
1/k log M log M
(1.7) f (M ) ≤ B k + 1 1/k sup(1, f (n) log n ),
log n
da cui, passando al limite per k → ∞, si ottiene la disuguaglianza
log M
f (M ) ≤ sup(1, f (n) log n ).

Se f è archimedea, esiste un intero M con f (M ) > 1 (cf. Proposizione II.1.5) e dalla disuguaglianza si
deduce che f (n) > 1 per ogni n > 1 e dunque, che si ha f (M )1/ log M ≤ f (n)1/ log n e quindi, scambiando
i ruoli di M ed n, si ottiene

f (M )1/ log M = f (n)1/ log n per ogni coppia di interi M, n.

log f (n)
Si conclude perciò che il rapporto α = è indipendente da n e quindi che f (x) = |x|α
∞ , per ogni
log n
x ∈ Q.
Supponiamo ora che f sia non-archimedea. Allora, l’insieme

M = { n ∈ Z | f (n) < 1 }

è un ideale primo, non banale, di Z e si deduce dalla formula (II.1.7) che f è equivalente a | |p , ove p è
un generatore di M. CVD 
Indichiamo con V = { p ∈ Z | p è primo } ∪ {∞} l’insieme delle classi di equivalenza dei valori assoluti
su Q (i posti di Q) e scegliamo per ogni v ∈ V il valore assoluto | |v , opportunamente normalizzato,
ovvero l’usuale valore assoluto se v = ∞ (per cui si ha |n|∞ = n per ogni n ∈ N) ed il valore assoluto
p-adico se v = p (per cui si ha |p|p = p−1 ). Con queste normalizzazioni vale la seguente
Y
[formula del prodotto] |x|v = 1 per ogni x ∈ Q× . (1.8)
v∈V

Il corpo Q può essere completato rispetto a ciascuna delle metriche indotte dai valori assoluti | |v e
si ha Q∞ = R, mentre si indica con Qp il completamento rispetto al valore assoluto p-adico. Si verifica
facilmente che, trattandosi di valori assoluti non-archimedei, le sfere

B(0, 1+ ) = { x ∈ Qp | |x|p ≤ 1 } =: Zp e B(0, 1− ) = { x ∈ Qp | |x|p < 1 } =: mp

sono rispettivamente un sottoanello di Qp ed un ideale massimale di tale anello; inoltre si ha Qp =


F rac Zp (∗) . L’ideale mp contiene tutti gli elementi non-invertibili di Zp ed è generato dal primo p, si
conclude che Zp è un DVR (cf. Proposizione I.9.3) e la relazione tra la valutazione discreta vp : Q×
p →Z
ed il valore assoluto p-adico è data dall’identità

|x|p = p−vp (x) per ogni x ∈ Qp .

Vogliamo illustrare ora alcune proprietà topologiche dei completamenti p-adici di Q.


(∗)
Si potrebbe mostrare che Zp ∼
= lim Z/pn Z, ove le freccie di connessione sono le proiezioni naturali tra i quozienti.

52 Il Teorema di Hasse e Minkowski II §.1

1.9 Proposizione. L’anello Zp è compatto e totalmente sconnesso. Dunque Qp è localmente compatto


e totalmente sconnesso.

dim. Si osservi che, ogni sfera di Qp è simultaneamente aperta e chiusa ed è omeomorfa a Zp , essendo

B(x, p−m,+ ) = y ∈ Qp | |y − x|p ≤ p−m = { x + u | vp (u) ≥ m } = x + pm Zp = B(x, p−m+1,− ).




Da ciò discende che Qp è totalmente sconnesso e che è sufficiente dimostrare che Zp è compatto per con-
cludere. Per fare ciò mostriamo che vale il criterio di Bolzano-Weierstrass, ovvero che da ogni successione
in Zp si può estrarre una sottosuccessione convergente. Sia quindi (xn )n∈N una successione in Zp e sia
S = { xn | n ∈ N } un insieme infinito. Poichè il quoziente Zp /pZp ∼
= Z/pZ è finito, esiste un elemento xn(1)
di S tale che l’insieme S1 = xn | n ≥ n(1), vp (xn − xn(1) ) ≥ 1 contenga infiniti elementi. Considerando
l’immagine di S1 nel 2 ∼ 2
 quoziente finito Zp /p Zp = Z/p Z, ottengo che esiste un elemento xn(2) di S1 tale
che l’insieme S2 = xn | n ≥ n(2), vp (xn − xn(1) ) ≥ 2 contenga infiniti elementi. Ragionando analoga-
mente, si costruisce una sottosuccessione (xn(k) )k∈N , che soddisfa alla condizione di Cauchy, perchè | |p
è un valore assoluto non-archimedeo e si ha vp (xn(k) − xn(k+1) ) ≥ k, ovvero |xn(k) − xn(k+1) |p ≤ p−k per
ogni k ∈ N. CVD 

Si osservi che, per costruzione, l’anello degli interi Z è denso in Zp e Q è denso nel suo completamento
Qp . Ciò si estende al prodotto finito di completamenti di Q nel modo seguente.
1.10 Proposizione. [Principio di approssimazione
Y debole] Per ogni sottoinsieme finito S ⊂ V, l’imma-
gine di Q tramite l’immersione diagonale Q → Qv è densa.
v∈S

dim. Osserviamo che, se ∞ ∈ / S, allora il risultato discende dall’usuale teorema cinese del resto. Si scriva
′ ′
quindi
Q S = {∞} ∪ S , con S = {p1 , . . . , pn } e indichiamo con (x∞ , x1 , . . . , xn ) un generico elemento di
Qv . Dobbiamo quindi mostrare che fissati comunque un tale elemento ed un numero reale positivo ε,
esiste un numero razionale x ∈ Q tale che |x − x∞ |∞ < ε e |x − xi |pi < ε per i = 1, . . . , n. A meno
di moltiplicare per un prodotto del tipo pm mn
1 · · · pn , si può supporre che xi ∈ Zpi per ogni i = 1, . . . , n e
1

quindi, per il Teorema citato, in corrispondenza ad un qualunque numero reale positivo δ, esiste un intero
y ∈ Z tale che |y − xi |pi < ε per i = 1, . . . , n; inoltre la condizione resta vera se sostituisco ad y numeri
razionali del tipo y + (p1 · · · pn )M u, per M sufficientemente elevato ed |u|pi ≤ 1 per ogni i = 1, . . . , n. Si
tratta quindi di determinare u affinché si abbia

y − x∞ ε
|y + (p1 · · · pn )M u − x∞ |∞ < ε ovvero +u < .
(p1 · · · pn )M (p1 · · · pn )M

È chiaro che si possono trovare dei numeri razionali soddisfacenti a questa condizione, che non contengano
nessuno dei pi al denominatore. CVD 

Da ultimo, diamo qualche cenno ai prolungamenti dei valori assoluti p-adici di Q alle sue estensioni
finite. Se L è un’estensione di Q di grado n, per il Teorema dell’elemento primitivo (cf. Proposizione I.2.2),
possiamo supporre che sia L = Q(α) ed indicare con F (X) = a0 + a1 X = · · · + X n ∈ Q[X] il polinomio
minimo di α. Indicato con OL l’anello degli interi di L (ovvero la chiusura integrale di Z in L), si avrà
pOL = pe11 · · · perr , ove gli pj sono primi distinti di OL e si ha n = ri=1 ei fi , ove fi = [OL /pi : Fp ] per
P
i = 1, . . . , r (cf. Teorema I.9.14). Allora si può dimostrare che esistono esattamente r estensioni g1 , . . . , gr
del valore assoluto | |p ad L, rispettivamente con indici di ramificazione e1 , . . . , er e tali che per ogni
i = 1, . . . , r si abbia { x ∈ L | gi (x) ≤ 1 } = OL,pi .
In particolare, si può osservare che L ⊗Q Qp è somma diretta di r corpi L1 , . . . , Lr , di grado [Li :
Qp ] = fi ei , determinati in corrispondenza alla decomposizione in fattori irriducibili di F (X) in Qp [X].
Uno studio ulteriore potrebbe determinare la ramificazione di p nelle singole estensioni.
II §.2 Equazioni polinomiali p-adiche 53

(∗)
Non dimostriamo queste asserzioni
√ , ci limitiamo invece ad illustrare l’esempio di un’estensione
quadratica
  di Q. Sia quindi L = Q( d) ove d è un intero square-free e sia p un primo tale che p 6 | 2d.
d
Se p = 1, ovvero se d è un quadrato modulo p, allora esiste un elemento α ∈ Qp tale che α2 = d (si
veda
√ il successivo Corollario II.2.4), e quindi vi sono due immersioni distinte di L in Qp (che mandano
d in α e −α rispettivamente) e le restrizioni di | |p all’immagine forniscono√le due estensioni del valore
assoluto p-adico da Q ad L. In particolare, dall’esistenza di α, si deduce Q( d) ⊗Q Qp ∼= Qp ⊕ Qp .
√ √
D’altro canto, se p = −1, allora d non è un quadrato in Qp e perciò Q( d) ⊗Q Qp ∼
d
= Qp ( d).
In particolare, vi è un’unica estensione | | del valore assoluto | |p , che può essere determinata in questo
modo: se β ∈ Q̄p è una radice quadrata di d (β 2 = d), allora posto c = |a + bβ| = |a − bβ| (due elementi
coniugati hanno la stessa valutazione), si ha c2 = |a + bβ| |a − bβ| = |a2 + db2 |p , e quindi deve essere
1/2
|x| = |NL/Q (x)|p per ogni x ∈ L.

2. Equazioni polinomiali p-adiche


Dato un polinomio f (X) ∈ Zp [X1 , . . . , Xn ] indicheremo con fm (X) il polinomio che si ottiene
riducendo modulo pm i coefficienti di f (X).
2.1 Proposizione. Sia f (X) ∈ Zp [X1 , . . . , Xn ]. Le seguenti affermazioni sono equivalenti
(i) esiste a = (a1 , . . . , an ) ∈ Znp tale che f (a) = 0;
(ii) la congruenza f (X) ≡ 0 (mod p)m ha soluzione per ogni m ≥ 0.

(m) (m)
dim. È chiaro che (i) ⇒ (ii). Viceversa se, per ogni m, si indica con a(m) = (a1 , . . . , an ) ∈ Znp una
soluzione della congruenza f (X) ≡ 0 (mod p)m , ricordando che Zp è compatto (cf. Proposizione II.1.9),
si conclude che esiste una sottosuccessione convergente di soluzioni delle congruenze che converge quindi
ad uno zero di f (X). CVD 
Per i polinomi omogenei, il risultato si può rafforzare introducendo il concetto di n-upla primitiva,
ovvero di un n-upla (x1 , . . . , xn ) ∈ Znp , tale che sup |xi |p = 1. Possiamo quindi enunciare la seguente
Proposizione la cui dimostrazione si ottiene da un facile adattamento degli argomenti della dimostrazione
precedente.
2.2 Proposizione. Sia f (X) ∈ Zp [X1 , . . . , Xn ] un polinomio omogeneo. Le seguenti affermazioni sono
equivalenti
(i) esiste a = (a1 , . . . , an ) ∈ Qnp \ {(0, . . . , 0)} tale che f (a) = 0;
(ii) esiste un n-upla primitiva a = (a1 , . . . , an ) ∈ Znp tale che f (a) = 0;
(iii) la congruenza f (X) ≡ 0 (mod p)m ha soluzioni primitive per ogni m ≥ 0.
In base alle osservazioni fatte, possiamo enunciare il metodo di approssimazione di Newton delle
soluzioni di un’equazione (cf. Lemma I.6.9) nel modo seguente.
2.3 Proposizione. Siano dati f (X) ∈ Zp [X1 , . . . , Xn ] e due interi k, m con 0 ≤ 2k < m. Dato a =
(a1 , . . . , an ) ∈ Znp tale che
 
∂f
f (a) ≡ 0 (mod p)m e vp = k per qualche j = 1, . . . , n,
∂xj

allora esiste x = (x1 , . . . , xn ) ∈ Znp tale che f (x) = 0 e vp (xi − ai ) ≥ m − k per i = 1, . . . , n.


Questo risultato ha interessanti conseguenze che andiamo ad enunciare per le equazioni polinomiali
in Qp ed in particolare per le forme quadratiche.
(∗)
Il lettore interessato può trovare una dimostrazione di queste affermazioni nei §§. 2 e 3 del Capitolo II di J.-P. Serre,
Corps Locaux, Hermann 1962.
54 Il Teorema di Hasse e Minkowski II §.2

2.4 Corollario. Sia f (X) ∈ Zp [X1 , . . . , Xn ] un polinomio. Ogni zero semplice (†) di f1 in (Z/pZ)n si
rialza ad uno zero di f in Znp .
2.5 Corollario. Sia p 6= 2 e si consideri una forma quadratica
X
f (X) = aij Xi Xj ∈ Zp [X1 , . . . , Xn ]
1≤i,j≤n

con aij = aji e det(aij ) ∈ Z×


p . Dato a ∈ Zp , ogni soluzione primitiva della congruenza f (x) ≡ a (mod p)
si rialza ad una soluzione (primitiva) di f (x) = a.

dim. Sia y una soluzione primitiva della congruenza. In base al risultato precedente è sufficiente verificare
che una almeno tra le derivate parziali di f non si annulla, modulo p, in y. e ciò è vero perchè
n
∂f X
=2 aij Xi , det(aij ) 6≡ 0 (mod p), y è primitiva.
∂Xj i=1

In tal modo si conclude. CVD 

Consideriamo infine il caso in cui p = 2, che richiede una qualche cautela.


2.6 Corollario. Sia p = 2 e si consideri una forma quadratica
X
f (X) = aij Xi Xj ∈ Z2 [X1 , . . . , Xn ]
1≤i,j≤n

con aij = aji . Dato a ∈ Z2 , Se y è una soluzione primitiva della congruenza f (x) ≡ a (mod 8), y si rialza
ad una soluzione (primitiva) dell’equazione f (x) = a se una almeno tra le derivate parziali di f non si
annulla in y modulo 4. In particolare, quest’ultima condizione è soddisfatta se det(aij ) ∈ Z×
2.

L’asserzione si dimostra applicando la Proposizione nel caso in cui m = 3 e k = 1 e ragionando poi


come nel caso in cui p 6= 2.

Nel seguito di questo numero applicheremo i risultati precedenti allo studio dei gruppi Z× ×
p e Qp .
Prima di fare ciò, vogliamo generalizzare ai completamenti p-adici un risultato ben noto per i numeri
reali (completamento archimedeo di Q).
2.7 Proposizione. Il corpo Qp non ha automorfismi diversi dall’identità.

dim. Osserviamo che ogni automorfismo induce l’identità sul sottocorpo fondamentale Q, che è denso in
Qp e quindi è sufficiente dimostrare che ogni automorfismo di Qp è continuo(∗) . Si consideri il sottogruppo
moltiplicativo
U1 = x ∈ Q × m

p | ∀m ∈ N, (m, p) = 1, x = y ∃y ∈ Qp .

È chiaro che, per ogni automorfismo σ di Qp , deve aversi σ(U1 ) ⊆ U1 , quindi, se mostriamo che U1 =
1 + pZp , si conclude che σ(pZp ) ⊆ pZp , che è sufficiente per verificare che σ è continuo. Dunque,
se x ∈ U1 allora deve aversi vp (x) = mvp (y) per infiniti interi m e quindi vp (x) = 0. Inoltre, deve
aversi x ≡ y p−1 ≡ 1 (mod p), perchè il gruppo moltiplicativo di Fp è ciclico, di periodo p − 1. Dunque
U1 ⊆ 1 + pZp . D’altra parte, se u ∈ 1 + pZp , la congruenza X m ≡ u (mod p) ha una soluzione non

(†)
Se F (X1 , . . . , Xn ) è un polinomio a coefficienti in un corpo, uno zero x di F si dice semplice se una almeno tra le
∂F
derivate ∂X non si annulla in x.
i
(∗)
Nel caso del corpo reale, ciò si vede osservando che i positivi sono quadrati in R, e perciò ogni automorfismo conserva
l’ordinamento dei numeri reali ed è quindi continuo per il valore assoluto archimedeo.
II §.2 Equazioni polinomiali p-adiche 55

nulla che non annulla la derivata se (m, p) = 1. Dunque, per il Corollario II.2.4, possiamo concludere che
u ∈ U1 . CVD 

2.8 Remarks. (a). Dato un elemento u ∈ 1 + pZp si poteva verificare l’esistenza di radici m-esime di u in Qp ,
osservando che la serie binomiale
X 1/m h
(1 + X)1/m = X
h
h≥0

ha i coefficienti in Zp se (m, p) = 1 e perciò converge (assolutamente) per ogni x ∈ pZp (†) e la sua somma è una
radice m-esima di 1 + x per il principio di identità. Un modo semplice per vedere che per α ∈ Zp ed h ∈ N i
coefficienti binomiali α h
= α(α−1)···(α−h+1)
h!
appartengono a Zp è osservare che ogni elemento di Zp è limite di
(‡)
una successione di interi razionali (αn )n∈N e che il coefficiente binomiale, è una funzione di tipo polinomiale, e
quindi continua nell’argomento α. Si conclude che
     
α αn αn
= lim ≤ 1, perchè ∈ Z.
h n→∞ h h

Una stima più precisa del raggio di convergenza delle serie binomiali, si può avere ricordando che tali serie si
possono ottenere a partire dalle serie esponenziale e logaritmica ponendo

(1 + X)α = exp[α log(1 + X)], per α ∈ Zp ;

ricordando che 
X xn |x| < 1 se p 6= 2
log(1 + x) = (−1)n−1 , converge per 1
,
n |x| < 2
altrimenti
n≥1

ed
|y| < p1/(1−p)
X yn 
se p 6= 2
exp y = , converge per 1
.
n! |y| < 4
altrimenti
h≥0

La stima del raggio di convergenza di queste ultime due serie, si ottiene facilmente dall’osservazione che vp (n) ≤
logp (n) (logaritmo reale in base p) e vp (n!) = n−S(n)
p−1
≤ n−1
p−1
, ove S(n) è la somma delle cifre della scrittura in
base p del numero naturale n.
(b). Il contenuto della Proposizione precedente resta valido per le estensioni finite di Qp , ma è chiaramente
falso per le estensioni di R (il coniugio di C è un automorfismo diverso dall’identità e, più in generale, esistono
infiniti Q-automorfismi non-continui di C.). Una conseguenza di quanto dimostrato è che non vi sono sottocorpi
di indice finito in Qp ; infatti, se L fosse un tale sottocorpo, sarebbe un sottocorpo chiuso nella sua chiusura
normale, in quanto stabile rispetto agli automorfismi del gruppo di Galois. Poichè L è chiuso e contiene Q, deve
necessariamente aversi L = Qp , perchè Q è denso in Qp .

Concludiamo questa sezione occupandoci della struttura del gruppo delle unità di Zp e di Qp . Sia
quindi
U = Z×
p = { x ∈ Qp | |x|p = 1 } ,


X
(†)
In un corpo completo per un valore assoluto non-archimedeo, una serie an converge assolutamente se, e solo se,
n=0
lim an = 0.
n→∞
(‡) 1
Ad esempio, se (m, p) = 1, si può approssimare m nel modo seguente. Essendo am + bp = 1 per opportuni interi a e
b, si può scrivere
1 a 1 X
= =a =a (bp)n ;
m am 1 − bp
n≥0

1
la serie geometrica converge perche |bp|p < 1 e fornisce cosı̀ una successione di interi che converge ad m
.
56 Il Teorema di Hasse e Minkowski II §.2

e si osservi che in U vi è la filtrazione discendente di sottogruppi

U ⊃ U1 ⊃ U2 ⊃ · · · ove Un = 1 + pn Zp , per n ≥ 1. (2.9)

Considerando la restrizione ad U della riduzione modulo p, e l’applicazione 1 + pn x 7→ x (mod p), per


n ≥ 1, si conclude che i quozienti successivi della filtrazione sono

U/U1 ∼
= F×
p ed Un /Un+1 ∼
= Fp se n ≥ 1.

In particolare, per ogni n ≥ 1, si ha la sequenza esatta (spezzante(∗) )

0 −−−−→ U1 /Un −−−−→ U/Un −−−−→ U/U1 −−−−→ 0

Dunque, U/Un ∼ = V ⊕ U1 /Un , ove V è un sottogruppo ciclico di ordine p − 1 di U/Un . Considerando il


limite proiettivo di queste sequenze, si può scrivere

U = V ⊕ U1 ,

ove V è un sottogruppo ciclico, finito, di ordine p − 1 di U , ovvero il gruppo delle radici pn -esime di 1 in
Qp (∗∗) . Per quanto riguarda la struttura del gruppo U1 , dobbiamo distinguere il caso in cui p = 2 dagli
altri primi; precisamente vale il seguente risultato.
2.10 Proposizione. Notazioni come in (II.2.9). Allora
(i) se p 6= 2, si ha U1 ∼
= Zp ;
(ii) se p = 2, U1 ∼ = {±1} ⊕ U2 ed U2 ∼
= Z2 .

dim. (i). Si osservi che, per n ≥ 1, se x ∈ Un \ Un+1 , allora xp ∈ Un+1 \ Un+2 . Infatti, se x = 1 + pn y,
con y ∈ Z× p
p , allora applicando la formula del binomio di Newton, si ottiene x = 1 + p
n+1
y + pn+2 t, ove
X p
pn+2 t = pnj y j e quindi xp ∈ Un+1 \ Un+2 . Da questa osservazione, si ricava che, se α ∈ U1 \ U2 ,
j
j≥2
allora l’immagine di α nel quoziente U1 /Un ∼ = Z/pn Z è un generatore di questo gruppo ciclico. Dunque,
dato u ∈ U1 , in corrispondenza ad ogni n ≥ 1, esiste un intero an , determinato, a meno di addendi in
pn Z, tale che u ≡ αan (mod Un ). Poichè an+1 ≡ an (mod pn ), si conclude che esiste lim an = a ∈ Zp e
n→∞
che u = αa := lim αan . La corrispondenza u 7→ a è l’isomorfismo cercato.
n→∞
(ii). Se p = 2, non è più vera l’osservazione iniziale, ma è vero che per n ≥ 2, se x ∈ Un \ Un+1 , allora
x2 ∈ Un+1 \ Un+2 . Allora, ragionando come nel caso precedente si conclude che U2 ∼ = Z2 . Poichè U1
contiene il sottogruppo di 2-torsione {±1}, mentre U2 è privo di torsione si conclude che la sequenza
esatta
0 −−−−→ U2 −−−−→ U1 −−−−→ U1 /U2 −−−−→ 0
si spezza, dando luogo alla decomposizione dell’enunciato. CVD 
(∗)
Una sequenza esatta di gruppi abeliani finiti

0 −−−−−→ A −−−−−→ C −−−−−→ B −−−−−→ 0


α β

si spezza se gli ordini di A e B sono coprimi. Infatti, se #(A) = a e #(B) = b, con (a, b) = 1, allora B ′ = { x ∈ C | bx = 0 },
è un sottogruppo di C, isomorfo a B tramite β e tale che C = A ⊕ B ′ .
(∗∗)
Si può osservare che, essendo ap ≡ a (mod p) per ogni intero a (piccolo teorema di Fermat), se ne deduce in particolare
n+1 n n
che, per 1 ≤ a ≤ p − 1, si ha ap ≡ ap (mod pn ) e quindi esiste ωa = lim ap ∈ Zp . Osservando che la riduzione
n→∞
modulo p di ωa coincide con la riduzione di a, si conclude che, ωap = ωa 6= 0 e quindi che ωap−1 = 1. In questo modo si ha
una costruzione esplicita degli elementi del gruppo V .
II §.3 Il simbolo di Hilbert 57

Possiamo quindi concludere, osservando che, ogni elemento di z ∈ Q× p si può decomporre in modo
unico nel prodotto z = pn u, ove vp (x) = n ∈ Z ed u ∈ Z×
p , e dedurre da ciò la struttura del gruppo Q×
p,
ovvero
Z ⊕ Zp ⊕ Z/(p − 1)Z se p 6= 2

× ∼
(2.11) Qp = .
Z ⊕ Z2 ⊕ Z/2Z se p = 2

In particolare, indicato con Q2p il sottogruppo di Q×


p formato dai quadrati degli elementi non nulli, da
(II.2.11) si deduce
Z/2Z ⊕ Z/2Z se p 6= 2

× 2 ∼
Qp /Qp = . (2.12)
Z/2Z ⊕ Z/2Z ⊕ Z/2Z se p = 2

3. Il simbolo di Hilbert
In questa sezione ci occuperemo di studiare una generalizzazione della legge di reciprocità quadratica
che, in questa forma potrà essere generalizzata alle estensioni finite di Q. Sia K un corpo (che supporremo
nel seguito essere uguale ad uno dei completamenti Qv al variare di v nell’insieme V dei posti di Q) Si
definisce l’applicazione ( , ) : K × × K × → {±1}, ponendo

1 se Z 2 − aX 2 − bY 2 ha uno zero non banale in K × K × K



(a, b) =
−1 altrimenti

Cominciamo ad elencare alcune proprietà elementari di questa operazione, valide su qualsiasi corpo K.
(i) (a, b) = (b, a);
(ii) (a, −a) = 1 = (a, 1 − a);
(iii) (a, c2 ) = 1;
(iv) (a, b) = 1 ⇒ (aa′ , b) = (a′ , b);
(v) (a, b) = (a, −ab) = (a, (1 − a)b);
Le prime tre proprietà sono di verifica immediata: la (i) discende dalla definizione stessa mentre la
(ii) e la (iii) si verificano osservando che nei rispettivi casi le terne (0, 1, 1), (1, 1, 1) e (0, 1, c) sono zeri
non banali della forma quadratica in questione. Per quanto riguarda (iv) (e rispettivamente (v)), è chiaro
che l’affermazione si deduce da (iii) se b (risp. a) è un quadrato. In caso contrario, possiamo dedurre il
risultato dal seguente
3.1 Lemma. Se b non è un quadrato in K, allora (a, b) = 1 se, e solo se, a = NK(√b)/K (x) per qualche

x ∈ K( b).

dim. Se (α, β, γ) ∈ K 3 è uno zero non banale di Z 2 − aX 2 − bY 2 , e b non è un quadrato in K, deve aversi
γ 2 − aα2 − bβ 2 = 0, con α 6= 0. Si conclude che

γ2 β2 γ β√
a=
2
− b 2 = NK(√b)/K ( + b).
α α α α

D’altra parte se a = NK(√b)/K (t + u b) = t2 − bu2, allora (1, u, t) è uno zero di Z 2 − aX 2 − bY 2 . CVD

In base a questa osservazione, (iv) discende banalmente dalla moltiplicatività della norma (cf. Propo-
sizione I.2.11 (i)) e (v) si deduce da (ii) e (iv).

In base alle proprietà appena dimostrate, resta ben definita un’applicazione simmetrica di F2 -spazi
vettoriali
[simbolo di Hilbert] ( , ) : K × /K 2 × K × /K 2 → {±1}.
58 Il Teorema di Hasse e Minkowski II §.3

Nel caso in cui K sia uno dei completamenti di Q, mostreremo che il simbolo di Hilbert è un’applicazione
bilineare (simmetrica) non-degenere di spazi vettoriali su F2 . Ciò discenderà da una descrizione esplicita
del simbolo di Hilbert
 e, perciò richiamiamo alcuni simboli. Nella sezione I.7 è stato definito il simbolo
a
di Legendre p per ogni intero a ed ogni primo p; poichè il simbolo dipende solo dalla riduzione modulo
 
p di a, è chiaro cosa si intende per αp per α ∈ Zp . Inoltre, se u ∈ 1 + Z2 , allora si pone

0 se u ≡ 1 (mod 4) u2 − 1 0 se u ≡ ±1 (mod 8)
 
u−1
ε(u) ≡ (mod 2) = , ω(u) ≡ (mod 2) = .
2 1 se u ≡ 3 (mod 4) 8 1 se u ≡ ±3 (mod 8)

Osserviamo, in particolare che in Z2 l’applicazione U1 /U3 → F2 × F2 definita da u 7→ (ε(u), ω(u)) è un


isomorfismo di gruppi, ovvero che un’unità u ∈ Z×
2 è un quadrato se, e solo se, ε(u) = 0 = ω(u).
Possiamo quindi enunciare il seguente
3.2 Teorema. Notazioni come sopra.
(i) Se K = R, allora si ha
−1 se a < 0, b < 0

(a, b)∞ = .
1 altrimenti
(ii) Se K = Qp , allora, posto a = pα u, b = pβ v, con α, β ∈ Z ed u, v ∈ Z×
p , si ha

 (−1)αβε(p) u β v α
    
p p se p 6= 2
(a, b)p = .
ε(u)ε(v)+αω(v)+βω(u)
(−1) se p = 2

dim. (i). È chiaro che la forma quadratica Z 2 − aX 2 − bY 2 è priva di zeri non banali in R se, e solo se,
è definita positiva, e ciò permette di concludere.
(ii). Otterremo il risultato con calcoli diretti e perciò, dobbiamo distinguere vari casi. Cominciamo quindi
supponendo
p 6= 2. In tal caso Q× 2
p /Qp è uno spazio vettoriale di dimensione 2 su F2 , generato da (le classi di) p e u,
×
ove u ∈ Zp \ U1 . Dobbiamo quindi verificare la formula dell’enunciato sulle coppie di elementi
non nulli.
• Se u, v ∈ Z× 2
p , allora (u, v)p = 1, perchè la forma quadratica Z − uX − vY
2 2
ha uno zero
non banale se, e solo se, la sua ridotta modulo p ha uno zero non banale (cf. Corollario II.2.5)
e questo si verifica facilmente, ad esempio prendendo Z = 1 ed osservando che vi sono p+1 2
elementi distinti del tipo 1 − ux2 e p+1 2
2 elementi distinti del tipo vy , al variare di x, y ∈ Fp
e perciò due fra questi elementi devono coincidere dando luogo ad uno zero non-banale della
forma quadratica ridotta.  
v
• Se u, v ∈ Z×p , allora (pu, v)p = p . Infatti, essendo (u, v)p = 1, in base alla proprietà (iv) del
simbolo di Hilbert, si ricava che (pu, v)p = (p, v)p e si verifica facilmente che (p, v)p = 1 se, e
solo se, v è un quadrato modulo p.   
ε(p) u v
• Se u, v ∈ Z× p , allora (pu, pv)p = (−1) p p . Infatti, per la proprietà (v) del simbolo
di Hilbert, si ha (pu, pv)p = (pu, −p2 uv)
 p =  (pu, −uv)p e quindi, per quanto visto nel punto
−uv
precedente si conclude che (pu, pv)p = p da cui si deduce la tesi (cf. (I.7.6)).
p = 2. In tal caso Q× 2
2 /Q2 è uno spazio vettoriale di dimensione 3 su F2 , ed anche in questo caso
discuteremo varie possibilità separatamente.
• Se u, v ∈ Z×
2 , allora dobbiamo mostrare che

(u, v)2 = (−1)ε(u)ε(v) ,


II §.3 Il simbolo di Hilbert 59

ovvero che (u, v)2 = 1 se uno almeno tra u e v appartiene ad U2 , mentre (u, v)2 = −1 in caso
contrario. Supponiamo quindi che si abbia u ∈ U2 \ U3 , perchè se u ∈ U3 è un quadrato e si ha
(u, v)2 = 1. Dunque u + 4v ≡ 1 (mod 8) e quindi, esiste w ∈ Z2 tale che u + 4v = w2 , ovvero
(1, 2, w) è uno zero della forma quadratica Z 2 − uX 2 − vY 2 e perciò (u, v)2 = 1. Supponiamo
quindi che si abbia u ≡ v ≡ −1 (mod 4), allora, se esistesse una soluzione primitiva (x, y, z) della
forma Z 2 − uX 2 − vY 2 , allora si avrebbe, in particolare, z 2 + x2 + y 2 ≡ 0 (mod 4) che implica
x ≡ y ≡ z ≡ 0 (mod 2) contro l’ipotesi che si tratti di una soluzione primitiva, dunque deve
aversi (u, v)2 = −1.
• Dobbiamo ora mostrare che, se u, v ∈ Z× 2 , allora

(2u, v)2 = (−1)ε(u)ε(v)+ω(v) .

Mostriamo per prima cosa che (2, v)2 = (−1)ω(v) , ovvero che (2, v)2 = 1 se, e solo se, v ≡
±1 (mod 8). Infatti, se v ≡ 1 (mod 8), allora v è un quadrato e quindi (2, v)2 = 1; mentre, se
v ≡ −1 (mod 8), allora la forma quadratica Z 2 − 2x2 − vY 2 , ridotta modulo 8, ha la soluzione
(1, 1, 1) e quindi (2, v)2 = 1 (cf. Corollario II.2.6). D’altra parte, se esistesse una terna primitiva
(x, y, z), per cui z 2 − 2x2 − vy 2 = 0, e quindi con y ≡ z ≡ 1 (mod 2), riducendo modulo 8,
dovrebbe aversi 1 − 2x2 − v ≡ 0 (mod 8); ed osservando che gli unici quadrati in Z/8Z sono 0,
1 e 4 si conclude che v ≡ ±1 (mod 8).
Per concludere questa parte, dobbiamo mostrare che (2u, v)2 = (2, v)2 (u, v)2 . Ciò è vero se
(2, v) = 1, oppure se (u, v) = 1 per la proprietà (iv) del simbolo di Hilbert. Resta quindi
da dimostrare che (2, v)2 = −1 = (u, v)2 ⇒ (2u, v)2 = 1. Le condizioni in ipotesi sono
equivalenti alle congruenze u ≡ v ≡ −1 (mod ()4) e v ≡ 3 mod 8; quindi è sufficiente osservare
che le equazioni Z 2 2X 2 − 3Y 2 = 0 e Z 2 − 6X 2 + 5Y 2 = 0 ammettono la soluzione (1, 1, 1) per
concludere che (2u, v)2 = 1 (cf. Corollario II.2.6).
• L’ultimo punto consiste nel verificare che, se u, v ∈ Z× 2 , allora

(2u, 2v)2 = (−1)ε(u)ε(v)+ω(u)+ω(v) .

Per la proprietà (v) del simbolo di Hilbert, si ha (2u, 2v) = (2u, −4uv) = (2u, −uv) e quindi, dal
caso discusso nel punto precedente si deduce

(2u, 2v)2 = (2u, −uv)2 = (−1)ε(u)ε(−uv)+ω(−uv) = (−1)ε(u)(ε(−1)+ε(u)+ε(v))+ω(−1)+ω(u)+ω(v) .

Si può quindi concludere ricordando che ε(−1) = 1, ω(−1) = 0 e ε(u)(1 + ε(u)) = 0, come si
ricava direttamente dalle definizioni. CVD 

Una conseguenza di questa descrizione esplicita del simbolo di Hilbert è contenuta nel seguente
3.3 Teorema. Per ogni posto v di Q il simbolo di Hilbert è un’applicazione bilineare simmetrica non-
degenere di Qv /Q2v a valori in F2 .
L’unica cosa che non sia stata dimostrata in modo esplicito è la verifica che il simbolo di Hilbert sia
non-degenere e ciò si può dedurre facilmente dalla matrice del simbolo di Hilbert nei vari casi. Scrivi-
amo quindi la matrice di questa applicazione bilineare di F2 -spazi vettoriali, usando –come in tutta la
discussione precedente– la notazione moltiplicativa (±1) per gli elementi di F2 .
• se K = R la matrice è (−1).
 
u
• se K = Qp con p 6= 2, consideriamo la base {p, u} di Qp /Q2p , con u ∈ Z×p ed p = −1. Allora la
matrice del simbolo di Hilbert è
   
1 −1 −1 −1
se p ≡ 1 (mod 4), e se p ≡ −1 (mod 4).
−1 1 −1 1
60 Il Teorema di Hasse e Minkowski II §.3

• se K = Q2 , rispetto alla base {2, −1, 5}, la matrice del simbolo di Hilbert è
 
1 1 −1
 1 −1 1  .
−1 1 1

Il corpo Q può essere immerso come sottocorpo denso in ciascuno dei suoi completamenti Qv ed
anche in ogni loro prodotto finito (cf. Proposizione II.1.10). Il Teorema che segue, mostra quale relazione
vi sia tra i vari simboli di Hilbert di una coppia di numeri razionali.
3.4 Teorema. [Hilbert] Siano a, b ∈ Q× ; allora si ha (a, b)v = 1 per tutti i posti v di Q, eccetto al più
un numero finito, e inoltre Y
(a, b)v = 1.
v∈V

dim. Il quoziente Q× /Q2 è uno spazio vettoriale di dimensione infinita su F2 , che ha come base l’insieme
{±1} ∪ { p ∈ N | p primo }. Si tratta quindi di verificare gli asserti dell’enunciato nei casi in cui a e b sono
uguali a −1 oppure ad un primo razionale. Distinguiamo i vari casi ed effettuiamo i calcoli servendoci del
Teorema II.3.2.
• Se a = −1 = b, allora (−1, −1)∞ = −1 = (−1, −1)2, e (−1, −1)p = 1, per p 6= 2 e quindi la tesi è
verificata.
• Se a = −1 e b = ℓ (ℓ primo). Se ℓ = 2, si ha (−1, 2)v = 1, per ogni v ∈ V . Se ℓ 6= 2, allora
(−1, ℓ)v = 1 per v 6= 2, ℓ e (−1, ℓ)2 = (−1, ℓ)ℓ = (−1)ε(ℓ) . Anche in questo caso la tesi è verificata.
• Se a = ℓ e b = ℓ′ (ℓ, ℓ′ primi). Se fosse ℓ = ℓ′ , in base alla proprietà (v) del simbolo di Hilbert, si
ha (ℓ, ℓ)v = (−1, ℓ)v e questo caso l’abbiamo già trattato nel punto precedente. Sia quindi ℓ 6= ℓ′ ed
osserviamo che, nel caso in cui ℓ′ = 2, si ha (ℓ, 2)v = 1 per v 6= 2, ℓ e (ℓ, 2)2 = (−1)ω(ℓ) = (ℓ, 2)ℓ . Infine
ǫ(ℓ)ǫ(ℓ′)
se ℓ ed ℓ′ 
sono  distinti tra loro
′ ′ ′
 eda 2, si ha (ℓ, ℓ )v = 1 se v 6= 2, ℓ, ℓ ed inoltre, (ℓ, ℓ )2 = (−1) ,

(ℓ, ℓ′ )ℓ = ℓℓ ed (ℓ, ℓ′ )ℓ′ = ℓℓ′ . Grazie alla legge di reciprocità quadratica, si conclude che
 ′ 
ǫ(ℓ)ǫ(ℓ′ ) ℓ ℓ
(−1) =1
ℓ ℓ′

(cf. Teorema I.7.8) il che conclude la dimostrazione. CVD 


Concludiamo questa sezione con un risultato di esistenza di numeri razionali con valori prefissati del
simbolo di Hilbert. Faremo uso di questo risultato nella dimostrazione del Teorema di Hasse e Minkowski
(cf. Teorema II.5.1).
3.5 Teorema. Siano {a1 , . . . , am } dei numeri razionali non nulli e siano dati, per ogni i = 1, . . . , m e
per ogni posto v di Q, i numeri εi,v ∈ {±1}, soggetti alle seguenti condizioni
(i) ad eccezione di un numero finito Y di coppie di indici (i, v), si ha εi,v = 1;
(ii) per ogni i = 1, . . . , m, si ha εi,v = 1;
v
(iii) per ogni posto v, esiste xv ∈ Q× ×
v tale che (xv , ai )v = εi,v per i = 1, . . . , m. Allora esiste x ∈ Q tale
che (x, ai )v = εi,v per ogni coppia di indici (i, v).

dim. È pressochè immediato verificare che le condizioni date sono necessarie per l’esistenza di un tale
x ∈ Q× . Per verificare che sono anche sufficienti avremo bisogno di appellarci al
Teorema. [Dirichlet] Dati due interi positivi e coprimi a e b; allora esistono infiniti numeri primi p che
soddisfano alla congruenza p ≡ a (mod b).
Di questo teorema non daremo la dimostrazione e rimandiamo il lettore interessato al Capitolo VII
di A. W. Knapp, Elliptic Curves, Princeton Univ. Press 1992.
II §.4 Forme quadratiche 61

Cominciamo quindi la dimostrazione del Teorema osservando che, a meno di moltiplicare gli ai per
un quadrato, possiamo supporre che si tratti di numeri interi e consideriamo quindi il sottoinsieme S
di posti di Q, formato da ∞, 2 e dai primi che compaiono nella fattorizzazione degli ai . Oltre ad S,
consideriamo anche l’insieme T dei posti v per cui qualcuno degli εi,v è uguale a −1. Entrambi sono
sottoinsiemi finiti dell’insieme dei posti di Q e supponiamo dapprima che si abbia S ∩ T = Ø rimandando
il caso generale ad una successiva discussione. Allora, sotto l’ipotesi S ∩ T = Ø, si ponga
Y Y
a= ℓ e b=8 ℓ.
ℓ∈T ℓ∈S
ℓ6=∞ ℓ6=2,∞

Gli interi a e b sono coprimi e, per il teorema di Dirichlet citato sopra, esiste un numero primo p ∈ / S∪T
tale che p ≡ a (mod b). Mostriamo che, in tal caso, il numero x = ap soddisfa alle condizioni del Teorema.
Se v = ∞, allora v ∈ S e quindi εi,∞ = 1 perchè S ∩ T = Ø, d’altra parte (ai , x)∞ = 1 perchè x > 0.
Se consideriamo ora un numero primo ℓ ∈ S, essendo x = pa ≡ a2 (mod m), si deduce che x è congruo
ad un quadrato, sia modulo ℓ che modulo 8, e quindi, poichè sia a che x sono unità in Qℓ , si conclude
che x è un quadrato in Qℓ (cf. Corollario II.2.5 e Corollario II.2.6) e quindi si ha (ai , x)ℓ = 1 = εi,ℓ , ove
l’ultima uguaglianza discende sempre dal fatto che ℓ ∈ S ed S ∩ T = Ø.
Se si considera un numero primo ℓ ∈ / S, allora, ciascuno degli ai è un’unità in Qℓ e si ha (ai , b)ℓ =
 vℓ (b)
ai ×
ℓ , per ogni b ∈ Qℓ (cf. Teorema II.3.2). Se ℓ ∈
/ T ∪{p}, allora vℓ (x) = 0 e quindi (ai , x)ℓ = 1 = εi,ℓ .
Se ℓ ∈ T , allora vℓ (x) = 1 e inoltre, esiste un elemento xℓ ∈ Q×
ℓ , tale che (ai , xℓ ) = εi,ℓ per ogni i, ed uno
almeno degli εi,ℓ = −1, per cui si conclude che vℓ (xℓ ) è un numero dispari e quindi
 
ai
(ai , x)ℓ = = (ai , xℓ ) = εi,ℓ , per ogni i = 1, . . . , m.

Da ultimo il caso ℓ = p è necessariamente verificato perchè, per ogni i, sia i simboli di Hilbert (ai , x)v che
i vari εi,v soddisfano alla formula del prodotto (cf. Teorema II.3.4 e l’ipotesi (ii)).
Ciò dimostra completamente il teorema nell’ipotesi che S ∩ T = Ø e passiamo quindi a discutere
il caso generale. Si osservi che, qualunque sia il posto v di Q, se |x − 1|v < 18 , allora x è un quadrato
in Qv (cf. Corollario II.2.5 e Corollario II.2.6); dunque, per il principio di approssimazione debole
(cf. Proposizione II.1.10), esiste un’elemento x′ ∈ Q× tale che x′ /xv sia un quadrato in Qv per ogni
v ∈ S. Quindi, in particolare, si ha (ai , x′ )v = (ai , xv )v = εi,v per ogni v ∈ S e quindi, posto

ε′i,v = ε′i,v (ai , x′ )v per ogni posto v,

si ottiene una famiglia che soddisfa alle ipotesi del Teorema con l’ulteriore condizione che ε′i,v = 1 se
v ∈ S e quindi, per le considerazioni fatte in precedenza esiste un elemento y ∈ Q× tale che (ai , y)v = ε′i,v
per ogni indice i e per ogni posto v. Per la bilinearità del simbolo di Hilbert, si conclude che x = yx′ è
l’elemento che soddisfa alle condizioni del Teorema. CVD 
62 Il Teorema di Hasse e Minkowski II §.4

4. Forme quadratiche
In questa sezione ci occuperemo di forme quadratiche su corpi di caratteristica diversa da 2.
4.1 Definizione. Siano K un corpo e V uno spazio vettoriale di dimensione finita su K. Una applica-
zione q : V → K è una forma quadratica se, e solo se, l’applicazione (x, y) 7→ q(x + y) − q(x) − q(y) è
un’applicazione bilineare.
Si chiama modulo quadratico la coppia (V, q), ove V è uno spazio vettoriale di dimensione finita su
K e q : V → K è una forma quadratica.
Dati due moduli quadratici (V, q) e (V ′ , q ′ ), un’applicazione lineare φ : V → V ′ è un’isometria se
q = q ′ ◦ φ.
Due moduli quadratici (V, q) e (V ′ , q ′ ) si dicono isometrici se hanno la stessa dimensione ed esiste
un’isometria φ : V → V ′ .
La definizione precedente resta valida anche su corpi di caratteristica 2. D’ora in poi però supporremo
che K abbia caratteristica diversa da 2 e, dato un modulo quadratico (V, q), indicheremo con

1
x · y := [q(x + y) − q(x) − q(y)]
2
l’applicazione bilineare (simmetrica) su V , associata a q, ed applicheremo a (V, q), la terminologia in uso
per gli spazi dotati di un ‘prodotto scalare’: parleremo quindi del nucleo dell’applicazione bilineare (Nq =
{ v ∈ V | v · x = 0 ∀x ∈ V }) e di forma non-degenere (Nq = {0}), di sottospazi mutuamente ortogonali
(U ⊆ W ⊥ se u · w = 0 per ogni u ∈ U ed ogni w ∈ W ) e di somma diretta ortogonale (U ⊕W ˆ , ovvero
la somma diretta di U e W con i due sottospazi mutuamente ortogonali) ed infine, chiameremo isotropi
i sottospazi U contenuti nel proprio ortogonale (U ⊆ U ⊥ )e piano  iperbolico un modulo quadratico di
0 1
dimensione 2, ove la matrice dell’applicazione bilineare sia .
1 0
Raccogliamo brevemente nella proposizione successiva alcune proprietà elementari delle applicazioni
bilineari.
4.2 Proposizione. Sia K un corpo di caratteristica diversa da 2.
(i) Sia (V, q) un modulo quadratico su K ed N = Nq il nucleo dell’applicazione bilineare associata; allora
(V /N, q) è un modulo quadratico non-degenere.
(ii) Sia (V, q) un modulo quadratico su K ed U un sottospazio vettoriale di V . Allora la restrizione ad
U di q è non degenere se, e solo se, U ∩ U ⊥ = {0}. In tal caso V = U ⊕U ˆ ⊥.
(iii) Sia (V, q) un modulo quadratico non-degenere su K, allora esiste una base ortogonale di V .
(iv) Siano (V, q) un modulo quadratico non-degenere, (V ′ , q ′ ) un modulo quadratico su ed s : V → V ′
un’isometria. Allora s è iniettiva.
(v) Sia (V, q) un modulo quadratico non-degenere su K; allora, dati due vettori v, w ∈ V tali che
v · v = w · w 6= 0, allora esiste un’isometria σ : V → V , tale che σ(v) = w.
(vi) Sia (V, q) un modulo quadratico non-degenere su K allora ogni vettore isotropo è contenuto in un
piano iperbolico.
(vii) Sia (V, q) un modulo quadratico non-degenere su K, se vi sono in V vettori isotropi non-nulli, allora
q rappresenta ogni elemento di K (ovvero q : V → K è suriettiva).

dim. (i) Dalla definizione discende che x ∈ N se, e solo se, q(y + x) = q(y), per ogni y ∈ V e quindi è ben
definita la funzione q su V /N ed è ovviamente una forma quadratica non-degenere.
(ii) È una conseguenza diretta delle definizioni.
(iii) Dobbiamo dimostrare che esiste una base V = {v1 , . . . , vn } di V tale che vi · vj 6= 0 se, e solo se, i = j.
Ciò è banalmente vero se dim V = 1, si può quindi fare induzione sulla dimensione di V , osservando che, se
q è non-degenere, esiste almeno un vettore non isotropo (char K 6= 2), sia v1 , ed allora V = hv1 i ⊕ ˆ hv1 i⊥ .

Essendo dim hv1 i = dim V − 1, esiste una base ortogonale {v2 , . . . , vn } di tale sottospazio e quindi
V = {v1 , . . . , vn } è la base cercata.
II §.4 Forme quadratiche 63

(iv) Se s(v) = 0, allora, per ogni x ∈ V , si ha

1 1
x·v = [q(x + v) − q(x) − q(v)] = [q ′ (s(x + v)) − q ′ (s(x)) − q ′ (s(v))] = 0
2 2

perchè s è un’applicazione lineare e q ′ (0) = 0. Dunque v ∈ Nq = {0}, perchè q è non-degenere.


(v) Si considerino i vettori x = v + w ed y = v − w e si osservi che si ha x · x = 2(v · v + v · w) ed
y · y = 2(v · v − v · w) quindi, essendo v · v 6= 0, uno almeno tra x ed y non è un vettore isotropo. Sia y,
z·y
allora l’applicazione σy : V → V definita ponendo σy (z) := z − 2 y, è l’isometria richiesta(∗) , come si
y·y
verifica con calcoli diretti. Se invece y è isotropo, allora l’analoga applicazione σx : V → V è un’isometria
per cui σx (v) = −w. È quindi sufficiente considerare −σx per concludere.
(vi) Sia u 6= 0 un vettore isotropo. Poichè V è non-degenere, esiste un vettore w, tale che u · w 6= 0 e, a
meno di dividere w per una costante possiamo supporre u · w = 1. Allora il sottospazio hu, wi è un piano
a
iperbolico. Infatti, se fosse w · w = a 6= 0, basta considerare i vettori u e v 
= w −2 u per avere una base
0 1
di hu, wi rispetto a cui la restrizione dell’applicazione bilineare ha matrice .
1 0
(vii) È sufficiente mostrare che se (U, q) è un piano iperbolico, allora q rappresenta ogni
 elemento
 di K.
0 1
Infatti se {u, v} è una base di U rispetto a cui l’applicazione bilineare ha matrice , allora si
1 0
ha q(u + av) = (u + av) · (u + av) = 2a per ogni a ∈ K e poichè 2 è invertibile in K ciò permette di
concludere. CVD 

Possiamo quindi dimostrare il risultato fondamentale per la classificazione delle forme quadratiche
su di un corpo di caratteristica diversa da 2, ovvero il Teorema di cancellazione (o Teorema di estensione
delle isometrie) di Ernst Witt.
4.3 Teorema. [Witt] Siano (V, q) e (V ′ , q ′ ) due moduli quadratici, non-degeneri ed isometrici, definiti
su un corpo K di caratteristica diversa da 2. Se U ⊂ V è un sottospazio vettoriale ed s : U → V ′ è
un’isometria iniettiva (q ′ (s(u)) = q(u) per ogni u ∈ U ), allora s si estende ad una isometria di tutto V su
V ′.

dim. Osserviamo che l’ipotesi che l’isometria s : U → V ′ sia iniettiva non è ridondante perchè può ben
accadere che la restrizione di q ad U sia degenere. Infatti, dimostriamo dapprima che in tal caso, s si
estende ad un sottospazio U1 , contenente U , tale che la restrizione di q ad U1 sia non-degenere.
Supponiamo quindi che vi sia un vettore u 6= 0 nel nucleo N della restrizione di q ad U . Se W è un
sottospazio di U tale che U = hui ⊕ W allora esiste un vettore y ∈ W ⊥ \ U ⊥ , e, a meno di sostituirlo
con un vettore del tipo βy + αu (con β 6= 0), possiamo supporre che si abbia y · u = 1 e y · y = 0.
Analogamente, considerando in V ′ il vettore s(u) ed il sottospazio U ′ = ims = hs(u)i ⊕ s(W ), si può
determinare un vettore y ′ ∈ s(W )⊥ , per cui si abbia y ′ · s(u) = 1 e y ′ · y ′ = 0. Allora, presi il sottospazio
T = U ⊕ hyi e l’applicazione s′ : T → V ′ definita ponendo s′ (x + αy) := s(x) + αy ′ per ogni x ∈ U , si ha
che s′ estende s e che il nucleo della restrizione di q a T è contenuto in N ed ha dimensione strettamente
più piccola, perchè non contiene u.
Procedendo in tal modo, si può determinare un sottospazio U1 ⊃ U ed un’isometria iniettiva s1 :
U1 → V ′ , con l’ulteriore proprietà che la restrizione di q ad U1 sia non degenere. Per concludere la
dimostrazione del Teorema di Witt, dobbiamo estendere s1 a tutto V . Fissiamo una base ortogonale
{x1 , . . . , xr } di U1 (cf. Proposizione II.4.2 (iii)) ed osserviamo che si hanno le decomposizioni

ˆ ···⊕
V = hx1 i ⊕ ˆ 1⊥
ˆ hxr i ⊕U e V ′ = hs1 (x1 )i ⊕
ˆ ···⊕ ˆ 1 (U1 )⊥ .
ˆ hs1 (xr )i ⊕s

(∗)
Si osservi che l’applicazione σy altri non è che la ‘riflessione’ rispetto al sottospazio hyi⊥ ovvero, scritto z = u + αy,
con u ∈ hyi⊥ ed α ∈ K, si ha σy (z) = u − αy.
64 Il Teorema di Hasse e Minkowski II §.4

Fissata inoltre un’isometria f : V → V ′ , i vettori f (x1 ) ed s1 (x1 ) di V ′ soddisfano alle ipotesi della
Proposizione II.4.2 (v) e quindi esiste un’isometria σ1 : V ′ → V ′ , tale che σ1 (f (x1 )) = s1 (x1 ). Dunque
σ1 ◦ f è un’isometria di V su V ′ e coincide con s1 sul sottospazio hx1 i; in particolare, l’immagine di
⊥ ˆ ···⊕ ˆ 1⊥ è contenuta in hs1 (x1 )i⊥ = hs1 (x2 )i ⊕
ˆ hxr i ⊕U ˆ ···⊕
ˆ hs1 (xr )i ⊕s
ˆ 1 (U1 )⊥ . Quindi
hx1 i = hx2 i ⊕
questi due sottospazi sono isometrici e si può quindi costruire un’isometria σ2 : V → V ′ che mandi

σ1 (f (x2 )) su s1 (x2 ) ed induca l’identità su s1 (x1 ). Proseguendo in tal modo, si costruisce un’isometria
σr ◦ · · · ◦ σ1 ◦ f : V → V ′ che estende s1 e quindi s. CVD 

4.4 Remark. Prima di trarre le conseguenze del Teorema di Witt, vogliamo mostrare con un esempio come
tale risultato non si possa estendere a forme quadratiche su campi di caratteristica 2. Sia dunque K un corpo
di caratteristica 2 e siano V e W due spazi vettoriali di dimensione 3 su K. Siano {v1 , v2 , v3 } una base di
V e {w1 , w2 , w3 } una base di W e si considerino le applicazioni bilineari che, rispetto alle basi date, hanno
rispettivamente matrice
1 0 0 1 0 0
! !
A= 0 1 0 e B= 0 0 1 .
0 0 1 0 1 0
I due moduli quadratici cosı̀ ottenuti sono isometrici, perchè l’applicazione

v1 7→ w1 + w2 + w3 , v2 7→ w1 + w2 , v3 7→ w1 + w3

si verifica essere un’isometria. D’altra parte l’applicazione v1 7→ w1 è un’isometria iniettiva di hv1 i su W , ma


non si può estendere a tutto V , perchè una tale estensione, dovrebbe mandare il sottospazio hv1 i⊥ = hv2 , v3 i, sul
sottospazio hw1 i⊥ = hw2 , w3 i, ma questi sopttospazi non sono isometrici, come si vede facilmente osservando che
il secondo non contiene alcun vettore non isotropo.

Andiamo quindi ad enunciare alcune conseguenze del Teorema di Witt, cominciando da quella che
gli vale il nome di Teorema di cancellazione e la cui dimostrazione è immediata applicazione del Teorema.
4.5 Corollario. Sia (V, q) un modulo quadratico non-degenere sul corpo K di caratteristica diversa da
2. Se U1 ed U2 sono sottospazi di V , allora U1 è isometrico ad U2 se, e solo se, U1⊥ è isometrico ad U2⊥ .
Il teorema si applica inoltre alla classificazione (a meno di isometria) dei moduli quadratici nel modo
seguente.
4.6 Proposizione. Sia (V, q) un modulo quadratico non-degenere sul corpo K di caratteristica diversa
da 2. Allora V si decompone nella somma ortogonale
ˆ . . . ⊕U
V = U1 ⊕ ˆ r ⊕W,
ˆ

ove U1 , . . . , Ur sono piani iperbolici, mentre W è privo di vettori isotropi diversi da zero. Il numero
r ≥ 0 dei piani iperbolici e la classe di isometria di W non dipendono dalla decomposizione, ma sono
univocamente determinati da (V, q).

dim. Se V non contiene vettori isotropi (diversi da zero), allora V = W ed il risultato è banalmente vero.
Altrimenti, se V contiene un vettore isotropo diverso da zero, per la Proposizione II.4.2 (vi), V contiene
un piano iperbolico U1 e si può quindi decomporre V = U1 ⊕U ˆ 1⊥ (cf. la Proposizione citata (ii)). Ora, se
U1 non contiene vettori isotropi non banali si pone U1 = W , altrimenti, U1⊥ contiene un piano iperbolico
⊥ ⊥

U2 e si prosegue analogamente fino ad ottenere la decomposizione dell’enunciato.


ˆ . . . ⊕U
Infine, se V = U1 ⊕ ˆ r ⊕W
ˆ = U1′ ⊕
ˆ . . . ⊕U ˆ ′ sono due decomposizioni di V del tipo descritto
ˆ s′ ⊕W
ˆ . . . ⊕U
con r ≥ s, allora l’isometria naturale di U1 ⊕ ˆ . . . ⊕U
ˆ s su U1′ ⊕ ˆ s′ induce un’isometria tra i rispettivi

ortogonali e quindi deve aversi sia r = s, perchè W non contiene vettori isotropi diversi da zero, che
indurre un isometria di W su W ′ . CVD 
Da ciò si conclude che la classificazione delle forme quadratiche su un corpo K di caratteristica
diversa da 2 si riduce alla classificazione dei moduli quadratici (V, q) privi di vettori isotropi non-nulli
II §.4 Forme quadratiche 65

(talvolta detti moduli quadratici ellittici) e lo strumento utilizzato in questo ambito è il gruppo di Witt.
Diamo qualche cenno alla costruzione del gruppo di Witt W(K), associato al corpo K (di caratteristica
diversa da 2).
ˆ ′ , −q ′ ) è una
Due moduli quadratici (V, q) e (V ′ , q ′ ) si dicono equivalenti secondo Witt se (V, q)⊕(V
somma ortogonale di piani iperbolici. Si può mostrare che le classi di equivalenza secondo Witt dei
moduli quadratici formano un gruppo rispetto all’operazione di somma ortogonale e questi è il gruppo di
Witt. Si può dedurre facilmente dal Teorema di estensione delle isometrie che due moduli quadratici su
K sono isometrici se, e solo se, hanno la stessa dimensione e sono equivalenti secondo Witt. Ciò mostra
la relazione tra il gruppo di Witt e la classificazione dei moduli quadratici. Inoltre, si può dimostrare
che per qualsiasi corpo K, il gruppo W(K) è generato dalle classi [a] al variare di a ∈ K, soggette alle
relazioni [a] = [ax2 ] ∀x ∈ K, [a] + [−a] = 0, [a] + [b] = [a + b] + [ab(a + b)] se a + b 6= 0 (cf. ad
esempio J. Milnor, D. Husemoller, Symmetric Bilinear Forms, Springer 1973, Ch. III, per un’esauriente
trattazione dell’argomento). Lo studio del gruppo di Witt sui corpi finiti Fq , di caratteristica diversa da
2, risulta semplice se si osserva che ogni modulo quadratico di dimensione ≥ 3 su Fq contiene un vettore
isotropo non nullo (ciò perchè la forma quadratica aX12 + bX22 , con ab 6= 0, rappresenta ogni elemento di
Fq ). Quindi utilizzando le relazioni scritte sopra, si deduce che

Z/2Z × Z/2Z se − 1 è un quadrato in Fq



se 26 | q, W(Fq ) = .
Z/4Z altrimenti

Non diamo altri dettagli sullo studio del gruppo di Witt e torniamo alla discussione iniziale sulle forme
quadratiche.

Dato un polinomio omogeneo di grado 2 (forma quadratica) a coefficienti in K, sia g(X1 , . . . , Xn ),


possiamo associare a questi il modulo quadratico (K n , g), e quindi, date due forme quadratiche g1 e g2 ,
scriveremo g1 ∼ g2 per indicare che i corrispondenti moduli quadratici sono isometrici. Date due forme
quadratiche g(X1 , . . . , Xn ) ed h(X1 , . . . , Xm ) indicheremo con g +̇h (risp. g −̇h) la somma ortogonale (risp.
differenza ortogonale) delle due forme, ovvero il modulo quadratico (K n+m , f ), ove f (X1 , . . . , Xn+m ) =
g(X1 , . . . , Xn ) + h(Xn+1 , . . . , Xn+m ) (risp. f (X1 , . . . , Xn+m ) = g(X1 , . . . , Xn ) − h(Xn+1 , . . . , Xn+m ))
ovvero (K n+m , f ) = (K n , g)⊕(K ˆ m , h) (risp. (K n+m , f ) = (K n , g)⊕(K
ˆ m , −h)).
In queste notazioni, i risultati già mostrati per i moduli quadratici possono essere enunciati nel modo
seguente.
• Se f è non-degenere e rappresenta zero (cioè f (ξ) = 0 per qualche ξ 6= (0, . . . , 0)), allora f ∼ f1 +̇g
con g(X1 , X2 ) = X1 X2 (ovvero g è la forma quadratica associata ad un piano iperbolico). Inoltre f
rappresenta ogni elemento di K.
• L’esistenza di una base ortogonale per i moduli quadratici è equivalente al fatto che ogni forma
quadratica è equivalente ad una ‘somma di quadrati’; ovvero, per ogni forma quadratica f in n
indeterminate, esistono delle costanti a1 , . . . , an in K tali che f ∼ a1 X12 + · · · + an Xn2 .
• Il Teorema di cancellazione di Witt è quindi equivalente a

g1 +̇h1 ∼ g2 +̇h2 , g1 ∼ g2 =⇒ h1 ∼ h2 . (4.7)

• Se f è una forma quadratica non-degenere, allora f = g1 +̇ · · · +̇gr +̇h con g1 , . . . , gr piani iperbolici
ed h forma quadratica che non rappresenta zero (cioè h(ξ) = 0 ⇒ ξ = (0, . . . , 0)). Inoltre, l’intero
r ≥ 0 e la classe di isometria di h sono univocamente determinati da f .
Sempre nel linguaggio delle forme quadratiche, possiamo enunciare i seguenti
4.8 Corollario. Siano g(X1 , . . . , Xn−1 ) una forma quadratica non-degenere ed a ∈ K × . Sono equiv-
alenti:
(i) g rappresenta a;
(ii) g ∼ h+̇aZ 2 per un’opportuna forma quadratica h(X1 , . . . , Xn−2 );
66 Il Teorema di Hasse e Minkowski II §.4

(iii) La forma f = g −̇aZ 2 rappresenta 0.

dim. È immediato verificare che (ii) ⇒ (i) ⇒ (iii). Se vale (iii), allora esiste ξ = (x1 , . . . , xn ) 6=
(0, . . . , 0) tale che f (ξ) = 0. Se xn = 0, allora g rappresenta 0 e quindi ogni elemento di K, altri-
menti g(x1 /xn , . . . , xn−1 /xn ) = a e quindi (iii) ⇒ (i). Infine, se vale (i), esiste v ∈ K n−1 tale che
v · v = g(v) = a 6= 0, allora K n−1 = hvi ⊕ ˆ hvi⊥ (cf. Proposizione II.4.2 (ii)) e quindi, indicata con h la

forma quadratica indotta su hvi si ottiene quanto affermato in (ii). CVD 
4.9 Corollario. Siano g ed h due forme quadratiche non-degeneri e sia f = g −̇h. Sono equivalenti:
(i) f rappresenta 0;
(ii) esiste a ∈ K × rappresentato sia da g che da h;
(iii) esiste a ∈ K × tale che g −̇aZ 2 ed h−̇aZ 2 rappresentino entrambe lo 0.

dim. È immediato verificare che (ii) ⇔ (iii) e che (ii) ⇒ (i). Infine, se vale (i), sia 0 = g(ξ) − h(η) e si
ponga a = g(ξ) = h(η). Se a 6= 0 è verificata la (ii); se fosse a = 0, allora una almeno tra le due forme
quadratiche, sia g, avrebbe un vettore isotropo non-nullo e quindi potrebbe rappresentare qualsiasi valore
non-nullo di h. CVD 
Sia p 6= 2 un primo razionale ed interessiamoci della classificazione, a meno di isometria, delle forme
quadratiche su Qp e cominciamo la discussione introducendo due importanti invarianti da associare ad
una forma quadratica.
Sia (V, q) un modulo quadratico non-degenere su K = Qp . Fissata una base ortogonale V =
{v1 , . . . , vn } di V (p 6= 2), consideriamo le due grandezze
Y
(4.10) d(q, V) = q(v1 ) · · · q(vn ), e ε(q, V) = (q(vi ), q(vj ))p ,
1≤i<j≤n

ove ( , )p indica il Simbolo di Hilbert. Vogliamo mostrare che sia la classe di d(q, V) in K × /K 2 che ε(q, V)
sono indipendenti dalla scelta della base ortogonale e sono perciò invarianti della forma quadratica q. Tali
invarianti saranno detti, rispettivamente, il discriminante d(q) ed il simbolo ε(q) della forma quadratica
q. Mostreremo poi che due moduli quadratici (V, q) e (V ′ , q ′ ) sono isometrici se, e solo se, hanno la stessa
dimensione, lo stesso discriminante e lo stesso simbolo.
Nelle notazioni precedenti, osserviamo che d(q, V) = q(v1 ) · · · q(vn ) è il determinante della matrice
della forma bilineare associata a q, scritta rispetto alla base ortogonale V. Poichè due matrici simmetriche
A eB rappresentano la stessa applicazione bilineare se, e solo se, esiste una matrice invertibile P tale
che tP AP = B; è chiaro che la classe di d(q, V) è determinata modulo quadrati. Scriveremo quindi
d(q) ∈ K × /K 2 per indicare il discriminante di q, ovvero la classe di d(q, V) in K × /K 2 . Notiamo a
margine che la definizione di discriminante può essere estesa a qualsiasi corpo K (di caratteristica diversa
da 2).
La dimostrazione dell’invarianza del simbolo seguirà da un’osservazione e da alcuni calcoli espliciti
sul simbolo di Hilbert. Per cominciare, diciamo che due basi di un modulo quadratico (V, q) sono contigue
se hanno almeno un vettore in comune. Dimostriamo quindi la seguente Proposizione, che resta valida
su ogni corpo K di caratteristica diversa da 2.
4.11 Proposizione. Sia (V, q) un modulo quadratico non degenere su K, di dimensione n ≥ 3, e siano
V = {v1 , . . . , vn } e V ′ = {v1′ , . . . , vn′ } due basi ortogonali di V . Allora esiste una successione finita di basi
ortogonali, V0 , . . . , Vr , a due a due contigue, tale che V = V0 , V1 , . . . , Vr = V ′ .

dim. Cominciamo supponendo che (v1 ·v1 )(v1′ ·v1′ )−(v1 ·v1′ )2 6= 0, ovvero che la restrizione di q a hv1 , v1′ i sia

non-degenere. In particolare ciò significa che hv1 , v1′ i ha dimensione 2 e che V = hv1 , v1′ i⊕hv1 , v1′ i . Allora
si può considerare una base ortogonale v3′′ , . . . , vn′′ di hv1 , v1′ i⊥ e completarla con le due basi ortogonali
v1 , w1 e v1′ , w1′ di hv1 , v1′ i. Poichè n ≥ 3, le basi ortogonali
{v1 , w1 , v3′′ , . . . , vn′′ } e {v1′ , w1′ , v3′′ , . . . , vn′′ }
II §.4 Forme quadratiche 67

sono contigue tra loro ed ovviamente, contigue rispettivamente alle basi V e V ′ .


Se invece (v1 · v1 )(vi′ · vi′ ) − (v1 · vi′ )2 6= 0 per i = 1, 2, allora, poichè la restrizione di q a hv1′ , v2′ i è non
degenere, esiste una costante λ ∈ K tale che v0 = λv1′ + v2′ è un vettore non isotropo, linearmente indipen-
dente da v1 e tale che la restrizione di q a hv1 , v0 i sia non degenere. Allora si considera la decomposizione
⊥ ⊥
V = hv1 , v0 i ⊕ hv1 , v0 i e si completa una base ortogonale w3′′ , . . . , wn′′ di hv1 , v0 i , con due basi ortogonali
′ ′ ′
v1 , w1 e v0 , w0 di hv1 , v0 i. Infine, si osservi che hv0 , v1 i = hv1 , v2 i e perciò la restrizione di q a tale spazio
è non-degenere e quindi, ragionando come sopra, si può congiungere la base {v0 , w0 , w3′′ , . . . , wn′′ } con V ′
tramite basi contigue. CVD 

Passiamo quindi a dimostrare l’indipendenza del simbolo ε(q, V) dalla scelta della base ortogonale e
facciamo induzione sula dimensione dello spazio V . Infatti, se n = dim V = 1 il simbolo vale 1 in quanto è
un prodotto su di un insieme vuoto di indici. Se n = 2, allora q(X1 , X2 ) = a1 X12 + a2 X22 ed ε(q) = (a1 , a2 )
ed in base al Corollario II.4.8 (a1 , a2 ) = 1 se, e solo se, q rappresenta 1 e quindi la condizione non dipende
dalla base scelta, ma dalla sola forma q.
Supponiamo ora n ≥ 3 e supponiamo che V e V ′ siano due basi ortogonali contigue (cf. enuncita-
contigue), ovvero siano V = {v1 , . . . , vn } e V ′ = {v1 , v2′ , . . . , vn′ } e poniamo ai = q(vi ) ed a′i = q(vi′ ), per
i = 1, . . . , n. Per l’ipotesi induttiva, possiamo supporre
Y Y
(ai , aj ) = (a′i , a′j )
2≤i<j≤n 2≤i<j≤n


perchè si tratta del simbolo della restrizione di q al sottospazio hv1 i . Indichiamo con ν tale valore ed
osserviamo che si ha ε(q, V) = (a1 , a2 · · · an )ν. Inoltre, per la bilinearità e la proprietà (v) del simbolo di
Hilbert, si ottiene (a1 , a2 · · · an ) = (a1 , −a1 a2 · · · an ) = (a1 , −d), ove d rappresenta il discriminante della
forma q, che è indipendente (a meno di quadrati) dalla scelta della base. Ciò permette di concludere.

Andiamo ora a dimostrare che il discriminante ed il simbolo permettono di classificare le forme


quadratiche. Cominciamo dimostrando un Lemma sul simbolo di Hilbert che ci sarà utile nel seguito.
4.12 Lemma. Siano K = Qp , a ∈ K × /K 2 ed ε ∈ {±1} e si ponga

Haε = x ∈ K × /K 2 | (x, a) = ε .


Allora si ha
(i) a = 1 ⇒ Ha1 = K × /K 2 , Ha−1 = Ø;
(ii) se a 6= 1 allora Haε contiene esattamente due elementi;
(iii) siano a 6= 1 6= a′ ed ε, ε′ ∈ {±1}, allora

a = a′


Haε ∩ Haε′ =Ø ⇔ .
ε 6= ε′

dim. Per la proprietà (iii) del simbolo di Hilbert, si ha (x, 1) = 1 per ogni x, mentre se a 6= 1, l’applicazione
x 7→ (x, a) è una forma lineare non nulla sul F2 -spazio vettoriale K × /K 2 che ha dimensione 2 (cf. Teo-
rema II.3.3 ed anche (II.2.12)). Ciò permette di concludere per quanto riguarda (i) e (ii).

(iii) Cominciamo osservando che, se ε = ε′ , allora non può aversi Haε ∩ Haε′ = Ø. Dunque, se ε 6= ε′ , si

ha Haε ∩ Haε′ = Ø se, e solo se, (x, a) = (x, a′ ) per ogni x ∈ K × /K 2 e quindi a = a′ (cf. Teorema II.3.3).
CVD 

Il passo successivo è dimostrare che è sufficiente classificare i moduli quadratici di dimensione ‘piccola’.
In particolare, ricordiamo che il rango di una forma quadratica q(X1 , . . . , Xn ) è la dimensione di uno spazio
vettoriale su cu q induce una forma quadratica non-degenere.
68 Il Teorema di Hasse e Minkowski II §.4

4.13 Proposizione. Sia q una forma quadratica di rango n e siano d il discriminante di q ed ε il suo
simbolo. Allora
(i) q rappresenta zero se, e solo se,
• n = 2 e d = −1;
• n = 3 ed ε = (−1, −d);
• n = 4 e d 6= 1 oppure d = 1 ed ε = (−1, −1);
• n ≥ 5.
(ii) dato a ∈ K × /K 2 , q rappresenta a se, e solo se,
• n = 1 e d = a;
• n = 2 ed ε = (a, −d);
• n = 3 e a 6= −d oppure a = −d ed ε = (−1, −d);
• n ≥ 4.

dim. Osserviamo che, punto per punto, (i) ⇒ (ii), come si deduce facilmente considerando la forma
quadratica aZ 2 − q, e quindi ci limiteremo a dimostrare il punto (i) e ci serviremo delle conseguenze
enunciate in (ii).
Cominciamo dal caso n = 2; allora a1 X12 + a2 X22 rappresenta zero se, e solo se, −a1 /a2 ∈ K 2 e
quindi, se e solo se, −d = 1 in K × /K 2 .
Sia ora n = 3; allora a1 X12 + a2 X22 + a3 X32 rappresenta zero se, e solo se, a13 q rappresenta zero;
ovvero, per la definizione del simbolo di Hilbert, se, e solo se, (− aa13 , − aa23 ) = 1. Si ha (cf. Teorema II.3.3)

a1 a2
(− , − ) = (−a1 a3 , −a2 a3 ) = (−1, −1)(−1, a2)(−1, a3 )(a1 , −1)(a1 , a2 )(a1 , a3 )(a3 , −1)(a3 , a2 )(a3 , a3 )
a3 a3

ed osservando che (a3 , −1)(a3 , a3 ) = (a3 , −a3 ) = 1, si ottiene che il prodotto a secondo membro è uguale
a (−1, −d)ε e ciò permette di concludere.
Sia ora n = 4 ed osserviamo che, in base al Corollario II.4.9, a1 X12 +a2 X22 +a3 X32 +a4 X42 rappresenta
zero se, e solo se, esiste un elemento a ∈ K × che sia rappresentato da entrambe le forme quadratiche
a1 X12 + a2 X22 e −a3 X32 − a4 X42 . Inoltre, per quanto osservato all’inizio della dimostrazione, dalla verifica
del caso n = 3 del punto (i), possiamo dedurre il caso n = 2 di (ii) e quindi concludere che, per un tale a
deve aversi
(a, −a1 a2 ) = (a1 , a2 ) e (a, −a3 a4 ) = (−a3 , −a4 ).
(a ,a )
Dunque, nelle notazioni del Lemma precedente, q non rappresenta lo zero se, e solo se, H−a11 a22 ∩
(−a ,−a )
H−a3 a3 3 4 = Ø e ciò significa che deve aversi a1 a2 = a3 a4 (in K × /K 2 ) ed (a1 , a2 ) = −(−a3 , −a4 ).
Dalla prima relazione si deduce d = 1 e quindi, se d 6= 1, allora q rappresenta lo zero. Sia d = 1 e
calcoliamo il simbolo ε. Ricordando che d = 1 e la bilinearità del simbolo di Hilbert, si ha

ε = (a1 , a2 )(a3 , a4 )(a1 a2 , a3 a4 )


= (a1 , a2 )(a3 , a4 )(−a1 a2 a3 a4 , a3 a4 )
= (a1 , a2 )(a3 , a4 )(−1, a3 a4 )
= (a1 , a2 )(−a3 , −a4 )(−1, −1).

E la condizione (a1 , a2 ) = −(−a3 , −a4 ) è quindi equivalente ad ε 6= (−1, −1).


Sia infine n = 5. Si osservi che ogni forma di rango 2 rappresenta almeno due elementi di K × /K 2
perchè, se d = −1 allora la forma rappresenta zero e quindi ogni elemento di K × ; altrimenti, (cf. (ii)
ε
per n = 2), q rappresenta a se, e solo se, a ∈ H−d e, per il Lemma precedente, questo insieme contiene
esattamente due elementi. Allora, esiste un elemento a 6= d ∈ K × /K 2 rappresentato da q. Possiamo
quindi scrivere q ∼ g +̇aZ 2 ed il discriminante di g è diverso da 1, perchè d(q) = a d(g). Quindi g ha
rango 4 e rappresenta zero. Ciò conclude la dimostrazione. CVD 
Possiamo quindi concludere con il seguente
II §.5 Il Teorema di Hasse e Minkowski 69

4.14 Teorema. Siano q e g due forme quadratiche non-degeneri su K = Qp . Allora q e g sono isome-
triche se, e solo se, d(q) = d(g) ed ε(q) = ε(g).

dim. Dimostriamolo per induzione su n. Se n = 1 la tesi è ovviamente vera (ed è sufficiente considerare il
discriminante). Sia quindi n ≥ 2 e supponiamo che la tesi sia vera per forme quadratiche di rango n − 1.
Per la Proposizione II.4.13, possiamo suppore che q e g rappresentino entrambe uno stesso elemento
a ∈ K × . Si ha quindi q ∼ aZ 2 +̇q ′ e g ∼ aZ 2 +̇g ′ e da ciò si deduce ad(g ′ ) = d(g) = d(q) = ad(q ′ ) e quindi
d(g ′ ) = d(q ′ ) ed inoltre, (a, d(q ′ ))ε(q ′ ) = ε(q) = ε(g) = (a, d(g ′ ))ε(g ′ ), da cui si deduce che ε(q ′ ) = ε(g ′ ) e
ciò permette di concludere per l’ipotesi induttiva. CVD 

5. Il Teorema di Hasse e Minkowski

Il celebre Teorema di Hasse e Minkowski lega la rappresentabilità di un numero razionale tramite


una forma quadratica a coefficienti razionali alla possibilità di rappresentare tale numero localmente,
ovvero in ciascuno dei completamenti del corpo Q. Tale risultato è ricco di conseguenze che cercheremo
di illustrare lungo questa sezione.
Cominciamo con l’enunciato del Teorema.
5.1 Teorema. [Hasse-Minkowski] Sia f (X) ∈ Q[X1 , . . . , Xn ] una forma quadratica. Allora f rappre-
senta lo zero in Q se, e solo se, f rappresenta lo zero su Qv , per ogni posto v di Q.
La dimostrazione di questo risultato e di alcune sue conseguenze si estenderà lungo tutta la sezione.
Osserviamo ora alcuni fatti preliminari: per prima cosa è chiaro che è sufficiente dimostrare l’asserto
sulla rappresentabilità dello zero per ottenere un analogo criterio di rappresentabilità per ogni numero
razionale (cf. Corollario II.4.8); inoltre, è ovvio osservare che l’esistenza di uno zero ‘globale’ (in Q) per
la forma quadratica f implica l’esistenza degli zeri locali, visto che Q si immerge in ciascuno dei suoi
completamenti; infine, come vedremo nel corso della dimostrazione, osserviamo che il criterio di Hasse e
Minkowski è un criterio effettivo, perchè, come vedremo, sarà sufficiente conoscere la rappresentabilità
dello zero in un numero finito di posti (determinabile a partire da f ) per concludere sulla rappresentabilità
globale.

Cominciamo la dimostrazione, che si farà discutendo separatamente i vari casi, al crescere del numero
n delle variabili coinvolte.
n = 2 In tal caso, possiamo ridurci a considerare l’esistenza di soluzioni razionali ad un’equazione del
tipo X 2 = aY 2 , con a ∈ Q× e quindi, a meno di quadrati (che possono essere ‘inglobati nelle soluzioni’),
con a ∈ Z \ {0} e square-free (cf. I §.4); inoltre, poichè l’equazione è risolubile in R, deve aversi a > 0.
Sia quindi a = p1 · · · pr con p1 < p2 < · · · < pr , primi distinti e mostriamo che la risolubilità locale ci
permette di concludere che a = 1 (ovvero che a è un quadrato). Infatti, se comparisse il primo p1 ed
(x1 , y1 ) fosse una soluzione primitiva dell’equazione X 2 = aY 2 in Qp1 (cf. Proposizione II.2.2), dovrebbe
aversi vp1 (x1 ) > 0 e quindi vp1 (x21 ) ≥ 2, da cui si dedurrebbe vp1 (y1 ) ≥ 1, contro l’ipotesi che la soluzione
sia primitiva. Ciò conclude la dimostrazione per n = 2.

Prima di procedere nella dimostrazione per i successivi valori di n, vogliamo osservare che, in questo caso, si
potrebbe dimostrare un’asserto più forte sulla risolubilità locale, ovvero
Osservazione. Una forma quadratica f (X) ∈ Q[X1 , X2 ] rappresenta lo zero in Q se, e solo se, rappresenta lo
zero su Qv , per ogni posto v di Q ad eccezione di un numero finito.

dim. In base a quanto osservato, si tratta di mostrare che, dato un intero a, il polinomio X 2 − a è irriducibile
in Q[X] se, e solo se, la
 congruenza
 x2 ≡ a (mod p) non ha soluzione per infiniti primi, ovvero se, e solo se,
a
il simbolo di Legendre p
= −1 per infiniti primi p. Dividendo per gli eventuali quadrati, si può supporre
70 Il Teorema di Hasse e Minkowski II §.5

a = (−1)α 2ε p1 · · · pr con 2 < p1 <


 · · · < pr , primi distinti, ed α, ε ∈ {0, 1} e mostriamo che se compare un primo
nella fattorizzazione di a, allora ap = −1 per infiniti primi p. Infatti, per ogni primo p, si ha

   r 
α  ε Y 
a −1 2 pi
= .
p p p p
i=1

I primi
 dueQfattori
 sono
 uguali ad 1 se p ≡ 1 (mod 8) (cf. I.7.7), e sotto tali ipotesi, per reciprocità quadratica, si
a r p
ha p = i=1 pi . Allora, se r ≥ 1, fissato un elemento u che non sia un residuo quadratico modulo p1 , si ha


   p ≡ 1 (mod p2 · · · pr )
a
= −1 se p ≡ u (mod p1 )
p 
p ≡ 1 mod 8

ovvero se p ≡ u (mod 8p1 · · · pr ). Per il Teorema di Dirichlet, vi sono infiniti primi soddisfacenti a questa con-
dizione.    α  
Infine, se a = (−1)α 2, per ogni primo p, si ha ap = −1 p
2
p
e questi è certamente uguale a −1 se
p ≡ −3 (mod 8) ed anche in questo caso, per il Teorema di Dirichlet, vi sono infiniti primi soddisfacenti a questa
condizione. CVD 

Torniamo alla dimostrazione del Teorema di Hasse e Minkowski e consideriamo ora il caso successivo.
n = 3 Consideriamo quindi l’equazione X 2 − aY 2 − bZ 2 con a, b ∈ Z \ {0}, entrambi square-free e con
|a| ≤ |b|. Facciamo induzione sul numero |a| + |b| chè, per |a| + |b| = 2, l’equazione data ha soluzioni
razionali se, e solo se, ha soluzioni in R. Sia quindi |a| + |b| = N > 2 e supponiamo che la tesi sia vera
per valori minori di N . Osserviamo che la risolubilità dell’equazione per ogni posto v, implica l’esistenza
di soluzioni non nulle per la congruenza t2 ≡ a (mod b). Infatti, è sufficiente verificare la risolubilità di
questa congruenza per i primi che dividono b e, se p | a e p | b, allora vi è la soluzione t = 0, mentre
se p | b e p 6 | a, allora c’è una soluzione primitiva (x, y, z) all’equazione X 2 − aY 2 − bZ 2 e, poichè b è
square-free, deve aversi vp (y) = 0, ovvero y è invertibile modulo p e ciò dice come si possa scegliere t. Si
fissi quindi un numero intero t, con |t| ≤ |b| 2 ′
2 , tale che t = a + bb ed osserviamo che deve aversi

|t|2 |a| |b|


|b′ | ≤ + ≤ + 1 < |b|,
|b| |b| 4

perchè |b| ≥ 2. Inoltre, la condizione su t implica che bb′ = t2 − a = NQ(√a)/Q (t + a), e quindi b è la

norma di un elemento di Q( a) se, e solo se, b′ lo è. Ovvero l’equazione X 2 − aY 2 − bZ 2 ha soluzione se,
e solo se, ha soluzione l’equazione X 2 − aY 2 − b′ Z 2 e possiamo concludere in base all’ipotesi induttiva.
Infatti, per ogni posto v, si ha (a, bb′ )v = 1 (cf. Lemma II.3.1) e quindi, per la bilinearità del simbolo di
Hilbert, deve aversi (a, b′ )v = (a, b)v = 1, che è quanto ci serve per concludere.

Ancora una volta interrompiamo il corso della dimostrazione per alcune osservazioni relative al caso appena
trattato, che ha un’interessante applicazione geometrica.
Remark. Sia C una curva piana irriducibile di genere 0, definita sul corpo Q dei numeri razionali. Vogliamo
mostrare che il Teorema di Hasse-Minkowski –e precisamente il caso n = 3 appena trattato– può essere usato per
decidere dell’esistenza di punti di C su Q. Siano quindi f (X, Y ) ∈ Q[X, Y ] un polinomio assolutamente irriducibile
ed A = Q[X, Y ]/(f (X, Y )), di modo che K = F rac A sia il corpo delle funzioni razionali su C. Poichè la curva
C ha genere 0, K ⊗ Q ∼ = Q(t) e quindi esistono due funzioni r(t) ed s(t) in Q(t) tali che f (r(t), s(t)) = 0 in tale
anello.
Osserviamo che le funzioni r(t) ed s(t) possono essere scelte in Q(t) se, e solo se, C ha un punto non-singolare
definito su Q. e quindi che, in tal caso, ha infiniti punti razionali su Q. Infatti, se P è un punto razionale di C, per
il Teorema di Riemann-Roch (!precisare per corpi non algebricamente chiusi!), lo spazio vettoriale delle funzioni
II §.5 Il Teorema di Hasse e Minkowski 71

razionali φ (in K) tali che (φ) + P sia un divisore positivo, ha dimensione (su Q) uguale a 2 e quindi esiste in tale
spazio una funzione razionale τ (t) non costante che ha solo un polo semplice in P e quindi Q(τ ) = K = Q(C).
Possiamo quindi rispondere alla domanda sull’esistenza di punti razionali su C tramite il Teorema di Hasse e
Minkowski, mostrando che la curva razionale C è birazionalmente equivalente ad una curva piana di grado ≤ 2 e
perciò deducendo l’esistenza di punti razionali per C dall’esistenza di punti razionali per tale curva. Consideriamo
quindi la curva piana C ed il differenziale dx. Il divisore D di dx ha grado −2, come si può dedurre dal teorema di
Riemann-Roch e quindi, lo spazio vettoriale delle funzioni razionali φ su C, tali che (φ)−D sia un divisore positivo,
ha dimensione 3. Sia φ una di tali funzioni e si consideri il divisore positivo (e razionale su Q) φ − D = (P ) + (Q),
con P e Q non necessariamente distinti. Sia quindi 1, x, y una base dello spazio vettoriale delle funzioni razionali
tali che (φ) + (P ) + (Q) sia un divisore positivo. Se x, oppure y, ha solo un polo semplice in uno dei due punti,
sia P ; allora P è un punto razionale di C e quindi, ragionando come sopra, Q(C) = Q(x) ed abbiamo concluso.
Altrimenti, il divisore polare di x è (P ) + (Q) e considerando le funzioni 1, x, y, x2 , y 2 , xy, si conclude che tutte
queste stanno nello spazio delle funzioni con divisore maggiore o uguale a 2(P ) + 2(Q); tale spazio ha dimensione 5
e quindi le funzioni date sono linearmente dipendenti, ovvero c’è una relazione quadratica tra x ed y. Si ha quindi
Q(x, y) ⊆ Q(C) e se i due corpi fossero distinti, dall’osservazione che [Q(C) : Q(x)] = 2 (x ha due poli su C), si
dovrebbe concludere che y ∈ Q(x). Poichè y ha gli stessi poli di x, y dovrebbe essere una funzione polinomiale di
grado 1 nella x, contro l’ipotesi che 1, x, y siano linearmente indipendenti. Ciò conclude la discussione.
5.2 Remark. Proseguiamo nelle nostre osservazioni dando un’altra dimostrazione del Teorema di Hasse-Min-
kowski nel caso in cui n = 3, basata sul Teorema di Minkowski (cf. Teorema I.10.6). Ci interessiamo quindi degli
zeri di una forma quadratica f (X) = aX 2 + bY 2 − cZ 2 ove possiamo supporre a, b, c ∈ Z>0 , square-free ed a due
a due coprimi. In particolare, per quanto riguarda l’ultima condizione sui coefficienti, si osservi che è possibile
ottenere una tale forma quadratica con un ragionamento induttivo sul numero di fattori primi del prodotto abc dei
coefficienti. Infatti se per un fattore primo p si avesse a = pa′ e b = pb′ , allora, posto Z = pZ ′ , gli zeri della forma
2
quadratica data, sarebbero in ovvia corrispondenza con gli zeri della forma a′ X 2 + b′ Y 2 + pcZ ′ si otterrebbe cosı̀
una forma quadratica con un numero strettamente minore di fattori primi nel prodotto dei coefficienti.
Dati due numeri reali positivi λ, µ, si consideri la regione di R3 cosı̀ definita

(x, y, z) ∈ R3 | ax2 + by 2 ≤ λ, cy 2 ≤ µ .

Rλ,µ =

È chiaro che si tratta di un cilindro e quindi√di una regione chiusa, limitata, convessa e simmetrica rispetto
2πλ µ
all’origine di R3 , il cui volume è uguale a √ . Inoltre max |f (x)| ≤ max{λ, µ}.
abc x∈Rλ,µ

Vediamo ora di determinare un sottoreticolo di Z3 . Sia p 6= 2 un primo che divide abc, allora f (X) è congrua,
modulo p, ad una forma in due variabili, che ha uno zero non banale modulo p (cf. Proposizione II.2.2), e quindi
è prodotto di due forme lineari Lp ed Mp . Consideriamo quindi i reticoli

Λp = { (x, y, z) ∈ Z3 | Lp (x, y, z) ≡ 0 (mod p) } per 2 6= p | abc,

e si osservi che Λp ha indice p in Z3 , come si vede facilmente considerando la dimensione del nucleo di una forma
lineare su F3p . Se 2 6 | abc, f (X) ≡ (aX + bY − cZ)2 (mod 2), e quindi posto L2 (X, Y, Z) = aX + bY − cZ, si
consideri il sottoreticolo
Λ2 = { (x, y, z) ∈ Z3 | L2 (x, y, z) ≡ 0 (mod 2) } ,
che ha indice p in Z3 . Se invece 2 | abc, si consideri il sottoinsieme

Λ2 = { (x, y, z) ∈ Z3 | f (x, y, z) ≡ 0 (mod 4) } ,

e verifichiamo che si tratta di un sottoreticolo di indice 4 in Z3 . Per fissare le idee, supponiamo che 2 | a ed
osserviamo che, se (x1 , y1 , z1 ) ed (x2 , y2 , z2 ) appartengono a Λ2 , allora

a(x1 + x2 )2 + b(y1 + y2 )2 − c(z1 + z2 )2 ≡ 2(by1 y2 − cz1 z2 ) (mod 4).

Inoltre, poichè (x1 , y1 , z1 ) ∈ Λ2 e 2 | a, si ha che by12 − cz12 ≡ 0 (mod 2) e quindi by1 − cz1 ≡ 0 (mod 2). Se ne
deduce che (y1 , z1 ) ed (y2 , z2 ) determinano elementi di F22 che sono nel nucleo della stessa forma quadratica e
sono quindi proporzionali. Ciò permette di concludere che by1 y2 − cz1 z2 ≡ 0 (mod 2), che è quanto ci serviva per
concludere che Λ2 è un sottoreticolo di Z3 . Per quanto riguarda l’indice del reticolo Λ2 , si osservi che 2Z3 ⊂ Λ2
72 Il Teorema di Hasse e Minkowski II §.5

e che la condizione by − cz ≡ 0 (mod 2) dice che (y, z) varia in un sottospazio 1-dimensionale di F22 e inoltre, per
ogni tale scelta di y e z, x è completamente determinato modulo 2 e quindi dimF2 (Λ2 /2Z3 ) = 1 e quindi, Λ2 ha
indice 4 in Z3 .
In ogni caso, si pone \ M 3
Λ= Λp e si ha Z3 /Λ ∼
= Z /Λp
p|2abc p|2abc

3
e quindi Λ è un sottoreticolo di indice 2abc di Z . Ciò significa che il dominio fondamentale di Λ ha volume 2abc
e quindi, per il teorema di Minkowski (cf. Teorema I.10.6), vi è intersezione tra Λ ed il cilindro Rλ,µ se

2πλ µ
√ ≥ 16abc.
abc

4abc 4abc
In particolare, se λ = µ, vi è un’intersezione se λ ≥ 2/3 e quindi supponiamo che sia λ = µ = 2/3 , da cui si
π π
deduce che esiste un elemento 0 6= v ∈ Λ ∩ Rλ,λ , e quindi si ha

4
f (v) ≡ 0 (mod 2abc) e |f (v)| ≤ abc < 2abc,
π 2/3

che può aversi se, e solo se, f (v) = 0 e qundi v è la soluzione intera cercata.
Osserviamo che entrambo i metodi utilizzati per la dimostrazione nel caso n = 3, permettono di dare una
stima del valore assoluto (reale) delle soluzioni in termini del valore assoluto dei coefficienti. La dimostrazione
basata sul teorema di Minkowski ha permesso di affermare che, se la forma quadratica f (X) = aX 2 + bY 2 − cZ 2
con a, b, c ∈ Z>0 , square-free, a due a due coprimi ha una soluzione in Q, allora esiste una soluzione intera
4
x = (x, y, z) con |f (x)| ≤ 2/3 abc, da cui si deducono le disuguaglianze
π

2 √ 2 2 √ 2 2 √ 2
|x| < bc ≤ M, |y| < ac ≤ M, |z| < ab ≤ M;
π 1/3 π 1/3 π 1/3 π 1/3 π 1/3 π 1/3

ove M = max{|a|, |b|, |c|}.


Per determinare un’altra stima del valore assoluto dele soluzioni, ricordiamo che nel metodo delineato nella
dimostrazione del Teorema di Hasse-Minkowski nel caso n = 3, la forma quadratica era stata posta nella forma
X 2 − aY 2 − bZ 2 con a, b ∈ Z \ {0}, entrambi square-free e con |a| ≤ |b| = m ove si supponeva m > 1 per escludere
il caso banale. Si consideri ora l’intero t, tale che t2 = a + bb′ e |t| ≤ m 2
. Da ciò si deduce che |b′ | ≤ m
4
+1<m
ed è equivalente considerare l’equazione x1 − ay1 − b z1 in luogo di quella di partenza, ove , b′′ è definito dalla
2 2 ′′ 2

condizione di essere square-free e legato a b′ dalla relazione b′ = q 2 b′′ , per qualche intero q. In particolare, si ha
max{|a|, |b′′ |} ≤ m, ove vale la disuguaglianza stretta se |a| < |b| = m. [.......]

Vogliamo quindi procedere nella dimostrazione del Teorema di Hasse-Minkowski trattando un ulte-
riore caso.
n = 4 Si consideri quindi la forma quadratica aX 2 + bY 2 − cZ 2 − dW 2 e si ponga f (X, Y ) = aX 2 + bY 2
e g(Z, W ) = cZ 2 + dW 2 . Allora, in base al Corollario II.4.9, per ogni posto v esiste un elemento tv ∈ Q×v
che è rappresentato sia da f che da g. Applicando la Proposizione II.4.13, ciò significa che per ogni posto
v, deve aversi
(tv , −ab)v = (a, b)v e (tv , −cd)v = (c, d)v .
Siamo nelle ipotesi del Teorema II.3.5 e quindi esiste un elemento x ∈ Q× che può essere posto in luogo
di tutti gli elementi tv e quindi le forme quadratiche f − xZ 2 e g − xT 2 rappresentano lo 0 in ciascuno
dei Qv e quindi, essendo forme quadratiche in 3 variabili, rappresentano lo 0 in Q. A questo punto, è
sufficiente ricordare il Corollario II.4.8 per concludere.
n ≥ 5 Dimostriamo l’asserto per induzione, supponendo che sia vero per forme quadratiche di rango
minore di n. Sia f (X) = a1 X12 + · · · + an Xn2 , con a1 , . . . , an ∈ Z \ {0} e consideriamo le due forme
quadratiche h(X1 , X2 ) = a1 X12 + a2 X22 e g(X3 , . . . , Xn ) = −a3 X32 + · · · − an Xn2 . Dunque si ha f = h−̇g e,
II §.5 Il Teorema di Hasse e Minkowski 73

per ogni posto v di Q, esiste un elemento xv ∈ Q×


v rappresentato sia da h che da g (cf. Corollario II.4.9).
Si consideri l’insieme di posti

S = {∞, 2} ∩ { ℓ | ℓ primo ed ℓ | ai ∃i }

e, per v ∈ S, indichiamo con u1,v ed u2,v due elementi di Q× v tali che h(u1,v , u2,v ) = xv . Allora, per il
principio di approssimazione debole (cf. Proposizione II.1.10), esistono u1 , u2 ∈ Q× tali che ui /ui,v sia un
quadrato, per i = 1, 2 e per ogni v ∈ S. Allora, posto x = h(u1 , u2 ) ∈ Q si ha che h−̇xZ 2 rappresenta lo
0 su Q. Inoltre xT 2 − g rappresenta lo 0 su ogni Qv perchè, per v ∈ S la tesi è vera per xv ed x/xv è un
quadrato in Qv , mentre, per v ∈ / S la forma quadratica g ha rango maggiore o uguale a 3 ed i coefficienti
suoi coefficienti sono unità in Zv . Quindi, per ipotesi induttiva, xT 2 − g rappresenta lo zero in Q e perciò
sia h che g rappresentano x in Q, che è quanto ci basta per concludere (cf. Corollario II.4.9). CVD


5.3 Remark. [Rappresentazione di interi come somma di quadrati] Cominciamo cercando di deter-
minare i numeri interi positivi n, per cui si abbia n = x21 + x22 , con x1 , x2 ∈ Q. Ciò equivale a chiedere che
la forma quadratica nx23 − x21 − x22 rappresenti lo zero in ogni Qp , e ciò accade se, e solo se, il discriminante
d ed il simbolo ε della forma quadratica sono legati dalla relazione ε = (−1, −d)p , per ogni primo p
(cf. Proposizione II.4.13). Dunque n è somma di due quadrati in Q se, e solo se, 1 = (−1, n)p per ogni
primo p. Questa condizione è ovviamente soddisfatta se p6 | n e p 6= 2, mentre se 26 | n, deve aversi inoltre,
ε(n) = 0, ovvero n ≡ 1 (mod 4) (cf. Teorema II.3.2). Se poi n = pα u, con α > 0, si ha
(  −1 α
p se p 6= 2
(−1, n)p = (cf. Teorema II.3.2 e (I.7.6)).
(−1)ε(n) se p = 2

Possiamo quindi concludere che n si scrive come somma di due quadrati in Q se i primi dispari che
compaiono nella fattorizzazione di n con esponente dispari sono tutti congrui 1 modulo 4.
Consideriamo ora il problema di determinare i numeri interi positivi n, per cui si abbia n = x21 + x22 +
x23 , con x1 , x2 , x3 ∈ Q. Si tratta quindi di trovare i valori di n per cui la forma quadratica nX4 −x21 −x22 −x23
rappresenta zero su ogni Qp . La condizione della Proposizione II.4.13 è verificata per ogni valore di n se
p 6= 2. Mentre, per p = 2, la forma rappresenta lo zero se, e solo se, il suo discriminante −n non è un
quadrato in Q2 ; ovvero se n non è della forma n = 4α (8k − 1).
Osserviamo a margine come si possa ridurre ad una conseguenza di quanto discusso sopra, il problema
di determinare se ogni numero intero n sia somma di tre numeri triangolari, ovvero se l’equazione

x(x + 1) y(y + 1) z(z + 1)


n= + +
2 2 2

abbia soluzioni intere non-banali. Infatti, moltiplicando per 8 e sommando 3 ai due membri dell’equazione,
si ottiene un’equazione della forma

8n + 3 = (2x + 1)2 + (2y + 1)2 + (2z + 1)2 ,

che ci riconduce alla questione di verificare se il numero 8n + 3 sia rappresentabile in Z come somma di
tre quadrati(∗) . Come abbiamo visto sopra il problema è risolubile in Q e vedremo (cf. Lemma II.5.4)
che ciò è sufficiente per l’esistenza di soluzioni intere.
La questione di determinare soluzioni intere a ciascuno dei problemi precedenti può essere decisa
grazie al seguente
(∗)
Si osservi che il quadrato di un numero intero è congruo a 0, 1 o 4, modulo 8 e quindi una soluzione intera del problema
8n + 3 = X 2 + Y 2 + Z 2 è necessariamente costituita da tre numeri dispari.
74 Il Teorema di Hasse e Minkowski II §.6

5.4 Lemma. [Davenport-Cassels] Sia f una forma quadratica di rango n, definita positiva, a coefficienti
in Z e supponiamo che per ogni x ∈ Qn esista y ∈ Zn tale che f (x − y) < 1. Allora m ∈ Z è rappresentato
da f su Z se, e solo se, m è rappresentato da f su Q.

dim. Sia x ∈ Zn e t ∈ Z≥1 , tale che f (x/t) = m e mostriamo che si può trovare un elemento v = x′ /t′ ,
tale che f (x′ /t′ ) = m e 0 < t′ < t. È chiaro che, in tal modo, dopo un numero finito di passi, si ottiene
la soluzione intera (cioè con denominatore t = 1). La costruzione di v procede nel modo seguente: se
t > 1, si considera un elemento y ∈ Zn tale che xt = y + z, con f (z) < 1 e si determina il secondo
punto di intersezione (dopo xt ) tra la retta per y e xt e la conica f (X) = m. Si verifica poi che questo
punto di intersezione soddisfa alle condizioni richieste. Si consideri quindi il valore di λ 6= 0 per cui si ha
( xt + λz) · ( xt + λz) = m, ovvero
z · xt
λ = −2 ,
z·z
x
ove si è indicato con un puntino il prodotto scalare associato ad f . E ricordando che z = t − y con
y ∈ Zn , si osservi che si ha

z · xt z · xt z · xt z · (z − 2 xt )
 
x x z·x
v= − 2z = 1−2 + 2y =x + 2y
t z·z t z·z z·z tz ·z tz · z

e inoltre
x x x
z · (z − 2 ) = ( − y) · (− − y) = y · y − m = a ∈ Z
t t t
x
z · x = · x − y · x = tm − y · x = b ∈ Z
t
t2 z · z = (ty − x) · (ty − x) = t2 y · y − 2ty · x + 2mt2 − mt2 = at2 + 2bt = t(at + 2b)

e da ciò si deduce che t′ = tz · z = at + 2b ∈ Z e dalla disuguaglianza z · z < 1 si conclude che v = ax+2by


t′
soddisfa alla condizione f (v) = m ed ha il denominatore 0 < t′ < t, che è quanto volevamo. CVD 
r
X
Tornando alle forme quadratiche in questione, ovvero Xi2 , si osservi che per ogni vettore x ∈ Qr
i=1
r
X
esiste un elemento y ∈ Zr tale che |xi − yi | ≤ 1
2 per i = 1, . . . , r. Allora, se r ≤ 3, si ha (xi − yi )2 ≤
i=1
r
< 1, e quindi sono soddisfatte le ipotesi del Lemma di Davenport e Cassels e perciò le considerazioni
4
fatte in precedenza sulla rappresentabilità in Q restano valide per decidere della rappresentabilità in Z
di un intero come somma di quadrati. Infine, per quanto riguarda il problema di esprimere un intero
positivo n come somma di quattro quadrati di numeri interi, si può ragionare cosı̀: si scriva n = 4α k,
ove 4 6 | k, e si osservi che, per le considerazioni precedenti se k 6≡ −1 (mod 8), allora n si scrive come
somma di tre quadrati di numeri interi. Se poi k ≡ −1 (mod 8), allora esistono tre interi x, y, z tali che
k − 1 = x2 + y 2 + z 2 e si conclude quindi che

n = 4α k = (2α x)2 + (2α y)2 + (2α z)2 + (2α )2 ,

che è quanto volevamo mostrare(†) .

(†)
Si osservi che, in base alla Proposizione II.4.13, ogni numero intero positivo n, si scrive come n = x21 + x22 + x23 + x24 ,
con x1 , x2 , x3 , x4 ∈ Q: ma in questo caso non è più applicabile il Lemma di Davenport e Cassels e perciò si è preferito un
approccio diretto al problema.
II §.6 Punti razionali e punti p-adici per le curve 75

6. Punti razionali e punti p-adici per le curve

Il Teorema di Hasse-Minkowski asserisce che, per le forme quadratiche, l’esistenza di zeri razionali è
equivalente all’esistenza di zeri sui corpi p-adici, per ogni p; e da ciò avevamo dedotto, in particolare, un
criterio per l’esistenza di punti razionali su di una curva di genere 0. Come abbiamo visto, l’esistenza di
punti p-adici per una curva è legata all’esistenza di punti non-singolari su Fp e, nel caso di curve di genere
zero, ci si può ricondurre al problema dell’esistenza di zeri non-banali per le coniche. Queste ultime sono
definite da equazioni omogenee di grado 2 in 3 variabili e quindi, si può ottenere una risposta dal teorema
di Chevalley-Warning (cf. Teorema I.7.13).
Il problema analogo per curve di genere superiore, presenta invece un carattere profondamente diverso
e mette subito davanti a notevoli difficoltà. Per citare qualche risultato in questa direzione, ricordiamo
che Gauss determinò un metodo per studiare le soluzioni in Fp dell’equazione x3 + y 3 = 1. Circa un secolo
dopo, Hasse provò che, indicato con Np il numero dei punti in Fp della chiusura proiettiva di una cubica
in forma di Weierstrass: y 2 = x3 + ax + b, è soddisfatta la condizione

|Np − p − 1| ≤ 2 p,

al variare di p. Questo risultato fu generalizzato da Weil, il quale mostrò che per una curva C, assoluta-
mente irriducibile, di genere g, definita su Fp , vale la condizione

|Np − p − 1| ≤ 2g p,

ove, ancora una volta, Np indica il numero dei punti del modello proiettivo non-singolare di C. Inoltre,
Weil congetturò che, per una varietà generica V , non-singolare, di dimensione r, dovesse aversi

|NV − NP | < cpr/2 per un’opportuna costante c,

ove NV indica il numero dei punti di V su Fp , mentre NP indica il numero di punti dello spazio proiettivo
di dimensione r sullo stesso campo. La congettura di Weil venne poi dimostrata da P. Deligne, all’inizio
degli anni ’70.
La dimostrazione di questi risultati va ben al di là dell’ambito di queste note. Qui ci limiteremo
a descrivere il metodo utilizzato da Gauss per contare le soluzioni di equazioni cubiche su corpi finiti.
Consideriamo quindi il polinomio

F (X, Y, Z) = aX 3 + bY 3 − Z 3 , con a, b ∈ F×
p,

e cerchiamo di determinare il numero Np degli elementi dell’insieme S = (x, y, z) ∈ F3p | F (x, y, z) = 0 .




Sia ζ una radice p-esima primitiva dell’unità e si osservi che, al variare di h in Fp , si ha

1 se h = 0

1 X ht
ζ = (6.1).
p 0 altrimenti
t∈F p

Dunque, dati arbitrariamente (x, y, z) ∈ F3p , si ha

1 se (x, y, z) ∈ S

1 X tF (x,y,z)
ζ = ;
p 0 altrimenti
t∈Fp

da cui si deduce che


X 1 X tF (x,y,z)
ζ = Np .
p
(x,y,z)∈F3p t∈Fp
76 Il Teorema di Hasse e Minkowski II §.6

Possiamo scambiare l’ordine di somma e mettere in evidenza gli addendi per cui t = 0; in tal modo si
ottiene
1 X X 1 X X
Np = ζ tF (x,y,z) = p2 + ζ tF (x,y,z) .
p 3
p 3
t∈Fp (x,y,z)∈Fp ×
t∈Fp (x,y,z)∈Fp

Fissato t 6= 0, si ha X X 3 X 3 X 3
ζ tF (x,y,z) = ζ −tz ζ tax ζ tby ;
(x,y,z)∈F3p z∈Fp x∈Fp y∈Fp

e quindi, posto X 3
σh = ζ hx ,
x∈Fp

si può scrivere
1 X
(6.2) N p = p2 + σta σtb σ−t .
p ×
t∈Fp

Ricordiamo ora che F× p è un gruppo ciclico di ordine p − 1 e quindi:


• se p ≡ 2 (mod 3), allora la corrispondenza x 7→ x3 è biunivoca in Fp e perciò σh = 0, non appena
h 6= 0 (II.6.1). Si conclude perciò che per primi di questo tipo, si ha Np = p2 .
• se invece, p ≡ 1 (mod 3), allora i cubi (degli elementi non-nulli) formano un sottogruppo di F× p di
indice 3 e non si può più applicare il ragionamento del punto precedente. In questo caso, cerchiamo
una maggiorazione del numero |Np − p2 |.
Supponiamo quindi p ≡ 1 (mod 3) e sia g un generatore del gruppo ciclico F× p . Fissata una radice
cubica primitiva dell’unità, ε ∈ C, possiamo considerare il carattere (moltiplicativo) χ : F× p → C definito
ponendo χ(g ) = ε , per ogni elemento g ∈ Fp . È chiaro che il nucleo di χ è formato dai cubi di F×
m m m ×
p.
Analogamente a quanto si è fatto per il Simbolo di Legendre (cf. I,§.7)), si può estendere il carattere χ
ad Fp , ponendo χ(0) = 0.
Vogliamo mostrare un semplice
6.3 Lemma. Notazioni come sopra. Allora, dato w ∈ Fp , il numero di soluzioni in Fp dell’equazione
X 3 = w coincide con 1 + χ(w) + χ2 (w).

dim. Osserviamo che la formula è vera per w = 0. Inoltre, poichè p ≡ 1 (mod 3), esiste in Fp una radice
cubica primitiva di 1 e perciò, se w è un cubo in F×
p , allora vi sono esattamente 3 soluzioni all’equazione
data e, in questo caso 3 = 1 + χ(w) + χ2 (w). Infine, se w non è un cubo in F× p , non vi sono soluzioni per
l’equazione data e, d’altra parte, si ha 1 + χ(w) + χ2 (w) = 0. CVD 
Dunque, dal lemma precedente, si deduce che, per h 6= 0, si ha
X 3 X X X X
(6.4) σh = ζ hx = ζ hw (1 + χ(w) + χ2 (w)) = ζ hw + χ(w)ζ hw + χ2 (w)ζ hw ,
x∈Fp w∈Fp w∈Fp w∈Fp w∈Fp

ove il primo addendo è nullo (cf. (II.6.1)) ed il secondo ed il terzo sono le somme di Gauss relative ai
caratteri χ e χ2 = χ, rispettivamente.
Ci siamo quindi ricondotti al problema di stimare il valore delle somme di Gauss, ed infatti, si ha
6.5 Lemma. Sia χ : F× p → C un carattere, esteso ad Fp ponendo χ(0) = 0. Siano ζ ∈ C una radice
p-esima primitiva di 1, ed h ∈ F×
p . Allora

X √
χ(w)ζ hw = p.
w∈Fp
II §.6 Punti razionali e punti p-adici per le curve 77

dim. Infatti, si ha
2   
X X X X
χ(w)ζ hw = χ(w1 )ζ hw1   χ(w2−1 )ζ −hw2  = χ(w1 /w2 )ζ h(w1 −w2 ) .
w∈Fp w1 ∈F×
p w2 ∈F×
p w1 ,w2 ∈F×
p

Posto quindi y = w1 /w2 , la somma si può scrivere nella forma


X X X
χ(y)ζ hw2 (y−1) = χ(y) ζ hw2 (y−1)
y,w2 ∈F×
p y∈F×
p w2 ∈F×
p

e si ha
−1 se y 6= 1
X 
ζ hw2 (y−1) = .
p−1 se y = 1
w2 ∈F×
p

Possiamo quindi riassumere le osservazioni precedenti e scrivere


2
X X X
χ(w)ζ hw =− χ(y) + (p − 1)χ(1) = p − χ(y).
w∈Fp y∈Fp \{0,1} y∈F×
p

Infine, ricordando che p ≡ 1 (mod 3), si conclude che la somma a destra è nulla ed è cosı̀ verificata la
tesi. CVD 

Dunque, in base al lemma precedente ed a (II.6.4)), si ottiene, |σh | ≤ 2 p per ogni h 6= 0 e quindi,
applicando questa disuguaglianza a (II.6.2)), si ottiene, per ogni primo p, la stima

|Np − p2 | ≤ 8(p − 1) p. (6.6)

Per p sufficientemente grande, 8(p − 1) p < p2 , e quindi questa stima permette di concludere che esistono
punti in Fp per la cubica data.
78
Sommario del contenuto

I. Interi algebrici
Esempi introduttivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Richiami di Teoria di Galois. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Interi di un’estensione algebrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8
Corpi quadratici e corpi ciclotomici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
L’equazione di Pell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Complementi. Unità di un corpo quadratico reale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Corpi finiti. Reciprocità quadratica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Ideali ed estensioni intere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Domini di Dedekind . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Applicazioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
Un’osservazione sui corpi quadratici immaginari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

II. Il Teorema di Hasse e Minkowski


Valori assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Equazioni polinomiali p-adiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Il simbolo di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57
Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Il Teorema di Hasse e Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Punti razionali e punti p-adici per le curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

79
80

Potrebbero piacerti anche