0% ont trouvé ce document utile (0 vote)
52 vues8 pages

Cours 1

Al

Transféré par

adam mina
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
52 vues8 pages

Cours 1

Al

Transféré par

adam mina
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Chapitre 1

Ensembles quotients

Dans ce court chapitre préliminaire, nous rappelons quelques notions générales


de théorie des ensembles. La notion de relation d’équivalence sur un ensemble X est
l’outil qui permet en pratique d’identifier les éléments de X partageant une certaine
propriété (les rendant “équivalents”). Nous rappelons comment la donnée d’une telle
relation sur X définit une partition naturelle de X en classes d’équivalence. L’en-
semble de ces classes, un sous-ensemble de l’ensemble de toutes les parties de X,
est appelé ensemble quotient de X par R, et il est noté X/R. Sa propriété princi-
pale (dite “universelle”) est qu’une application f : X → Y constante sur les classes
d’équivalence de R se factorise canoniquement en une application f : X/R → Y ,
appelé passage au quotient de f . La notion de système de représentants de R, qui
consiste à choisir un élément par classe, conduit naturellement à discuter l’axiome du
choix, un énoncé bien intuitif mais qui a joué un rôle historiquement important dans
les fondements des mathématiques (il ne jouera que peu de rôle dans ce cours). Le
chapitre culmine avec la discussion de plusieurs énoncés surprenants entrainés par
(en fait équivalents à) l’axiome du choix, comme le lemme de Zorn ou le théorème de
Zermelo. Dans la démonstration du Lemme de Zorn, donnée en complément, nous
nous approcherons sans la définir, de la notion d’ordinal, et nous renvoyons au cours
de logique pour des développements sur ce sujet. Les exercices contiennent notam-
ment un fascicule de résultats classiques de théorie des ensembles (dénombrabilité,
cardinalité) utiles à tout mathématicien.
Quelques références : L’appendice 2 de Algebra, 3ème ed. (S. Lang), le
premier chapitre de Algèbres et théories galoisiennes (R. & A. Douady).

1. Partitions et relations d’équivalence

Définition 1.1. Soit X un ensemble. Une partition de X est la donnée d’un


ensemble {Xi }i∈I de parties non vides Xi de X tel que X est la réunion disjointe
des Xi , i.e. X = ∪i∈I Xi et Xi ∩ Xj = ∅ pour i 6= j. On note alors simplement
a
X= Xi .
i∈I

Par exemple, l’ensemble X = {1, 2, 3} possède exactement 5 partitions, à savoir


{{1, 2, 3}}, {{1}, {2, 3}}, {{2}, {1, 3}}, {{3}, {1, 2}} et {{1}, {2}, {3}}.

Exemple 1.2. (Partition en fibres) Soit f : X → Y une application et y ∈ Y .


On appelle fibre de f en y l’ensemble 1
f −1 ({y}) = {x ∈ X | f (x) = y}
1. Le ({}) est lourd, et on la note donc parfois f −1 (y), même si cette notation désigne aussi
l’unique antécédant de y par f quand f est bijective.
3
4 1. ENSEMBLES QUOTIENTS

des antécédants de y par f . Lorsque f est surjective, ses fibres Xy := f −1 ({y}), avec
y parcourant X, sont non vides et forment une partition de X indexée
` par Y . Toutes
les partitions de X s’obtiennent en fait ainsi : si l’on a X = i∈I Xi avec Xi 6= ∅
pour tout i, alors l’application f : X → I, associant à x ∈ X l’unique i ∈ I vérifiant
x ∈ Xi , est surjective et vérifie f −1 ({i}) = Xi .

Une relation sur un ensemble X est la donnée d’une partie R de X × X. On note


suggestivement « x R y » pour « (x, y) ∈ R ».
Définition 1.3. Une relation R sur un ensemble X est une relation d’équiva-
lence si elle vérifie :
(i) x R x, pour tout x dans X (réflexivité),
(ii) x R y ⇒ y R x, pour tout x, y ∈ X (symétrie), et
(iii) x R y et y R z ⇒ x R z, pour tout x, y, z dans X (transitivité).

Des notations standards pour les relations d’équivalence sont ∼, ' ou ≡. Soient
R une relation d’équivalence sur X et x ∈ X. La classe de R-équivalence de x est
par définition [x]R = {y ∈ X | y R x}. On la note aussi x mod R. Lorsque R est
sous-entendue, on parle simplement de classe d’équivalence de x et on la note en
général [x] ou x au lieu de [x]R . On a x ∈ [x]R (réflexivité) ainsi que
(1) ∀ x, y ∈ X, y ∈ [x]R =⇒ [y]R = [x]R .
En effet, z R y implique z R x (transitivité), puis [y]R ⊂ [x]R . On conclut par sym-
métrie car y ∈ [x]R implique y ∈ [x]R .
Proposition 1.4. Si R est une relation d’équivalence sur X, ses classes d’équi-
valence forment une partition de X.

Démonstration — On a x ∈ [x]R par (i), donc X est réunion des classes d’équiva-
lence, et ces dernières sont non vides. On conclut car d’après (1), deux classes [x]R
et [y]R , avec x, y ∈ X, sont égales ou disjointes. 

`
Remarque 1.5. Réciproquement, toute partition X = i∈I Xi est la partition
en classes d’équivalence d’une unique relation d’équivalence sur X. En effet, on
constate que x R y ⇔ ∃i ∈ I, x ∈ Xi et y ∈ Xi est une relation d’équivalence sur X
(et même manifestement l’unique) dont les classes sont les Xi .

On vérifie aisément qu’une intersection de relations d’équivalence sur X est d’équi-


valence. En revanche, c’est faux en général pour une réunion (pourquoi ?). Si X est
un ensemble, on note P(X) l’ensemble des parties de X.

Définition 1.6. Si R est une relation d’équivalence sur X, le sous-ensemble de


P(X) constitué des classes de R-équivalence est appelé ensemble quotient de X par
R, et il est noté X/R. L’application πR : X → X/R, x 7→ [x]R , est appelée projection
canonique associée à R. C’est une surjection dont les fibres sont par définition les
classes d’équivalence de R.
1. PARTITIONS ET RELATIONS D’ÉQUIVALENCE 5

Exemple 1.7. (L’ensemble Z/N Z) Soit N ∈ Z. On définit une relation d’équiva-


lence sur Z en posant a R b ⇔ N |a − b (le vérifier). Depuis Gauss, on note en général
a ≡ b mod N pour a R b. L’ensemble Z/R est le familier Z/N Z de l’arithmétique
modulaire. La classe de a ∈ Z est le sous-ensemble a + N Z = {a + N m | m ∈ Z} de
Z, aussi noté a mod N ou simplement a.
Exemple 1.8. (Décomposition en “translations” et “cycles” d’une bijection) Soient
X un ensemble et f : X → X une bijection. On pose 2
x R y ⇔ ∃ i ∈ Z, y = f i (x).
C’est une relation d’équivalence sur X : on a x = f 0 (x), y = f i (x) ⇔ x = f −i (y) et
f i (f j (x)) = f i+j (x). On a en outre ici x R f (x), donc f préserve les classes. Quelle
est la classe de x ∈ X ? Il y a deux cas, soit tous les f i (x), i ∈ Z, sont distincts,
auquel cas Z → [x], i 7→ f i (x) est bijective, et identifie f à la translation i 7→ i + 1.
Soit il existe i < j, avec disons d := j − i minimal, tel que f j (x) = f i (x). Appliquant
f −i on a alors f d (x) = x, puis que a ≡ b mod d implique f a (x) = f b (x). On en déduit

|[x]| = d et [x] = {x, f (x), f 2 (x), . . . , f d−1 (x)},


par minimalité de d. Dans ce cas, f préserve, et permute circulairement, les d élé-
ments de [x].

L’Exemple 1.8 est en fait un cas particulier d’action de groupes, que nous in-
troduirons plus tard (action du groupe Z sur X). L’Exemple 1.7 est aussi un cas
particulier de l’Exemple 1.8 : considérer X = Z et f : Z → Z, x 7→ x + N . Une
conséquence de l’Exemple 1.8 est la suivante :

Corollaire 1.9. Soient X un ensemble fini et f : X → X une application telle


que f p = idX avec p premier. Soit Fix X = {x ∈ X | f (x) = x} l’ensemble des
points fixes de f . Alors on a |X| ≡ |Fix X| mod p.

Démonstration — On est dans la situation de l’Exemple 1.8, car f est bijective


d’inverse f p−1 . Soient x ∈ X et d = |[x]|. Montrons d = 1 (i.e. x ∈ Fix X) ou
d = p. On a f d (x) = x et f p (x) = x (donc d ≤ p par minimalité de d). On en
déduit f i (x) = x pour tout i dans dZ + pZ. Si on a d < p alors 1 ∈ dZ + pZ par
BezoutP(car p est premier), et donc f (x) = x, i.e. d = 1. On conclut en écrivant
|X| = C∈X/R |C| (partition en classes, Proposition 1.4). 

Ce corollaire peut être utilisé pour prouver l’existence de points fixes. En voici
une application particulièrement amusante due à Zagier, dans le cas p = 2 (une
application f : X → X telle que f 2 = idX s’appelle une involution.) Il s’agit d’une
démonstration « en une seule phrase » du fait que tout nombre premier q ≡ 1 mod 4
est somme de deux carrés d’entiers (un résultat fondateur de la théorie des nombres
dû à Fermat, dont redonnerons une démonstration plus conceptuelle due à Dedekind
un peu plus loin dans le cours).

2. On rappelle que f i désigne la composée f ◦ f ◦ · · · ◦ f (i fois) pour i > 0, (f −1 )−i pour i < 0,
et la convention f 0 = 1X . On a alors f i+j = f i ◦ f j pour tout i, j dans Z.
6 1. ENSEMBLES QUOTIENTS

Exemple 1.10. (Zagier, Amer. Math. Monthly 97 (1990), no. 2, 144) « The
involution on the finite set S = {(x, y, z) ∈ N3 | x2 + 4yz = q} defined by

 (x + 2z, z, y − x − z) if x < y − z,
(2) (x, y, z) 7→ (2y − x, y, x − y + z) if y − z < x < 2y,
(x − 2y, x − y + z, y) if x > 2y.

has only one fixed point, so |S| is odd and the involution defined by (x, y, z) 7→
(x, z, y) also has a fixed point. »

Pour la petite histoire, le fait que l’application ci-dessus est une involution de S
est laissée au lecteur par Zagier (et en effet, facile à vérifier), tout comme le fait que
son unique point fixe est (1, 1, q−1
4
) (c’est ici que l’on utilise que q est premier). Zagier
n’explique pas d’où vient la formule donnée : on en trouvera sur la chaine Youtube
de Mathologer https://www.youtube.com/watch?v=DjI1NICfjOk une explication
géométrique limpide (les « moulins »), que l’on peut résumer en :

2. Passage au quotient

Examinons comment définir une application dont la source est un ensemble quo-
tient. Observons que si l’on dispose d’une application g : X/R → Y , alors l’applica-
tion qui s’en déduit f := g ◦ πR : X → Y est manifestement constante sur chaque
classe de R-équivalence. C’est la situation générale :
Proposition 2.1. (Propriété universelle du quotient) Soient f : X → Y une
application et R une relation d’équivalence sur X. On suppose que f est constante
sur chaque classe d’équivalence : pour tout x, y ∈ X, x R y ⇒ f (x) = f (y). Alors
existe une unique application g : X/R → Y telle que g([x]R ) = f (x) pour tout
x ∈ X, ou ce qui revient au même, vérifiant g ◦ πR = f .

Démonstration — L’unicité de g découle de la surjectivité de πR . Pour son existence,


on observe que si C est une classe de R-équivalence, il y a un sens à poser g(C) = f (x)
où x est un élément quelconque 3 de C, car C est non vide et f est constante sur C
par hypothèses. Pour tout x ∈ X on a alors f (x) = g([x]R ), i.e. f = g ◦ πR . 

3. Dit comme ça, on a l’impression que l’on a utilisé l’axiome du choix (cf. plus bas). On peut
faire sans : par hypothèse sur f , pour C une classe d’équivalence alors l’ensemble f (C) est un
singleton, et on définit alors g(C) comme étant son unique élément.
3. SECTIONS ET SYSTÈMES DE REPRÉSENTANTS 7

L’application g de l’énoncé est appelée « passage au quotient de f », on la note


souvent f . Essentiellement, nous avons simplement vérifié une fois pour toutes que
l’application X/R → Y, [x]R 7→ f (x), est bien définie... ce qui est assez trivial !
L’identité f = f ◦ πR est appelée « factorisation canonique de f ». À moins de
bien savoir ce que l’on fait, on procèdera toujours de cette manière pour définir
une application dont la source est un quotient. On retiendra le slogan : « c’est la
même chose de se donner une application X/R → Y et se donner une application
X → Y constante sur les classes de R-équivalence » (les bijections réciproques étant
g 7→ g ◦ πR et f 7→ f ).

Exemple 2.2. (Contraction d’une partie) Soit A une partie de X. La relation


x R y ⇔ x = y ou (x ∈ A et y ∈ A), est une relation déquivalence sur X dont
les classes d’équivalence sont A et les {x} avec x ∈ X r A. Ainsi, la projection
πR : X → X/R est la « contraction de A en un point ». Considérons par exemple
le cas X = [0, 1] et A = {0, 1}. Alors X/R s’identifie naturellement au cercle unité
S1 . En effet, l’application f : x 7→ e2iπx , [0, 1] → S1 , est constante sur les classes de
R car on a f (0) = f (1). Elle se factorise donc en une application f : [0, 1]/R →
S1 , x 7→ e2iπx , qui est manifestement bijective. La notion de topologie quotient (voir
le cours d’analyse) permettrait même de voir f comme un homéomorphisme.

3. Sections et systèmes de représentants

Définition 3.1. Soit f : X → Y une application. Une section de f (ou “inverse


à droite”) est une application s : Y → X vérifiant f ◦ s = idY .

Autrement dit, une application s : Y → X est une section de f si et seulement si


pour tout y ∈ Y , s(y) est un élément de la fibre f −1 ({y}). Une section est toujours
injective, et uniquement déterminée par son image s(Y ), qui est une partie de X
rencontrant chaque fibre de f en un et un seul point (transversale de f ).
Si f possède une section, alors f est surjective. Réciproquement, intuitivement,
toute surjection f : X → Y admet une section : il suffit de choisir, pour chaque
y ∈ Y , un élément arbitraire de la fibre f −1 ({y}), et de l’appeler s(y). L’axiome
autorisant cette construction en théorie des ensemble s’appelle l’axiome du choix.
(AC) Pour tout ensemble X, il existe une application τ : P(X) − {∅} → X telle que
τ (E) ∈ E pour toute partie non vide E de X.
Une telle fonction τ est appelée fonction de choix sur X.

Proposition 3.2. Les énoncés suivants sont équivalents à l’axiome du choix :


(i) Toute surjection admet une section.
(ii) Pour toute famille
Q {Xi }i∈I de sous-ensembles non vides Xi d’un ensemble
X, le produit i∈I Xi est non vide.

Démonstration — Si f : X → Y est une surjection, et si τ est une fonction de


choix sur X, alors s(y) := τ (f −1 ({y})) est une section de f (noter (f −1 ({y}) 6= ∅
car f est surjective). Donc AC ⇒ (i).
8 1. ENSEMBLES QUOTIENTS

`
Soient {Xi }i∈I des ensembles non vides comme au (ii). Posons X = i∈I Xi
leur réunion disjointe externe 4 On dispose d’une application f : X → I vérifiant
f −1 (i) = Xi pour
Q i ∈ I (déjà vue dans l’Exemple 1.2). Pour toute section s de f , on
a (s(i))i∈I ∈ i∈I Xi : cela montre (i) ⇒ (ii).
Enfin, appliquant
Q (ii) à l’ensemble de toutes les parties non vides de X, on en
déduit que E∈P(X)−{∅} E est non vide : un élément quelconque τ := (τ (E))E est
une fonction choix sur X. 

Bien que très intuitif, AC a aussi des conséquences surprenantes, comme le pa-
radoxe de Banach-Tarski, ou plus simplement les théorèmes de Zorn et de Zermelo
(voir §4). Pour de nombreux exemples concrets d’ensembles X, on peut construire
une fonction de choix sur X sans appel à AC : « Pour choisir une chaussette plutôt
que l’autre pour chaque paire d’une collection infinie, on a besoin de l’axiome du
choix. Mais pour les chaussures, ce n’est pas la peine » (Russel).
Remarque 3.3. (Culturelle) On sait depuis Gödel et Cohen que si l’on rajoute
l’axiome du choix, ou son contraire, à la théorie axiomatique des ensembles de Zer-
melo et Fraenkel (ZF), et si l’on suppose cette dernière cohérente, alors on obtient
une théorie cohérente. Nous renvoyons au cours de logique pour comprendre le sens
de cette affirmation !
Définition 3.4. Soient X un ensemble et R une relation d’équivalence sur X.
Un représentant d’une classe d’équivalence est la donnée d’un élément de cette classe.
Un système de représentants de (X, R) est la donnée d’un sous-ensemble de X conte-
nant un et un seul représentant de chaque classe d’équivalence ; autrement dit, c’est
l’image d’une section de πR .

Le fait que toute relation d’équivalence possède un système de représentants


est donc une autre formulation de AC. Dans le cas de Z/nZ avec n ≥ 1, l’unicité
de la division euclidienne montre bien sûr que {0, . . . , n − 1} est un système de
représentants (et donc |Z/nZ| = n), mais il y en a bien d’autres ! (une infinité
dénombrable).

Exemple 3.5. (Infinite prisonners wearing hats, without hearing) Nous ren-
voyons à https://risingentropy.com/axiom-of-choice-and-hats/ pour une ex-
plication d’un puzzle surprenant montrant comment l’axiome du choix peut ... sau-
ver des vies ! Il est basé sur le choix d’un système de représentants de la relation
d’équivalence sur {0, 1}N définie par (xn ) ∼ (yn ) ⇔ ∃N ≥ 1, xn = yn pour n ≥ N .

4. Le lemme de Zorn

Nous profitons de cette petite discussion sur l’axiome du choix pour discuter
du Lemme de Zorn. C’est un énoncé moins intuitif qui se déduit de AC et qui a
de nombreuses applications : existence d’une base dans un espace vectoriel géné-
ral, existence des clôtures algébriques, théorème de prolongement de Hahn-Banach,
théorème de Tychonoff, existence d’un idéal maximal dans un anneau commutatif
non nul... Il nous faut d’abord faire quelques rappels sur les relations d’ordre.

4. Formellement, on identifie naturellement pour tout i l’ensemble Xi au sous-ensemble


S Yi =
Xi × {i} de E × I, on observe que les Yi y sont deux à deux disjoints, et on pose X = i∈I Yi .
4. LE LEMME DE ZORN 9

Définition 4.1. Une relation d’ordre sur un ensemble X est une relation R sur
X supposée réflexive, transitive et vérifiant en outre x R y et y R x ⇒ x = y, pour
tout x, y ∈ X (antisymétrie).

Une relation d’ordre est en général notée ≤. On note alors aussi x ≥ y pour
y ≤ x, x < y pour “x ≤ y et x 6= y”, et x > y pour y < x. L’ordre ≤ est dit total si
deux éléments quelconques de X sont comparables : pour tout x, y ∈ X on a x ≤ y
ou y ≤ x. Un ensemble muni d’une relation d’ordre est appelé ensemble ordonné.

Soit (X, ≤) un ensemble ordonné. Toute partie Y de X est naturellement ordon-


née par l’ordre induit ≤ ∩ (Y × Y ), encore noté ≤ en général. De plus, on appelle
majorant (resp. majorant strict) de Y tout élément x ∈ X vérifiant y ≤ x (resp.
y < x) pour tout y ∈ Y .

Définition 4.2. Soient (X, ≤) un ensemble ordonné et x ∈ X. On dit que x est


un élément maximal si le seul élément y ∈ X avec x ≤ y est y = x. On dit que x est
un plus grand élément si c’est un majorant de X, i.e. si on a y ≤ x pour tout y ∈ X.
Un plus grand élément est nécessairement maximal, et unique s’il existe, auquel cas
on le note max X.

Par symétrie, on dispose aussi de notions de minorants, d’élément minimal (un


x ∈ X tel que y ≤ x ⇒ y = x) et de plus petit élément (un x ∈ X tel que pour tout
y ∈ X on a x ≤ y) et on note min X l’unique plus petit élément de X s’il existe.

Remarque 4.3. Il faut bien noter que quand ≤ n’est pas total, un élément
maximal n’est pas nécessairement un plus grand élément, et n’est pas nécessairement
unique. Par exemple, soient n un entier ≥ 2 et X l’ensemble des parties à < n
éléments de {1, . . . , n} muni de l’ordre X ≤ Y ⇔ X ⊂ Y . Alors (X, ≤) n’a pas
de plus grand élément, ses éléments maximaux sont les parties à n − 1 éléments de
{1, . . . , n}, et on a min X = ∅.

Nous pouvons désormais énoncer le lemme de Zorn. Un ensemble ordonné est dit
inductif si tout sous-ensemble totalement ordonné admet un majorant. Par exemple,
un ensemble totalement ordonné est inductif si, et seulement si, il admet un plus
grand élément.
Théorème 4.4. (Zorn) Tout ensemble ordonné inductif possède au moins un
élément maximal.

(Un ensemble ordonné inductif est non vide, comme on le voit en considérant un
majorant de sa partie vide...) Une application typique de cet énoncé est la suivante.

Corollaire 4.5. Tout espace vectoriel possède une base.

On rappelle qu’une partie X d’un k-espace vectoriel V est dite libre,


Psi pour toute
famille finie non vide {vj }j∈J d’éléments distincts de X, la relation i∈J λj vj = 0
avec les λj ∈ k entraîne λj = 0 pour tout j ∈ J. De plus, X est dite génératrice si
tout élément de V est combinaison linéaire finie 5 d’éléments de X . Enfin, X est
une base si elle est à la fois libre et génératrice.

5. Bien noter que les combinaisons linéaires infinies n’ont pas de sens en général.
10 1. ENSEMBLES QUOTIENTS

Démonstration — Soient k un corps et V un k-espace vectoriel. Soit L ⊂ P(V )


le sous-ensemble des parties libres de V (noter ∅ ⊂ L !). On le munit de la relation
d’inclusion ⊂ induite de P(V ). Montrons que (L, ⊂) est inductif. Soit {Li }i∈I ⊂ L
une famille totalement ordonnée de parties libres de V . Alors leur réunion L0 =
∪i∈I Li est encore une partie libre, car toute famille finie d’éléments de L0 appartient
à un même Li , et L0 contient aussi chaque Li : c’est un majorant de {Li | i ∈ I}
dans L. D’après Zorn, il existe un élément maximal de L, notons-le B.
La fin de l’argument est comme en dimension finie. Supposons B non ` génératrice :
il existe b ∈ V non dans Vectk B (en particulier,
P b ∈/ B). Alors B {b} contient
strictement B et elle est libre : si on a λb + j∈J λj bj = 0, avec les {bj }j∈J distincts
P k, on a λ 6= 0 car B est libre, donc λ inversible car k est
dans B, et λ et les λj dans
un corps, puis b = −λ−1 j∈J λj bj . On a contredit la maximalité de B. 

Remarque 4.6. Une modification simple de la démonstration montre que de


toute famille génératrice on peut extraire une base. De plus, comme en dimension
finie, on peut montrer que si {ei }i∈I et {fj }j∈J sont des bases d’un même espace
vectoriel, alors I est en bijection avec J (voir l’Exercice1.17).

Vous aimerez peut-être aussi