Algebra Superior II-6
Algebra Superior II-6
NOTAS DE
ÁLGEBRA SUPERIOR II
1. Preliminares 5
1.1. Cálculo combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Estructuras algebraicas 13
2.1. Los números enteros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Anillos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4. El anillo Zn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5. Polinomios 79
5.1. El anillo de los polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2. Divisibilidad de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Índice alfabético 92
Bibliografı́a 93
3
4 ÍNDICE GENERAL
Preliminares
5
6 CAPÍTULO 1. Preliminares
En la gráfica de arriba los guiones representan espacios que se llenan con los k objetos restantes.
En cada una de las posiciones tenemos k objetos, que por la hipótesis de inducción, se pueden
acomodar de k! formas. Entonces en total hay k + 1 posiciones con k! formas cada una, esto
quiere decir que hay
{z· · · + k!} = k!(k + 1) = (k + 1)!.
|k! + k! +
(k+1)−veces
formas de acomodar los objetos x1 , x2 , . . . , xk , xk+1 . Esto demuestra la propiedad para n = k+1.
Por el principio de inducción matemática el resultado es cierto para todo n ∈ N.
En ocasiones es interesante obtener la forma en que se pueden acomodar n objetos distintos
por medio de secciones. En la demostración anterior lo que hicimos en el paso n = k + 1 fue
seccionar los k + 1 objetos en dos pedazos: uno de tamaño 1 y el otro de tamaño k.
Consideremos k < n. Si tenemos n objetos los podemos seccionar en dos pedazos, uno de
tamaño k y otro de tamaño n − k. Las formas en como podemos acomodar los k objetos son
k!, y la forma en como podemos acomodar los n − k objetos son (n − k)!. Para tener todas las
posibles combinaciones, es necesario considerar todos los grupos de k elementos del total de n
n
elementos. Denotemos por k al número de subconjuntos de tamaño k que se pueden obtener
de los n elementos. Tenemos entonces que
n
n! = k!(n − k)!
k
Antes de continuar, recordamos que los números naturales los definimos como N = {1, 2, 3, . . .}
y además N0 = N ∪ {0}.
Existe una relación entre los coeficientes binomiales, pero para motivar un poco tal resultado
recordaremos el triangulo de Pascal (si, el mismo que se ve en la preparatoria). El triángulo
de Pascal esta definido como
fila 0 1
fila 1 1 1
fila 2 1 2 1
fila 3 1 3 3 1
fila 4 1 4 6 4 1
.. .. .. ..
. . . .
La forma de construir la fila n-ésima es la siguiente: Empezamos con un uno, el siguiente término
es el resultado de sumar el número de la izquierda y la derecha de la fila n − 1, el proceso se
repite y se finaliza con un uno. Por ejemplo 1 + 3 = 4, 3 + 3 = 6, 1 + (n − 1) = n, etc. El lector
se habrá dado cuenta de lo siguiente
3 3 3 3
= 1, = 3, = 3, = 1,
0 1 2 3
y también que
(a + b)3 = 1a3 b0 + 3a2 b1 + 3a1 b2 + 1a0 b3 .
De forma parecida
4 4 4 4 4
= 1, = 4, = 6, = 4, = 1,
0 1 2 3 4
y
(a + b)4 = 1a4 b0 + 4a3 b1 + 6a2 b2 + 4a1 b3 + 1a0 b4 .
Lo anterior establece que en general se deben de cumplir los dos siguientes teoremas
Teorema 1.1.4 (Propiedad de Pascal). Sean k, n ∈ N con k ≤ n − 1, entonces
n−1 n−1 n
+ = . (1.1)
k−1 k k
Demostración.
n−1 n−1 (n − 1)! (n − 1)!
+ = +
k−1 k (k − 1)! n − 1 − (k − 1) ! k!(n − 1 − k)!
(n − 1)! (n − 1)!
= +
(k − 1)!(n − k)! k!(n − k − 1)!
(n − 1)!·n · k (n − 1)!·n · (n − k)
= +
n · k·(k − 1)!(n − k)! k!(n − k − 1)!·(n − k) · n
n!·k n!·(n − k)
= +
n·k!(n − k)! k!(n − k)!·n
n! k n−k
= +
k!(n − k)! n n
n! n
= = .
k!(n − k)! k
Lo anterior prueba la veracidad de P (n + 1). Pon inducción concluimos que P (n) es cierta
para todo número n ∈ N0 .
En el caso cuando a y b son números reales no negativos, la suma del lado derecho de (1.2)
consta de términos no negativos y por lo cual, se tiene directamente el siguente resultado.
Teorema 1.1.6. Sean a, b ∈ R números no negativos, entonces para cualquier j, n ∈ N0 tales
que 0 ≤ j ≤ n, se cumple la desigualdad
j
X n n−k k
a b ≤ (a + b)n .
k=0
k
En particular se tiene
n n−j j
a b ≤ (a + b)n y an + nan−1 b ≤ (a + b)n .
j
Definición 1.1.7. Sea n ∈ N. Definimos In como In = {1, 2, . . . , n}. Además decimos que el
conjunto A tiene n elementos (es finito) si existe una función biyectiva f : In −→ A. En este
caso se escribe
A = {a1 , a2 , . . . , an }.
Definición 1.1.8. Sean n, m ∈ N0 y A un conjunto con n elementos. Las ordenaciones con
repetición de n elementos tomadas de m en m, se define como el conjunto de las funciones de
Im en el conjunto de esos n elementos. Al número total de ellas lo denotamos por ORnm .
Las ordenaciones con repetición son el conjunto {f : Im −→ A | f es función} y ORnm es el
número de sus elementos.
Definición 1.1.9. Sean n, m ∈ N0 y A un conjunto con n elementos. Las ordenaciones (o
también ordenaciones sin repetición) de n elementos tomadas de m en m, se define como el
conjunto de las funciones inyectivas de Im en el conjunto de esos n elementos. Al número total
de ellas lo denotamos por Onm .
Las ordenaciones sin repetición son el conjunto {f : Im −→ A | f es función inyectiva} y
Onm es el número de sus elementos.
Definición 1.1.10. Las ordenaciones de n elementos tomados de n en n (es decir n = m), se
llaman permutaciones de n elementos. Las permutaciones son las funciones biyectivas de A
en A, y al número de todas ellas se le denota por Pn .
En el teorema 1.1.2 ya demostramos que Pn = n!, pero un poco más adelante lo daremos
como una consecuencia de las combinaciones.
Definición 1.1.11. Sean n, m ∈ N0 y A un conjunto con n elementos. Las combinaciones de
n elementos tomadas de m en m, se define como los subconjuntos con m elementos del conjunto
de esos n elementos. Al número total de ellos lo denotamos por Cnm .
Las combinaciones de n elementos tomadas de m en m, es el conjunto
O = {f : Im −→ A | f es función inyectiva}
C = {B ⊆ A | B tiene exactamente m elementos}
f (1) = a1 , . . . , f (m) = am ,
Estructuras algebraicas
Axioma 2.1.1 (Principio del buen orden). Si S ⊆ N con S ̸= ∅, entonces existe n0 ∈ S tal
que n0 ≤ n, para toda n ∈ S.
El axioma anterior se puede ampliar un poco para “secciones” de números enteros. De forma
más precisa tenemos el siguiente resultado.
n0 − m + 1 = k0 ≤ n − m + 1, ∀ n ∈ S.
13
14 CAPÍTULO 2. Estructuras algebraicas
El lector recordará de sus cursos de primaria y secundaria la forma en que se realizaba una
división, la cual puede ser exacta o no. Por ejemplo, cuando dividimos el número 13 entre 4,
tenemos un cociente de 3 y un resto de 1, pues 13 es igual al producto de 3 por 4 más 1. Esta
idea de dividir se trabajará con el siguiente resultado, que como estamos acostumbrados, define
de manera formal lo que platicamos con el 13 y el 4.
Teorema 2.1.3 (Algoritmo de Euclides). Sean m y n dos enteros con m > 0. Entonces
existen q, r ∈ Z con 0 ≤ r < m, tales que n = qm + r.
Demostración. Definamos S = {n − tm ≥ 0 : t ∈ Z}. Observemos que si t0 = −|n| entonces
n − t0 m = n + |n|m ≥ n + |n| ≥ 0, esto quiere decir que S ̸= ∅ (de hecho si t es un entero
grande negativo, entonces S tiene elementos positivos). Por el principio del buen orden S tiene
elemento mı́nimo, el cual lo denotamos por r. Como r ∈ S entonces r ≥ 0 y r = n − qm para
algún q ∈ Z. Veamos que r < m. En caso de que n − qm = r ≥ m, se tendrı́a n − (q + 1)m ≥ 0
y con ello que n − (q + 1)m ∈ S. Puesto que −m < 0 se tiene
n − (q + 1)m = n − qm − m < n − qm = r.
(b) m | 0.
(c) Si m | n y n | q entonces m | q.
Demostración. Varias de las propiedades son fáciles de verificar, ası́ que sólo veremos las que
no sean tan evidentes.
c) Como m | n y n | q entonces existen k1 , k2 ∈ Z tales que n = k1 m y q = k2 n, al sustituir
n tenemos q = k2 (k1 m) = (k2 k1 )m, por lo que m | q.
d) Por hipótesis m | n y m | q entonces existen k1 , k2 ∈ Z tales que n = k1 m y q = k2 m.
Multiplicamos la primera igualdad por r y la segunda por s para tener
rn = rk1 m y sq = sk2 m,
y al sumar las ecuaciones tenemos rn + sq = (rk1 + sk2 )m, por lo que m | (rn + sq).
f) Nuevamente como m | n y n | m, existen k1 , k2 ∈ Z tales que n = k1 m y m = k2 n. Al
sustituir m se tiene n = k1 (k2 n), y como n ̸= 0, entonces k1 k2 = 1. Ası́ k2 = ±1 por lo que
m = n o m = −n.
g) Como m | n existe k ∈ Z tal que n = km. Puesto que n ̸= 0 entonces k ̸= 0 y por lo
tanto |n| = |k||m| ≥ |m|.
1. Si a ̸= b, entonces a − b | an − bn .
2. Si a ̸= −b y n es impar, entonces a + b | an + bn .
3. Si a ̸= b y m es un divisor de n, entonces am − bm | an − bn .
Corolario 2.1.7 (Algoritmo de Euclides). Sean m y n dos enteros con m > 0, entonces la
descomposición del teorema 2.1.3 es única, es decir, existen únicos q, r ∈ Z con 0 ≤ r < m,
tales que n = qm + r.
Demostración. Supongamos que existen otros enteros q1 , r1 ∈ Z con 0 ≤ r1 < m, tales que
n = q1 m + r1 . Tenemos pues que
n = qm + r, con 0 ≤ r < m,
n = q1 m + r1 , con 0 ≤ r1 < m.
De las condiciones del lado derecho de arriba, se cumple que |r − r1 | < m. Al restar la
segunda ecuación a la primera tenemos que 0 = m(q − q1 ) + (r − r1 ), o de forma equivalente
m(q1 − q) = (r − r1 ). Lo anterior significa que m | (r − r1 ), por lo que si r ̸= r1 de la proposición
2.1.5 inciso g) se tendrı́a que |m| ≤ |r − r1 |, lo cual no es posible. Ası́ r = r1 . Ahora, como
m > 0 y m(q1 − q) = 0, necesariamente q = q1 .
Unos de los conceptos de interés en los números enteros es el siguiente: dados una cantidad
finita de enteros, ¿cuál es el factor común más grande que tienen dichos números?. La definición
que se damos a continuación es para dos enteros, pero se puede generalizar para una cantidad
finita de ellos.
Definición 2.1.8 (Máximo común divisor). Sean m y n dos enteros no ambos cero. Su
máximo común divisor es un entero c con la siguientes propiedades:
(i) c > 0.
(ii) c | m y c | n.
En el teorema siguiente probaremos que el máximo común divisor de dos números enteros
siempre existe. La propiedad (II) signifca que c debe ser un divisor de los enteros m y n,
y (III) dice que c es el máximo de los divisores comunes de m y n. Note que el entero −c
también cumple (II) y (III), pero para poder tomar el máximo en cuestión de orden, tomamos
los divisores positivos.
Teorema 2.1.9. Si m y n no son ambos cero, entonces su máximo común divisor c = (m, n)
existe, es único y además existen r0 , s0 ∈ Z tales que c = r0 m + s0 n.
m = qc + r = q(r0 m + s0 n) + r
entonces
r = (1 − qr0 )m − qs0 n ∈ S,
lo cual no es posible por que c es el elemento mı́nimo de S. Ası́ r = 0 y c | m. De forma análoga
c | n.
Veamos ahora la unicidad. Supongamos que t es otro entero que cumple las condiciones de
la definición 2.1.8. Por (II) d | m y d | n, entonces d | (r0 m + s0 n), es decir d | c. Como c | m
y c | n, de (III) c | t. De la proposición 2.1.5 inciso (f), t = c o t = −c, pero como t y c son
positivos, necesariamente t = c.
En el teorema anterior se pide que m y n no sean ambos cero, pues en el caso cuando
los dos son cero, cualquier número natural serı́a un divisor común de ambos. Cuando se tiene
k = rm + sn, se dice que k es una combinación lineal de m y n. √
El lector recordará que en su primer semestre vió la demostración de que 2 es un número
irracional, y en el proceso se uso el hecho de que una fracción de dos enteros se podı́an simplificar
hasta no tener divisores en común. En lo que sigue daremos mayor detalle a esas afirmaciones.
Definición 2.1.10. Sean m y n dos números enteros, se dice que m y n son primos relativos
si mcd (m, n) = 1.
Demostración. La demostración será por contradicción. Supongamos que existe m > 1 que no
es primo y que tampoco es producto de primos. Definamos
De la suposición hecha tenemos que A ̸= ∅. Por el principio del buen orden existe m elemento
mı́nimo de A. Como m no es primo, de la proposición 2.1.16 existe un entero k con 1 < k < m
y tal que k | m. De lo anterior existe 1 < r < m tal que m = kr (note que si r = 1 o r = m
implicarı́a que k = m o k = 1), y puesto que m es el elemento mı́nimo de A se debe tener
necesariamente que k ∈ / Ayr∈ / A, lo anterior implica que k y r son primos o productos de
primos, en cualquier caso m = kr deberı́a ser producto de primos, lo cual no es posible por que
m ∈ A.
donde p1 < p2 < · · · < pk son primos y los exponentes a1 , a2 , . . . , ak son enteros positivos.
Demostración. Del teorema 2.1.19 n debe ser un primo o producto de primos, entonces sólo se
debe verificar que la factorización de n es única. Supongamos que existe un entero n > 1 que
tiene dos factorizaciones distintas y denotemos
p1 ≤ pj = q1 ≤ qi = p1 , es decir p1 = q1 .
c
Ahora r = = pa11 −1 pa22 · · · pakk < c entonces r ∈
/ A (por que c es el elemento mı́nimo de A) y
p1
por lo cual r se puede factorizar de forma única, luego de la igualdad
necesariamente k = m, p2 = q2 , . . . , pk = qk y a1 − 1 = b1 − 1, a2 = b2 , . . . , ak = bk . Esto
implicarı́a que los primos y exponentes de la factorización de c son únicos, lo cual no es posible
pues c ∈ A (recordemos que los elementos de A no tienen representación única).
Teorema
√ 2.1.21. Sea n es un entero con n > 1. Supongamos que para todo primo p con
p ≤ n, se tiene que p ∤ n. Entonces n es primo.
Demostración. Supongamos que n no es un número primo, de la proposición 2.1.16 existe un
entero k con 1 < k < n y tal que k | n. Como n = mk, también tenemos que 1 < m < n. Por
el teorema fundamental de la aritmética k y m son producto de primos, digamos
k = k1 · · · kt
y m = m1 · · · ms .
√
Cada uno
√ de los primos k i y mj son estrictamente mayores a
√ √ n, pues los primos menores o
igual a n no dividen a n. Esto implica que k > n y m > n, por lo que
√ √
n = mk > n n = n,
(ii) m | c y n | c.
Proposición 2.1.24. Sean m y n dos enteros distintos de cero, entonces mcm (m, n) existe y
es único.
Demostración. Existencia. Consideremos primero el caso particular cuando mcd (m, n) = 1.
En este caso definimos c = |mn| y veamos que c cumple lo pedido. (I) y (II) son claras, vemos
la propiedad (III). Si d es un entero tal que m | d y n | d, entonces existen r, s ∈ Z tal que
d = rm y d = sn, por lo que m | sn. Como mcd (m, n) = 1, del corolario 2.1.12 m | s, por lo
que existe t ∈ Z tal que s = tm. Esto implica que d = tmn y por tanto c | d.
En el caso cuando m y n no son primos relativos definimos
m n
α = mcd (m, n), m′ = y n′ = .
α α
Del ejercicio 2.6.1 m′ y n′ son primos relativos, por lo que c′ = |m′ n′ | cumple los tres incisos
|mn|
de la definición 2.1.23. Tomemos ahora c = . Claramente c cumple (I) y (II), para la parte
α
(III) sea d es un entero tal que m | d y n | d. De lo anterior se cumple que
m d n d
m′ = y n′ = ,
α α α α
lo que implica que
|mn| ′ d
= c ,
α2 α
por lo cual
|mn|
c= d.
α
Unicidad. Sea c1 un entero que cumpla los tres incisos de la definición 2.1.23. Como m | c1
y n | c1 , entonces c | c1 . De la misma forma c1 | c, por lo cual c = c1 .
Observe que de la demostración de la proposición anterior tenemos automaticamente que
|mn| |mn|
mcm (m, n) = o con la otra notación, [m, n] = .
mcd (m, n) (m, n)
Sean m y n dos números naturales, del teorema fundamental de la aritmética sabemos que
existen únicos primos p1 < p2 < · · · < pk y q1 < q2 < · · · < pr , y únicos exponentes positivos
a1 , a2 , . . . , ak y b1 , b2 , . . . , br tales que
En un principio los primos pi no tienen que ser igual a algún primo qj . Si incluimos los primos
fatantes qj con exponente cero a la expresión de m, y viceversa, no alteramos su valor y
tendremos una notación estandar para los dos números m y n.
Teorema 2.1.25. Sean m y n dos números naturales, sabemos que existen únicos primos
p1 < p2 < · · · < pk y únicos exponentes no negativos a1 , a2 , . . . , ak y b1 , b2 , . . . , bk tales que
Entonces:
Demostración. 1) Definamos c = pα1 1 pα2 2 · · · pαk k , es claro que c cumple (I) y (II) de la definición
de máximo común divisor. Sea d ∈ N tal que d | m y d | n. Entonces existen r, s ∈ Z tal que
esto quiere decir que el número de primos en la expresión de d tiene que ser menor o igual que
la de m y n. Si d = pe11 pe22 · · · pekk , con e1 , . . . , ek ∈ N0 , tenemos que ai ≥ ei y bi ≥ ei , para todo
i = 1, . . . , k, por lo que αi = mı́n{ai , bi } ≥ ei , para todo i = 1, . . . , k. Ası́ c | d.
2) De lo último comentado en la proposición 2.1.24 tenemos directamente
m = 23 · 3 · 52 y n = 22 · 5 · 72
El método de la casita para encontrar el máximo común divisor es obtener factores primos en
común, y el proceso termina cuando ya no hay factores comunes. El método de la casita para
encontrar el mı́nimo común múltiplo es obtener factores primos, no importa si se comparten o
no. El proceso termina cuando ya no hay factores.
600 980 2
300 490 2
150 245 2
600 980 2
75 49 3
300 490 2
mcd mcm 25 49 5
150 245 5
5 49 5
30 49
1 49 7
1 7 7
1 1
2.2. Grupos
Una de las estructuras algebraicas más simples es el concepto de grupo, pero a pesar de la
simplicidad que tiene, muchas de las definiciones que daremos será en base a los grupos.
En algunos textos se pide que la operación ∗ sea cerrada, es decir que a ∗ b ∈ G para todo
a, b ∈ G, pero en nuestro caso esto se pide de un inicio. Puesto que a un mismo conjunto G se
le pueden asociar distintas operaciones, entonces en ocaciones decimos que la pareja (G, ∗) es
un grupo, para resaltar la operación que se está considerando.
Ejemplo 2.2.2. Consideremos a Z con la suma usual (en este caso G = Z y ∗ = +), entonces
tenemos que a + (b + c) = (a + b) + c, para todo a, b, c ∈ Z. En este caso e = 0 es el elemento
neutro pues a + 0 = 0 + a = a para cada a ∈ Z, y además para cada a ∈ Z existe −a ∈ Z tal
que a + (−a) = (−a) + a = 0.
donde ac ̸= 0. Esto quiere decir que ∗ es una operación cerrada. Como la composición de
funciones es asociativa, tenemos que f ∗ (g ∗ h) = (f ∗ g) ∗ h, para toda f, g, h ∈ G. En est
caso la función identidad I ∈ G es el neutro para la composición. Si f (x) = ax + b con a ̸= 0,
entonces f es invertible y en este caso el inverso bajo la operación ∗ es la función inversa f −1 .
G = {f : X −→ X | f es biyectiva}.
3. Si a ∗ b = a ∗ c, entonces b = c.
4. Si b ∗ a = c ∗ a, entonces b = c.
−1
5. a−1 = a.
b = e ∗ b = (α ∗ a) ∗ b = α ∗ (a ∗ b) = α ∗ (a ∗ c) = (α ∗ a) ∗ c = e ∗ c = c.
Todo grupo G tiene dos grupos obvios, G y {e}. Estos son los subgrupos triviales de G.
Antes de dar ejemplos de subgrupos damos una equivalencia de la definición 2.2.9.
H1 = {f : R −→ R | f (x) = ax, a ̸= 0}
H2 = {f : R −→ R | f (x) = x + b}
H3 = {f : R −→ R | f (x) = ax + b, a ̸= 0, a, b ∈ Q}
H4 = {f : R −→ R | f (x) = ax + a, a ̸= 0}
esto quiere decir que H1 , H2 , H3 son cerrados bajo ∗. Ası́ H1 , H2 , H3 son subgrupos de G.
Si H4 fuese un subgrupo de G, se deberı́a tener que I ∈ H4 , pero esto claramente no es
posible.
2.3. Anillos
La siguiente definición está motivada de las propiedades de los números enteros junto con
las operaciones suma y producto.
Definición 2.3.1. Sea A un conjunto no vacı́o. Se dice que A es un anillo si tiene dos
operaciones (una suma y un producto) + : A × A −→ A y · : A × A −→ A que satisfacen lo
siguiente:
(a) (Conmutatividad) Para todos a, b ∈ A se tiene a + b = b + a.
a · (b + c) = a · b + a · c
(b + c) · a = b · a + c · a
Como en el caso de grupos, desde un inicio se pide que las operaciones sean cerradas con
respecto a las operaciones + y ·. Observe que según la definición de anillo, se debe tener que
(A, +) debe ser un grupo abeliano cuyo neutro se denota por 0, pero con la multiplicación no
se pide más que la asociatividad y el lazo común con la suma, que es la distributividad. Para
resaltar la dependencia de las operaciones se dice que (A, +, ·) es un anillo.
Definición 2.3.2. Sea (A, +, ·) un anillo.
1. Si existe i ∈ A tal que a · i = i · a = a, para todo a ∈ A, se dice que A es un anillo con
unidad, es costumbre denotar i = 1 y en general se pide que 1 ̸= 0.
2. Suponga que (A, +, ·) es un anillo con unidad 1. Se dice que (A, +, ·) es un anillo con
división si para cada a ∈ A con a ̸= 0 existe b ∈ A tal que a · b = b · a = 1. En este caso
se escribe b = a−1 .
3. (−a) · (−b) = a · b.
5. (a + b)2 = a2 + a · b + b · a + b2 .
Demostración. 1) Como 0 = 0 + 0, entonces a · 0 = a · (0 + 0) = a · 0 + a · 0, por lo que al
cancelar a · 0 se tiene a · 0 = 0.
2) a·b+a·(−b) = a(b+(−b)) = a·0 = 0, por la unicidad del inverso aditivo −(a·b) = a·(−b).
3) De la parte 2 tenemos (−a) · (−b) = −((−a) · b) = −(−(a · b)) = ab.
4) Aplicamos 2 para tener (−1) · a = −(1 · a) = −a.
2.4. El anillo Zn
Vamos ahora a definir un anillo muy importante en álgebra. Recordemos que una relación R
en X se dice que es una relación de equivalencia si es reflexiva, simétrica y transitiva. Además
R induce una partición de X. Recı́procamente, toda partición B de X, induce una relación de
equivalencia en X.
Sea n un número natural. En Z definimos la relación ∼ como: a ∼ b si y sólo si n | b − a.
Del teorema 2.1.5 se tienen las siguentes propiedades:
1. (Reflexividad) Para todo a ∈ Z tenemos que a ∼ a.
2. (Simetrı́a) Si a ∼ b entonces b ∼ a.
3. (Transitividad) Si a ∼ b y bRc entonces a ∼ c.
Las propiedades anteriores quieren decir que ∼ es una relación de equivalencia en Z. Cuando
a se relaciona con b se dice que a es congruente con b módulo n, y en este caso se escribe
a ≡ b (mod n).
Las clases de equivalencia del entero a se define como
[a] = {x ∈ Z : a ∼ x} = {x ∈ Z : a ≡ x (mod n)}
y el espacio cociente es
Z/ ∼= {[a] : a ∈ Z}.
Vamos a escribir las propiedades de ∼ como módulos y otras dos propiedades que usaremos
más adelante para poder definir dos operaciones de clases.
db − da = dk1 n y ad − ac = ak2 n,
por lo que al sumarlas se tiene que db − ac = (dk1 + ak2 )n. Ası́ (ac) ≡ (bd) (mod n).
Ejemplo 2.4.3. Demostrar que si a, b ∈ Z y p es primo, entonces (a + b)p ≡ (ap + bp ) (mod p).
Ejemplo 2.4.4. Demostrar que todo número entero es divisible por 3 si y sólo si la suma de
sus cifras es divisible por 3.
Como 10 ≡ 1 (mod 3), de la proposición 2.4.1 inciso 5 102 ≡ 1 (mod 3), y de forma inductiva
10i ≡ 1 (mod 3), para todo i ∈ N. De esto ai 10i ≡ ai (mod 3), y nuevamente de la proposición
2.4.1 inciso 4 tenemos
Si 3 | a significa que a ≡ 0 (mod 3), y por transitividad (ak + · · · + a1 + a0 ) ≡ 0 (mod 3), esto
implica que 3 | (ak + · · · + a1 + a0 ).
Lo que veremos ahora es que en general las clases de equivalencia consisten de números
enteros con el mismo residuo y el espacio cociente Z/ ∼ es {[0], [1], . . . , [n − 1]}.
Demostración. Sea a ∈ Z, por el algoritmo de Euclides existen q, r ∈ Z con 0 ≤ r < n, tal que
a = qn + r. Esto quiere decir que a ∈ [r], por lo que Z/ ∼⊆ {[0], [1], . . . , [n − 1]}. Sólo resta
ver que las clases [0], [1], . . . , [n − 1] son distintas. Sean r1 , r2 ∈ {0, 1, . . . , n − 1} con r1 ̸= r2 y
supongamos que [r1 ] ∩ [r2 ] ̸= ∅. Entonces existe a ∈ Z tal que r1 ≡ a (mod n) y a ≡ r2 (mod n),
por transitividad r1 ≡ r2 (mod n), pero esto no es posible pues |r1 − r2 | < n. Ası́ necesariamente
[r1 ] ∩ [r2 ] = ∅ y por lo tanto
Z/ ∼= {[0], [1], . . . , [n − 1]}.
Notemos que estas definiciones dependen fuertemente de los representantes de las clases,
entonces es necesario comprobar que efectivamente definen funciones, es decir, se debe comprobar
que están bien definidas.
Condiremos por ejemplo la partición de R dada por H = (−∞, 0), {0}, (0, ∞) . Recordemos
que toda partición induce una relación de equivalencia. En este caso [3] = [12] = (0, ∞) y
también [−1] = [−15] = (−∞, 0). Si tomamos las operaciones de la definición 2.4.7 se tendrı́a
y
[−15] ⊕ [3] = [−15 + 3] = [−12] = (−∞, 0),
por lo que la suma no estarı́a bien definida.
Veamos que las operaciones ⊕ y ⊙ en Z/ ∼, están bien definidas. Sean a, a′ representantes
de la clase [a] y b, b′ representantes de la clase [b]. Tenemos que
Esto quiere decir que [a′ + b′ ] = [a + b] y [a′ b′ ] = [ab], y por lo tanto las operaciones ⊕ y ⊙ están
bien definidas.
Teorema 2.4.9. Zn es un anillo abeliano con unidad. El neutro aditivo es 0 = [0] y el elemento
unidad es 1 = [1].
Demostración. Sean [a], [b], [c] ∈ Zn . De la conmutatividad de los enteros tenemos que
[a] ⊕ ([b] ⊕ [c]) = [a] ⊕ [b + c] = [a + (b + c)] = [(a + b) + c] = [a + b] ⊕ [c] = ([a] ⊕ [b]) ⊕ [c].
[a] ⊙ ([b] ⊕ [c]) = [a] ⊙ [b + c] = [ab + ac] = [ab] ⊕ [ac] = ([a] ⊙ [b]) ⊕ ([a] ⊙ [c])
([b] ⊕ [c]) ⊙ [a] = [b + c] ⊙ [a] = [ba + ca] = [ba] ⊕ [ca] = ([b] ⊙ [a]) ⊕ ([c] ⊙ [a])
El teorema anterior dice que el conjunto Zn tiene las mismas propiedades algebraicas de los
números enteros. De hecho, de estas propiedades de anillo, en algunos textos escriben [a] = a o
[a] = a, y las operaciones ⊕ y ⊙ como + y ·, respectivamente. Al igual que en Z, puede pasar
que [a] no tenga inversos multiplicativos, de hecho podemos tener cosas más extrañas.
Consideremos por ejemplo Z4 = {[0], [1], [2], [3]}. Denotemos [a] = a. Tenemos
2 · 2 = 4 = 0,
pero 2 ̸= 0. Más generalmente, si m = 2k + 1 se tiene
2m = 22k+1 = (22 )k · 2 = 4k · 2 = 0k · 2 = 0,
y si m = 2k
2m = 22k = (22 )k = 4k = 0k = 0,
Esto significa que 2m = 0, para todo m ∈ N.
Ejemplo 2.4.10. Demostrar que todo número entero es divisible por 3 si y sólo si la suma de
sus cifras es divisible por 3.
Demostración. Consideremos Z3 = {[0], [1], [2]}, y expresemos a a en su expansión base 10,
a = ak 10k + ak−1 10k−1 + · · · + a1 10 + a0 .
Como [10t ] = [10]t = [1]t = [1t ] = [1], para toda t ∈ N, entonces
[a] = [ak 10k + ak−1 10k−1 + · · · + a1 10 + a0 ]
= [ak ] · [10k ] + [ak−1 ] · [10k−1 ] + · · · + [a1 ] · [10] + [a0 ]
= [ak ] · [1] + [ak−1 ] · [1] + · · · + [a1 ] · [1] + [a0 ]
= [ak + ak−1 + · · · + a1 + a0 ]
Ası́ [a] = [0] si y sólo si [ak + ak−1 + · · · + a1 + a0 ] = [0].
Proposición 2.4.11. Sea n un número natural.
1. Si a ∈ Z es primo relativo a n, entonces existe b ∈ Z tal que ab ≡ 1 (mod n).
2. Si a y b son dos enteros tales que ab ≡ 1 (mod n), entonces a y n son primos relativos.
Demostración. 1) Del teorema 2.1.11 existen b, s ∈ Z tal que 1 = ba + sn, luego
[1] = [ba + sn] = [ba] ⊕ [sn] = [ba] ⊕ [sn] = [ba]
y por lo cual existe b ∈ Z tal que ab ≡ 1 (mod n).
2) De forma parecida, como [ab] = [1] entonces [ab − 1] = [0], por lo que n | (ab − 1). Ası́
existe k ∈ Z tal que ab − 1 = kn, o equivalentemente ab + (−k)n = 1. Nuevamente del teorema
2.1.11 a y n son primos relativos.
Nota 2.4.12. Sea p > 1 un número primo y consideremos Zp . Si a ∈ Z es primo relativo a p,
de la proposición anterior existe b ∈ Z tal que
[1] = [ab] = [a] ⊙ [b], [b] ̸= 0.
Puesto que 1, . . . , p − 1 son primos relativos a p, entonces cualquier elemento [a] ∈ Zp tiene
inverso multiplicativo.
2.5. Campos
El lector ya conoce las propiedades de campo de los números reales, las cuales se definieron
en el curso de cálculo I. Todas las propiedades que el lector sabı́a en a preparatoria fueron
justificadas en dicho curso. Ası́ como como los reales positivos forman un grupo y los números
enteros forman un anillo, surge entonces una pregunta natural: ¿Se tendrán otros conjuntos
que cumplan las propiedades de campo de los números reales? Como se ha comentado antes la
respuesta a esta pregunta es afirmativa.
Definición 2.5.1. Sea C un conjunto no vacı́o. Se dice que C es un campo si tiene dos
operaciones (una suma y un producto) + : C × C −→ C y · : C × C −→ C que satisfacen las
siguientes propiedades.
4. (Existencia de inverso aditivo) Para todos a ∈ C existe b ∈ C tal que a+b = b+a = 0.
En este caso se denota b = −a.
a · (b + c) = a · b + a · c
(b + c) · a = b · a + c · a
Ejemplo 2.5.2. Consideremos a los números reales con sus operaciones usuales. Entonces
(R, +, ·) es un campo. Puesto que los números racionales son cerrados bajo la suma y la
multiplicación, y preservan las mismas propiedades algebraicas de R, entonces (Q, +, ·) también
es un campo.
Podrı́a pensarse que hay una gran variedad de campos, y en efecto es ası́ je je, pero se
prueba (aquı́ no serı́a prudente demostrarlo) que cualquier campo es isomorfo a un subcampo
de los números complejos. ¿Qué son los números complejos? El lector, como unos servidores,
tendrán el gusto de conocerlos y trabajar un poco con ellos.
Ejemplo 2.5.6. Consideremos el campo de los números reales (R, +, ·). Claramente el subcojunto
de los números racionales es cerrados bajo la suma y el producto de reales, entonces Q es un
subcampo de los números reales.
Ejemplo 2.5.7. Consideremos nuevamente el campo de los números reales (R, +, ·). Definamos
ahora el conjunto √
X2 = {x + y 2 : x, y ∈ Q}.
√ √
Sean a y b elementos de X2 , entonces a y b son de la forma a = x1 + y1 2 y b = x2 + y2 2,
para ciertos racionales x1 , y1 , x2 , y2 . De la suma y multiplicación de números reales tenemos que
√ √ √
a + b = (x1 + y1 2) + (x2 + y2 2) = (x1 + x2 ) + (y1 + y2 ) 2
y
√ √
ab = (x1 + y1 2)(x2 + y2 2)
√ √
= x1 x2 + x1 y2 2 + x2 y1 2 + 2y1 y2
√
= (x1 x2 + 2y1 y2 ) + (x1 y2 + x2 y1 ) 2,
√ √
por lo cual las operaciones + y · son cerradas en X2 . En este caso 0 = 0 + 0 2 y 1 = 1 + 0 2
son los neutros aditivo y multiplicativo, respectivamente. El inverso multiplicativo de a es
x1 y1 √
a−1 = − 2 2.
x21 − 2y1 x1 − 2y12
2
Es fácil verificar las demás propiedades de campo para los elementos de X2 . Ası́ X2 es un
subcampo de R. Note además que Q es a su vez un subcampo propio de X2 .
2.6. Ejercicios
m
Ejercicio 2.6.1. Sean m y n números enteros no cero. Si c = mcd (m, n) demuestre que y
c
n
son primos relativos.
c
Ejercicio 2.6.2. Sea a un número natural. Demuestre que mcd (am, an) = a mcd (m, n).
Ejercicio 2.6.4. Demostrar por inducción matemática que 3 | (n3 − n), para toda n ∈ N.
Ejercicio 2.6.5. Sea p > 1 un número primo. Demostrar que p | (np − n), para toda n ∈ N.
Sugerencia: Use el teorema del binomio.
Ejercicio 2.6.6. Sean m y n números enteros distintos de cero. Demuestre que mcd (m, n) =
|m| si y sólo si m | n.
Ejercicio 2.6.7. Sean m y n dos enteros con m > 0. Por el algoritmo de Euclides existen
q, r ∈ Z con 0 ≤ r < m, tales que n = qm + r. Demuestre que mcd (m, n) = mcd (m, r)
Ejercicio 2.6.8. Sean m, n, a tres números enteros distintos de cero. Demostrar que
3.1. Matrices
Los sistemas de ecuaciones lineales aparecen en muchos planteamientos de problemas que
tienen que ver con relaciones entre varias variables. El lector recordará los sistemas clásicos de
2 × 2, como por ejemplo
2x − 3y = 7 (3.1)
x + 4y = −2 (3.2)
El punto del sistema anterior es encontrar a x y y que cumplan simultaneamente las dos
ecuaciones anteriores. Uno de los métodos usados para resolver el sistema anterior es el de
sustitución. Al despejar x de la segunda ecuación (3.2) resulta que x = −2 − 4y, y al sustituir
en la primera ecuación (3.1) tenemos
2(−2 − 4y) − 3y = 7,
de donde y = −1. Al sustituir este valor en la ecuación x = −2 − 4y, resulta que x = 2. Otro
método de solución del sistema de ecuaciones es el de eliminación, el cual nos interesa un poco
más pues es el que se generalizará en la teorı́a siguiente. Al multiplicar la ecuación (3.1) por 4
y la ecuación (3.2) por 3 se tiene
8x − 12y = 28
3x + 12y = −6
Al sumar las ecuaciones se tiene 11x = 22, por lo cual x = 2, y de aquı́ y = −1. Vamos
comentar un poco este proceso. Lo que se hizo fue multiplicar la fila (3.1) por 4, la fila (3.2)
por 3 y sumar, para dar una ecuación equivalente donde ya se puede conocer el valor de alguna
de las indeterminadas. Por lo tanto, el sistema original es equivalente al sistema
11x = 22
x + 4y = −2
o también al sistema
2x − 3y = 7
11x = 22
37
38 CAPÍTULO 3. Sistemas de ecuaciones lineales
Los sitemas 3 × 3 involucran un poco más de trabajo, pero se puede seguir el mismo método
que antes. Consideremos por ejemplo el sitema lineal
x − 2y + 4z = 11 (3.3)
2x + y − 3z = −5 (3.4)
−3x + 2y + z = −3 (3.5)
Multiplicamos la ecuación (3.4) por 3, la ecuación (3.5) por 2 y las sumamos, tenemos pues
7y − 7z = −21, y por lo cual el sistema equivalente
x − 2y + 4z = 11 (3.6)
2x + y − 3z = −5 (3.7)
7y − 7z = −21 (3.8)
Multiplicamos la ecuación (3.6) por −2, y le sumamos la ecuación (3.7), el resultado es este
caso es 5y − 11z = −27, y por lo cual el sistema equivale al sistema
x − 2y + 4z = 11 (3.9)
5y − 11z = −27 (3.10)
7y − 7z = −21 (3.11)
Multiplicamos la ecuación (3.10) por 7, la ecuación (3.11) por −5 y sumamos, se tiene pues
−42z = −84, y por lo cual el sistema equivalente
x − 2y + 4z = 11
5y − 11z = −27
−42z = −84
De este sistema ya se pueden conocer los valores de z, después y y por último x, que en este
caso son x = 1, y = −1, z = 2. Realizando un paso más se tiene
5x − 2z = 1
5y − 11z = −27
z = 2
Eliminando ahora los términos −11z y 4z tenemos el sistema reducido
5x = 5
5y = −5
z= 2
En todos los cálculos que hicimos anteriormente, las variables no tienen mucha relevacia, pues
siempre mantuvimos su posición original. Entonces podemos quitar tales variables y trabajar
sólo con los coeficientes en un arreglo en el cual operamos de la forma anterior para “reducirlo”
y encontrar el valor de las indeterminadas. Implı́citamente en el ejemplo anterior tenemos que
considerar el arreglo
1 −2 4 11
2 1 −3 −5
−3 2 1 −3
Con lo cual x = 1, y = −1 y z = 2.
Según lo comentado anteriormente, es necesario definir los arreglos de números y dar un
sentido a sus operaciones de filas.
Definición 3.1.1. Una matriz de tamaño m × n sobre el campo de los números reales es una
función de la forma
A : {1, . . . , m} × {1, . . . , n} −→ R.
Observe que la función actúa sobre pares ordendos (i, j). En forma práctica es costumbre
denotar aij = A(i, j) o Aij = A(i, j), y la matriz A se escribe simplemente como el arreglo de
m filas con n columnas, dado por
a11 a12 · · · a1n
a21 a22 · · · a2n
A = .. .. .
..
. . .
am1 am2 · · · amn
En forma corta, el arreglo se escribe como A = (aij )i=1,...,m o simplemente A = (aij ). A los
j=1,...,n
elementos aij se le llaman entradas de la matriz A. Notemos que en la expresión de la entrada
aij , i representa la posición de la fila i-ésima, y j la posición de la columna j-ésima. En general
escribimos A = (aij ), B = (bij ), C = (cij ), etc. , para representar a las matrices.
Por ejemplo, las matrices
√
−3 2 5 π 9 2 0.1 0.6 0.3
1
0 −11 7 1 −1 2 0.4 0.35 0.25
son de tamaño 2 × 3, mientras que las matrices
1
−1 2 2
−2 −2 0
4 −1 0 −3 0 −1
4
1√
5 8 −1 3 π 1+ 3
son de tamaño 3 × 2.
Nota 3.1.2. De la misma definición, dos matrices son iguales si y sólo si son iguales entradas
por entradas. Para cada i = 1, . . . , m, el i-ésimo renglón de la matriz A es ai1 ai2 · · · ain .
Para cada j = 1, . . . , n, la j-ésima columna de la matriz A es
a1j
a2j
..
.
amj
Definición 3.1.3. El conjunto de todas las matrices de tamaño m × n sobre el campo R, se
denota por Mm×n (R). En ocaciones se escribe simplemente Mm×n .
Definición 3.1.4. Sean A, B ∈ Mm×n (R) dos matrices y α ∈ R.
1. La suma de la matriz A con la matriz B es la matriz C ∈ Mm×n (R), dada por la regla
cij = aij + bij , ∀ i = 1, . . . , m, j = 1, . . . , n.
Denotamos C = A + B. En notación corta (aij ) + (bij ) = (aij + bij ).
2. La multiplicación por escalar de α con la matriz A, es la matriz αA = C ∈ Mm×n (R),
definida por la regla
cij = α · aij , ∀ i = 1, . . . , m, j = 1, . . . , n.
En notación corta α(aij ) = (αaij ).
r
a11 a12 · · ·
↓
a1n
b11 · · · b1r · · · b1p
.. .. ..
. . . n
!
b21 · · · b2r · · · b2p X
AB = i→ ai1 ai2 · · · ain .. .. .. = aik bkr
. .. ..
. . .
.. . . k=1
bn1 · · · bnr · · ·
bnp
am1 am2 · · · amn
En la gráfica anterior expresamos la forma práctica de multiplicar matrices: La entrada cir será
la suma de multiplicar componente por componente la fila i-ésima de A con la columna r-ésima
de B y sumar.
Definición 3.1.7. La matriz identidad I ∈ Mn×n (R), es la matriz dada por la regla I = (δij ),
donde δij = 0 si i ̸= j y δij = 1 si i = j. A la función δij se le llama delta de Kronecker. En
ocaciones la matriz identidad es denotada por In , para resaltar el orden de la matriz (tamaño
de la matriz).
1 0 ··· 0 0
0 1 ··· 0 0
In = ... ... .. .. .
. .
0 0 ··· 1 0
0 0 ··· 0 1
Ejemplo 3.1.8. Sean A ∈ Mm×n (R), entonces AIn = A e Im A = A.
Demostración. De la definición de producto, las entradas de la matriz B = AIn son
n
X
bij = aik δkj = aij δjj = aij ,
k=1
Debido a que las operaciones entre matrices están dadas por sus entradas, y las entradas son
elementos del campo R, es de esperarse que haya propiedades muy parecidas a las del campo
de los números reales, pero en este caso con las matrices.
Teorema 3.1.9. Sean A, B, C ∈ Mm×n (R) tres matrices de tamaño m × n. Entonces
(a) A + B = B + A.
(b) (A + B) + C = A + (B + C).
(c) Existe 0 ∈ Mm×n (R) tal que A + 0 = 0 + A = A.
(d) Existe una matriz D ∈ Mm×n (R) tal que A + D = 0. En este caso se denota D = −A.
Demostración. (a). De la definición de suma de matrices y de la conmutatividad de los números
reales tenemos
A + B = (aij ) + (bij ) = (aij + bij ) = (bij + aij ) = (bij ) + (aij ) = B + A.
(b). Es similar al inciso anterior, sólo que se usa la asociatividad de los números reales
[A + B] + C = (aij ) + (bij ) + (cij )
= aij + bij + (cij )
= [aij + bij ] + cij
= aij + [bij + cij ]
= (aij ) + bij + cij
= (aij ) + (bij ) + (cij ) = A + [B + C].
(c). La matriz 0 está dada por 0ij = 0, para todo i, j. (d). Definamos la matriz D como
dij = −aij , para todo i, j. Entonces
A + D = (aij ) + (dij ) = (aij + dij ) = ((aij ) − (aij )) = (0) = (0ij ) = 0.
El teorema anterior implica que Mm×n (R) con la operación +, es un grupo abeliano.
Teorema 3.1.10. Sean A, B ∈ Mm×n (R) matrices de tamaño m×n y C, D ∈ Mn×p (R) matrices
de tamaño n × p. Entonces
(a) (A + B)C = AC + BC.
(b) A(C + D) = AC + AD.
Demostración. (a). Aquı́ usamos la distributividad de números reales y propiedades de la suma
n
!
X
(A + B)C = (aij + bij )(cjr ) = (aik + bik )ckr
k=1
n
!
X
= (aik ckr + bik ckr )
k=1
n n
!
X X
= aik ckr + bik ckr
k=1 k=1
n
! n
!
X X
= aik ckr + bik ckr = AC + BC.
k=1 k=1
De acuerdo a los últimos dos teoremas, es tentador pensar que Mm×n (R) con las operaciones
de suma y producto de matrices, es un anillo. Sin embargo esto no siempre es cierto, pues la
multiplicación no se realiza siempre con las matrices del mismo orden y de hecho el producto
también puede salirse del conjunto Mm×n (R).
Teorema 3.1.12. Sean A ∈ Mm×n (R) y B ∈ Mn×p (R) dos matrices y α ∈ R, entonces
Demostración. Las entradas de cada una de las tres matrices anteriores son, respectivamente
n n n
!
X X X
(αaik )bkj , aik (αbkj ), α aik bkj .
k=1 k=1 k=1
De las propiedades de la suma tiene que los tres números anteriores son iguales, y por lo cual
(αA)B = A(αB) = α(AB).
Definición 3.1.13. a) Decimos que una matriz A es cuadrada, si el número de filas es igual
al número de columnas.
b) Sea A una matriz cuadrada. Decimos que A es invertible, si existe una matriz B tal que
AB = BA = In . En este caso se denota B = A−1 .
Usando el ejemplo 3.1.8 y los teoremas 3.1.9, 3.1.10, 3.1.11, tenemos el siguiente resultado
importante.
Teorema 3.1.14. El conjunto Mn×n (R) junto con la suma y multiplicación de matrices forman
un anillo con unidad In .
Observación 3.1.15. El anillo Mn×n (R), +, · para n ≥ 2, no es abeliano, ni anillo de división,
ni es dominio entero.
Demostración. Veamos primero el caso cuando n = 2.
1 2 0 1
Mn×n (R) no es anillo abeliano. Definamos las matrices A = yB = . Tenemos
−1 3 2 −1
que
4 −1 −1 3
AB = , BA = .
6 −4 3 1
1 −1
Mn×n (R) no es anillo de división. Definamos la matriz A = . Si existiese B ∈ Mn×n (R)
0 0
tal que AB = BA = I2 , entonces se debe de tener
b11 −b11 b11 b12 1 −1 1 0
= = BA = I2 = ,
b21 −b21 b21 b22 0 0 0 1
Tenemos que
4 −1 0 · · · 0 −1 3 0 ··· 0
6 −4 0 · · · 0 3 1 0 ··· 0
AB = 0 0 0 · · · 0 , BA = 0 0 0 ··· 0 .
.. .. .. .. .. .. .. ..
. . . . . . . .
0 0 0 ··· 0 0 0 0 ··· 0
1 −1 0 ··· 0
0 0 0 ··· 0
Mn×n (R) no es anillo de división. Definamos la matriz A = .. .. . Si existiese
.. ..
. . . .
0 0 0 ··· 0
B ∈ Mn×n (R) tal que AB = BA = I2 , entonces se debe de tener
b11 b12 · · · b1n 1 −1 0 · · · 0 1 0 ··· 0 0
b21 b22 · · · b2n 0 0 0 · · · 0 0 1 ··· 0 0
.. = .. .. ,
.. .. .. .. .. .. .. ..
. . . . . . . . . . .
bn1 bn2 · · · bnn 0 0 0 ··· 0 0 0 ··· 0 1
Definición 3.1.17. Sea A ∈ Mm×n (K) una matriz. Definimos la matriz transpuesta de A
como la matriz At ∈ Mn×m (K), dada por atij = aji .
a) (At )t = A.
b) (A + B)t = At + B t .
Demostración. (a) Las entradas de la matriz (At )t son cij = atji = aij , las cuales son exactamente
igual que las entradas de la matriz A. Ası́ (At )t = A.
(b) Las entradas de la matriz (A + B)t son cij = aji + bji = atij + btij , lo que corresponde a
sumar las entradad de las matrices transpuestas At y B t . Ası́ (A + B)t = At + B t .
Proposición 3.1.20. Sea A ∈ Mm×n (R) y B ∈ Mn×p (R) dos matrices. Entonces
(AB)t = B t At .
Pn
Demostración. Recordemos que las entrada de la matriz AB están dadas por cij = k=1 aik bkj .
Entonces las entradas de (AB)t son
n
X n
X n
X
ctij = cji = ajk bki = atkj btik = btik atkj ,
k=1 k=1 k=1
las cuales son exactamente las entradas de la matriz producto B t At . Ası́ (AB)t = B t At .
3.2. Determinantes
Una de las operaciones importantes de matrices es el determinante. El lector recordará que
uno de los métodos para resolver sistemas de ecuaciones 3 × 3 era por las reglas de Cramer,
la cual involucraba el determinante. La idea de esta parte es generalizar esa definición y dar
propiedades generales relacionadas con las operaciones de matrices. El determinante de una
matriz A ∈ Mn×n (R) se denotará como Det (A) o |A|. Empezamos con la definición de
determinante de matrices de tamaño 1 × 1 y 2 × 2.
Definición 3.2.1. Si A ∈ M1×1 (R) definimos su determinante como Det (A) = a11 y si
A ∈ M2×2 (R) definimos Det (A) = a11 a22 − a21 a12 .
Para obtener el determinante de una matriz de tamaño 3 × 3 se usa la regla de Sarrus, la
cual consiste en repetir las dos primeras filas de la matriz debajo de la misma (quedan entonces
cinco filas), se suman los productos de las diagonales descendentes y se restan los productos de
las diagonales ascendentes
*
aH
11H a12 a13
(−)
H *
a21
H H a22
H Ha23
= a11 a22 a33 + a21 a32 a13 + a31 a12 a23 −a31 a22 a13 − a11 a32 a23 − a21 a12 a33 .
H HH *
aH
31 a
H 32 H
H a
33j
a11 a12HHa13H
H H j (+)
a21 a22 a23
HHj
Entonces si A ∈ M3×3 (R) se define su determinante como
Det (A) = a11 a22 a33 + a21 a32 a13 + a31 a12 a23 − a31 a22 a13 − a11 a32 a23 − a21 a12 a33 .
La idea es definir el determinate de una matriz de tamaño n×n, y se hará de forma inductiva.
La definición formal del determinante se escapa de la teorı́a presentada en estas notas, rogamos
al lector nos comprenda por esta situación.
Definición 3.2.2. Sea n ∈ N con n > 1 y A ∈ Mn×n (R) una matriz. Definimos el menor de
A como la matriz A(i|j) de tamaño (n − 1) × (n − 1) que se obtiene de A eliminando la i-ésima
fila y la j-ésima columna de la matriz A.
De forma gráfica, si A es la matriz
a11 · · · a1j · · · a1n
.. .. ..
. . .
A = ai1 · · · aij · · · ain
. .. ..
.. . .
an1 · · · anj · · · ann
Entonces la matriz A(i|j) ∈ M(n−1)×(n−1) (R) es el resultado de eliminar los elementos de
color azul de la matriz anterior
··· ···
a11 a1(j−1) a1(j+1) a1n
.. .. .. ..
. . . .
a ··· a(i−1)(j−1) a(i−1)(j+1) · · · a(i−1)n
A(i|j) = (i−1)1 .
a(i+1)1 ··· a(i+1)(j−1) a(i+1)(j+1) · · · a(i+1)n
.. .. .. ..
. . . .
an1 ··· an(j−1) an(j+1) ··· ann
Definición 3.2.3. Si A ∈ M1×1 (R) definimos su determinante como Det (A) = a11 y si
A ∈ Mn×n (R) con n > 1, definimos de forma recursiva
n
X
(−1)j+1 a1j Det A(1|j) .
Det (A) =
j=1
Veamos algunos casos particulares para que se entienda la definición. Para una matriz 2 × 2
los menores son números reales
X 2
a11 a12
(−1)j+1 a1j Det A(1|j)
Det =
a21 a22
j=1
= (−1)2 a11 Det A(1|1) + (−1)3 a12 Det A(1|2) = a11 a22 − a12 a21 .
Para el caso n = 3 los menores son matrices 2 × 2, y su determinante se calcula como el caso
anterior, por lo cual
a11 a12 a13 X3
(−1)j+1 a1j Det A(1|j)
Det a21 a22 a23 =
a31 a32 a33 j=1
= (−1)2 a11 Det A(1|1) + (−1)3 a12 Det A(1|2) + (−1)4 a13 Det A(1|3)
a22 a23 a21 a23 a21 a22
= a11 Det − a12 Det + a13 Det
a32 a33 a31 a33 a31 a32
= a11 (a22 a33 − a32 a23 ) − a12 (a21 a33 − a31 a23 ) + a13 (a21 a32 − a31 a22 )
= a11 a22 a33 + a21 a32 a13 + a31 a12 a23 − a31 a22 a13 − a11 a32 a23 − a21 a12 a33 .
Que es exactamente la regla de Sarrus para el caso de una matriz de 3 × 3. Vamos ahora a dar
propiedades del determinante y de algunas operaciones básicas de las matrices. Por la misma
definición del determinante, las demostraciones serán por inducción matemática. En el curso
de Álgebra lineal II, el lector podrá tener formás más elegantes para comprobar los resultados
expuestos. Hay dos resultados importantes que no vamos a demostrar, pero haremos el caso
para matrces 2 × 2.
Los cuatro teoremas que siguen son sobre operaciones y/o propiedades realizadas a las
columnas de una matriz.
Teorema 3.2.4. Sea A ∈ Mn×n (R) una matriz y α ∈ R. Supongamos que la matriz B se
obtiene de A multiplicando una columna por el escalar α. Entonces Det (B) = α Det (A).
Observemos que los menores de A y B cumplen que B(1|r) = A(1|r) y para j ̸= r, B(1|j) se
obtiene de A(1|j) multiplicando una columna por α. Como A(1|j) ∈ M(n−1)×(n−1) (R), podemos
aplicar la hipótesis de inducción en cada una de las A(1|j), para j ̸= r. Ası́
n
X
(−1)j+1 b1j Det B(1|j)
Det (B) =
j=1
X
(−1)j+1 b1j Det B(1|j) + (−1)r+1 b1r Det B(1|r)
=
j̸=r
X
(−1)j+1 a1j α Det A(1|j) + (−1)r+1 αa1r Det A(1|r)
=
j̸=r
Xn
(−1)j+1 a1j Det A(1|j)
=α
j=1
= α Det (A).
Esto quiere decir que el resultado es válido para n. Por inducción matemática se sigue que la
propiedad es válida para todo n ∈ N.
Corolario 3.2.5. Sea A ∈ Mn×n (R) una matriz que tiene una columna nula (columna de puros
ceros), entonces Det (A) = 0.
Teorema 3.2.6. Sea n ≥ 2 y A ∈ Mn×n (R) una matriz que tiene dos columnas consecutivas
iguales, entonces Det (A) = 0.
Supongamos válido el resultado para n−1. Queremos demostrar la propiedad para n. Supongamos
que las columnas que son iguales son la r-ésima y la (r + 1)-ésima.
a11 · · · a1r a1r · · · a1n
a21 · · · a2r a2r · · · a2n
A = .. .. .
.. ..
. . . .
an1 · · · anr anr · · · ann
En este caso todas las matrices A(1|j) ∈ M(n−1)×(n−1) (R), para j ∈ / {r, r + 1}, tienen dos
columnas consecutivas iguales (las cuales son las azules sin los términos a1r ), además se cumple
n
X
(−1)j+1 a1j Det A(1|j)
Det (A) =
j=1
X
(−1)j+1 a1j Det A(1|j) +
=
j ∈{r,r+1}
/
= 0.
Esto quiere decir que el resultado es válido para n. Por inducción matemática se sigue que la
propiedad es válida para todo n ∈ N.
Teorema 3.2.7. Sea n ≥ 2 y A ∈ Mn×n (R) una matriz. Supongamos que la matriz B se
obtiene de A intercambiando dos columnas consecutivas. Entonces Det (B) = − Det (A).
a12 a11
Det (B) = Det = a12 a21 − a22 a11 = −(a11 a22 − a21 a12 ) = − Det (A).
a22 a21
Supongamos válido el resultado para n−1. Queremos demostrar la propiedad para n. Supongamos
que B resulta de A intercambiando las columnas r-ésima y la (r + 1)-ésima.
a11 · · · a1r a1(r+1) · · · a1n a11 · · · a1(r+1) a1r · · · a1n
a21 · · · a2r a2(r+1) · · · a2n a21 · · · a2(r+1) a2r · · · a2n
A = .. .. , B = .. .. .
.. .. .. ..
. . . . . . . .
an1 · · · anr an(r+1) · · · ann an1 · · · an(r+1) anr · · · ann
En este caso las matrices B(1|j) ∈ M(n−1)×(n−1) (R), para j ∈/ {r, r + 1}, se obtienen
de
A intercambiando dos filas consecutivas, por lo que Det B(1|j) = − Det A(1|j) , además
B(1|r) = A(1|r + 1) y B(1|r + 1) = A(1|r). De esto
n
X
(−1)j+1 b1j Det B(1|j)
Det (B) =
j=1
X
(−1)j+1 b1j Det B(1|j) +
=
j ∈{r,r+1}
/
Xn
(−1)j+1 a1j Det A(1|j)
=−
j=1
= − Det (A).
Esto quiere decir que el resultado es válido para n. Por inducción se sigue que la propiedad es
válida para todo n ∈ N.
Lo que queremos ahora es genralizar un poco el teorema anterior.
Teorema 3.2.8. Sea n ≥ 2 y A ∈ Mn×n (R) una matriz. Supongamos que la matriz B se
obtiene de A intercambiando dos columnas cualesquiera. Entonces Det (B) = − Det (A).
Demostración. Supongamos que las columnas que se intercambian son la r-ésima y la p-ésima,
donde r < p. Vamos a aplicar el teorema 3.2.7 varias veces. Intercambiamos la columna r-ésima
con la (r + 1)-ésima, después la (r + 1)-ésima con la (r + 2)-ésima, ası́ hasta llegar a la p-ésima.
El total de cambios son p − r, y cada cambio arroja un −1, por lo cual si denotamos por C a
esa matriz resultante, se tiene
Det (C) = (−1)p−r Det (A).
Del paso anterior, la columna p-ésima en la matriz C se encuentra ahora en la posición p − 1,
por lo que para regresar la columna a la posición r-ésima se necesitan p − r − 1 cambios, por
lo que
Det (B) = (−1)p−r−1 Det (C) = (−1)p−r−1 (−1)p−r Det (A) = − Det (A).
Teorema 3.2.9. Sea n ≥ 2 y A ∈ Mn×n (R) una matriz que tiene dos columnas iguales, entonces
Det (A) = 0.
Demostración. Supongamos que las columnas iguales son la r-ésima y la p-ésima, donde tomamos
r < p. Denotemos por B a la matriz que resulta de la matriz A intercambiando la fila r-ésima
con la fila (p − 1)-ésima. Por el teorema 3.2.8 tenemos que Det (B) = − Det (A). Pero como la
matriz B tiene dos columnas consecutivas iguales, del teorema 3.2.6 se tiene que Det (B) = 0.
Ası́ Det (A) = 0.
Teorema 3.2.10. Sea n ≥ 2, A ∈ Mn×n (R) y C ∈ Mn×1 (R) una matriz columna. Supongamos
que la matriz B se obtiene de A sumándole C a una columna, y la matriz E se obtiene de A
sustituyendo C exactamente en el lugar que se suma la columna de la matriz B. Entonces
Demostración. La demostración será por inducción matemática. Para n = 2 tenemos dos casos,
el primero es cuando
a11 a12 a11 + c11 a12 c11 a12
A= , B= y E= ,
a21 a22 a21 + c21 a22 c21 a22
entonces
a11 + c11 a12
Det (B) = Det
a21 + c21 a22
= (a11 + c11 )a22 − (a21 + c21 )a12
= a11 a22 − a21 a12 + (c11 a22 − c21 a12 ) = Det (A) + Det (E).
entonces
a11 a12 + c11
Det (B) = Det
a21 a22 + c21
= a11 (a22 + c21 ) − a21 (a12 + c11 )
= a11 a22 − a21 a12 + (a11 c21 − a21 c11 ) = Det (A) + Det (E).
y
a11 · · · a1r + c11 · · · a1n a11 · · · c11 · · · a1n
a21 · · · a2r + c21 · · · a2n a21 · · · c21 · · · a2n
B = .. .. , E = .. .. .
.. ..
. . . . . .
an1 · · · anr + cn1 · · · ann an1 · · · cn1 · · · ann
Observemos que por la hipótesis de inducción Det B(1|j) = Det A(1|j) + Det E(1|j) ,
para j ̸= r. Además Det B(1|r) = Det A(1|r) , por lo cual
n
X
(−1)j+1 b1j Det B(1|j)
Det (B) =
j=1
X
(−1)j+1 b1j Det B(1|j) + (−1)r+1 b1r Det B(1|r)
=
j̸=r
X
(−1)j+1 a1j Det A(1|j) + Det E(1|j) + (−1)r+1 (a1r + c11 ) Det A(1|r)
=
j̸=r
X n
X
(−1)j+1 a1j Det A(1|j) + (−1)j+1 e1j Det E(1|j) + (−1)r+1 c11 Det A(1|r)
=
j=1 j̸=r
Xn X n
(−1)j+1 a1j Det A(1|j) + (−1)j+1 e1j Det E(1|j)
=
j=1 j=1
= Det (A) + Det (E).
Esto quiere decir que el resultado es válido para n. Por inducción se sigue que la propiedad es
válida para todo n ∈ N.
Corolario 3.2.11. Sea α ∈ R y A ∈ Mn×n (R) una matriz. Supongamos que la matriz B resulta
de A intercambiando una columna por α veces otra columna más la misma columna, entonces
Det (B) = Det (A).
Del teorema 3.2.4 tenemos que Det (E) = α Det (D), donde
a11 · · · a1r · · · a1r · · · a1n
a21 · · · a2r · · · a2r · · · a2n
D = .. .. .
.. ..
. . . .
an1 · · · anr · · · anr · · · ann
Como D tiene dos columnas iguales, del teorema 3.2.9 Det (D) = 0. Ası́ Det (B) = Det (A).
A pesar de que hemos dados varios resultados del determinante y las operaciones con
matrices, hay dos propiedades que todavı́a no podemos demostrar, pues se necesita teorı́a un
poco más general que el lector verá en su curso de álgebra lineal II. Sin embargo, usaremos tal
resultado e ilustraremos el caso para matrices 2 × 2.
Teorema 3.2.12. Sean A, B ∈ Mn×n (R) dos matrices, entonces
1. Det (At ) = Det (A).
Por lo cual
Det (At ) = a11 a22 − a12 a21 = a11 a22 − a21 a12 = Det (A)
y
Det (AB) = (a11 b11 + a12 b21 )(a21 b12 + a22 b22 ) − (a21 b11 + a22 b21 )(a11 b12 + a12 b22 )
= a11 b11 a21 b12 + a11 b11 a22 b22 + a12 b21 a21 b12 + a12 b21 a22 b22
−a21 b11 a11 b12 − a21 b11 a12 b22 − a22 b21 a11 b12 − a22 b21 a12 b22
= a11 b11 a22 b22 + a12 b21 a21 b12 − a21 b11 a12 b22 − a22 b21 a11 b12
= a11 b11 a22 b22 − a22 b21 a11 b12 + a12 b21 a21 b12 − a21 b11 a12 b22
= a11 a22 (b11 b22 − b21 b12 ) − a21 a12 (b11 b22 − b21 b12 )
= (a11 a22 − a21 a12 )(b11 a22 − b21 a12 )
= Det (A) Det (B).
El inciso uno del teorema 3.2.12 tiene muchas consecuencias, pues al cumplirse la igualdad
Det (At ) = Det (A), cada propiedad que se tenı́a por filas, se puede pasar automaticamente a las
columnas. En particular los teoremas 3.2.8, 3.2.9, 3.2.10 y el corolario 3.2.11 son válidos también
por columnas. El teorema anterior dice que el desarrollo que se hacı́a para el determinante por
filas, también se puede hacer por columnas.
n
X
(−1)i+1 ai1 Det A(i|1) .
Teorema 3.2.14. Sea A ∈ Mn×n (R), entonces Det (A) =
i=1
Ahora veremos que el desarrollo del determinante también se puede hace para cualquier fila,
no sólo para la primera.
n
X
(−1)j+i aij Det A(i|j) .
Teorema 3.2.15. Sea A ∈ Mn×n (R), entonces Det (A) =
j=1
Demostración. Para llevar la fila i a la posición 1 se necesitan i−1 cambios de filas consecutivas.
Denotemos por B a la matriz que resulta de A al realizar estos i − 1 intercambios de filas.
··· ···
a11 a12 a1n
ai1 ai2 ain
1→ 1→
a21 a22 ··· a2n a11 a12 ··· a1n
.. .. ..
a21 a22 ··· a2n
. . .
.. .. ..
a(i−1)1 a(i−1)2 · · · a(i−1)n . . .
A= , B= ,
ai1 ai2 ··· ain i→ a(i−1)1 a(i−1)2 · · · a(i−1)n
i→
a(i+1)1 a(i+1)2 · · · a(i+1)n a(i+1)1 a(i+1)2 · · · a(i+1)n
.. .. .. .. .. ..
. . . . . .
an1 an2 ··· ann an1 an2 ··· ann
Por lo tanto
n
X
Det (A) = (−1)i−1 Det (B) = (−1)i−1 (−1)j+1 aij Det A(i|j)
j=1
n
X
(−1)j+i aij Det A(i|j) .
=
j=1
Consideremos pues
1 x1 x21
A3 = 1 x2 x22 .
1 x3 x23
Usamos ahora el teorema 3.2.4 para sacar del determinante a x1 − x3 de la primera fila y x2 − x3
de la segunda fila
x1 − x3 x1 (x1 − x3 ) 1 x1
Det = (x1 − x3 )(x2 − x3 ) Det
x2 − x3 x2 (x2 − x3 ) 1 x2
= (x1 − x3 )(x2 − x3 )(x2 − x1 ).
Recordemos que del corolario 3.2.11 las operaciones por filas no alteran el determinante. Vamos
a multiplicar la columna n por xn+1 y restarla a la columna n + 1, multiplicar la columna n − 1
por xn+1 y restarla a la columna n, multiplicar la columna n−2 por xn+1 y restarla a la columna
n − 1. Ası́ sucesivamente hasta multiplicar la columna 1 por xn+1 y restarla a la columna 2.
En la última matriz podemos sacar los factores (x1 − xn+1 ), . . . , (xn − xn+1 ) para tener
1 x1 x21 · · · x1n−1
1 x2 x2 · · ·
2 x2n−1
n+2 1 x3 x2 · · ·
Det (An+1 ) = (−1) (x1 − xn+1 ) · · · (xn − xn+1 ) Det 3 x3n−1
.. .. .. ..
. . . .
1 xn x2n · · · xnn−1
Teorema 3.2.18. Sea A ∈ Mn×n (R), entonces AA∗ = Det (A)In y A∗ A = Det (A)In .
Sea i ̸= j. Denotemos por B a la matriz que resulta de A sustituyendo el renglón j-ésimo por
el i-ésimo.
a11 a12 ··· a1n
.. .. ..
. . .
i→ ai1 ai2 · · · ain
. .. ..
B= ..
. . .
j→ ai1
ai2 · · · ain
. .. ..
.. . .
an1 an2 · · · ann
Como la matriz B tiene dos filas iguales, del teorema 3.2.9 tenemos que Det (B) = 0. Al
desarrollar el determinante de B por la fila j-ésima se tiene
n
X n
X
(−1)k+j bjk Det B(j|k) = (−1)k+j aik Det A(j|k) = cij ,
0 = Det (B) =
k=1 k=1
Ası́
Det (A) 0 ··· 0
0 Det (A) · ·· 0
AA∗ = C = = Det (A)In .
.. .. ..
. . .
0 0 ··· Det (A)
Para la otra igualdad denotemos ahora C = A∗ A, se tiene
n
X n
X
a∗ik akj (−1)i+k Det A(k|i) akj .
cij = =
k=1 k=1
Para i ̸= j, sea B la matriz que se obtiene de A sustituyendo la columna i-ésima por la columna
j-ésima
i j
↓ ↓
a11 · · · a1j · · · a1j · · · a1n
a21 · · · a2j · · · a2j · · · a2n
B= .
.. .. .. ..
. . . .
an1 · · · anj · · · anj · · · ann
Como B tiene dos columnas iguales, su determinante vale cero. Al desarrollar Det (B) por la
columna i-ésima tenemos
n
X n
i+k
X
(−1)i+k akj Det A(k|i) = cij .
0 = Det (B) = (−1) bki Det B(k|i) =
k=1 k=1
Si i = j tenemos que
n
X
(−1)i+k aki Det A(k|i) = Det (A).
cii =
k=1
Ası́
Det (A) 0 ··· 0
0 Det (A) · · · 0
A∗ A = C = = Det (A)In .
.. .. ..
. . .
0 0 ··· Det (A)
Corolario 3.2.19. Sea A ∈ Mn×n (R), una matriz tal que Det (A) ̸= 0. Entonces A es invertible
1
y A−1 = A∗ .
Det (A)
Demostración. Del teorema anterior sabemos que A∗ A = AA∗ = Det (A)In , por cual del
teorema 3.1.12 tenemos que
1 ∗ 1 ∗ 1 ∗ 1
A A= A A = In y A A = AA∗ = In .
Det (A) Det (A) Det (A) Det (A)
A11 ∈ Mm1 ×n1 (R), A12 ∈ Mm1 ×n2 (R), A21 ∈ Mm2 ×n1 (R), A22 ∈ Mm2 ×n2 (R),
como
a11 · · · a1n1 a1(n1 +1) · · · a1n
A11 = ... .. ,
A12 = .. .. ,
. . .
am1 1 · · · am1 n1 am1 (n1 +1) · · · am1 n
a(m1 +1)1 · · · a(m1 +1)n1 a(m1 +1)(n1 +1) · · · a(m1 +1)n
A21 = .. .. .. ..
,
A22 = ,
. . . .
am1 ··· amn1 am(n1 +1) ··· amn
A11 A12
podemos expresar a la matriz A de la forma A = . A esta expresión se le llama
A21 A22
forma por bloques de A. Observe que la forma de representar los bloques no es única. Por
ejemplo, si
−1 2 −2 0 1
0 4 −8 5 0
A= 1 1 −1 1 1 ,
7 2 0 6 −1
A11 A12
podemos escribir A = donde
A21 A22
−1 2 −2 0 1 1 1 −1 1 1
A11 = , A12 = , A21 = , A22 = ,
0 4 −8 5 0 7 2 0 6 −1
A11 A12
pero también se puede escribir A = donde
A21 A22
−1 2 −2 0 1 1 1 −1 1 1
A11 = , A12 = , A21 = , A22 = ,
0 4 −8 5 0 7 2 0 6 −1
Definición 3.3.1. Sea A ∈ Mm×n (R), una descomposición de A por bloques es la expresión
A11 A12 · · · A1k
A21 A22 · · · A2k
A = .. .. ,
..
. . .
Ak1 Ak2 · · · Akk
No es mucho trabajo verificar que si A, B ∈ Mm×n (R) son dos matrices expresadas por
bloques y α ∈ R
A11 A12 · · · A1k B11 B12 · · · B1k
A21 A22 · · · A2k B21 B22 · · · B2k
A = .. .. , B = .. .. ,
.. ..
. . . . . .
Ak1 Ak2 · · · Akk Bk1 Bk2 · · · Bkk
entonces
αA11 αA12 · · · αA1k A11 + B11 A12 + B12 · · · A1k + B1k
αA21 αA22 · · · αA2k A21 + B21 A22 + B21 · · · A2k + B2k
αA = .. .. , A+B =
.. .. .. ..
. . . . . .
αAk1 αAk2 · · · αAkk Ak1 + Bk1 Ak2 + Bk2 · · · Akk + Bkk
En esta parte trabajaremos con resultados de productos de matrices por bloques. Para los
fines de estas notas es suficiente trabajar con descomposiciones de tamaño 2 × 2.
Demostración. Antes de la demostración hacemos algunos comentarios. Para empezar note que
las multiplicaciones y suma de matrices de los bloques del producto tienen sentido, pues como
Aij ∈ Mmi ×nj (R) y Bjl ∈ Mnj ×pl (R), entonces Aij Bjl ∈ Mmi ×pl (R). Las expresiones de A y B
son
··· ···
a11 a1n1 a1(n1 +1) a1n
.. .. .. ..
. . . .
am1 1 ··· am1 n1 am1 (n1 +1) ··· am 1 n
A= ,
a(m1 +1)1 · · · a(m1 +1)n1 a(m1 +1)(n1 +1) · · · a(m1 +1)n
.. .. .. ..
. . . .
am1 ··· amn1 am(n1 +1) ··· amn
y
··· ···
b11 b1p1 b1(p1 +1) a1p
.. .. .. ..
. . . .
b · · · b b · · · b
B = n1 1 n1 p1 n1 (p1 +1) m1 p
.
b(n1 +1)1 · · · b(n1 +1)p1 b(n1 +1)(p1 +1) · · · a(n1 +1)p
. .. .. ..
.. . . .
bn1 ··· bnp1 bn(p1 +1) ··· bnp
Aqui vamos a expresar las entradas de los bloques como (A11 )P ij , (B21 )ij , etc.
Sea C = AB, sabemos que las componentes de C son cij = nk=1 aik bkj . Para ver la igualdad
sólo se deben considerar los cuatro casos de los rangos donde se mueven i y j. Si 1 ≤ i ≤ m1 y
1 ≤ j ≤ p1 , tenemos que
n
X n1
X n
X
cij = aik bkj = aik bkj + aik bkj
k=1 k=1 k=n1 +1
Xn1 n
X
= (A11 )ik (B11 )kj + (A12 )ik (B21 )kj ,
k=1 k=n1 +1
por lo que el bloque C11 de la matriz C es C11 = A11 B11 + A12 B21 . Si 1 ≤ i ≤ m1 y p1 ≤ j ≤ p,
tenemos que
n
X n1
X n
X
cij = aik bkj = aik bkj + aik bkj
k=1 k=1 k=n1 +1
Xn1 n
X
= (A11 )ik (B12 )kj + (A12 )ik (B22 )kj ,
k=1 k=n1 +1
por lo que el bloque C12 de la matriz C es C12 = A11 B12 + A12 B22 . Los otros dos casos son
análogos.
Para el siguiente resultado representaremos por 0 a la matriz cero, sin importar su tamaño
(el tamaño se debe de entender en el contexto).
por lo cual
I A−1 A Ip A−1
A11 0 11 A12
B p 11 12 =
0 Iq A21 A22 − A21 A−111 A12 0 Iq
−1
A11 Ip A11 A11 A12
=
A21 Ip A21 A−1 A12 + (A22 − A21 A−111 A12 )Iq
11
A11 A12
= = A.
A21 A22
El inciso 2 se hace de forma parecida.
Esto justifica el paso n y con ello la igualdad del teorema para toda n ∈ N.
(b) Si A11 es invertible entonces Det (A) = Det (A22 − A21 A−1
11 A12 ) det(A11 ).
Ip A12 A−1
22 Ip 0
Del teorema 3.3.4 el determinante de las matrices y son el
0 Iq A−1
22 A21 Iq
producto de los determinantes de su diagonal, el cual en este caso es uno por se la matriz
Ip A−1
Ip 0 A11 0 11 A12
A= .
A21 A−111 Iq 0 A22 − A21 A−1 11 A12 0 Iq
Son muchas las versiones de la creación de los números complejos, creemos que se necesita
profundizar un poco más en las necesidades de algunas ramas de las matemáticas para poder
entender el por qué de su surgimiento. Geronimo Cardano introdujo la unidad imaginaria en
1545 para expresar las soluciones, aunque fueran imaginarias, de las ecuaciones de segundo
grado. Como es sabido, la fórmula cuadrática
√
−b ± b2 − 4ac
2a
describe las soluciones de la ecuación de segundo grado ax2 + bx + c = 0, pero esta fórmula
puede requerir√ obtener
√ raı́ces cuadradas de números negativos. Cardano notó que si se trabaja
con la regla −1 −1 = −1, entonces siempre se le podı́a dar solución a las ecuaciones de
segundo grado.
Fue hasta los trabajos de Casper Wessel (1797), Jean Robert Argan (1806), Karl Friedrich
Gauss (1831), Sir William R. Hamilton (1837), entre otros, que se clarificó el significado de los
números complejos y que no hay algún rasgo de imaginarios en ellos. En el siglo XIX el principe
de las matemáticas Karl Friedrich Gauss demostró en su tesis doctoral que todo polinomio con
coeficientes complejos tiene todas sus raı́ces en C (este resultado tan importante se conoce como
teorema fundamental del álgebra). Gauss fue el que introdujo la aritmética de los números
complejos.
Los números complejos son tan importantes que hay toda una rama para su estudio, el
“análisis complejo”. El inicio del análisis complejo fue en el siglo XIX, y fue desarrollado
principalmente por Augustin Cauchy. Porteriormente la teorı́a se hizo más rigurosa y fue
extendida por matemáticos como Peter Dirichlet, Karl Weierstrass y Bernhard Riemman.
De su curso de geometrı́a I, el lector conoce las propiedes de los vectores de R2 (de hecho por
su similitud de operarlos como números reales, se les maneja sin la “flechita” y con los mismos
sı́mbolos que R), algunas de estas propiedades se tendrá también para los números complejos.
En particular se usará el punto de vista geométrico para los complejos.
Con la experiencia que ya tiene el elctor de los números reales una cosa si es segura: lo que
hace a los números reales, ser los números reales, son sus propiedades de campo. Esto quiere
decir que cualquier conjunto que posea dos operaciones + y ·, y que cumpla con las propiedades
de campo, gozará de las mismas reglas y propiedades que se tienen en los números reales.
Recordamos al lector que la notación R2 hace referencia al producto cartesiano R × R, junto
con la suma de vectores y la multiplicación por escalar. En nuestro caso, trabajaremos sólo con
65
66 CAPÍTULO 4. Los números complejos
el producto cartesiano
R × R = {(x, y) : x, y ∈ R}
y asignaremos unas nuevas operaciones. En algunos textos se escribe simplemente R2 , pero se
debe de tener cuidado de las operaciones que se están trabajando.
Demostración. Vamos a comprobar las 9 propiedades que definen un campo, las más sencillas
se dejarán como ejercicio al lector. Sean pues a = (x1 , y1 ), b = (x2 , y2 ) y c = (x2 , y2 ) tres
elementos de R × R.
2) De la sociatividad de los números reales
a + (b + c) = (x1 , y1 ) + (x2 , y2 ) + (x3 , y3 )
= (x1 , y1 ) + (x2 + x3 , y2 + y3 )
= x1 + (x2 + x3 ), y1 + (y2 + y3 )
= (x1 + x2 ) + x3 , (y1 + y2 ) + y3
= (x1 + x2 , y1 + y2 ) + (x3 , y3 )
= (x1 , y1 ) + (x2 , y2 ) + (x3 , y3 ) = (a + b) + c.
yi x + yi
Al igual que en R2 , la parte izquierda del eje real representa los número negativos y la parte
derecha los números positivos. De forma análoga se tiene la representación con el eje imaginario.
Cuando x = 0, queda z = yi. Este tipo de números complejos se les llama imaginarios
puros. En el caso cuando y = 0, se tiene z = x, y en este caso tenemos un número real.
Ejemplo 4.1.6. Consideremos los números complejos z = 2 + 3i, w = −1 + i, a = −4 y b = 5i.
Calcular z + w, w − a, zw, az y z/w. También calcule la parte real e imaginaria de cada uno
de los números encontrados.
Aquı́ simplemente realizamos el cálculo directo (o de igual forma se puede aplicar la definición
correspondiente a cada operación).
yi
z = x + yi
|z|
Re
-
x
z = x − yi
Note que si z lo escribimos como par ordenado (x, y), entonces el módulo de z coincide con
la norma del vector (x, y) ∈ R2 . Además si z es un número real (es decir Im (z) = 0) entonces
el módulo de z coincide con el valor absoluto usual. Veamos ahora algunas propiedades del
conjugado y módulo de números complejos.
1. z = z.
2. z + w = z + w.
3. z + z = 2 Re (z) y z − z = 2i Im (z).
6. |z| = |z|.
7. zw = z · w.
8. |zw| = |z||w|.
z
9. Si z ̸= 0, entonces z −1 = .
|z|2
z |z|
10. Si w ̸= 0 entonces = .
w |w|
Demostración. Sólo demostraremos los incisos que no sean tan claros. Aquı́ z = x + yi y
w = a + bi.
2) Como z + w = (x + a) + (y + b)i, entonces
8) |zw|2 = (zw)zw = (zz)(ww) = |z|2 |w|2 , al sacar raı́z cuadrada |zw| = |z||w|.
z
9) Como zz = |z|2 , entonces z 2 = 1. De la unicidad del inverso multiplicativo tenemos
|z|
z
que z −1 = 2 .
|z|
10) Tenemos directamente de los incisos 8 y 9
Al igual que las propiedades básicas que se tienen con los números reales, el lema anterior
da algunas de las propiedades básicas que tenemos con el conjugado y el módulo de un número
complejo.
3 − 4i
Ejemplo 4.1.9. Exprese el cociente como un número complejo.
2 + 5i
Según el lema anterior
3 − 4i 2 − 5i 2 5
= (3 − 4i)(2 + 5i)−1 = (3 − 4i) = (3 − 4i) − i
2 + 5i 22 + 52 29 29
Como los números complejos forman un campo, podemos usar los mismos artificios que en R.
En este caso podemos multiplicar y dividir un número complejo que no sea cero
Ejemplo 4.1.10. Sea z ∈ C tal que |z| = 1, entonces para todo a, b ∈ C tales que bz ̸= −a, se
cumple que
az + b
= 1.
bz + a
z
Sabemos que z −1 = 2 = z, por lo cual
|z|
az + b az + b 1 az + b az + b |az + b|
= = = = =1
bz + a −1
z(b + az ) z b + az −1 az + b |az + b|
Ejemplo 4.1.11. Demuestre que el conjunto
E = {z ∈ C : |z + 3 − 2i| + |z − 3 − 2i| = 10}
determina una elipse, y encontrar la ecuación canónica de la misma.
Demostración. Denotemos z = x + yi, entonces la ecuación que describe a E se puede escribir
como
|(x + 3) + (y − 2)i| + |(x − 3) + (y − 2)i| = 10
o equivalentemente
p p
(x + 3)2 + (y − 2)2 + (x − 3)2 + (y − 2)2 = 10.
Pasamos la segunda raı́z del lado derecho y elevamos al cuadrado
p 2 p 2
(x + 3)2 + (y − 2)2 = 10 − (x − 3)2 + (y − 2)2
lo que nos lleva a la igualdad
p
(x + 3)2 + (y − 2)2 = 100 − 20 (x − 3)2 + (y − 2)2 + (x − 3)2 + (y − 2)2 ,
y eso equivale a
p
12x = (6)(2x) = (x + 3)2 − (x − 3)2 = 100 − 20 (x − 3)2 + (y − 2)2
o p
3x = 25 − 5 (x − 3)2 + (y − 2)2 .
Nuevamente elevando al cuadrado
25 (x − 3)2 + (y − 2)2 = (25 − 3x)2 = 625 − 150x + 9x2
lo que se reduce a
16x2 + 25(y − 2)2 = 400
por lo tanto la ecuación de la elipse es
x2 (y − 2)2
+ = 1.
25 16
2. |z + w| ≤ |z| + |w|.
|z + w|2 = (z + w)(z + w)
= zz + zw + wz + ww
= |z|2 + 2 Re (zw) + |w|2
≤ |z|2 + 2|zw| + |w|2
= |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2
Observe que |w| = 1, esto quiere decir que w está sobre la circunferencia con centro en (0, 0) y
radio 1. Por lo que sabemos de geometrı́a, podemos escribir a w de la forma w = cos θ + i sen θ,
para un cierto ángulo θ ∈ R.
Im
6
yi
z = x + yi
|z|
Re
θ -
x
De la periodicidad de las funciones seno y coseno, sabemos que hay infinitos valores θ ∈ R
que cumplen la igualdad w = cos θ + i sen θ. Definamos el conjunto
A = θ ∈ R : z = |z|(cos θ + i sen θ) .
Observemos que θ, α ∈ A, si y sólo si, cos θ = cos α y sen θ = sen α, si y sólo si α = θ + 2kπ,
para algún k ∈ Z. De entre todos los argumentos del número complejo z ̸= 0 hay sólo uno
que se encuentra en el intervalo semiabierto (−π, π], este valor se denota por arg (z). Para el
número complejo z = x + yi ̸= 0, se puede observar que
arctan(y/x) − π si y < 0, x < 0
arctan(y/x) + π si y ≥ 0, x < 0
arg(z) = −π/2 si y < 0, x = 0
π/2 si y > 0, x = 0
arctan(y/x) si x > 0
Veamos una forma equivalente de representar el argumento del complejo z. Primero, es claro
que |z| = − Re (z), si y sólo si z = x < 0. De lo anterior, si |z| =
̸ − Re (z) podemos definir el
número real
Im (z)
α = 2 arctan .
|z| + Re (z)
Del rango de la arcotangente se cumple que α ∈ (−π, π). Además de la identidad del coseno y
la tangente del ángulo medio
Im (z) 2
2
1 − tan (α/2) 1 − |z|+ Re (z)
cos(α) = 2
= Im (z) 2
1 + tan (α/2) 1+ |z|+ Re (z)
Se cumple lo siguiente:
1. zw = |z||w| cos(θ + φ) + i sen(θ + φ) .
z |z|
2. Si w ̸= 0, entonces = cos(θ − φ) + i sen(θ − φ) .
w |w|
3. (Fórmula de De Moivre) Si n ∈ Z, entonces
Ası́ como en los números reales tenemos raı́ces cuadradas (o en general raı́ces n-esimas),
queremos ver como es esa situación con los números complejos. Sean z y w dos número complejos
y n un número natural. representemos como antes
z = |z|(cos θ + i sen θ) y w = |w|(cos φ + i sen φ).
Dejemos fijo a z y veamos cómo debe ser w para que se verifique la igualdad wn = z. Por la
fórmula de De Moivre se debe cumplir que
|w|n cos(nφ) + i sen(nφ) = |z|(cos θ + i sen θ).
p
Esto implica que |w| = n |z| y nφ = θ + 2kπ, para algún k ∈ Z. Denotemos
θ + 2kπ
φk = , k ∈ Z.
n
Si w es un número complejo que cumplen la ecuación wn = z, entonces tiene que pertenecer al
conjunto n o
p
n
W = wk : wk = |z|(cos φk + i sen φk ), k ∈ Z .
θ + 2kπ
Si wk ∈ W, sabemos que φk = . Del algoritmo de Euclides existen q, r ∈ Z con
n
0 ≤ r < m, tales que k = qn + r. De esto
θ + 2kπ θ + 2(qn + r)π θ + 2rπ
φk = = = + 2qπ,
n n n
y por lo cual wk = wr . Veamos ahora que los números complejos w0 , w1 , . . . , wn−1 son todos
distintos. Sean r1 , r2 ∈ {0, 1, . . . , n − 1} y supongamos que wr1 = wr2 , entonces existe m ∈ Z
tal que
θ + 2r1 π θ + 2r2 π
φr1 = φr2 + 2mπ o equivalentemente = + 2mπ
n n
lo anterior implica que r1 − r2 = mn, por lo que n | (r1 − r2 ) y por lo tanto r1 = r2 .
Con todo el trabajo anterior hemos demostrado el siguente resultado.
Teorema 4.2.3 (Raı́ces de un número complejo). Sea z = |z|(cos θ + i sen θ) un número
complejo, existen exactamente n números complejos distintos que cumplen la ecuación wn = z.
Explı́citamente w0 , w1 . . . , wn−1 están dados por
p
n θ + 2kπ θ + 2kπ
wk = |z| cos + i sen , k = 0, 1, . . . , n − 1.
n n
Ejemplo 4.2.4 (Raı́ces de la unidad). Veamos como se ven las raices de la ecuación z n = 1.
En este caso
2kπ 2kπ
wk = cos + i sen , k = 0, 1, . . . , n − 1.
n n
Definamos u = cos( 2π n
) + i sen( 2π
n
), entonces por la fórmula de De Moivre wk = uk , para todo
k = 0, 1, . . . , n − 1. En este caso las raı́ces son
u0 , u1 , . . . , un−1 .
Definición 4.2.5 (Notación de Euler). Sea θ ∈ R un número real. Definimos
eiθ = cos θ + i sen θ.
Sean θ, φ ∈ R y n ∈ N. Note que de esta definición se cumplen las siguientes propiedades:
Polinomios
En este capı́tulo estudiaremos al conjunto de los polinomios. El lector ya ha trabajado con los
polinomios en sus cursos básicos, por lo menos con los polinomios lineales y cuadráticos mx + b
y ax2 + bx + c. En dichos cursos los polinomios eran tratados como funciones, y como tales,
la forma de sumarlos y multiplicarlos eran con las propiedades que se tienen de los números
reales.
79
80 CAPÍTULO 5. Polinomios
dos polinomios. Los polinomios p(x) y q(x) serán iguales si ai = bi , para todo i ≥ 0. Al
polinomio
0(x) = 0 + 0x + · · · + 0xn−1 + 0xn
se le llamará el polinomio cero (no importa el valor de n). De forma corta se escribirá
n
X
n−1 n
p(x) = a0 + a1 x + · · · + an−1 x + an x = ai x i
i=0
Xm
q(x) = b0 + b1 x + · · · + bm−1 xm−1 + bm xm = bj x j
j=0
si por ejemplo n < m, entonces para operar a tales polinomios, implı́citamente se considera que
an+1 , . . . , am son cero. A lo largo de este capı́tulo estaremos trabajando con esta consideración,
para que los polinomios tengan el mismo número de coeficientes.
Definición 5.1.4. Sean p(x), q(x) ∈ A[x] dos polinomios. Definimos p(x) + q(x) como
La suma es como se hacia antes, coefiente a coeficiente (note que esto corresponde a agrupar
los términos semejantes). Lo que se ve un poco extraño es la multiplicación, pero no es otra
cosa que multiplicar todo los términos y agrupar términos semejantes. Esto se ve mejor en un
esquema, consideremos los polinomios
n
X m
X
i
p(x) = ai x y q(x) = bj x j ,
i=0 j=0
como se comentó antes, podemos suponer que n = m, pues en caso de que n < m se pueden
agregar los términos con coeficiente cero. En este caso el producto es igual a
a0 b0 + a0 b1 x + a0 b2 x2 + · · · + a0 bm−1 xm−1 + a0 bm xm
+ a1 b0 x + a1 b1 x2 + a1 b2 x3 + · · · + a1 bm−1 xm + a1 bm xm+1
+ a2 b0 x2 + a2 b1 x3 + a2 b2 x4 + · · · + a2 bm−1 xm+1 + a2 bm xm+2
..
.
+ am−1 b0 xm−1 + am−1 b1 xm + · · · + am−1 bm−1 x2m−2 + am−1 bm x2m−1
+ am b0 xm + am b1 xm+1 + am b2 xm+2 + · · · + am bm−1 x2m−1 + am bm x2m
de este último arreglo se puede observar que los términos comunes son los que se encuentran en
las diagonales, y esto corresponde exactamente a los términos ck de la definición de producto.
A pesar de que en el producto anterior se tomó n = m, es un poco complicado trabajar el
coeficiente ck . Una buena idea serı́a separa en los casos k ≤ m y k > m, pues aquı́ se tiene
X k
X X m
X
ck = aj b i = ak−i bi y ck = aj b i = ak−i bi ,
j+i=k i=0 j+i=k i=k−m
respectivamente. Para tener una descripción uniforme, de los coeficientes ck podemos considerar
Xk k
X
ck = ak−i bi = ai bk−i , donde los términos am+1 , . . . , a2m , bm+1 , . . . , b2m los tomaremos
i=0 i=0
como cero.
Note que en la definición de suma y producto se tiene que r = máx{n, m} y s = n + m. En
este caso podemos escribir
r s k
!
X X X
p(x) + q(x) = (ak + bk )xk y p(x) · q(x) = ak−i bi xk .
k=0 k=0 i=0
m
X m
X m
X
i i
p(x) = ai x , q(x) = bi x , h(x) = ci x i .
i=0 i=0 i=0
Note que hemos usado lo que se ha comentado antes, es decir, uniformizar las expresiones de
los polinomios.
a) Usando la conmutatividad de la suma de A
m
X
p(x) + q(x) = (ak + bk )xk
k=0
Xm m
X
i
= bi x + ai xi = q(x) + p(x).
i=0 i=0
m
X m
X
(ak + bk )xk + ci x i
p(x) + q(x) + h(x) =
k=0 i=0
m
X
(ak + bk ) + ck xk
=
k=0
m
X
ak + (bk + ck ) xk
=
k=0
Xm m
X
i
= ai x + (bk + ck )xk
k=0 k=0
= p(x) + q(x) + h(x) .
m
X m
X
i
p(x) + 0(x) = (ai + 0)x = ai xi = p(x).
i=0 i=0
Pm i
d) Existe el polinomio −p(x) ∈ A[x] dado por −p(x) = i=0 (−ai )x tal que
m m
X i
X
p(x) + − p(x) = (ai + (−ai ))x = 0xi = 0(x).
i=0 i=0
k
X k
X
e) Usando la asociatividad de la multiplicación de A y que ak−i bi = ai bk−i tenemos
i=0 i=0
2m k
! m
X X X
k
ci x i
p(x) · q(x) · h(x) = ai bk−i x ·
k=0 i=0 i=0
k−j
3m k
! !
X X X
= ai bk−j−i cj xk
k=0 j=0 i=0
3m k k−i
!!
X X X
= ai bk−i−j cj xk
k=0 i=0 j=0
m 2m k
!
X X X
i
= ai x · bk−i ci xk
i=0 k=0 i=0
= p(x) · q(x) · h(x) .
Demostración. Sean p(x), q(x) ∈ A[x] dos polinomios no cero. Definamos n = grad p(x) y
m = grad q(x). Como an ̸= 0 y bP m ̸= 0 entonces an bm ̸= 0. Recordemos que los coeficientes de
p(x) · q(x) están dados por ck = ki=0 ak−i bi . Observe que
n+m
X m−1
X n+m
X
cn+m = an+m−i bi = an+m−i bi + an bm + an+m−i bi
i=0 i=0 i=m+1
Pm−1
Si i ≤ m − 1 entonces
Pn+m n + 1 ≤ n + m − i, por lo cual i=0 an+m−i bi = 0. Ahora si i ≥ m + 1
también se tiene i=m+1 an+m−i bi = 0. Entonces cn+m = an bm ̸= 0. Esto quiere decir que
p(x) · q(x) es un polinomio no cero.
(a) Si p(x) + q(x) ̸= 0(x), entonces grad (p(x) + q(x)) ≤ máx{ grad p(x), grad q(x)}.
(b) Si grad p(x) ̸= grad q(x), entonces grad (p(x) + q(x)) = máx{ grad p(x), grad q(x)}.
Corolario 5.1.9. Si A es un dominio entero, entonces los polinomios en A[x] que son invertibles
son los elementos de A que lo son. En el caso particular cuando A es un campo, estos elementos
son A \ {0}.
4. Si p(x) | q(x) y p(x) | h(x), entonces p(x) | r(x) · q(x) + s(x) · h(x), para todo polinomio
r(x), s(x) ∈ K[x].
6. Si p(x) | q(x) y q(x) | p(x), entonces p(x) = a · q(x) para alguna a ∈ K \ {0}.
Teorema 5.2.3 (Algoritmo de la División). Sean f (x), g(x) ∈ K[x] tales que g(x) ̸= 0.
Entonces existen polinomios únicos q(x), r(x) ∈ K[x] tales que
f (x) = g(x) · q(x) + r(x), donde r(x) = 0 o grad r(x) < grad g(x).
Definición 5.2.4 (Máximo común divisor). Sea K un campo y p(x), q(x) ∈ K[x] no ambos
cero. Un polinomio d(x) ∈ K[x] es el máximo común divisor de p(x) y q(x) si cumple:
1. d(x) es mónico.
Definición 5.2.5. Si mcd (p(x), q(x)) = 1, se dice que p(x) y q(x) son primos relativos.
Teorema 5.2.6. Si p(x) | q(x) · h(x) y mcd (p(x), q(x)) = 1, entonces p(x) | h(x).
Proposición 5.2.9. Sea p(x) un polinomio irreducible en K[x]. Para cada polinomio f (x) ̸= 0
en K[x] se cumple que mcd (p(x), f (x)) = 1 o mcd (p(x), f (x)) = a−1 p(x), donde a es el
coeficiente principal de p(x). Más aún, mcd (p(x), f (x)) = a−1 p(x) si y sólo si p(x) | f (x).
Proposición 5.2.10. Sea p(x) un polinomio irreducible en K[x] y supongamos además que
p(x) | f (x) · g(x). Entonces p(x) | f (x) o p(x) | g(x).
Corolario 5.2.11. Sean f1 (x), . . . , fl (x) ∈ K[x] polinomios y p(x) un polinomio irreducible en
K[x]. Supongamos que p(x) | f1 (x) · · · fl (x), entonces p(x) | fj (x) para algún j = 1, . . . , l.
Teorema 5.2.12. Cada polinomio de grado positivo en K[x] se expresa como producto de un
elemento invertible (elemento distinto de cero del campo K) y polinomios irreducibles mónicos.
La descomposición es única salvo por el orden de los factores.
Proposición 5.2.13. Sean c1 , c2 ∈ K con c1 ̸= c2 . Entonces mcd (x − c1 )n , (x − c2 )m = 1,
para cualesquiera n, m ∈ N.
f (α) = a0 + a1 α + · · · + an αn , α ∈ K.
Esto es, para encontrar f (α) sólo se debe sustituir x por α en el polinomio f (x).
Definición 5.2.14. Sea f (x) ∈ K[x] y α ∈ K. Se dice que α es una raı́z de f (x) si f (α) = 0.
Teorema 5.2.15. Sea f (x) ∈ K[x] y α ∈ K. Entonces
Entonces existe r > 0 tal que |f (z)| ≥ |a0 |, para toda z ∈ C con |z| > r.
n−1
X
Demostración. Supongamos primero que f (x) es mónico. Veamos que r = 2 |ak | + 1 cumple
k=0
lo pedido. Si z ̸= 0 tenemos que
a a1 an−1
n 0
f (z) = z n
+ + ··· + +1 .
z z n−1 z
De esto y la desigualdad del triángulo invertida
n−1 n−1 n−1
!
n
X ak n
X ak X ak
|f (z)| = |z| 1 + n−k
≥ |z| 1 − ≥ |z|n 1− . (5.1)
k=0
z k=0
z n−k k=0
z n−k
Si |z| > r implica que |z|j > rj ≥ r, para toda j ∈ N, por lo que
n−1 n−1 n−1 n−1
X ak X |ak | X |ak | 1X 1r−1 1 1 1
n−k
≤ n−k
≤ = |ak | = = − < .
k=0
z k=0
|z| k=0
r r k=0 r 2 2 2r 2
De (5.1) tenemos
n−1
!
|z|n
n
X ak n 1 r
|f (z)| ≥ |z| 1− ≥ |z| 1 − = > > |a0 |.
k=0
z n−k 2 2 2
Esto quiere decir que el resultado se cumple cuando f (x) es mónico. Para el caso general
definimos g(x) = a1n f (x), de lo hecho anteriormente existe r > 0 tal que |g(x)| ≥ |a0 |, para
toda z ∈ C con |z| > r. Luego
|a0 |
|f (z)| = |an | |g(z)| ≥ |an | = |a0 |,
|an |
para toda z ∈ C con |z| > r.
El lector recordará los tres teoremas fuertes de cálculo, aquı́ usaremos la generalización de
dos de ellos (lamentablemente, no se podrán demostrar aquı́, pero en cálculo III ya se tendrá
la herramienta necesaria para poder hacerlo, por lo pronto no queda más que confiar en el
escritor).
Teorema 5.2.21. Sea f una función continua en el conjunto Ar = {z ∈ C : |z| ≤ r}, donde
r > 0. Entonces
1. |f | es acotada en Ar .
2. |f | alcanza su mı́nimo y máximo en el conjunto Ar , es decir, existen z0 , w0 ∈ Ar tal que
|f (z0 )| = mı́n{|f (z)| | z ∈ Ar } y |f (w0 )| = máx{|f (z)| | z ∈ Ar }.
Teorema 5.2.22 (Teorema fundamental del álgebra). Cada polinomio en C[x] y de grado
mayor que cero tiene al menos una raı́z en C.
Demostración. Sea f (x) ∈ C[x] un polinomio de grado n. Se demostrará que la función |f |
tiene un mı́nimo cuando hacemos variar z en todo el plano complejo. Si z0 ∈ C es un punto
mı́nimo de |f (z)|, demostraremos que |f (z0 )| = 0.
Por el lema 5.2.20 existe r > 0 tal que |f (z)| ≥ |a0 |, para toda z ∈ C con |z| > r. En el
conjunto Ar = {z ∈ C : |z| ≤ r} la función |f (z)| alcanza su mı́nimo, es decir, existe z0 ∈ Ar
tal que |f (z0 )| ≤ |f (z)|, para todo z ∈ Ar . En particular |f (z0 )| ≤ |f (0)| = |a0 |.
Como también |f (z0 )| ≤ |a0 | ≤ |f (z)| para toda z ∈ C con |z| > r, tenemos por lo tanto
|f (z0 )| ≤ |f (z)|, ∀ z ∈ C. (5.2)
Puesto que f (z) = f (z − z0 ) + z0 , entonces
n
X k
f (z) = f (z − z0 ) + z0 = ak (z − z0 ) + z0
k=0
n X
k
X k
= ak (z − z0 )j z0k−j
k=0 j=0
j
n
" n #
X X k k−j
= ak z0 (z − z0 )j .
j=0 k=j
j
De lo anterior, existe un polinomio g(x) ∈ C[x] tal Pque f (z)= g(z − z0 ) (de hecho el grado de
g(x) es exactamente n y sus coeficientes son bj = nk=j ak kj z0k−j , pero en nuestro caso no nos
interesa este detalle). Observe ahora que de (5.2), para todo z ∈ C se tiene
|g(0)| = |g(z0 − z0 )| = |f (z0 )| ≤ |f (z + z0 )| = g (z + z0 ) − z0 = |g(z)|
Esto quiere decir que
|g(0)| ≤ |g(z)|, ∀ z ∈ C. (5.3)
Pn
Como f (z0 ) = g(0), vamos a comprobar entonces que g(0) = 0. Denotemos g(x) = k=0 bk xk ,
y definamos j = mı́n{k > 0 | bk ̸= 0} (es decir, bj es el primer coeficente no cero de g(x), por
supuesto, después de b0 ). Tenemos que
n
X
j
g(z) = b0 + bj z + bk z k , bj ̸= 0.
k=j+1
En el caso de que |b0 | > 0, podemos encontrar ε tal que 0 < ε < |w||bj+1 0|
M
, lo que implica a su
j+1
vez que 0 < |b0 | − ε|w| M,y por lo cual
|g(εw)| ≤ |b0 | − εj |b0 | − ε|w|j+1 M < |b0 | = |g(0)|
Teorema 5.2.24. Si α es una raı́z del polinomio f (x) ∈ R[x], entonces α también es raı́z de
f (x).
Corolario 5.2.25. Todo polinomio f (x) ∈ R[x] se puede factorizar como producto de polinomios
lineales y cuadráticos.
R Números reales.
Q Números racionales.
I Números irracionales.
N = {1, 2, . . .} Números naturales.
N0 = N ∪ {0} Números naturales junto con el 0.
91
92 CAPÍTULO 5. Preliminares
[Zorich] Vladimir A. Zorich Mathematical Analysis II. Second Edition. Springer. 2012.
[Rudin] W. Rudin. Principios de Análisis Matemático. Ed. McGraw-Hill. Tercera edición. 1980.
93