Portada
Indice
Unidad 1
Introducción
La unidad 1 aborda el tema de los números complejos comprendidos sobre la
variable compleja I, permitiendo la introducción a este nuevo conjunto de números
denotados por la letra C, los cuales son utilizados en diversas áreas de las
matemáticas, incluyendo el álgebra lineal, el análisis complejo y la geometría
algebraica, así mismo son fundamentales en la teoría de funciones complejas
desempeñándose en campos como la física y la ingeniería.
Como parte de los objetivos del presente curso se tiene que el alumno
comprenderá los elementos de operaciones algebraicas con números complejos:
binómica, polares y exponenciales, su representación gráfica, el cálculo de
potencias y raíces de estos.
Definición y origen de los números complejos
Definición
Los números complejos representan la combinación de números reales y números
imaginarios. La parte real se puede expresar mediante un número entero o sus
decimales, mientras que la parte imaginaria es aquella cuyo cuadrado es negativo.
La fórmula matemática de los números complejos se expresa como a + b i, donde
a y b son números reales, por su parte la i representa el número imaginario. Esta
expresión se conoce como la forma binómica, ya que se compone de dos partes.
Los números complejos pueden expresarse también en otras formas, como la
forma polar, que utiliza la magnitud y el ángulo del número complejo en el plano
complejo. Estas diferentes formas de expresar los números complejos tienen
aplicaciones prácticas en diversas áreas de la matemática y las ciencias
aplicadas.
Los números complejos surgieron de la necesidad de abarcar las raíces de los
números negativos, lo que los números reales no pueden lograr. Por esta razón,
los números complejos reflejan todas las raíces de los polinomios.
Origen
El origen de los números complejos comienza desde que el reconocido
matemático René Descartes, destacó la presencia de la dimensión imaginaria en
los números, argumentando que «es posible concebir una cantidad de números
tan vasta como la que se ha mencionado en cada ecuación, pero en ocasiones, no
se corresponde con una cantidad tangible en el mundo real».
Sin embargo, el concepto de los números complejos fue establecido en la historia
de la matemática gracias a las contribuciones de varios matemáticos importantes.
Uno de ellos fue el matemático italiano Gerolamo Cardano, quien en el siglo XVI
demostró que una raíz cuadrada de un número negativo es posible al tener un
término negativo dentro de la raíz. Antes de esto, se creía que la raíz cuadrada de
un número negativo no era posible.
En el siglo XVIII, el matemático alemán Carl Friedrich Gauss profundizó en las
ideas de Cardano y estableció las bases modernas del concepto de números
complejos. En su trabajo, Gauss desarrolló un enfoque geométrico del concepto,
situando los números complejos en un plano. Esto permitió una representación
visual de los números complejos y su operación matemática.
Aunque la idea de números complejos fue considerada imaginaria por muchos
matemáticos, su aplicación práctica en campos como la ingeniería eléctrica y la
física demostró su importancia y validez en la vida real. Hoy en día, los números
complejos son una herramienta fundamental en diversas ramas de la matemática
y las ciencias aplicadas.
Construcción de un número complejo
La definición de los números complejos es esencial en el contexto matemático.
Estos números son un par ordenado de números reales donde:
El conjunto de todos los números complejos se designa con la letra C.
C={z =a+bi:a,b∈ R}.
Comúnmente se utiliza la letra z para indicar un número complejo y se escribe en
forma de par ordenado: z = (a, b).
La parte real de un número complejo se indica con a = Re(z) y la parte imaginaria
con b = Im(z).
Si la primera componente de un complejo es igual a cero, es decir, z = (0, b), se le
llama número imaginario puro. Si la segunda componente es igual a cero, es decir,
z = (a, 0), se le llama número real puro.
Se representan como un punto en el plano de coordenadas (a, b) o como un
vector de componentes (a, b).
Representación gráfica
En matemáticas, el plano complejo es una forma de visualizar y ordenar el
conjunto de los números complejos. El plano de Argand es una herramienta
fundamental en el estudio de los números complejos. Este plano es una extensión
del plano cartesiano, donde el eje horizontal representa los números reales y el eje
vertical representa los números imaginarios.
Cada número complejo se puede representar mediante un punto en el plano,
donde la posición del punto corresponde a la parte real e imaginaria del número.
Esta representación gráfica permite una visualización más clara de las
propiedades y operaciones de los números complejos.
El plano de Argand también permite una interpretación geométrica de las
operaciones con números complejos. Por ejemplo, la suma de dos números
complejos corresponde a la suma vectorial de los puntos que representan cada
número en el plano. De igual manera, la multiplicación de dos números complejos
corresponde a una rotación y escala en el plano.
El uso del plano de Argand en el estudio de los números complejos ha sido
fundamental en el desarrollo de diversas ramas de las matemáticas y la física,
como la teoría de funciones complejas, la teoría de ecuaciones diferenciales y la
teoría electromagnética, por nombrar algunas. Es por ello que el plano de Argand
sigue siendo una herramienta esencial en la educación matemática y científica
actual.
Operaciones fundamentales con números complejos.
Suma
Dados dos números complejos z = a +bi y w = c+di definimos la suma z +w así:
z +w=(a+c)+(b+d)i
Propiedades de la suma. Si z,w,v ∈ C se verifica:
1. Conmutativa: z +w = w+z.
2. Asociativa: (z +w) +v = z +(w+v).
3. Existe un elemento nulo para la suma, el 0 = 0+0i tal que z +0 = 0+z = z para
todo z ∈ C.
4. Cada número complejo z = a+bi tiene un elemento opuesto −z = −a+(−b)i tal
que z +(−z) = 0.
Producto y división
Dados dos números complejos z = a +bi y w = c+di se define el producto zw así:
zw =(ac−bd)+(ad+bc)i
Propiedades del producto. Si z,w,v ∈ C se verifica:
1. Conmutativa: zw = wz.
2. Asociativa: (zw)v = z(wv).
3. Existe un elemento unidad para el producto, el 1 = 1+0i tal que z1 = 1z = z para
todo z ∈ C.
4. Cada número complejo z = a+bi ≠ 0 tiene un elemento inverso z -1 tal que zz-1= z-
1
z = 1. De hecho, si z = a+bi ≠ 0 se tiene que
a −b
z-1 = 2 2
+ 2 2i
a +b a +b
También se verifica una propiedad que relaciona la suma y el producto: la
propiedad distributiva del producto respecto de la suma:
z (w +v) = zw+zv
El inverso de z lo representaremos por z-1 y por 1/z y
w
= w(1/z) = wz-1
z
Para obtener la parte real y la imaginaria en una división de números complejos
podemos hacer lo siguiente. Si z = a+bi ≠ 0 y w =c+di
w c +di a −b (c +di )(a−bi)
= =(c+di)(a+bi)-1 = (c+di) ( 2 2 + 2 2 i) = (c+di)(a−bi)
z a+bi a +b a +b a 2+ b2
De cualquier modo, tras estudiar la conjugación y el módulo veremos otra técnica
más eficiente para calcular el inverso de un número complejo o dividir números
complejos. Observación. No es posible establecer en el conjunto de los números
complejos una relación de orden que verifique las mismas propiedades que
verifica la relación de orden que conocemos entre los números reales.
Potencias de “i”, módulo o valor absoluto de un número complejo.
Definición
La unidad imaginaria es la raíz cuadrada de un número negativo que, multiplicado por un
número real cualquiera forma un número imaginario y se expresa mediante una i.
En otras palabras, la unidad imaginaria es la raíz cuadrada de -1 y crea un número
imaginario cuando se multiplica por un número real cualquiera.
𝑖 = √−1
Unidad imaginaria
Se utiliza la “i” para denotar la unidad imaginaria dado que proviene del
inglés, imaginary numbers. Como no podemos utilizar los números reales para dar
solución a la ecuación anterior que parece imposible, tendremos que “imaginar” un
número que sí lo hace.
Para entender de donde viene la igualdad anterior, quitaremos la raíz de la
derecha del igual y elevaremos al cuadrado la i. Una vez elevada, la podemos
descomponer como el producto de dos i, tal que:
Equivalencia de la unidad imaginaria
Aceptando la propiedad anterior, podemos resolver la siguiente ecuación:
Ejemplo unidad imaginaria
Este resultado puede reducirse para que nos sea más familiar quitando la potencia
de la izquierda y añadiendo la raíz cuadrada a la derecha:
Número imaginario
La ecuación anterior es la expresión de un número imaginario, compuesto por la
parte real, número 8, y la parte imaginaria, i, es decir, la unidad imaginaria.
Propiedades de la unidad imaginaria
La unidad imaginaria posee tres propiedades.
Propiedad 1
1·i=i
La multiplicación de 1 con la i produce un efecto neutro.
Propiedad 2
i · i = -1
-i · i = 1
Esta propiedad es la más importante dado que solo la poseen los números
imaginarios.
Propiedad 3
-1 · i = -i
La multiplicación de -1 con la i produce un cambio de signo en la i.
Por lo tanto, si seguimos dichas propiedades:
i 2 = –1.
i 3 puede ser escrito como ( i 2 ) i , que es igual a (–1) i o simplemente – i .
i 4 puede ser escrito como ( i 2 )( i 2 ), que es igual a (–1)(–1) o 1.
i 5 puede ser escrito como ( i 4 ) i , que es igual a (1) i o i .
Hecho que nos permite observar que el ciclo se repite cada cuatro potencias,
quedando como se muestra en la siguiente
imagen (sentido antihorario) y tabla:
Potencias
i1=i i0=1
i2=-1 i-1=-i
i3=-i i-2=-1
i4=1 i-3=i
i5=i i-4=1
i6=-1 i-5=-i
i7=-i i-6=-1
i8=1 i-7=i
i9=i i-8=1
i10=-1 i-9=-i
etc Etc
Forma polar y apolar de un número complejo
FORMA POLAR Y EXPONENCIAL DE UN NÚMERO COMPLEJO
La forma polar de un número complejo, es un segmento de recta que se encuentra
ubicado en un plano rectangular, el cual cuenta con dos características
importantes, tiene un ángulo medido desde el eje horizontal positivo, hasta el
segmento de la recta y el segmento de la recta tiene una longitud. Si bien un
número complejo se representa de forma binomica, la forma polar es otra manera
de expresar dichos números complejos.
Si bien un numero complejo en la forma binomica esta denotado por z = a + bi, la
forma polar de este número complejo se denota por 𝑧 = 𝑟𝜃. Si ubicamos la parte a
y la parte b en el plano cartesiano, se formaría un rectángulo, pero este se partiría
por el vector que sale desde el punto de origen hasta el punto de unión de a y b, y
ese sería el vector denotado por r, al hacer esto quedaría un triángulo y r sería una
hipotenusa.
Donde r se calcula a través del teorema de Pitágoras con la formula:
r =√ a +b
2 2
Y el ángulo que hay entre r y el punto donde se marca el número complejo en el
plano cartesiano y se calcula como:
θ=tan −1 ( ba )
Ejemplo: convertir 5 – 5i en forma polar
Se saca el módulo de z:
z=√ 52 +(−5)2 =√ 25+ 25 = 150
Ahora se obtiene teta:
θ=tan
−1
( −55 )=−45
El resultado de esta operación es -45, pero está en el punto (5, -5) y esta
coordenada se encuentra en el cuarto cuadrante por lo que a 360 se le debe restar
el valor de teta:
0 = 360 − 45 = 315°
Entonces
z=√ 50(cos 315°+i sen 315 °)
Representación de forma polar de un numero complejo en el plano cartesiano:
Como se puede observar en el plano ya se encuentran ubicadas las coordenadas,
donde r se encuentra representada por la línea roja, mientras que 𝜃 es el ángulo
que se forma entre r y el eje de las x.
Forma exponencial
Mientras que en la forma polar de un numero complejo se mide el ángulo en
sexagesimales, en la forma exponencial se mide en radianes.
Se le conoce como fórmula de Euler a la ecuación e iθ =cosθ +i senθ que define el
símbolo e iθ para todo valor real de θ .
Esta fórmula de Euler permite expresar compactamente a z en forma exponencial:
z=r e iθ
Se verifica que: e iθ = 𝑐𝑜𝑠(𝜃) + 𝑖 𝑠𝑒𝑛(𝜃)
Donde 𝜃 es el ángulo en radianes y 𝑖 = √−1
“e” es un número irracional que empieza como sigue:
𝑒 ≈ 2,7182818284 …
Este número “e” fue descubierto por John Napier cuando invento el logaritmo
Neperiano en 1614, pero fue Euler quien trabajó y desarrolló posteriormente esta
constante. Además, en esta forma, se tienen los mismos parámetros en que la
forma polar.
La ecuación se conoce como representación exponencial del número complejo z y
es muy útil porque permite simplificar los cálculos al hacer uso de las propiedades
inherentes a la función exponencial.
Existen algunas relaciones que se tienen que saber para la forma exponencial de
un número complejo:
• e x está definida para todos los números complejos.
• (e ¿¿ x) y ¿ = e x = e xy
• Para todo complejo z=a ebi su conjugado es a e−bi
−x 1
•e = x
e
Pues bien, la fórmula de Euler también nos permite representar los números
complejos con una notación más corta que se conoce como forma exponencial.
De esta manera, sí un número complejo está escrito en forma trigonométrica
puede expresarse de manera exponencial la cual resulta ser más corta, siendo así
una simplificación.
Además, ley de Euler tiene un importante vínculo entre la trigonometría y el
cálculo, al asociar la exponenciación de la parte imaginaria compleja con la
representación de un complejo cuyo módulo es 1.
Esta es la base para la representar exponencialmente los números complejos y
como base demostrativa para la Ley de Moivre. Sea 𝜃 = arg (𝑧) expresado en
radianes. Entonces la expresión trigonométrica de z es:
𝑧 = |𝑧|(cos 𝜃 + 𝑖 𝑠𝑒𝑛𝜃)
Por ejemplo, para pasar z1 = 3i y z2 = 1 – i se hace de la siguiente manera:
( )
π
π π i
z 1=3 i=3 cos + i sen =3 e 2
2 2
( )
7π
7π 7π i
z 2=1−i= √2 cos + i sen =√ 2 e 4
4 4
Representación de forma exponencial de un número complejo en el plano
cartesiano:
Como se puede ver, los grados obtenidos en la forma exponencial también se
plasman en el plano cartesiano, como se mencionó antes, todo depende del
cuadrante en el que se encuentren las coordenadas para poder obtener de
manera correcta los grados correspondientes.
La función exponencial es particularmente útil para representar los números
complejos de módulo, es decir los números complejos de la forma cos 𝜃 + i sen 𝜃
(𝜃𝜖ℝ).
Teorema de De Moivre, potencias y extracción de raíces de un número
complejo.
TEOREMA DE MOIVRE
La fórmula Z * W = |z| * |W| (cos (θ + µ) + i sen (θ + µ)) puede ser utilizada para
hallar la potencia enésima de un numero complejo.
Supongamos que Z = |Z| (cos θ + isen θ), y n es un entero positivo, entonces se
obtiene:
n
Z n=|Z| (cos ( n∗θ ) +i sen ( n∗θ ) )
Esta relación, que se conoce con el nombre de Formula de Moivre, y proporciona
un algoritmo bastante eficiente para hallar la potencia enésima de cualquier
número complejo en forma polar.
Ejemplo. Sea Z = 2 (cos30° + i sen30°).
Calcule la potencia de orden cinco de este número, es decir, Z 5.
EXTRACCIÓN DE LAS RAICES DE UN NÚMERO COMPLEJO.
Si Z es un número complejo tal que para algún entero positivo se tenga:
n
Z=W
donde W es otro número complejo, entonces se dice que W es una raíz enésima
de
Z. Esto lo denotamos por:
W =Z = √ Z
1 /n n
En los números reales, todo número posee una raíz de orden impar y dos raíces
de orden par. En los complejos hay una mayor abundancia de raíces.
Concretamente, se tiene la siguiente propiedad:
Todo número complejo tiene exactamente n raíces n – esimas. Así por ejemplo 1
tiene 4 raíces cuartas, pues:
Luego 1, -1, i, y -i son las raíces cuartas de 1.
A continuación, damos una fórmula para hallar las raíces de un número complejo.
Sea Z = |Z|(cos θ + i sen θ).
Las potencias enteras de un número complejo no nulo z=r e iθ vienen dadas por
z=r n e inθ (n=0 ,+1 ,−1,+2 ,−2 …)
Como zn+1 = zzn cuando n=1, 2, …, esto se comprueba fácilmente para valores
positivos de n por inducción, para el producto de números complejos en forma
exponencial. La ecuación es válida también para n = 0 con el convenio de que z o =
1. Si n = -1, -2…, por otro lado, definimos z n en términos del inverso multiplicativo
de z escribiendo z n=( z−1)m , donde m = -n = 1, 2, … Entonces, como la
ecuación z=r n e inθ es válida para potencias enteras positivas, se sigue de la forma
exponencial de z−1 que
n i(−θ ) m m ℑ (−θ ) n inθ
z =[1 /r e ] =(1/ r) e =r e
Por tanto, la ecuación z=r n e inθ es válida para toda potencia entera.
Nótese que si r =1, z=r n e inθ se convierte en
(e iθ )n=eiθn (n=0 ,± 1 ,± 2 …)
Cuando se expresa en la forma:
n
(cos θ+ i sen θ) =cos nθ+ i sen nθ
se le conoce como la fórmula de De Moivre
Ecuaciones polinómicas
Una función polinómica es aquella que tiene por expresión un polinomio. En
general, suelen estudiarse según el grado del polinomio: Las funciones afines Una
función afín es una función polinómica cuya expresión es un polinomio de grado 1,
del tipo: f(x) = ax + b La gráfica de una función afín es una recta. Al número a se le
denomina pendiente de la recta e informa de la inclinación de ésta. Por ejemplo:
Puntos de corte con los ejes: con el eje X: (–b/a,0) con el eje Y: (0,b) Crecimiento:
la función es creciente si a >0 la función es constante si a = 0 la función es
decreciente si a < 0 Un tipo especial de funciones afines son las funciones
lineales: una función lineal es una función afín cuyo término independiente es 0.
Su representación es una recta que pasa por el origen. Por ejemplo:
Las funciones polinómicas Una función polinómica es una función cuya expresión
es un polinomio; por ello, a veces, se le denomina simplemente polinomio. En la
gráfica de una función polinómica pueden diferenciarse dos elementos: las ramas
y la parte central, también los máximos y los mínimos, y los puntos de corte con
los ejes:
Unidad 2
2.1 Definición de matriz, notación y orden.
Definición
Se llama matriz al arreglo bidimensional de números. Dado que puede definirse
tanto la suma como el producto de matrices, en mayor generalidad se dice que
son elementos de un anillo. Una matriz se representa por medio de una letra
mayúscula (A, B...) y sus elementos con la misma letra minúscula (a,b,..) con un
doble subíndice donde el primero indica la fila y el segundo la columna a la que
pertenece.
NOTACION
Abreviadamente suele expresarse en la forma A=(aij).con i= 1,2,...,m; j=1,2,...,n.
Los subíndices indican la posición del elemento dentro de la matriz, el primero
denota la fila (i) y el segundo la columna (j). Por ejemplo, el elemento a25 será el
elemento de la fila 2 y la columna 5.
ORDEN DE UNA MATRIZ
El número de elementos de una matriz lo obtendremos de multiplicar el número de
filas por el de columnas: m x n.
Al producto "m x n" lo llamamos orden de matriz.
2.2 OPERACIONES CON MATRICES
Suma de matrices
Para poder sumar dos matrices, estas deben tener la misma dimensión. Entonces
se suman termino a término.
Producto de un número por una matriz
Se multiplica el número por cada uno de los elementos de la matriz.
Producto de matrices
Para poder multiplicar dos matrices, el número de columnas de la primera debe
coincidir con el número de filas de la segunda.
Producto de una matriz fila por una matriz columna
El producto de una matriz fila por una matriz columna es un número que se
obtiene multiplicando elemento a elemento y sumando los resultados.
Propiedades del producto de matrices
Trasposición de matrices
Trasponer una matriz significa cambiar las filas por las columnas. Si una matriz es
de dimensión m x n, su traspuesta es de dimensión n x m, la matriz traspuesta se
representa AT y se lee la traspuesta de A.
Potencias de matrices.
Para poder calcular la potencia de una matriz, esta tiene que ser cuadrada. Se
trata de multiplicar la matriz por sí misma tantas veces como diga el exponente.
2.3 CLASIFICACIÓN DE LAS MATRICES
Matriz fila Matriz columna
Esta constituida por una sola fila Tiene una sola columna
Matriz rectangular
Tiene distinto número de filas que de columnas, siendo su dimensión m x n.
Matriz cuadrada
Tiene el mismo número de filas que de columnas.
Matriz triangular superior
Los elementos situados por debajo de la diagonal principal son ceros.
Matriz triangular inferior
Los elementos situados por encima de la diagonal principal son ceros.
Matriz diagonal
Todos los elementos situados por encima y por debajo de la diagonal principal son
nulos.
Matriz escalar
Es una matriz diagonal en la que los elementos de la diagonal principal son
iguales.
Matriz identidad o unidad
Es una matriz diagonal en la que sus elementos de la diagonal principal son
iguales a 1.
Matrices normales
Una matriz es normal si conmuta con su traspuesta, esto es, si AAT= ATA.
Obviamente si A es simétrica, antisimétrica u ortogonal es necesariamente normal.
Matrices escalonada
Una matriz es escalonada si al principio de cada fila o columnas un elemento nulo
más que en la fila o columna anterior.
2.4 TRANSFORMACIONES ELEMENTALES POR RENGLÓN.
ESCALONAMIENTO DE UNA MATRIZ. NÚCLEO Y RANGO DE UNA MATRIZ
La idea que se persigue con las transformaciones elementales es convertir una
matriz concreta en otra matriz más fácil de estudiar. En concreto, siempre será
posible conseguir una matriz escalonada, en el sentido que definimos a
continuación.
Sea A una matriz y F una fila de A. Diremos que F es nula si todos los números de
F coinciden con el cero. Si F es no nula, llamamos PIVOTE de F al primer número
distinto de cero de F contando de izquierda a derecha.
Una MATRIZ ESCALONADA es aquella que verifica las siguientes propiedades:
Todas las filas nulas (caso de existir) se encuentran en la parte inferior de la
matriz.
El pivote de cada fila no nula se encuentra estrictamente mas a la derecha que el
pivote de la fila de encima.
Por ejemplo, entre las matrices:
A no es escalonada, mientras que B y C si lo son.
Dada una matriz escalonada E se define el RANGO de E, que representamos por
rg (E), como el número de filas no nulas de E.
En los ejemplos B y C de arriba se tiene rg (B) = rg(C) = 2, sin embargo, no
podemos decir que rg(A) = 3 ya que A no está escalonada. Otro ejemplo, las
matrices nulas tienen rango cero y la matriz identidad de orden n cumple rg (In) =
n.
La siguiente cuestión que abordaremos es la definición de rango para una matriz
cualquiera que no esté escalonada. La idea será la de transformar la matriz dada
en otra que sea escalonada mediante las llamadas transformaciones elementales
por filas que describimos a continuación.
Dada una matriz A cualquiera, las TRANSFORMACIONES ELEMENTALES por
filas de A son tres:
Intercambiar la posición de dos filas.
Multiplicar una fila por un número real distinto de cero.
Sustituir una fila por el resultado de sumarle a dicha fila otra fila que ha sido
previamente multiplicada por un número cualquiera.
Nota: Análogamente podríamos hacerlo todo por columnas; sin embargo, son las
transformaciones por filas las que son importantes en los sistemas de ecuaciones
lineales que estudiaremos después.
El siguiente resultado nos garantiza que siempre podemos transformar una matriz
cualquiera en otra escalonada.
Teorema
A partir de cualquier matriz A se puede llegar, mediante una cantidad finita de
transformaciones elementales, a una matriz escalonada E.
Veamos en un ejemplo cómo se hace. Obsérvese que, primero, hacemos que la
componente (1,1) de la matriz de partida sea igual a uno. Luego, se hace que el
resto de componentes de la primera columna sean cero. Después se pasa a la
componente (2,2), y así sucesivamente.
El teorema anterior nos permite hacer una definición importante:
Dada una matriz A cualquiera se define el RANGO de A y lo denotamos rg(A)
como el rango de cualquier matriz escalonada E equivalente con A (se demuestra
que este número no depende de la matriz escalonada E a la que se llegue). El
rango siempre es un número menor o igual que el número de filas y el número de
columnas de A. Además, el rango es cero si y sólo si A = 0. En nuestro ejemplo de
antes, el rango es 3.
2.5 CALCULO DE LA INVERSA DE UNA MATRIZ
Sabemos ya multiplicar matrices y hemos visto algunas de las propiedades de
esta operación. Recordemos, en primer lugar, que no siempre es posible efectuar
la multiplicación de dos matrices, y en segundo lugar, que aunque sea posible
hacer esta multiplicación, en general no es conmutativo, es decir A·B es distinto de
B*A.
En el caso particular de que tratemos con matrices cuadradas del mismo orden A
y B, es claro que podemos efectuar los productos A·B y B·A, que darán como
resultado otra matriz del mismo orden, aunque, como ya se ha dicho, las matrices
resultantes serán, en general, distintas.
Sabemos también que el elemento neutro del producto de matrices es la matriz
identidad In. Por analogía con el caso de los números reales, podemos
plantearnos la siguiente cuestión: Si tenemos un número real, por ejemplo, el 2,
podemos interesarnos en buscar el inverso del 2 para el producto, es decir un
número real x tal que 2·x = 1, el producto de 2 por x sea igual al elemento neutro,
el 1.
Evidentemente, en el caso de los números reales es bien fácil despejar x para
obtener, en nuestro caso, que x =12, es decir, el inverso de un número real es otro
número que multiplicado por ´el da el elemento neutro, el 1.
Todo número real, salvo el 0, tiene inverso.
Trasladando esto a las matrices, nos podemos plantear si dada una matriz
cuadrada A de orden n, cualquiera, existe su inversa X para el producto de
matrices, tal que A ・ X = In es decir, el producto de A por su inversa produce el
elemento neutro matricial, la matriz identidad In. Sin embargo, hay algunas
diferencias con respecto al caso de los números reales:
No podemos “despejar” la matriz X del modo X = In A, porque no hemos definido
la división de matrices.
No todas las matrices cuadradas no nulas tienen matriz “inversa” (sea lo que sea,
por analogía con los números).
Definamos, en primer lugar, el término de matriz inversa: Dada una matriz
cuadrada de orden n, A, se dice que A es invertible (o que posee inversa o que es
no singular o que es regular ), si existe otra matriz del mismo orden, denominada
matriz inversa de A y representada por A−1 y tal que: A * A−1 = In y A−1 * A = In
Si A no tiene inversa, se dice que es singular o no invertible.
Si una matriz tiene inversa, dicha matriz inversa es única (sólo hay una).
2.6 DEFINICIÓN DE DETERMINANTE DE UNA MATRIZ
El determinante de una matriz cuadrada es un número real cuya definición exacta
es bastante complicada. Por ello, definiremos primero el determinante de matrices
pequeñas, y estudiaremos métodos y técnicas para calcular determinantes en
general. Solamente se puede calcular el determinante a matrices cuadradas.
En cuanto a la notación, a veces el determinante se escribe con la palabra det, y
otras veces se indica sustituyendo los paréntesis de la matriz por barras verticales.
El determinante de una matriz determina si los sistemas son singulares o mal
condicionados. En otras palabras, sirve para determinar la existencia y la unicidad
de los resultados de los sistemas de ecuaciones lineales.
El determinante de una matriz es un número.
Un determinante con valor de cero indica que se tiene un sistema singular.
Un determinante con valor cercano a cero indica que se tiene un sistema mal
condicionado.
Un sistema singular es cuando en el sistema de ecuaciones se tiene a más de una
ecuación con el mismo valor de la pendiente. Por ejemplo, ecuaciones que
representan líneas paralelas o ecuaciones que coinciden en los mismos puntos de
graficación.
En un sistema mal condicionado es difícil identificar el punto exacto en que las
líneas de las ecuaciones se interceptan.
2.7 PROPIEDADES DE LOS DETERMINANTES
1.- |At|= |A| El determinante de una matriz A y el de su traspuesta At son iguales.
2.-|A|=0 Si: posee dos líneas iguales.
Todos los elementos de una línea son nulos
Los elementos de una línea son combinación lineal de las otras.
3.- Un determinante triangular es igual al producto de los elementos de la diagonal
principal.
4.- Si en un determinante se cambian entre si dos líneas paralelas su determinante
cambia de signo.
5.- Si a los elementos de una línea se le suman los elementos de otra paralela
multiplicados previamente por un número real el valor del determinante no varía.
6.- Si se multiplica un determinante por un número real, queda multiplicado por
dicho número cualquier línea, pero solo una.
7.- Si todos los elementos de una fila o columna están formados por dos
sumandos, dicho determinante se descompone en la suma de dos determinantes.
8.-|A•B| =|A|•|B| El determinante de un producto es igual al producto de los
determinantes.
2.8 INVERSA DE UNA MATRIZ CUADRADA A TRAVÉS DE LA ADJUNTA
Sea A una matriz de m x n. Entonces A es invertible si y solo si detA≠0. Si detA≠0,
entonces
Si detA≠0, entonces se demuestra que (1/detA)(adjA) es la inversa de A
multiplicada por A y obteniendo la matriz identidad:
Si AB=I,entonces B=A-1. Así, (1/detA)adjA=A-1
2.9 APLICACIONES DE MATRICES Y DETERMINANTES
Las matrices se utilizan en el contexto de las ciencias como elementos que sirven
para clasificar valores numéricos atendiendo a dos criterios o variables.
Ejemplo: Un importador de globos los importa de dos colores, naranja (N) y rojo
(R). Todos ellos se envasan en paquetes de a 2, 5 y 10 unidades, que se venden
al precio (en euros) indicado por la tabla siguiente:
sabiendo que en un año se venden el siguiente número de paquetes:
Resumirla información anterior en dos matrices A y B, de tamaño respectivo de
2x3 y 3x2 que recojan las ventas en un año (A) y los precios (B).
Nos piden que organicemos la información anterior en dos matrices de tamaño
concreto. Si nos fijamos en las tablas, es sencillo obtener las matrices:
Estas matrices se denominan matrices de información y simplemente recogen los
datos numéricos del problema en cuestión.
Otras matrices son las llamadas matrices de relación, que indican si ciertos
elementos están relacionados o no entre si. En general, la existencia de
relación se expresa con un 1 en la matriz y la ausencia de dicha relación se
expresa con un 0.
Estas matrices se utilizan cuando queremos trasladar la información dada por un
grafo y expresarla numéricamente.
En matemáticas, un grafo es una colección cualquiera de puntos conectados por
líneas. Existen muchos tipos de grafos. Entre ellos, podemos destacar:
Grafo simple: Es el grafo que no contiene ciclos, es decir, lineas que unan un
punto consigo mismo, ni lineas paralelas, es decir, lineas que conecten el mismo
par de puntos.
Grafo dirigido: Es el grafo que indica un sentido de recorrido de cada linea,
mediante una flecha.
Estos tipos de grafos pueden verse en la figura:
Relacionadas con los grafos se pueden definir algunas matrices. Entre todas ellas,
nosotros nos fijaremos en la llamada matriz de adyacencia, que es aquella
formada por ceros y unos exclusivamente, de tal forma que:
Un 1 en el lugar (i,j) expresa la posibilidad de ir desde el punto de la fila i hasta el
punto de la columna j mediante una linea que los una directamente.
Un 0 en el lugar (i,j) expresa la imposibilidad de ir del primer punto al segundo
mediante una linea que los una directamente.
La matriz de adyacencia del grafo de la figura anterior será:
Unidad 3
Sistemas de ecuaciones Lineales.
En matemáticas y álgebra lineal, un sistema de ecuaciones lineales, también
conocido como sistema lineal de ecuaciones o simplemente sistema lineal, es un
conjunto de ecuaciones lineales (es decir, un sistema de ecuaciones en donde
cada ecuación es de primer grado), definidas sobre un cuerpo o un anillo
conmutativo. Un ejemplo de sistema lineal de ecuaciones sería el siguiente:
El problema consiste en encontrar los valores desconocidos de las variables
x1, x2 y x3 que satisfacen las tres ecuaciones.
El problema de los sistemas lineales de ecuaciones es uno de los más antiguos de
la matemática y tiene una infinidad de aplicaciones, como en procesamiento digital
de señales, análisis estructural, estimación, predicción y más generalmente en
programación lineal así como en la aproximación de problemas no lineales de
análisis numérico.
3.1 Definición de sistemas de ecuaciones lineales.
En matemáticas y álgebra lineal, un sistema de ecuaciones lineales, también
conocido como sistema lineal de ecuaciones o simplemente sistema lineal, es un
conjunto de ecuaciones lineales (es decir, un sistema de ecuaciones en donde
cada ecuación es de primer grado), definidas sobre un cuerpo o un anillo
conmutativo. Un ejemplo de sistema lineal de ecuaciones sería el siguiente:
El problema consiste en encontrar los valores desconocidos de las variables x1, x2
y x3 que satisfacen las tres ecuaciones.
El problema de los sistemas lineales de ecuaciones es uno de los más antiguos de
la matemática y tiene una infinidad de aplicaciones, como en procesamiento digital
de señales, análisis estructural, estimación, predicción y más generalmente en
programación lineal, así como en la aproximación de problemas no lineales de
análisis numérico.
En general, un sistema con m ecuaciones lineales y n incógnitas puede ser escrito
en forma normal como:
Donde son las incógnitas y los números son los coeficientes del sistema
sobre el cuerpo . Es posible reescribir el sistema separando con
coeficientes con notación matricial:
Si representamos cada matriz con una única letra obtenemos:
Donde A es una matriz m por n, x es un vector columna de longitud n y b es otro
vector columna de longitud m. El sistema de eliminación de Gauss-Jordan se
aplica a este tipo de sistemas, sea cual sea el cuerpo del que provengan los
coeficientes.
3.2 Clasificación de los sistemas de ecuaciones lineales y tipos de solución.
= Clasificación =
Podemos clasificar los sistemas de ecuaciones lineales según su número de
soluciones de la siguiente forma:
Sistemas con una solución: Las ecuaciones del sistema son rectas secantes. Se
cortan en un punto (x, y) que es la solución del sistema
Sistemas sin solución: Las ecuaciones del sistema son rectas paralelas. No tienen
ningún punto en común, y por tanto no hay solución
Sistemas con infinitas soluciones: Las ecuaciones del sistema son rectas
coincidentes. Tienen todos los puntos en común, y por tanto todos ellos son
solución
Condiciones que deben cumplir las ecuaciones para que el sistema tenga una,
ninguna o infinitas soluciones:
Una solución: Los coeficientes de x e y de las dos ecuaciones no son
proporcionales.
Ejemplo:
Ninguna solución: Los coeficientes de x e y de una ecuación son proporcionales a
los de la otra, mientras que los términos independientes no lo son.
Ejemplo:
Infinitas soluciones: Los coeficientes de x e y, y el término independiente de una
ecuación, son proporcionales a los de la otra.
Ejemplo:
=Tipos de Solución=
=Sustitución=
El método de sustitución consiste en despejar en una de las ecuaciones cualquier
incógnita, preferiblemente la que tenga menor coeficiente, para, a continuación,
sustituirla en otra ecuación por su valor.
En caso de sistemas con más de dos incógnitas, la seleccionada debe ser
sustituida por su valor equivalente en todas las ecuaciones excepto en la que la
hemos despejado. En ese instante, tendremos un sistema con una ecuación y una
incógnita menos que el inicial, en el que podemos seguir aplicando este método
reiteradamente. Por ejemplo, supongamos que queremos resolver por sustitución
este sistema:
En la primera ecuación, seleccionamos la incógnita y por ser la de menor
coeficiente y que posiblemente nos facilite más las operaciones, y la despejamos,
obteniendo la siguiente ecuación.
El siguiente paso será sustituir cada ocurrencia de la incógnita y en la otra
ecuación, para así obtener una ecuación donde la única incógnita sea la x.
Al resolver la ecuación obtenemos el resultado x=5, y si ahora sustituimos esta
incógnita por su valor en alguna de las ecuaciones originales obtendremos y=7,
con lo que el sistema queda ya resuelto.
=Igualación=
El método de igualación se puede entender como un caso particular del método de
sustitución en el que se despeja la misma incógnita en dos ecuaciones y a
continuación se igualan entre sí la parte derecha de ambas ecuaciones.
Tomando el mismo sistema utilizado como ejemplo para el método de sustitución,
si despejamos la incógnita en ambas ecuaciones nos queda de la siguiente
manera:
Como se puede observar, ambas ecuaciones comparten la misma parte izquierda,
por lo que podemos afirmar que las partes derechas también son iguales entre sí.
Una vez obtenido el valor de la incógnita x, se substituye su valor en una de las
ecuaciones originales, y se obtiene el valor de la y.
La forma más fácil de tener el método de sustitución es realizando un cambio para
despejar x después de averiguar el valor de la y.
=Reducción=
Este método suele emplearse mayoritariamente en los sistemas lineales, siendo
pocos los casos en que se utiliza para resolver sistemas no lineales. El
procedimiento, diseñado para sistemas con dos ecuaciones e incógnitas, consiste
en transformar una de las ecuaciones (generalmente, mediante productos), de
manera que obtengamos dos ecuaciones en la que una misma incógnita aparezca
con el mismo coeficiente y distinto signo. A continuación, se suman ambas
ecuaciones produciéndose así la reducción o cancelación de dicha incógnita,
obteniendo así una ecuación con una sola incógnita, donde el método de
resolución es simple. Por ejemplo, en el sistema:
no tenemos más que multiplicar la primera ecuación por -2 para poder cancelar la
incógnita y. Al multiplicar, dicha ecuación nos queda así:
Si sumamos esta ecuación a la segunda del sistema original, obtenemos una
nueva ecuación donde la incógnita y ha sido reducida y que, en este caso, nos da
directamente el valor de la incógnita x:
El siguiente paso consiste únicamente en sustituir el valor de la incógnita x en
cualquiera de las ecuaciones donde aparecían ambas incógnitas, y obtener así
que el valor de y es igual a:
=Método Gráfico=
Consiste en construir la gráfica de cada una de las ecuaciones del sistema. El
método (manualmente aplicado) solo resulta eficiente en el plano cartesiano, es
decir para un espacio de dimensión 2.
El proceso de resolución de un sistema de ecuaciones mediante el método gráfico
se resuelve en los siguientes pasos:
Se despeja la incógnita (y) en ambas ecuaciones.
Se construye para cada una de las dos ecuaciones de primer grado obteniendo la
tabla de valores correspondientes.
Se representan gráficamente ambas rectas en los ejes coordenados. En este
último paso hay tres posibilidades:
Si ambas rectas se cortan, las coordenadas del punto de corte son los únicos
valores de las incógnitas (x,y). "Sistema compatible determinado".
Si ambas rectas son coincidentes, el sistema tiene infinitas soluciones que son las
respectivas coordenadas de todos los puntos de esa recta en la que coinciden
ambas. «Sistema compatible indeterminado».
Si ambas rectas son paralelas, el sistema no tiene solución.
=Método de Gauss=
La eliminación de Gauss-Jordan, más conocida como método de Gauss, es un
método aplicable únicamente a los sistemas lineales de ecuaciones, y consistente
en triangular la matriz aumentada del sistema mediante transformaciones
elementales, hasta obtener ecuaciones de una sola incógnita, cuyo valor será
igual al coeficiente situado en la misma fila de la matriz. Este procedimiento es
similar al anterior de reducción, pero ejecutado de manera reiterada y siguiendo un
cierto orden algorítmico.
El Método de Gauss consiste en convertir un sistema normal de 3 ecuaciones con
3 incógnitas en uno escalonado, en la que la primera ecuación tiene 3 incógnitas,
la segunda ecuación tiene 2 incógnitas, y la tercera ecuación tiene 1 incógnita. De
esta forma será fácil a partir de la última ecuación y subiendo, calcular el valor de
las tres incógnitas.
En primer lugar, reducimos la incógnita x, sumando a la segunda fila, la primera
multiplicada por 2/3, y a la tercera, la primera fila. La matriz queda así:
El siguiente paso consiste en eliminar la incógnita y en la primera y tercera fila,
para lo cual les sumamos la segunda multiplicada por -2 y por -4, respectivamente.
Por último, eliminamos la z, tanto de la primera como de la segunda fila,
sumándoles la tercera multiplicada por -2 y por 1/2, respectivamente:
Llegados a este punto podemos resolver directamente las ecuaciones que se nos
plantean:
O, si lo preferimos, podemos multiplicar las tres filas de la matriz por: 1/2, 2 y -
1 respectivamente, y obtener así automáticamente los valores de las incógnitas en
la última columna.
Pongamos un ejemplo del cálculo de un sistema de ecuaciones por el método de
Gauss:Se reúnen 30 personas entre hombres, mujeres y niños. Se sabe que entre
los hombres y el triple de mujeres exceden en 20 el doble de los niños. También
se sabe que entre hombres y mujeres se duplican al número de niños. Plantear y
resolver el sistema de ecuaciones x=número de hombres; y=número de mujeres; y
z=número de niños. Se reúnen 30 personas entre hombres, mujeres y niños:
x+y+z=30. Se sabe que entre los hombres y el triple de mujeres exceden en 20 el
doble de los niños: x+3y=2z+20. También se sabe que entre hombres y mujeres
se duplican al número de niños: x+y=2z.
Agrupando las tres ecuaciones tenemos el sistema, que ordenado resulta:
Aplicamos Gauss, restando la primera ecuación a las dos siguientes:
En este caso en la tercera ecuación se ha eliminado la y, por lo que no es
necesario hacer más operaciones. Por lo tanto, obtenemos que z = 10 de la
tercera ecuación:
Sustituyendo z en la segunda ecuación obtenemos que y = 10:
Sustituyendo z é y en la primera ecuación obtenemos x = 10.
Con lo que hemos obtenido el resultado del sistema:
=Método de Cramer=
La regla de Cramer da una solución para sistemas compatibles determinados en
términos de determinantes y adjuntos dada por:
Donde Aj es la matriz resultante de remplazar la j-ésima columna de A por el
vector columna b. Para un sistema de dos ecuaciones y dos incógnitas:
La regla de Cramer da la siguiente solución:
Nota: Cuando en la determinante original det(A) el resultado es 0, el sistema indica
múltiples o sin coincidencia.
3.3 Interpretación geométrica de las soluciones.
Cada ecuación representa un plano en el espacio tridimensional. Luego se trata de
estudiar la posición relativa de tres planos en el espacio. Las soluciones del
sistema son geométricamente los puntos de intersección de los tres planos, los
casos son:
=Un punto único. Sistema compatible determinado. Los tres planos se cortan en P.
=Una recta. Son soluciones todos los puntos representativos de la recta común.
Sistema compatible indeterminado con un grado de libertad. Los planos se cortan
en r.
=Un plano. Los planos son coincidentes. El sistema es compatible indeterminado
con dos grados de libertad.
=Ningún punto. El sistema es incompatible. Esta situación se presenta
geométricamente de distintas maneras. Para estudiar las posiciones relativas de
los planos hay que tomarlos de dos en dos.
=Se pueden presentar varios casos: Que los planos sean paralelos:
3.4 Métodos de solución de un sistema de ecuaciones lineales: Gauss,
Gauss-Jordan, inversa de una matriz y regla de Cramer.
MÉTODO DE RESOLUCIÓN DE GAUSS-JORDAN
Es el método de resolución de sistemas de ecuaciones lineales, que consiste en
llegar a un sistema "escalonado" transformando la matriz ampliada en una matriz
escalonada por filas. El método de Gauss es una generalización del método de
reducción, que utilizamos para eliminar una incógnita en los sistemas de dos
ecuaciones con dos incógnitas. Consiste en la aplicación sucesiva del método de
reducción, utilizando los criterios de equivalencia de sistemas, para transformar la
matriz ampliada con los términos independientes ( A* ) en una matriz triangular, de
modo que cada fila (ecuación) tenga una incógnita menos que la inmediatamente
anterior. Se obtiene así un sistema, que llamaremos escalonado, tal que la última
ecuación tiene una única incógnita, la penúltima dos incógnitas, la antepenúltima
tres incógnitas, ..., y la primera todas las incógnitas.
El siguiente esquema muestra cómo podemos resolver un sistema de ecuaciones
lineales aplicando este método.
Partimos, inicialmente, de un sistema de n ecuaciones lineales con n incógnitas,
compatible determinado:
En primer lugar, aplicando sucesivamente el método de reducción, eliminamos en
todas las ecuaciones, excepto en la primera, la incógnita x1, obteniéndose un
sistema equivalente:
En segundo lugar, aplicando nuevamente el método de reducción de forma
sucesiva, eliminamos en todas las ecuaciones, excepto en las dos primeras, la
incógnita x2, obteniéndose un sistema equivalente:
Para resolverlo despejamos, en primer lugar, la única incógnita de la última
ecuación. Luego sustituimos ésta en la penúltima ecuación y despejamos la otra
incógnita. Posteriormente, sustituimos dos de las tres incógnitas de la
antepenúltima ecuación por sus valores y despejamos la que queda, y así
sucesivamente hasta llegar a la primera ecuación.
Las transformaciones que podemos realizar en dicha matriz para transformar el
sistema inicial en otro equivalente son las siguientes:
Multiplicar o dividir una fila por un número real distinto de cero. Sumarle o restarle
a una fila otra fila.
Sumarle a una fila otra fila multiplicada por un número distinto de cero. Cambiar el
orden de las filas.
Cambiar el orden de las columnas que corresponden a las incógnitas del sistema,
teniendo en cuenta los cambios realizados a la hora de escribir el nuevo sistema
equivalente. Es decir: si, por ejemplo, la 2ª columna corresponde a la incógnita y y
la tercera a la incógnita z, y cambiamos el orden de las columnas, ahora la 2ª
columna corresponde a la incógnita z y la tercera a la incógnita y.
Eliminar filas proporcionales o que sean combinación lineal de otras. Eliminar filas
nulas (0 0 0 ... 0).
Después de realizar las transformaciones que se consideren pertinentes, se
obtendrá un sistema escalonado. Suponiendo que hubiésemos eliminado, si las
hubiera, las filas nulas (0 0 0 ... 0), que corresponden a ecuaciones del tipo 0 = 0,
el sistema equivalente tendría ahora k ecuaciones lineales con n incógnitas.
Analizando el sistema resultante, podemos efectuar su discusión del siguiente
modo:
Si alguna de las ecuaciones es del tipo 0 = b (siendo b distinto de cero), el sistema
es incompatible y no tiene solución.
Si no hay ecuaciones del tipo 0 = b, y además k = n, es decir, el número de
ecuaciones del sistema equivalente es igual al número de incógnitas, el sistema es
compatible determinado y, por lo tanto, tiene una única solución.
Si no hay ecuaciones del tipo 0 = b y k < n, es decir, el número de ecuaciones es
menor que el número de incógnitas, el sistema es compatible indeterminado y, en
consecuencia, tiene infinitas soluciones. En este caso, tenemos que separar las
incógnitas principales de las no principales.
Pero, ¿cuáles son las incógnitas principales? Se puede dar el siguiente criterio: Si
el sistema es escalonado y tiene k ecuaciones, las k primeras incógnitas serán las
principales y las n - k restantes serán las no principales que pasaremos al
segundo miembro como parámetros.
MÉTODO DE RESOLUCIÓN DE CRAMER. REGLA DE CRAMER
La regla de Cramer utiliza las propiedades de las matrices y sus determinantes
para despejar, por separado, una cualquiera de las incógnitas de un sistema de
ecuaciones lineales.
REGLA DE CRAMER
Un sistema de ecuaciones lineales recibe el nombre de sistema de Cramer cuando
se cumplen las dos condiciones siguientes:
El número de ecuaciones es igual al número de incógnitas.
El determinante de la matriz de los coeficientes (matriz del sistema) es distinto de
cero (det ( A ) ≠ 0)
Un sistema de Cramer es, por definición, compatible determinado, puesto que se
cumple que rango (A) = rango (A*) = n (nº de incógnitas).
Consideremos un sistema de Cramer, es decir, un sistema de n ecuaciones
lineales con n incógnitas, cuya expresión general es la siguiente:
Sean A la matriz del sistema, entonces det (A) ≠0.
Llamaremos matriz asociada a la incógnita xi y la designaremos por Ai a la matriz
que se obtiene al sustituir en la matriz del sistema la columna i por la matriz
columna de los términos independientes. Es decir:
Todos los sistemas de Cramer son compatibles determinados. El valor de cada
incógnita se obtiene dividiendo el determinante de la matriz asociada a dicha
incógnita por la matriz del sistema (matriz de los coeficientes de las incógnitas).
¿Se puede aplicar la regla de Cramer para resolver sistemas de ecuaciones
lineales compatibles que tengan más ecuaciones que incógnitas? La respuesta es
afirmativa. Basta con obtener un sistema equivalente a la inicial eliminando las
ecuaciones superfluas o dependientes (proporcionales, nulas o que sean
combinación lineal de otras).
El procedimiento a seguir es el siguiente: Supongamos que tenemos un sistema
de m ecuaciones lineales con n incógnitas, siendo m > n y tal que: rango (A) =
rango (A*) = n. Por lo tanto, sobran m - n ecuaciones. Para averiguar cuáles son
las ecuaciones de las que podemos prescindir, basta encontrar en la matriz de los
coeficientes ( A ) un menor de orden n distinto de cero, por ejemplo, el que
utilizamos para averiguar el rango de la matriz A.
Las filas que intervienen en este menor son las que corresponden a las
ecuaciones principales. Las restantes ecuaciones las podemos suprimir.
Ejemplo: Sea el sistema de ecuaciones lineales formado por dos ecuaciones con
dos incógnitas:
Encontrar el valor de x e y mediante la regla de Cramer.
Empezaremos con el primer paso, que consiste en hallar la matriz ampliada A b
asociada al sistema de ecuaciones lineales:
El segundo paso es calcular el determinante de A. Así pues:
Y el tercero y último paso consiste en calcular las incógnitas:
MÉTODO DE LA MATRIZ INVERSA
Consideremos un sistema de n ecuaciones lineales con n incógnitas, cuya
expresión general es la siguiente:
Hemos visto que este sistema se puede escribir en forma matricial del siguiente
modo: A X = [Link] matriz A se llama matriz del sistema, es de dimensión n x n y
sus elementos son los coeficientes de las incógnitas.
La matriz X es una matriz columna, de dimensión n x 1, formada por las incógnitas
del sistema. Por último, la matriz B es otra matriz columna, de dimensión n x 1,
formada por los términos independientes. Es decir:
Si el determinante de la matriz A es distinto de cero (det (A) ≠ 0 ), la matriz A tiene
inversa ( A-1 ). Por lo tanto, podemos calcular la matriz de las incógnitas X del
siguiente modo:
Es decir, para calcular la matriz columna de las incógnitas ( X ), multiplicamos la
inversa de la matriz A ( A-1 ) por la matriz columna de los términos
independientes, obteniéndose otra matriz columna de la misma dimensión que X.
¿Se puede aplicar el método de la matriz inversa para resolver sistemas de
ecuaciones lineales compatibles que tengan más ecuaciones que incógnitas? La
respuesta es afirmativa. Basta con obtener un sistema equivalente a la inicial
eliminando las ecuaciones superfluas o dependientes (proporcionales, nulas o que
sean combinación lineal de otras).
El procedimiento a seguir es el siguiente: Supongamos que tenemos un sistema
de m ecuaciones lineales con n incógnitas, siendo m > n y tal que: rango (A) =
rango (A*) = n. Por lo tanto, sobran m - n ecuaciones. Para averiguar cuáles son
las ecuaciones de las que podemos prescindir, basta encontrar en la matriz de los
coeficientes ( A ) un menor de orden n distinto de cero, por ejemplo, el que
utilizamos para averiguar el rango de la matriz A. Las filas que intervienen en este
menor son las que corresponden a las ecuaciones principales. Las restantes
ecuaciones las podemos suprimir.
¿Se puede aplicar el método de la matriz inversa para resolver sistemas de
ecuaciones lineales compatibles indeterminados? La respuesta es también
afirmativa. El procedimiento a seguir es el siguiente: Supongamos que tenemos un
sistema de m ecuaciones lineales con n incógnitas, tal que: rango (A) = rango (A*)
= k < n. Por lo tanto, sobran m - k ecuaciones y, además, hay n - k incógnitas no
principales. Para averiguar cuáles son las ecuaciones de las que podemos
prescindir, y cuáles son las incógnitas no principales, basta encontrar en la matriz
de los coeficientes ( A ) un menor de orden k distinto de cero, por ejemplo, el que
utilizamos para averiguar el rango de la matriz A. Las filas que intervienen en este
menor son las que corresponden a las ecuaciones principales o independientes.
Las restantes ecuaciones las podemos suprimir. Las columnas que figuran en
dicho menor corresponden a las incógnitas principales. Las incógnitas no
principales las pasamos al otro miembro y pasan a formar un único término junto
con el término independiente. Se obtiene, de este modo, un sistema de k
ecuaciones lineales con k incógnitas, cuyas soluciones van a depender de n - k
parámetros (correspondientes a las incógnitas no principales).
3.5 Aplicaciones.
=Fracciones parciales =
Una técnica muy conveniente utilizada en algunas tareas matemáticas es aquella
conocida como fracciones idea principal consiste en cambiar la forma que puede
ser expresado un cociente entre polinomios a otra forma más conveniente para
cierto tipo de cálculo.
Ejemplo 4.1 Determine los valores de las constantes a y b para que satisfagan:
SOLUCIÓN
Ejemplo: (Forma dudosa) Determine los valores de las constantes a y b para que
satisfagan:
SOLUCIÓN
= Determinación de curvas =
Un problema común en diferentes áreas es la determinación de curvas. Es decir,
el problema de encontrar la función que pasa por un conjunto de puntos.
Usualmente se conoce la naturaleza de la función, es decir, se conoce la forma
que debe tener la función. Por ejemplo, línea recta, parábola o exponencial etc. Lo
que se hace para resolver este tipo de problemas es describir la forma más
general de la función mediante parámetros constantes. Y posteriormente se
determinan estos parámetros haciendo pasar la función por los puntos conocidos.
Ejemplo: Determine la función cuadrática que pasa por los puntos P (1, 4), Q(−1,
2), y R(2, 3).
Solución
La forma más general de una cuadrática es: f (x) = a x2 + b x + c donde los
coeficientes a, b, y c son constantes numéricas. El problema consiste en
determinar estos coeficientes.
Así pues, los parámetros a, b, y c se vuelven ahora las incógnitas. Y para poderlas
determinar requerimos de ecuaciones o igualdades que deben satisfacer. Para
determinar estas ecuaciones debemos usar los puntos.
Para que la función pase por el punto P (1, 4) se debe cumplir que f (x = 1) = 4, es
decir, se debe cumplir: a (1)2 + b (1) + c = 4
es decir, se debe cumplir: a + b + c =4
Procediendo de igual manera con el punto Q(−1, 2): formulamos la ecuación: a − b
+ c =2 y para R(2, 3): 4a + 2b + c = 3.
Resumiendo para que la función f (x) = a x2 + b x + c pase por los puntos P , Q, y
R deben cumplirse las ecuaciones:
a+b+c=4a−b+c=2
4a + 2b + c = 3
La solución a este sistema es: a = 2/3, b = 1, y c =11/3
La misma situación presentada en el problema de las fracciones parciales que
originaba un sistema inconsistente, se puede presentar en la determinación de
funciones. Y la conclusión es similar: si el sistema originado es inconsistente lo
que se concluye es que no existe una función con esa forma general que pase
exactamente por los puntos dados.
=Balanceo de Reacciones Químicas=
Una aplicación sencilla de los sistemas de ecuaciones se da en el balanceo de
reacciones químicas. La
problemática consiste en determinar el número entero de moléculas que
intervienen en una reacción química
cuidando siempre que el número de átomos de cada sustancia se preserve.
Ejemplo Balancee la reacción química: aCH4 + bO2=cCO2 + dH2O
Solución: Para determinar los coeficientes a, b, c, y d que representan el número
de moléculas de las sustancias en la reacción debemos igualar el numero
de átomos en cada miembro:
Por los átomos de carbono: a = c. Por los átomos de oxígeno: 2 b = 2 c + d. Por
los átomos de hidrógeno: 4 a = 2 d
Este sistema es consistente y origina infinitas soluciones. La fórmula general para
las soluciones queda:
a = 1/2 d
b=d
c = 1/2 d
El valor más pequeño de d que hace que los números de moléculas sean enteros
positivos es d = 2: a = 1, b = 2, c = 1, y d = 2
=Aplicaciones a Manufactura=
Ejemplo: Patito computers fabrica tres modelos de computadoras personales:
cañón, clon, y lenta-pero-segura. Para armar una computadora modelo cañón
necesita 12 horas de ensamblado, 2.5 para probarla, y 2 más para instalar sus
programas. Para una clon requiere 10 horas de ensamblado, 2 para probarla, y 2
para instalar programas. Y por ´ultimo, para una lenta-pero-segura requiere 6 para
ensamblado, 1.5 para probarla, y 1.5 para instalar programas. Si la fábrica dispone
en horas por mes de 556 para ensamble, 120 para pruebas, y 103 horas para
instalación de programas, ¿cuántas computadoras se pueden producir por mes?
Solución
En nuestro caso las incógnitas el número de cada tipo de computadora a producir:
x = número de computadoras cañón
y = número de computadoras clon
z = número de computadoras lenta-pero-segura
Para determinar las ecuaciones debemos utilizar los tiempos de ensamblado,
pruebas, e instalación de programas.
Ensamblado: 556(total) = 12 x(cañón) + 10 y(clon) + 6 z(lenta) Pruebas: 120(total)
= 2.5 x(cañón) + 2 y(clon) + 1.5 z(lenta)
Instalación de programas: 103(total) = 2 x(cañón) + 2 y(clon) + 1.5 z(lenta) Al
resolver este sistema obtenemos: x = 34, y = 4, z = 18
Dado lo común de las aplicaciones hacia el área de manufactura, existe una forma
simple de construir la matriz del sistema de ecuaciones que en general se trabaja
como una tabla:
En la última columna aparecen los recursos: un renglón para cada tipo de recursos
y en cuya posición final se pone el total de recursos disponibles.
En las primeras columnas se colocan los objetos o modelos a ser ensamblados o
construidos: en cada posición se coloca el total de recursos que consume en
forma unitaria cada tipo de objeto.
Unidad 4
4.1 DEFINICION DE ESPACIO VECTORIAL
Espacio vectorial real.
Un espacio vectorial real V es un conjunto de objetos, denominados vectores,
junto con dos operaciones binarias llamadas suma y multiplicación por un
escalar y que satisfacen los diez axiomas enumerados a continuación.
Notación. Si “x” y “y” están en V y si a es un número real, entonces la suma se
escribe como
“x + y” y el producto escalar de a y x como ax.
Antes de presentar la lista de las propiedades que satisfacen los vectores en un
espacio vectorial deben mencionarse dos asuntos de importancia. En primer lugar,
mientras que puede ser útil pensar en R2 o R3 al manejar un espacio vectorial,
con frecuencia ocurre que el espacio vectorial parece ser muy diferente a estos
cómodos espacios (en breve tocaremos este tema). En segunda instancia, la
definición 1 ofrece una definición de un espacio vectorial real. La palabra “real”
significa que los escalares que se usan son números reales. Sería igualmente
sencillo definir un espacio vectorial complejo utilizando números complejos en
lugar de reales. Este libro está dedicado principalmente a espacios vectoriales
reales, pero las generalizaciones a otros conjuntos de escalares presentan muy
poca dificultad.
Axiomas de un espacio vectorial.
1- Si X pertenece a V y Y pertenece a V, entonces X+Y pertenece a V.
2- Para todo X, Y y Z en V, (x+y)+z = x(y+z).
3- Existe un vector |0 pertenece V tal que para todo X pertenece a V,
X+0=0+X=X.
4- Si x pertenece a V, existe un vector –x en V tal que x+(-x)=0.
5- Si X y Y están en V, entonces x+y=y+x.
6- Si x pertenece a V y a es un escalar, entonces ax pertenece a V.
7- Si X y Y están en V y a es un ecalar, entonces a(x+y)= ax + ay
8- Si X pertenece a V y a y b son escalares, entonces (a+b) x = ax+ by.
9- Si X pertenece a V y a y b son escalares, entonces a(bx) = (ab)x.
10- Para cada vector X pertenece a V, 1x = x.
4.2 DEFINICIÓN DE SUB-ESPACIO VECTORIAL Y SUS PROPIEDADES
Sea H un subconjunto no vacío de un espacio vectorial V y suponga que H es en
sí un espacio vectorial bajo las operaciones de suma y multiplicación por un
escalar definidas en V. Entonces se dice que H es un sub espacio de V. Existen
múltiples ejemplos de sub espacio, sin embargo, en primer lugar, se demostrará
un resultado que hace relativamente sencillo determinar si un subconjunto de V es
en realidad sub espacio de V
Teorema de sub espacio
Un subconjunto no vacío de H de un espacio vectorial V es un sub espacio de V si
se cumplen las dos reglas de cerradura:
Reglas de cerradura para ver si un subconjunto no vació es un sub espacio
i) Si x € H y y € H, entonces x + y € H.
ii) Si x € H, entonces αx € H para todo escalar α.
Es obvio que, si H es un espacio vectorial, entonces las dos reglas de cerradura
se deberán cumplir. De lo contrario, para demostrar que es un espacio vectorial,
se deberá demostrar que los axiomas i) a x) de la definición cumplen bajo las
operaciones de suma de vectores y multiplicación por un escalar definidas en V.
Las dos operaciones de cerradura [axiomas i) y iv)] se cumplen por hipótesis,
como los vectores en H son también vectores en V, las identidades asociativa,
conmutativa, distributiva y multiplicativa [axiomas ii), v), vii), viii), ix) y x)] se
cumplen.
Este teorema demuestra que para probar si H es o no es un sub espacio de V, es
suficiente verificar que:
x + y y αX están en H cuando x y y están en H y α es un escalar.
PROPIEDADES DE SUB ESPACIO VECTORIAL
v 1). El vector cero de V está en H.2
v 2). H es cerrado bajo la suma de vectores. Esto es, para cada u y v en
H, la suma u + v está en H.
v 3). H es cerrado bajo la multiplicación por escalares. Esto es, para cada
u en H y cada escalar c, el vector cu está en H.
4.3 Combinación lineal Dependencia e Independencia lineal
Una combinación lineal de dos o más vectores es el vector que se obtiene al
sumar esos vectores multiplicados por escalares.
Cualquier vector se puede poner como combinación lineal de otros que tengan
distinta dirección.
Esta combinación lineal es única.
Sean v1,v2,…,vn vectores en un espacio vectorial V. Entonces cualquier vector de
la forma:
α1v1+α2v2+…+αnvn
donde α1v1+α2v2+…+αnvn son escalares se denomina combinación lineal de v1,v2,
…,vn.
Todo vector V = (a, b, c) en R3 se puede expresar como
i = (1,0,0);
j = (0,1,0);
k =(0,0,1)
V = (a, b, c) = a(i) + b(j) + c(k)
Entonces se dice que V es una combinación lineal de los 3 vectores i,j,k.
Los vectores son linealmente independientes si tienen distinta dirección y sus
componentes no son proporcionales.
Un conjunto de vectores {v1,v2,…,vk} es un espacio vectorial V es linealmente
dependiente si existen escalares c1,c2,…,ck, al menos uno de los cuales no es
cero, tales que:
c1v1+c2v2+…+ckvk=0
Si los vectores no son linealmente dependientes, se dice que son linealmente
independientes.
Criterios de Independencia Lineal
Sean u1, u2, …,uk k vectores en Rn y A la matriz que tiene como columnas a estos
vectores, los vectores son linealmente independientes si el sistema Ax = 0 tiene
únicamente solución trivial.
Los vectores son linealmente dependientes si el sistema Ax=0 tiene soluciones no
triviales (solución múltiple).
Si k=n
Los vectores son linealmente independientes si A es invertible
Si k>n
Los vectores son linealmente dependientes.
Dos vectores en un espacio vectorial son linealmente dependientes si uno de ellos
es múltiplo escalar del otro.
Un conjunto de vectores linealmente independientes en n contiene a lo más n
vectores.
Tres vectores en 3 son linealmente dependientes si y sólo si son coplanares, esto
es, que están en un mismo plano.
Teoremas
1. Cualquier conjunto que contenga al vector 0 es linealmente dependiente.
2. Cualquier conjunto que contenga un único vector diferente de cero, v ≠0, es
linealmente independiente.
3. Cualquier conjunto formado por dos vectores diferentes de cero, S = {v 1, v2},
donde v1 ≠ 0, v2 ≠ 0, es linealmente dependiente si, y sólo si, uno de los
vectores es múltiplo escalar del otro.
4. Cualquier conjunto que contenga un subconjunto linealmente dependiente
es linealmente dependiente.
5. Cualquier subconjunto de un conjunto linealmente independiente es
linealmente independiente.
4.4 BASE Y DIMENSIÓN DE UN ESPACIO VECTORIAL, CAMBIO DE BASE
Una combinación lineal de dos o más vectores es el vector que se obtiene al
sumar esos vectores multiplicados por escalares.
Cualquier vector se puede poner como combinación lineal de otros que tengan
distinta dirección.
Esta combinación lineal es única.
Sean v1,v2,…,vn vectores en un espacio vectorial V. Entonces cualquier vector de
la forma:
α1v1+α2v2+…+αnvn
donde α1v1+α2v2+…+αnvn son escalares se denomina combinación lineal de
v1,v2,…,vn.
Todo vector V = (a, b, c) en R3 se puede expresar como
i = (1,0,0); j = (0,1,0); k =(0,0,1)
V = (a, b, c) = a(i) + b(j) + c(k)
Entonces se dice que V es una combinación lineal de los 3 vectores i,j,k.
Los vectores son linealmente independientes si tienen distinta dirección y sus
componentes no son proporcionales.
Un conjunto de vectores {v1,v2,…,vk} es un espacio vectorial V es linealmente
dependiente si existen escalares c1,c2,…,ck, al menos uno de los cuales no es
cero, tales que:
c1v1+c2v2+…+ckvk=0
Si los vectores no son linealmente dependientes, se dice que son linealmente
independientes.
Criterios de Independencia Lineal
Sean u1, u2, …,uk k vectores en Rn y A la matriz que tiene como columnas a
estos vectores, los vectores son linealmente independientes si el sistema Ax = 0
tiene únicamente solución trivial.
Los vectores son linealmente dependientes si el sistema Ax=0 tiene soluciones no
triviales (solución múltiple).
Si k=n
Los vectores son linealmente independientes si A es invertible
Si k>n Los vectores son linealmente dependientes.
Dos vectores en un espacio vectorial son linealmente dependientes si uno de ellos
es múltiplo escalar del otro.
Un conjunto de vectores linealmente independientes en n contiene a lo más n
vectores.
Tres vectores en 3 son linealmente dependientes si y sólo si son coplanares, esto
es, que están en un mismo plano.
Teoremas
1. Cualquier conjunto que contenga al vector 0 es linealmente dependiente.
2. Cualquier conjunto que contenga un único vector diferente de cero, v ≠0, es
linealmente independiente.
3. Cualquier conjunto formado por dos vectores diferentes de cero, S = {v1,
v2}, donde v1 ≠ 0, v2 ≠ 0, es linealmente dependiente si, y sólo si, uno de
los vectores es múltiplo escalar del otro.
4. Cualquier conjunto que contenga un subconjunto linealmente dependiente
es linealmente dependiente.
5. Cualquier subconjunto de un conjunto linealmente independiente es
linealmente independiente.
4.5 Espacio vectorial con producto interno
Producto Interno:
Un producto interno sobre un espacio vectorial V es una operación que asigna a
cada par de vectores u y v en V un número real <u, v>.
Un producto interior sobre V es una función que asocia un número real ‹u, v› con
cada par de vectores u y v cumple los siguientes axiomas:
Propiedades:
i. (v, v) ≥ 0
ii. (v, v) = 0 si y sólo si v = 0.
iii, (u, v +w) = (u, v)+ (u, w)
iv. (u + v, w) = (u, w)+(v, w)
v. (u, v) = (v, u)
vi. (αu, v) = α(u, v)
vii. (u, αv) = α(u, v)
Espacios con producto interior:
El producto interior euclidiano es solo uno más de los productos internos que se
tiene que definir en Rn Para distinguir entre el producto interno normal y otros
posibles productos internos se usa la siguiente notación.
u ●v = producto punto (producto interior euclidiano para Rn)
‹u, v› = producto interno general para espacio vectorial V.
Propiedades de los productos interiores:
1. ‹0, v› = ‹v, 0› = 0
2. ‹u + v, w› = ‹u, w› + ‹v, w›
3. ‹u, cv› = c‹u, v›.
Un espacio vectorial con producto interno se denomina espacio con producto
interno.
4.6 cambio de base, base ortonormal, proceso de ortonormalización Gram-
Schmidt.
Cambio de base
El cambio de base consiste en conocidas las coordenadas de un vector respecto a
una base B, encontrar las coordenadas de dicho vector con respecto a otra
base B’.
TEOREMA (La inversa de la matriz de transición). Si P es la matriz de transición
de una base B a una base B’ en , entonces Pes invertible y la matriz de transición
de B’a B es .
TEOREMA (Matriz de transición de una base B a una base B’).
Seanydos bases de Rn, entonces la matriz de transición P-1 de B a B’ puede
determinarse mediante eliminación de Gauss – Jordan en la matriz como se
muestra a continuación.
En la matriz B’ representa la matriz que tiene por columnas las componentes de
los vectores de la base B’ respectivamente, de forma similar B representa la matriz
que tiene por columnas las componentes de los vectores de la base B
respectivamente.
Base ortonormal
En álgebra lineal, una base ortonormal de un espacio prehilbertiano V (es decir,
un espacio vectorial con producto interno) o, en particular, de un espacio de
Hilbert H, es un conjunto de elementos cuyo span es denso en el espacio, en el
que los elementos son mutuamente ortogonales y normales, es decir, de magnitud
unitaria. Una base ortogonal satisface las mismas condiciones, salvo la de
magnitud unitaria; es muy sencillo transformar una base ortogonal en una base
ortonormal mediante el producto por un escalar apropiado y de hecho, esta es la
forma habitual en la que se obtiene una base ortonormal: por medio de una base
ortogonal.
Así, una base ortonormal es una base ortogonal, en la cual la norma de cada
elemento que la compone es unitaria.
Estos conceptos son importantes tanto para espacios de dimensión finita como de
dimensión infinita. Para espacios de dimensión finita, la condición de span denso
es la misma que la de 'span', como se usa en álgebra lineal.
Una base ortonormal por lo general no es una "base", es decir, en general no es
posible escribir a cada elemento del espacio como una combinación lineal de un
número finito de elementos de la base ortonormal. En el caso de dimensión
infinita, esta distinción cobra importancia: la definición dada requiere solo que el
span de una base ortonormal sea densa en el espacio vectorial, y no que iguale al
espacio entero.
Una base ortonormal de un espacio vectorial V no tiene sentido si el espacio no
posee un producto interno. Un Espacio de Bambach no tendrá una base
ortonormal a no ser que sea un espacio de Hilbert.