Sistemas de Ecuaciones Lineales
Sistemas de Ecuaciones Lineales
a11 p1
a12 a13
q1
a a 22 a 23
21 p 2 = q 2
a31a32 p3 a33
q3
A p = q
Básicamente este método tiene el objetivo de convertir la matriz A en una
matriz triangular, cuyos elementos inferiores son ceros; para ello hay que multiplicar
convenientemente una fila por un elemento y sumarla a otra.
Como primer paso, se remplaza la segunda ecuación con lo que resulte de
sumarle la primera ecuación multiplicada por (-a21/a11), con lo que se obtiene un 0 en
la posición de a21. Similarmente se sustituye la tercera ecuación con el resultado de
sumarle la primera ecuación multiplicada por (-a31/a11).
Esto da lugar al nuevo sistema:
a11 a12 a13 p1 q1
0 a a a /a a 23 a13 a 21 / a11 p 2 = q 2 q1 a 21 / a11
22 12 21 11
Donde las a’ y las q’ son los nuevos elementos que se obtienen de las
operaciones ya mencionadas, y donde p 1 se ha eliminado en la segunda y tercera
ecuaciones. Ahora, multiplicando la segunda ecuación de 3.3 por (-a 32‘/a22’) y
sumando el resultado a la tercera ecuación de 3.3, se obtiene el sistema triangular:
a11 a12 a13 p1 q1
0 a' '
a 23 q2 '
2=
p
22
0 0 a33' a 23
'
a32' / a 22
'
p3 q3' q 2' a32' / a 22'
Que simbólicamente puede representarse más simplificadamente así:
p1
p
2 = 3.4
a11 a12 a13 q1
' ' '
0 a 22 a 23 q 2
0 0 "
a 33
q3
"
p3
Donde a33” y q3“, resultaron de las operaciones realizadas y P2 se ha eliminado
de la tercera ecuación.
El proceso de llevar el sistema de ecuaciones 3.2 a la forma de la ecuación
3.4 se conoce como triangularización.
El sistema en la forma de la ecuación 3.4 se resuelve despejando de su última
ecuación p3, sustituyendo p3 en la segunda ecuación y despejando P2 de ella, por
último, con p3 y p2 sustituidas en la primera ecuación de 3.4 se obtiene p 1. Esta parte
del proceso se llama sustitución regresiva.
Antes de ilustrar la eliminación de Gauss con un ejemplo particular, nótese
que no es necesario conservar p 1, p2 y p3 en la triangularización y que ésta puede
llevarse a cabo usando solamente la matriz coeficiente A y el vector q. Para mayor
simplicidad se empleará la matriz aumentada B.
Ejemplo 3.1
Resuelva por eliminación de Gauss el sistema:
4p1 - 9p2 + 2p3 = 500
2p1 - 4p2 + 6p3 = 300
p1 - p2 + 3p3 = 400
SOLUCIÓN
La matriz aumentada del sistema es
4 9 2 500
2 4 6 300
1 1 3 400
Triangularización.- Al sumar la primera ecuación multiplicada por (-2/4) a la
segunda, y la primera ecuación multiplicada por (-1/4) a la tercera, resulta:
4 9 2 500
0 0.5 5 50
0 1.25 2.5 275
Obsérvese que en este paso la primera fila se conserva sin cambio.
Sumando la segunda fila multiplicada por (-1.25/0.5) a la tercera se obtiene la matriz
4 9 2 500
0 0 .5 5 50
0 0 10 150
Que en términos de sistemas de ecuaciones quedaría como
4p1 - 9p2 + 2p3 = 500
0.5p2 + 5p3 = 50 3.5
-10p3 = 150
Un proceso de sustitución regresiva produce el resultado buscado. La tercera
ecuación de 3.5 da el valor de p3 = -15. De la segunda ecuación se obtiene entonces
0.5P2 = 50 - 5p3 = 125. Y por tanto P2 = 250
Finalmente al sustituir p2 y p3 en la primera ecuación de la forma 3.5 resulta
4p1 = 500 + 9p2 – 2p3 = 2780. De modo que p1 = 695
Con la sustitución de estos valores en el sistema original se verifica la
exactitud de los resultados.
natural de los pivotes a 11, a22’, a33”, etc., es muy conveniente tanto para trabajar con
una calculadora como con una computadora, desafortunadamente falla cuando
alguno de esos elementos es cero, puesto que los multiplicadores quedarían
indeterminados (por ejemplo si a 11 fuera cero, el multiplicador (a21/a11) no está
definido). Una manera de evitar esta posibilidad es seleccionar como pivote el
coeficiente de máximo valor absoluto en la columna relevante de la matriz reducida.
Como antes, se tomarán las columnas en orden natural de modo que se vayan
eliminando las incógnitas también en orden natural p1, p2, p3, etc. Esta técnica,
llamada pivoteo, se ilustra con la solución del siguiente sistema.
Ejemplo 3.2
Resuelva el sistema
10p1 + p2 - 5p3 = 100
-20p1 + 3p2 + 20p3 = 200 3.6
5p1 + 3p2 + 5p3 = 600
SOLUCIÓN
La matriz aumentada es
10 1 5 100
20 3 20 200
5 3 5 600
El primer pivote debe ser (-20), ya que es el elemento de máximo valor absoluto en la
primera columna. Vamos a la forma triangular en la eliminación. Para esto es
necesario, por ejemplo en la ecuación 3.6, intercambiar la segunda fila (donde se
encuentra el elemento de máximo valor absoluto) con la primera, con lo que se
obtiene
20 3 20 200
10 1 5 100
5 3 5 600
Se elimina entonces P1 de la segunda y tercera filas de la ecuación 3.6. Para
ello, se suma a la segunda fila la primera multiplicada por (-10/(-20)), y a la tercera
fila la primera multiplicada por (-5/(-20)). Con esto se reduce en la primera
eliminación a
20 3 20 200
0 2.5 5 200
0 3.75 10 650
El siguiente pivote debe seleccionarse entre la segunda y tercera filas (segunda
columna) y en este caso es (3.75). se intercambian la segunda y la tercera filas de la
matriz anterior para obtener
20 3 20 200
0 3.75 10 650
0 2.5 5 200
Sumando a la tercera fila la segunda multiplicada por (-2.5/3.75), al eliminar p 2
resulta
20 3 20 200
0 3.75 10 650
0 0 1.666 233.3
Que tiene ya la forma triangular y está lista para la sustitución regresiva que
proporciona los siguientes valores:
233.3
p3 140 . De la tercera ecuación
1.666
650 10(140)
p2 200 . De la segunda ecuación. Y finalmente:
3.75
200 3( 200) 20(140)
p1 100 . De la primera ecuación
20
Para terminar el tema, comparemos las técnicas de eliminación de Gauss con
pivoteo y sin éste. Por brevedad, la primera se denominará GP y la segunda G.
1. La búsqueda del coeficiente de mayor valor absoluto que se usará como pivote y
el intercambio de filas significa mayor programación en GP.
2. Encontrar en GP un pivote igual a cero significaría que se trata de una matriz
coeficiente A singular y que el sistema A p = q no tiene solución única. Encontrar en
G un pivote igual a cero detendría el proceso de triangularización.
A pesar de la programación adicional y el mayor tiempo de máquina que se
emplea en el método de Gauss con pivoteo, sus otras ventajas borran totalmente
estas desventajas en la práctica.
Ejemplo 3.3
Por eliminación de Jordan, resuelva el sistema
4p1 - 9p2 + 2p3 = 500
2p1 - 4p2 + 6p3 = 300
p1 - p2 + 3p3 = 400
SOLUCION
La matriz aumentada del sistema es
4 9 2 500
2 4 6 300
1 1 3 400
Como en la primera columna el elemento de máximo valor absoluto se
encuentra en la primera fila, ningún intercambio es necesario y el primer paso de
eliminación produce
4 9 2 500
0 0.5 5 50
0 1.25 2.5 275
El elemento de máximo valor absoluto en la parte relevante de la segunda columna
(filas 2 y 3) es 1.25; por tanto, la fila 3 debe intercambiarse con la 2.
4 9 2 500
0 1.25 2.5 275
0 0.5 5 50
Sumando la segunda fila multiplicada por (-(-9)/1.25), a la primera fila y la segunda
multiplicada por (-0.5/1.25) a la tercera, se obtiene el nuevo arreglo
4 0 20 2480
0 1.25 2.5 275
0 0 4 60
Donde se han eliminado los elementos de arriba y abajo del pivote (nótese que en
este paso el primer pivote no se modifica porque sólo hay ceros debajo de él). Por
último, sumando la tercera fila multiplicada por (-20/4) a la primera fila y la tercera
multiplicada por (-2.5/4) a la segunda
4 0 0 2780
0 1.25 0 312.5
0 0 4 60
Que escrita de nuevo como sistema de ecuaciones da
4p1 = 2780
1.25p2 = 312.5
4p3 = -60
De donde el resultado final se obtiene fácilmente
p1 2780 / 4 695
p 2 312.5 / 1.25 250
p 3 60 / 4 15
l1,1u1,1 a1,1
l1,1u1, 2 a1, 2
l1,1u1,3 a1, 3
b)Segunda fila de L por las tres columnas de U
l 2 ,1u1,1 a 2 ,1
l 2,1u1, 2 l 2, 2 u 2, 2 a 2, 2
l 2,1u1, 3 l 2 , 2 u 2, 3 a 2 ,3
c) Tercera fila de L por las tres columnas de U
l 3,1u1,1 a 3,1
l 3,1u1, 2 l 3, 2 u 2 , 2 a3, 2
l 3,1u1, 3 l 3, 2 u 2, 3 l 3,3 u 3, 3 a 3, 3
Se llega a un sistema de
ecuaciones con 12 incógnitas nueve
l1,1 , l 2,1 , l 2, 2 , l 3,1 , l 3, 2 , l 3, 3 , u1,1 , u1, 2 , u1, 3 , u 2, 2 , u 2 , 3 , u 3, 3 ,
por lo que será necesario
establecer tres condiciones arbitrarias sobre las incógnitas para resolver dicho
sistema. La forma de seleccionar las condiciones ha dado lugar a diferentes
métodos; por ejemplo, si se toman de modo que l1,1 l 2, 2 l 3,3 1 , se obtiene el
método de Doolitle; si en cambio se selecciona u1,1 u 2, 2 u 3,3 1 , el algoritmo
resultante es llamado método de Crout.
Se continuará el desarrollo de la factorización. Tómese l1,1 l 2, 2 l3,3 1
Con estos valores se resuelven las ecuaciones directamente en el orden en que
están dadas
De (a) u1,1 = a1,1 u1,2 = a1,2 u1,3 = a1,3 3.8
De (b) y sustituyendo los resultados (Ec. 3.8)
a 2,1 a 2,1
l 2,1
u1,1 a1,1
a 2,1
u 2, 2 a 2, 2 l 2,1u1, 2 a 2, 2 a1, 2 3.9
a1,1
a 2,1
u 2,3 a 2 ,3 l 2,1u1,3 a 2,3 a1,3
a1,1
De (c) y sustituyendo los resultados de las ecuaciones 3.8 y 3.9
a3,1 a3,1
l3,1
u1,1 a1,1
a 3,1
a 3, 2 a1, 2
a3, 2 l 3,1u1, 2 a1,1
l 3, 2 3.10
u 2, 2 a 2,1
a 2, 2 a1, 2
a1,1
a3,1
a 3, 2 a1, 2
u 3,3 a3,3 l 3,1u1,3 l 3, 2 u 2,3 a3,3
a3,1
a1,3
a1,1 a a 2,1 a
a1,1 a 2,1 2,3 a1,1 1,3
a
2, 2 a1, 2
a1,1
Las ecuaciones 3.8, 3.9 y 3.10, convenientemente generalizadas constituyen un
método directo para la obtención de L y U, con la ventaja sobre la triangularización
Ejemplo 3.4
Resuelva por el método de Doolitle el sistema
4p1 -9p2 + 2p3 = 5
2p1 -4p2 + 6p3 = 3
p1 -p2 + 3p3 = 4
SOLUCIÓN
Con l1,1 l 2, 2 l3,3 1 , se procede al cálculo de la primera fila de U
u1,1 = 4 u1,2 = -9 u1,3 = 2
Cálculo de la primera columna de L
l1,1 = 1 (dato) l2,1 = 2/4 = 0.5 l3,1 = ¼ = 0.25
Cálculo de la segunda fila de U
u2,1 = 0 (recuérdese que U es triangular superior)
u2,2 = -4 –(2/4)(-9) = 0.5
u2,3 = 6 –(2/4)(2) = 5
Cálculo de la segunda columna de L
l1,2 = 0 (ya que L es triangular inferior)
l2,2 = 1 (dato)
l3,2 = (-1-(1/4)(-9))/(-4-(2/4)(-9)) = 2.5
Cálculo de la tercera fila de U, o más bien sus elementos faltantes, ya que por
ser triangular superior
u31 = u32 = 0
u3,3 = 3 -(1/4)(2) -[(-l-(1/4)(-9))/(-4-(2/4)(-9))](6-(2/4)(2)) = - 10
Con esto se finaliza la factorización.
Las matrices L y U quedan como sigue
1 0 0 4 9 2
0 .5 0 0 5
L= 1 U= 0. 5
0.25
2 .5 1
0
0
10
Cuyo producto, como ya se comprobó, da A.
Se resuelve el sistema Lg = q, donde q es el vector de términos independientes
del sistema original
1 0 0 g 1 5
0 .5 1
0 g 2 =
3
0.25 2.5 1 g 3
4
g1 = 5
g2 = 3 –0.5(5) = 0.5
g3 = 4 –0.25(5) –2.5 (0.5) = 1.5
Y, finalmente, al resolver el sistema Up = g se tiene la solución del sistema
original
4 9 2 p1 5
0 0.5 0.5
p2 =
5
0 0 10
p 3
1.5
p3 = -0.15
p2 = (0.5 –5(-0.15))/0.5 = 2.5
p1 =(5 + 9(2.5) -2(-0.15))/4 = 6.95
6.95
2.5
p =
0.15
Las ecuaciones 3.8, 3.9 y 3.10 se generalizan para factorizar la matriz coefi-
ciente del sistema Ap = q, que puede resolverse por eliminación de Gauss sin
intercambio de filas; se tiene entonces
i 1
u i , j ai , j li ,k u k , j j = i+1, … ,n
k 1
j 1
1
li , j ( ai , j u k , j l i ,k ) i = j+1, … ,n 3.11
ui, j k 1
l i ,i 1 i = i+1, … ,n
0
Con la convención en las sumatorias que 0
k 1
Puede observarse al seguir las ecuaciones 3.8, 3.9, 3.10 o bien las ecuaciones
3.11, que una vez empleada ai,j el cálculo de ui,j o li,j según sea el caso, esta
componente de A no vuelve a emplearse como tal, por lo que las componentes de L
y U generadas pueden guardarse en A y ahorrar memoria de esa manera.
p = p0 + ε0 Por lo tanto:
Ap = Ap0 + Aε0 O sea:
Aε0 = q - Ap0
Este vector se llama vector residual, y naturalmente es 0 para solución exacta.
fijado, y que se conserven menores para todos los vectores siguientes de la iteración;
es decir
lim p mj p j 1 j n 3.15
m
La forma como se llega a la ecuación 4.13 define el algoritmo y su
convergencia. Dado el sistema Ap = q, la manera más sencilla es despejar p 1 de la
primera ecuación, p2 de la segunda, etc. Para ello, es necesario que todos los
elementos de la diagonal principal de A, por razones obvias, sean distintos de cero.
Para ver esto en detalle considérese el sistema general de tres ecuaciones
(naturalmente puede extenderse a cualquier número de ecuaciones).
Sea entonces
a11p1 + a12p2 + a13p3 = q1
a21p1 + a22p2 + a23p3 = q2
a31p1 + a32p2 + a33p3 = q3
Con , a11, a22 y a33 distintos de cero.
Se despeja p1 de la primera ecuación, p2 de la segunda y p3 de la tercera con lo que
se obtiene
a12 a13 q1
p1 p2 p3
a11 a11 a11
a 21 a q
p2 p1 23 p3 2 3.16
a 22 a 22 a 22
a a q
p3 31 p1 32 p 2 3
a33 a33 a33
Que en notación matricial queda
a12 a13 q1
0
a11 a11 a11
p1 p1
a 21 a q2
p
= 0 23 p
+ 4.17
2
a a 22 2
a
p3 a22 p3 q22
31 a32
0 3
a33 a33 a33
Y ésta es la ecuación 3.14 desarrollada, con
a12 a13 q1
0
a11 a11 a11
a 21 a q2
B= 0 23 y c =
a a 22 a
a22 a32 q22
31 0 3
a33 a33 a33
Una vez que se tiene la forma 3.17, se propone un vector inicial p (0) que puede
ser p(0) = 0, o algún otro que sea aproximado al vector solución p. Se presenta a
continuación un algoritmo para resolver sistemas de ecuaciones lineales con el
método iterativo, en sus dos versiones, desplazamientos simultáneos y
desplazamientos sucesivos
p1k
Si p (k ) p 2k 3.18
p3k
Es el vector aproximación a la solución p después de k iteraciones, entonces se
tiene para la siguiente aproximación
1
(q1 a12 p 2k a13 p3k )
p1k 1 a11
( k 1) k 1 1 k
p p2 (q a p a 23 p3 )
k
3.19
a 22 2 21 1
p3
k 1
1
(q3 a31 p1k a32 p 2k )
a33
Ejemplo 3.5
Resuelva el siguiente sistema por los métodos de Jacobi y Gauss-Seidel
4 p1 p2 5
p1 4 p2 p3 9
3.23
p2 4 p3 p4 3
p3 4 p4 15
SOLUCIÓN
Despejando p1 de la primera ecuación, p2 de la segunda, etc., se obtiene
p2 5
p1
4 4
p1 p3 9
p2
4 4 4 3.24
p2 p 3
p3 4
4 4 4
p3 15
p4
4 4
Vector inicial.- Cuando no se tiene una aproximación al vector solución, se
emplea generalmente como vector inicial el vector cero, esto es p ( 0 ) 0 0 0 0 T
a) Método de Jacobi
El cálculo de p (1) en el método de Jacobi se obtiene remplazando p ( 0) en cada
una de las ecuaciones de 3.24
0 5 5
p1 1.25
4 4 4
0 0 9 9
p2 2.25
4 4 4 4
0 0 3 3
p3 0.75
4 4 4 4
0 15 15
p4 3.75
4 4 4
T
5 9 3 15
Y entonces p (1) , , ,
4 4 4 4
( 2)
Para calcular p se sustituye (1) en cada una de las ecuaciones de 3.24. Para
p
simplificar la notación se han omitido los superíndices.
p1 2.25
4 54 1.8125
p2 1.25
4 0.75 4 94 2.375
p3 2.25
4 3.75 4 34 0.75
p4 0.75 4 15 4 3.5625
A continuación se presentan los resultados de subsecuentes iteraciones, en forma tabular
p1k p 2k p3k p 4k 1k 2k 3k 4k
K
0 0,000000 0,000000 0,000000 0,000000
1 1,250000 2,250000 -0,750000 3,750000 1,2500 2,2500 -0,7500 3,7500
2 1,812500 2,375000 0,750000 3,562500 0,5625 0,1250 1,5000 -0,1875
3 1,843750 2,890625 0,734375 3,937500 0,0313 0,5156 -0,0156 0,3750
4 1,972656 2,894531 0,957031 3,933594 0,1289 0,0039 0,2227 -0,0039
5 1,973633 2,982422 0,957031 3,989258 0,0010 0,0879 0,0000 0,0557
6 1,995605 2,982666 0,992920 3,989258 0,0220 0,0002 0,0359 0,0000
7 1,995667 2,997131 0,992981 3,998230 0,0001 0,0145 0,0001 0,0090
8 1,999283 2,997162 0,998840 3,998245 0,0036 0,0000 0,0059 0,0000
9 1,999290 2,999531 0,998852 3,999710 0,0000 0,0024 0,0000 0,0015
10 1,999883 2,999536 0,999810 3,999713 0,0006 0,0000 0,0010 0,0000
11 1,999884 2,999923 0,999812 3,999953
12 1,999981 2,999924 0,999969 3,999953
13 1,999981 2,999987 0,999969 3,999992
14 1,999997 2,999988 0,999995 3,999992
15 1,999997 2,999998 0,999995 3,999999
16 1,999999 2,999998 0,999999 3,999999
17 1,999999 3,000000 0,999999 4,000000
18 2,000000 3,000000 1,000000 4,000000
Tabla 3.1 Solución del sistema 3.23 por el método de Jacobi.
b) Método de Gauss-Seidel
Para el cálculo del primer elemento del vector p (1) , se sustituye p ( 0 ) en la
primera ecuación de 3.24, para simplificar la notación se han omitido los su-
períndices.
0 5 5
p1 1.25
4 4 4
p1k p 2k p3k p 4k 1k 2k 3k 4k
K
0 0,000000 0,000000 0,000000 0,000000
1 1,250000 2,562500 -0,109375 3,722656 1,2500 2,5625 -0,1094 3,7227
2 1,890625 2,695313 0,854492 3,963623 0,6406 0,1328 0,9639 0,2410
3 1,923828 2,944580 0,977051 3,994263 0,0332 0,2493 0,1226 0,0306
4 1,986145 2,990799 0,996265 3,999066 0,0623 0,0462 0,0192 0,0048
5 1,997700 2,998491 0,999389 3,999847 0,0116 0,0077 0,0031 0,0008
6 1,999623 2,999753 0,999900 3,999975 0,0019 0,0013 0,0005 0,0001
7 1,999938 2,999960 0,999984 3,999996 0,0003 0,0002 0,0001 0,0000
8 1,999990 2,999993 0,999997 3,999999
9 1,999998 2,999999 1,000000 4,000000
10 2,000000 3,000000 1,000000 4,000000
Tabla 3.2 Solución del sistema 3.23 por el método de Gauss-Seidel.
En la aplicación de estas dos variantes son válidas las preguntas siguientes:
1. ¿La sucesión de vectores p (1) , p ( 2 ) , p (3) , ... , converge o se aleja del vector
solución p [ p1 p 2 ... p n ] ?
T
2. Cuando:
k 1 k 1
a) Los valores absolutos p1 p1 , p 2 p 2 , etc., sean todos menores de un
k k
p1 3 p2 5 p3
10 2 p4
p 158 4
p2 1 p3 p4
9 99 9
p3 2 p1 p 2 3 p4
p4 p2 2
Con el vector cero como vector inicial, se tiene la siguiente sucesión de vectores.
Nótese que el proceso diverge.
y 3.27
n
a ii
j 1
a ji
1 i n
j i
p2 p3 p4 3
p1
2 2 2 2
p1 8 p3 4 p4 15
p2
9 9 9 9
p1 3 p2 2 p4 10
p3
5 5 5 5
p4 p2 2
Los resultados para las primeras 18 iteraciones con el vector cero como vector
inicial se muestran en la tabla 3.4
Antes de continuar las iteraciones, puede observarse en la tabla 3.4 que los
valores de p (18) parecen converger al vector
p 1 2
T
0 1
Con la sustitución de estos valores en el sistema 3.26, se comprueba que p1
= -1, p 2 = 0.0, p3 = 1 y p 4 = 2 es el vector solución y por razones obvias se detiene
el proceso.
a) De consideraciones físicas
Sí el sistema de ecuaciones 3.28 tiene un significado físico, con frecuencia es
posible acotar los valores de las incógnitas a partir de consideraciones físicas. Por
ejemplo, si alguna de las variables x i, representa la velocidad de flujo de un fluido,
ésta no podrá ser negativa. Por tanto x i ≥ 0 En el caso de que xi represente una
concentración expresada como fracción peso o fracción molar de una corriente de
b) De consideraciones geométricas
En caso de tener un sistema de dos ecuaciones con dos incógnitas
f 1 ( x1 , x 2 ) 0
f 2 ( x1 , x 2 ) 0
Cada una define, en general, una curva en el plano x 1 – x2 y el problema de
resolver el sistema puede verse como el problema de encontrar el punto o los puntos
de intersección de estas dos curvas. Graficando (puede usarse el software GC, el
Math-CAD, o un programa que grafique) pueden obtenerse buenos valores iniciales.
Sea por ejemplo el sistema
f 1 ( x1 , x 2 ) 0
f 2 ( x1 , x 2 ) 0
Por último, resulta muy conveniente conocer bien las características de cada método
de solución del sistema 3.28 para efectuar la elección más adecuada del mismo.
3.4.2 MÉTODO DE PUNTO FIJO MULTIVARIABLE
Ejemplo 3.6
Encuentre una solución del sistema de ecuaciones no lineales
f1(x, y) = x2 – 10x + y2 + 8 = 0
f2(x, y) = xy2 + x – 10y + 8 = 0.
SOLUCIÓN
Con el despeje de x del término (-10x) en la primera ecuación y de y del término (-
10y) en la segunda ecuación, resulta
x2 y2 8
x
10
xy x 8
2
y
10
o con la notación de la ecuación 3.31
(xk )2 ( y k )2 8
x k 1
10
x k ( y k )2 xk 8
y k 1
10
Con los valores iniciales x0 = 0, y0 = 0, se inicia el proceso iterativo
Primera iteración
02 02 8
x1 0.8
10
0( 0) 2 0 8
y1 0.8
10
Segunda iteración
(0.8) 2 (0.8) 2 8
x2 0.928
10
0.8(0.8) 2 0.8 8
y2 0.9312
10
Al continuar el proceso iterativo, se encuentra la siguiente sucesión de vectores
k xk yk
0 0.00000 0.00000
1 0.80000 0.80000
2 0.92800 0.93120
3 0.97283 0.97327
4 0.98937 0.98944
5 0.99578 0.99579
6 0.99832 0.99832
7 0.99933 0.99933
8 0.99973 0.99973
9 0.99989 0.99989
10 0.99996 0.99996
11 0.99998 0.99998
12 0.99999 0.99999
13 1.00000 1.00000
Para observar la convergencia del proceso iterativo, se pudieron usar criterios
como distancia entre dos vectores consecutivos o bien las distancias componente a
componente de dos vectores consecutivos. También existe un criterio de
convergencia equivalente que dice: Una condición suficiente aunque no necesaria,
para asegurar la convergencia es que
g 1 g 2 g1 g 2
M 1 ; M 1 3.32
x x y y
para todos los puntos (x, y) de la región del plano que contiene todos los valores
(xk, yk) y la raíz buscada ( x , y ) .
Por otro lado; si M es muy pequeña en una región de interés, la iteración
converge rápidamente; si M es cercana a 1 en magnitud, entonces la iteración puede
converger lentamente. Este comportamiento es similar al del caso de una función
univariable discutido anteriormente.
Por lo general es muy difícil encontrar el sistema 3.30 a partir de la ecuación
3.29, de modo que satisfaga la condición 3.32.
De todas maneras, cualquiera que sea el sistema 3.29 a que se haya llegado y
que se vaya a resolver con este método, puede aumentarse la velocidad de
convergencia usando desplazamientos sucesivos en lugar de los desplazamientos
simultáneos del esquema 3.31. Es decir, se iteraría mediante
x k 1 g1 ( x k , y k )
y k 1 g 2 ( x k 1 , y k )
Si la iteración por desplazamientos simultáneos diverge, generalmente el
método por desplazamientos sucesivos divergiría más rápido; es decir, se detecta
más rápido la divergencia, por lo que se recomienda en general el uso de
desplazamientos sucesivos en lugar de desplazamientos simultáneos.
Ejemplo 3.7
Resuelva el sistema del ejemplo 3.6 utilizando el método de punto fijo multivariable
con desplazamientos sucesivos
f1(x, y) = x2 – 10x + y2 + 8 = 0
f2(x, y) = xy2 + x – 10y + 8 = 0.
Sugerencia: Se pueden seguir los cálculos con un pizarrón electrónico o se
programa una calculadora.
SOLUCIÓN
Al despejar x del término (-10x) y y del término (-10y) de la primera y segunda
ecuaciones, respectivamente, resulta
(x k )2 ( y k )2 8
x k 1 g1 ( x k , y k )
10
x ( y k ) 2 x k 1 8
k 1
y k 1 g 2 (x k , y k )
10
Al derivar parcialmente, se obtiene
g 1 2 x k g1 2yk
x 10 y 10
g 2 ( y k ) 2 1 g 2 2 x k 1 y k
x 10 y 10
y evaluadas en x0 = 0 y en y0 = 0
g1 g 2 1
0 para x0 y y0
x x 10
g1 g 2
0 0 para x0 y y0
y y
con lo que se puede aplicar la condición 3.32
g 1 g 2
+ = 0 + 1/10 = 1/10 < 1
x x
g 1 g 2
+ =0+0=0<1
y y
Que se satisface; si los valores sucesivos de la iteración: x 1, y1; x2, y2; x3, y3; …la
satisfacen también, se llega entonces a ( x , y ) .
Primera iteración
02 02 8
x1 0.8
10
0.8(0) 2 0.8 8
y1 0.88
10
Cálculo de la distancia entre el vector inicial y el vector [x 1, y1]T
x (1) x ( 0 ) (0.8 0.0) 2 (0.88 0.0) 2 1.18929
Segunda iteración
(0.8) 2 (0.88) 2 8
x2 0.94144
10
0.94144(0.88) 2 0.94144 8
y2 0.96704
10
Cálculo de la distancia entre [x2, y2]T y [x1, y1]T
tinuación
xk+1 = xk + h
yk+1 = yk + j 3.37
La sustitución de la ecuación 3.36 en la 3.35 y el rearreglo dan como resultado
f 1 f
h 1 j f1 ( x k , y k )
x y
f 2 f 2
h j f 2 (x k , y k ) 3.38
x y
El cual es un sistema de ecuaciones lineales en las incógnitas h y j (recuérdese que
las derivadas parciales de la ecuación 3.38, así como f 1 y f2 están evaluadas en (xk,yk)
y, por tanto, son números reales).
Este sistema de ecuaciones lineales resultante tiene solución única, siempre
que el determinante de la matriz de coeficientes o matriz jacobiana J no sea cero; es
decir si
f 1 f 1
x y
J 0
f 2 f 2
x y
Precisando: El método de Newton-Raphson consiste fundamentalmente en
formar y resolver el sistema 3.38, esto último por alguno de los métodos vistos. Con
la solución y la ecuación 3.37 se obtiene la siguiente aproximación.
Este procedimiento se repite hasta satisfacer algún criterio de convergencia
establecido.
Es interesante notar que como en el caso unidimensional, este método puede
obtenerse encontrando un plano tangente a cada f de la ecuación 3.29 en (xk,yk) y
luego encontrar el cero común de estos planos; es decir, hallar un plano tangente en
(xk, yk) tanto a la superficie f 1 como a la superficie f 2, y luego la intersección de cada
plano tangente con el plano x-y, con lo cual se obtienen dos líneas rectas en el plano
x-y y, por último, la intersección de estas dos líneas rectas, que da el cero común de
los planos tangentes.
Cuando converge este método, lo hace con orden dos, y requiere que el
vector inicial (x0, y0) esté muy cerca de la raíz buscada ( x , y )
Ejemplo 3.8
Use el método de Ncwton-Raphson para encontrar una solución aproximada del
sistema
f1(x, y) = x2 – 10x + y2 + 8 = 0
f2(x, y) = xy2 + x – 10y +8 = 0
con el vector inicial: [x0, y0]T = [0, 0]T
SOLUCIÓN
Primero se forma la matriz coeficiente del sistema 3.38, también conocida como
matriz de derivadas parciales
f 1 f 1
2 x 10 2y
x y
f 2 f 2
y2 1 2 xy 10
x y
[Link] GENERALIZACIÓN
f 1 f 1 f 1
h1 h2 ... hn f1
x1 x 2 x n
f 2 f 2 f 2
h1 h2 ... hn f2
x1 x 2 x n
. . .
. . .
. . .
f n f n f n
h1 h2 ... hn f n
x1 x 2 x n
3.39
o J h = -f
donde las funciones fi y las derivadas parciales ∂f i/∂xj, i = 1, 2, …, n; j = 1, 2, …, n
están evaluadas en el vector x(k) y
hi xik 1 xik 1≤i≤n 3.40
De donde
xik 1 xik hi 1≤i≤n 3.41
( k 1)
o x x h
(k ) (k )
Ejemplo 3.9
Con el algoritmo 3.2, elabore un programa de propósito general para resolver
sistemas de ecuaciones no lineales. Luego úselo para resolver el Sistema
f1(x1, x2, x3) = 3x1 - cos(x2x3) - 0.5 = 0
f2(x1, x2, x3) = x12 - 625x22 = 0
f3(x1, x2, x3) = e-x1x2 + 20x3 + (10π -3)/3 = 0
SOLUCIÓN
La matriz jacobiana ampliada para el sistema es
3 x3 sen ( x 2 x3 ) x 2 sen( x 2 x3 ) 3 x1 cos( x 2 x3 ) 0.5
2x 1250 x 2 0 x12 625 x 22
1
x 2 e x1 x2 x1e x1 x2 20 x1 x 2 10 3
e 20 x3
3
X3 =.-0.52310085
Ejemplo 3.10
Resuelva el sistema
f1(x, y) = x2 – 10x + y2 + 8 = 0
f2(x, y) = xy2 + x – 10y +8 = 0
con el método Newton-Raphson modificado, usando los valores iniciales x 0=0, y0=0.
SOLUCIÓN
Primero se obtiene
f 1 f 2
2 x 10 y 2 xy 10
x y
Primera iteración
Se evalúan f1 y ∂f1/∂x en [0,0]T
f1(0,0) = 8
y
f 1 0
x 10
x
y0
se sustituye
8
x1 0 0.8
10
Para el cálculo de y1 se necesita evaluar f2 y ∂f2/∂y en x1, y0
F2(0.8, 0) = 0.8(0)2 + 0.8 - 10(0) + 8 = 8.8
f 2 1
x 2(0.8)(0) 10 10
y
y0
se sustituye
8.8
y1 0 0.88
10
Segunda iteración
f 1 1
f1(0.8, 0.88) = 1.4144 y x 8.4
x
y1
1.4144
x 2 0.8 0.96838
8.4
Ahora se evalúan f2 y ∂f2/∂y en (x2, y1):
f 2 2
F2(0.96838, 0.88) = 0.91829 y x 8.29565
y
y1
de donde
0.91829
y 2 0.88 0.99070
8.29565
Continuar las iteraciones y calcular las distancias entre cada dos vectores
consecutivos. Continuar hasta que xk ≈ 1 y yk ≈ 1. Comparar además la velocidad de
convergencia de este método con la velocidad de convergencia del método de
Newton-Raphson y el de punto fijo para este sistema particular.
En la aplicación de este método se pudo tomar f 2 para evaluar x1 y f1 a fin de
evaluar y1, asÍ
f2 (x0 , y 0 )
x x
1 0
f 2 x
f1 ( x1 , y 0 )
y1 y 0
f 1 y
Esto puede producir convergencia en alguno de los arreglos y divergencia en
el otro. Es posible saber de antemano si la primera o la segunda forma convergirán
para el caso de sistemas de dos ecuaciones, pero cuando n ≥ 3 las posibilidades son