0% encontró este documento útil (0 votos)
53 vistas26 páginas

Tema 7

Este documento trata sobre los extremos (máximos y mínimos) de funciones de varias variables reales. Introduce conceptos como extremos absolutos y relativos, y define puntos críticos como aquellos donde el gradiente de la función es cero o no está definido. Explica que si una función presenta un extremo en un punto, este punto debe ser crítico, lo que constituye una condición necesaria para la existencia de extremos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
53 vistas26 páginas

Tema 7

Este documento trata sobre los extremos (máximos y mínimos) de funciones de varias variables reales. Introduce conceptos como extremos absolutos y relativos, y define puntos críticos como aquellos donde el gradiente de la función es cero o no está definido. Explica que si una función presenta un extremo en un punto, este punto debe ser crítico, lo que constituye una condición necesaria para la existencia de extremos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Análisis Matemático

Tema 7. Extremos de funciones de


varias variables reales
Primer Curso de Fı́sica

Área de Análisis Matemático

Carmen Calzada Canalejo

Universidad de Córdoba
Dpto. Informática y Análisis Numérico

[email protected]
Contenido

7. Extremos de funciones de varias variables reales 1


7.1. Introducción: Máximos y mı́nimos de funciones de varias variables . . . . . 1
7.2. Condiciones necesarias para la existencia de extremos . . . . . . . . . . . . 4
7.3. Condiciones suficientes para la existencia de extremos . . . . . . . . . . . . 5
7.4. Extremos condicionados: Método de los multiplicadores de Lagrange . . . . 9

A. Formas cuadráticas 19
A.1. Definición de forma cuadrática . . . . . . . . . . . . . . . . . . . . . . . . . 19
A.2. Clasificación de formas cuadráticas reales . . . . . . . . . . . . . . . . . . . 20
Extremos de funciones de varias variables reales
7
SECCIÓN 7.1

Introducción: Máximos y mı́nimos de funciones de


varias variables

En este tema estudiaremos técnicas para hallar los valores extremos de una función
de varias variables reales.
Para fijar ideas, sea u una variable que puede obtenerse a partir de las variables inde-
pendientes x1 , x2 , . . . , xn mediante la función u = f (x1 , . . . , xn ). En tal caso es frecuente
que interese saber qué valores de las variables independientes x1 , . . . , xn proporcionan el
valor óptimo de u; donde por “óptimo” suele entenderse el valor “máximo” o el “mı́nimo”,
según los casos. Ası́, por ejemplo, es evidente que interesa “maximizar” variables como
el rendimiento, el beneficio, la calidad, . . . y que interesa “minimizar” variables como el
tiempo requerido en la producción, el coste total, el porcentaje de fallos, . . . . Además
de estos ejemplos, que aparecen constantemente en la Industria y la Ingenierı́a Quı́mica,
se pueden plantear muchos otros problemas donde el objetivo sea “optimizar” cierta va-
riable fı́sico–quı́mica como la concentración, el volumen, la presión, la temperatura, . . . .
Otro ejemplo práctico, denominado el “método de mı́nimos cuadrados” (introducido por
Gauss) consiste en calcular los parámetros de cierta función teórica que mejor se ajustan
a los datos experimentales, en el sentido de que minimicen la suma de cuadrados de las
diferencias entre cada valor real y el correspondiente valor teórico (ajustado según el mo-
delo dado). De esta forma se calcula, por ejemplo, la recta de regresión y = mx + b que
mejor se ajusta a una nube de puntos {(xi , yi ), i = 1, . . . , n}.
Todos los problemas antes aludidos, una vez planteados matemáticamente (lo que
permite ignorar el significado “real” de cada variable), consisten en hallar los puntos
(a1 , a2 , . . . , an ) donde la función u = f (x1 , x2 , . . . , xn ) alcanza un mı́nimo (resp. máximo);
es decir, donde se cumple:
f (a1 , . . . , an ) ≤ f (x1 , . . . , xn ) (resp. f (a1 , . . . , an ) ≥ f (x1 , . . . , xn )).

Con la denominación de extremo nos referimos indistintamente a los mı́nimos y a


los máximos de la función u. Se dice que tal extremo es absoluto (o global ) cuando la
desigualdad anterior se verifica para cualquier punto (x1 , . . . , xn ) del dominio D ⊂ Rn

1
Tema 7. Extremos de funciones de varias variables reales 2

de la función f : D −→ R. Hablándose de un extremo relativo (o local ) cuando dicha


desigualdad se cumple en los puntos (x1 , . . . , xn ) pertenecientes a cierto entorno del punto
(a1 , . . . , an ) . En todas estas definiciones hemos considerado la palabra extremo en sentido
amplio, al admitir la igualdad entre f (a1 , . . . , an ) y f (x1 , . . . , xn ) . Pero, en todos los
casos, podemos hablar de extremo estricto cuando las desigualdades son estrictas. Es
decir, cuando para todo (x1 , . . . , xn ) 6= (a1 , . . . , an ), se tiene:

f (a1 , . . . , an ) < f (x1 , . . . , xn ) (resp. f (a1 , . . . , an ) > f (x1 , . . . , xn )).

En concreto para una función de dos variables serı́a:

Definición 7.1 Los valores f (a, b) y f (c, d) tales que

f (a, b) ≤ f (x, y) ≤ f (c, d)

para todo (x, y) en una región R se conoce como mı́nimo absoluto y máximo absoluto de
f , respectivamente, en la región R.

Como en el cálculo para funciones de una variable, distinguimos entre extremos abso-
lutos y extremos relativos.

Definición 7.2 Sea f una función definida en una región R que contiene en su interior
al punto (x0 , y0 ).

1. f (x0 , y0 ) es un mı́nimo relativo de f si f (x, y) ≥ f (x0 , y0 ) para todo (x, y) en un


disco abierto que contiene a (x0 , y0 ), es decir,

si ∃ δ > 0 tal que f (x0 , y0 ) ≤ f (x0 + h, y0 + k) con h2 + k 2 < δ

2. f (x0 , y0 ) es un máximo relativo de f si f (x, y) ≤ f (x0 , y0 ) para todo (x, y) en un


disco abierto que contiene a (x0 , y0 ), es decir,

si ∃ δ > 0 tal que f (x0 + h, y0 + k) ≤ f (x0 , y0 ) con h2 + k 2 < δ

Decir que z0 = f (x0 , y0 ) es un máximo relativo de f significa que el punto (x0 , y0 , z0 )


es al menos tan alto como los puntos de su entorno en la gráfica de z = f (x, y). De forma
similar, z0 = f (x0 , y0 ) es un mı́nimo relativo de f si (x0 , y0 , z0 ) está al menos tan bajo
como los puntos de su entorno en la gráfica.
Observación: Para hallar los extremos de una función, usaremos a continuación técnicas
del Cálculo Diferencial; por lo que supondremos que se trata de funciones derivables defi-
nidas sobre un conjunto abierto. De esta forma obtendremos los extremos relativos de la
función. En caso de que ésta no sea derivable o su dominio de definición no sea abierto,
ası́ como cuando queramos obtener sus extremos absolutos, habrá que efectuar conside-
raciones adicionales o aplicar otras técnicas de optimización (que aparecen desarrolladas
en ramas como la Programación Matemática).
Por ejemplo, supongamos que la función z = f (x, y) es continua en el rectángulo
R = [0, 3]×[0, 2] y derivable en R\{(2, 1)}. Entonces, para calcular sus extremos absolutos

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 3

(a) Máximo relativo (b) Mı́nimo relativo

Figura 7.1: Extremos relativos para una función de dos variables reales

en R, además de hallar los extremos relativos en (0, 3) × (0, 2) \ {(2, 1)} (siguiendo los
pasos que veremos a continuación), deberemos evaluar la función f en la frontera de R y
en el punto (2, 1).
El objetivo de este tema es intentar localizar los extremos relativos de f , para lo cual,
investigamos los puntos en los que su gradiente es cero o no está definido. LLamamos a
tales puntos, puntos crı́ticos.

Definición 7.3 Sea f definida en una región abierta R ⊂ Rn conteniendo el punto


(a1 , a2 , . . . , an ). Decimos que (a1 , a2 , . . . , an ) es un punto crı́tico de f si se verifica una de
las afirmaciones siguientes:

∂f
1. (a1 , a2 , . . . , an ) = 0 para todo i = 1, 2, . . . n.
∂xi
2. Algunas de las derivadas parciales (o todas) no existen.

En concreto para una función de dos variables reales serı́a:

Definición 7.4 Sea f definida en una región abierta R conteniendo el punto (x0 , y0 ).
Decimos que (x0 , y0 ) es un punto crı́tico de f si se verifica una de las afirmaciones si-
guientes:

1. fx (x0 , y0 ) = 0 y fy (x0 , y0 ) = 0.
2. fx (x0 , y0 ) ó fy (x0 , y0 ) no existen.

Recordemos que si f es diferenciable y se cumple la primera condición, tenemos:


∇f (x0 , y0 ) = fx (x0 , y0 )~i + fy (x0 , y0 )~j = 0~i + 0~j =⇒ ∇f (x0 , y0 ) = ~0

entonces toda derivada direccional en (x0 , y0 ) ha de ser cero. Eso implica que la función
tiene un plano tangente horizontal en el punto (x0 , y0 , z0 ). Salta a la vista que ese punto
es candidato a que haya en él un extremo. Además el plano tangente en este punto es
z = z0 (horizontal).

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 4

(a) Máximo relativo (b) Mı́nimo relativo

Figura 7.2: Extremos relativos para una función de dos variables reales: Plano z = z0

SECCIÓN 7.2

Condiciones necesarias para la existencia de


extremos

Teorema 7.1 Si f : D ⊂ Rn → R (con D abierto) presenta un extremo relativo (en


sentido amplio o estricto) en el punto (a1 , . . . , an ) ∈ D, entonces dicho punto es un punto
crı́tico.

Demostración: Si no existen algunas de las derivadas parciales en el punto, entonces


estamos en un punto crı́tico. Por tanto, suponemos que la función es derivable en el punto
(a1 , . . . , an ).
Considerando entonces cualquiera de las variables xi , i = 1, . . . , n y la función de esa
única variable g(xi ) = f (a1 , . . . , ai−1 , xi , ai+1 , . . . , an ) empleada para definir la derivada
∂f
parcial , es obvio que g(xi ) presenta un extremo relativo en ai , por lo que g 0 (ai ) =
∂xi
∂f
(a1 , . . . , an ) = 0, para todo i = 1, . . . , n.
∂xi

Este teorema nos dice que para hallar los extremos relativos necesitamos solamente
examinar valores de f en los puntos crı́ticos. Sin embargo, al igual que se cumple para
funciones de una sola variable, los puntos crı́ticos no siempre nos conducen a máximos
o mı́nimos relativos. Es decir, el teorema anterior es una condición necesaria, pero no
suficiente, para la existencia de extremos.
Aquellos puntos crı́ticos que no son extremos se denominan puntos de silla.
Ejemplo: La función z = x2 − y 2 , tiene un punto de silla en (0, 0), ya que
∂z ∂z
= 2x = 0 =⇒ x = 0 = −2y = 0 =⇒ y = 0
∂x ∂y
Sin embargo la función no posee en el punto (0, 0) ni máximo ni mı́nimo, pues en este
punto z(0, 0) = 0 y sin embargo en cualquier entorno del (0, 0), z toma valores positivos

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 5

y negativos.

Figura 7.3: Función: z = x2 − y 2


Si la función es sencilla mediante consideraciones geométricas podemos averiguar si
los puntos crı́ticos obtenidos son extremos o no. Para funciones más complicadas, los
argumentos algebraicos no son tan útiles, y dependemos de los medios más analı́ticos que
se introducen en el siguiente criterio de las derivadas parciales segundas. Este es el criterio
que en dos o más variables corresponde al criterio de la derivada segunda para funciones
de una variable.

SECCIÓN 7.3

Condiciones suficientes para la existencia de


extremos

Como es sabido, el estudio de extremos relativos para funciones de una variable (deri-
vables al menos dos veces) puede efectuarse sin dificultad a partir del desarrollo de Taylor
en torno a cada punto crı́tico. Lo cual motiva a usar el mismo método con funciones
de varias variables. En este caso, los términos de segundo orden constituyen una forma
cuadrática; lo que hará que nuestro problema se reduzca a clasificarla como definida posi-
tiva (originando entonces un mı́nimo relativo estricto), como definida negativa (tratándose
entonces de un máximo relativo estricto) o como indefinida (en los puntos de silla). Pero
antes de ver el criterio que nos da la condición suficiente, definamos lo que se entiende
por matriz hessiana de una función.
o
Definición 7.5 Dada f : D ⊂ Rn −→ R y ~a ∈D, se denomina matriz hessiana de f en
~a, a la matriz de las derivadas parciales de segundo orden
 
fx1 x1 (~a) fx1 x2 (~a) · · · fx1 xn (~a)
 fx x (~a) fx x (~a) · · · fx x (~a) 
 2 1 2 2 2 n
Hf (~a) = 

. . 
 . 
fxn x1 (~a) fxn x2 (~a) · · · fxn xn (~a)

y se denomina hessiano de f en ~a al determinante de esta matriz, es decir |Hf (~a)|

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 6

Teorema 7.2 Sea una función f con derivadas parciales primeras y segundas continuas
en una región abierta que contiene un punto (a, b) para el que fx (a, b) = 0 y fy (a, b) = 0.
Para determinar si en dicho punto hay un extremo relativo de f , definimos la cantidad
(es decir, el determinante de la denominada matriz hessiana de f en el punto)
fxx (a, b) fxy (a, b)
|Hf (a, b)| = fxx (a, b)fyy (a, b) − [fxy (a, b)]2 =
fyx (a, b) fyy (a, b)

1. Si |Hf (a, b)| > 0 y fxx (a, b) > 0, entonces hay un mı́nimo relativo estricto en (a, b).
2. Si |Hf (a, b)| > 0 y fxx (a, b) < 0, entonces hay un máximo relativo estricto en (a, b).
3. Si |Hf (a, b)| < 0, entonces hay un punto de silla en (a, b).
4. Si |Hf (a, b)| = 0, el criterio no nos da información.

Demostración: La fórmula de Taylor para f (x, y) en un punto (a + h, b + k), suponiendo


que f es dos veces diferenciable, viene dada por
∂f ∂f
f (a + h, b + k) = f (a, b) + h (a, b) + k (a, b)
∂x ∂y
2
∂ 2f 2
 
1 2∂ f 2∂ f
+ h (a + θh, b + θk) + 2hk (a + θh, b + θk) + k (a + θh, b + θk)
2 ∂x2 ∂x∂y ∂y 2
con 0 < θ < 1.
Como
∂f ∂f
(a, b) = (a, b) = 0
∂x ∂y

∂ 2f

1
f (a + h, b + k) − f (a, b) = h2 2 (a + θh, b + θk)
2 ∂x
∂ 2f ∂ 2f

+2hk (a + θh, b + θk) + k 2 2 (a + θh, b + θk)
∂x∂y ∂y

Ahora bien como las derivadas parciales segundas son continuas en (a, b), el signo de
éstas en un entorno de dicho punto coincide con el signo de sus respectivas derivadas
parciales segundas en (a, b). Ası́, el signo de
f (a + h, b + k) − f (a, b)

coincide con el signo de


∂ 2f ∂ 2f 2
2∂ f
F (h, k) = h2 (a, b) + 2hk (a, b) + k (a, b)
∂x2 ∂x∂y ∂y 2

Como vemos se trata de una forma cuadrática en h y k, siendo su matriz


 
fxx (a, b) fxy (a, b)
Hf (a, b) =
fyx (a, b) fyy (a, b)

de manera que aplicando el criterio de Sylvester (para el caso de una función de dos
variables reales) se tiene que:

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 7

1. Si |Hf (a, b)| > 0 y fxx (a, b) > 0, la forma cuadrática es definida positiva ⇒ f (a +
h, b + k) − f (a, b) > 0 para valores no nulos de h y k suficientemente pequeños, con
lo cual tenemos un mı́nimo relativo estricto en (a, b).

2. Si |Hf (a, b)| > 0 y fxx (a, b) < 0, la forma cuadrática es definida negativa ⇒ f (a +
h, b + k) − f (a, b) < 0 para valores no nulos de h y k suficientemente pequeños, con
lo que entonces hay un máximo relativo estricto en (a, b).

3. Si |Hf (a, b)| < 0, la forma cuadrática es indefinida, entonces arbitrariamente cerca
de (a, b, f (a, b)) sobre la superficie z = f (x, y) hay puntos por arriba y por abajo
de (a, b, f (a, b)). Por tanto la función f tiene un punto de silla en (a, b) y no es ni
máximo ni mı́nimo.

4. Si |Hf (a, b)| = 0, estamos en un caso dudoso, con lo que el criterio no nos da
información.


Este teorema se puede extender para funciones de tres variables reales. Hemos visto
cómo para funciones de dos variables, la existencia de extremo dependı́a de la conservación
del signo de la forma cuadrática binaria en h y k:

F (h, k) = fxx h2 + 2fxy hk + fyy k 2

Para el caso de funciones de tres variables f (x, y, z) con derivadas segundas continuas y no
simultáneamente nulas en el punto (a, b, c), la existencia de extremo dependerá también
de la conservación del signo de la forma cuadrática ternaria en h, k y l:

F (h, k, l) = fxx h2 + fyy k 2 + fzz l2 + 2fxy hk + 2fxz hl + 2fyz kl

Aunque no vamos a demostrarlo, si hacemos un razonamiento análogo, llegamos al si-


guiente teorema:

Teorema 7.3 Si una función f (x, y, z) tiene derivadas segundas continuas y no simultánea-
mente nulas en el punto (a, b, c) de una región abierta R y en dicho punto es fx = fy =
fz = 0, para determinar si en dicho punto hay un extremo relativo de f , definimos las
cantidades:
fxx (a, b, c) fxy (a, b, c) fxz (a, b, c)
H3 (a, b, c) = fyx (a, b, c) fyy (a, b, c) fyz (a, b, c)
fzx (a, b, c) fzy (a, b, c) fzz (a, b, c)

fxx (a, b, c) fxy (a, b, c)


H2 (a, b, c) =
fyx (a, b, c) fyy (a, b, c)

H1 (a, b, c) = fxx (a, b, c)

Entonces:

1. Si H3 (a, b, c) > 0, H2 (a, b, c) > 0 y H1 (a, b, c) > 0, en el punto (a, b, c) la función


tiene un mı́nimo relativo estricto.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 8

2. Si H3 (a, b, c) < 0, H2 (a, b, c) > 0 y H1 (a, b, c) < 0, en el punto (a, b, c) la función


tiene un máximo relativo estricto.

3. Si H2 (a, b, c) < 0, en el punto (a, b, c) la función tiene un punto de silla.

4. Si H1 (a, b, c)H3 (a, b, c) < 0, la función tiene un punto de silla en (a, b, c).

5. El resto de los casos son dudosos..


Ejemplo: Hallar los extremos de la función f (x, y) = x3 − 3axy + y 3 según los valores de
a.
Como f es diferenciable, calculamos fx y fy :

fx (x, y) = 3x2 − 3ay fx (x, y) = 3x2 − 3ay = 0 ⇒ x2 − ay = 0

fy (x, y) = 3y 2 − 3ax fy (x, y) = 3y 2 − 3ax = 0 ⇒ y 2 − ax = 0

Si a = 0, la única solución del sistema anterior es x = y = 0, y si a 6= 0, se tiene


x2
x2 − ay = 0 ⇒ y =
a

Ası́, sustituyendo en la segunda ecuación, llegamos a

x(x3 − a3 ) = 0 ⇒ x = 0 ó x = a

de manera que los puntos crı́ticos son:

Si a = 0, P1 = (0, 0).

Si a 6= 0, P2 = (0, 0) y P3 = (a, a).

Para aplicar la condición suficiente calculamos la matriz hessiana:


   
fxx (x, y) fxy (x, y) 6x −3a
H(x, y) = = ,
fyx (x, y) fyy (x, y) −3a 6y

y estudiamos el signo del hessiano en cada punto.

1. Si a = 0 se tenı́a el punto P1 = (0, 0), entonces

0 0
H(0, 0) = = 0,
0 0

luego en principio el criterio no nos da información sobre la naturaleza del punto.


Pero en este caso, al ser a = 0, la función quedarı́a f (x, y) = x3 + y 3 . Estudiando
el comportamiento de la función en un entorno del punto P1 = (0, 0), comprobamos
que si las coordenadas del punto (x, y) son ambas positivas, f (x, y) > 0, mientras
que si fueran ambas negativas f (x, y) < 0. Incluso sobre la recta x + y = 0, se tiene
que f (x, y) = 0. Por lo tanto el punto P1 = (0, 0) es un punto de silla.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 9

2. Si a 6= 0, tenemos dos puntos que estudiar.

a) En el punto P2 = (0, 0), el hessiano viene dado por

0 −3a
H(0, 0) = = −9a2 < 0 ,
−3a 0
de donde P2 = (0, 0) es un punto de silla.
b) En el punto P3 = (a, a), el hessiano viene dado por

6a −3a
H(a, a) = = 27a2 > 0 .
−3a 6a
Luego si a > 0, al ser fxx (a, a) = 6a > 0, en el punto P3 se alcanza un mı́nimo
relativo, mientras que si a < 0, como fxx (a, a) = 6a < 0, en el punto P3 se
alcanza un máximo relativo.


Nota: Aplicando el criterio de Sylvester para clasificar formas cuadráticas en Rn se puede
extender fácilmente la condición suficiente de extremos para funciones de n variables.

SECCIÓN 7.4

Extremos condicionados: Método de los


multiplicadores de Lagrange

Al principio del tema ya hemos comentado la importancia práctica que supone en


muchos casos el maximizar o minimizar cierta función mediante la elección apropiada del
valor de sus variables independientes. Por lo general, estas variables están restringidas a
cierto conjunto de valores que constituyen el dominio de definición (teórico o real) de la
función dada.
Pero, en muchas ocasiones, los valores factibles de las variables están sujetos además
a condiciones adicionales tales que dejan de ser realmente variables independientes. Se
trata de relaciones que “ligan” sus valores estableciendo cierta dependencia entre las va-
riables. Aquı́ consideraremos el caso de dependencia funcional entre las variables cuyo
valor óptimo queremos calcular, dependencia que se expresa entonces mediante las deno-
minadas funciones de ligadura (o simplemente ligaduras). En lo que sigue usaremos
la siguiente expresión general para un problema de extremos condicionados:
Optimizar la función u = f (x1 , x2 , . . . , xn ), sujeta a las condiciones (o ligaduras):


 g1 (x1 , . . . , xn ) = 0


 g2 (x1 , . . . , xn )
 = 0
(7.1)
 ...

..
.



gk (x1 , . . . , xn ) = 0

siendo 1 ≤ k < n.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 10

Siempre que sea factible, interesa usar las ligaduras para despejar k variables ex-
presándolas en función de las n − k variables restantes. Haciendo estas sustituciones en la
función u, el problema se reduce a calcular los extremos (ya sin ligaduras) de una función
de n − k variables. Para poder hacer esto hay que asegurarse que se verifica el teorema de
la función implı́cita. En concreto, reordenado las variables si es preciso, podemos suponer
que las k últimas variables xn−k+1 , xn−k+2 , . . . , xn−1 , xn dependen de las n − k primeras,
que son ası́ las únicas variables independientes. Para hacer patente este hecho cambiamos
la notación de las variables escribiendo:
y1 = xn−k+1
y2 = xn−k+2
··· ······
yk = xn

con lo que se tendrá que verificar que


 
g1 , g2 , · · · , gk ∂gi
J = 6= 0
y1 , y2 , · · · , yk ∂yj 1≤i,j≤k

De esta forma, el problema de extremos condicionados se reduce a estudiar los extremos


de una función

F (x1 , x2 , · · · , xn−k ) = f (x1 , x2 , · · · , xn−k , y1 , · · · , yk )

que se resuelve según hemos visto en las preguntas anteriores del tema.
En la resolución práctica de este problema hay dos situaciones bien diferentes que se
nos pueden plantear:

1. Las variables y1 , y2 , . . . , yk pueden obtenerse explı́citamente como función de las


variables x1 , x2 , . . . , xn−k , a partir de las k funciones de ligaduuras g1 = g2 = · · · =
gk = 0.
Este caso, que será el menos frecuente, permite olvidarnos totalmente de las ligadu-
ras una vez que conocemos la expresión explı́cita de

yj = yj (x1 , x2 , . . . , xn−k ), j = 1, 2, . . . , k.

Sustituyendo estas expresiones explı́citas en la función a optimizar f (x1 , x2 ,


. . . , xn ) podemos trabajar simplemente con la función resultante F (x1 , x2 ,
. . . , xn−k ).

2. Las variables y1 , y2 , . . . , yk quedan determinadas implı́citamente por las ligaduras


g1 = g2 = · · · = gk = 0, siendo complicado o imposible obtener su expresión
explı́cita.
En este caso, que será el más frecuente, optimizamos la función F (x1 , x2 , . . . ,
xn−k ) considerando sus n−k variables independientes. Pero en todos los cálculos de-
bemos derivar implı́citamente en g1 = g2 = · · · = gk = 0 para obtener las derivadas
de y1 , y2 , . . . , yk que aparecen como funciones implı́citas de x1 , x2 , . . . , xn−k .

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 11

Pero muchas veces es complicado o imposible despejar k variables de las ligaduras, por
lo que resulta inviable el método descrito. Otras veces, aún pudiéndose eliminar dichas
variables, el problema de extremos da lugar a ecuaciones difı́ciles de resolver. O bien el
calculo efectuado con las funciones implı́citas, suele resultar bastante largo y engorroso.
Para solventar esta situación vemos a continuación un nuevo método introducido por
Lagrange (en un conocido trabajo suyo sobre Mecánica, realizado cuando contaba sólo 19
años de edad).
Comenzamos con un problema simple de optimización con ligaduras. Supóngase que
queremos hallar el rectángulo de área máxima que puede inscribirse en una elipse

x2 y 2
+ =1
9 16

Sea (x, y) = (x0 , y0 ) el vértice del rectángulo situado en el primer cuadrante. Entonces,
como el rectángulo tiene lados de longitudes 2x y 2y, su área viene dada por

f (x, y) = 4xy función objetivo

Queremos hallar x e y tal que f (x, y) sea máxima. Nuestra elección de (x, y) se restringe
a puntos que pertenecen a la elipse

x2 y 2
+ = 1 ligadura
9 16

x2 y 2
Figura 7.4: Rectángulo de área máxima que puede inscribirse en la elipse + =1
9 16
Para ver cómo puede resolverse este problema mediante los multiplicadores de Lagran-
ge, consideremos la ecuación de ligadura como una curva de nivel fija de

x2 y 2
g(x, y) = + −1
9 16

en concreto serı́a la curva de nivel g(x, y) = 0.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 12

Las curvas de nivel de f representan una familia de hipérbolas


f (x, y) = 4xy = k ,

y en esta familia las curvas de nivel que satisfacen la ligadura dada corresponden a hipérbo-
las que cortan a la elipse (ver figura 7.5). Además, para maximizar f (x, y), queremos hallar
la hipérbola que satisface la ligadura exactamente. La curva de nivel que hace esto es tan-
gente a la elipse, es decir, la solución (x0 , y0 ) debe ser el punto de la elipse, S, donde la
curva de nivel correspondiente sea tangente a S.

Figura 7.5: Curvas de nivel de f (x, y) = k

Para hallar la hipérbola apropiada, usamos el hecho de que dos curvas son tangentes
en un punto si y sólo si sus vectores gradientes son paralelos. Intuitivamente vemos que en
el punto (x, y) de S para que la hipérbola sea tangente a la elipse, el gradiente ∇f (x, y)
debe ser perpendicular a S, pero un vector normal a S en (x, y) es ∇g(x, y). Esto significa
que ∇f (x, y) debe ser un múltiplo de ∇g(x, y) en el punto de tangencia. En el contexto de
los problemas de optimización con ligaduras, denotamos este escalar por λ y escribimos
∇f (x, y) = λ∇g(x, y) . (7.2)

El escalar λ se conoce como multiplicador de Lagrange. La condición (7.2), junto con la


condición de ligadura, establece un sistema de tres ecuaciones con tres incógnitas (x, y, λ),
cuya solución constituye el llamado Método de los multiplicadores de Lagrange:
fx (x, y) = λgx (x, y)
fy (x, y) = λgy (x, y)
g(x, y) =0

El siguiente teorema nos da las condiciones necesarias para la existencia de extremos


relativos condicionados, en los que aparecen tales multiplicadores.

Teorema 7.4 Sean f y g funciones con derivadas parciales primeras continuas tales que
f tiene un extremo relativo en el punto (x0 , y0 ) de la curva de ligadura g(x, y) = 0. Si
∇g(x0 , y0 ) 6= ~0, entonces existe un número real λ tal que
∇f (x0 , y0 ) = λ∇g(x0 , y0 )

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 13

Demostración: Para empezar, representemos la curva suave dada por g(x, y) = 0 por la
función vectorial
~r(t) = x(t)~i + y(t)~j, ~r 0 (t) =
6 ~0 ,

siendo x0 e y 0 continuas en un intervalo I. Si definimos la función h por h(t) = f (x(t), y(t)),


entonces, como f (x0 , y0 ) es un valor extremo de f , sabemos que

h(t0 ) = f (x(t0 ), y(t0 )) = f (x0 , y0 )

es un valor extremo de h. Esto implica que h0 (t0 ) = 0 y, por la regla de la cadena,

h0 (t0 ) = fx (x0 , y0 )x0 (t0 ) + fy (x0 , y0 )y 0 (t0 ) = ∇f (x0 , y0 ) · ~r 0 (t0 ) = 0 .

Luego, ∇f (x0 , y0 ) es ortogonal a ~r 0 (t0 ). Además, sabemos por un tema anterior que
∇g(x0 , y0 ) también es ortogonal a ~r 0 (t0 ). En consecuencia los gradientes ∇f (x0 , y0 ) y
∇g(x0 , y0 ) son paralelos, y por tanto, debe existir un escalar λ tal que

∇f (x0 , y0 ) = λ∇g(x0 , y0 )


Ası́, el método de los multiplicadores de Lagrange para hallar los valores extremos de
una función f sujeta a una ligadura es:
Supongamos que f y g satisfacen las hipótesis del teorema de Lagrange y que f tiene,
sujeta a la ligadura g(x, y) = 0, un mı́nimo o un máximo. Para hallar el mı́nimo o máximo
de f , resolvemos simultáneamente las ecuaciones ∇f (x, y) = λ∇g(x, y) y g(x, y) = 0
resolviendo el sistema de ecuaciones:
fx (x, y) = λgx (x, y)
fy (x, y) = λgy (x, y)
g(x, y) =0

Otra manera de considerar estas ecuaciones es pensar en λ como una variable adicional
y formar la función auxiliar

F (x, y, λ) = f (x, y) − λg(x, y)

En el teorema de Lagrange se dice que para hallar los puntos extremos de f restrin-
gida a g debemos examinar los puntos crı́ticos de F . Estos se encuentran resolviendo las
ecuaciones
∂F ∂f ∂g
= 0 =⇒ −λ =0
∂x ∂x ∂x
∂F ∂f ∂g
= 0 =⇒ −λ =0
∂y ∂y ∂y
∂F
= 0 =⇒ g(x, y) = 0
∂λ
que son las mismas que las ecuaciones dadas anteriormente. A la función F se le llama
función de Lagrange o lagrangiana.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 14

Notemos que el teorema de Lagrange, nos da una condición necesaria para la existencia
de extremos de la función f , que no es una condición suficiente.
Nota: Si tanto la función f como la función g depende de tres variables, las gráficas
correspondientes se sitúan en el espacio tridimensional; pero el razonamiento seguido
anteriormente continúa siendo válido sin más que hablar de superficies de nivel para la
función f y g. En tal caso se deben usar dos parámetros para la superficie g(x, y, z) = 0
en la demostración anterior.
Por otra parte, el método de los multiplicadores de Lagrange se puede extender cuando
tenemos dos funciones de ligadura. Ası́, en los problemas de optimización con dos funciones
de ligadura g y h, introducimos un segundo multiplicador de Lagrange y resolvemos la
ecuación
∇f (x, y, z) = λ1 ∇g(x, y, z) + λ2 ∇h(x, y, z)
Consideremos el problema consistente en optimizar la función u = f (x, y, z), estando las
variables sujetas a las dos condiciones:

g(x, y, z) = 0, h(x, y, z) = 0.

Entonces la superficie de nivel f (x, y, z) = k debe tocar tangencialmente a la curva

~r(t) = S = {(x, y, z) / g(x, y, z) = 0, h(x, y, z) = 0} con t ∈ I

en el punto crı́tico t0 ∈ I tal que ~r(t0 ) = (x(t0 ), y(t0 ), z(t0 )) = P . Podemos formar la
composición
f ◦ ~r : I ⊆ R −→ R

la cual es una función real de la variable t, que alcanza un extremo en t = t0 . Entonces


(f ◦ ~r)0 (t0 ) = 0. Esta derivada es, según la regla de la cadena, si ~r(t) = (x(t), y(t), z(t)),
la siguiente:
∂f ∂f ∂f
(f ◦ ~r)0 (t) = (~r(t))x0 (t) + (~r(t))y 0 (t) + (~r(t))z 0 (t) = ∇f (~r(t)) · ~r 0 (t)
∂x ∂y ∂z

donde ~r 0 (t) es el vector tangente a la curva S. Entonces

0 = (f ◦ ~r)0 (t0 ) = ∇f (P ) · ~r 0 (t0 )

Siendo el vector ~r 0 (t0 ) tangente a la curva S en el punto P , y siendo

∇f (P ) · ~r 0 (t0 ) = 0,

concluimos que el vector ∇f (P ) es un vector que se encuentra en el plano normal a la


curva S en P .
Por otra parte, sabemos que ∇g(P ) es un vector normal a g(x, y, z) = 0 en P y ∇h(P )
es un vector normal a h(x, y, z) = 0. Además, ∇g(P ) y ∇h(P ) son vectores normales a
la curva S en P . Siendo ∇f (P ) un vector normal a la curva S en P , concluimos que los
tres vectores ∇f (P ), ∇g(P ), ∇h(P ) se encuentran en el mismo plano, el plano normal
a S en P . Son por tanto, linealmente dependientes. Si los vectores ∇g(P ) y ∇h(P ) son

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 15

linealmente independientes1 , podemos expresar ∇f (P ) como combinación lineal de ellos.


En tales condiciones deben existir λ1 y λ2 tales que

∇f (P ) = λ1 ∇g(P ) + λ2 ∇h(P ) .

Concluimos entonces que una condición necesaria para que la función f (x, y, z) sujeta
a las restricciones g(x, y, z) = 0 y h(x, y, z) = 0 alcance un extremo en (x, y, z) (donde se
supone la independencia lineal de los vectores ∇g(x, y, z) y ∇h(x, y, z)), es que existan
constantes λ1 y λ2 ∈ R de modo que

∇f (x, y, z) = λ1 ∇g(x, y, z) + λ2 ∇h(x, y, z) .

Generalizando las situaciones anteriores y utilizando la expresión general para un


problema de extremos condicionados, que recordemos era: Optimizar la función u =
f (x1 , x2 , . . . xn ) sujeta a las condiciones o ligaduras

 g1 (x1 , x2 , . . . , xn ) = 0


 g2 (x1 , x2 , . . . , xn ) = 0

.. ..


 . .

gk (x1 , x2 , . . . , xn ) = 0

siendo 1 ≤ k < n,
el teorema de los multiplicadores de Lagrange, nos dirá lo siguiente:

Teorema 7.5 Supongamos que las funciones f, g1 , . . . , gk : D ⊂ Rn −→ R (con 1 ≤


k < n) tienen derivadas primeras continuas en el abierto D y sea S el subconjunto de D
determinado por:

S = {(x1 , . . . , xn ) ∈ D tal que gj (x1 , . . . , xn ) = 0, ∀j = 1, . . . , k}.

Si la función f restringida a S posee un extremo relativo en el punto (a1 , . . . , an ), en el


cual tiene rango k la matriz jacobiana
 
∂gj
Jg (a1 , . . . , an ) = (a1 , . . . , an ) ,
∂xi 1≤i≤n
1≤j≤k

entonces existen k escalares λ1 , . . . , λk ∈ R tales que (a1 , . . . , an ) es un punto crı́tico de


la función
k
X
F (x1 , . . . , xn , λ1 , . . . , λk ) = f (x1 , . . . , xn ) − λj gj (x1 , . . . , xn ).
j=1

1
El que los vectores ∇g(P ) y ∇h(P ) sean linealmente independientes, equivale a decir que el rango de
la matriz jacobiana siguiente es dos:
 
gx gy gz
J (P ) =
hx hy hz

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 16

Por tanto, el método de los multiplicadores de Lagrange, consiste en introducir un


multiplicador λj por cada una de las k ligaduras gj (x1 , x2 , . . . , xn ) = 0. Como consecuen-
cia, los puntos crı́ticos de u = f (x1 , x2 , . . . , xn ) se obtienen como solución del siguiente
sistema de n + k ecuaciones con n + k incógnitas:
 k
 ∂f X ∂gj
(x1 , x2 , . . . , xn ) = λj (x1 , x2 , . . . , xn )


∂x1 ∂x1



 j=1


.. ..





 . .


 k
∂f ∂gj
 X
(x1 , x2 , . . . , xn ) = λj (x1 , x2 , . . . , xn )


 ∂x n j=1
∂x n





 g1 (x1 , x2 , . . . , xn ) = 0

.. ..






 . .

gk (x1 , x2 , . . . , xn ) = 0

Este sistema se obtiene sin más que derivar la función F respecto de cada una de las
variables xi , i = 1, . . . n y λj , j = 1, . . . , k.
Nota: Decir que el rango de la matriz jacobiana Jg (de orden k × n) es k, es equivalente
a decir que tiene algún menor de orden k no nulo, y las k variables que aparecen en
este menor no nulo son las que pueden considerarse como función implı́cita de las n − k
variables restantes.
En la sección anterior, desarrollamos una condición suficiente, para extremos de fun-
ciones de varias variables, basada en la observación del término de segundo grado en la
serie de Taylor de f , estudiando al final el signo de una forma cuadrática. Sin embargo,
ahora no estamos interesados en todos los valores de f sino sólo en aquellos obtenidos
al restringir f a algún conjunto S que sea el conjunto de nivel de otra función g. La si-
tuación es complicada, primero porque los extremos restringidos de f no necesariamente
se presentan en los puntos crı́ticos de f y, segundo, porque sólo se permite a la variable
moverse en el conjunto S. No obstante se puede dar un criterio de la segunda derivada en
términos de lo que se llama el hessiano limitado. Sin embargo su desarrollo es un poco
tedioso y no merece la pena desarrollarlo aquı́.
La condición suficiente en el caso más sencillo, es decir, cuando tenemos la función
objetivo f (x, y), con una ecuación de ligadura, g(x, y) = 0, se reduce a estudiar el signo
de la forma cuadrática de la función de Lagrange F (x, y, λ), para el valor de λ calculado.
Supongamos que (x0 , y0 ) es un punto crı́tico de f , condicionado a que g(x0 , y0 ) = 0 y
además suponemos que y = y(x), a través de g(x, y) = 0. Si consideramos y = y(x),
entonces
h(x) = f (x, y(x))

ası́, si (x0 , y0 ) es un punto crı́tico de f restringido a g, h0 (x0 ) = 0 y podemos aplicar la


condición suficiente directamente a la función h(x), de manera que:

1. Si h00 (x0 ) > 0, entonces en (x0 , y0 ) la función h, y por tanto f restringida a g, tiene
un mı́nimo relativo,

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 17

2. Si h00 (x0 ) < 0, entonces en (x0 , y0 ) la función h, y por tanto f restringida a g, tiene
un máximo relativo.

Se demuestra que

d2 F (x0 , y0 , λ0 ) = (dx)2 h00 (x0 )


con la condición2
gx (x0 , y0 )dx + gy (x0 , y0 )dy = 0

y en consecuencia,
sign d2 F (x0 , y0 , λ0 ) = sign h00 (x0 )

Esta condición suficiente se puede generalizar al problema de optimizar


u = f (x1 , x2 , . . . , xn ) sujeto a:


 g1 (x1 , x2 , . . . , xn ) = 0

 g2 (x1 , x2 , . . . , xn ) =

0
.. ..


 . .

gk (x1 , x2 , . . . , xn ) = 0

1 ≤ k < n de la siguiente manera:


Tenemos que estudiar la diferencial segunda de la función de Lagrange
k
X
F (x1 , . . . , xn , λ1 , . . . , λk ) = f (x1 , . . . , xn ) − λj gj (x1 , . . . , xn ).
j=1

fijando los valores obtenidos para los multiplicadores de Lagrange y en el punto crı́tico,
restringida por las condiciones siguientes:
 ∂g1 ∂g1 ∂g1    
∂x1 ∂x2
··· ∂xn dx1 0
∂g2 ∂g2 ∂g2

∂x1 ∂x2
··· ∂xn
 dx2   0 
Jg · H =  . = (7.3)
    
.. ..  .. ..
 ..
 
. .  .   . 
∂gk ∂gk ∂gk dxn 0
∂x1 ∂x2
··· ∂xn

con H 6= ~0.
En estas condiciones, si para todos los vectores H que cumplan (7.3) se verifica que:

1. d2 F (P ) > 0, entonces se tiene un mı́nimo relativo estricto en P .

2. d2 F (P ) < 0, entonces se tiene un máximo relativo estricto en P .

3. d2 F (P ) cambia de signo al variar H, entonces se trata de un punto de silla.


2
Se calcula d2 F (x0 , y0 , λ0 ) fijado de antemano el valor de λ0

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 18

4. d2 F (P ) se anula para algún H y no se altera su signo, entonces no podemos afirmar


nada.

Ejemplo: Determinar entre todos los rectángulos de perı́metro 2k el de área máxima.


La función objetivo es f (x, y) = xy (área del rectángulo) siendo la condición de li-
gadura 2x + 2y = 2k (perı́metro del rectángulo), de manera que la ecuación de ligadura
viene dada por la función g(x, y) = x + y − k = 0.
Como ∇g(x, y) = (1, 1) 6= ~0, para todo x, y tal que x + y − k = 0, podemos aplicar el
Teorema de los multiplicadores de Lagrange. Ası́ tenemos,
F (x, y, λ) = xy − λ(x + y − k) .

A continuación buscamos los puntos crı́ticos de la función de Lagrange:


∂F

=y−λ 

∂x 

y−λ=0 y=λ


∂F 
=x−λ ⇒ x−λ=0 x=λ
∂y
x + y − k = 0 ⇒ 2λ − k = 0 ,



∂F


=x+y−k 

∂λ
 
k k k
de manera que se obtiene el punto crı́tico , para λ = , el cual será el posible
2 2 2
extremo para nuestra función f (x, y) condicionado a que x + y − k = 0.
Para comprobar si elpunto obtenido es un máximo, estudiamos el signo de la forma
k k k
cuadrática d2 F , , .
2 2 2

∂ 2F ∂ 2F ∂ 2F
 
k 2
d2 F x, y, = 2
(x, y)(dx) + 2 (x, y)dxdy + 2
(x, y)(dy)2
2 ∂x ∂y∂x ∂y
   ,
 Fxx (x, y) Fxy (x, y) dx
= dx dy
Fxy (x, y) Fyy (x, y) dy

de donde     
2 k  0 1 dx
d F x, y, = dx dy ,
2 1 0 dy
condicionado a que
   
dx  dx
∇g =0⇒ 1 1 = 0 ⇒ dx + dy = 0 ⇒ dy = −dx .
dy dy

Por lo tanto
    
2 k k k 0 1 dx
= −2(dx)2 < 0,

dF , , = dx −dx
2 2 2 1 0 −dx

para todo dx 6= 0.
k k2
Luego la solución pedida es el cuadrado de lado siendo su área y su perı́metro
2 4
2k.


Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Formas cuadráticas
A
SECCIÓN A.1

Definición de forma cuadrática

En esta sección veremos algunos hechos importantes que aparecen en el estudio de las
formas cuadráticas. El material que aquı́ se presenta se ha utilizado en el estudio de los
extremos de las funciones de varias variables en el tema 7.

Definición A.1 Sea Rn el espacio vectorial de dimensión n en el cual consideramos la


base canónica. Se llama:

Forma lineal a cualquier aplicación lineal f : Rn −→ R. Si su matriz es A =


(a1 a2 · · · an ) ∈ M1×n (matriz fila) y X ∈ Mn×1 (matriz columna) es la matriz de
coordenadas de ~x = (x1 , x2 , . . . , xn ), a cada ~x le asocia el número real

f (~x) = AX = a1 x1 + a2 x2 + · · · + an xn .

Forma cuadrática a cualquier aplicación q : Rn −→ R definida por

q(~x) = X t AX

donde A ∈ Mn×n es una matriz simétrica y X ∈ Mn×1 es la matriz de coordenadas


de ~x = (x1 , x2 , . . . , xn ).

Ejemplos:

1. Una forma cuadrática en R2 es una función q : R2 −→ R


  
a b x
= ax2 + cy 2 + 2bxy

q(x, y) = x y
b c y

19
Tema 7. Extremos de funciones de varias variables reales 20

2. Una forma cuadrática en R3 es del tipo q : R3 −→ R

  
 a b c x
q(x, y, z) = x y z  b d e   y 
c e f z

= ax2 + dy 2 + f z 2 + 2bxy + 2cxz + 2eyz

SECCIÓN A.2

Clasificación de formas cuadráticas reales

Definición A.2 Una forma cuadrática q : Rn −→ R, o la matriz que la representa, se


dice que es:

1. definida positiva, si q(~x) > 0 ∀ ~x ∈ Rn , ~x 6= ~0.

2. definida negativa, si q(~x) < 0 ∀ ~x ∈ Rn , ~x 6= ~0.

3. semidefinida positiva, si q(~x) ≥ 0 ∀ ~x ∈ Rn .

4. semidefinida negativa, si q(~x) ≤ 0 ∀ ~x ∈ Rn .

5. indefinida (o no definida), si ∃ ~x, ~y ∈ Rn tal que q(~x) > 0 y q(~y ) < 0.

Ejemplos:

1. La forma cuadrática q : R −→ R, dada por q(x) = ax2 es definida positiva (respec-


tivamente definida negativa, semidefinida positiva, semidefinida negativa) si y sólo
si a > 0 (respectivamente a < 0, a ≥ 0, a ≤ 0).

2. La forma cuadrática q : R2 −→ R, dada por q(x, y) = 3x2 + 7y 2 es definida positiva,


pues es claro que q(x, y) > 0 para todo (x, y) ∈ R2 , (x, y) 6= (0, 0).

3. La forma cuadrática q : R3 −→ R, dada por q(x, y, z) = −x2 − 8y 2 − 10z 2 es definida


negativa, ya que q(x, y, z) < 0 para todo (x, y, z) ∈ R3 , (x, y, z) 6= (0, 0, 0).

4. La forma cuadrática q : R3 −→ R, dada por q(x, y, z) = 2x2 + 3z 2 es semidefinida


positiva, ya que q(x, y, z) ≥ 0 para todo (x, y, z) ∈ R3 (de hecho para todos los
vectores del tipo (0, y, 0) la forma q vale 0).


Con los ejemplos anteriores podemos darnos cuenta de que la propiedad de una forma
cuadrática de ser definida positiva o negativa se descubre inmediatamente cuando ésta

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 21

solamente posee los términos cuadráticos. Más en concreto, podemos decir que la forma
cuadrática q : Rn −→ R dada por
q(x1 , x2 , . . . xn ) = λ1 x21 + λ2 x22 + · · · + λn x2n

será definida positiva (respectivamente definida negativa, semidefinida positiva, semidefi-


nida negativa) si y sólo si todos los coeficientes λi son números positivos (respectivamente
negativos, no negativos, no positivos).
Observación: En el caso anterior la matriz simétrica de la forma cuadrática es en realidad
una matriz diagonal, cuyos elementos en la diagonal principal son los números λi . Para
cualquier matriz A real y simétrica, se demuestra que ésta es congruente a la matriz
diagonal formada por los autovalores λ1 , λ2 , . . . , λn de A (que serán todos reales). Por
tanto, la forma cuadrática q : Rn −→ R es:

definida positiva, si λi > 0, para todo i = 1, 2, . . . , n,


definida negativa, si λi < 0, para todo i = 1, 2, . . . , n,
semidefinida positiva, si λi ≥ 0, para todo i = 1, 2, . . . , n,
semidefinida negativa, si λi ≤ 0, para todo i = 1, 2, . . . , n
indefinida, si existen i, j ∈ {1, 2, . . . , n} tal que λi λj < 0.

Ejemplos:

1. Caso n = 1: Es inmediato clasificar q(x) = λx2 .

definida positiva, si λ > 0,


definida negativa, si λ < 0,
ninguna de ambas, ni indefinida si λ = 0.

(a) λ > 0 (b) λ < 0 (c) λ = 0

Figura A.1: Forma cuadrática q(x) = λx2

2. Caso n = 2: Sea q(x, y) = λ1 x2 + λ2 y 2 , donde q tiene matriz diagonal


 
λ1 0
D=
0 λ2

entonces q es:

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 22

Figura A.2: Forma cuadrática q(x, y) definida positiva, con λ1 > 0, λ2 > 0.

definida positiva, si λ1 > 0, λ2 > 0, (paraboloide elı́ptico)


definida negativa, si λ1 < 0, λ2 < 0, (paraboloide elı́ptico)

Figura A.3: Forma cuadrática q(x, y) definida negativa con λ1 < 0, λ2 < 0.

indefinida en los dos casos siguientes:


• si λ1 > 0, λ2 < 0, (paraboloide hiperbólico)

Figura A.4: Forma cuadrática q(x, y) indefinida con λ1 > 0, λ2 < 0.

• si λ1 < 0, λ2 > 0, (paraboloide hiperbólico)


Como vemos, un método para clasificar una forma cuadrática es reducirla a cuadrados
perfectos o diagonalizarla. Un segundo método es aplicar el criterio de Sylvester. En

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 23

Figura A.5: Forma cuadrática q(x, y) indefinida con λ1 < 0, λ2 > 0.

este criterio se usa el concepto de submatriz angular: consideremos la matriz cuadrada


A = (aij ) de orden n. A las submatrices
 
  a11 a12 a13
a11 a12
A1 = a11 , A2 = , A3 =  a21 a22 a23  , . . . , An = A
a21 a22
a31 a32 a33

se les llama submatrices angulares de A. En forma esquemática


 
a11 | a12 | · · · a1n
 a21 a22 | · · · a2n 
A =  ..
 
.. . . . .. 
 . . . 
an1 an2 · · · ann

Teorema A.1 (Criterio de Sylvester) Sea q : Rn −→ R la forma cuadrática q(~x) =


X t AX, donde A es una matriz real simétrica de orden n. Consideremos los n menores
principales siguientes de la matriz A (es decir, los determinantes de las matrices angulares
∆1 = det A1 , ∆2 = det A2 , . . . , ∆n = det An = det A):
a11 a12 · · · a1i
a12 a22 · · · a2i
∆i = .. .. .. ; ∀ i = 1, 2, . . . , n
. . .
a1i a2i · · · aii

Entonces se cumple que esta forma (o bien la matriz A) es:

1. definida positiva ⇐⇒ ∆i > 0, para todo i = 1, 2, . . . , n,


2. definida negativa ⇐⇒ (−1)i ∆i > 0, para todo i = 1, 2, . . . , n,
3. indefinida, si ∃ i par tal que ∆i < 0,
4. indefinida, si ∃ i, j impares tal que ∆i ∆j < 0.

Este resultado nos viene a decir que, la forma cuadrática (o la matriz A) es definida
positiva, si y sólo si los determinantes de las submatrices angulares son positivos; es
definida negativa, si y sólo si los determinantes tienen signos alternados, comenzando con
∆1 = det A1 < 0; es indefinida cuando no se cumplen ninguno de los dos casos anteriores,
en los que:

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)


Tema 7. Extremos de funciones de varias variables reales 24

todos los ∆i con i par son positivos,


todos los ∆i con i impar tienen el mismo signo.

Nota: Observemos que los apartados 3 y 4 del criterio de Sylvester son condiciones
suficientes para que la forma cuadrática sea indefinida, pero no necesarias.
El teorema anterior, en el caso de una forma cuadrática binaria (en R2 ), quedarı́a:

Corolario A.1.1 (Criterio de Sylvester para n = 2) Sea q : R2 −→ R la forma cuadráti-


ca q(x, y) = Ax2 + 2Bxy + Cy 2 , siendo su matriz
 
A B
H=
B C

y los determinantes de las submatrices angulares


∆1 = A, ∆2 = AC − B 2 = det H

Entonces se cumple que la forma cuadrática es:

1. definida positiva, si y sólo si ∆1 > 0, ∆2 > 0,


2. definida negativa, si y sólo si ∆1 < 0, ∆2 > 0,
3. indefinida, si ∆2 < 0,
4. caso dudoso, si ∆2 = 0.

El criterio de Sylvester, que enunciamos, para el caso n = 3 serı́a:

Corolario A.1.2 Sea q : R3 −→ R la forma cuadrática q(x, y) = Ax2 + Dy 2 + F z 2 +


2Bxy + 2Cxz + 2Eyz, siendo su matriz
 
A B C
H= B D E 
C E F

y los determinantes de las submatrices angulares


A B
∆1 = A, ∆2 = , ∆3 = det H
B D

Entonces se cumple que la forma cuadrática es:

1. definida positiva, si y sólo si ∆1 > 0, ∆2 > 0, ∆3 > 0,


2. definida negativa, si y sólo si ∆1 < 0, ∆2 > 0, ∆3 < 0,
3. indefinida, si ∆2 < 0,
4. indefinida, si ∆1 ∆3 < 0,
5. caso dudoso, si ∆2 = 0 y ∆1 ∆3 ≥ 0,
6. caso dudoso, si ∆2 ≥ 0 y ∆1 ∆3 = 0.

Universidad de Córdoba Análisis Matemático I (1◦ Fı́sica)

También podría gustarte