0% encontró este documento útil (0 votos)
591 vistas26 páginas

Extremos Restringidos

Este documento describe extremos absolutos y restringidos en R2. Explica que los extremos restringidos involucran optimizar una función f sujeto a una restricción g(x, y) = c. Propone un procedimiento para optimizar f restringida a g mediante parametrización de la curva de restricción y optimización de la composición f ◦ c. También presenta el teorema de los multiplicadores de Lagrange, el cual establece que si (x0, y0) es un extremo de f restringida, entonces el gradiente de f en ese punto es

Cargado por

Mat
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
591 vistas26 páginas

Extremos Restringidos

Este documento describe extremos absolutos y restringidos en R2. Explica que los extremos restringidos involucran optimizar una función f sujeto a una restricción g(x, y) = c. Propone un procedimiento para optimizar f restringida a g mediante parametrización de la curva de restricción y optimización de la composición f ◦ c. También presenta el teorema de los multiplicadores de Lagrange, el cual establece que si (x0, y0) es un extremo de f restringida, entonces el gradiente de f en ese punto es

Cargado por

Mat
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Unidad 5: Extremos

Extremos absolutos y restringidos

1. Extremos restringidos: parametrizaciones en R2


En la práctica resulta común que, en lugar de optimizar «localmente» nos interesa optimizar
«globalmente», es decir, encontrar máximos y mínimos absolutos de una función sujeta a una o
varias restricciones. Veamos un ejemplo típico de cómo surgen estos problemas.
Ejemplo 1.1. Supongamos que queremos hallar el punto a menor distancia del (0, 0) sobre la recta
y = x + 1. En álgebra lineal vimos un método geométrico para resolver este problema. Otra manera
p resolver el siguiente problema de optimización. Sea d(x, y) = d((x, y), (0, 0)) = ||(x, y)−(0, 0)|| =
es
x2 + y 2 la función distancia del punto (x, y) al (0, 0). Nos interesa optimizar d sobre todos los
(x, y) que cumplen que y = x + 1. Entonces, podemos proceder como sigue.
Como la raíz cuadrada es una función creciente,
p no cambia la naturaleza de los puntos
críticos, es decir, los máximos/mínimos de f (x, y) son exactamente los máximos/mínimos
de f (x, y). Por lo tanto, para optimizar d(x, y), alcanza con optimizar f (x, y) = x2 + y 2 .
Como tenemos que optimizar f (x, y) = x2 +y 2 sobre los (x, y) que cumplen y = x+1, podemos
reemplazar en f y obtenemos g(x) = x2 +(x+1)2 = x2 +x2 +2x+1 = 2x2 +2x+1. Entonces,
debemos optimizar g, una función derivable en una variable. Por lo tanto, calculamos las
soluciones de g 0 (x) = 4x + 2 = 0, que nos dan x = − 21 . Un análisis rápido muestra que x = 12
es un mínimo absoluto de g. Por lo tanto f (x, y) = x2 + y 2 sujeto a y = x + 1 tiene un mínimo
absoluto en (x, y) = ( 21 , 12 + 1) = ( 21 , 32 ).

Atención: si queremos hallar la distancia mínima de y = x + 1 al (0, 0), reemplazamos ( 21 , 32 )


en d(x, y), no en f (x, y). Esto es porque la raíz cuadrada no cambia quiénes son los extremos,
pero si cambia los valores máximos y mínimos de la función.

El ejemplo anterior, si bien es muy sencillo, da una idea de lo que entendemos por estudiar
una función f sujeta a una restricción. Más formalmente, sean f : R2 → R y g : R2 → R y
consideremos la restricción g(x, y) = c. Optimizar f sujeta a la restricción g(x, y) = c significa
analizar los extremos de f considerando como dominio de definición sólo los puntos (x, y) que
cumplen la condición g(x, y) = c. Es decir, si llamamos C = {(x, y) ∈ R2 : g(x, y) = c} (se trata
de una curva de nivel), optimizar f sobre g(x, y) = c significa optimizar f : C → R. La primera
observación importante es que (si g no es la función constantemente 0) C no es abierto, porque
si nos paramos en cualquier punto de C, no hay disco centrado en el punto que esté contenido
en C. Esta es la razón por la cual no podemos usar el criterio del Hessiano para detectar puntos
críticos de f sujeta a g(x, y) = c. Geométricamente, f restringida a g(x, y) = 0 quiere decir
que estamos caminando sobre el gráfico de f a lo largo de la curva C. Para ser más concretos,
consideremos f (x, y) = x2 +xy+2y 2 . Supongamos que queremos optimizar f sujeta a. la restricción
g(x, y) = x2 + y 2 = 1. El criterio del Hessiano nos daría al punto (0, 0) como único punto crítico,
que resulta ser un mínimo (absoluto). Sin embargo, este punto no cumple la restricción g(x, y) = 1,
por lo tanto no tiene chance de ser un punto extremo de f restringida a g(x, y) = 1. De hecho, el
siguiente dibujo muestra cómo es la restricción de f , en donde se pueden apreciar cuáles son los
extremos.

1
Figura 1: La curva negra es la restricción de f a g(x, y) = 1. En el dibujo se aprecia que f tiene
varios extremos sobre la restricción, ninguno de los cuales es el (0, 0).

Por lo tanto no podemos usar el criterio del Hessiano para optimizar f sujeta a g(x, y) = c. No
obstante, el Ejemplo 1.1 sugiere la siguiente estrategia.
Procedimiento 1.2. Sea f : R2 → R. Supongamos que queremos optimizar f sujeta a la restric-
ción g(x, y) = c. Podemos proceder como sigue.
1. Hallamos alguna parametrización para la curva g(x, y) = c, digamos h : I → R2 con I un
intervalo.
2. Optimizamos F : I → R dada por F (t) = F ◦ h(t).

Ejemplo 1.3. Supongamos que queremos hallar el punto a menor p distancia del (0, −1) sobre la
curva y = x2 . Queremos optimizar d(x, y) = ||(x, y) − (0, −1)|| = x2 + (y + 1)2 sobre y = x2 .
Dado que la raíz cuadrada es creciente y no cambia la naturaleza de los extremos, alcanza con
optimizar f (x, y) = x2 + (y + 1)2 sobre y = x2 . Consideramos g(x, y) = y − x2 = 0.
1. Parametrizamos la curva g(x, y) = y − x2 = 0. Por ejemplo, podemos tomar c(t) = (t, t2 ) con
t ∈ R.
2. Optimizamos F (t) = f ◦ c(t) = f (t, t2 ) = t2 + (t2 + 1)2 . Para ello, calculamos F 0 (t) =
2t + 2(t2 + 1)2t y buscamos los puntos críticos,

F 0 (t) = 2t + 4t(t2 + 1) = 2t(1 + 2t2 + 2) = 0,

cuya única solución es t = 0. Haciendo un estudio de función vemos que F decrece de (−∞, 0)
y crece de (0, +∞), por lo tanto t = 0 es un mínimo absoluto. En este valor de t, c(t) = (0, 0),
por lo tanto (0, 0) es el punto a menor distancia del (0, −1) sobre y = x2 .

Ejercicio 1.4. Optimizar f (x, y) = x2 + y 2 − x − y + 1 sobre el la circunferencia x2 + y 2 = 1.


Resolución. Podemos parametrizar la circunferencia mediante c : [0, 2π] → R2 , c(t) = (cos(t), sen(t)).
Entonces optimizamos F : [0, 2π] → R dada por

F (t) = f ◦ c(t) = f (cos(t), sen(t)) = cos2 (t) + sen2 (t) − cos(t) − sen(t) − 1 = 2 − cos(t) − sen(t).

2
Calculamos los puntos críticos
F 0 (t) = sen(t) − cos(t) = 0,
es decir, sen(t) = cos(t). Si cos(t) = 0, t = π2 o 3π π
2 en [0, 2π], pero en estos valores sen( 2 ) =
3π sen(t)
1, sen( 2 ) = −1. Por lo tanto podemos pasar dividiendo cos(t) = tan(t) = 1, que tiene por soluciones
t = π4 y 5π
4 en [0, 2π].
Dado que F tiene por dominio al intervalo cerrado [0, 2π], el teorema de Weierstrass asegura que
hay extremos absolutos, y debemos considerar como puntos críticos a los extremos 0, 2π. Entonces,
nuestros puntos críticos son {0, π4 , 5π
4 , 2π} y evaluamos F en cada uno de estos valores,

π √ 5π √
F (0) = 1, F ( ) = 2 − 2, F ( ) = 2 + 2, F (2π) = 1.
4 4
Comparando valores, vemos que t = π4 es un mínimo absoluto para F , y t = 5π 4 es un máximo
√ √ √ √ √ √
absoluto para F . Dado que c( 4 ) = ( 2 , 2 ) y c( 4 ) = (− 2 , − 2 ) tenemos que ( 2 , 22 ) y
π 2 2 5π 2 2 2
√ √
(− 22 , − 22 ) son el máximo y mínimo absoluto de f en x2 + y 2 = 1, respectivamente.

2. Extremos restringidos: multiplicadores de Lagrange en R2


El Procedimiento 1.2 se basa en el hecho que conozcamos una parametrización para g(x, y) = c,
pero en general este no es el caso, o la parametrización puede hacer que la composición f ◦ c(t)
quede complicada. Sin embargo, el teorema de la función implícita nos dice que existe alguna
parametrización para g(x, y) = c alrededor de un (x0 , y0 ) de la curva, siempre que ∇g(x0 , y0 ) 6=
(0, 0). Más específicamente, supongamos que (x0 , y0 ) es un extremo local para f restringida a
g(x, y) = c. Si ∇g(x0 , y0 ) 6= (0, 0) (es decir, el punto no es un punto singular de la curva), podemos
despejar y = y(x) o x = x(y) alrededor de (x0 , y0 ). Para fijar ideas, supongamos que y = y(x). En
este caso,
∂g
(x, y(x))
y 0 (x) = − ∂x
∂g
.
∂y (x, y(x))

Consideremos c(t) = (t, y(t)). Debemos tener que F (t) = f ◦ c(t) tiene un extremo local en t0 = x0 ,
por lo tanto la regla de la cadena nos da

F 0 (t0 ) = ∇f (t0 ) · c0 (t0 ) = ∇f (x0 , y0 ) · (1, y 0 (x0 )) = 0.


∂g
(x ,y )
Entonces ∇f (x0 , y0 ) es perpendicular a (1, y 0 (x0 )) = (1, − ∂x
∂g
0 0
(x ,y )
). Entonces ∇f (x0 , y0 ) es per-
∂y 0 0
0 ∂g
pendicular a la recta t(1, y (x0 )). Tomando t = ∂y (x0 , y0 ) tenemos que ∇f (x0 , y0 ) es perpendicular
∂g ∂g
a ( ∂y (x0 , y0 ), − ∂x (x0 , y0 )). Pero un vector perpendicular a un vector de la forma (a, −b) es un
∂g ∂g
múltiplo de (b, a), en consecuencia, ∇f (x0 , y0 ) = λ( ∂x (x0 , y0 ), ∂y (x0 , y0 )) = λ∇g(x0 , y0 ). Hemos
probado el siguiente resultado fundamental, conocido como multiplicadores de Lagrange.
Teorema 2.1 (Multiplicadores de Lagrange en R2 ). Sea f : R2 → R una función de clase C 1 . Sea
g : R2 → R una función de clase C 1 . Supongamos que f restringida a g(x, y) = 0 tiene un extremo
en (x0 , y0 ), es decir, g(x0 , y0 ) = 0. Si ∇g(x0 , y0 ) 6= (0, 0) debe tenerse que existe λ ∈ R tal que

∇f (x0 , y0 ) = λ∇g(x0 , y0 ).

Del teorema anterior resulta natural dar la siguiente definición.


Definición 2.2 (Puntos críticos). Sean f, g : R2 → R de clase C 1 . Un punto crítico para f
restringida a g(x, y) = 0 es un punto (x0 , y0 ) ∈ U tal que
(
∇g(x0 , y0 ) = (0, 0)
(es decir, (x0 , y0 ) es un punto singular), o
g(x0 , y0 ) = 0
(
∇f (x0 , y0 ) = λ∇g(x0 , y0 )
.
g(x0 , y0 ) = 0

3
Veamos cómo se usa el Teorema 2.1, aplicándolo para resolver el Ejercicio 1.4.
Ejemplo 2.3. Consideremos f (x, y) = x2 + y 2 − x − y + 1 sobre g(x, y) = x2 + y 2 = 1. Por el
Teorema 2.1, un extremo de f sujeta a la restricción indicada debe ser un punto crítico, es decir,
es un punto singular de g(x, y) = x2 + y 2 = 1, o existe λ tal que
(
∇f (x0 , y0 ) = λ∇g(x0 , y0 )
.
g(x0 , y0 ) = 0

Primero estudiemos los puntos singulares de g(x, y) = x2 + y 2 = 1. Planteamos


(
∇g(x, y) = (0, 0)
,
g(x, y) = 0

es decir, como ∇g(x, y) = (2x, 2y), 


2x = 0

2y = 0 .

 2
x + y2 = 1
De las primeras dos ecuaciones tenemos que x = y = 0. Reemplazando en la tercera ecuación vemos
que 02 + 02 = 0 6= 1, por lo tanto g(x, y) = 1 no tiene puntos singulares. Entonces, buscamos los
puntos críticos que cumplen que existe λ tal que
(
∇f (x, y) = λ∇g(x, y)
,
g(x, y) = 1

es decir, como ∇f (x, y) = (2x − 1, 2y − 1),



2x − 1 = λ2x

2y − 1 = λ2y .

 2
x + y2 = 1

Para resolver este sistema, primero trabajamos con las primeras dos ecuaciones. De la primera
ecuación, podemos despejar λ = 2x−12x siempre que sea x 6= 0. Si x = 0, reemplazamos en la tercera
ecuación 02 + y 2 = 1, de donde y = ±1, y podemos ver que (0, ±1) cumplen las tres ecuaciones.
Por otro lado, si x 6= 0, podemos reemplazar λ = 2x−1
2x en la segunda ecuación,

2x − 1 (2x − 1)y
2y − 1 = 2y = ,
2x x
por lo tanto (2y − 1)x = (2x − 1)y. Distribuyendo, obtenemos que 2yx − x = 2xy − y, es decir
x = y. Reemplazando en la tercera ecuación,

x2 + x2 = 2x2 = 1,
√ √ √
es decir x = ± √12 = ± 22 , y por lo tanto obtenemos ±( 22 , 22 ), que son puntos que cumplen las
tres ecuaciones. √ √
Concluimos que los candidatos a extremos, es decir, los puntos críticos, son {(0, ±1), ±( 22 , 22 )}.
El problema que tenemos es que el Teorema 2.1 no dice nada sobre la naturaleza de los puntos
críticos. No obstante, si tuviéramos el dato adicional que f alcanza máximos y mínimos absolutos
sobre g(x, y) = 1, estos extremos deben ser puntos críticos, y por lo tanto los podemos hallar
evaluando f en estos puntos y comparando,
√ √ √ √
2 2 √ 2 2 √
F (0, 1) = 1, F (0, −1) = 3, F ( , ) = 2 − 2, F (− ,− ) = 2 + 2,
2 2 2 2
√ √ √ √
de donde ( 22 , 22 ) y (− 22 , − 22 ) son el mínimo y máximo absoluto de f , respectivamente, como
lo habíamos corroborado en el Ejercicio 1.4.

4
Ejemplo 2.4. Supongamos que queremos optimizar f (x, y) = xy sujeta a la restricción x2 + y 2 = 1.
Hasta ahora, sólo sabemos que, de tener f extremos absolutos, estos deben ser puntos críticos.
Supongamos entonces que f tiene máximos y mínimos absolutos en la restricción. Llamemos
g(x, y) = x2 + y 2 − 1. Como f y g son de clase C 1 , un punto crítico (x, y) debe cumplir algu-
na de las siguientes condiciones.

(
∇g(x, y) = (0, 0)
.
g(x, y) = 0
Notemos que ∇g(x, y) = (2x, 2y) = (0, 0) si y sólo si (x, y) = (0, 0). Pero g(0, 0) = −1 6= 0,
por lo tanto no hay puntos críticos que cumplan esto.
Debe existir λ ∈ R tal que (
∇f (x, y) = λ∇g(x, y)
.
g(x, y) = 0
Como ∇f (x, y) = (y, x), debe tenerse que

y = λ · (2x)

x = λ · (2y) .

 2
x + y2 − 1 = 0

Tenemos varias formas de intentar resolver este sistema. Una posibilidad es despejar λ y
y
reemplazarlo en otra ecuación. Por ejemplo, de la primera ecuación tenemos que λ = 2x
siempre que x 6= 0. Entonces, tenemos que considerar por separado el caso x = 0. Cuando
x = 0, en la última ecuación obtenemos 02 + y 2 − 1 = 0 que nos da y = ±1. Pero si
reemplazamos en la primera ecuación obtenemos 1 = 0, que es una contradicción. Entonces
y y
x 6= 0. Ahora, reemplazamos λ = 2x en la segunda ecuación y obtenemos x = 2x · 2y, es decir
2 2 2 2
x = y . Entonces x − y = (x − y)(x + y) = 0 de donde x = y o x = −y. En ambos casos,
reemplazamos en la tercera ecuación y obtenemos

x2 + (±x)2 − 1 = x2 + x2 − 1 = 2x2 − 1 = 0,

1 2
es decir x2 = 2 de donde x = ± √12 = ± 2 . Usando que x = y o x = y obtenemos cuatro
√ √ √ √ √ √ √ √
2 2 2 2 2 2 2 2
puntos críticos, ( 2 , 2 ), ( 2 , − 2 ), (− 2 , 2 ), (− 2 , − 2 ).

Ahora que tenemos los puntos críticos, y que sabemos que f tiene máximos absolutos y mínimos
absolutos, lo que hacemos es evaluar f en los puntos críticos. El√ menor √
y mayor

valor

serán el
2 2 2 2
mínimo y máximo de la función, respectivamente. Dado que f ( 2 , 2 ) = f (− 2 , − 2 ) = 21 y
√ √ √ √ √ √ √ √
f ( 22 , − 22 ) = f (− 22 , 22 ) = − 12 , tenemos que ( 22 , 22 ), (− 22 , − 22 ) son máximos absolutos, y
√ √ √ √
( 22 , − 22 ), (− 22 , 22 ) son mínimos absolutos.
Como vimos en el Ejemplo 2.3 y en el Ejemplo 2.4, necesitamos algún criterio para poder
asegurar que existen extremos absolutos. Si pensamos en funciones en una variable, teníamos el
teorema de Weierstrass. Concretamente, toda función f : [a, b] → R continua alcanzaba máximos
y mínimos absolutos. Para el teorema es fundamental que el intervalo [a, b] es cerrado. ¿Cuál sería
el análogo del intervalo [a, b] en dos o más variables?

3. Conjuntos compactos y el teorema de Weierstrass


En la práctica resulta común que, en lugar de optimizar «localmente» nos interesa optimizar
«globalmente», es decir, encontrar máximos y mínimos absolutos de una función sujeta a varias
restricciones. Esto lleva al problema de determinar cuándo una función tiene extremos absolutos.
De Análisis I sabemos que para funciones en una variable, si f : [a, b] → R es continua, por
el teorema de Weierstrass tenemos que f alcanza máximos y mínimos absolutos. Este teorema
seguirá siendo válido para funciones en varias variables una vez que generalicemos adecuadamente
los intervalos cerrados [a, b]. Con este fin, comenzamos con la siguiente definición.

5
Definición 3.1 (Conjunto cerrado). Un conjunto A ⊆ Rn se dice cerrado1 si contiene todos los
puntos de su frontera.
Los conjuntos cerrados pueden ser muy complicados. La idea intuitiva es que, para que un
conjunto sea cerrado, tiene que contener todo su borde.

Figura 2: De izquierda a derecha: el primer conjunto es abierto pero no cerrado, porque no contiene
a su borde. El segundo conjunto es cerrado. El tercer conjunto no es abierto ni cerrado.

Por ejemplo, en R los intervalos cerrados [a, b] son conjuntos cerrados, ya que la frontera de un
intervalo consiste de los extremos {a, b}. En R2 , A = {(x, y) ∈ R2 : x2 + y 2 ≤ 1} es cerrado, ya que
es el círculo de radio 1 con todos los puntos de la curva x2 + y 2 = 1. Similarmente, A = {(x, y) ∈
2 2
R2 : xa2 + yb2 ≤ 1}, la elipse con todo su interior, es un conjunto cerrado. Notemos que las curvas
F (x, y) = c también son conjuntos cerrados. En R3 , la esfera {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} es
cerrado, como así también el exterior de la esfera, {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≥ 1}.
En general, tenemos un criterio bastante útil para detectar si un conjunto es abierto o cerrado.
Proposición 3.2. Sea A ⊆ Rn .
1. Si A está definido usando las relaciones > o <, y funciones continuas, entonces A es abierto;
2. Si A está definido usando las relaciones ≤, ≥ o =, y funciones continuas, entonces A es
cerrado.
Notemos que los conjuntos cerrados no son todavía la generalización de los intervalos [a, b] que
queremos; por ejemplo, A = {x ∈ R : x ≥ 0} = [0, +∞) es cerrado pues f (x) = x, g(x) = 0 son
continuas, y usamos la relación ≥. Entonces, la razón por la cual [0, +∞) no es de la forma [a, b]
porque no es un intervalo acotado. Esto motiva la siguiente definición.
Definición 3.3 (Conjunto acotado). Un conjunto A ⊆ Rn se dice acotado si está contenido en
algún disco. Analíticamente, esto significa que hay algún número C tal que todo (x1 , . . . , xn ) ∈ A
cumple que ||(x1 , . . . , xn )|| ≤ C.

En general, si dibujamos las regiones podremos saber si son acotadas o no. Por ejemplo, {(x, y) ∈
R2 : x2 + y 2 ≤ 1} es acotado, mientras que {(x, y) ∈ R2 : x2 − y 2 = 1} no lo es.
Ahora podemos dar la generalización correcta de los intervalos [a, b].
1 La definición tradicional (equivalente a la que damos) es que un conjunto es cerrado si su complemento, Rn \A =

{(x1 , . . . , xn ) ∈ Rn : (x1 , . . . , xn ) ∈
/ A}, es abierto. Optamos por la definición en términos de la frontera ya que es
más geométrica y más sencilla de visualizar.

6
Definición 3.4 (Conjunto compacto). Un conjunto A ⊆ Rn se dice compacto si es cerrado y
acotado.

Por ejemplo, el círculo x2 + y 2 ≤ 1 define un conjunto compacto. Similarmente la región


x2 y2
4 + 9 ≤ 1 es compacta (es cerrada y está encerrada por una elipse, que es acotada). Pero no
todo conjunto cerrado es acotado. La hipérbola x2 − y 2 = 1 define un conjunto cerrado pero no
acotado. Evidentemente, [a, b] es cerrado y acotado, por lo tanto es un conjunto compacto.
Tenemos que el problema de optimizar una función continua en un compacto siempre tiene
solución.
Teorema 3.5 (Teorema de Weierstrass). Sea K ⊆ Rn un subconjunto compacto. Si f : K → R
es continua, tenemos que f alcanza sus máximos y mínimos absolutos. En particular, cuando
K = [a, b] recuperamos el teorema de Weierstrass clásico.
Si K no es cerrado o acotado, no tienen por qué haber extremos absolutos. Los ejemplos son los
mismos que los que vimos para funciones en una variable. Si K = (0, 1) y f (x) = x1 , la función es
continua en (0, 1) pero no alcanza su máximo absoluto. El problema es que el (0, 1) no es cerrado.
Por otro lado, si K = [0, +∞) y f (x) = x, tenemos que f tampoco alcanza su máximo absoluto a
pesar de ser continua en K, pero K no es acotado.
Con el teorema de Weierstrass y multiplicadores de Lagrange podemos hallar extremos absolutos
en curvas que son compactas.
Ejercicio 3.6. Determinar la menor y la mayor distancia de un punto que se encuentra en la elipse
x2 + 4y 2 − 4 = 0 al punto (1, 0).

Resolución. Los puntos que se p encuentran a menor y mayor distancia deben ser puntos críticos de
d(x, y) = ||(x, y) − (1, 0)|| = (x − 1)2 + y 2 restringida a g(x, y) = x2 + 4y 2 − 4 = 0. Haciendo la
reducción de siempre, alcanza con determinar los puntos críticos de f (x, y) = (x − 1)2 + y 2 sujeta
a la restricción g(x, y) = x2 + 4y 2 − 4 = 0. Como g(x, y) = 0 define un conjunto cerrado (pues
g(x, y) = x2 + 4y 2 − 4, h(x, y) = 0 son continuas y el conjunto está definido usando la relación =),
y es acotado (es una elipse) tenemos que estamos estudiando f sobre un conjunto compacto. Como
f es continua en R2 , en particular en la región definida por g(x, y) = 0, el teorema de Weierstrass
implica que existen máximos y mínimos absolutos de f . Para hallar estos extremos, calculamos los
puntos críticos y evaluamos f en estos puntos.

Figura 3: Gráfico de x2 + 4y 2 = 4. Es cerrado (contiene a su frontera) y es acotado.

Como f y g son de clase C 1 , un punto crítico (x, y) debe cumplir alguna de las siguientes dos
condiciones.

(
∇g(x, y) = (0, 0)
.
g(x, y) = 0
Notemos que ∇g(x, y) = (2x, 8y) = (0, 0) si y sólo si (x, y) = (0, 0). Pero g(0, 0) = −4 6= 0,
por lo tanto no hay puntos críticos que cumplan esto.

Debe existir λ ∈ R tal que (


∇f (x, y) = λ∇g(x, y)
.
g(x, y) = 0

7
Como ∇f (x, y) = (2(x − 1), 2y), debe tenerse que

2(x − 1) = λ · 2x

2y = λ · 8y .

 2
x + 4y 2 − 4 = 0

De la segunda ecuación tenemos que 2y − λ8y = 2y(1 − 4λ) = 0 es decir y = 0 o λ = 41 . En el


primer caso, reemplazamos en la tercera ecuación y obtenemos que x2 +4·02 −4 = x2 −4 = 0, es
decir x = ±2. Reemplazando, vemos que (±2, 0) cumplen las tres ecuaciones. Entonces (2, 0)
y (−2, 0) son puntos críticos. Si λ = 41 , reemplazamos en la primera ecuación y obtenemos
2(x−1) = 2x−2 = 41 ·2x = 12 x. Entonces 2x− 12 x = 23 x = 2, de donde x = 43 . Reemplazando en

la tercera ecuación obtenemos ( 43 )2 +4y 2 −4 = 0, de donde a que 4y 2 = 20
9 , es decir y = ± 35 .
√ √ √
Reemplazando, vemos que ( 34 , ± 35 ) cumplen las tres ecuaciones. Entonces ( 43 , 35 ), ( 34 , − 35 )
son puntos críticos.
Ahora que tenemos todos los puntos críticos, y que sabemos que f tiene máximos y mínimos
absolutos, lo que hacemos es evaluar f en los puntos críticos. El menor y mayor valor serán √
el
4 5
mínimo y máximo de la función, respectivamente. Dado que f (2, 0) = 1, f (−2, 0) = 9, f ( 3 , ± 3 ) =

2 4 5
3 , concluimos que f tiene un máximo en (−2, 0) con máximo valor 9, y tiene un mínimo en ( 3 , ± 3 )
2
con mínimo valor 3 .
Ejercicio 3.7. Sea C ⊆ R2 la curva dada por la ecuación 5x2 + 5y 2 + 6xy − 2 = 0. Se tiene que
C es un conjunto compacto2 . Usando este hecho, hallar los puntos de la curva que se encuentren a
mayor distancia del (0, 0). ¿Cuál es la distancia máxima?

Figura 4: Gráfico de 5x2 + 5y 2 + 6xy − 2 = 0. La curva es cerrada (contiene a su frontera) y es


acotada.

p que se encuentran a mayor distancia deben ser puntos críticos de d(x, y) =


Resolución. Los puntos
||(x, y) − (0, 0)|| = x2 + y 2 restringida a g(x, y) = 5x2 + 5y 2 + 6xy − 2 = 0. Haciendo la reducción
usual, alcanza con determinar los puntos críticos de f (x, y) = x2 + y 2 sujeta a la restricción
g(x, y) = 5x2 + 5y 2 + 6xy − 2 = 0. Como el enunciado dice que g(x, y) = 0 es un conjunto compacto
y f es una función continua en R2 , el teorema de Weierstrass implica que existen máximos y
mínimos absolutos de f . Para hallar estos extremos, calculamos los puntos críticos y evaluamos f
en estos puntos. Notemos que en este caso no es evidente cómo parametrizar 5x2 +5y 2 +6xy−2 = 0,
por lo tanto multiplicadores de Lagrange es particularmente útil en este caso.
Como f y g son de clase C 1 , un punto crítico (x, y) debe cumplir alguna de las siguientes dos
condiciones.

(
∇g(x, y) = (0, 0)
.
g(x, y) = 0
2 En efecto, lo único no obvio es que el conjunto sea acotado. Para ver que es acotado, se puede proceder como

sigue. Como 5x2 + 5y 2 + 6xy − 2 = 0, tenemos √ 2


√x con a = 5, b = 6y, c = 5y − 2. Usando
una ecuación cuadrática en
−6y± 36y 2 −4·5(5y 2 −2) −6y± −64y 2 +40
la resolvente, tenemos que sus raíces son 10
= .
Para que esta ecuación tenga
10 q
40 5 5
soluciones reales debe tenerse que 40 − 64y 2 ≥ 0, es decir y 2 ≤ 64
Tomando raíz cuadrada, |y| ≤
= 8
. 8
. Es decir,
q
2 2 5
si (x, y) cumple que 5x + 5y + 6xy − 2 = 0, y debe estar acotado por 8
. Razonando de la misma manera con
q
5 2 2
x, tenemos que |x| ≤ 8
. Entonces, un punto de 5x + 5y + 6xy − 2 = 0 tiene x, y acotados, y por lo tanto define
un conjunto acotado.

8
Notemos que ∇g(x, y) = (10x + 6y, 10y + 6x) = (0, 0) nos da el sistema
(
10x + 6y = 0
,
10y + 6x = 0

que se puede comprobar fácilmente que tiene por única solución al (0, 0). Pero g(0, 0) = −2 6=
0, por lo tanto no hay puntos críticos que cumplan esto.
Debe existir λ ∈ R tal que (
∇f (x, y) = λ∇g(x, y)
.
g(x, y) = 0
Como ∇f (x, y) = (2x, 2y), debe tenerse que

2x = λ(10x + 6y)

2y = λ(10y + 6x) .

 2
5x + 5y 2 + 6xy − 2 = 0

Para resolver este sistema, podemos proceder como sigue. Primero, despejamos λ de la pri-
2x
mera ecuación. Entonces λ = 10x+6y , siempre y cuando 10x + 6y 6= 0, porque en este caso el
despeje no se puede hacer. Entonces reemplazamos en la segunda ecuación, y obtenemos que
2x
2y = (10y + 6x),
10x + 6y

que equivale a que 2y(10x + 6y) = 2x(10y + 6x). Distribuyendo, llegamos a que

20xy + 12y 2 = 20xy + 12x2 ,

de donde 12y 2 = 12x2 . Simplificando, esta condición es x2 = y 2 , que implica que y = x o


y = −x. Si y = x, reemplazamos en la tercera ecuación, y obtenemos que

5x2 + 5x2 + 6x2 − 2 = 0,

es decir que 16x2 = 2, obteniendo que x = ± √18 . Reemplazando en y = x, tenemos que


±( √18 , √18 ) son posibles puntos críticos. Se comprueba que son puntos críticos reemplazando
en las ecuaciones del sistema y corroborando que se cumplan. Similarmente, si y = −x,
reemplazamos en la tercera ecuación, y obtenemos que

5x2 + 5x2 − 6x2 − 2 = 0,

es decir que 4x2 = 2, obteniendo que x = ± √12 . Reemplazando en y = −x tenemos que


( √12 , − √12 ), (− √12 , √12 ) son posibles puntos críticos. Se comprueba que son puntos críticos
reemplazando en las ecuaciones del sistema y corroborando que se cumplan.
Dado que para despejar λ supusimos que 10x+6y 6= 0, nos resta considerar esta posibilidad. Si
10x+6y = 0, entonces 2x = λ(10x+6y) = 0, de donde x = 0. Pero entonces 10x+6y = 6y = 0,
por lo tanto y = 0. Así, 10x + 6y = 0 nos da el punto (0, 0) que no cumple la tercera ecuación
5x2 + 5y 2 + 6xy − 2 = 0.
Ahora que tenemos todos los puntos críticos, y que sabemos que f tiene máximos y mínimos
absolutos, lo que hacemos es evaluar f en los puntos críticos. El menor y mayor valor serán
el mínimo y máximo valor de la función, respectivamente. Dado que f (±( √18 , √18 )) = 41 y
f ( √12 , − √12 ) = f (− √12 , √12 ) = 1, tenemos que ( √12 , − √12 ), (− √12 , √12 ) son los puntos donde la
distancia es máxima. Para calcular la distancia, reemplazamos en la función original, f (x, y),
y obtenemos que f ( √12 , − √12 ) = f (− √12 , √12 ) = 1. Así, la distancia máxima es 1.

9
4. Extremos con varias restricciones en R2
En general, nos interesará optimizar un problema en regiones que no son ni abiertas ni res-
tricciones a curvas o superficies. Concretamente, el problema que estudiaremos ahora es el de
optimizar f : K ⊆ R2 → R donde K es un subconjunto compacto de cierta forma. A grandes
rasgos, tendremos dos casos, el primero siendo un caso particular del segundo caso.

4.1. Regiones encerradas por una restricción


El primer ejemplo a estudiar consiste en regiones que están limitadas por una restricción
g(x, y) = 0 con g de clase C 1 , con la curva definida por la restricción compacta.

x2 y2
Figura 5: Región encerrada por la restricción compacta g(x, y) = 4 + 9 − 1 = 0.

En este caso, si D ⊆ R2 es la región determinada por la restricción, y f : D → R es continua


en D, y de clase C 1 en algún abierto que contenga a D, el teorema de Weierstrass implica que f
tiene máximo y mínimo absoluto en D. Entonces, estos extremos son puntos críticos, y tienen que
cumplir algunas de las siguientes condiciones.

El punto crítico se encuentra en el interior de D. Como el interior de D es abierto, sabemos


que los puntos críticos verifican la condición ∇f (x, y) = (0, 0). Entonces determinamos los
(x, y) que cumplen ∇f (x, y) = (0, 0) y que se encuentran en D, es decir, verificamos si
(x, y) ∈ D.
El punto crítico se encuentra en el borde de D. Como el borde de D es la restricción g(x, y) =
0, podemos estudiar los puntos críticos,

• parametrizando g(x, y) = 0 mediante con alguna c : I → R y optimizando F (t) = f ◦c(t),


o
• usando multiplicadores de Lagrange: los puntos críticos verifican que, o bien ∇g(x, y) =
(0, 0) y g(x, y) = 0 (son puntos singulares), o que existe λ ∈ R tal que
(
∇f (x, y) = λ∇g(x, y)
.
g(x, y) = 0

Entonces determinamos los (x, y) que cumplen algunas de estas condiciones.

Una vez que hallamos todos los puntos críticos, evaluamos f en todos esos puntos; los valores
más grandes y más pequeños se corresponderán a los máximos y mínimos absolutos de f en D,
respectivamente.
Ejercicio 4.1. Optimizar la función f (x, y) = x2 + y 2 − x − y + 1 en la región D = {(x, y) ∈ R2 :
x2 + y 2 ≤ 81 }.

Resolución. Como D es un conjunto cerrado (está definido por las funciones continuas g(x, y) =
x2 + y 2 y h(x, y) = 1) y es acotado (la restricción g(x, y) = x2 + y 2 ≤ 18 es un círculo, que
es acotado), tenemos que D es compacto. Como f es continua en D, el teorema de Weierstrass
implica que la función alcanza máximos y mínimos absolutos en D. Entonces buscamos los puntos
críticos de f en D. Sea g(x, y) = x2 + y 2 − 81 .

10
Figura 6: Región x2 + y 2 ≤ 18 . Se tiene que es cerrada (contiene su frontera) y es acotada.

(Interior) Como f es de clase C 1 , los puntos críticos en el interior de D son los (x, y)’s con
∇f (x, y) = (0, 0). Dado que ∇f (x, y) = (2x − 1, 2y − 1) = (0, 0) si y sólo si (x, y) = ( 21 , 12 ),
tenemos que ( 12 , 12 ) es un candidato a punto crítico de f en D. Corroboremos si el punto está
en D. Dado que ( 12 )2 + ( 12 )2 = 41 > 18 tenemos que ( 12 , 12 ) ∈
/ D, y por lo tanto no es un punto
crítico de f en D.
(Borde) Como f y g son de clase C 1 , podemos usar multiplicadores de Lagrange para hallar
los puntos críticos en el borde de D; son los (x, y)’s tales que ocurre alguna de las siguientes
dos condiciones.
(
∇g(x, y) = (0, 0)
• . Como ∇g(x, y) = (2x, 2y) = (0, 0) si y sólo si (x, y) = (0, 0) y
g(x, y) = 0
g(0, 0) = − 81 6= 0, no hay puntos críticos que cumplan esto.
(
∇f (x, y) = λg(x, y)
• , es decir
g(x, y) = 0

2x − 1 = λ · 2x

2y − 1 = λ · 2y .
x + y 2 − 81 = 0

 2

De la primera ecuación obtenemos que λ = 2x−1 2x siempre que x 6= 0. Pero si x =


0, reemplazando en la primera ecuación tenemos que −1 = 0, que es contradictorio.
Entonces x 6= 0 y λ = 2x−1
2x . Reemplazamos en la segunda ecuación y obtenemos que
2y − 1 = 2x−1
2x 2y = 2x−1
x y. Despejando, llegamos a que

(2y − 1)x = (2x − 1)y,

que distribuyendo nos da


2yx − x = 2xy − y,
es decir x = y. Si reemplazamos en la tercera ecuación obtenemos que x2 + x2 − 81 = 0,
es decir 2x2 = 18 , de donde x = ± 41 . Entonces ±( 14 , 14 ) es un candidato a punto crítico; se
verifica que cumplen las tres ecuaciones, y evidentemente están en D (porque la región
está limitada por una sola restricción, y los puntos cumplen la restricción). Entonces
( 41 , 14 ), (− 14 , − 14 ) son puntos críticos.

Teniendo todos los puntos críticos evaluamos f en los puntos. Dado que f ( 14 , 14 ) = 58 y f (− 14 , − 14 ) =
13 1 1 13 1 1
8 , tenemos que f tiene un máximo en (− 4 , − 4 ) con máximo valor 8 y tiene un mínimo en ( 4 , 4 )
5
con mínimo valor 8 .

4.2. Regiones determinadas por más de una restricción


En general, puede ocurrir que la región esté encerrada por más de una restricción. En este caso
el procedimiento es muy parecido al caso de una restricción, pero hay que tener un poco más de
cuidado.

11
Figura 7: Región encerrada por las restricciones 1 ≤ x2 + y 2 ≤ 4, y ≥ 0. La región está limitada
por tres curvas: las circunferencia x2 + y 2 = 1, x2 + y 2 = 4, y la recta y = 0.

Supongamos que D es una región compacta limitada por varias restricciones, es decir, por finitas
curvas g1 (x, y) = 0, g2 (x, y) = 0, . . ., todas las gi de clase C 1 . Si f : D → R es continua y de clase
C 1 en algún abierto que contenga a D, el teorema de Weierstrass implica que f tiene máximo y
mínimo absoluto en D. Entonces, estos extremos son puntos críticos, y tienen que cumplir algunas
de las siguientes condiciones.

El punto crítico se encuentra en el interior de D. Como el interior de D es abierto, sabemos


que los puntos críticos verifican la condición ∇f (x, y) = (0, 0). Entonces determinamos los
(x, y) que cumplen ∇f (x, y) = (0, 0) y que se encuentran en D, es decir, verificamos si
(x, y) ∈ D.
El punto crítico se encuentra en el borde de D. En este caso, hay dos posibilidades:

1. El punto crítico se encuentra exactamente en una de las restricciones gi . En este caso,


podemos estudiar los puntos críticos
• parametrizando gi (x, y) = 0 mediante alguna ci : I → R y optimizando F (t) =
f ◦ ci (t), o
• usando multiplicadores de Lagrange; los puntos críticos verifican que, o bien ∇gi (x, y) =
(0, 0) y gi (x, y) = 0, o que existe λ ∈ R tal que
(
∇f (x, y) = λ∇gi (x, y)
.
gi (x, y) = 0

Entonces determinamos los (x, y) que cumplen algunas de estas condiciones, y co-
rroboramos si estos puntos están en D. Esto es importante, porque al tener más de
una restricción, este paso podría dar puntos que no están en D.
2. La consideración anterior tiene el problema que, al estudiar sobre cada restricción por
separado, no contempla que las restricciones interactúan entre sí. Concretamente, podría
ocurrir que el extremo se encuentre simultáneamente en las restricciones g1 (x, y) =
0, g2 (x, y) = 0, y que estos extremos no sean detectados por multiplicadores de Lagrange.
Esta situación es similar a cuando en funciones de una variable, f : [a, b] → R, agregamos
los extremos a, b como puntos críticos. Entonces, calculamos los vértices de D, que
serían las intersecciones de las restricciones que definen a D. Por ejemplo, si g1 (x, y) =
0, g2 (x, y) = 0 son restricciones de D, hay que resolver
(
g1 (x, y) = 0
.
g2 (x, y) = 0

Una vez calculados estos puntos, verificamos que estén en D.


Una vez que hallamos todos los puntos críticos, evaluamos f en todos esos puntos; los valores
más grandes y más pequeños se corresponderán a los máximos y mínimos absolutos de f en
D, respectivamente.

Ilustremos esta situación con varios ejemplos.


Ejercicio 4.2. Hallar los extremos absolutos f (x, y) = x2 + y 2 − 3y sobre la región limitada por
y ≤ −x − 2, x2 + y 2 ≤ 4.

12
Resolución. La región sobre la que hay que optimizar f es la de la figura siguiente.

Dado que la región es acotada (está contenida en un círculo) y es cerrada (está definida por dos
restricciones ≤), tenemos que es una región compacta. Puesto que f es continua, concluimos que
f alcanza sus máximos y mínimos absolutos sobre esta región. Estos extremos absolutos deben ser
puntos críticos, que deben cumplir alguna de las siguientes condiciones.

(Interior de la región) Podrían estar en el interior de la región. Puesto que f es de clase C 1 ,


esto implica que ∇f (x, y) = (0, 0). Planteamos ∇f (x, y) = (2x, 2y − 3) = (0, 0) lo que nos da
(x, y) = (0, 23 ). Pero este punto no cumple la restricción 32 ≤ 0 − 2 = −2, por lo tanto no es
un punto crítico.

(Bordes) Podrían estar en el borde de la región. Esto quiere decir que, o bien están en la recta
y = −x − 2, o en la circunferencia x2 + y 2 = 4. Entonces estudiamos estas dos condiciones por
separado. Si están en la recta y = −x − 2, consideramos la parametrización c(t) = (t, −t − 2)
con t ∈ R y buscamos los puntos críticos de

F (t) = f ◦ c(t) = t2 + (−t − 2)2 − 3(−t − 2)


= t2 + t2 + 4t + 4 + 3t + 6 = 2t2 + 7t + 10.

Entonces, debe cumplir que F 0 (t) = 4t + 7 = 0. Es decir, que t = − 47 . Entonces y = −x − 2 =


7 1 7 1
4 − 2 = − 4 y obtenemos (− 4 , − 4 ). Se corrobora que este punto está en la región, pues
evidentemente está sobre la recta y = −x − 2, y (− 47 )2 + (− 14 )2 = 49 1 50
16 + 16 = 16 ≤ 4.
Ahora estudiamos el borde x2 + y 2 = 4. Poniendo g(x, y) = x2 + y 2 − 4, tenemos que un
extremo absoluto debe cumplir la condición de multiplicadores de Lagrange. Primero notemos
que ∇g(x, y) = (2x, 2y) = (0, 0) si y sólo si (x, y) = (0, 0). Dado que g(0, 0) = −4 6= 0, resulta
que (0, 0) no es punto crítico. Entonces debe cumplirse que existe λ ∈ R tal que
(
∇f (x, y, ) = λ∇g(x, y)
,
g(x, y) = 0

es decir 
2x = λ2x

2y − 3 = λ2y . (1)

 2
x + y2 − 4 = 0
De la primera ecuación de (1) concluimos que 2x − λ2x = 2x(1 − λ) = 0, es decir que x = 0
o λ = 1. Si x = 0, reemplazando en la tercera ecuación obtenemos que 02 + y 2 − 4 = 0,
es decir y 2 = 4, por lo tanto y = ±2. Es decir, obtenemos los candidatos a puntos críticos
(0, ±2). Si λ1, en la tercera ecuación nos queda 2y − 3 = 2y, que conduce a la contradicción
0 = −3. Concluimos que (0, ±2) son los únicos posibles puntos críticos sobre la circunferencia
x2 +y 2 = 4. Ahora corroboramos si estos puntos están en la región. Dado que (0, 2) no cumple
que 2 ≤ 0 − 2 = −2, pero (0, −2) sí, tenemos que (0, −2) es el único punto crítico de f con
la restricción g(x, y) = 0 que está en la región.
(Vértices) Podrían ser puntos que están en la intersección entre las curvas que definen la
región. Entonces, estos puntos cumplen que
(
x2 + y 2 = 4
.
y = −x − 2

13
De la condición y = −x − 2 reemplazamos en la ecuación de la circunferencia, y obtenemos

x2 + (−x − 2)2 = x2 + x2 + 4x + 4 = 2x2 + 4x + 4 = 4,

es decir
2x2 + 4x = 2x(x + 2) = 0.
Entonces x = 0 o x = −2. Si x = 0, tenemos que y = −x − 2 = −0 − 2 = −2, mientras que
si x = −2, se tiene que y = −x − 2 = 2 − 2 = 0. Entonces los vértices son (0, −2), (−2, 0), y
se comprueba que ambos están en la región.
Concluimos que los únicos puntos críticos son (− 47 , − 14 ), (0, −2), (−2, 0). Evaluando f en estos
puntos, concluimos que (0, −2) y (− 47 , − 41 ) son el máximo y mínimo absoluto de f en la región,
respectivamente.
Ejercicio 4.3. Optimizar f (x, y) = x2 − 4y + 1 en la región D = {(x, y) ∈ R2 : x2 − y 2 ≤ 1, −1 ≤
y ≤ 1}.
Resolución. La región sobre la que hay que optimizar f es la de la figura siguiente.

Dado que la región es acotada (se puede ver en la figura) y es cerrada (está definida por tres
funciones continuas, g(x, y) = x2 −y 2 −1, h1 (x, y) = −1, h2 (x, y) = y, h3 (x, y) = 1, y por la relación
≤), tenemos que D es compacto. Puesto que f es continua, concluimos que f alcanza sus máximos
y mínimos absolutos sobre esta región. Estos extremos absolutos deben ser puntos críticos, que
deben cumplir alguna de las siguientes condiciones.

(Interior de la región) Podrían estar en el interior de la región. Puesto que f es de clase C 1 ,


esto implica que ∇f (x, y) = (0, 0). Planteamos ∇f (x, y) = (2x, −2y) = (0, 0) lo que nos da
(x, y) = (0, 0). Este punto cumple las restricciones 02 − 02 = 0 ≤ 1 y −1 ≤ 0 ≤ 1, tenemos
que (0, 0) es un punto crítico.
(Bordes) Podrían estar en el borde de la región. Esto quiere decir que, o bien están en la
recta y = −1, o en la recta y = 1, o en la hipérbola x2 − y 2 = 1. Entonces estudiamos estas
tres condiciones por separado.
1. Sobre la recta y = −1 consideramos la parametrización c(t) = (t, −1) y buscamos los
puntos críticos de F (t) = f ◦ c(t) = t2 + 4 + 1 = t2 + 5. Entonces, debe cumplir que
u0 (t) = 2t = 0, es decir t = 0. Entonces y = −1 nos da como candidato (0, −1), que
cumple 02 − (−1)2 = −1 ≤ 1 y −1 ≤ 1 ≤ 1. Similarmente, sobre y = 1 consideramos
c(t) = (t, 1) y buscamos los puntos críticos de F (t) = f ◦ c(t) = t2 − 4 + 1 = t2 − 3, que
nos vuelve a dar t = 0 y (0, 1) como punto crítico.
2. Sobre el borde x2 − y 2 = 1 ponemos g(x, y) = x2 − y 2 − 1. Notemos que ∇g(x, y) =
(2x, −2y) = (0, 0) si y sólo si (x, y) = (0, 0). Pero g(0, 0) = −1 6= 0, por lo tanto de
haber un extremo en esta restricción debe cumplir que existe λ ∈ R tal que
(
∇f (x, y) = λ∇g(x, y)
,
g(x, y) = 0

es decir, 
2x = λ · 2x

−4 = λ · (−2y) .

 2
x − y2 = 1

14
De la primera ecuación tenemos que x = 0 o λ = 1. Si x = 0 en la tercera ecuación
obtenemos que −y 2 = 1, que no tiene soluciones reales. Por lo tanto λ = 1; en la segunda
ecuación obtenemos que −4 = −2y, es √ decir y = 2. Reemplazando
√ en la tercera ecuación,
x2 − 22 = x2 − 4 = 1, es decir x = ± 5. Como (± 5, 2) cumplen las tres ecuaciones,
tenemos que son puntos críticos.
(Vértices) Podrían ser puntos que están en la intersección de dos de las tres curvas que definen
la región. Tenemos tres posibilidades (en verdad, dos posibilidades).

1. Una posibilidad sería que el punto esté en las restricciones y = 1, y = −1, pero esto es
imposible, porque estas dos rectas no se cortan.
2. Otra posibilidad sería que el punto esté en las restricciones x2 − y 2 = 1, y = 1, es decir,
debemos resolver (
x2 − y 2 = 1
.
y=1
2 2 2
Entonces, reemplazamos √ obteniendo x − 1 = x −
√ la segunda ecuación en la primera,
1 = 1, es decir x = ± 2. Entonces los vértices son (± 2, 1), que cumplen todas las
restricciones de D.
3. Finalmente, podría ocurrir que el punto esté en las restricciones
√ x2 − y 2 = 1, y = −1.
Este sistema es similar al anterior, y da los vértices (± 2, −1), que cumplen todas las
restricciones de D.
√ √ √
Concluimos
√ √que los puntos
√ críticos son (0, 0), (0, 1), (0, −1), ( 5, 2), (− 5, 2), √( 2, 1),
(− 2, 1), ( 2, −1), (− 2, −1). Evaluando f en estos puntos, concluimos que (± 2, −1)
son máximos absolutos con máximo valor 7, y (0, 1) es el mínimo absoluto con mínimo valor
−3.

Ejercicio 4.4. Sea f (x, y) = 23 x3 + y 2 − 3xy − x


2 − y. Optimizar f sobre el triángulo de vértices
(0, 0), (1, 0), (1, 1).
Resolución. La primera observación fundamental es que la región D a estudiar no tiene interior:
consta sólo de su frontera, que son las rectas x = 1, y = 0, y = x.

Entonces no tiene sentido buscar puntos donde ∇f (x, y) = (0, 0). Para estudiar los extremos de
f , estudiamos f sobre cada recta que determina el triángulo. Dado que no tenemos una definición de
la región, resultará conveniente parametrizar cada recta especificando lo mejor posible el intervalo
de definición.

1. Sobre y = x parametrizamos con c(t) = (t, t) con t ∈ [0, 1], y buscamos los puntos críticos de
F (t) = f ◦ c(t) = 32 t3 + t2 − 3t2 − 2t − t = 32 t3 − 2t2 − 23 t. Calculamos

3
F 0 (t) = 2t2 − 4t − = 0,
2
√ √ √
que tiene raíces 1± 27 . Entonces los candidatos a puntos críticos son c(1+ 27 ) = (1+ 27 , 1+
√ √ √ √ √
7 7 7 7 7
2 ) y c(1 − 2 ) = (1 − 2 , 1 − 2 ). Dado que 1 ± 2 no está en [0, 1], ninguno de estos
puntos está en el triángulo.

15
2. Sobre x = 1 parametrizamos con c(t) = (1, t) con t ∈ [0, 1], y buscamos los puntos críticos de
F (t) = f ◦ c(t) = 32 + t2 − 3t − 12 − t = t2 − 4t + 61 . Calculamos

F 0 (t) = 2t − 4 = 2(t − 2) = 0,

que tiene raíz t = 2. Entonces el candidato a punto crítico es c(2) = (1, 2). Como 2 ∈
/ [0, 1],
(1, 2) no está en el triángulo.
3. Sobre y = 0 parametrizamos con c(t) = (t, 0) con t ∈ [0, 1] y buscamos los puntos críticos de
F (t) = f ◦ c(t) = 23 t3 − 2t . Calculamos

1
F 0 (t) = 2t2 − = 0,
2
que tiene raíces t = ± 21 . Entonces los candidatos a puntos críticos son c( 12 ) = ( 12 , 0) y
c(− 21 ) = (− 12 , 0). Como − 12 ∈
/ [0, 1] pero 21 ∈ [0, 1], tenemos que sólo ( 12 , 0) está en el
triángulo.

Por lo tanto ( 12 , 0) es el único punto crítico que obtenemos estudiando f sobre cada restricción por
separado. Ahora consideramos los vértices del triángulo. que son (0, 0), (1, 0), (1, 1); son candidatos
a puntos críticos. Entonces {( 21 , 0), (0, 0), (1, 0), (1, 1)} son todos los puntos críticos de f en el
triángulo. Evaluando f en estos puntos obtenemos que (1, 0) y (1, 1) son el máximo y mínimo
absoluto de f en D, respectivamente.

5. Extremos restringidos en R3
Al igual que en R2 , hay problemas que se formulan de manera natural como problemas de
optimización de funciones sujetas a restricciones adecuadas. Por ejemplo, tenemos el siguiente
problema de minimización de distancia a una superficie.
Ejemplo 5.1. Supongamos que queremos hallar el punto en el plano 2x−y+2z = 20 que se encuentra
a menor distancia al origen. En lugar de resolver este problema de manera geométrica, podemos
resolver
p este problema como sigue. Consideramos d(x, y, z) = d((x, y, z), (0, 0, 0)) = |||(x, y, z)|| =
x2 + y 2 + z 2 la función distancia del punto (x, y, z) al (0, 0, 0). Nos interesa optimizar d sobre
todos los (x, y) que cumplen que 2x − y + 2z = 20. Dado que la raíz cuadrada es una función
creciente, podemos reducirnos a estudiar f (x, y, z) = x2 + y 2 + z 2 sujeta a 2x − y + 2z = 20.
Despejamos z = 10 + 21 y − x y reemplazamos en f , obteniendo

1
h(x, y) = x2 + y 2 + (10 + y − x)2 ,
2
que es una función cuadrática. Notemos que ∇h(x, y) = (2x − 2(10 + 21 y − x), 2y + 10 + 21 y − x).
Por lo tanto, ∇h(x, y) = (0, 0) nos da el sistema lineal
( (
2x − 20 − y + 2x = 0 4x + y = 20
1
, es decir ,
2y + 10 + 2 y − x = 0 −x + 25 y = −10

60
que tiene solución
 (x,y) = ( 11 , − 20
11 ). Entonces este es el único punto crítico de h. Dado que
4 −1
H(x, y) = tiene todos sus autovalores negativos, por el criterio del Hessiano para
−1 2
60
formas cuadráticas tenemos que ( 11 , − 20 1
11 ) es un mínimo absoluto de h. Dado que z = 10+ 2 y −x =
1 20 60 40 60 20 40
10 + 2 (− 11 ) − 11 = 11 tenemos que (x, y, z) = ( 11 , − 11 , 11 ) es el punto sobre 2x − y + 2z = 20
que se encuentra a menor distancia del origen.
Al igual que para R2 , el ejemplo anterior nos sugiere la siguiente estrategia.
Procedimiento 5.2. Sea f : R3 → R. Supongamos que queremos optimizar f sujeta a la restric-
ción g(x, y, z) = c. Podemos proceder como sigue.

1. Hallamos alguna parametrización para la superficie g(x, y, z) = c, digamos h : D → R2 .

16
2. Optimizamos F : D → R dada por F (u, v) = F ◦ h(u, v).
El problema que surge con este procedimiento es que, si D es abierto, no sabemos si F tiene
extremos absolutos; sólo podemos usar el criterio del Hessiano para hallar extremos locales. Si D
no es abierto, en un principio el análisis de extremos de F puede ser bastante complicado (si D es
compacto, habría que hacer el análisis realizado en la sección anterior). Por este motivo resulta útil
contar con una versión de multiplicadores de Lagrange para R3 , cuya prueba es similar al Teorema
2.1 reemplazando el teorema de la función implícita en R2 por el de R3 .
Teorema 5.3 (Multiplicadores de Lagrange en R3 ). Sean U ⊆ R3 abierto y f : U → R una función
de clase C 1 . Sea g : U → R una función de clase C 1 . Supongamos que f restringida a g(x, y, z) = c
tiene un extremo en (x0 , y0 , z0 ), es decir, g(x0 , y0 , z0 ) = c. Si ∇g(x0 , y0 , z0 ) 6= (0, 0, 0) debe tenerse
que existe λ ∈ R tal que
∇f (x0 , y0 , z0 ) = λ∇g(x0 , y0 , z0 ).

Definición 5.4 (Puntos críticos). Sean U ⊆ R3 y f, g : U → R de clase C 1 . Un punto crítico para


f restringida a g(x, y, z) = c es un punto (x0 , y0 , z0 ) ∈ U tal que
(
∇g(x0 , y0 , z0 ) = (0, 0)
(es decir, es un punto singular de g(x, y, z) = c), o
g(x0 , y0 , z0 ) = c
(
∇f (x0 , y0 , z0 ) = λ∇g(x0 , y0 , z0 )
.
g(x0 , y0 , z0 ) = c

Ejemplo 5.5. Consideremos el problema de optimizar f (x, y, z) = x+z restringida a x2 +y 2 +z 2 = 1.


Notemos que x2 + y 2 + z 2 = 1 define una región cerrada (está definida con las funciones continuas
f (x, y, z) = x2 + y 2 + z 2 , h(x, y, z) = 1, y la relación =) y acotada (define una esfera, que es
claramente acotada), por lo tanto define una región compacta. Como f es continua, el teorema
de Weierstrass implica que f tiene máximos y mínimos absolutos en la restricción g(x, y, z) =
x2 + y 2 + z 2 − 1 = 0. Estos extremos deberán ser puntos críticos; como f y g son de clase C 1 , estos
puntos deberán cumplir alguna de las siguientes dos condiciones.

(
∇g(x, y, z) = (0, 0, 0)
.
g(x, y, z) = 0
Notemos que ∇g(x, y, z) = (2x, 2y, 2z) = (0, 0, 0) si y sólo si (x, y, z) = (0, 0, 0). Pero
g(0, 0, 0) = −1 6= 0, por lo tanto no hay puntos críticos que cumplan esto.
Debe existir λ ∈ R tal que
(
∇f (x, y, z) = λ∇g(x, y, z)
.
g(x, y, z) = 0

Como ∇f (x, y, z) = (1, 0, 1), nos queda el sistema




 1 = λ · 2x

0 = λ · 2y
.


 1 = λ · 2z
 2
x + y2 + z2 − 1 = 0

De la segunda ecuación obtenemos que λ = 0 o y = 0. En el primer caso, reemplazando


en la primera ecuación obtenemos 1 = 0, que es una contradicción. Por lo tanto y = 0. De
1
la primera ecuación despejamos λ = 2x siempre que x 6= 0. Si x = 0, reemplazando en la
1
primera ecuación . Si x 6= 0, λ = 2x . Reemplazamos en la tercera ecuación y obtenemos
1
que 1 = 2x 2z = xz , es decir z = x. Reemplazando esta identidad y la identidad y = 0

tenemos que x2 + 02 + x2 − 1 = 2x2 − 1 = 0. Obtenemos que x = ± √12 = ± 22 . Enton-
√ √ √ √
ces ( 22 , 0, 22 ), (− 22 , 0, − 22 ) son candidatos a puntos críticos; reemplazando en las cuatro
ecuaciones, vemos que las cumplen, y por lo tanto son puntos críticos.

17
√ √ √ √
Concluimos que ( 22 , 0, 22 ), (− 22 , 0, − 22 ) son los únicos puntos críticos de f en la restricción.
√ √ √ √ √ √
Evaluando f en estos puntos, vemos que f ( 22 , 0, 22 ) = 2 y f (− 22 , 0, − 22 ) = − 2, por lo
√ √ √
tanto f alcanza un máximo absoluto en ( 22 , 0, 22 ) con máximo valor 2 y alcanza un mínimo
√ √ √
absoluto en (− 22 , 0, − 22 ) con mínimo valor − 2.

6. Distancia mínima a una curva o superficie


En general, una curva/superficie F ⊆ Rn es cerrada pero no necesariamente acotada. Cuando
no es acotada, dado P ∈ / F no tiene sentido de preguntar por el punto en F que se encuentra a
distancia máxima. No obstante, siempre existen puntos que se encuentran a distancia mínima.
Teorema 6.1. Sea F ⊆ Rn un subconjunto cerrado. Dado P ∈ Rn , existe algún punto Q ∈ F que
se encuentra a distancia mínima de P .

La prueba del Teorema 6.1 es un poco técnica para los fines de este curso, pero su idea es
sencilla: la distancia de un punto x a P , es decir, f (x) = ||x − P || se hace cada vez más grande a
medida que x es muy «grande», esto es, a medida que ||x|| es muy grande. Por lo tanto, de haber
un punto a distancia mínima a P sobre F , este punto se encuentra contenida en un disco B, y más
en particular, en los puntos de F que están en B, es decir, en B ∩ F . Pero f (x) es continua sobre
B ∩ F y este conjunto es cerrado (porque ambos contienen su frontera) y acotado (está contenido
en el disco B). Por el teorema de Weiestrass f tiene un mínimo absoluto en B ∩ F y este mínimo
es absoluto para f en F .
Ejercicio 6.2. Hallar los puntos sobre la superficie z 2 − xy = 1 más cercanos al origen.

Figura 8: Gráfico de la superficie z 2 − xy = 1. Se trata de un hiperboloide de una hoja.

Resolución.
p Tenemos que minimizar la distancia de un punto al origen, es decir f (x, y, z) =
x2 + y 2 + z 2 , sujeta a la restricción g(x, y, z) = z 2 −xy −1 = 0. Como la raíz cuadrada es crecien-
te, el problema se reduce a minimizar f (x, y, z) = x2 + y 2 + z 2 sujeta a g(x, y, z) = z 2 − xy − 1 = 0.
Puesto que por el Teorema 6.1 sabemos hay un punto a distancia mínima, y f es una función de
clase C 1 , este punto debe ser un punto crítico que satisface las condiciones de los multiplicadores
de Lagrange.
Primero notemos que ∇g(x, y, z) = (−y, −x, 2z) = 0 si y sólo si (x, y, z) = (0, 0, 0). Pero
g(0, 0, 0) 6= 0, por lo tanto no hay puntos donde el gradiente de g se anule. Entonces, el mínimo de
f restringida a g debe cumplir que existe λ ∈ R tal que
(
∇f (x, y, z) = λ∇g(x, y, z)
,
g(x, y, z) = 0

es decir, (
(2x, 2y, 2z) = λ(−y, −x, 2z)
.
z 2 − xy − 1 = 0

18
Esto conduce al sistema 

2x = −λy

2y = −λx
. (2)


2z = λ2z
 2
z − xy − 1 = 0
De la tercera ecuación de (2) obtenemos que 2z − λ2z = 2z(1 − λ) = 0, es decir que z = 0 o λ = 1.
Si λ = 1, en las primeras dos ecuaciones de (2) nos queda
( (
2x = −y y = −2x
, es decir .
2y = −x y = − x2

Igualando las ecuaciones, tenemos que −2x = − x2 es decir x = 0. Por lo tanto y = 0 y


tenemos que x = y = 0. Reemplazando en la cuarta ecuación de (2) obtenemos que

z 2 − 0 · 0 − 1 = z 2 − 1 = 0,

de donde z 2 = 1 y por lo tanto z = ±1. Concluimos que (0, 0, ±1) son puntos críticos.
Si z = 0, nos queda el nuevo sistema

2x = −λy

2y = −λx . (3)

xy = −1

El sistema (3) se puede resolver de varias maneras. Por ejemplo, despejamos λ de (3), obte-
niendo λ = − 2x
y siempre y cuando y 6= 0. Dado que xy = −1, la posibilidad que y = 0 queda
descartada. Entonces, reemplazamos en la segunda ecuación de (3) para obtener
 
2 2x
2y = − − x= ,
y y
es decir
2y 2 = 2x2 .
Esta ecuación es equivalente a que y 2 = x2 , es decir que |y| = |x|, que en definitiva es que
y = ±x. Si y = x, en la tercera ecuación de (3) queda xx = x2 = −1, que no tiene solución,
mientras que si y = −x, en la tercera ecuación de (3) queda x(−x) = −x2 = −1, es decir
x2 = 1, y obtenemos x = ±1. Como y = −x y z = 0, concluimos que (1, −1, 0), (−1, 1, 0) son
puntos críticos.
Resumiendo, obtuvimos cuatro puntos críticos, (1, −1, 0), (−1, 1, 0), (0, 0, 1), (0, 0, −1). Evaluando
f en cada punto obtenemos que (0, 0, 1) y (0, 0, −1) son los puntos sobre z 2 − xy = 1 que están a
distancia mínima del origen.
Otra forma de resolver este ejercicio consiste en parametrizar z 2 −xy = 1. Por ejemplo, podemos
2 2
despejar y = z x−1 y considerar h : U → R dada por h(u, v) = (u, v u−1 , v) donde U = {(u, v) : u 6=
2
0}. Entonces optimizamos F (u, v) = f ◦ h(u, v) = u2 + ( v u−1 )2 + v 2 con (u, v) ∈ U . Como U es
abierto, el mínimo absoluto de f restringida a g(x, y, z) = 0 debe ser un punto crítico de F (u, v),
es decir, ∇F (u, v) = (0, 0). Tenemos que
(v 2 − 1)2 4v(v 2 − 1)
 
∇F (u, v) = 2u − 2 , + 2v = (0, 0)
u3 u2
si y sólo si ( 2 2
2u − 2 (v u−1)
3 =0
4v(v 2 −1)
.
u2 + 2v = 0
2 2
De la segunda ecuación tenemos que 2v(2 v u−1
2 + 1) = 0, por lo tanto v = 0 o v 2 − 1 = − u2 . Si
v = 0, reemplazando en la primera ecuación obtenemos que
1
2u − 2 = 0.
u3

19
Despejando, queda u4 = 1, cuyas únicas raíces reales son u = ±1. Entonces u = ±1, v = 0, y
reemplazando, tenemos los puntos críticos h(1, 0) = (1, −1, 0), h(−1, 0) = (−1, 1, 0). Si v 2 − 1 =
2
− u2 , reemplazando en la primera ecuación,
2
(− u2 )2 u 3
2u − 2 = 2u − = u = 0.
u3 2 2
Entonces u = 0 y v 2 −1 = 0 es decir v = ±1. Entonces h(0, 1) = (0, 0, 1), h(0, −1) = (0, 0, −1). Con-
cluimos que (1, −1, 0), (−1, 1, 0), (0, 0, 1), (0, 0, −1) son todos los puntos críticos (son exactamente
los mismos puntos que hallamos con multiplicadores de Lagrange). Ahora el ejercicio se termina
como en la resolución que utilizó multiplicadores de Lagrange, evaluando f y determinando qué
valor es el más pequeño.

Observación 6.3. Notemos que no hay puntos más lejanos al origen sobre z 2 −xy = 1. Una forma de
ver esto es considerar las intersecciones de la superficie con el plano z = 0. En este caso obtenemos
la curva −xy = 1 (una hipérbola) que tiene puntos tan lejanos al origen como se quieran.
Ejemplo 6.4. Consideremos el problema de encontrar el punto sobre y 2 − x3 = 0 a menor distancia
del (−1, 0). Por el Teorema 6.1 existe algún punto que minimiza la distancia. Argumentando como
en los ejemplos anteriores, este punto se busca optimizando f (x, y) = (x + 1)2 + y 2 sujeta a la
restricción g(x, y) = y 2 − x3 = 0. Si buscásemos sólo los (x, y) para los cuáles ∇f (x, y) = λ∇g(x, y)
y g(x, y) = 0, tendríamos que resolver el sistema de ecuaciones

2
2(x + 1) = λ(−3x )

2y = λ(2y) .

 2 3
y −x =0

De la segunda condición, obtenemos que y = 0 o λ = 1. Si y = 0, reemplazamos en la tercera


ecuación y obtenemos que y 2 − 03 = y 2 = 0, es decir (x, y) = (0, 0). Pero este punto no cumple el
sistema, ya que la primera ecuación queda 2(0 + 1) = 0, que es absurda. Si λ = 1, de la primera
ecuación obtenemos que 2(x + 1) = −3x2 , es decir 3x2 + 2x + 2 = 0, que no tiene raíces reales. Por
lo tanto, no hay puntos críticos sobre g(x, y) = 0 que cumplan ∇f (x, y) = λ∇g(x, y).
En este ejemplo vemos por qué consideramos también como puntos críticos a los (x, y) con
g(x, y) = 0, ∇g(x, y) = 0. En efecto, ∇g(x, y) = (−3x2 , 2y) = (0, 0) si y sólo si x = y = 0. Dado
que g(0, 0) = 0 resulta que (0, 0) también es un punto crítico. Dado que el Teorema 6.1 implica
que existe un mínimo absoluto para f , debe tenerse que (0, 0) es el punto a menor distancia del
(−1, 0) sobre y 2 − x3 = 0.

7. Multiplicadores de Lagrange para más de una restricción


Vimos que en regiones de R2 podía ocurrir que la región esté definida con más de una restricción;
en ese caso, teníamos como puntos críticos a los vértices de la región, es decir, las intersecciones dos
a dos de las restricciones. En R3 , la situación es un poco más complicada, ya que si intersecamos dos
restricciones g1 (x, y, z) = 0, g2 (x, y, z) = 0 en general obtenemos infinitas soluciones. Por ejemplo,
si g1 (x, y, z) = x + y + z − 1, g2 (x, y, z) = x − y − z + 2, la intersección de estas dos restricciones es
una recta pues g1 (x, y, z) = 0, g2 (x, y, z) = 0 son planos que se cortan. No obstante, si recordamos
lo visto en la unidad anterior, tenemos dos situaciones posibles cuando intersecamos dos superficies
y estudiamos la intersección alrededor de un punto.
1. Los planos tangentes a g1 (x, y, z) = 0, g2 (x, y, z) = 0 en (x0 , y0 , z0 ) coinciden (las superficies
son tangentes en (x0 , y0 , z0 )), esto es, ∇g1 (x0 , y0 , z0 ) y ∇g2 (x0 , y0 , z0 ) son múltiplos. En este
caso (x0 , y0 , z0 ) es un punto singular de la intersección.

2. Los planos tangentes a g1 (x, y, z) = 0, g2 (x, y, z) = 0 en (x0 , y0 , z0 ) no coinciden. En este caso,


la intersección alrededor de (x0 , y0 , z0 ) es como una curva, y la recta tangente a la curva en
(x0 , y0 , z0 ) es la intersección de los planos tangentes.
Cuando ocurre la segunda situación se puede ver que hay una versión del teorema de la función
implícita, que permite generalizar el Teorema 5.3 al siguiente resultado.

20
Teorema 7.1 (Multiplicadores de Lagrange con dos restricciones). Sean f, g, h : U → R funciones
de clase C 1 . Sea (x0 , y0 , z0 ) un extremo de f sujeta a las restricciones g(x, y, z) = 0, h(x, y, z) = 0.
En particular, g(x0 , y0 , z0 ) = 0, h(x0 , y0 , z0 ) = 0. Si ∇g(x0 , y0 , z0 ) no tiene la misma dirección que
∇h(x0 , y0 , z0 ), es decir, si no son múltiplos entre sí, entonces existen λ, µ ∈ R tales que

∇f (x0 , y0 , z0 ) = λ∇g(x0 , y0 , z0 ) + µ∇h(x0 , y0 , z0 )

g(x0 , y0 , z0 ) = 0 .

h(x0 , y0 , z0 ) = 0

Entonces tenemos otra noción de puntos críticos.


Definición 7.2 (Puntos críticos). Sean U ⊆ R3 abierto y f, g, h : U → R de clase C 1 . Un punto
crítico de f restringida a g(x, y, z) = 0, h(x, y, z) = 0 es un punto (x0 , y0 , z0 ) ∈ U tal que
existe a ∈ R tal que

∇g(x0 , y0 , z0 ) = a∇h(x0 , y0 , z0 )

g(x0 , y0 , z0 ) = 0 (es decir ,(x0 , y0 , z0 ) es un punto singular),

h(x0 , y0 , z0 ) = 0

o existen λ, µ ∈ R tales que



∇f (x0 , y0 , z0 ) = λ∇g(x0 , y0 , z0 ) + µ∇h(x0 , y0 , z0 )

g(x0 , y0 , z0 ) = 0 .

h(x0 , y0 , z0 ) = 0

Si D = {(x, y, z) ∈ R3 : g(x, y, z) = 0, h(x, y, z) = 0} es compacto y f es continua en D, por el


teorema de Weierstrass f tendrá máximos y mínimos absolutos en f , que tendrán que ser puntos
críticos.
Ejemplo 7.3. Consideremos f (x, y, z) = x + y + z sujeta a las restricciones x2 + y 2 = 2, x + z = 1.
Notemos que la región determinada por las restricciones es cerrada, porque está definida por
funciones continuas y por la relación =. Para ver que es acotada, resulta conveniente hacer un
gráfico aproximado.

21
Figura 9: La región es la curva obtenida de la intersección entre el cilindro x2 + y 2 = 2 y el plano
x + z = 1.

Puesto que la región resulta acotada, concluimos que la región determinada por x2 + y 2 =
2, x + z = 1 es compacta, y como f es continua, tenemos que alcanza máximos y mínimos absolutos
en esta región. Llamemos g(x, y, z) = x2 + y 2 − 2, h(x, y, z) = x + z − 1. Dado que f, g, h son de
clase C 1 , estos extremos deben ser puntos críticos.

Primero verificamos si 
∇g(x, y, z) = a∇h(x, y, z)

g(x, y, z) = 0

h(x, y, z) = 0

para algún a. Dado que ∇g(x, y, z) = (2x, 2y, 0), ∇h(x, y, z) = (1, 0, −1), deberíamos tener
que (2x, 2y, 0) = a(1, 0, −1). Si a 6= 0, debería tenerse que 0 = −a 6= 0, lo que es absurdo.
Entonces a = 0, y en este caso (2x, 2y, 0) = (0, 0, 0) implica que x = y = 0. Pero g(0, 0, z) =
−2 6= 0, por lo tanto no hay puntos críticos que cumplan esta condición.
Concluimos que los puntos críticos deben verificar las ecuaciones

∇f (x, y, z) = λ∇g(x, y, z) + µ∇h(x, y, z)

g(x, y, z) = 0 .

h(x, y, z) = 0

Como ∇f (x, y, z) = (1, 1, 1) nos queda el sistema



(1, 1, 1) = λ(2x, 2y, 0) + µ(1, 0, 1)

x2 + y 2 − 2 = 0 ,

x+z−1=0

22
es decir 


1 = λ2x + µ
1 = λ2y



1=µ .

x2 + y 2 − 2 = 0





x + z − 1 = 0

La tercera ecuación nos da µ = 1. Reemplazando en la primera ecuación obtenemos que


1 = λ2x + 1, es decir λ2x = 0. Entonces x = 0 o λ = 0. Si λ = 0, reemplazando en la segunda
ecuación obtenemos que 1 = 0, que es una contradicción. Por lo tanto, x = 0. Reemplazando √
en la cuarta ecuación nos queda que 02 + y 2 − 2 = 0, es decir y 2 = 2, que nos da y = ± 2.
Similarmente,
√ reemplazando
√ x = 0 en la quinta ecuación obtenemos que z = 1. Entonces
(0, 2, 1), (0, − 2, 1) son los candidatos a puntos críticos. Como estos puntos cumplen las
cinco ecuaciones, tenemos que efectivamente son puntos críticos de f .
√ √
Entonces, (0, 2, 1), (0, − 2, 1)√ √ de f en la
son todos√los puntos críticos √región a estudiar. Evaluamos

a f en estos puntos; como f (0, 2, 1) = √ 2 + 1 y f (0, −√ 2, 1) = − 2 + 1 tenemos que (0, 2, 1)
es un máximo
√ absoluto con máximo valor 2 + 1 y (0, − 2, 1) es un mínimo absoluto con mínimo
valor − 2 + 1.
Observación 7.4. Podemos resolver el Ejemplo 7.3 usando parametrizaciones. La intersección x2 +
y 2 = 2 con x +
√ √ z = 1 puede parametrizarse√como sigue. Usando coordenadas √ cilíndricas,
√ x =
√ 2 cos(t), y = 2sen(t) y z = 1 − x = 1 − 2 cos(t). Entonces c(t) = ( 2 cos(t), 2sen(t), 1−
2 cos(t)) con t ∈ [0, 2π] es una parametrización para la intersección. Optimizamos
√ √ √ √
F (t) = f ◦ c(t) = 2 cos(t) + 2sen(t) + 1 − 2 cos(t) = 1 + 2sen(t).
Tenemos √
F 0 (t) = 2 cos(t) = 0
π 3π
si y sólo si t = 2, 2 en [0, 2π]. Como F tiene dominio en el intervalo cerrado [0, 2π], agrega-
√ √
mos los puntos 0, 2π como puntos críticos. Dado que c(0) = c(2π) = ( 2, 0, 1 − 2), c( π2 ) =
√ √ √ √ √ √
(0, 2, 1), c( 3π
2 ) = (0, − 2, 1), tenemos que {( 2, 0, 1 − 2), (0, 2, 1), (0, − 2, 1)} son todos los
√ √
puntos críticos de f . Evaluando, de nuevo vemos que (0, − 2, 1) y (0, 2, 1) es un mínimo y
máximo absoluto de f , respectivamente.
Veamos un ejemplo de optimización de una función en R3 una región definida por más de una
restricción
Ejercicio 7.5. Optimizar f (x, y, z) = xyz en D = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 4, x + y + z ≥ 1}.
Resolución. Notemos que D consiste de la región comprendida entre el plano x + y + z = 1 y la
esfera x2 + y 2 + z 2 = 4.

Figura 10: El conjunto D es la región comprendida por el plano (en gris) x + y + z = 1 y la esfera
x2 + y 2 + z 2 = 4.

23
Por lo tanto D es acotado. Dado que también es cerrado, concluimos que D es compacto. Como
f es continua, el teorema de Weierstrass implica que f alcanza máximos y mínimos absolutos.
Estos extremos cumplen algunas de las siguientes condiciones.
(Interior) Son puntos que se encuentran en el interior de la región, por lo tanto cumplen
que ∇f (x, y, z) = (yz, xz, xy) = (0, 0, 0). Esta igualdad se da si y sólo si dos de las variables
son 0. En otras palabras, obtenemos puntos de la forma (x, 0, 0), (0, y, 0), (0, 0, z). Puesto que
buscamos que los puntos estén en D, x + 0 + 0 = x ≥ 1 y x2 + 02 + 02 = x2 ≤ 4, por lo
tanto 1 ≤ x ≤ 2. Razonando similarmente con los otros puntos, tenemos que (x, 0, 0) con
1 ≤ x ≤ 2, (0, y, 0) con 1 ≤ y ≤ 2, (0, 0, z) con 1 ≤ z ≤ 2, son todos los puntos críticos que
obtenemos.
(Bordes) Son puntos que se encuentran en el borde de la región. Tenemos dos superficies que
delimitan a la región: g(x, y, z) = x2 + y 2 + z 2 − 4 y h(x, y, z) = x + y + z − 1. Estudiamos
los puntos críticos en cada superficie.
1. Sobre g(x, y, z) = x2 + y 2 + z 2 − 4 = 0. Notemos que ∇g(x, y, z) = (2x, 2y, 2z) = (0, 0, 0)
si y sólo si (x, y, z) = (0, 0, 0), pero g(0, 0, 0) = −4 6= 0. Por lo tanto los puntos críticos
deben cumplir que existe λ ∈ R tal que
(
∇f (x, y, z) = λ∇g(x, y, z)
,
g(x, y, z) = 0

es decir, 
yz = λ(2x)


xz = λ(2y)
.
xy = λ(2z)


 2
x + y2 + z2 − 4 = 0
yz
De la primera ecuación, podemos despejar λ = 2x siempre que x  0. Si x = 0 tenemos
que yz = λ · 0 = 0 por lo tanto y = 0 o z = 0. Si y = 0, de la cuarta ecuación
obtenemos que 02 + 02 + z 2 = 4, es decir z = ±2. Similarmente, si z = 0 obtenemos
que y = ±2. Entonces obtenemos los candidatos (0, ±2, 0), (0, 0, ±2), de los cuáles sólo
yz
(0, 2, 0), (0, 0, 2) ∈ D. Si x 6= 0, tenemos λ = 2x , con lo que reemplazando en la segunda
ecuación obtenemos que
yz y2 z
xz = 2y = ,
2x x
que implica x2 = y 2 , es decir y = ±x. Similarmente, si reemplazamos λ en la tercera
ecuación obtenemos que
yz yz 2
xy = 2z = ,
2x x
que implica x2 = z 2 , es decir z = ±x. Entonces, si y = ±x, z = ±x, reemplazamos en
la cuarta ecuación y obtenemos que x2 + (±x)2 + (±x)2 − 4 = 3x2 − 4 = 0, que nos
da x = ± √23 . Entonces (± √23 , ± √23 , ± √23 ) son los candidatos a puntos críticos, de los
cuáles sólo ( √23 , √23 , √23 ), (− √23 , √23 , √23 ), ( √23 , − √23 , √23 ), ( √23 , √23 , − √23 ) ∈ D.
2. Sobre h(x, y, z) = x + y + z − 1 = 0. Notemos que ∇h(x, y, z) = (1, 1, 1) 6= (0, 0, 0). Por
lo tanto los puntos críticos deben cumplir que existe λ ∈ R tal que
(
∇f (x, y, z) = λ∇h(x, y, z)
,
h(x, y, z) = 0

es decir, 
yz = λ


xz = λ
.
xy = λ


x+y+z−1=0

Igualando la primera y segunda ecuación obtenemos que yz = xz, de donde tenemos


quez = 0 o y = x. Si z = 0, igualamos la primera y tercera ecuación y obtenemos que

24
xy = yz = y · 0 = 0, por lo tanto x = 0 o y = 0. Entonces, si z = 0 resulta que x = 0, en
cuyo caso si reemplazamos en la tercera ecuación debe tenerse que 0 + y + 0 − 1 = 0 es
decir y = 1, y si z = 0, y = 0, el mismo razonamiento nos da x = 1. Entonces obtenemos
los puntos (1, 0, 0), (0, 1, 0) ∈ D. Si z 6= 0, y = x. Igualando la primera y tercera ecuación
obtenemos que yz = xy. Recordando que y = x, nos queda xz = x2 . Entonces, x = 0,
en cuyo caso y = 0 y reemplazando en la tercera ecuación obtenemos que z = 1, lo que
nos da el punto (0, 0, 1) ∈ D. Si x 6= 0, simplificamos x en xz = x2 y obtenemos que
z = x. Entonces, si x 6= 0, z 6= 0, resulta que x = y = z. Reemplazando en la tercera
ecuación, x + y + z − 1 = 3x − 1 = 0, es decir x = 31 . Por lo tanto ( 13 , 13 , 13 ) ∈ D es un
punto crítico.
Resumiendo, obtuvimos los puntos críticos (1, 0, 0), (0, 1, 0), (0, 0, 1), ( 31 , 13 , 13 ).
3. (Intersecciones entre las superficies) Para regiones en R3 , la intersección entre dos de las
superficies que definen a la región no dan puntos como en el caso de regiones limitadas
por curvas (a estos puntos los llamábamos vértices). En estos casos, o bien parametri-
zamos la intersección de las superficies, o utilizamos multiplicadores de Lagrange para
estudiar f (x, y, z) = xyz sujeta a las dos restricciones g(x, y, z) = 0, h(x, y, z) = 0.
Procedamos usando multiplicadores de Lagrange; tenemos dos tipos de puntos críticos.
• Puntos (x, y, z) donde ∇g(x, y, z) = a∇h(x, y, z) para algún a, y g(x, y, z) = h(x, y, z) =
0. En este caso, ∇g(x, y, z) = (2x, 2y, 2z) y ∇h(x, y, z) = (1, 1, 1). Entonces (2x, 2y, 2z) =
(1, 1, 1) implica que x = y = z = 21 . Pero el punto ( 12 , 12 , 12 ) no cumple las restric-
ciones g(x, y, z) = 0, h(x, y, z) = 0.
• Puntos para los cuáles existen λ, µ ∈ R tales que

∇f (x, y, z) = λ∇g(x, y, z) + µ∇h(x, y, z)

g(x, y, z) = 0 ,

h(x, y, z) = 0

es decir, 
yz = λ(2x) + µ


xz = λ(2y) + µ



xy = λ(2z) + µ .

x2 + y 2 + z 2 − 4 = 0





x + y + z − 1 = 0

De la primera ecuación despejamos µ = yz − 2λx y reemplazamos en la segunda


ecuación, obteniendo que
xz = 2λy + yz − 2λx,
es decir
xz − yz = 2λy − 2λx,
que sacando factor común, equivale a

z(x − y) = 2λ(y − x). (4)

Supongamos que y = x (en cuyo caso no podemos simplificar la expresión que


obtuvimos). Si reemplazamos en la quinta ecuación nos queda que 2x + z − 1 = 0, es
decir z = 1 − 2x. Reemplazando
√ √
en la cuarta

ecuación,

x2 +√x2 + (1√− 2x)2 = 4,√que
tiene raíces x = 4±12 72 . Así, ( 4+12 72 , 4+12 72 , 1−2 4+12 72 ), ( 4−12 72 , 4−12 72 , 1−2 4−12 72 )
son los candidatos a puntos críticos que se puede comprobar que se encuentran en
D.
Si y 6= x, podemos simplificar en (4) y obtener que −z = 2λ, es decir λ = − z2 .
Reemplazando µ, λ en la tercera ecuación obtenemos
z z
xy = (− )2z + yz − 2(− )x = −z 2 + yz + xz.
2 2
Despejando, obtenemos la ecuación

xy − yz = xz − z 2 ,

25
que sacando factor común, equivale a

y(x − z) = z(x − z). (5)

Supongamos que x = z (en cuyo caso no podemos simplificar la expresión que


obtuvimos). Si reemplazamos en la quinta ecuación nos queda que 2x + y − 1 = 0, es
decir y = 1 − 2x. Reemplazando
√ √
en la cuarta√ecuación, √
x2 +√(1 − 2x)2 + x √
2
= 4,√que
4± 72 4+ 72 4+ 72 4+ 72 4− 72 4− 72 4− 72
tiene raíces x = 12 . Así, ( 12 , 1 − 2 12 , 12 )( 12 , 1 − 2 12 . 12 )
son los candidatos a puntos críticos que se puede comprobar que se encuentran en
D.
Si z 6= x, podemos simplificar en (5) y obtener que y = z. Reemplazando ern la
quinta ecuación nos queda que x + 2y − 1 = 0 es decir x = 1 − 2y. Reemplazando √
en la cuarta ecuación, (1 − 2y)2 + y 2 + y 2 = 4, que tiene raíces y = 4±12 72 . Así,
√ √ √ √ √ √
(1 − 2 4+12 72 , 4+12 72 , 4+12 72 ), (1 − 2 4−12 72 , 4−12 72 , 4−12 72 ) son los candidatos a puntos
críticos que se puede comprobar que se encuentran en D.
Resumiendo,
√ √
los puntos√
críticos√ que se√ encuentran √
en en las

dos restricciones
√ √
son
( 4+12 72 , 4+12 72 , 1−2 4+12 72 ), ( 4−12 72 , 4−12 72 , 1−2 4−12 72 ), ( 4+12 72 , 1−2 4+12 72 , 4+12 72 ),
√ √ √ √ √ √ √ √ √
( 4−12 72 , 1−2 4−12 72 . 4−12 72 ), (1−2 4+12 72 , 4+12 72 , 4+12 72 ), (1−2 4−12 72 , 4−12 72 , 4−12 72 ).
Finalmente evaluamos f en todos los puntos críticos obtenidos podemos comprobar que ( √23 , √23 , √23 )
es el máximo absoluto, y (− √23 , √23 , √23 ), ( √23 , − √23 , √23 ), ( √23 , √23 , − √23 ) son los mínimos absolu-
tos.

Ejercicios de la guía que se pueden hacer


Se puede hacer toda la guía 5.

Referencias
[Apostol] Apostol, T., Calculus 2, Editorial Reverté, Segunda Edición, 2006 (Secciones 9.14, 9.15,
9.16 y 9.17.).
[Marsden-Tromba] Marsden, J., Tromba, A., Cálculo vectorial, Addison Wesley Longman, Cuarta
Edición, 1998 (Sección 3.4)

26

También podría gustarte