Funciones Implícitas e Inversas en R²
Temas abordados
Funciones Implícitas e Inversas en R²
Temas abordados
FUNCIONES IMPLÍCITAS E
INVERSAS
En este capı́tulo vamos a estudiar problemas propios de varias variables que no tienen análogo
para una variable. Para entender de qué se trata nos situamos en R2 . Ya disponemos de herramientas
suficientes para el estudio de una función f(x,y) de clase suficientemente buena en un abierto de R2 ,
las desarrolladas en el capı́tulo anterior. Pero, supongamos que queremos estudiar nuestra función
f en un conjunto cerrado de interior vacı́o, como puede ser el caso de la circunferencia unidad.
Dicha circunferencia es un caso particular de conjunto del siguiente tipo:
M = {(x, y) : F (x, y) = 0}
donde F (x, y) = x2 + y 2 − 1 es una función de dos variables de clase C (∞ con valores en R. Nada de
lo dicho en el capı́tulo anterior se puede aplicar para estudiar f sobre M porque ningún punto de
M es interior. Pero observamos que este estudio equivale a lo siguiente: llamemos C + a la parte
√ de
la circunferencia en el semiplano superior abierto; C + consta de puntos (x, y) donde y = x2 − 1
y x ∈ (−1, 1). Entonces, estudiar f (x, y) en C + es equivalente a estudiar
p
g(x) = f (x, 1 − x2 ), x ∈ (−1, 1).
Si
√ f es buena, g también lo es por composiciones donde aparecen f y la expresión despejada
1 − x2 , luego tenemos un problema para una función de una variable en el abierto (−1, 1) de R.
Análogamente, si queremos estudiar f (x, y, z) en la parte del semiespacio superior de la esfera
que es un conjunto con interior vacı́o en R3 , con la teorı́a del capı́tulo anterior no tenemos nada
que hacer. Pero este estudio es equivalente al de la función de dos variables
p
g(x, y) = f (x, y, 1 − x2 − y 2 ),
en {x2 + y 2 < 1} que es un conjunto abierto en R2 y, por tanto, a g sı́ que le podemos aplicar los
resultados del capı́tulo 2.
¿Qué está ocurriendo en estos sencillos ejemplos? Simplemente que de√F (x, y) = 0, podemos
despejar y = ϕ(x), donde ϕ es una función buena (en concreto, ϕ(x) = 1 − x2 ). O, en el otro
caso, podemos despejar de F (x, y, z) = 0, z = ψ(x, y).
Estas funciones F van de Rn en R (con n = 2 en el primer caso o n = 3 en el segundo). En
la práctica, uno se encuentra con más ejemplos de este tipo. Ası́, si queremos estudiar una función
f (x, y, z) sobre el conjunto (circunferencia en R3 )
M = {(x, y, z) : x2 + y 2 + z 2 − 1 = 0, x + y = 0}
1
2 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
√
será importante darse cuenta de que (al menos, en alguna zona) y = −x, z = 1 − 2x2 , es decir,
podemos despejar dos variables (la y y la z) en función de una sola (la x), y nuestro problema
será equivalente al estudio de la función de una variable
p
g(x) = f (x, −x, 1 − 2x2 )
que es buena porque lo es la f y porque lo son las funciones que despejan y, z en función de x.
Dicho en forma más abstracta, lo que ocurre en este ejemplo es lo siguiente: tenemos una función
F : R3 −→ R2 , F (x, y, z) = (x2 + y 2 + z 2 − 1, x + y)
y podemos despejar del sistema F (x, y, z) = 0, y = φ(x), z = χ(x), donde φ y χ son funciones
buenas.
En general, interesará saber si de un sistema de ecuaciones F (x) = 0, donde F es una función
buena que va de Rn en Rm , podremos despejar m de las variables x1 , . . . , xn en función de las
n − m restantes y si las funciones que despejan son buenas. Ası́, el estudio de una función f (x) de n
variables, sobre el conjunto de puntos dado por F (x) = 0 (que no será abierto en Rn ) se reducirá al
estudio de otra función de n − m variables, pero ahora sobre un abierto.
F (x, y) = x2 +y 2 +1. Aquı́ no existen puntos que verifiquen la ecuación F (x, y) = 0. Debemos
imponer que exista al menos un par (x0 , y0 ) tal que F (x0 , y0 ) = 0.
= x2 + y 2 − 1. Aquı́ observamos que para cada x ∈ (−1, 1) tenemos dos valores de y
F (x, y) √
(y = ± 1 − x2 ) que satisfacen F (x, y) = 0. En este ejemplo, vemos claro que para obtener
una función buena nos podemos decidir siempre por + o siempre por −. Pero en otros casos,
puede que no quede clara esta forma de decidirse. Esto nos indica que el planteamiento del
problema tiene que ser local. Obsérvese que, en este ejemplo, es cierto lo siguiente:
Dado (x0 , y0 ) con −1 < x0 < 1 y F (x0 , y0 ) = 0, podemos encontrar U entorno de x0 , V
entorno de y0 tal que ∀x ∈ U , existe un único y ∈ V verificando F (x, y) = 0.
Con alguna hipótesis añadida, la anterior aserción la podremos demostrar para F general.
Supongamos que de F (x, y) = 0 podemos extraer efectivamente una función y = ϕ(x) tal que
F (x, ϕ(x)) = 0 y que ϕ es una función buena (en este caso, derivable). Entonces, usando la
regla de la cadena tendremos que
Fx (x, ϕ(x)) + Fy (x, ϕ(x))ϕ0 (x) = 0.
Para poder despejar ϕ0 (x), parece que deberemos imponer alguna condición del tipo
Fy (x, ϕ(x)) 6= 0.
Esta será la hipótesis añadida que necesitaremos.
3.1. FUNCIONES DE R2 EN R 3
Extraer una función implı́cita de F (x, y) = 0 para funciones tan sencillas como F (x, y) =
x2 + y 2 − 1 no es interesante pues lo podemos hacer explı́citamente. El problema empieza
a tener su interés cuando nos encontramos con funciones como, por ejemplo,
luego, g(y) es estrictamente creciente. Por otro lado, es inmediato comprobar que
Por tanto, g tiene un único cero que llamamos y0 . Es decir, existe un único y0 tal que
F (x0 , y0 ) = 0 que es lo que querı́amos demostrar.
Entonces, tenemos bien definida una función ϕ : R −→ R tal que F (x, ϕ(x)) = 0, ∀x ∈ R.
Demostraremos más adelante que esta función es de clase C (∞ . De esta función no sabemos
ninguna representación explı́cita, pero tenemos la información de que cumple
En la ecuación anterior podemos derivar tantas veces como queramos y obtener relaciones
entre las derivadas de ϕ y a la postre tener bastante información.
Estos ejemplos nos dan idea de las condiciones que tenemos que imponer a F para sacar buenas
funciones implı́citas y también del método de demostración.
ϕ : (x0 − a, x0 + a) −→ (y0 − b, y0 + b)
x 7−−−−−−−−→ ϕ(x) = única y tal que f (x, y) = 0
cumple:
(a) ϕ(x0 ) = y0 ;
(c) ϕ es de clase C (p .
4 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
Demostración. O bien fy (x0 , y0 ) > 0, o bien fy (x0 , y0 ) < 0; vamos a suponer que
fy (x0 , y0 ) > 0
Está bien definida y es derivable; h0 (y) = fy (x0 , y) > 0 para cada y ∈ (y0 − ρ, y0 + ρ), ası́ que h
es estrictamente creciente. Fijemos ahora b ∈ R tal que 0 < b < ρ. Entonces, h(y0 − b) < h(y0 ) <
h(y0 + b), es decir:
f (x0 , y0 − b) < 0 < f (x0 , y0 + b).
que está bien definida en algún intervalo de la forma (x0 − ε, x0 + ε); esta función es continua y se
tiene k(x0 ) = f (x0 , y0 − b) < 0, ası́ que k es negativa cerca de x0 . Es decir: existe algún δ1 > 0 tal
que
f (x, y0 − b) = k(x) < 0 siempre que x ∈ (x0 − δ1 , x0 + δ1 ).
Tomemos ahora a > 0 tal que a < mı́n{δ1 , δ2 } y tan pequeño que los dos segmentos
(x0 − a, x0 + a) × {y0 − b}
estén contenidos en la bola B((x0 , y0 ); ρ) (véase el dibujo). Entonces, para cada x ∈ (x0 − a, x0 + a)
se tiene
f (x, y0 − b) < 0 < f (x, y0 + b). (2)
B((x0 , y0 ); ρ)
(x0 , y0 + b)
(x0 − a, y0 + b) (x0 + a, y0 + b)
(x0 , y0 )
(x0 − a, y0 − b) (x0 + a, y0 − b)
(x0 , y0 − b)
∗) g es derivable en (y0 − b, y0 + b), con g 0 (y) = fy (x, y) > 0, por (1), luego g es estrictamente
creciente en [y0 − b, y0 + b]. Por todo esto, existe una única y ∈ [y0 − b, y0 + b] (en realidad,
y ∈ (y0 − b, y0 + b)) tal que g(y) = 0.
Es decir: para cada x ∈ (x0 − a, x0 + a), existe una única y ∈ (y0 − b, y0 + b) tal que f (x, y) = 0.
Tenemos ası́ definida la función ϕ del enunciado, que claramente verifica los apartados (a) y (b).
Falta probar el apartado (c).
II) La función ϕ es continua.
Observemos primero la siguiente propiedad, que se deduce del procedimiento empleado para
definir ϕ: si x ∈ (x0 − a, x0 + a) e y1 , y2 ∈ [y0 − b, y0 + b] son tales que f (x, y1 ) < 0 < f (x, y2 ),
entonces y1 < ϕ(x) < y2 .
Ahora veamos que ϕ es continua. Sea x1 ∈ (x0 − a, x0 + a). Sea ε > 0. ¿Existe algún δ > 0 tal
que |x − x1 | < δ =⇒ |ϕ(x) − ϕ(x1 )| < ε?
Sin pérdida de generalidad, podemos suponer ε suficientemente pequeño para que ϕ(x1 ) − ε,
ϕ(x1 ) + ε ∈ (y0 − b, y0 + b). Como la función y 7→ f (x1 , y) es estrictamente creciente y se tiene
f (x1 , ϕ(x1 )) = 0, entonces
Ahora, f es continua; usando esta propiedad, no es difı́cil probar que existe un δ > 0 tal que para
cada x con |x − x1 | < δ se cumple
es decir:
|ϕ(x) − ϕ(x1 )| < ε,
siempre que |x − x1 | < δ. Luego ϕ es continua en cualquier x1 ∈ (x0 − a, x0 + a), como querı́amos
probar. Utilizaremos esto para probar que ϕ es de clase C (p .
III) La función ϕ es de clase C (p .
6 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
Lo que vamos a probar es que para cada x1 ∈ (x0 − a, x0 + a), ϕ es derivable en x1 y se tiene
fx (x1 , ϕ(x1 ))
ϕ0 (x1 ) = − .
fy (x1 , ϕ(x1 ))
Si demostramos esto, como fx , fy y ϕ son funciones continuas (fy (x1 , ϕ(x1 )) 6= 0, por (1)), ϕ0
será también continua, es decir: ϕ ∈ C (1 y, reiterando, ϕ ∈ C (p .
Sea entonces x1 ∈ (x0 − a, x0 + a) fijo; hay que probar que
ϕ(x) − ϕ(x1 ) fx (x1 , ϕ(x1 ))
∃ lı́m =− .
x→x1 x − x1 fy (x1 , ϕ(x1 ))
Para cada x ∈ (x0 − a, x0 + a), tenemos:
por ser (u, v) un punto intermedio entre (x, ϕ(x)) y (x1 , ϕ(x1 )). Y como las funciones fx y fy son
continuas,
fx (u, v) −→ fx (x1 , ϕ(x1 )),
fy (u, v) −→ fy (x1 , ϕ(x1 ));
en resumen,
ϕ(x) − ϕ(x1 ) fx (x1 , ϕ(x1 ))
∃ lı́m =− ,
x→x1 x − x1 fy (x1 , ϕ(x1 ))
como querı́amos demostrar.
Notas. (a) Un resultado análogo puede obtenerse intercambiando x e y; pero ninguno de los dos
puede garantizarse si (x0 , y0 ) es un punto crı́tico, de manera que fx (x0 , y0 ) = fy (x0 , y0 ) = 0.
(b) A partir de la igualdad f (x, ϕ(x)) = 0 se pueden calcular expresiones para las derivadas
ϕ0 , ϕ00 , . . . , ϕ(p ; derivando los dos miembros de la igualdad,
y ası́
fx (x, ϕ(x))
ϕ0 (x) = − ,
fy (x, ϕ(x))
expresión obligada para ϕ0 (x) que no necesitamos memorizar (y de la que nos hemos servido
en la demostración del teorema para probar que existe ϕ0 (x), lo cual —junto con la existencia
de ϕ— es la gran aportación del teorema.)
3.1. FUNCIONES DE R2 EN R 7
B((x0 , y0 ); a) × (z0 − b, z0 + b) ⊆ Ω
y de forma que para cada (x, y) ∈ B((x0 , y0 ); a) hay un único z ∈ (z0 − b, z0 + b) con f (x, y, z) = 0
y la función definida por
ϕ : B((x0 , y0 ); a) −→ (z0 − b, z0 + b)
(x, y) 7−−−−−−−−→ ϕ(x, y) = único z tal que f (x, y, z) = 0
cumple:
(a) ϕ(x0 , y0 ) = z0 ;
(c) ϕ es de clase C (p .
Notas.
(b) A partir de la igualdad f (x, y, ϕ(x, y))) = 0 se pueden calcular expresiones para las derivadas
parciales ϕx , ϕy , ϕxx , etc., derivando parcialmente los dos miembros de la igualdad,
Ejercicio.
1. Probar el teorema anterior siguiendo punto por punto la demostración del caso n = 2, haciendo
las modificaciones necesarias al cambiar de dimensión.
En efecto, como f ∈ C (∞ (R3 ), f (0, 0, 0) = 0 y fz (0, 0, 0) = 1 6= 0, el TFI nos asegura que existen
una bola B((0, 0); a) y un entorno (−b, b) tales que ∀(x, y) ∈ B((0, 0); a), existe un único z ∈ (−b, b)
tal que f (x, y, z) = 0 y queda definida una función
de clase C (∞ (B((0, 0); a)), sabiendo además que φ(0, 0) = 0. Derivando con respecto a x y con
respecto a y en la ecuación
obtenemos
3x2 + 3φ(x, y)2 φx (x, y) + 1 + φx (x, y) = 0,
6x + 6φ(x, y)φx (x, y)2 + 3φ(x, y)2 φxx (x, y) + φxx (x, y) = 0,
6φ(x, y)φy (x, y)φx (x, y) + 3φ(x, y)2 φxy (x, y) + φxy (x, y) = 0,
6y + 6φ(x, y)φy (x, y)2 + 3φ(x, y)2 φyy (x, y) + φyy (x, y) = 0.
Evaluando en (0, 0) se obtiene φxx (0, 0) = φxy (0, 0) = φyy (0, 0) = 0. Por tanto, podemos asegurar
que, en un entorno de (0, 0),
φ(x, y) = −x − y + o k(x, y)k2 .
podemos extraer una función ϕ : R −→ R tal que F (x, ϕ(x)) = 0, ∀x ∈ R. Del TFI no podemos
extraer esta conclusión global puesto que es un resultado local, pero el TFI sı́ que nos va a servir
para demostrar que la función ϕ ∈ C (∞ (R). En efecto, el ser C (∞ es una propiedad local, es decir, si
podemos demostrar que para cada x0 ∈ R2 existe un entorno abierto U de x0 tal que ϕ ∈ C (∞ (U ),
entonces ϕ ∈ C (∞ (R).
Fijemos pues un punto x0 ∈ R. Aplicando el TFI al punto (x0 , y0 = ϕ(x0 )) obtenemos a, b > 0
tales que ∀x ∈ (x0 − a, x0 + a), existe un único y ∈ (y0 − b, y0 + b) tal que F (x, y) = 0 y queda
definida una función φ : (x0 − a, x0 + a) −→ (y0 − b, y0 + b) poniendo φ(x) = y. Pero por unicidad
es claro que en (x0 − a, x0 + a) tiene que ser φ(x) = ϕ(x). Como el TFI asegura que φ ∈ C (∞ ,
entonces ϕ también lo es.
f : Ω −→ Rm ;
(x, y) 7→ f (x, y), x = (x1 , . . . xn ), y = (y1 , . . . , ym )
y1 = φ1 (x1 , . . . , xn )
...
ym = φm (x1 , . . . , xn )
3.2. CASO GENERAL 9
verificando 1
f (x1 , . . . , xn , φ1 (x1 , . . . , xn ), . . . , φm (x1 , . . . , xn )) = 0
...
m
f (x1 , . . . , xn , φ1 (x1 , . . . , xn ), . . . , φm (x1 , . . . , xn )) = 0
Escrito en forma más abreviada, se trata de ver si podemos encontrar una función φ = (φ1 , . . . , φm )
de un subconjunto de Rn en Rm tal que
f (x, φ(x)) = 0.
Si suponemos que φ es buena y podemos derivar (por ejemplo, con respecto a x1 ) en el sistema an-
terior, obtendrı́amos (por simplicidad, nos olvidamos de los puntos donde se aplican las derivadas):
∂f 1 ∂f 1 ∂φ1 ∂f 1 ∂φm
∂x1 + ∂y1 ∂x1 + ··· + ∂ym ∂x1 =0
...
∂f m ∂f m ∂φ1 ∂f m ∂φm
∂x1 + ∂y1 ∂x1 + ··· + ∂ym ∂x1 =0
1 m
En este sistema lineal de m ecuaciones en las incógnitas ∂φ ∂φ
∂x1 , . . . , ∂x1 , si queremos asegurarnos de
que exista solución, deberemos imponer que la matriz de coeficientes que es
∂f 1 ∂f 1 ∂f 1
∂y1 (x, φ(x) ∂y2 (x, φ(x) ··· ∂ym (x, φ(x)
∂f 2 ∂f 2 ∂f 2
···
∂y (x, φ(x) ∂y2 (x, φ(x) ∂ym (x, φ(x)
1
M = .. .. .. .. )
.
. . .
∂f m ∂f m ∂f m
∂y1 (x, φ(x) ∂y2 (x, φ(x) · · · ∂ym (x, φ(x)
∂φ1 ∂f 1
∂x1 ∂x1
∂φ2 ∂f 2
−1
∂x1 = −M . ∂x1
... ...
∂φm ∂f m
∂x1 ∂x1
∂f 1 ∂f 1 ∂f 1
∂y1 (x, y) ∂y2 (x, y) ··· ∂ym (x, y)
∂f 2 ∂f 2 ∂f 2
···
∂y (x, y) ∂y2 (x, y) ∂ym (x, y)
1
Jy f (x, y) = .. .. .. .. .
.
. . .
∂f m ∂f m ∂f m
∂y1 (x, y) ∂y2 (x, y) · · · ∂ym (x, y)
10 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
Teorema 3.2.1 (de la función implı́cita: caso general). Sean n, m ∈ N y sea f una aplicación
de clase C (p (1 ≤ p ≤ ∞) de un abierto Ω de Rn × Rm ∼ = Rn+m en Rm . Dado (x0 , y0 ) ∈ Ω para
el que f (x0 , y0 ) = 0 y det Jy f (x0 , y0 ) 6= 0, existen abiertos U en Rn y V en Rm , conteniendo
respectivamente a x0 , y0 , de manera que
U ×V ⊆Ω
y ∀x ∈ U existe un único y ∈ V tal que f (x, y) = 0. Queda ası́ definida una función ϕ : U → V
que cumple
(b) ϕ es de clase C (p en U .
(c) en consecuencia, Jϕ(x) = −Jy f (x, ϕ(x))−1 · Jx f (x, ϕ(x)) para cada x ∈ U .
Observación. La unicidad de ϕ conlleva que ϕ(x0 ) = y0 . Por otra parte, puede ponerse equiva-
lentemente en el enunciado U = B(x0 , a), V = B(y0 , b) para a, b > 0 convenientemente elegidos
Notas.
(a) Enfatizamos: para cada x ∈ U , el valor y = ϕ(x) es el único y ∈ V tal que f (x, y) = 0.
(c) A partir de la igualdad f (x, ϕ(x)) = 0, pueden obtenerse expresiones para las derivadas
parciales sucesivas de ϕ, resolviendo sistemas de ecuaciones lineales obtenidos mediante la
regla de la cadena, como hicimos en la introducción de este párrafo. Esta forma suele resultar
más cómoda que acudir a la fórmula que da el teorema para el jacobiano de ϕ, pues ésta pasa
por invertir una matriz (véase el siguiente ejemplo).
Ejemplo. Sea
f : R4 −→ R2 , 3 f (x, y, z, u) = (y 2 + u2 − 2xz, y 3 + u3 + x3 − z 3 ).
Veamos que f (x, y, z, u) = (0, 0) define, en un entorno del punto (x0 , y0 , z0 , u0 ) = (1, −1, 1, 1) una
función implı́cita h(y, u). En efecto, primero comprobamos que
Como queremos despejar las variables x, z en función de las otra dos, debemos aislar la parte del
jacobiano correspondiente a las derivadas respecto de x y de z, i. e.,
−2z −2x
Jx,z f (x, y, z, u) = .
3x2 −3z 2
3.3. FUNCIÓN INVERSA 11
que tiene determinante −12 6= 0. Entonces, el TFI nos asegura que existen: U entorno abierto de
(−1, 1), V entorno abierto de (1, 1) de forma que
3y 2 + 3h1 (y, u)2 h1y (y, u) − 3h2 (y, u)2 h2y (y, u) = 0.
Particularizando en y = −1, z = 1,
Es claro que F ∈ C (p (Ω × Rn ) y
∂f 1 ∂f 1
∂x1 (x) ... ∂xn (x) −1 0 ... 0
∂f 2 ∂f 2
∂x1 (x)... ∂xn (x) 0 −1 . . . 0
JF (x, y) =
... ... ... ... ... ... ...
∂f n ∂f n
∂x1 (x) . . . ∂xn (x) 0 0 . . . −1
donde I es la matriz identidad. Por hipótesis, tenemos que F (x0 , y0 ) = 0 y det Jx F (x0 , y0 ) 6= 0. Por
tanto, por el TFI (podemos despejar las x’s en función de las y’s):
existen V0 entorno abierto de y0 , U0 entorno abierto de x0 con U0 ⊆ Ω tal que
También es claro que la función que define el TFI de V en U que a cada y le asocia el único x
tal que f (x) = y es, por definición, la función inversa de f : U −→ V . El mismo TFI asegura
que esta función es de clase C (p en V .
Jg(y) = −Jx F (g(y), y)−1 .Jy F (g(y), y) = −Jf (g(y))−1 .(−I) = Jf (g(y))−1 .
Observación. El resultado es de carácter local: puede ser det Jf (x) 6= 0 para todo x ∈ Ω sin que
f sea inyectiva (y no tendrá inversa global); ejemplo:
2. f es de clase C (p en Ω.
3. f −1 es de clase C (p en f (Ω).
En la anterior definición queda implı́cito que f (Ω) debe ser un conjunto abierto.
El TFInv local nos ayuda a evitar este punto en muchos casos:
3.3. FUNCIÓN INVERSA 13
Demostración. Sea Ω0 ⊆ Ω un abierto. Debemos probar que f (Ω0 ) es abierto y lo haremos probando
que todo punto es interior. Sea f (x0 ) ∈ f (Ω0 ), (x0 ∈ Ω0 ). Consideramos f : Ω0 −→ Rn y aplicamos
el TFInv local en y0 = f (x0 ). Entonces, existen U ⊆ Ω0 entorno abierto de x0 , V entorno abierto
de f (x0 ) tal que f : U −→ V es biyección. En particular,
f (x0 ) ∈ V = f (U ) ⊆ f (Ω0 )
El siguiente resultado nos dice que no es necesario calcular la inversa para saber si una función
es difeomorfismo.
Demostración. Observemos, primero, que el hecho de ser de clase C (p es una propiedad local. Para
una función h : Ω ⊆ Rn −→ Rm ,
Sólo tenemos que probar que f −1 es de clase C (p en f (Ω) (que ya sabemos que es abierto). Lo
hacemos localmente por la observación. Sea f (x0 ) ∈ f (Ω). Por el TFInv local, existen U y V
entornos abiertos, etc. y nos quedamos con la conclusión de que V es entorno abierto de f (x0 ) y la
función g : V −→ U que aparece allı́, que no es otra que f −1 |V es de clase C (p en V .
Para el recı́proco observar que como f ◦ f −1 = Id : f (Ω) −→ f (Ω) y f −1 ◦ f = Id : Ω −→ Ω,
entonces usando la regla de la cadena, para cada x ∈ Ω se tiene:
Notas.
Ejemplos.
1. La función g(x, y, z) = (e2y + e2z , e2x − e2z , x − y) es un C (∞ -difeomorfismo de R3 en g(R3 ).
En efecto, es claro que g ∈ C (∞ (R3 ), y que
2e2y 2e2z
0
det 2e2x 0 −2e2z = −4(e2y+2z + e2z+2x ) 6= 0,
1 −1 0
14 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
para todo (x, y, z) ∈ R3 . Sólo falta probar que g es inyectiva y aquı́ no nos ayuda la teorı́a, es un
problema algebraico y de conocimiento de las funciones elementales. Si g(x, y, z) = g(x0 , y 0 , z 0 ), es
decir, si 2y 0 0
e + e2z = e2y + e2z
0 0
e2x − e2z = e2x − e2z
x − y = x0 − y 0
0 0 0 0 0
se tiene, sumando las dos primeras, que e2y +e2x = e2y +e2x =⇒ e2y (1+e2x−2y ) = e2y (1+e2x −2y ).
0
Ahora, teniendo en cuenta la tercera, se sigue que e2y = e2y =⇒ y = y 0 , de donde por la tercera
x = x0 y por la primera z = z 0 , con lo que queda demostrada la inyectividad. Esto demuestra que
g es un C (∞ -difeomorfismo de R3 en g(R3 ), sin necesidad de haber hallado la inversa.
El problema de hallar la inversa, muy ligado con el problema de hallar el conjunto imagen, es
otro problema algebraico en el que tampoco nos ayudará la teorı́a vista en el párrafo. Vamos a
hacerlo para nuestra función g:
Se trata de saber para qué (u, v, w) ∈ R3 existe (x, y, z) ∈ R3 tal que g(x, y, z) = (u, v, w). Es
decir, se trata de resolver el sistema (u, v, w datos y x, y, z incógnitas),
2y
e + e2z = u
e2x − e2z = v
x−y =w
Observamos de partida que no para todo (u, v, w) hay solución. Por ejemplo, tiene que ser u > 0 y
si sumamos las dos primeras ecuaciones, e2y + e2x = u + v se ve que también tiene que ser u + v > 0.
Ahora
1 u+v
u + v = e2y + e2x = e2y (1 + e2x−2y ) = e2y (1 + e2w ) =⇒ y = log .
2 1 + e2w
luego, por la tercera ecuación
1 u+v
x = w + log
2 1 + e2w
y, por la primera
u+v
e2z = u − ,
1 + e2w
u+v
que sólo puede tener solución si u − 1+e2w
> 0, que será
1 u+v
z= log u − .
2 1 + e2w
Repasando con detalle el razonamiento anterior, se ve que hemos demostrado que g(R3 ) es el abierto
u+v
g(R3 ) = {(u, v, w) ∈ R3 : u > 0, u + v > 0, u − > 0}
1 + e2w
es 0 en (0, 0).
3.3. FUNCIÓN INVERSA 15
Esto, por supuesto, no quiere decir que f no sea difeomorfismo en algunos abiertos de R2 . Sin
ir más lejos, el TFInv local nos asegura que si (x0 , y0 ) 6= (0, 0), existen U, V abiertos de R2 con U
entorno de (x0 , y0 ) tal que f : U −→ V es difeomorfismo.
Vamos a ver algo mejor: si Ω = {(x, y) : x > 0} es el semiplano de la derecha f : Ω −→ f (Ω) es
un difeomorfismo. La condición sobre el determinante del jacobiano se cumple y sólo resta probar
la inyectividad. Vamos a hacerlo de una forma distinta al ejemplo anterior. Calcularemos f (Ω) y
probaremos que ∀(u, v) ∈ f (Ω), ∃|(x, y) ∈ Ω 3 f (x, y) = (u, v).
Nos preguntamos entonces, para qué pares (u, v) existe un par (y si es único) (x, y) ∈ Ω solución
del sistema 2
x − y 2 = u,
2xy = v,
x>0
Ω0 = R2 \ {(u, 0) : u ≤ 0},
entonces,
∀(u, v) ∈ Ω0 , ∃|(x, y) ∈ Ω 3 f (x, y) = (u, v).
Es decir, f : Ω −→ Ω0 es una biyección. Además f −1 : Ω0 −→ Ω viene dada por
s √
−1 u + u2 + v 2 v
f (u, v) = , q √ .
2 2 2
2 u+ u2 +v
Nota. Para los familiarizados con el cuerpo de los números complejos, obsérvese que si identificamos
R2 con C por (x, y) ∼ z = x + iy, la función anterior no es otra que f (z) = z 2 .
x+y
3. Sea U = {(x, y) : 0 < x < y} y f : U −→ R2 definida por f (x, y) = ( , xy). Vamos a hallar
xy
f (U ).
La cuestión es qué pares (u, v) son tales que existe (x, y) ∈ U tal que f (x, y) = (u, v), es decir,
tales que el sistema x+y
xy = u,
xy = v,
0<x<y
16 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
tiene solución. De entrada, es claro que deben ser u, v > 0. Despejando y de la segunda y sustitu-
yendo el valor en la primera, llegamos a la ecuación de segundo grado
√
2 uv ± u2 v 2 − 4v
x − uvx + v = 0 =⇒ x =
2
Para que exista tal x real, se debe cumplir que u2 v 2 − 4v ≥ 0. Por otro lado, por Cardano, las dos
raı́ces de esta ecuación cumplen que su producto es v. Luego precisamente y es la otra raı́z,
√
uv ∓ u2 v 2 − 4v
y=
2
porque si (u, v) cumple esas condiciones, existe un (x, y) ∈ Ω, tal que f (x, y) = (u, v); además es
único porque tiene que ser precisamente
√ √
uv − u2 v 2 − 4v uv + u2 v 2 − 4v
x= , y= .
2 2
Luego, también hemos probado que f : U −→ f (U ) es biyección y que
√ √
−1 uv − u2 v 2 − 4v uv + u2 v 2 − 4v
f (u, v) = , .
2 2
f : U −→ f (U ) es difeomorfismo (no haremos el determinante) porque comprobamos directamente
que f ∈ C (∞ (U ) y f −1 ∈ C (∞ (f (U )).
Las distintas derivadas parciales de z y ze están relacionadas por la regla de la cadena (obviamos
los puntos donde se aplican).
zes = zx xs + zy ys
zet = zx xt + zy yt
zess = (zxx xs + zxy ys )xs + zx xss + (zyx xs + zyy ys )ys + zy yss
EC
zest = (zxx xt + zxy yt )xs + zx xst + (zyx xt + zyy yt )ys + zy yst
ze = (zxx xt + zxy yt )xt + zx xtt + (zyx xt + zyy yt )yt + zy ytt
tt
...
A las igualdades EC las denominaremos ecuaciones del cambio. Si φ es un difeomorfismo con-
creto, elegido hábilmente, la primitiva EDP en términos de z se podrá transformar en otra más
sencilla en términos de ze. Es objeto de la teorı́a de ecuaciones diferenciales saber qué φ hay que
elegir según el tipo de EDP que tengamos. En nuestro caso, vamos a elegir φ(s, t) = ( s+t s−t
2 , 2 ). Es
decir, nuestro cambio de variables va a ser
s+t s−t
x= , y= .
2 2
Para este cambio particular tendremos
zes = 12 zx + 21 zy
(donde f y g son funciones de una variable de clase C (2 ) la satisface. Ahora sólo falta deshacer el
cambio (porque z = ze ◦ φ−1 ), es decir, calcular φ−1 que en nuestro caso es muy sencillo,
s = x + y, t = x − y.
z = f (x + y) + g(x − y)
En este curso, sólo vamos a adquirir práctica en transformar ecuaciones (si luego las podemos
resolver, mejor), sin preocuparnos de dominios y dónde son difeomorfismos los cambios de variable.
El TFInv local nos asegura muchos difeomorfismos, al menos localmente.
Para obtener las ecuaciones del cambio, resulta muy fácil simbolizar mediante un esquema.
Cuando escribamos para dos letras a −→ b simplemente querremos decir que a depende de b. Todas
las dependencias de letras (flechas) que tenemos en son
s
*
x x - t s
*
*
z
H z
H
H
H
j H
j
H
y yH - s t
H
j
H
t
Ahora, obsérvese que de únicamente una letra (la z) sólo salen flechas y de únicamente dos
letras (la s y la t) sólo llegan flechas. Juntamos estas flechas poniendo la z en el centro y a ambos
lados la s y la t de las dos formas que se puede llegar a ellas. Obtenemos el siguiente esquema
(árbol):
s
*
s x - t
H
Y
HH *
zH
Hj
H
t yH - s
Hj
H
t
En este esquema se deriva hacia ambos lados siguiendo la regla de la cadena y se obtienen las
ecuaciones del cambio EC. Aquı́ puede parecer excesivo realizar tal operación, pero a medida que
compliquemos las cosas, el árbol resultará muy útil y cómodo.
3.3. FUNCIÓN INVERSA 19
En principio, lo que tendriamos que hacer es hallar la inversa de este difeomorfismo, i. e., despejar
(x, y) en función de (s, t),
x = x(s, t)
y = y(s, t)
y proceder como en el caso anterior teniendo
Pero componiendo a ambos lados con el cambio de partida, esto es lo mismo que tener
Entonces, las ecuaciones del cambio son (consideremos sólo las derivadas primeras):
zx = zs sx + zt tx
EC0
zy = zs sy + zt ty
A esto se llega también con el correspondiente árbol; ahora las flechas que tenemos son
x
*
x s-y s
* *
z
H z
H
HH
j H
j
H
y tH-x t
H
j
H
y
De z sólo salen flechas, y sólo llegan a x e y. Ponemos z en el centro y a ambos lados terminamos
con x y y, quedando el árbol
x
*
y s-y
H
Y
HH *
zH
Hj
H
x tH-x
Hj
H
y
Derivando a ambos lados se obtiene con facilidad EC0 .
Ejemplo. Transformemos zxx + zyy = 0 con el cambio
s = x2 − y 2
t = 2xy
Deberı́amos deshacer el cambio, pues en nuestra nueva ecuación sólo pueden aparecer las letras
z, s, t, pero como está igualada a cero, tendremos
zss + ztt = 0.
lo cual es una ecuación en la que intervienen tres variables (u, v, w). El TFI permitirá en muchos
casos despejar una de ellas en función de las otras dos. Por ejemplo, w = w(u, v) que cumplirá
Nos preguntamos por la relación entre las derivadas antiguas zx , zy , zxx , . . . con las derivadas nuevas
wu , wv , wuu , . . . . Si derivamos en ♦ con respecto a u y v obtenemos
(
zu + zw wu = zx (xu + xw wu ) + zy (yu + yw wu )
EC00
zv + zw wv = zx (xv + xw wv ) + zy (yv + yw wv ).
Esto son dos ecuaciones que permiten obtener (wu , wv ) en términos de (zx , zy ) a través de los
datos del cambio xu , xv , xw , yu , yv , yw , zu , zv , zw . Si queremos obtener relaciones para las derivadas
segundas, volverı́amos a derivar.
Aquı́, también sirve el esquema de árbol. Las flechas que tenemos son
u
*
xH v
-
Hj
H
w
x u u
*
*
*
zH yH v
- wH
Hj
H Hj
H H
j
H
y w v
u
*
z
H v -
Hj
H
w
De z sólo salen flechas y a u y v sólo llegan. Juntamos todas ellas, situando z en el centro y a
ambos lados terminamos con u y v (ésta es una forma de esquematizar la relación ♦):
3.3. FUNCIÓN INVERSA 21
u
*
x
H-v u
*
u w H j
H
v -
Y
HH
u v zH
H u
Y
H
Hj
H *
v H w yH v
- u
j
H
H *
w -v
Y sobre este esquema derivamos a ambos lados con respecto a u y v siguiendo la regla de la
cadena, obteniendo las ecuaciones del cambio EC00 .
Si tuviéramos que hacer un cambio
u = u(x, y, z)
v = v(x, y, z)
w = w(x, y, z),
(es decir, inverso del anterior), para obtener las ecuaciones del cambio sigue sirviendo el esquema
de árbol. En este caso, nuestras flechas son
x
*
uH y
-
Hj
H
z
x x u
* *
*
zH
vH y
- wH
HH
j Hj
H H
j
H
y z v
x
*
w
HH y-
j
H
z
Aquı́ w es la letra de la que sólo salen flechas, x e y a las que sólo llegan y obtenemos el árbol
x
*
uHH y
- x
j
H *
x z - y
Y
H
H
x y wH
H x
Y
H
H
Hj
H *
y H z vH y- x
H
j
H *
z -y
Derivando a ambos lados con respecto a x e y por la regla de la cadena, obtenemos las ecuaciones
del cambio (escribimos sólo las primeras derivadas parciales):
(
wx + wz zx = wu (ux + uz zx ) + wv (vx + vz zx )
wy + wz zy = wu (uy + uz zy ) + wv (vy + vz zy )
Ejemplos.
1 Encontrar soluciones de la ecuación
wv = 0.
Una solución a esta sencilla ecuación es w = φ(u) con φ cualquier función de una variable que sea
derivable. Deshaciendo el cambio
log z − (x + y) = φ(x2 + y 2 ),
y despejando la z,
z = exp(x + y + φ(x2 + y 2 ))
serán soluciones de nuestra EDP primera (compruébese).
Ası́, transformar en términos de w = w(u, v) es lo mismo que x = x(y, z). Pongamos el árbol para
este cambio (muchas flechas no aparecerán):
3.3. FUNCIÓN INVERSA 23
u -y
x
H
Y
HH
wH
H
j
H
vH x
H
j
H *
z -y
Derivando a ambos lados con respecto a x e y, obtenemos simplemente:
(
wx = wv vz zx
0 = wu uy + wv vz zy ,
es decir, (
1 = wv zx
0 = wu + wv zy .
Volviendo a derivar a ambos lados la primera respecto de x, la primera respecto de y y la segunda
respecto de y, tenemos:
2
0 = wvv zx + wv zxx
0 = (wvu + wvv zy )zx + wv zxy
0 = (wuu + wuv zy ) + (wvu + wvv zy )zy + wv zyy .
Encontremos ahora una solución no trivial de la EDP. Por ejemplo, w = uev verifica wuu = 0.
Es decir, x = yez verifica la ecuación cambiada. Despejando z, z = log(x/y) verifica la EDP del
principio.
en términos de ρ = ρ(t).
Es como antes, sólo que más simplificado al tener una sola variable. Las flechas que tenemos
aquı́ son
24 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
ρ
*
x - t
y -x ρ -t
yH - ρ
H
j
H
t
Ponemos la y en el centro y a ambos lados acabamos en la t, llegando al árbol
t ρ ρ -t
H
Y
H *
Hy - xH
Hj
H
t t
yρ ρt + yt = yx (xρ ρt + xt ),
que nos proporciona la relación entre yx (y 0 ) con ρt (ρ0 ). Sustituyendo los datos del cambio
Operando y simplicando queda, sin más, ρt = ρ. Una solución de esta ecuación es ρ = et . Desha-
ciendo el cambio, p
ρ = x2 + y 2
t = arc tg(y/x).
Entonces de la igualdad p
x2 + y 2 = earc tg(y/x)
saldrá implı́citamente y = y(x) que satisfará la EDO primitiva (comprobarlo).
G = M ∩ Ω, con Ω abierto de Rn .
1. M 6= ∅,
2. F ∈ C (p (Ω), (p ≥ 1),
ϕ0 : U0 −→ ϕ0 (U0 ) ⊆ M
(x1 , . . . , xk ) 7→ (x1 , . . . , xk , g k+1 (x1 , . . . , xk ), . . . , g n (x1 , . . . , xk ))
Obsérvese que no tienen por qué ser, precisamente, las k primeras. (U0 , ϕ0 ) se llama carta explı́cita
en torno a x0 .
Al cambiar de punto, en general, existirá otra carta explı́cita en la que pueden ser otras k
coordenadas. Puede ocurrir que una misma carta sirva para muchos puntos de la variedad, de
hecho, la misma carta (U0 , ϕ0 ) sirve para todos los puntos del abierto relativo a M , ϕ0 (U0 ).
Ejemplos.
F (x, y) := x2 + y 2 − 1 = 0,
y rango JF (x, y) = 1, ∀(x, y) ∈ C, porque JF (x, y) = (2x, 2y) tiene rango 1 salvo para el punto
(0, 0) que no está en C.
Lo que hemos demostrado en el teorema, para este caso particular es que ∀(x0 , y0 ) ∈ C, en un
entorno, podemos despejar una coordenada en términos de la otra. En efecto, si (x0 , y0 ) es tal que
−1 < x0 < 1 e y0 > 0, entonces existe U0 = (x0 − δ, x0 + δ) y
p
ϕ0 : U0 −→ ϕ0 (U0 ) ⊂ C 3 ϕ0 (x) = (x, 1 − x2 ),
cumpliendo las aserciones del teorema. Si el punto es tal que −1 < x0 < 1 e y0 < 0, lo mismo
poniendo un - en la raı́z. Y si es el punto (1, 0) (ó (−1, 0)) no se puede despejar la y, pero podemos
parametrizar un trozo abierto de C en términos de y. Efectivamente, existe U0 = (−δ, δ) y
p
ϕ0 : U0 −→ ϕ0 (U0 ) ⊂ C 3 ϕ0 (y) = ( 1 − y 2 , y),
2. La esfera (n − 1)-dimensional,
3. El conjunto
M = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1, x + y + z = 0}
3.4. VARIEDADES DIFERENCIABLES EN RN 27
√ √
es una variedad 1-dimensional de R3 de clase C (∞ . En efecto, M 6= ∅ ((1/ 2, −1/ 2, 0) ∈ M ).
Viene dado por la función de R3 en R2 ,
Su matriz jacobiana es
2x 2y 2z
JF (x, y, z) = ,
1 1 1
que tiene rango 2 salvo cuando x = y = z, pero ningún punto de éstos puede estar en M .
Notemos que una curva siempre tiene una parametrización equivalente en cualquier intervalo;
lo más cómodo es parametrizarla en un (−ε, ε) y que el punto x0 se corresponda con t = 0.
Queremos probar que TM (x0 ) es un subespacio vectorial de Rn de dimensión k. Directamente,
parece tarea difı́cil (¿cómo se probarı́a que la suma de elementos de este conjunto está en el con-
junto?) y vamos a dar un rodeo conectando con la función F que define la variedad y la función ϕ
de la carta explı́cita que existe en torno a x0 .
La situación es la siguiente: M = {x ∈ Ω : F (x) = 0} donde F : Ω ⊆ Rn −→ Rn−k es una función
tal que rango JF (x0 ) = n−k. Por otro lado, sabemos que existe una carta explı́cita en torno a x0 que
llamaremos (U, ϕ) cumpliendo el teorema anterior. En particular, ϕ : U ⊆ Rk −→ ϕ(U ) ⊆ M ⊆ Rn
es biyectiva y si llamamos u0 al único punto en U tal que ϕ(u0 ) = x0 , se tiene que rango Jϕ(u0 ) = k.
Recordemos de Álgebra los dos hechos siguientes:
dϕ(u0 ) : Rk −→ Rn
dF (x0 ) : Rn −→ Rn−k
es una aplicación lineal suprayectiva, por tanto, por el teorema de la dimensión, Ker(dF (x0 ))
es un subespacio de Rn de dimensión k.
Proposición 3.4.4.
TM (x0 ) = Im(dϕ(u0 )) = Ker(dF (x0 )),
y como consecuencia TM (x0 ) es un subespacio de Rn de dimensión k.
Demostración. Como ya sabemos que Im(dϕ(u0 )) y Ker(dF (x0 )) son subespacios de dimensión k,
bastará que probemos sólo los dos contenidos
Para el primero, sea h ∈ Im(dϕ(u0 )). Si h = 0 podemos comprobar directamente por la definición
que h ∈ TM (x0 ) (tómese una curva constante γ(t) = x0 ). Si h 6= 0 entonces h = dϕ(u0 )(l) con
l ∈ Rk \ {0}. Como u0 ∈ U y U es abierto en Rk , podemos tomar una bola B(u0 ; δ) ⊆ U y entonces
la curva
δ δ
γ(t) = ϕ(u0 + tl), t ∈ (− , ),
klk klk
tiene su soporte en M (porque u0 +tl ∈ B(u0 ; δ) ⊆ U y ϕ(U ) ⊆ M ); es de clase C (1 por composición
y la regla de la cadena nos da (comprobarlo)
En particular
F (γ(t)) = 0, t ∈ (−ε, ε)
y por la regla de la cadena,
Nota. Como el rango de JF (x0 ) es máximo, sus n − k filas, que están formadas por los vectores
(∇F 1 (x0 ), ∇F 2 (x0 ), . . . , ∇F n−k (x0 )), constituyen un sistema linealmente independiente. Por otro
lado, si h ∈ TM (x0 ),
x0 + TM (x0 ), x0 + NM (x0 )
Ejemplos.
1. Para la circunferencia C = {(x, y) ∈ R2 : F (x, y) := x2 + y 2 − 1 = 0} y un punto (x0 , y0 ) ∈ C,
se tiene
JF (x0 ) = ∇F (x0 ) = (2x0 , 2y0 ),
de donde se deduce que TC (x0 , y0 ) es la recta (subespacio de dimensión 1):
El vector (2x0 , 2y0 ) es una base para el espacio normal. Entonces, NC (x0 , y0 ) es la recta
TS (a) = {(x1 , . . . , xn ) ∈ Rn : a1 x1 + · · · + an xn = 0}
M = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1, x + y + z = 0}
TM (x0 , y0 , z0 ) = {(h, k, l) ∈ R3 : x0 h + y0 k + z0 l = 0; h + k + l = 0}
Demostración. Sea (U, ϕ) una carta explı́cita de M en torno a x0 y sea u0 = ϕ−1 (x0 ). Suponiendo,
por ejemplo, que x0 es un máximo relativo de f condicionado a M , la función g = f ◦ ϕ : u ∈ U →
g(u) = f (ϕ(u)) ∈ R tiene un máximo relativo (sin condicionar) en u0 ; porque si para un δ > 0 es
f (x) ≤ f (x0 ) siempre que x ∈ M y kx − x0 k < δ, como la continuidad de ϕ en u0 garantiza la
existencia de un r > 0 tal que para todo u ∈ U con ku − u0 k < r es kϕ(u) − ϕ(u0 )k < δ, y como
además ϕ(u) estará en M , se sigue que para todo u ∈ U con ku − u0 k < r es
Ya vimos que TM (x0 ) = Im dϕ(u0 ); esto significa que los vectores h ∈ TM (x0 ) son exactamente
los de la forma h = dϕ(u0 )(`) para algún ` ∈ Rk , luego la relación (†) nos dice que para cada
h ∈ TM (x0 ) es df (x0 )(h) = 0 o equivalentemente h∇f (x0 ), hi = 0.
3.5. EXTREMOS SOBRE VARIEDADES 31
Demostración. Teniendo en cuenta que el espacio normal NM (x0 ) admite como base el conjunto
de vectores {∇F 1 (x0 ), . . . , ∇F m (x0 )}, resulta:
x0 es punto crı́tico de f condicionado a M ⇐⇒P ∇f (x0 ) ∈ NM (x0 ) ⇐⇒ existe una (única)
m
m-tupla (λ1 , . . . , λm ) ∈ Rm tal que ∇f (x0 )P= i
i=1 λi ∇F (x0 ) ⇐⇒ existe una (única) m-
m
tupla (λ1 , . . . , λm ) ∈ Rm tal quePdf (x0 ) = i
i=1 λi dF (x0 ) ⇐⇒ existe una (única) m-tupla
m m i
(λ1 , . . . , λm ) ∈ R tal que d(f − i=1 λi F )(x0 ) = 0.
Ejemplo. Hallar los puntos de la esfera S 2 en R3 que disten menos y más de un punto dado (a, b, c)
con a, b, c 6= 0.
El problema es hallar mı́nimos y máximos absolutos de la función (x, y, z) → d((x, y, z), (a, b, c)).
Es obvio que en vez de esta función podemos considerar su cuadrado,
a b
Se deduce fácilmente que λ = 1 − x = 1− y = 1 − zc , de donde y = b
a x, z = c
a x, llevando estos
a2
valores a la cuarta ecuación, se tiene x2= a2 +b2 +c2
, de aquı́ salen dos valores de x que determinan
los de y, z, λ, llegando a las dos únicas soluciones
a b c p
(√ ,√ ,√ ) con λ = 1 − a2 + b2 + c2
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
a b c p
(− √ , −√ , −√ ) con λ = 1 + a2 + b2 + c2 .
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
Como sólo hay dos es claro que una será el mı́nimo que buscamos y la otra el máximo. Basta
a b c
evaluar f en estos puntos para ver que ( √ ,√ ,√ ) corresponde
2
a +b +c2 2 2
a +b +c2 2 a + b2 + c2
2
a b c
al mı́nimo y (− √ , −√ , −√ ) al máximo.
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
Nota. En general, si M es una variedad en Rn y a un punto de Rn \ M , entonces siempre existe
al menos un mı́nimo absoluto x0 ∈ M condicionado a M , de la función distancia (o al cuadrado
que es lo mismo) f (x) = kx − ak2 (pues f (x) es una función continua que tiene lı́mite +∞ cuando
kxk → ∞ y M es cerrado en Rn al ser la antiimagen de {0} por F ). Y este punto tiene que ser
punto crı́tico condicionado a M , es decir, se tiene que cumplir que
Obsérvese con algún dibujo que este hecho tiene un significado geométrico muy claro.
Ejemplo. Entre los triángulos de igual perı́metro, ¿cuál tiene área máxima?
Estamos con un problema tı́pico de máximos condicionados; veamos por qué. Recordemos la
fórmula clásica de Herón que dice que el área de un triángulo es
p
A = p(p − a)(p − b)(p − c)
Otra condición que impone la geometrı́a del problema es que 0 ≤ a, b, c ≤ p. Como el conjunto
K = {(a, b, c) ∈ R3 : a + b + c = 2p, 0 ≤ a, b, c ≤ p}
De las tres primeras ecuaciones se deduce λ(p − a) = λ(p − b) = λ(p − c), de donde a = b = c. Por
tanto, la única solución es
(2p/3, 2p/3, 2p/3) con λ = −p2 /9.
Ası́, la respuesta a nuestra pregunta es el triángulo equilátero.
Resolvamos este problema de máximos. Es claro que hay solución por estar con una función con-
tinua sobre un compacto. También es claro que si (α1 , . . . , αn ) es un máximo también lo serán
(±α1 , . . . , ±αn ) para cualquier combinación de signos. Ası́ podemos suponer que x1 , . . . , xn ≥ 0. Y
también es claro que si alguna coordenada es 0, ese punto no será solución a nuestro problema; por
tanto también podemos suponer que x1 , . . . , xn > 0. Y como última reducción al problema, en vez
de la función de partida podemos tomar su logaritmo y ası́ el problema es equivalente a hallar el
máximo de
M = {(x, y, z) ∈ R3 : x2 − xy + y 2 − z 2 = 1, x2 + y 2 = 1}.
M = {(x, y, z) ∈ R3 : x2 + y 2 = 1, xy + z 2 = 0}.
F 1 (x, y, z) = x2 + y 2 − 1, F 2 (x, y, z) = xy + z 2
34 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS
De la tercera ecuación, si z = 0, yendo a la cuarta y quinta, obtenemos las soluciones (0, ±1, 0)
(con λ = 1, µ = 0) y (±1, 0, 0) (con λ = 1, µ = 0). En estos puntos
(1) si QΦ(x0 )(h) > 0 para cada h ∈ TM (x0 ) \ {0}, se tiene que x0 es un mı́nimo local estricto de
f condicionado a M .
(2) si QΦ(x0 )(h) < 0 para cada h ∈ TM (x0 ) \ {0}, se tiene que x0 es un máximo local estricto de
f condicionado a M .
(3) si x0 es un mı́nimo local de f condicionado a M , se cumple QΦ(x0 )(h) ≥ 0 para cada
h ∈ TM (x0 ).
(4) si x0 es un máximo local de f condicionado a M , se cumple QΦ(x0 )(h) ≤ 0 para cada
h ∈ TM (x0 ).
(5) si existen vectores h1 , h2 ∈ TM (x0 ), tales que QΦ(x0 )(h1 ) > 0 > QΦ(x0 )(h2 ), se tiene que x0
no es un máximo ni un mı́nimo local de f condicionado a M (decimos entonces que es un
punto de silla de f condicionado a M ).
3.5. EXTREMOS SOBRE VARIEDADES 35
Demostración. Sea (U, ϕ) una carta explı́cita de M en torno a x0 . Como para todo x ∈ M es
de donde
Con esto
k n
X X ∂2Φ ∂ϕp ∂ϕq
Q(Φ ◦ ϕ)(u0 )(`) = (x0 ) (u0 ) (u0 ) `i `j
∂xp ∂xq ∂ui ∂uj
i,j=1 p,q=1
n k
X X ∂2Φ ∂ϕp ∂ϕq
= (x0 ) (u0 ) (u0 ) `i `j
∂xp ∂xq ∂ui ∂uj
p,q=1 i,j=1
n k
∂2Φ ∂ϕp
q
X X ∂ϕ
= (x0 ) (u0 ) `i (u0 ) `j
∂xp ∂xq ∂ui ∂uj
p,q=1 i,j=1
n
" k # k
X ∂2Φ X ∂ϕp X ∂ϕq
= (x0 ) (u0 ) `i (u0 ) `j
∂xp ∂xq ∂ui ∂uj
p,q=1 i=1 j=1
En consecuencia, dado que h ∈ TM (x0 ) ⇐⇒ existe ` ∈ Rk tal que h = dϕ(u0 )(`), y que con esta
notación h = 0 ⇐⇒ ` = 0 porque Jϕ(u0 ) es de rango k, podemos afirmar:
Si λ = 0, salen los puntos (0, 0, d/c), (0, d/b, 0), (d/a, 0, 0) y si λ 6= 0 sale (d/3a, d/3b, d/3c) con
λ = d2 /9abc.
Para el punto (0, 0, d/c) es Φ = f − 0 · F = f y el hessiano de esta función en dicho punto es
0 d/c 0
d/c 0 0 .
0 0 0
d
QΦ(0, 0, d/c)[h, k, l] = 2 hk.
c
Luego, sobre R3 es claramente indefinida; pero tenemos que estudiarla sobre el espacio tangente
y sigue saliendo indefinida (por ejemplo, cambia de signo en los puntos del espacio tangente dados
por (1, 1, −(a + b)/c) y (1, −1, −(a − b)/c)). Los otros puntos con λ = 0 son similares.
d2
Para el punto (d/3a, d/3b, d/3c) es Φ = f − 9abc F y el hessiano de Φ en dicho punto queda
0 d/3c d/3b
d/3c 0 d/3a ,
d/3b d/3a 0
con lo que
2d hk hl kl
QΦ(d/3a, d/3b, d/3c)[h, k, l] = + + .
3 c b a
3.5. EXTREMOS SOBRE VARIEDADES 37
Esta forma es indefinida sobre R3 , pero sobre el espacio tangente que vuelve a ser el mismo {(h, k, l) :
ah + bk + cl = 0}, se tiene que cl = −ah − bk, de donde
2d hk hl kl −2d −2d 1 3
(ah)2 + (bk)2 + (ah)(bk) = (ah + bk)2 + (bk)2
+ + =
3 c b a 3abc 3abc 2 4
que es (dependiendo de los signos de a, b, c, d) o siempre ≥ 0 o siempre ≤ 0. Además, si es 0 se
sigue que k = h = 0 y, por tanto, también l = 0.
Ası́, hemos demostrado que la forma es (dependiendo de los signos de a, b, c, d) o bien DP o
bien DN sobre el espacio tangente y el punto (d/3a, d/3b, d/3c) será mı́nimo o máximo local de f
condicionado a M .