0% encontró este documento útil (0 votos)
25 vistas37 páginas

Funciones Implícitas e Inversas en R²

Este documento introduce las funciones implícitas y explica cómo estudiar funciones definidas sobre conjuntos con interior vacío mediante el uso de funciones implícitas. Explica que si se puede despejar una o más variables de una ecuación F(x)=0 en función de las restantes variables, el problema se reduce al estudio de una función de menos variables definida sobre un abierto. Presenta el teorema de la función implícita para funciones de R2 en R, el cual establece condiciones para la existencia y propiedades de una función implícita localmente definida.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • funciones implícitas,
  • teoremas de existencia de solu…,
  • teoremas de existencia,
  • teoremas de continuidad,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …
0% encontró este documento útil (0 votos)
25 vistas37 páginas

Funciones Implícitas e Inversas en R²

Este documento introduce las funciones implícitas y explica cómo estudiar funciones definidas sobre conjuntos con interior vacío mediante el uso de funciones implícitas. Explica que si se puede despejar una o más variables de una ecuación F(x)=0 en función de las restantes variables, el problema se reduce al estudio de una función de menos variables definida sobre un abierto. Presenta el teorema de la función implícita para funciones de R2 en R, el cual establece condiciones para la existencia y propiedades de una función implícita localmente definida.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • funciones implícitas,
  • teoremas de existencia de solu…,
  • teoremas de existencia,
  • teoremas de continuidad,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …,
  • teoremas de diferenciación de …

Capı́tulo 3

FUNCIONES IMPLÍCITAS E
INVERSAS

En este capı́tulo vamos a estudiar problemas propios de varias variables que no tienen análogo
para una variable. Para entender de qué se trata nos situamos en R2 . Ya disponemos de herramientas
suficientes para el estudio de una función f(x,y) de clase suficientemente buena en un abierto de R2 ,
las desarrolladas en el capı́tulo anterior. Pero, supongamos que queremos estudiar nuestra función
f en un conjunto cerrado de interior vacı́o, como puede ser el caso de la circunferencia unidad.
Dicha circunferencia es un caso particular de conjunto del siguiente tipo:

M = {(x, y) : F (x, y) = 0}

donde F (x, y) = x2 + y 2 − 1 es una función de dos variables de clase C (∞ con valores en R. Nada de
lo dicho en el capı́tulo anterior se puede aplicar para estudiar f sobre M porque ningún punto de
M es interior. Pero observamos que este estudio equivale a lo siguiente: llamemos C + a la parte
√ de
la circunferencia en el semiplano superior abierto; C + consta de puntos (x, y) donde y = x2 − 1
y x ∈ (−1, 1). Entonces, estudiar f (x, y) en C + es equivalente a estudiar
p
g(x) = f (x, 1 − x2 ), x ∈ (−1, 1).

Si
√ f es buena, g también lo es por composiciones donde aparecen f y la expresión despejada
1 − x2 , luego tenemos un problema para una función de una variable en el abierto (−1, 1) de R.
Análogamente, si queremos estudiar f (x, y, z) en la parte del semiespacio superior de la esfera

M = {(x, y, z) : F (x, y, z) = 0}, con F (x, y, z) = x2 + y 2 + z 2 − 1

que es un conjunto con interior vacı́o en R3 , con la teorı́a del capı́tulo anterior no tenemos nada
que hacer. Pero este estudio es equivalente al de la función de dos variables
p
g(x, y) = f (x, y, 1 − x2 − y 2 ),

en {x2 + y 2 < 1} que es un conjunto abierto en R2 y, por tanto, a g sı́ que le podemos aplicar los
resultados del capı́tulo 2.
¿Qué está ocurriendo en estos sencillos ejemplos? Simplemente que de√F (x, y) = 0, podemos
despejar y = ϕ(x), donde ϕ es una función buena (en concreto, ϕ(x) = 1 − x2 ). O, en el otro
caso, podemos despejar de F (x, y, z) = 0, z = ψ(x, y).
Estas funciones F van de Rn en R (con n = 2 en el primer caso o n = 3 en el segundo). En
la práctica, uno se encuentra con más ejemplos de este tipo. Ası́, si queremos estudiar una función
f (x, y, z) sobre el conjunto (circunferencia en R3 )

M = {(x, y, z) : x2 + y 2 + z 2 − 1 = 0, x + y = 0}

1
2 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

será importante darse cuenta de que (al menos, en alguna zona) y = −x, z = 1 − 2x2 , es decir,
podemos despejar dos variables (la y y la z) en función de una sola (la x), y nuestro problema
será equivalente al estudio de la función de una variable
p
g(x) = f (x, −x, 1 − 2x2 )
que es buena porque lo es la f y porque lo son las funciones que despejan y, z en función de x.
Dicho en forma más abstracta, lo que ocurre en este ejemplo es lo siguiente: tenemos una función
F : R3 −→ R2 , F (x, y, z) = (x2 + y 2 + z 2 − 1, x + y)
y podemos despejar del sistema F (x, y, z) = 0, y = φ(x), z = χ(x), donde φ y χ son funciones
buenas.
En general, interesará saber si de un sistema de ecuaciones F (x) = 0, donde F es una función
buena que va de Rn en Rm , podremos despejar m de las variables x1 , . . . , xn en función de las
n − m restantes y si las funciones que despejan son buenas. Ası́, el estudio de una función f (x) de n
variables, sobre el conjunto de puntos dado por F (x) = 0 (que no será abierto en Rn ) se reducirá al
estudio de otra función de n − m variables, pero ahora sobre un abierto.

3.1. Teorema de la función implı́cita para funciones de R2 en R


Volviendo al caso inicial y más sencillo n = 2, m = 1, planteemos el problema, primero de forma
vaga, y hagamos alguna consideración más con objeto de precisarlo.

Problema: Dada F : Ω ⊂ R2 −→ R de clase C (p , consideremos la ecuación F (x, y) = 0. ¿Existe


algún abierto U en R, tal que ∀x ∈ U existe un único y verificando F (x, y) = 0? Si esto es cierto,
queda bien definida una función
ϕ : U −→ R, 3 x −→ y,
que cumple F (x, ϕ(x)) = 0. ¿Es esta función de clase C (p ?

Maticemos este enunciado con algunos ejemplos.

F (x, y) = x2 +y 2 +1. Aquı́ no existen puntos que verifiquen la ecuación F (x, y) = 0. Debemos
imponer que exista al menos un par (x0 , y0 ) tal que F (x0 , y0 ) = 0.
= x2 + y 2 − 1. Aquı́ observamos que para cada x ∈ (−1, 1) tenemos dos valores de y
F (x, y) √
(y = ± 1 − x2 ) que satisfacen F (x, y) = 0. En este ejemplo, vemos claro que para obtener
una función buena nos podemos decidir siempre por + o siempre por −. Pero en otros casos,
puede que no quede clara esta forma de decidirse. Esto nos indica que el planteamiento del
problema tiene que ser local. Obsérvese que, en este ejemplo, es cierto lo siguiente:
Dado (x0 , y0 ) con −1 < x0 < 1 y F (x0 , y0 ) = 0, podemos encontrar U entorno de x0 , V
entorno de y0 tal que ∀x ∈ U , existe un único y ∈ V verificando F (x, y) = 0.
Con alguna hipótesis añadida, la anterior aserción la podremos demostrar para F general.
Supongamos que de F (x, y) = 0 podemos extraer efectivamente una función y = ϕ(x) tal que
F (x, ϕ(x)) = 0 y que ϕ es una función buena (en este caso, derivable). Entonces, usando la
regla de la cadena tendremos que
Fx (x, ϕ(x)) + Fy (x, ϕ(x))ϕ0 (x) = 0.
Para poder despejar ϕ0 (x), parece que deberemos imponer alguna condición del tipo
Fy (x, ϕ(x)) 6= 0.
Esta será la hipótesis añadida que necesitaremos.
3.1. FUNCIONES DE R2 EN R 3

Extraer una función implı́cita de F (x, y) = 0 para funciones tan sencillas como F (x, y) =
x2 + y 2 − 1 no es interesante pues lo podemos hacer explı́citamente. El problema empieza
a tener su interés cuando nos encontramos con funciones como, por ejemplo,

F (x, y) = x2 y 5 + (x4 + 1)y + 2x.

En la ecuación F (x, y) = 0, para despejar explı́citamente y en función de x, necesitarı́amos


resolver una ecuación de quinto grado (y es conocido desde los tiempos de Galois, s. XIX, que
no se puede expresar con una fórmula). Pero, es muy fácil demostrar que

∀x ∈ R, existe un único y ∈ R 3 F (x, y) = 0.

En efecto, la clave va a ser el teorema de Bolzano. Fijemos x0 ∈ R y consideremos la función


de una variable g(y) = F (x0 , y). La derivada de esta función es

g 0 (y) = 5x20 y 4 + x40 + 1 > 0, ∀y ∈ R,

luego, g(y) es estrictamente creciente. Por otro lado, es inmediato comprobar que

lı́m g(y) = −∞, lı́m g(y) = +∞.


y→−∞ y→+∞

Por tanto, g tiene un único cero que llamamos y0 . Es decir, existe un único y0 tal que
F (x0 , y0 ) = 0 que es lo que querı́amos demostrar.
Entonces, tenemos bien definida una función ϕ : R −→ R tal que F (x, ϕ(x)) = 0, ∀x ∈ R.
Demostraremos más adelante que esta función es de clase C (∞ . De esta función no sabemos
ninguna representación explı́cita, pero tenemos la información de que cumple

x2 ϕ(x)5 + (x4 + 1)ϕ(x) + 2x = 0, ∀x ∈ R.

En la ecuación anterior podemos derivar tantas veces como queramos y obtener relaciones
entre las derivadas de ϕ y a la postre tener bastante información.

Estos ejemplos nos dan idea de las condiciones que tenemos que imponer a F para sacar buenas
funciones implı́citas y también del método de demostración.

Teorema 3.1.1 (de la función implı́cita, caso f : R2 −→ R). Sean Ω abierto en R2 , f : Ω −→ R


de clase C (p (Ω) con 1 ≤ p ≤ ∞, (x0 , y0 ) ∈ Ω tal que f (x0 , y0 ) = 0, fy (x0 , y0 ) 6= 0. Entonces, existen
a, b > 0 tales que
(x0 − a, x0 + a) × (y0 − b, y0 + b) ⊆ Ω
y de forma que para cada x ∈ (x0 − a, x0 + a) hay una única y ∈ (y0 − b, y0 + b) con f (x, y) = 0 y
la función definida por

ϕ : (x0 − a, x0 + a) −→ (y0 − b, y0 + b)
x 7−−−−−−−−→ ϕ(x) = única y tal que f (x, y) = 0

cumple:

(a) ϕ(x0 ) = y0 ;

(b) f (x, ϕ(x)) = 0 para cada x ∈ (x0 − a, x0 + a);

(c) ϕ es de clase C (p .
4 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Demostración. O bien fy (x0 , y0 ) > 0, o bien fy (x0 , y0 ) < 0; vamos a suponer que

fy (x0 , y0 ) > 0

(en el otro caso, se sigue de manera análoga).


I) Definición de la función ϕ.
Como la función fy : Ω −→ R es continua, por ser f ∈ C (1 (Ω), y fy (x0 , y0 ) > 0, fy es positiva
en algún entorno de (x0 , y0 ); es decir: existe algún ρ > 0 tal que

fy (x, y) > 0 siempre que (x, y) ∈ B((x0 , y0 ); ρ). (1)

Consideremos la función h : (y0 − ρ, y0 + ρ) −→ R dada por

h(y) = f (x0 , y).

Está bien definida y es derivable; h0 (y) = fy (x0 , y) > 0 para cada y ∈ (y0 − ρ, y0 + ρ), ası́ que h
es estrictamente creciente. Fijemos ahora b ∈ R tal que 0 < b < ρ. Entonces, h(y0 − b) < h(y0 ) <
h(y0 + b), es decir:
f (x0 , y0 − b) < 0 < f (x0 , y0 + b).

Consideremos ahora la función


k(x) = f (x, y0 − b),

que está bien definida en algún intervalo de la forma (x0 − ε, x0 + ε); esta función es continua y se
tiene k(x0 ) = f (x0 , y0 − b) < 0, ası́ que k es negativa cerca de x0 . Es decir: existe algún δ1 > 0 tal
que
f (x, y0 − b) = k(x) < 0 siempre que x ∈ (x0 − δ1 , x0 + δ1 ).

Con similar razonamiento, existe algún δ2 > 0 tal que

0 < f (x, y0 + b) siempre que x ∈ (x0 − δ2 , x0 + δ2 ).

Tomemos ahora a > 0 tal que a < mı́n{δ1 , δ2 } y tan pequeño que los dos segmentos

(x0 − a, x0 + a) × {y0 + b},

(x0 − a, x0 + a) × {y0 − b}

estén contenidos en la bola B((x0 , y0 ); ρ) (véase el dibujo). Entonces, para cada x ∈ (x0 − a, x0 + a)
se tiene
f (x, y0 − b) < 0 < f (x, y0 + b). (2)

Sea ahora x ∈ (x0 − a, x0 + a); consideremos la función g : [y0 − b, y0 + b] −→ R dada por

g(y) = f (x, y);

está bien definida y se tiene:

∗) g es continua en [y0 − b, y0 + b];

∗) g(y0 − b) < 0 < g(y0 + b), por (2);


3.1. FUNCIONES DE R2 EN R 5

B((x0 , y0 ); ρ)

(x0 , y0 + b)
(x0 − a, y0 + b) (x0 + a, y0 + b)

(x0 , y0 )

(x0 − a, y0 − b) (x0 + a, y0 − b)
(x0 , y0 − b)

∗) g es derivable en (y0 − b, y0 + b), con g 0 (y) = fy (x, y) > 0, por (1), luego g es estrictamente
creciente en [y0 − b, y0 + b]. Por todo esto, existe una única y ∈ [y0 − b, y0 + b] (en realidad,
y ∈ (y0 − b, y0 + b)) tal que g(y) = 0.
Es decir: para cada x ∈ (x0 − a, x0 + a), existe una única y ∈ (y0 − b, y0 + b) tal que f (x, y) = 0.
Tenemos ası́ definida la función ϕ del enunciado, que claramente verifica los apartados (a) y (b).
Falta probar el apartado (c).
II) La función ϕ es continua.
Observemos primero la siguiente propiedad, que se deduce del procedimiento empleado para
definir ϕ: si x ∈ (x0 − a, x0 + a) e y1 , y2 ∈ [y0 − b, y0 + b] son tales que f (x, y1 ) < 0 < f (x, y2 ),
entonces y1 < ϕ(x) < y2 .
Ahora veamos que ϕ es continua. Sea x1 ∈ (x0 − a, x0 + a). Sea ε > 0. ¿Existe algún δ > 0 tal
que |x − x1 | < δ =⇒ |ϕ(x) − ϕ(x1 )| < ε?
Sin pérdida de generalidad, podemos suponer ε suficientemente pequeño para que ϕ(x1 ) − ε,
ϕ(x1 ) + ε ∈ (y0 − b, y0 + b). Como la función y 7→ f (x1 , y) es estrictamente creciente y se tiene
f (x1 , ϕ(x1 )) = 0, entonces

f (x1 , ϕ(x1 ) − ε) < 0 < f (x1 , ϕ(x1 ) + ε).

Ahora, f es continua; usando esta propiedad, no es difı́cil probar que existe un δ > 0 tal que para
cada x con |x − x1 | < δ se cumple

f (x, ϕ(x1 ) − ε) < 0 < f (x, ϕ(x1 ) + ε).

Y, por la observación del principio de este apartado, se tendrá

ϕ(x1 ) − ε < ϕ(x) < ϕ(x1 ) + ε,

es decir:
|ϕ(x) − ϕ(x1 )| < ε,
siempre que |x − x1 | < δ. Luego ϕ es continua en cualquier x1 ∈ (x0 − a, x0 + a), como querı́amos
probar. Utilizaremos esto para probar que ϕ es de clase C (p .
III) La función ϕ es de clase C (p .
6 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Lo que vamos a probar es que para cada x1 ∈ (x0 − a, x0 + a), ϕ es derivable en x1 y se tiene
fx (x1 , ϕ(x1 ))
ϕ0 (x1 ) = − .
fy (x1 , ϕ(x1 ))
Si demostramos esto, como fx , fy y ϕ son funciones continuas (fy (x1 , ϕ(x1 )) 6= 0, por (1)), ϕ0
será también continua, es decir: ϕ ∈ C (1 y, reiterando, ϕ ∈ C (p .
Sea entonces x1 ∈ (x0 − a, x0 + a) fijo; hay que probar que
ϕ(x) − ϕ(x1 ) fx (x1 , ϕ(x1 ))
∃ lı́m =− .
x→x1 x − x1 fy (x1 , ϕ(x1 ))
Para cada x ∈ (x0 − a, x0 + a), tenemos:

(x1 , ϕ(x1 )) ∈ B((x0 , y0 ); ρ),

(x, ϕ(x)) ∈ B((x0 , y0 ); ρ);


por el teorema del valor medio aplicado a la función f , existe algún punto (u, v) entre (x, ϕ(x)) y
(x1 , ϕ(x1 )) tal que
 
 
0 = f (x, ϕ(x)) − f (x1 , ϕ(x1 )) = df (u, v) x, ϕ(x) − x1 , ϕ(x1 )
 
= df (u, v) x − x1 , ϕ(x) − ϕ(x1 ) = fx (u, v)(x − x1 ) + fy (u, v) ϕ(x) − ϕ(x1 ) ;
es decir:
ϕ(x) − ϕ(x1 ) fx (u, v)
=−
x − x1 fy (u, v)
(hay que tener en cuenta que fy (u, v) > 0, por (1), ya que (u, v) ∈ B((x0 , y0 ); ρ)).
Si ahora x −→ x1 , también será ϕ(x) −→ ϕ(x1 ), por ser ϕ continua; con lo cual,

(u, v) −→ (x1 , ϕ(x1 )),

por ser (u, v) un punto intermedio entre (x, ϕ(x)) y (x1 , ϕ(x1 )). Y como las funciones fx y fy son
continuas,
fx (u, v) −→ fx (x1 , ϕ(x1 )),
fy (u, v) −→ fy (x1 , ϕ(x1 ));
en resumen,
ϕ(x) − ϕ(x1 ) fx (x1 , ϕ(x1 ))
∃ lı́m =− ,
x→x1 x − x1 fy (x1 , ϕ(x1 ))
como querı́amos demostrar.

Notas. (a) Un resultado análogo puede obtenerse intercambiando x e y; pero ninguno de los dos
puede garantizarse si (x0 , y0 ) es un punto crı́tico, de manera que fx (x0 , y0 ) = fy (x0 , y0 ) = 0.
(b) A partir de la igualdad f (x, ϕ(x)) = 0 se pueden calcular expresiones para las derivadas
ϕ0 , ϕ00 , . . . , ϕ(p ; derivando los dos miembros de la igualdad,

fx (x, ϕ(x)) + fy (x, ϕ(x)) · ϕ0 (x) = 0,

y ası́
fx (x, ϕ(x))
ϕ0 (x) = − ,
fy (x, ϕ(x))
expresión obligada para ϕ0 (x) que no necesitamos memorizar (y de la que nos hemos servido
en la demostración del teorema para probar que existe ϕ0 (x), lo cual —junto con la existencia
de ϕ— es la gran aportación del teorema.)
3.1. FUNCIONES DE R2 EN R 7

El teorema anterior se extiende para funciones de Rn en R, con n ≥ 2 cualquiera, en la siguiente


forma: lo enunciamos para n = 3

Teorema 3.1.2 (de la función implı́cita, caso f : R3 −→ R). Sean Ω abierto en R3 , f : Ω −→ R


de clase C (p (Ω) con 1 ≤ p ≤ ∞, (x0 , y0 , z0 ) ∈ Ω tal que f (x0 , y0 , z0 ) = 0, fz (x0 , y0 , z0 ) 6= 0.
Entonces, existen a, b > 0 tales que

B((x0 , y0 ); a) × (z0 − b, z0 + b) ⊆ Ω

y de forma que para cada (x, y) ∈ B((x0 , y0 ); a) hay un único z ∈ (z0 − b, z0 + b) con f (x, y, z) = 0
y la función definida por

ϕ : B((x0 , y0 ); a) −→ (z0 − b, z0 + b)
(x, y) 7−−−−−−−−→ ϕ(x, y) = único z tal que f (x, y, z) = 0

cumple:

(a) ϕ(x0 , y0 ) = z0 ;

(b) f (x, y, ϕ(x, y)) = 0 para cada (x, y) ∈ B((x0 , y0 ); a);

(c) ϕ es de clase C (p .

Notas.

(a) Resultados análogos pueden obtenerse intercambiando x, y y z. Por ejemplo, si fy (x0 , y0 , z0 ) 6=


0, puede obtenerse y = ϕ(x, z) tal que f (x, ϕ(x, z), z) = 0.

(b) A partir de la igualdad f (x, y, ϕ(x, y))) = 0 se pueden calcular expresiones para las derivadas
parciales ϕx , ϕy , ϕxx , etc., derivando parcialmente los dos miembros de la igualdad,

fx (x, y, ϕ(x, y)) + fz (x, y, ϕ(x, y)) · ϕx (x, y) = 0,

fy (x, y, ϕ(x, y)) + fz (x, y, ϕ(x, y)) · ϕy (x, y) = 0,


y ası́
fx (x, y, ϕ(x, y))
ϕx (x, y) = − ,
fz (x, y, ϕ(x, y))
fy (x, y, ϕ(x, y))
ϕy (x, y) = − ,
fz (x, y, ϕ(x, y))
y volviendo a derivar, se van obteniendo las parciales sucesivas.

Ejercicio.

1. Probar el teorema anterior siguiendo punto por punto la demostración del caso n = 2, haciendo
las modificaciones necesarias al cambiar de dimensión.

2. Enunciar el teorema similar para n ≥ 2 cualquiera.

Ejemplo. Probar que la ecuación f (x, y, z) := x3 + y 3 + z 3 + x + y + z = 0 define una función


implı́cita z = φ(x, y) en un entorno de (0, 0, 0). Hallar la fórmula de Taylor para φ en (0, 0).

En efecto, como f ∈ C (∞ (R3 ), f (0, 0, 0) = 0 y fz (0, 0, 0) = 1 6= 0, el TFI nos asegura que existen
una bola B((0, 0); a) y un entorno (−b, b) tales que ∀(x, y) ∈ B((0, 0); a), existe un único z ∈ (−b, b)
tal que f (x, y, z) = 0 y queda definida una función

φ : B((0, 0); a) −→ (−b, b) 3 f (x, y, φ(x, y)) = 0,


8 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

de clase C (∞ (B((0, 0); a)), sabiendo además que φ(0, 0) = 0. Derivando con respecto a x y con
respecto a y en la ecuación

x3 + y 3 + φ(x, y)3 + x + y + φ(x, y) = 0, (x, y) ∈ B((0, 0); a),

obtenemos
3x2 + 3φ(x, y)2 φx (x, y) + 1 + φx (x, y) = 0,


3y 2 + 3φ(x, y)2 φy (x, y) + 1 + φy (x, y) = 0.


Y evaluando en (0, 0) se obtiene φx (0, 0) = φy (0, 0) = −1. Volviendo a derivar,

 6x + 6φ(x, y)φx (x, y)2 + 3φ(x, y)2 φxx (x, y) + φxx (x, y) = 0,

6φ(x, y)φy (x, y)φx (x, y) + 3φ(x, y)2 φxy (x, y) + φxy (x, y) = 0,
6y + 6φ(x, y)φy (x, y)2 + 3φ(x, y)2 φyy (x, y) + φyy (x, y) = 0.

Evaluando en (0, 0) se obtiene φxx (0, 0) = φxy (0, 0) = φyy (0, 0) = 0. Por tanto, podemos asegurar
que, en un entorno de (0, 0),
φ(x, y) = −x − y + o k(x, y)k2 .


Ejemplo. Al principio del capı́tulo demostramos que de la ecuación

F (x, y) := x2 y 5 + (x4 + 1)y + 2x = 0,

podemos extraer una función ϕ : R −→ R tal que F (x, ϕ(x)) = 0, ∀x ∈ R. Del TFI no podemos
extraer esta conclusión global puesto que es un resultado local, pero el TFI sı́ que nos va a servir
para demostrar que la función ϕ ∈ C (∞ (R). En efecto, el ser C (∞ es una propiedad local, es decir, si
podemos demostrar que para cada x0 ∈ R2 existe un entorno abierto U de x0 tal que ϕ ∈ C (∞ (U ),
entonces ϕ ∈ C (∞ (R).
Fijemos pues un punto x0 ∈ R. Aplicando el TFI al punto (x0 , y0 = ϕ(x0 )) obtenemos a, b > 0
tales que ∀x ∈ (x0 − a, x0 + a), existe un único y ∈ (y0 − b, y0 + b) tal que F (x, y) = 0 y queda
definida una función φ : (x0 − a, x0 + a) −→ (y0 − b, y0 + b) poniendo φ(x) = y. Pero por unicidad
es claro que en (x0 − a, x0 + a) tiene que ser φ(x) = ϕ(x). Como el TFI asegura que φ ∈ C (∞ ,
entonces ϕ también lo es.

3.2. Teorema de la función implı́cita (caso general)


Utilizaremos la siguiente notación. Sea Ω abierto en Rn × Rm ∼
= Rn+m y sea

f : Ω −→ Rm ;
(x, y) 7→ f (x, y), x = (x1 , . . . xn ), y = (y1 , . . . , ym )

Plantearse f (x, y) = 0 es plantearse un sistema


 1
 f (x1 , . . . , xn , y1 , . . . , ym ) = 0
 2

f (x1 , . . . , xn , y1 , . . . , ym ) = 0

 ...
 m
f (x1 , . . . , xn , y1 , . . . , ym ) = 0

de m ecuaciones con n + m incógnitas. Lo natural es preguntarse si podemos despejar m de ellas


(por ejemplo, y1 , . . . , ym ) en función de las n restantes (las x1 , . . . , xn ). Es decir, si podemos poner

 y1 = φ1 (x1 , . . . , xn )

...
ym = φm (x1 , . . . , xn )

3.2. CASO GENERAL 9

verificando  1
 f (x1 , . . . , xn , φ1 (x1 , . . . , xn ), . . . , φm (x1 , . . . , xn )) = 0
...
 m
f (x1 , . . . , xn , φ1 (x1 , . . . , xn ), . . . , φm (x1 , . . . , xn )) = 0

Escrito en forma más abreviada, se trata de ver si podemos encontrar una función φ = (φ1 , . . . , φm )
de un subconjunto de Rn en Rm tal que

f (x, φ(x)) = 0.

Si suponemos que φ es buena y podemos derivar (por ejemplo, con respecto a x1 ) en el sistema an-
terior, obtendrı́amos (por simplicidad, nos olvidamos de los puntos donde se aplican las derivadas):

∂f 1 ∂f 1 ∂φ1 ∂f 1 ∂φm


 ∂x1 + ∂y1 ∂x1 + ··· + ∂ym ∂x1 =0
...
 ∂f m ∂f m ∂φ1 ∂f m ∂φm

∂x1 + ∂y1 ∂x1 + ··· + ∂ym ∂x1 =0

1 m
En este sistema lineal de m ecuaciones en las incógnitas ∂φ ∂φ
∂x1 , . . . , ∂x1 , si queremos asegurarnos de
que exista solución, deberemos imponer que la matriz de coeficientes que es
 ∂f 1 ∂f 1 ∂f 1

∂y1 (x, φ(x) ∂y2 (x, φ(x) ··· ∂ym (x, φ(x)
 ∂f 2 ∂f 2 ∂f 2
···

 ∂y (x, φ(x) ∂y2 (x, φ(x) ∂ym (x, φ(x) 

1
M = .. .. .. .. )
.

 . . . 
∂f m ∂f m ∂f m
∂y1 (x, φ(x) ∂y2 (x, φ(x) · · · ∂ym (x, φ(x)

tenga determinante distinto de 0. Además obtendrı́amos, resolviendo el sistema, que

∂φ1 ∂f 1
   
∂x1 ∂x1
 ∂φ2   ∂f 2 
−1 
∂x1  = −M .  ∂x1
  
 
 ...   ... 
∂φm ∂f m
∂x1 ∂x1

Derivando respecto de las otras coordenadas x2 , . . . , xn se obtienen expresiones análogas, pero


la matriz de los coeficientes siempre es M . Efectivamente, si imponemos simplemente la condición
detM 6= 0 en un punto, encontraremos solución a nuestro problema; por supuesto, local como ya
ocurrı́a en la sección anterior.
Antes de enunciarlo, introducimos la siguientes notaciones para distinguir las partes de la matriz
jacobiana correspondientes a las primeras n variables y a las m últimas,
 ∂f 1 ∂f 1 ∂f 1

∂x1 (x, y) ∂x2 (x, y) ··· ∂xn (x, y)
 ∂f 2 ∂f 2 ∂f 2
···

 ∂x (x, y) ∂x2 (x, y) ∂xn (x, y) 

1
Jx f (x, y) =  .. .. .. .. ;
.

 . . . 
∂f m ∂f m ∂f m
∂x1 (x, y) ∂x2 (x, y) · · · ∂xn (x, y)

 ∂f 1 ∂f 1 ∂f 1

∂y1 (x, y) ∂y2 (x, y) ··· ∂ym (x, y)
 ∂f 2 ∂f 2 ∂f 2
···

 ∂y (x, y) ∂y2 (x, y) ∂ym (x, y) 

1
Jy f (x, y) =  .. .. .. .. .
.

 . . . 
∂f m ∂f m ∂f m
∂y1 (x, y) ∂y2 (x, y) · · · ∂ym (x, y)
10 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Teorema 3.2.1 (de la función implı́cita: caso general). Sean n, m ∈ N y sea f una aplicación
de clase C (p (1 ≤ p ≤ ∞) de un abierto Ω de Rn × Rm ∼ = Rn+m en Rm . Dado (x0 , y0 ) ∈ Ω para
el que f (x0 , y0 ) = 0 y det Jy f (x0 , y0 ) 6= 0, existen abiertos U en Rn y V en Rm , conteniendo
respectivamente a x0 , y0 , de manera que

U ×V ⊆Ω

y ∀x ∈ U existe un único y ∈ V tal que f (x, y) = 0. Queda ası́ definida una función ϕ : U → V
que cumple

(a) f (x, ϕ(x)) = 0 para cada x ∈ U .

(b) ϕ es de clase C (p en U .

(c) en consecuencia, Jϕ(x) = −Jy f (x, ϕ(x))−1 · Jx f (x, ϕ(x)) para cada x ∈ U .

Observación. La unicidad de ϕ conlleva que ϕ(x0 ) = y0 . Por otra parte, puede ponerse equiva-
lentemente en el enunciado U = B(x0 , a), V = B(y0 , b) para a, b > 0 convenientemente elegidos

La demostración no la haremos aquı́. Es más complicada que en el caso m = 1 ya que no se


puede usar Bolzano. Se basa en una generalización del método de Newton (o de las tangentes) para
encontrar ceros de funciones. Los interesados la pueden encontrar en el apéndice 2.

Notas.

(a) Enfatizamos: para cada x ∈ U , el valor y = ϕ(x) es el único y ∈ V tal que f (x, y) = 0.

(b) En lugar de “despejar” y1 , . . . , ym en función de x1 , . . . , xn , pueden despejarse otras m varia-


bles en función del resto, si se cumplen las hipótesis análogas a las del teorema que serán que
la parte m × m de la matriz jacobiana de f correspondiente a las m variables que queremos
despejar tenga determinante distinto de cero.

(c) A partir de la igualdad f (x, ϕ(x)) = 0, pueden obtenerse expresiones para las derivadas
parciales sucesivas de ϕ, resolviendo sistemas de ecuaciones lineales obtenidos mediante la
regla de la cadena, como hicimos en la introducción de este párrafo. Esta forma suele resultar
más cómoda que acudir a la fórmula que da el teorema para el jacobiano de ϕ, pues ésta pasa
por invertir una matriz (véase el siguiente ejemplo).

Ejemplo. Sea

f : R4 −→ R2 , 3 f (x, y, z, u) = (y 2 + u2 − 2xz, y 3 + u3 + x3 − z 3 ).

Veamos que f (x, y, z, u) = (0, 0) define, en un entorno del punto (x0 , y0 , z0 , u0 ) = (1, −1, 1, 1) una
función implı́cita h(y, u). En efecto, primero comprobamos que

f (1, −1, 1, 1) = (0, 0)

y en lo que respecta a la condición sobre el jacobiano, tenemos


 
−2z 2y −2x 2u
Jf (x, y, z, u) = .
3x2 3y 2 −3z 2 3u2

Como queremos despejar las variables x, z en función de las otra dos, debemos aislar la parte del
jacobiano correspondiente a las derivadas respecto de x y de z, i. e.,
 
−2z −2x
Jx,z f (x, y, z, u) = .
3x2 −3z 2
3.3. FUNCIÓN INVERSA 11

Evaluando en (1, −1, 1, 1) obtenemos la matriz


 
−2 −2
Jx,z f (1, −1, 1, 1) = ,
3 −3

que tiene determinante −12 6= 0. Entonces, el TFI nos asegura que existen: U entorno abierto de
(−1, 1), V entorno abierto de (1, 1) de forma que

∀(y, u) ∈ U, existe un único (x, z) ∈ V tal que f (x, y, z, u) = 0.

Queda ası́ definida una función


h = (h1 , h2 ) : U −→ V
(de clase C (∞ en este caso) tal que a cada (y, u) le aplica ese único (x, z). Es decir,

f (h1 (y, u), y, h2 (y, u), u) = 0, (y, u) ∈ U,

y además h1 (−1, 1) = 1, h2 (−1, 1) = 1. De otra forma,


 2
y + u2 − 2h1 (y, u)h2 (y, u) = 0
y 3 + u3 + h1 (y, u)3 − h2 (y, u)3 = 0.

Derivando con respecto a y obtenemos

2y − 2h1y (y, u)h2 (y, u) − 2h1 (y, u)h2y (y, u) = 0




3y 2 + 3h1 (y, u)2 h1y (y, u) − 3h2 (y, u)2 h2y (y, u) = 0.

Particularizando en y = −1, z = 1,

−2 − 2h1y (−1, 1) − 2h2y (−1, 1) = 0




3 + 3h1y (−1, 1) − 3h2y (−1, 1) = 0.

Sistema que se resuelve fácilmente resultando

h1y (−1, 1) = −1, h2y (−1, 1) = 0.

Derivando, el sistema respecto de u, obtendrı́amos h1u (−1, 1) y h2u (−1, 1) (ejercicio).


Volviendo a derivar, irı́amos obteniendo las parciales sucesivas de h1 y h2 en el punto (−1, 1).

3.3. Teorema de la función inversa. Difeomorfismos o cambios de


variable
Sea f una función de n variables con valores en Rn . El hecho de buscar una función inversa de
f tiene mucho que ver con sacar una función implı́cita por la siguiente razón: el problema de la
función inversa es saber si en la ecuación f (x) = y podemos despejar x en función de y, i. e., si
dado y, existe un único x tal que f (x) = y. Si denotamos F (x, y) = f (x) − y es claro que estamos
con un problema de funciones implı́citas para la ecuación F (x, y) = 0. No será de extrañar por
tanto que podamos probar el siguiente resultado local.
Teorema 3.3.1 (local de la función inversa). Sean Ω abierto en Rn , f : Ω −→ Rn de clase
C (p (Ω) con 1 ≤ p ≤ ∞, x0 ∈ Ω, y0 = f (x0 ) de manera que det Jf (x0 ) 6= 0. Entonces, existen dos
abiertos U y V de Rn , con
x0 ∈ U ⊆ Ω, y0 ∈ V ⊆ f (Ω),
tales que f U : U −→ V es biyectiva y la función inversa g = (f U
)−1 : V −→ U es de clase C (p .
Además, para cada y ∈ V
Jg(y) = [Jf (g(y))]−1 .
12 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Demostración. Definimos F : Ω × Rn −→ Rn por F (x, y) = f (x) − y, es decir,

F (x, y) = (f 1 (x1 , . . . , xn ) − y1 , . . . , f n (x1 , . . . , xn ) − yn ).

Es claro que F ∈ C (p (Ω × Rn ) y

∂f 1 ∂f 1
 
∂x1 (x) ... ∂xn (x) −1 0 ... 0
∂f 2 ∂f 2
∂x1 (x)... ∂xn (x) 0 −1 . . . 0 
 
JF (x, y) = 


 ... ... ... ... ... ... ... 
∂f n ∂f n
∂x1 (x) . . . ∂xn (x) 0 0 . . . −1

Por tanto, observamos claramente que

Jx F (x, y) = Jf (x), Jy F (x, y) = −I,

donde I es la matriz identidad. Por hipótesis, tenemos que F (x0 , y0 ) = 0 y det Jx F (x0 , y0 ) 6= 0. Por
tanto, por el TFI (podemos despejar las x’s en función de las y’s):
existen V0 entorno abierto de y0 , U0 entorno abierto de x0 con U0 ⊆ Ω tal que

∀y ∈ V0 , existe un único x ∈ U0 3 f (x) = y.

Entonces, los abiertos U = f −1 (V0 ) ∩ U0 y V = V0 son la solución a nuestro problema. En efecto,

f : U −→ V es biyectiva pues es claro que f (U ) ⊆ V y ∀y ∈ V, ∃|x ∈ U 3 f (x) = y.

También es claro que la función que define el TFI de V en U que a cada y le asocia el único x
tal que f (x) = y es, por definición, la función inversa de f : U −→ V . El mismo TFI asegura
que esta función es de clase C (p en V .

Si llamamos a esta función g, el T F I asegura que para cada y ∈ V ,

Jg(y) = −Jx F (g(y), y)−1 .Jy F (g(y), y) = −Jf (g(y))−1 .(−I) = Jf (g(y))−1 .

Esto concluye la demostración.

Observación. El resultado es de carácter local: puede ser det Jf (x) 6= 0 para todo x ∈ Ω sin que
f sea inyectiva (y no tendrá inversa global); ejemplo:

f : (x, y) ∈ R2 −→ f (x, y) = (ex cos y, ex sen y) ∈ R2 .

Recordemos que la situación es enteramente distinta para n = 1 y Ω un intervalo.

Definición 3.3.2. Diremos que una función f : Ω ⊆ Rn −→ f (Ω) ⊆ Rn es un difeomorfismo de


clase C (p (p ∈ N ∪ {∞}) si se verifica

1. f es biyectiva (o inyectiva; suprayectiva ya lo es al haber puesto en la derecha f (Ω)).

2. f es de clase C (p en Ω.

3. f −1 es de clase C (p en f (Ω).

Cuando no se indica explı́citamente, se supone p = 1.

En la anterior definición queda implı́cito que f (Ω) debe ser un conjunto abierto.
El TFInv local nos ayuda a evitar este punto en muchos casos:
3.3. FUNCIÓN INVERSA 13

Teorema 3.3.3 (de la aplicación abierta). Sean Ω abierto en Rn , f : Ω −→ Rn de clase C (1 (Ω),


det Jf (x) 6= 0 para cada x ∈ Ω, entonces f (Ω) es abierto de Rn . Más aún, f es abierta , es decir,
la imagen por f de un abierto ⊆ Ω es un abierto en Rn .

Demostración. Sea Ω0 ⊆ Ω un abierto. Debemos probar que f (Ω0 ) es abierto y lo haremos probando
que todo punto es interior. Sea f (x0 ) ∈ f (Ω0 ), (x0 ∈ Ω0 ). Consideramos f : Ω0 −→ Rn y aplicamos
el TFInv local en y0 = f (x0 ). Entonces, existen U ⊆ Ω0 entorno abierto de x0 , V entorno abierto
de f (x0 ) tal que f : U −→ V es biyección. En particular,

f (x0 ) ∈ V = f (U ) ⊆ f (Ω0 )

y ası́ f (x0 ) es un punto interior.

El siguiente resultado nos dice que no es necesario calcular la inversa para saber si una función
es difeomorfismo.

Teorema 3.3.4. Sea Ω abierto en Rn y f : Ω −→ f (Ω) ⊆ Rn . Entonces, f es de clase C (p ,


det Jf (x) 6= 0 para cada x ∈ Ω y f es inyectiva ⇐⇒ f es un C (p −difeomorfismo.

Demostración. Observemos, primero, que el hecho de ser de clase C (p es una propiedad local. Para
una función h : Ω ⊆ Rn −→ Rm ,

h ∈ C (p (Ω) ⇐⇒ ∀x ∈ Ω, ∃U entorno abierto de x 3 h ∈ C (p (U ).

Sólo tenemos que probar que f −1 es de clase C (p en f (Ω) (que ya sabemos que es abierto). Lo
hacemos localmente por la observación. Sea f (x0 ) ∈ f (Ω). Por el TFInv local, existen U y V
entornos abiertos, etc. y nos quedamos con la conclusión de que V es entorno abierto de f (x0 ) y la
función g : V −→ U que aparece allı́, que no es otra que f −1 |V es de clase C (p en V .
Para el recı́proco observar que como f ◦ f −1 = Id : f (Ω) −→ f (Ω) y f −1 ◦ f = Id : Ω −→ Ω,
entonces usando la regla de la cadena, para cada x ∈ Ω se tiene:

Jf (f −1 (f (x)).J(f −1 )(f (x)) = J(f ◦ f −1 )(f (x)) = J(Id)(f (x)) = I,

J(f −1 )(f (x)).Jf (x) = J(f −1 ◦ f )(x) = J(Id)(x) = I,


con lo que Jf (x) = Jf (f −1 (f (x)) es una matriz inversible y, por tanto, su determinante es distinto
de cero.

Notas.

(a) Ω abierto en Rn , f : Ω −→ Rn de clase C (1 , det Jf (x) 6= 0 para cada x ∈ Ω =⇒ f difeomor-


fismo local, es decir, en cada punto existen U y V abiertos como afirma el TFInv local (pero
puede no ser difeomorfismo: f no tiene por qué ser inyectiva).

(b) Ω abierto en Rn , f : Ω −→ Rn de clase C (1 , f inyectiva 6=⇒ f difeomorfismo (puede fallar la


condición det Jf (x) 6= 0). Por ejemplo f (x, y) = (x3 , ex−y ).

Ejemplos.
1. La función g(x, y, z) = (e2y + e2z , e2x − e2z , x − y) es un C (∞ -difeomorfismo de R3 en g(R3 ).
En efecto, es claro que g ∈ C (∞ (R3 ), y que

2e2y 2e2z
 
0
det  2e2x 0 −2e2z  = −4(e2y+2z + e2z+2x ) 6= 0,
1 −1 0
14 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

para todo (x, y, z) ∈ R3 . Sólo falta probar que g es inyectiva y aquı́ no nos ayuda la teorı́a, es un
problema algebraico y de conocimiento de las funciones elementales. Si g(x, y, z) = g(x0 , y 0 , z 0 ), es
decir, si  2y 0 0
 e + e2z = e2y + e2z
0 0
e2x − e2z = e2x − e2z
x − y = x0 − y 0

0 0 0 0 0
se tiene, sumando las dos primeras, que e2y +e2x = e2y +e2x =⇒ e2y (1+e2x−2y ) = e2y (1+e2x −2y ).
0
Ahora, teniendo en cuenta la tercera, se sigue que e2y = e2y =⇒ y = y 0 , de donde por la tercera
x = x0 y por la primera z = z 0 , con lo que queda demostrada la inyectividad. Esto demuestra que
g es un C (∞ -difeomorfismo de R3 en g(R3 ), sin necesidad de haber hallado la inversa.
El problema de hallar la inversa, muy ligado con el problema de hallar el conjunto imagen, es
otro problema algebraico en el que tampoco nos ayudará la teorı́a vista en el párrafo. Vamos a
hacerlo para nuestra función g:
Se trata de saber para qué (u, v, w) ∈ R3 existe (x, y, z) ∈ R3 tal que g(x, y, z) = (u, v, w). Es
decir, se trata de resolver el sistema (u, v, w datos y x, y, z incógnitas),
 2y
 e + e2z = u
e2x − e2z = v
x−y =w

Observamos de partida que no para todo (u, v, w) hay solución. Por ejemplo, tiene que ser u > 0 y
si sumamos las dos primeras ecuaciones, e2y + e2x = u + v se ve que también tiene que ser u + v > 0.
Ahora
1 u+v 
u + v = e2y + e2x = e2y (1 + e2x−2y ) = e2y (1 + e2w ) =⇒ y = log .
2 1 + e2w
luego, por la tercera ecuación
1 u+v 
x = w + log
2 1 + e2w
y, por la primera
u+v
e2z = u − ,
1 + e2w
u+v
que sólo puede tener solución si u − 1+e2w
> 0, que será

1 u+v 
z= log u − .
2 1 + e2w

Repasando con detalle el razonamiento anterior, se ve que hemos demostrado que g(R3 ) es el abierto
u+v
g(R3 ) = {(u, v, w) ∈ R3 : u > 0, u + v > 0, u − > 0}
1 + e2w

y que la función inversa g −1 : g(R3 ) −→ R3 viene dada por


1 u+v  1 u+v  1 u+v 
g −1 (u, v, w) = (w + log , log , log u − ).
2 1 + e2w 2 1 + e2w 2 1 + e2w

2. Sea f : R2 −→ R2 , f (x, y) = (x2 − y 2 , 2xy). Esta función no puede ser homeomorfismo de R2 en


f (R2 ) porque no es inyectiva (f (x, y) = f (−x, −y)) o porque el determinante del jacobiano
 
2x −2y
det = 4(x2 + y 2 )
2y 2x

es 0 en (0, 0).
3.3. FUNCIÓN INVERSA 15

Esto, por supuesto, no quiere decir que f no sea difeomorfismo en algunos abiertos de R2 . Sin
ir más lejos, el TFInv local nos asegura que si (x0 , y0 ) 6= (0, 0), existen U, V abiertos de R2 con U
entorno de (x0 , y0 ) tal que f : U −→ V es difeomorfismo.
Vamos a ver algo mejor: si Ω = {(x, y) : x > 0} es el semiplano de la derecha f : Ω −→ f (Ω) es
un difeomorfismo. La condición sobre el determinante del jacobiano se cumple y sólo resta probar
la inyectividad. Vamos a hacerlo de una forma distinta al ejemplo anterior. Calcularemos f (Ω) y
probaremos que ∀(u, v) ∈ f (Ω), ∃|(x, y) ∈ Ω 3 f (x, y) = (u, v).
Nos preguntamos entonces, para qué pares (u, v) existe un par (y si es único) (x, y) ∈ Ω solución
del sistema  2
 x − y 2 = u,
2xy = v,
x>0

Despejando y en la segunda y llevando el resultado a la primera, se logra la ecuación


√ √
4 2 2 2 2u ± 4u2 + 4v 2 u ± u2 + v 2
4x − 4ux − v = 0 =⇒ x = = (1)
4 2
Obsérvese en el sistema que si v = 0, entonces y = 0 y x2 = u con lo que tiene que ser u > 0. Es
decir, para los puntos del semieje {(u, 0) : u ≤ 0} no puede existir (x, y) ∈ Ω solución del sistema.
De las x solución en (1), tenemos que desechar las de signo − acompañando la raı́z porque dan
soluciones complejas. Entonces, nos quedamos con
√ s √
u + u 2 + v2 u + u2 + v 2
2
x = =⇒ x = + ,
2 2
La raı́z con signo − también es solución, pero no es x > 0. Luego, y tiene que ser
v
y= q √ .
2 2
2 u+ u2 +v

En resumen, hemos demostrado que si Ω0 es el abierto

Ω0 = R2 \ {(u, 0) : u ≤ 0},

entonces,
∀(u, v) ∈ Ω0 , ∃|(x, y) ∈ Ω 3 f (x, y) = (u, v).
Es decir, f : Ω −→ Ω0 es una biyección. Además f −1 : Ω0 −→ Ω viene dada por
s √
−1 u + u2 + v 2 v 
f (u, v) = , q √ .
2 2 2
2 u+ u2 +v

Nota. Para los familiarizados con el cuerpo de los números complejos, obsérvese que si identificamos
R2 con C por (x, y) ∼ z = x + iy, la función anterior no es otra que f (z) = z 2 .

x+y
3. Sea U = {(x, y) : 0 < x < y} y f : U −→ R2 definida por f (x, y) = ( , xy). Vamos a hallar
xy
f (U ).
La cuestión es qué pares (u, v) son tales que existe (x, y) ∈ U tal que f (x, y) = (u, v), es decir,
tales que el sistema  x+y
 xy = u,
xy = v,

0<x<y
16 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

tiene solución. De entrada, es claro que deben ser u, v > 0. Despejando y de la segunda y sustitu-
yendo el valor en la primera, llegamos a la ecuación de segundo grado

2 uv ± u2 v 2 − 4v
x − uvx + v = 0 =⇒ x =
2

Para que exista tal x real, se debe cumplir que u2 v 2 − 4v ≥ 0. Por otro lado, por Cardano, las dos
raı́ces de esta ecuación cumplen que su producto es v. Luego precisamente y es la otra raı́z,

uv ∓ u2 v 2 − 4v
y=
2

Si fuera u2 v 2 − 4v = 0, entonces x = y y no habrı́a solución al sistema en U , luego u2 v 2 − 4v > 0 y


para que la solución (x, y) cumpla x < y, debemos elegir
√ √
uv − u2 v 2 − 4v uv + u2 v 2 − 4v
x= , y= .
2 2
Por tanto, hemos demostrado que f (U ) es el abierto

f (U ) = {(u, v) ∈ R2 : u > 0, v > 0, u2 v 2 − 4v > 0}

porque si (u, v) cumple esas condiciones, existe un (x, y) ∈ Ω, tal que f (x, y) = (u, v); además es
único porque tiene que ser precisamente
√ √
uv − u2 v 2 − 4v uv + u2 v 2 − 4v
x= , y= .
2 2
Luego, también hemos probado que f : U −→ f (U ) es biyección y que
√ √
−1 uv − u2 v 2 − 4v uv + u2 v 2 − 4v 
f (u, v) = , .
2 2
f : U −→ f (U ) es difeomorfismo (no haremos el determinante) porque comprobamos directamente
que f ∈ C (∞ (U ) y f −1 ∈ C (∞ (f (U )).

Aplicación de los difeomorfismos. Cambios de variable


Una ecuación diferencial es una ecuación que involucra a una función y a sus diferentes derivadas.
Si sólo estamos en una variable se llama ecuación diferencial ordinaria (EDO) y si interviene más
de una variable se llama ecuación en derivadas parciales (EDP). El principal objetivo de la amplia
rama de la matemática que se llama Ecuaciones Diferenciales es resolver esta clase de ecuaciones.
Éste es un problema en general difı́cil que requiere de notables conocimientos (más de un curso de
la licenciatura estará dedicado especı́ficamente a ello).
Ecuaciones diferenciales son, por ejemplo,

y 0 (x) = f (x), con f una función concreta (EDO).


Se trata de encontrar las funciones y = y(x) que, en algún dominio, satisfacen la ecuación.
Esta sencilla ecuación no lo es tanto; resolverla es un problema de integración (búsqueda de
una primitiva de la función f (x)) y a esto se dedicó parte del curso Análisis I, viéndose que
no hay que poner f 0 s muy complicadas para no saber solucionar el problema con las técnicas
de integración allı́ vistas.
3.3. FUNCIÓN INVERSA 17

zxx (x, y) − zyy (x, y) = 0 (EDP).


Se trata de encontrar las funciones de dos variables z = z(x, y) que, en algún dominio de R2
satisfacen dicha ecuación. Este es un problema sencillo, pero no tanto. Podemos ver, a ojo,
que funciones como z = x + y ó z = x2 + y 2 la satisfacen, pero con nuestros conocimientos
hasta ahora, estamos lejos de dar una solución general.
En problemas como encontrar z = z(x, y) que verifiquen

zxx (x, y)2 zy (x, y)3 − zyyx (x, y) + sen(x + y) = 0,

ni siquiera atisbamos una solución particular.


Una de las técnicas más importantes para encontrar soluciónes de ED’s es la de cambio de
variable o variables. Esto fué utilizado a menudo en la búsqueda de primitivas y ahora vamos a
mostrar en qué consiste para varias variables. Daremos las explicaciones en R2 y para más variables
será clara la extensión. En lo que sigue no nos preocuparemos de dominios poniendo siempre R2 .

Cambio de variables directo


Fijamos ideas con un ejemplo sencillo; retomemos la EDP

zxx (x, y) − zyy (x, y) = 0.

Buscamos z : R2 −→ R, (z = z(x, y) esquemáticamente) que verifiquen la ecuación. Componemos z


con un C (∞ -difeomorfismo φ de R2 en R2 , φ(s, t) = (x, y) y esquemáticamente x = x(s, t), y = y(s, t)
(es decir, a las componentes de φ las llamamos x e y. Ası́ tenemos una función,

ze(s, t) = z(φ(s, t)) = z(x(s, t), y(s, t)). 

Las distintas derivadas parciales de z y ze están relacionadas por la regla de la cadena (obviamos
los puntos donde se aplican).


 zes = zx xs + zy ys



 zet = zx xt + zy yt
zess = (zxx xs + zxy ys )xs + zx xss + (zyx xs + zyy ys )ys + zy yss

EC

 zest = (zxx xt + zxy yt )xs + zx xst + (zyx xt + zyy yt )ys + zy yst
ze = (zxx xt + zxy yt )xt + zx xtt + (zyx xt + zyy yt )yt + zy ytt

 tt



...
A las igualdades EC las denominaremos ecuaciones del cambio. Si φ es un difeomorfismo con-
creto, elegido hábilmente, la primitiva EDP en términos de z se podrá transformar en otra más
sencilla en términos de ze. Es objeto de la teorı́a de ecuaciones diferenciales saber qué φ hay que
elegir según el tipo de EDP que tengamos. En nuestro caso, vamos a elegir φ(s, t) = ( s+t s−t
2 , 2 ). Es
decir, nuestro cambio de variables va a ser
s+t s−t
x= , y= .
2 2
Para este cambio particular tendremos
zes = 12 zx + 21 zy


zest = 21 ( 12 zxx − 12 zxy ) + 12 ( 21 zyx − 12 zyy ) = 14 (zxx − zxy )


No necesitamos hacer más derivadas. Ya vemos que nuestra ecuación zxx − zyy = 0 se transforma
en zest = 0. Y ésta es más fácil de resolver. Por ejemplo, vemos que cualquier función de la forma

ze(s, t) = f (s) + g(t)


18 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

(donde f y g son funciones de una variable de clase C (2 ) la satisface. Ahora sólo falta deshacer el
cambio (porque z = ze ◦ φ−1 ), es decir, calcular φ−1 que en nuestro caso es muy sencillo,

s = x + y, t = x − y.

Entonces, podemos asegurar que

z = f (x + y) + g(x − y)

es solución de la ecuación zxx − zyy = 0.


Normalmente a la función ze se le designa con la misma letra z (lo que, por sorprendente que
resulte, no ha creado la menor confusión en numerosas generaciones de matemáticos) y se suele
decir que:

1. Tenemos que buscar funciones z = z(x, y) que satisfacen una EDP

2. Hacemos el cambio de variables 


x = x(s, t)
CV
y = y(s, t)
y transformamos la EDP en términos de funciones z = z(s, t) y, si se puede, la resolvemos.

3. Deshacemos el cambio resolviendo el sistema CV,



s = s(x, y)
t = t(x, y)

En este curso, sólo vamos a adquirir práctica en transformar ecuaciones (si luego las podemos
resolver, mejor), sin preocuparnos de dominios y dónde son difeomorfismos los cambios de variable.
El TFInv local nos asegura muchos difeomorfismos, al menos localmente.
Para obtener las ecuaciones del cambio, resulta muy fácil simbolizar  mediante un esquema.
Cuando escribamos para dos letras a −→ b simplemente querremos decir que a depende de b. Todas
las dependencias de letras (flechas) que tenemos en  son

s
*

x x - t s

*
 *


z
H z
H
H
H
j H
j
H
y yH - s t
H
j
H
t
Ahora, obsérvese que de únicamente una letra (la z) sólo salen flechas y de únicamente dos
letras (la s y la t) sólo llegan flechas. Juntamos estas flechas poniendo la z en el centro y a ambos
lados la s y la t de las dos formas que se puede llegar a ellas. Obtenemos el siguiente esquema
(árbol):

s
*

s x - t
H
Y
HH  *

 zH


 Hj
H
t yH - s
Hj
H
t
En este esquema se deriva hacia ambos lados siguiendo la regla de la cadena y se obtienen las
ecuaciones del cambio EC. Aquı́ puede parecer excesivo realizar tal operación, pero a medida que
compliquemos las cosas, el árbol resultará muy útil y cómodo.
3.3. FUNCIÓN INVERSA 19

Cambio de variables inverso


Para determinadas EDP’s es posible que sea conveniente hacer un cambio inverso. Es decir, dar
las variables nuevas (s, t) en función de las antiguas (x, y),

s = s(x, y)
t = t(x, y)

En principio, lo que tendriamos que hacer es hallar la inversa de este difeomorfismo, i. e., despejar
(x, y) en función de (s, t), 
x = x(s, t)
y = y(s, t)
y proceder como en el caso anterior teniendo

z(s, t) = z(x(s, t), y(s, t)).

Pero componiendo a ambos lados con el cambio de partida, esto es lo mismo que tener

z(s(x, y), t(x, y)) = z(x, y).

Entonces, las ecuaciones del cambio son (consideremos sólo las derivadas primeras):

zx = zs sx + zt tx
EC0
zy = zs sy + zt ty

A esto se llega también con el correspondiente árbol; ahora las flechas que tenemos son

x
*


x s-y s

* *


z
H z
H
HH
j H
j
H
y tH-x t
H
j
H
y
De z sólo salen flechas, y sólo llegan a x e y. Ponemos z en el centro y a ambos lados terminamos
con x y y, quedando el árbol

x
*


y s-y
H
Y
HH  *

 zH


 Hj
H
x tH-x
Hj
H
y
Derivando a ambos lados se obtiene con facilidad EC0 .
Ejemplo. Transformemos zxx + zyy = 0 con el cambio

s = x2 − y 2


t = 2xy

Observando el árbol o las ecuaciones EC0 llegamos a



zx = zs 2x + zt 2y
zy = −zs 2y + zt 2x

Y volviendo a derivar siguiendo el árbol,



zxx = (zss 2x + zst 2y)2x + 2zs + (zts 2x + ztt 2y)2y
zyy = −(−zss 2y + zst 2x)2y − 2zs + (−zts 2y + ztt 2x)2x
20 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Luego la ecuación se convierte en

4(x2 + y 2 )(zss + ztt ) = 0

Deberı́amos deshacer el cambio, pues en nuestra nueva ecuación sólo pueden aparecer las letras
z, s, t, pero como está igualada a cero, tendremos

zss + ztt = 0.

Es decir, la ecuación se convierte en ella misma. A la hora de su resolución no habrı́amos avanzado


nada con este cambio.

Cambio de variables y de función


Si tenemos una expresión
z = z(x, y)
y transformamos mediante un difeomorfismo de R3 en R3 las coordenadas (x, y, z) en otras (u, v, w),

x = x(u, v, w)

y = y(u, v, w)

z = z(u, v, w)

y llevamos este cambio a la expresión anterior, tendremos:

z(u, v, w) = z(x(u, v, w), y(u, v, w)),

lo cual es una ecuación en la que intervienen tres variables (u, v, w). El TFI permitirá en muchos
casos despejar una de ellas en función de las otras dos. Por ejemplo, w = w(u, v) que cumplirá

z(u, v, w(u, v)) = z(x(u, v, w(u, v)), y(u, v, w(u, v))) ♦

Nos preguntamos por la relación entre las derivadas antiguas zx , zy , zxx , . . . con las derivadas nuevas
wu , wv , wuu , . . . . Si derivamos en ♦ con respecto a u y v obtenemos
(
zu + zw wu = zx (xu + xw wu ) + zy (yu + yw wu )
EC00
zv + zw wv = zx (xv + xw wv ) + zy (yv + yw wv ).

Esto son dos ecuaciones que permiten obtener (wu , wv ) en términos de (zx , zy ) a través de los
datos del cambio xu , xv , xw , yu , yv , yw , zu , zv , zw . Si queremos obtener relaciones para las derivadas
segundas, volverı́amos a derivar.
Aquı́, también sirve el esquema de árbol. Las flechas que tenemos son
u
*

xH v
 -
Hj
H
w
x u u
*
 *
 *


zH yH v
 - wH
Hj
H Hj
H H
j
H
y w v
u
*

z
H v -
Hj
H
w
De z sólo salen flechas y a u y v sólo llegan. Juntamos todas ellas, situando z en el centro y a
ambos lados terminamos con u y v (ésta es una forma de esquematizar la relación ♦):
3.3. FUNCIÓN INVERSA 21

u
*

x
H-v  u
*
u w H j 
H
v -
Y
HH
u v  zH
 H u
Y
H 
 Hj 
H *

v  H w yH v
- u
j 
H
H *

w -v
Y sobre este esquema derivamos a ambos lados con respecto a u y v siguiendo la regla de la
cadena, obteniendo las ecuaciones del cambio EC00 .
Si tuviéramos que hacer un cambio

u = u(x, y, z)

v = v(x, y, z)

w = w(x, y, z),

(es decir, inverso del anterior), para obtener las ecuaciones del cambio sigue sirviendo el esquema
de árbol. En este caso, nuestras flechas son
x
*

uH y
 -
Hj
H
z
x x u

* *
 *


zH
 vH y
 - wH
HH
j Hj
H H
j
H
y z v
x
*

w
HH y-
j
H
z
Aquı́ w es la letra de la que sólo salen flechas, x e y a las que sólo llegan y obtenemos el árbol
x
*


uHH y 
- x
j 
H *
x  z - y
Y
H
H
x y  wH
 H x
Y
H
H 

 Hj 
H *

y  H z vH y- x
H
j 
H *

z -y
Derivando a ambos lados con respecto a x e y por la regla de la cadena, obtenemos las ecuaciones
del cambio (escribimos sólo las primeras derivadas parciales):
(
wx + wz zx = wu (ux + uz zx ) + wv (vx + vz zx )
wy + wz zy = wu (uy + uz zy ) + wv (vy + vz zy )

donde los datos son ux , uy , uz , vx , vy , vz , wx , wy , wz .

Ejemplos.
1 Encontrar soluciones de la ecuación

yzx − xzy = (y − x)z

utilizando el cambio de variables y de función



2 2
u = x + y

v = (1/x) + (1/y)

w = log z − (x + y) ,

22 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

en términos de w = w(u, v).


El esquema de árbol es en este caso:
x
*

u - y
x 
Y
H
HH
x y  wH x
Y
HHH 
 Hj 
H *

y z v - y

Nótese cómo se ha simplificado el árbol al no depender u y v de z. Derivando respecto de x e


y a ambos lados, obtenemos (
wx + wz zx = wu ux + wv vx
wy + wz zy = wu uy + wv vy
Sustituyendo los datos queda (
−1 + zx
z = wu 2x + wv −1
x2
zy −1
−1 + z = wu 2y + wv y2

de donde es sencillo llegar a


x y
yzx − xzy − (y − x)z = wv z − =0
y 2 x2

Como está igualada a 0 no nos preocupamos de despejar x, y, z en función de u, v, w que es lo que


en rigor deberı́amos hacer y nos queda simplemente

wv = 0.

Una solución a esta sencilla ecuación es w = φ(u) con φ cualquier función de una variable que sea
derivable. Deshaciendo el cambio

log z − (x + y) = φ(x2 + y 2 ),

y despejando la z,
z = exp(x + y + φ(x2 + y 2 ))
serán soluciones de nuestra EDP primera (compruébese).

2. Transformar la ecuación diferencial

zy2 zxx − 2zx zy zxy + zx2 zyy = 0

en términos de x = x(y, z).


Esto quiere decir que de la ecuación z = z(x, y) podemos despejar implı́citamente x = x(y, z).
Para evitar lı́os con las letras es mejor introducir letras nuevas auxiliares y encajar este problema en
el marco de cambios de variable y de función. Es decir, pensemos que estamos haciendo el cambio
particularmente sencillo

u = u(x, y, z) = y

v = v(x, y, z) = z

w = w(x, y, z) = x.

Ası́, transformar en términos de w = w(u, v) es lo mismo que x = x(y, z). Pongamos el árbol para
este cambio (muchas flechas no aparecerán):
3.3. FUNCIÓN INVERSA 23

u -y
x 
H
Y
HH
wH
H
j
H
vH x
H
j 
H *

z -y
Derivando a ambos lados con respecto a x e y, obtenemos simplemente:
(
wx = wv vz zx
0 = wu uy + wv vz zy ,
es decir, (
1 = wv zx
0 = wu + wv zy .
Volviendo a derivar a ambos lados la primera respecto de x, la primera respecto de y y la segunda
respecto de y, tenemos:

2
0 = wvv zx + wv zxx

0 = (wvu + wvv zy )zx + wv zxy

0 = (wuu + wuv zy ) + (wvu + wvv zy )zy + wv zyy .

De estas cinco ecuaciones obtenemos





zx = w1v
 wu
zy = − wv



zxx = − wwvv
3
v
wv wuv −wu wvv

zxy = −



 wv3
z = − wuu wv2 −2wu wv wuv +wu2 wvv .


yy w3 v

Sustituyendo en la EDP y simplificando, queda simplemente


wuu xyy
=0 equivalentemente = 0.
wv xz

Encontremos ahora una solución no trivial de la EDP. Por ejemplo, w = uev verifica wuu = 0.
Es decir, x = yez verifica la ecuación cambiada. Despejando z, z = log(x/y) verifica la EDP del
principio.

3. Encontrar soluciones de la ecuación diferencial ordinaria


x+y
y0 =
x−y

utilizando el cambio de variable y de función



x = ρ cos t
y = ρ sen t,

en términos de ρ = ρ(t).
Es como antes, sólo que más simplificado al tener una sola variable. Las flechas que tenemos
aquı́ son
24 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

ρ
*

x - t
y -x ρ -t
yH - ρ
H
j
H
t
Ponemos la y en el centro y a ambos lados acabamos en la t, llegando al árbol

t ρ ρ -t
H
Y
H *

Hy - xH



 Hj
H
t t

Derivando respecto de t hacia ambos lados, obtenemos la ecuación

yρ ρt + yt = yx (xρ ρt + xt ),

que nos proporciona la relación entre yx (y 0 ) con ρt (ρ0 ). Sustituyendo los datos del cambio

sen t ρt + ρ cos t = yx (cos t ρt − ρ sen t).

Despejando la yx y llevando los datos a la EDO, tendremos


sen t ρt + ρ cos t ρ cos t + ρ sen t
= .
cos t ρt − ρ sen t ρ cos t − ρ sen t

Operando y simplicando queda, sin más, ρt = ρ. Una solución de esta ecuación es ρ = et . Desha-
ciendo el cambio,  p
ρ = x2 + y 2
t = arc tg(y/x).
Entonces de la igualdad p
x2 + y 2 = earc tg(y/x)
saldrá implı́citamente y = y(x) que satisfará la EDO primitiva (comprobarlo).

3.4. Variedades diferenciables en Rn


En este párrafo vamos a ver que los subconjuntos de Rn que son los ceros de funciones buenas,
aunque sean conjuntos cerrados con interior vacı́o, tienen propiedades que nos permitirán tratar
sobre ellos problemas de máximos y mı́nimos locales.
En lo que sigue siempre será m < n y denotaremos k = n − m. Recuérdese también que si M
es un subconjunto de Rn , los abiertos relativos a M (es decir, los abiertos en la topologı́a de Rn
restringida a M ) son los conjuntos de la forma

G = M ∩ Ω, con Ω abierto de Rn .

Definición 3.4.1. Sea F : Ω ⊆ Rn −→ Rm y sea M = {x ∈ Ω : F (x) = 0}. Si se verifica

1. M 6= ∅,

2. F ∈ C (p (Ω), (p ≥ 1),

3. rango JF (x) = m, (es decir, máximo), ∀x ∈ M ,


3.4. VARIEDADES DIFERENCIABLES EN RN 25

entonces diremos que M es una variedad implı́cita diferenciable k-dimensional de Rn de clase C (p


(abreviadamente, variedad k-dimensional de clase C (p ).
Recordemos que si una matriz m × n, como es el caso de la matriz jacobiana, tiene rango m
(máximo), entonces existe un menor m × m con determinante distinto de 0. Es decir, podemos
seleccionar m columnas (que equivalen a m coordenadas) de forma que la matriz resultante tiene
determinante distinto de 0. Entonces, el TFI nos permitirá poner estas coordenadas en función de
las k restantes. En esto consiste el siguiente teorema que justifica el nombre de k-dimensional.
Teorema 3.4.2. Sea M = {x ∈ Ω : F (x) = 0} una variedad k-dimensional de clase C (p , y sea
x0 ∈ M . Entonces, existe U0 abierto en Rk y una función ϕ0 : U0 −→ Rn con x0 ∈ ϕ0 (U0 )
cumpliendo
1. ϕ0 ∈ C (p (U0 )
2. rango Jϕ0 (u) = k, (es decir, máximo), ∀u ∈ U0
3. ϕ0 : U0 −→ ϕ0 (U0 ) ⊆ M es biyectiva y ϕ0 (U0 ) es un abierto relativo de M (es más, ϕ0
transforma abiertos de Rk contenidos en U0 en abiertos relativos a M , con lo que ϕ0 resulta
ser un homeomorfismo) .
Demostración. Como rango JF (x0 ) = m, podemos seleccionar un menor m × m con determinante
distinto de 0. Supongamos, por simplificar las notaciones que este menor es el de las últimas m
coordenadas. Utilizamos la notación x = (x0 , x00 ), x0 = (x00 , x000 ), donde x0 son las primeras k
coordenadas y x00 las m últimas. El TFI asegura entonces que existen U0 entorno abierto en Rk de
x00 , V0 entorno abierto en Rm de x000 , con U0 × V0 ⊆ Ω, tal que
∀x0 ∈ U0 , existe un único x00 ∈ V0 3 F (x0 , x00 ) = 0.
Llamemos g : U0 −→ V0 a la aplicación tal que g(x0 ) = x00 con F (x0 , g(x0 )) = 0; a las m componentes
de g, para mayor la claridad las denotamos g = (g k+1 , . . . , g n ). Definimos la aplicación
ϕ0 : U0 −→ U0 × V0 3 ϕ0 (x0 ) = (x0 , g(x0 )).
Entonces, U0 y ϕ0 son la solución que buscamos. En efecto,
ϕ0 : U0 −→ M , pues (x0 , g(x0 )) ∈ M ya que F (x0 , g(x0 )) = 0.
ϕ0 es inyectiva, pues (x0 , g(x0 )) = (y 0 , g(y 0 )) =⇒ x0 = y 0 .
ϕ0 ∈ C (p (U0 ) aplicando el TFI.
rango Jϕ0 (u) = k puesto que el menor k × k formado por las k primeras filas es la matriz
identidad.
ϕ0 (U0 ) es un abierto relativo de M porque se verifica la igualdad
ϕ0 (U0 ) = M ∩ (U0 × V0 ),
y el producto de abiertos U0 ×V0 es un abierto de Rn . Veamos la igualdad por doble contenido.
El contenido hacia la derecha es claro y, para el otro, si x = (x0 , x00 ) ∈ M ∩ (U0 × V0 ), entonces
F (x0 , x00 ) = 0, x0 ∈ U0 y x00 ∈ V0 .
Entonces, por la unicidad que da el TFI, debe ser x00 = g(x0 ), y ası́ x = (x0 , x00 ) = (x0 , g(x0 )) =
ϕ0 (x0 ) ∈ ϕ0 (U0 ).
Si en vez de U0 tomamos U abierto contenido en U0 , se prueba igualmente que
ϕ0 (U ) = M ∩ (U × V0 ),
con lo que ϕ0 (U ) es abierto relativo a M
26 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Con lo cual, queda demostrado el teorema.

Nota. Hemos demostrado que si M es variedad k dimensional de Rn y x0 ∈ M , en un entorno


abierto de x0 relativo a M , sus puntos se pueden poner (parametrizar) en términos de k coordenadas
solamente,

ϕ0 : U0 −→ ϕ0 (U0 ) ⊆ M
(x1 , . . . , xk ) 7→ (x1 , . . . , xk , g k+1 (x1 , . . . , xk ), . . . , g n (x1 , . . . , xk ))

Obsérvese que no tienen por qué ser, precisamente, las k primeras. (U0 , ϕ0 ) se llama carta explı́cita
en torno a x0 .
Al cambiar de punto, en general, existirá otra carta explı́cita en la que pueden ser otras k
coordenadas. Puede ocurrir que una misma carta sirva para muchos puntos de la variedad, de
hecho, la misma carta (U0 , ϕ0 ) sirve para todos los puntos del abierto relativo a M , ϕ0 (U0 ).

Ejemplos.

1 La circunferencia C = {(x, y) ∈ R2 : x2 + y 2 = 1} es una variedad 1-dimensional de R2 de clase


C (∞ . En efecto viene dada por la ecuación

F (x, y) := x2 + y 2 − 1 = 0,

y rango JF (x, y) = 1, ∀(x, y) ∈ C, porque JF (x, y) = (2x, 2y) tiene rango 1 salvo para el punto
(0, 0) que no está en C.
Lo que hemos demostrado en el teorema, para este caso particular es que ∀(x0 , y0 ) ∈ C, en un
entorno, podemos despejar una coordenada en términos de la otra. En efecto, si (x0 , y0 ) es tal que
−1 < x0 < 1 e y0 > 0, entonces existe U0 = (x0 − δ, x0 + δ) y
p
ϕ0 : U0 −→ ϕ0 (U0 ) ⊂ C 3 ϕ0 (x) = (x, 1 − x2 ),

cumpliendo las aserciones del teorema. Si el punto es tal que −1 < x0 < 1 e y0 < 0, lo mismo
poniendo un - en la raı́z. Y si es el punto (1, 0) (ó (−1, 0)) no se puede despejar la y, pero podemos
parametrizar un trozo abierto de C en términos de y. Efectivamente, existe U0 = (−δ, δ) y
p
ϕ0 : U0 −→ ϕ0 (U0 ) ⊂ C 3 ϕ0 (y) = ( 1 − y 2 , y),

(o con - la raı́z si se trata del punto (−1, 0)).


Cualquier subconjunto abierto relativo a C no vacı́o también es variedad. En efecto, un conjunto
de estos es de la forma M = C ∩ Ω, con Ω ⊆ R2 y es claro que

M = {(x, y) ∈ Ω : F (x, y) := x2 + y 2 − 1 = 0}.

2. La esfera (n − 1)-dimensional,

S n−1 = {(x1 , x2 , . . . , xn ) ∈ Rn : x21 + x22 + · · · + x2n = 1}

es una variedad (n − 1)-dimensional de Rn de clase C (∞ . En efecto, basta comprobar que la función

F (x1 , x2 , . . . , xn ) = x21 + x22 + · · · + x2n − 1

satisface las hipótesis requeridas.

3. El conjunto
M = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1, x + y + z = 0}
3.4. VARIEDADES DIFERENCIABLES EN RN 27
√ √
es una variedad 1-dimensional de R3 de clase C (∞ . En efecto, M 6= ∅ ((1/ 2, −1/ 2, 0) ∈ M ).
Viene dado por la función de R3 en R2 ,

F (x, y, z) = (x2 + y 2 + z 2 − 1, x + y + z).

Su matriz jacobiana es  
2x 2y 2z
JF (x, y, z) = ,
1 1 1
que tiene rango 2 salvo cuando x = y = z, pero ningún punto de éstos puede estar en M .

Ejercicio. Si f : Ω ⊆ Rn −→ R es una función de clase C (p en Ω, probar que el grafo de f ,

G = {(x, z) ∈ Rn+1 : z = f (x)}

es una variedad n-dimensional de clase C (p en Rn+1 .

Espacio tangente a una variedad en un punto


Lo vamos a definir de una forma intuitiva como el conjunto de vectores de Rn que son vectores
tangentes a curvas en la variedad que pasan por el punto (hágase un dibujo con una variedad
2-dimensional de R3 , por ejemplo).

Definición 3.4.3. Sea M ⊂ Rn variedad k-dimensional de clase C (1 y x0 ∈ M . Llamaremos


espacio tangente a M en x0 al conjunto

TM (x0 ) = {h ∈ Rn : ∃γ : (−ε, ε) −→ M ∈ C (1 3 γ(0) = x0 , γ 0 (0) = h}

Notemos que una curva siempre tiene una parametrización equivalente en cualquier intervalo;
lo más cómodo es parametrizarla en un (−ε, ε) y que el punto x0 se corresponda con t = 0.
Queremos probar que TM (x0 ) es un subespacio vectorial de Rn de dimensión k. Directamente,
parece tarea difı́cil (¿cómo se probarı́a que la suma de elementos de este conjunto está en el con-
junto?) y vamos a dar un rodeo conectando con la función F que define la variedad y la función ϕ
de la carta explı́cita que existe en torno a x0 .
La situación es la siguiente: M = {x ∈ Ω : F (x) = 0} donde F : Ω ⊆ Rn −→ Rn−k es una función
tal que rango JF (x0 ) = n−k. Por otro lado, sabemos que existe una carta explı́cita en torno a x0 que
llamaremos (U, ϕ) cumpliendo el teorema anterior. En particular, ϕ : U ⊆ Rk −→ ϕ(U ) ⊆ M ⊆ Rn
es biyectiva y si llamamos u0 al único punto en U tal que ϕ(u0 ) = x0 , se tiene que rango Jϕ(u0 ) = k.
Recordemos de Álgebra los dos hechos siguientes:

El que rango Jϕ(u0 ) = k, se traduce en que la diferencial

dϕ(u0 ) : Rk −→ Rn

es una aplicación lineal inyectiva y que el subespacio imagen Im(dϕ(u0 )) es un subespacio


de Rn de dimensión k.

El que rango JF (x0 ) = n − k, se traduce en que la diferencial

dF (x0 ) : Rn −→ Rn−k

es una aplicación lineal suprayectiva, por tanto, por el teorema de la dimensión, Ker(dF (x0 ))
es un subespacio de Rn de dimensión k.

Con este preámbulo y con las mismas notaciones, podemos probar:


28 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Proposición 3.4.4.
TM (x0 ) = Im(dϕ(u0 )) = Ker(dF (x0 )),
y como consecuencia TM (x0 ) es un subespacio de Rn de dimensión k.

Demostración. Como ya sabemos que Im(dϕ(u0 )) y Ker(dF (x0 )) son subespacios de dimensión k,
bastará que probemos sólo los dos contenidos

Im(dϕ(u0 )) ⊆ TM (x0 ) ⊆ Ker(dF (x0 )).

Para el primero, sea h ∈ Im(dϕ(u0 )). Si h = 0 podemos comprobar directamente por la definición
que h ∈ TM (x0 ) (tómese una curva constante γ(t) = x0 ). Si h 6= 0 entonces h = dϕ(u0 )(l) con
l ∈ Rk \ {0}. Como u0 ∈ U y U es abierto en Rk , podemos tomar una bola B(u0 ; δ) ⊆ U y entonces
la curva
δ δ
γ(t) = ϕ(u0 + tl), t ∈ (− , ),
klk klk
tiene su soporte en M (porque u0 +tl ∈ B(u0 ; δ) ⊆ U y ϕ(U ) ⊆ M ); es de clase C (1 por composición
y la regla de la cadena nos da (comprobarlo)

γ 0 (0) = dϕ(u0 )(l) = h.

Esto prueba que h ∈ TM (x0 ).


Para el segundo contenido, sea h ∈ TM (x0 ); entonces sabemos que

∃γ : (−ε, ε) −→ M ∈ C (1 3 γ(0) = x0 , γ 0 (0) = h.

En particular
F (γ(t)) = 0, t ∈ (−ε, ε)
y por la regla de la cadena,

JF (γ(t)) · γ 0 (t) = 0 =⇒ JF (x0 ) · h = 0,

es decir, dF (x0 )(h) = 0, luego h ∈ Ker(dF (x0 )).

En lo que sigue jugará un papel importante el espacio ortogonal a TM (x0 ); le daremos un


nombre.

Definición 3.4.5. Sea M ⊂ Rn variedad k-dimensional de clase C (1 y x0 ∈ M . Llamaremos


espacio normal a M en x0 al conjunto

NM (x0 ) = (TM (x0 ))⊥ = {l ∈ Rn :< l, h >= 0, ∀h ∈ TM (x0 )}

que es un subespacio vectorial de Rn de dimensión n − k.

Nota. Como el rango de JF (x0 ) es máximo, sus n − k filas, que están formadas por los vectores
(∇F 1 (x0 ), ∇F 2 (x0 ), . . . , ∇F n−k (x0 )), constituyen un sistema linealmente independiente. Por otro
lado, si h ∈ TM (x0 ),

JF (x0 ) · h = 0 =⇒< ∇F i (x0 ), h >= 0, i = 1, 2, . . . , n − k

Es decir, ∇F i (x0 ) ∈ NM (x0 ), i = 1, 2, . . . , n − k y como NM (x0 ) es de dimensión n − k tenemos


como consecuencia que:

(∇F 1 (x0 ), ∇F 2 (x0 ), . . . , ∇F n−k (x0 )) es una base de NM (x0 ).


3.4. VARIEDADES DIFERENCIABLES EN RN 29

Definición 3.4.6. Los subespacios afines trasladados a x0 ,

x0 + TM (x0 ), x0 + NM (x0 )

se llaman variedad tangente y variedad normal a M en x0 .

Ejemplos.
1. Para la circunferencia C = {(x, y) ∈ R2 : F (x, y) := x2 + y 2 − 1 = 0} y un punto (x0 , y0 ) ∈ C,
se tiene
JF (x0 ) = ∇F (x0 ) = (2x0 , 2y0 ),
de donde se deduce que TC (x0 , y0 ) es la recta (subespacio de dimensión 1):

TC (x0 , y0 ) = {(h, k) ∈ R2 :< (2x0 , 2y0 ), (h, k) >= 0} = {(h, k) : x0 h + y0 k = 0}.

El vector (2x0 , 2y0 ) es una base para el espacio normal. Entonces, NC (x0 , y0 ) es la recta

NC (x0 , y0 ) = {(tx0 , ty0 ) : t ∈ R}.

2. Para la esfera (variedad n − 1 dimensional de Rn ),

S = {x ∈ Rn : F (x) := x21 + . . . x2n − 1 = 0}

y un punto a = (a1 , . . . , an ) ∈ S se tiene

JF (a) = ∇F (a) = (2a1 , . . . , 2an ).

Por tanto, TS (a) es el hiperplano (subespacio n − 1 dimensional),

TS (a) = {(x1 , . . . , xn ) ∈ Rn : a1 x1 + · · · + an xn = 0}

y el espacio normal es la recta (subespacio de dimensión 1),

NS (a) = {(ta1 , . . . , tan ) : t ∈ R}.

3. Para el caso de una variedad 1 dimensional en R3 como, por ejemplo

M = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1, x + y + z = 0}

y un punto (x0 , y0 , z0 ) ∈ M se tendrá

∇F 1 (x0 , y0 , z0 ) = (2x0 , 2y0 , 2z0 ), ∇F 2 (x0 , y0 , z0 )) = (1, 1, 1).

Entonces, TM (x0 , y0 , z0 ) es la recta (subespacio 1 dimensional)

TM (x0 , y0 , z0 ) = {(h, k, l) ∈ R3 : x0 h + y0 k + z0 l = 0; h + k + l = 0}

(intersección de dos planos) y el espacio normal es el plano

NM (x0 , y0 , z0 ) = {λ(2x0 , 2y0 , 2z0 ) + µ(1, 1, 1) : λ, µ ∈ R}.

Ejercicio. Si f : Ω ⊆ Rn −→ R es una función de clase C (p en Ω, probar que para la variedad n


dimensional de Rn+1 ,
G = {(x, z) ∈ Rn+1 : z = f (x)},
la variedad tangente a G coincide con el hiperplano tangente de f .
30 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

3.5. Extremos sobre variedades. Multiplicadores de Lagrange


Definición 3.5.1. Extremos condicionados. Sea M una variedad en Rn y f : D ⊆ Rn → R
una función cuyo dominio D contiene a M . Dado un punto x0 ∈ M ,

(1) diremos que x0 es un máximo relativo de f condicionado a M (o que f restringida a


M tiene un máximo local en x0 ) si para algún δ > 0 es f (x) ≤ f (x0 ) siempre que x ∈ M
y kx − x0 k < δ;

(2) diremos que x0 es un mı́nimo relativo de f condicionado a M (o que f restringida a


M tiene un mı́nimo local en x0 ) si para algún δ > 0 es f (x) ≥ f (x0 ) siempre que x ∈ M y
kx − x0 k < δ;

(3) diremos que x0 es un máximo relativo estricto de f condicionado a M (o que f res-


tringida a M tiene un máximo local estricto en x0 ) si para algún δ > 0 es f (x) < f (x0 )
siempre que x ∈ M y 0 < kx − x0 k < δ;

(4) diremos que x0 es un mı́nimo relativo estricto de f condicionado a M (o que f res-


tringida a M tiene un mı́nimo local estricto en x0 ) si para algún δ > 0 es f (x) > f (x0 )
siempre que x ∈ M y 0 < kx − x0 k < δ;
Si se da una cualquiera de las situaciones anteriores, diremos que f tiene en x0 un extremo
local (relativo) condicionado a M .

De manera similar se definen los extremos absolutos de f condicionados a M .

Es obvio que todo extremo absoluto condicionado de f es extremo local condicionado de la


misma clase, pero el recı́proco en general no es cierto.
El término condicionado proviene de que lo que queremos es estudiar máximos y mı́nimos de la
expresión f (x) sujetos a la condición x ∈ M .

Proposición 3.5.2. Sea Ω un abierto de Rn , M una variedad de clase C (p (p ≥ 1) y dimensión


k contenida en Ω, x0 un punto de M , f : Ω → R diferenciable en x0 . Si x0 es un extremo relativo
de f condicionado a M , entonces para cada h ∈ TM (x0 ) es df (x0 )(h) = 0; equivalentemente,
∇f (x0 ) ∈ NM (x0 ).

Demostración. Sea (U, ϕ) una carta explı́cita de M en torno a x0 y sea u0 = ϕ−1 (x0 ). Suponiendo,
por ejemplo, que x0 es un máximo relativo de f condicionado a M , la función g = f ◦ ϕ : u ∈ U →
g(u) = f (ϕ(u)) ∈ R tiene un máximo relativo (sin condicionar) en u0 ; porque si para un δ > 0 es
f (x) ≤ f (x0 ) siempre que x ∈ M y kx − x0 k < δ, como la continuidad de ϕ en u0 garantiza la
existencia de un r > 0 tal que para todo u ∈ U con ku − u0 k < r es kϕ(u) − ϕ(u0 )k < δ, y como
además ϕ(u) estará en M , se sigue que para todo u ∈ U con ku − u0 k < r es

g(u) = f (ϕ(u)) ≤ f (ϕ(u0 )) = g(u0 ).

Pero g es diferenciable en u0 , luego su diferencial en u0 es nula; por tanto, 0 = dg(u0 ) =


df (x0 ) ◦ dϕ(u0 ) y para cada ` ∈ Rk se tendrá [df (x0 ) ◦ dϕ(u0 )](`) = 0, es decir,

df (x0 )(dϕ(u0 )(`)) = 0. (†)

Ya vimos que TM (x0 ) = Im dϕ(u0 ); esto significa que los vectores h ∈ TM (x0 ) son exactamente
los de la forma h = dϕ(u0 )(`) para algún ` ∈ Rk , luego la relación (†) nos dice que para cada
h ∈ TM (x0 ) es df (x0 )(h) = 0 o equivalentemente h∇f (x0 ), hi = 0.
3.5. EXTREMOS SOBRE VARIEDADES 31

Definición 3.5.3. Punto crı́tico condicionado . Sea Ω un abierto de Rn , M una variedad de


clase C (p (p ≥ 1) contenida en Ω, x0 un punto de Ω, f : Ω → R diferenciable en x0 . Se dice que
x0 es un punto crı́tico de f condicionado a M si ∇f (x0 ) ∈ NM (x0 ) (equivalentemente, si para
cada h ∈ TM (x0 ) es df (x0 )(h) = 0).
Que x0 sea punto crı́tico de f condicionado a M es necesario, pero no suficiente, para que f
tenga en x0 un extremo relativo condicionado a M .

Teorema 3.5.4 (de los multiplicadores de Lagrange). Sea Ω un abierto de Rn , M = {x ∈


Ω0 : F (x) = 0} una variedad de clase C (p (p ≥ 1) y dimensión k contenida en Ω. Sea x0 un punto
de M , f : Ω → R diferenciable en x0 . Si x0 es un punto crı́tico de f condicionado a M , entonces
existen λ1 , . . . , λm ∈ R (únicos) tales que la función Φ = f − λ1 F 1 − · · · − λm F m tiene en x0 un
punto crı́tico (dΦ(x0 ) = 0).

Demostración. Teniendo en cuenta que el espacio normal NM (x0 ) admite como base el conjunto
de vectores {∇F 1 (x0 ), . . . , ∇F m (x0 )}, resulta:
x0 es punto crı́tico de f condicionado a M ⇐⇒P ∇f (x0 ) ∈ NM (x0 ) ⇐⇒ existe una (única)
m
m-tupla (λ1 , . . . , λm ) ∈ Rm tal que ∇f (x0 )P= i
i=1 λi ∇F (x0 ) ⇐⇒ existe una (única) m-
m
tupla (λ1 , . . . , λm ) ∈ Rm tal quePdf (x0 ) = i
i=1 λi dF (x0 ) ⇐⇒ existe una (única) m-tupla
m m i
(λ1 , . . . , λm ) ∈ R tal que d(f − i=1 λi F )(x0 ) = 0.

Nota. Los extremos relativos condicionados a la variedad k dimensional M = {x ∈ Ω0 : F (x) = 0}


se encontrarán, por tanto, entre los puntos crı́ticos condicionados a M , pero no olvidemos que
tienen que estar en M (deben satisfacer la ecuación F (x) = 0). Ası́, estarán entre las soluciones del
sistema
1 m

 fx1 (x1 , . . . , xn ) = λ1 Fx1 (x1 , . . . , xn ) + · · · + λm Fx1 (x1 , . . . , xn )



 .
..


fxn (x1 , . . . , xn ) = λ1 Fx1n (x1 , . . . , xn ) + · · · + λm Fxmn (x1 , . . . , xn )



 F 1 (x1 , . . . , xn ) = 0

 ..
.




 m
F (x1 , . . . , xn ) = 0.
Los multiplicadores λ1 , . . . , λm son también incógnitas en el sistema, de modo que aparecen n + m
ecuaciones con n + m incógnitas. Al menos en principio, esto reduce considerablemente la búsqueda
de “candidatos a extremos”. Decidir finalmente si los puntos hallados son de verdad extremos
condicionados requiere un estudio adicional, que puede a veces simplificarse por consideraciones de
tipo geométrico o atendiendo a la naturaleza especı́fica del problema.

Ejemplo. Hallar los puntos de la esfera S 2 en R3 que disten menos y más de un punto dado (a, b, c)
con a, b, c 6= 0.
El problema es hallar mı́nimos y máximos absolutos de la función (x, y, z) → d((x, y, z), (a, b, c)).
Es obvio que en vez de esta función podemos considerar su cuadrado,

f (x, y, z) = (x − a)2 + (y − b)2 + (z − c)2 .

Como f es continua y S 2 un compacto en R3 , por el teorema de Weierstrass, f tendrá máximo y


mı́nimo absolutos condicionados a S 2 que serán relativos y, por tanto, puntos crı́ticos condicionados
a S 2 . Como ∇f (x, y, z) = (2(x − a), 2(y − b), 2(z − c)) y ∇F (x, y, z) = (2x, 2y, 2z), el sistema que
tenemos que resolver (en x, y, z, λ) es:


 2(x − a) = 2λx
2(y − b) = 2λy


 2(z − c) = 2λz
 2
x + y 2 + z 2 = 1.
32 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

a b
Se deduce fácilmente que λ = 1 − x = 1− y = 1 − zc , de donde y = b
a x, z = c
a x, llevando estos
a2
valores a la cuarta ecuación, se tiene x2= a2 +b2 +c2
, de aquı́ salen dos valores de x que determinan
los de y, z, λ, llegando a las dos únicas soluciones
a b c p
(√ ,√ ,√ ) con λ = 1 − a2 + b2 + c2
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
a b c p
(− √ , −√ , −√ ) con λ = 1 + a2 + b2 + c2 .
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
Como sólo hay dos es claro que una será el mı́nimo que buscamos y la otra el máximo. Basta
a b c
evaluar f en estos puntos para ver que ( √ ,√ ,√ ) corresponde
2
a +b +c2 2 2
a +b +c2 2 a + b2 + c2
2
a b c
al mı́nimo y (− √ , −√ , −√ ) al máximo.
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
Nota. En general, si M es una variedad en Rn y a un punto de Rn \ M , entonces siempre existe
al menos un mı́nimo absoluto x0 ∈ M condicionado a M , de la función distancia (o al cuadrado
que es lo mismo) f (x) = kx − ak2 (pues f (x) es una función continua que tiene lı́mite +∞ cuando
kxk → ∞ y M es cerrado en Rn al ser la antiimagen de {0} por F ). Y este punto tiene que ser
punto crı́tico condicionado a M , es decir, se tiene que cumplir que

∇f (x0 ) = 2(x0 − a) ∈ NM (x0 ) = TM (x0 )⊥ .

Obsérvese con algún dibujo que este hecho tiene un significado geométrico muy claro.

Ejemplo. Entre los triángulos de igual perı́metro, ¿cuál tiene área máxima?
Estamos con un problema tı́pico de máximos condicionados; veamos por qué. Recordemos la
fórmula clásica de Herón que dice que el área de un triángulo es
p
A = p(p − a)(p − b)(p − c)

donde p es el semiperı́metro y a, b, c los lados. Entonces se trata de hacer máxima la expresión (o


su cuadrado dividido por p)

f (a, b, c) = (p − a)(p − b)(p − c), condicionado a a + b + c = 2p.

Otra condición que impone la geometrı́a del problema es que 0 ≤ a, b, c ≤ p. Como el conjunto

K = {(a, b, c) ∈ R3 : a + b + c = 2p, 0 ≤ a, b, c ≤ p}

es cerrado y acotado, la expresión (continua) f (a, b, c) alcanzará un máximo absoluto en K. El


problema es que K no es variedad, pero por otro lado es obvio que este valor máximo se tiene que
alcanzar cuando 0 < a, b, c < p. Es decir, si llamamos Ω = {(a, b, c) : 0 < a, b, c < p}, éste es un
abierto de R3 y
M = {(a, b, c) ∈ Ω : a + b + c = 2p}
sı́ que es variedad 2 dimensional de R3 y el máximo se alcanzará en M , luego será punto crı́tico.
Como ∇f (a, b, c) = (−(p − b)(p − c), −(p − a)(p − c), −(p − a)(p − b)) y ∇F (a, b, c) = (1, 1, 1),
tenemos que resolver el sistema en a, b, c, λ,


 −(p − b)(p − c) = λ
 −(p − a)(p − c) = λ


−(p − a)(p − b) = λ
a + b + c = 2p




0 < a, b, c < p.

3.5. EXTREMOS SOBRE VARIEDADES 33

De las tres primeras ecuaciones se deduce λ(p − a) = λ(p − b) = λ(p − c), de donde a = b = c. Por
tanto, la única solución es
(2p/3, 2p/3, 2p/3) con λ = −p2 /9.
Ası́, la respuesta a nuestra pregunta es el triángulo equilátero.

Ejemplo. La conocida desigualdad entre la media aritmética y la geométrica


a1 + · · · + an
(a1 . . . an )1/n ≤
n
válida para números reales positivos, se puede deducir del siguiente problema: hallar el máximo de

(x1 . . . xn )2 con la condición x21 + · · · + x2n = 1.

Resolvamos este problema de máximos. Es claro que hay solución por estar con una función con-
tinua sobre un compacto. También es claro que si (α1 , . . . , αn ) es un máximo también lo serán
(±α1 , . . . , ±αn ) para cualquier combinación de signos. Ası́ podemos suponer que x1 , . . . , xn ≥ 0. Y
también es claro que si alguna coordenada es 0, ese punto no será solución a nuestro problema; por
tanto también podemos suponer que x1 , . . . , xn > 0. Y como última reducción al problema, en vez
de la función de partida podemos tomar su logaritmo y ası́ el problema es equivalente a hallar el
máximo de

f (x1 . . . xn ) = log x1 + · · · + log xn con la condición x21 + · · · + x2n = 1, x1 , . . . , xn > 0.

Resolvemos, entonces el sistema 


 1/x1 = 2λx1
..




 .
 1/xn = 2λxn
x2 + · · · + x2n = 1


 1


x1 , . . . , xn > 0
√ √
de donde sale un único punto: x1 = · · · = xn = 1/ 2λ = 1/ n. En este punto, tiene que encontrarse
el valor máximo y por tanto
1 1
(x1 . . . xn )2 ≤ ( √ . . . √ )2 siempre que x21 + · · · + x2n = 1.
n n

Si ahora, tomamos una n-tupla de números reales positivos (a1 , . . . , an ), ponemos bi = ai y
A = (a1 + · · · + an )1/2 , el vector ( bA1 , . . . , bAn ) está en la esfera, con lo que aplicando la desigualdad
anterior
(b1 . . . bn )2 a1 + · · · + an n
 
1 n
≤ ( ) =⇒ (a1 . . . an ) ≤ .
A2n n n
Tomando raı́ces n-ésimas sale el resultado.

Ejemplo. Hallar las distancias mı́nima y máxima del origen al conjunto

M = {(x, y, z) ∈ R3 : x2 − xy + y 2 − z 2 = 1, x2 + y 2 = 1}.

Obsérvese que podemos simplificar el problema porque

M = {(x, y, z) ∈ R3 : x2 + y 2 = 1, xy + z 2 = 0}.

Es fácil probar que M es una variedad 1-dimensional de R3 dada por

F 1 (x, y, z) = x2 + y 2 − 1, F 2 (x, y, z) = xy + z 2
34 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

y que M es un subconjunto de R3 cerrado y acotado. Por tanto, la función distancia al origen (o


mejor su cuadrado)
f (x, y, z) = x2 + y 2 + z 2
alcanzará máximo y mı́nimo absoluto sobre M . Hallemos los puntos crı́ticos de f condicionados a
M : tenemos que resolver el sistema (ahora, los multiplicadores son dos λ, µ)

 2x = λ2x + µy

 2y = λ2y + µx


2z = µ2z
 x2 + y 2 = 1



xy + z 2 = 0

De la tercera ecuación, si z = 0, yendo a la cuarta y quinta, obtenemos las soluciones (0, ±1, 0)
(con λ = 1, µ = 0) y (±1, 0, 0) (con λ = 1, µ = 0). En estos puntos

f (±1, 0, 0) = f (0, ±1, 0) = 1.

Si z 6= 0, entonces µ = 1 y x, y 6= 0 y de distinto signo (ver quinta ecuación). De las dos primeras


queda 
2x(1 − λ) = y
2y(1 − λ) = x,
de donde y 2 = x2 . Por la cuarta, llegamos a que x = ± √12 y de la quinta a z 2 = 1/2. Recopilando
toda la información, hemos hallado cuatro puntos crı́ticos más
1 1 1 1 1 1
( √ , − √ , ± √ ), (− √ , √ , ± √ ) con λ = 3/2, µ = 1.
2 2 2 2 2 2
En todos estos puntos f vale 3/2. La conclusión es que los cuatro primeros son mı́nimos absolutos
p y
los cuatro últimos máximos absolutos. Y, la distancia mı́nima es 1 y la distancia máxima es 3/2.
El siguiente resultado nos da condiciones suficientes para extremos condicionados. La diferencia
con los extremos sin condicionar radica en que hay que considerar el hessiano de Φ, no de f y en
que basta clasificarlo sobre el espacio tangente, no sobre todo Rn
Teorema 3.5.5 (condición suficiente para extremo condicionado). Sea Ω un abierto de Rn ,
M = {x ∈ Ω0 : F (x) = 0} una variedad de clase C (p (p ≥ 2) y dimensión k contenida en Ω, x0 un
punto de M , f : Ω → R una función de clase C (2 tal que x0 es un punto crı́tico de f condicionado
a M . Sean λ1 , . . . , λm ∈ R los multiplicadores asociados, es decir, x0 es un punto crı́tico de la
función Φ = f − λ1 F 1 − · · · − λm F m : Ω ∩ Ω0 → R. Entonces, denotando por QΦ(x0 ) la forma
cuadrática hessiana de Φ en x0 ,

(1) si QΦ(x0 )(h) > 0 para cada h ∈ TM (x0 ) \ {0}, se tiene que x0 es un mı́nimo local estricto de
f condicionado a M .
(2) si QΦ(x0 )(h) < 0 para cada h ∈ TM (x0 ) \ {0}, se tiene que x0 es un máximo local estricto de
f condicionado a M .
(3) si x0 es un mı́nimo local de f condicionado a M , se cumple QΦ(x0 )(h) ≥ 0 para cada
h ∈ TM (x0 ).
(4) si x0 es un máximo local de f condicionado a M , se cumple QΦ(x0 )(h) ≤ 0 para cada
h ∈ TM (x0 ).
(5) si existen vectores h1 , h2 ∈ TM (x0 ), tales que QΦ(x0 )(h1 ) > 0 > QΦ(x0 )(h2 ), se tiene que x0
no es un máximo ni un mı́nimo local de f condicionado a M (decimos entonces que es un
punto de silla de f condicionado a M ).
3.5. EXTREMOS SOBRE VARIEDADES 35

Demostración. Sea (U, ϕ) una carta explı́cita de M en torno a x0 . Como para todo x ∈ M es

Φ(x) = f (x) − λ1 · 0 − · · · − λm · 0 = f (x),

y en particular Φ(ϕ(u)) = f (ϕ(u)) para todo u ∈ U , por la continuidad de ϕ en u0 = ϕ−1 (x0 )


vemos que f tendrá en x0 un extremo local condicionado a M si y sólo si Φ ◦ ϕ tiene un extremo
local (sin condicionar) del mismo tipo en u0 . Examinemos entonces cómo es la forma cuadrática
hessiana de Φ ◦ ϕ en u0 en términos de la de Φ en x0 .
∂Φ
Puesto que dΦ(x0 ) = 0, será (x0 ) = 0 (1 ≤ p ≤ n) y
∂xp

∂(Φ ◦ ϕ) ∂Φ ∂ϕ1 ∂Φ ∂ϕn


(u) = (ϕ(u)) (u) + · · · + (ϕ(u)) (u) (1 ≤ j ≤ k)
∂uj ∂x1 ∂uj ∂xn ∂uj

de donde

∂ 2 (Φ ◦ ϕ) ∂2Φ ∂ϕ1 ∂2Φ ∂ϕn ∂ϕ1


 
(u0 ) = (x0 ) (u 0 ) + · · · + (x0 ) (u 0 ) (u0 )
∂ui ∂uj ∂x21 ∂ui ∂xn ∂x1 ∂ui ∂uj
∂Φ ∂ 2 ϕ1
+ (x0 ) (u0 )
∂x1 ∂ui ∂uj
+ ······················································
 2
∂ϕ1 ∂2Φ ∂ϕn ∂ϕn

∂ Φ
+ (x0 ) (u0 ) + · · · + (x0 ) (u 0 ) (u0 )
∂x1 ∂xn ∂ui ∂x2n ∂ui ∂uj
∂Φ ∂ 2 ϕn
+ (x0 ) (u0 )
∂xn ∂ui ∂uj
n
X ∂2Φ ∂ϕp ∂ϕq
= (x0 ) (u0 ) (u0 ).
∂xp ∂xq ∂ui ∂uj
p,q=1

Con esto
 
k n
X X ∂2Φ ∂ϕp ∂ϕq
Q(Φ ◦ ϕ)(u0 )(`) =  (x0 ) (u0 ) (u0 ) `i `j
∂xp ∂xq ∂ui ∂uj
i,j=1 p,q=1
n k
X X ∂2Φ ∂ϕp ∂ϕq
= (x0 ) (u0 ) (u0 ) `i `j
∂xp ∂xq ∂ui ∂uj
p,q=1 i,j=1
n k 
∂2Φ ∂ϕp
 q 
X X ∂ϕ
= (x0 ) (u0 ) `i (u0 ) `j
∂xp ∂xq ∂ui ∂uj
p,q=1 i,j=1
n
" k # k 
X ∂2Φ X ∂ϕp X ∂ϕq
= (x0 ) (u0 ) `i  (u0 ) `j 
∂xp ∂xq ∂ui ∂uj
p,q=1 i=1 j=1

= QΦ(x0 ) (dϕ(u0 )(`)) .

En consecuencia, dado que h ∈ TM (x0 ) ⇐⇒ existe ` ∈ Rk tal que h = dϕ(u0 )(`), y que con esta
notación h = 0 ⇐⇒ ` = 0 porque Jϕ(u0 ) es de rango k, podemos afirmar:

Q(Φ ◦ ϕ)(u0 ) es definida positiva (respectivamente, definida negativa o semidefinida positiva


o semidefinida negativa o indefinida) si y sólo si la restricción de QΦ(x0 ) a TM (x0 ) es definida
positiva (respectivamente, definida negativa o semidefinida positiva o semidefinida negativa
o indefinida).
36 CAPÍTULO 3. FUNCIONES IMPLÍCITAS E INVERSAS

Como obviamente u0 es un punto crı́tico de Φ ◦ ϕ, de aquı́ se obtiene el teorema. (Por ejemplo,


si QΦ(x0 )(h) > 0 para cada h ∈ TM (x0 ) \ {0}, Q(Φ ◦ ϕ)(u0 ) es definida positiva y Φ ◦ ϕ tiene
en u0 un mı́nimo relativo estricto; esto significa que existe un r > 0 tal que para todo u ∈ Rk
con 0 < ku − u0 k < r es u ∈ U y (Φ ◦ ϕ)(u) < (Φ ◦ ϕ)(u0 ); pero ϕ es un homeomorfismo, luego
ϕ({u ∈ Rk : ku − u0 k < r}) es un abierto relativo en M al que pertenece x0 , que contiene por tanto
la intersección de M con una bola de centro x0 y radio δ para algún δ > 0; y ası́ para cada x ∈ M
con 0 < kx − x0 k < δ existe u ∈ U con 0 < ku − u0 k < r y x = ϕ(u), lo que da

f (x) = f (ϕ(u)) = Φ(ϕ(u)) < Φ(ϕ(u0 )) = f (ϕ(u0 )) = f (x0 ),

es decir, que x0 es un mı́nimo local estricto de f condicionado a M .


De manera parecida, con las adaptaciones necesarias, se procede en los restantes casos.

Ejemplo. Sea la variedad 2-dimensional M = {(x, y, z) ∈ R3 : ax + by + cz = d} con a, b, c, d 6= 0.


Estudiar los extremos de f (x, y, z) = xyz condicionados a M .
Primero, buscamos los puntos crı́ticos con sus correspondientes multiplicadores,

∇f (x, y, z) = (yz, xz, xy), ∇F (x, y, z) = (a, b, c),

luego tenemos que resolver el sistema




 yz = λa
xz = λb


 xy = λc
ax + by + cz = d

Si λ = 0, salen los puntos (0, 0, d/c), (0, d/b, 0), (d/a, 0, 0) y si λ 6= 0 sale (d/3a, d/3b, d/3c) con
λ = d2 /9abc.
Para el punto (0, 0, d/c) es Φ = f − 0 · F = f y el hessiano de esta función en dicho punto es
 
0 d/c 0
 d/c 0 0  .
0 0 0

Por tanto, la forma cuadrática es

d
QΦ(0, 0, d/c)[h, k, l] = 2 hk.
c

Luego, sobre R3 es claramente indefinida; pero tenemos que estudiarla sobre el espacio tangente

TM (0, 0, d/c) = {(h, k, l) ∈ R3 :< ∇F (0, 0, d/c), (h, k, l) >= 0} = {(h, k, l) : ah + bk + cl = 0}

y sigue saliendo indefinida (por ejemplo, cambia de signo en los puntos del espacio tangente dados
por (1, 1, −(a + b)/c) y (1, −1, −(a − b)/c)). Los otros puntos con λ = 0 son similares.
d2
Para el punto (d/3a, d/3b, d/3c) es Φ = f − 9abc F y el hessiano de Φ en dicho punto queda
 
0 d/3c d/3b
 d/3c 0 d/3a  ,
d/3b d/3a 0

con lo que
2d hk hl kl 
QΦ(d/3a, d/3b, d/3c)[h, k, l] = + + .
3 c b a
3.5. EXTREMOS SOBRE VARIEDADES 37

Esta forma es indefinida sobre R3 , pero sobre el espacio tangente que vuelve a ser el mismo {(h, k, l) :
ah + bk + cl = 0}, se tiene que cl = −ah − bk, de donde

2d hk hl kl  −2d  −2d 1 3
(ah)2 + (bk)2 + (ah)(bk) = (ah + bk)2 + (bk)2

+ + =
3 c b a 3abc 3abc 2 4
que es (dependiendo de los signos de a, b, c, d) o siempre ≥ 0 o siempre ≤ 0. Además, si es 0 se
sigue que k = h = 0 y, por tanto, también l = 0.
Ası́, hemos demostrado que la forma es (dependiendo de los signos de a, b, c, d) o bien DP o
bien DN sobre el espacio tangente y el punto (d/3a, d/3b, d/3c) será mı́nimo o máximo local de f
condicionado a M .

También podría gustarte