Pruebas de Teoremas en Espacios Normados
Pruebas de Teoremas en Espacios Normados
ÁLvarez-Nodarse 1
as
Teorema 1 (Teorema de completitud en dimensión finita) Todo subespacio M de
dimensión finita de un espacio normado es completo. En particular, todo espacio normado
de dimensión finita es completo.
m
Demostración: Sea (ym )m una sucesión de Cauchy arbitraria de M . Sea dim M = n.
re
(m)
Entonces para todo ym ∈ M , existen los números (únicos) αk , k = 1, 2, . . . , n, tales que
Pn (m)
ym = k=1 αk ek . Como (ym )m es de Cauchy, entonces, por un lado
eo
y por el otro, por el Lema técnico 1.28, existe un c > 0 tal que
n
X n
X n
X
(m) (m+p) (m) (m+p) (m) (m+p)
>k (αk − αk )ek k ≥ c |αk − αk | sT =⇒ |αk − αk | ≤ /c,
k=1 k=1 k=1
(m) (m)
i.e., las sucesiones (αk )m son de Cauchy, y por tanto convergenPn (los αk son números
reales o complejos), a ciertos αk , k = 1, 2, . . . , n. Sea y = k=1 αj ej ∈ M . Entonces
se
n n
lo
m→∞
X X
ar
(m) (m)
kym − yk = (αk − αk )ek ≤ |αk − αk |kek k −→ 0 =⇒ lı́m ym = y ∈ M,
m→∞
od
k=1 k=1
i.e., M es completo.
-N
ez
Teorema 2 (Equivalencia de las normas en Rn ) Sea X un espacio vectorial de di-
e
r
mensión finita. Entonces cualquier norma k · k en X es equivalente a cualquier otra norma
va
en X.
sd
Ál
existen (y son únicos) los números α1 , . . . , αn tales que x = nj=1 αj ej . Entonces, por el
Lema técnico 1.28
na
ba
kxk
Re
Pero 0
ue
n n n
0
X X
0 0
X k
kxk = ≤ |αj |kej k ≤ máx kej k |αj | ≤ kxk,
Pr
αj ej
j=1 j=1
j
j=1
c
donde hemos denotado por k al máxj kej k. Intercambiando las normas obtenemos kxk ≤
k0
Pr
c0
kxk0 , de donde se sigue el resultado.
as
x = nk=1 xk ek . Entonces
P
n
X n
X n
X
kT xk = T xk ek ≤ |xk |kT ek k ≤ máx kT ek k |xk |.
k
m
k=1 k=1 k=1
Por otro lado, usando el Lema técnico 1.28 tenemos que existe un c > 0 tal que
re
n
X n
X
kxk = xk ek ≥ c |xk |.
k=1 k=1
eo
kxk
kT xk ≤ máx kT ek k =⇒ kT xk ≤ γkxk,
k c
con γ = máxk kT ek k/c.
sT
Teorema 4 (Regla de la cadena) Sean f : A ⊂ Rn → Rm y g : B ⊂ Rm → Rk , A, B
abiertos tales que f (A) ⊂ B. Supongamos que f es diferenciable en a y g es diferenciable
en f (a). Entonces la función compuesta g ◦ f : A ⊂ Rn → Rk es diferenciable en a
se
y D(g ◦ f )(a) = Dg(f (a)) ◦ Df (a). Lo anterior se puede escribir en coordenadas de la
lo
ar
siguiente forma:
od
m m
X ∂(g ◦ f )i (a) X ∂gi (f (a)) ∂fl (a)
Dj (g ◦ f )i (a) = Dk gi (f (a))Dj fk (a), =
-N
k=1
∂xj l=1
∂xl ∂xj ez
donde i = 1, . . . , n, j = 1, · · · , k. Matricialmente lo anterior se escribe como: D(g◦f )(a) =
e
Demostración: Calculamos
Ál
Ahora bien, como Dg(f (a)) es una aplicación lineal acotada, entonces kDg(f (a))vk ≤
of.
kDg(f (a))kkvk, de donde se sigue que Dg(f (a))o(khk) = o(khk). Por otro lado f (a +
ue
o(khk)
kf (a + h) − f (a)k ≤ kDf (a)kkhk + o(khk) = kDf (a)k + khk,
khk
Pr
pero la expresión entre paréntesis de la última igualdad está acotada pues Df (a) es
acotada y o(khk)/khk → 0 si h → 0. De lo anterior se deduce que existe un M > 0 tal
que kf (a + h) − f (a)k ≤ M khk. Luego o(kf (a + h) − f (a)k) = o(khk), de donde se sigue
el resultado.
Prof. R. ÁLvarez-Nodarse 3
as
con A abierto y sea a ∈ A. Supongamos que existen las derivadas parciales de cada una
de las componentes de f en un entorno de a con respecto a cada una de las variables y
son continuas en a, entonces f es diferenciable en a.
m
Demostración: Para probarlo es suficiente considerar el caso de una función escalar.
re
=[f (a1 +h1 , a2 +h2 , · · · , an−1 +hn−1 , an +hn )−f (a1 , a2 +h2 , · · · , an−1 +hn−1 , an +hn )]
+ [f (a1 , a2 +h2 , · · · , an−1 +hn−1 , an +hn )−f (a1 , a2 , a3 +h3 , · · · , an−1 +hn−1 , an +hn )]
+ ···
eo
+ [f (a1 , a2 , · · · , an−1 + hn−1 , an + hn ) − f (a1 , a2 , · · · , an−1 , an + hn )]
+ [f (a1 , a2 , · · · , an−1 , an + hn ) − f (a1 , a2 , · · · , an−1 , an )].
A cada uno de los sumandos entre corchetes se le puede aplicar el teorema del valor
sT
medio de Lagrange (sólo cambia una única variable y f como función de cada variable es
continua y diferenciable en todo un intervalo). Ası́ pues
n
X ∂f (yk )
f (a + h) − f (a) = hk
se
k=1
∂xk
lo
ar
donde y1 = (ξ1 , a2 + h2 , a3 + h3 , . . . , an + hn ), y2 = (a1 , ξ2 , a3 + h3 , . . . , an + hn ), . . . ,
od
yn = (a1 , a2 , a3 , . . . , ξn ), con ξk ∈ (ak , ak + hk ), k = 1, 2, . . . , n. Calculamos ahora
-N
n n
X ∂f (a) X ∂f (yk ) ∂f (a)
f (a+h) − f (a) − Df (a)(h) = f (a+h) − f (a) − hk = − hk .
ez
∂xk ∂xk ∂xk
e
k=1 k=1
r
va
Teniendo en cuenta que |hk | ≤ khk para todo k = 1, . . . , n, tenemos entonces que
sd
Ál
n
|f (a + h) − f (a) − Df (a)(h)| X ∂f (yk ) ∂f (a)
≤ − → 0 cuando h → 0,
khk ∂x k ∂x k
to
k=1
na
hipótesis.
Re
of.
convexo. Sean a, b ∈ A y sea s el segmento que los une (s = {(1 − t)a + tb : t ∈ [0, 1]}).
Pr
Entonces, para cada vector v ∈ Rm existe un punto z en el interior del segmento s tal que
as
definida por
m
X
F (t) = hv, f (a + (b − a)t)i = vk fk (a + (b − a)t).
k=1
m
Como f es diferenciable en A, entonces F es continua en [0, 1] y diferenciable en (0, 1)
por lo que podemos aplicar el teorema del valor medio de Lagrange de una variable.
Ası́ F (1) − F (0) = hv, f (b) − f (a)i = F 0 (ξ) con ξ ∈ (0, 1). Pero, usando la regla de la
re
cadena y las propiedades de la diferenciación de la suma y multiplicación
n
d X ∂
fk (a + (b − a)t) = fk (a + (b − a)t) · (bj − aj ) = Dfk [a + (b − a)t](b − a).
dt ∂x j
eo
j=1
Ası́ que
m m
0
Xd X
F (ξ) = vk fk (a + (b − a)ξ) = vk Dfk [a + (b − a)ξ](b − a) = hv, Df (z)(b − a)i,
sT
k=1
dt k=1
se
Teorema 7 (Schwarz) Sea f : A ⊂ Rn → Rm con A abierto, y sea x0 ∈ A. Si en A
lo
ar
∂f (x) ∂f (x) ∂ 2 f (x) ∂ 2 f (x)
existen las derivadas parciales , y y la derivada es continua
∂xi ∂xj ∂xj ∂xi ∂xj ∂xi
od
∂ 2 f (x0 ) ∂ 2 f (x0 ) ∂ 2 f (x0 )
en x0 , entonces en x0 ∈ A existe la derivada y = .
∂xi ∂xj ∂xj ∂xi ∂xi ∂xj
-N
ez
e
Demostración: Sin pérdida de generalidad vamos a probarlo para una función escalar de
r
dos variables (¿por qué?). Sea la función u(x) = f (x, b + k) − f (x, b), x0 = (a, b), donde h
va
sd
y k son lo suficientes pequeños de forma que el rectángulo U = {(x, y), x ∈ (a, a + h), y ∈
Ál
u también lo es ası́ que podemos aplicar el teorema del valor medio de Lagrange para
Re
0
∆f (a, b) = u(a + h) − u(a) = u (x)h = − h, x ∈ (a, a + h),
ue
∂x ∂x
Pr
que aplicando otra vez el teorema del valor medio de Lagrange a la función ∂f∂x (x,y)
en la
variable y nos conduce a
Pr
∂ 2 f (x, y)
∂ ∂f (x, y)
∆f (a, b) = hk = hk , x ∈ (a, a + h), y ∈ (b, b + k).
∂y ∂x ∂y∂x
Escojamos ahora (x, y) ∈ U donde U = {(x, y), x ∈ (a, a + h), y ∈ (b, b + k)}, siendo
2 f (x,y)
h y k las cantidades anteriores, es el rectángulo usado anteriormente. Como ∂ ∂y∂x es
Prof. R. ÁLvarez-Nodarse 5
continua en (a, b) entonces para cualquier > 0 existe una bola B(x0 , δ) tal que para
as
todos (x, y) ∈ B(x0 , δ)
∂ 2 f (x, y) ∂ 2 f (a, b)
− < .
∂y∂x ∂y∂x 2
Por tanto, si escogemos U ⊂ B(x0 , δ) tenemos
m
∆f (a, b) ∂ 2 f (a, b)
− < . (1)
hk ∂y∂x 2
re
∂f
Como existe , entonces
∂y
eo
∆f (a, b) 1 f (a + h, b + k) − f (a + h, b) f (a, b + k) − f (a, b)
lı́m = lı́m −
k→0 hk k→0 h k k
1 ∂f (a + h, b) ∂f (a, b)
= − ,
h ∂y ∂y
sT
luego, tomando el lı́mite k → 0 en (1), tenemos
∂ 2 f (a, b)
1 ∂f (a + h, b) ∂f (a, b)
− − ≤ .
h ∂y ∂y ∂y∂x 2
se
Tomando el lı́mite h → 0 en la expresión anterior se deduce que
lo
ar
∂ 2 f (a, b)
1 ∂f (a + h, b) ∂f (a, b)
lı́m − = ,
od
h→0 h ∂y ∂y ∂y∂x
-N
∂ 2 f (a,b)
pero, por definición, si existe el lı́mite del miembro izquierdo este es igual a
ez ∂x∂y
.
e
∂f (x) ∂f (x)
va
sd
∂ 2 f (a) ∂ 2 f (a)
diferenciables en a. Entonces = .
∂xj ∂xi ∂xi ∂xj
to
na
y sea la función G(x) = f (x, b + h) − f (x, b). Está claro que ∆f (a, b) = G(a + h) − G(a)
ue
y que G es una función de una variable que por condición es continua y diferenciable en
Pr
∂x ∂x
∂f
Como ∂x
es diferenciable por hipótesis entonces
∂f (ξ, b + h) ∂f (a, b) ∂ ∂f (a, b) ∂ ∂f (a, b) p
= + (ξ −a)+ h+o (ξ − a)2 + h2 ,
∂x ∂x ∂x ∂x ∂y ∂x
6 Pruebas de los principales Teoremas de DFVV.
∂f (ξ, b) ∂f (a, b) ∂ ∂f (a, b)
= + (ξ − a) + o (ξ − a) ,
as
∂x ∂x ∂x ∂x
p
que, teniendo en cuenta que o (ξ − a)2 + h2 = o(h) (pues |ξ − a| < |h|) nos conduce
a
∂ ∂f (a, b)
m
∆f (a, b) = h2 + ho(h)
∂y ∂x
de donde se sigue que
re
∂ 2 f (a, b)
∆f (a, b) ∂ ∂f (a, b)
lı́m 2
= =
h→0 h ∂y ∂x ∂y∂x
Sea ahora la función H(y) = f (a + h, y) − f (a, y). Como ∆f (a, b) = H(b + h) − H(b)
eo
tenemos, de forma análoga que existe un ξ ∈ (b, b + h) tal que
0 ∂f (a + h, ξ) ∂f (a, ξ)
∆f (a, b) = hH (ξ) = h − .
∂y sT∂y
Si usamos la diferenciabilidad de ∂f
∂y
obtenemos, de forma completamente análoga
∂ ∂f (a, b) 2 ∆f (a, b) ∂ ∂f (a, b)
∆f (a, b) = h + ho(h) =⇒ lı́m = ,
∂x ∂y h→0 h2 ∂x ∂y
se
lo
ar
od
Teorema 9 (de Taylor con resto de Lagrange) Supongamos que f : A ⊂ Rn 7→ R,
f ∈ C k (A). Sea a ∈ A y asumamos que el intervalo [a, a + h] ⊂ A para cierto h 6= 0.
Entonces -N
ez
k−1
1 l
e
X
f (a + h) = f (a) + D f (a)(h) + rk (a, h),
r
l!
va
l=1
sd
donde
Ál
1 k
rk (a, h) = D f (a + ξh)(h), ξ ∈ (0, 1).
k!
to
n
X ∂f (x + ht)
ue
0
φ (t) = Df (x + ht) · h = hi ,
∂xi
Pr
i=1
" n # n " n # n
00 d X ∂f (x + ht) X X ∂ ∂f (x + ht) X ∂ 2 f (x + ht)
φ (t) = hi = hj hi = hj hi ,
dt i=1 ∂xi ∂xj ∂xi ∂xj ∂xi
Pr
y, en general,
n n k
∂ k f (x + ht)
(k)
X X ∂ ∂
φ (t) = ··· hi1 · · · hik = h1 + · · · + hn f (x + ht). (2)
i =1 i =1
∂x i 1 · · · ∂x i k
∂x 1 ∂x n
1 k
Prof. R. ÁLvarez-Nodarse 7
as
Entonces podemos usar el Teorema de Taylor para funciones de una variable. Sea
τ ∈ (0, 1] cualquiera, entonces existe un ξ ∈ (0, τ ) tal que
m
φ(τ ) = φ(0) + φ0 (0)τ + · · · + φ(k−1) (0)τ k−1 + rk (τ ),
(k − 1)!
re
donde tomamos el resto rk , por ejemplo, en forma de Lagrange
1 (k)
rk (τ ) = φ (ξ)τ k .
k!
eo
Escogiendo τ = 1 y usando (2) con x = a se deduce el teorema.
Si tenemos una función f : A ⊂ Rn 7→ Rm , f ∈ C k (A), podemos aplicar el teorema de
Taylor a cada una de sus componentes.
sT
Teorema 10 (de la función implı́cita) Sea F : A ⊂ Rn × R 7→ R definida en un
entorno del punto (x0 , y0 ) ∈ A, A abierto de Rn × R. Supongamos que:
se
1. F (x, y) := F (x1 , x2 , . . . , xn , y) ∈ C (p) (A), p ≥ 1,
lo
ar
od
2. F (x0 , y0 ) := F (x01 , x02 , . . . , x0n , y0 ) = 0,
3. Fy0 (x0 , y0 ) =
∂F (x01 , x02 , . . . , x0n , y0 )
∂y
6= 0. -N
ez
e
r
va
∂f (x) ∂f (x1 , . . . xn )
ue
∂xi ∂xi
Demostración:
10
Análogamente al caso de los intervalos definidos justo antes del Teorema 2.8, definiremos el abierto
(x0 − h, x0 + h) como (x01 − h2 , x01 + h1 ) × (x02 + −h2 , x02 + h2 ) × · · · × (x0n − hn , x0n + hn ).
8 Pruebas de los principales Teoremas de DFVV.
1. Asumamos que Fy0 (x0 , y0 ) > 0, entonces, como Fy0 (x, y) es continua en (x0 , y0 ) ∈ A,
as
se tiene que existe todo un entorno I = Ix ×Iy de (x0 , y0 ) donde Fy0 (x, y) > 0. Luego,
F (x, y) como función de y es estrictamente creciente. Como F (x0 , y0 ) = 0 entonces
tenemos que
m
0 > F (x0 , y0 − k) < F (x0 , y0 ) < F (x0 , y0 + k) > 0.
re
entorno de cada punto, i.e., existe un entorno Ix (que por simplicidad asumimos
igual al de antes) tal que
eo
Pero para cada x ∈ Ix la función h(y) := F (x, y) cambia de signo en los extremos
del intervalo Iy , luego por el Teorema de Bolzano para cada x ∈ Ix existe un único
y ∈ Iy tal que F (x, y) = 0 (la unicidad es consecuencia de la monotonı́a de h(y)).
Definiendo la función f : Ix 7→ Iy ⊂ R de forma que y = f (x) obtenemos una
sT
función que cumple con que F (x, f (x)) = 0.
se
cambie de signo en los extremos de [y0 − , y0 + ], luego f (x) ∈ (y0 − , y0 + ), i..e.,
lo
r
∀ > 0, ∃δ > 0, tal que |f (x) − f (x0 )| < , que es justo lo que se querı́a probar.
da
3. Para probar que f ∈ C (1) (Ix ) hacemos lo siguiente: Elegimos ∆x = hei , ei i-ésimo
No
vector de la base canónica de Rn . Como f es continua en Iy , entonces podemos
escribir f (x + ∆x) = f (x) + ∆y = y + ∆y, donde ∆y = f (x + ∆x) − f (x) → 0 si -
rez
∆x → 0. Como F (x, y) = F (x + ∆x, y + ∆y) = 0 entonces, aplicando el teorema
e
del valor medio 6 para funciones escalares sabemos que existe un θ ∈ (0, 1) tal que
va
sd
∆x
A´l
= h+ ∆y.
∂xi ∂y
na
ba
∂F (x, y) ∂F (x, y) ∆y
0= + lı́m
∂xi ∂y h→0 h
of.
ue
i
, y que como hemos visto en
∂F (x, y)
todo un entorno de (x0 , y0 ) 6= 0, se sigue el resultado (3).
∂y
Pr
4. Finalmente, para probar que f (x) ∈ C (p) (Ix ) basta notar que en la parte derecha
fórmula (3) solo aparece la función f y F . Del apartado anterior se sigue que ambas
son diferenciables, entonces derivando consecutivamente (3) se obtiene el resultado
ya que cada vez que se deriva en la parte derecha aparecen las derivadas parciales
sucesivas de f de un orden menor que las que aparecen en la parte izquierda.
Prof. R. ÁLvarez-Nodarse 9
as
abierto, a ∈ A. Supongamos que f tiene en a un extremo relativo. Entonces, si existen
∂f ∂f
las derivadas parciales ∂x k
, k = 1, . . . , n éstas son iguales a cero en a, i.e., ∂x k
(a) = 0,
k = 1, . . . , n. En particular si f es diferenciable en a, entonces Df (a) = 0.
m
Demostración: Sea a = (a1 , · · · , an ) ∈ A, A abierto, un extremo de la función f : A ⊂
Rn → R diferenciable en a. Definamos la función φk (xk ) := f (a1 , . . . , ak−1 , xk , ak+1 , . . . , an ).
re
Es obvio que φk es diferenciable en su única variable y tiene un extremo en xk = ak , luego
el Lema de Fermat para funciones escalares de una variable nos asegura que φ0k (ak ) = 0,
de donde se sigue el resultado.
eo
Teorema 12 (Condición suficiente de extremo) Sea f : A ⊂ Rn → R dos veces
diferenciable en a ∈ A, A abierto, y sea x = a un punto crı́tico de f , i.e., Df (a) = 0.
Entonces
se
3. Si la segunda diferencial D2 f (a)(x) es indefinida, i.e., si existen x, y ∈ Rn tales que
lo
ar
D2 f (a)(x) > 0 > D2 f (a)(y), entonces f tiene un punto de silla en a.
od
Demostración: Usamos la fórmula local de Taylor (¿por qué?)
1
f (x) = f (a) + Df (a)(h) + D2 f (a)(h) + o(khk2 ),
-N
ez
e
2
r
va
Ál
n
!
2
1 2 1 X ∂ f (a) hi hj
f (x) − f (a) = D f (a)(h) + o(khk2 ) = khk2 + o(1) ,
2 2 ∂x i ∂x j khk khk
to
i,j=1
na
donde o(1) es tal que lı́mx→a o(1) = lı́mh→0 o(1) = 0. De la expresión anterior se sigue
ba
que el signo de f (x) − f (a) coincide con el signo de la expresión dentro de los paréntesis.
Re
0
X ∂ 2 f (a) hi hj h
Q(h , a) = , h0 = , kh0 k = 1.
ue
i,j=1
Nótese que Q está definida sobre el vector h0 = h/khk con norma uno, i.e., Q es una función
continua (polinomio) sobre un cerrado y acotado (la esfera S = {x ∈ Rn |kx − ak = 1}),
Pr
entonces existe un entorno de x = a tal que Q(h0 , a) + o(1) > 0 (¿por qué), y por tanto
as
en dicho entorno de a f (x) − f (a) > 0, i.e., f tiene un mı́nimo local. Si por el contrario Q
es definida negativa entonces M < 0. Razonando igual que antes y tomando < |M |/2,
tenemos que f (x) − f (a) < 0, i.e., f tiene un máximo. Lo anterior prueba 1 y 2.
Probemos ahora 3. Sean am y aM los puntos donde Q alcanza su mı́nimo y máximo
m
absolutos sobre S (nótese que kam k = kaM k = 1), respectivamente. Como Q es indefinida
entonces m < 0 < M (¿por qué?). Por tanto tenemos 0 > m ≤ Q(h0 , a) ≤ M > 0. Si
re
elegimos ahora h = x − a = tam con t suficientemente pequeño tendremos (¿por qué?)
1 1 t2
f (x) − f (a) = D2 f (a)(h) + o(khk2 ) = D2 f (am t)(h) + o(kam tk2 ) = (m + o(1)),
2 2 2
eo
y para ciertos x en un entorno de a el signo de f (x) − f (a) es igual al signo de m, o
sea, negativo. Repitiendo el razonamiento para h = x − a = taM con t suficientemente
pequeño obtendremos que para ciertos x en un entorno de a f (x) − f (a) > 0, luego en a
no puede haber ningún extremo de f . sT
se
lo
ar
od
-N
ez
e
r
va
sd
Ál
to
na
ba
Re
of.
ue
Pr
Pr
Prof. R. Álvarez-Nodarse
Universidad de Sevilla