Libro FING
Libro FING
variable
IMERL
Facultad de Ingenierı́a
Universidad de la República
2
1. Conjuntos 1
1.1. Conjuntos, elementos y pertenencia . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Operaciones con conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Número real 9
2.1. ¿Qué es un número real? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2. Desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3. Completitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3. Integración 21
3.1. Integral de una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.1. Objetivo y método . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.2. Particiones de un intervalo . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.3. Sumas inferiores y superiores . . . . . . . . . . . . . . . . . . . . . . 25
3.1.4. Integral inferior y superior . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.5. Ejemplos y contraejemplo . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2. Propiedades de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.1. Monotonı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.2. Linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.3. Integral y valor absoluto . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4. Aditividad respecto al intervalo
Rb . . . . . . . . . . . . . . . . . . . . . 51
3.2.5. Extensión de la notación a f a los casos donde a = b y a>b . . . . 54
3.2.6. Otras propiedades geométricas de la integral . . . . . . . . . . . . . . 56
3.3. Ejemplos de funciones integrables . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.1. Funciones escalonadas . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2. Integración de funciones polinomiales . . . . . . . . . . . . . . . . . . 65
3.3.3. Integral de la función t 7→ 1/t . . . . . . . . . . . . . . . . . . . . . . 72
4. Lı́mites y continuidad 79
4.1. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.1. Entornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.2. Noción de lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.1.3. Ejemplos y contraejemplos . . . . . . . . . . . . . . . . . . . . . . . . 83
4.1.4. Propiedades algebraicas de los lı́mites . . . . . . . . . . . . . . . . . . 89
4.1.5. Propiedades de monotonı́a . . . . . . . . . . . . . . . . . . . . . . . . 95
4.1.6. Composición de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3
4
5. Derivadas 141
5.1. Definición de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.1.1. Velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.1.2. Pendiente de la recta tangente . . . . . . . . . . . . . . . . . . . . . . 144
5.1.3. Lı́mite del cociente incremental . . . . . . . . . . . . . . . . . . . . . 146
5.1.4. Continuidad de las funciones derivables . . . . . . . . . . . . . . . . . 147
5.2. Cálculo de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.2.1. Primeros ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.2.2. Un ejemplo que desafı́a la intuición . . . . . . . . . . . . . . . . . . . 153
5.2.3. Álgebra de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.2.4. Regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.2.5. Teorema de la función inversa . . . . . . . . . . . . . . . . . . . . . . 159
5.2.6. Regla de L’Hôpital . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.3. Teorema del valor medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.1. Extremos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.2. Teorema de Rolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.3.3. Teorema del valor medio de Lagrange . . . . . . . . . . . . . . . . . . 170
5.3.4. Demostración de la Regla de L’Hôpital . . . . . . . . . . . . . . . . . 172
5.4. Crecimiento y clasificación de extremos . . . . . . . . . . . . . . . . . . . . . 174
5.4.1. Crecimiento y signo de la derivada . . . . . . . . . . . . . . . . . . . 174
5.4.2. Clasificación de extremos a partir del signo de la derivada . . . . . . 177
5.4.3. Clasificación de extremos con la derivada segunda . . . . . . . . . . . 178
Conjuntos
a∈A
Una de las primeras interrogantes que aparecen al trabajar con conjuntos es la forma
de determinarlos. Se debe indicar de una forma precisa y sin ambigüedades, cuáles son sus
elementos. Se pueden distinguir varias formas, una de estas es determinar al conjunto por
extensión, esto es, listar todos los elementos del conjunto. Por ejemplo, si A es el conjunto
de los números naturales mayores o iguales que 10 y menores que 20, entonces
A = {10, 11, 12, 13, 14, 15, 16, 17, 18, 19}
Podemos observar que cada elemento está separado por una coma, y los mismos se encuen-
tran entre llaves.
1
2
Otra forma de describir un conjunto es por comprensión, la misma consiste en indicar una
propiedad que deben cumplir sus elementos y sólo estos (para no generar ambigüedades).
Consideremos B como el conjunto de los números naturales que son pares y menores que
nueve, entonces
B = {n ∈ N : n < 9 y n = 2̇}
Como última observación recordemos que el conjunto que no tiene elementos se denomina
conjunto vacı́o, se lo denota usualmente { } o ∅.
Ejemplo 1.1.1. Determinar los siguientes conjuntos por extensión y por comprensión:
1. A es el conjunto formado por los cuadrados de los primeros diez números naturales.
2. B es el conjunto formado por las raı́ces cuadradas de los primeros cincuenta naturales
y que además sean naturales.
3. C es el conjunto formado por los naturales múltiplos de tres que además son menores
que diecisiete o múltiplos de cinco menores que treinta.
Solución:
1. Si deseamos determinar A por extensión, debemos elevar al cuadrado cada uno de
los diez primeros números naturales y el elemento obtenido pertenecerá al conjunto.
Realicemos los cálculos: 02 = 0, 12 = 1, 22 = 4, 32 = 9, 42 = 16, 52 = 25,
62 = 36, 72 = 49, 82 = 64, 92 = 81, 102 = 100. Obtenemos entonces que
Ahora bien, para determinar por comprensión A, debemos indicar que propiedad cum-
plen sus elementos
A = {x : x = n2 , n ∈ N, n ≤ 10}
2. Para determinar por extensión este conjunto podrı́amos probar aplicar raı́z cuadrada a
cada número entre 0 y 50 y ver si el resultado es un número natural. Luego de algunos
cálculos obtenemos que
B = {7, 6, 5, 4, 3, 2, 1, 0}
Para expresar B por comprensión indicamos las propiedades que se deben cumplir:
√
B = {x ∈ N : x = n, n ∈ N, n ≤ 50}
3. Al determinar C debemos tener en cuenta las dos condiciones, la primera es ser múlti-
plo de tres menor que diecisiete, la segunda es ser múltiplo de cinco y menor que
treinta. Entonces
C = {3, 6, 9, 12, 15, 5, 10, 20, 25}
Determinemos C por comprensión:
C = {x : x = 3n, n ≤ 5, n ∈ N o x = 5m, m ≤ 5, m ∈ N}
Más adelante veremos una forma mas sencilla de determinar este conjunto teniendo
en cuenta las operaciones entre conjuntos.
3
Veamos ahora una representación en modo gráfico de los conjuntos, es claro que en ciertos
casos manejar diferentes registros ayuda a la comprensión de la situación. Los conjuntos
pueden representarse gráficamente utilizando diagramas de Venn, la idea es bastante simple
y conocida,
A ⊂ B si ∀ x / x ∈ A ⇒ x ∈ B
Decir que dos conjuntos son iguales (A = B), es decir que tienen los mismos elementos,
por tanto todo elemento de A debe pertenecer a B y asimismo, todo elemento de B debe
pertenecer a A. En resumidas cuentas, A = B si A ⊂ B y B ⊂ A. En el caso que A ⊂ B
pero A ̸= B se dice que A está incluido estrictamente en B o que A es un subconjunto
propio de B y se denota A ⊊ B. En este caso todo elemento del conjunto A pertenece al
conjunto B, pero existe al menos un elemento b que pertenece al conjunto B tal que éste no
pertenece al conjunto A. En sı́mbolos
A ⊊ B si ∀ a ∈ A ⇒ a ∈ B y ∃ b ∈ B / b ∈
/A
4
A∪B
A B
Ejemplo 1.2.1. Sean A = {1, 5, 7, 14, 22, 31, 33} y B = {2, 4, 5, 6, 7, 20, 22, 30}.
Entonces A ∪ B = {1, 2, 4, 5, 6, 7, 14, 20, 22, 30, 31, 33}.
Ejemplo 1.2.2. Consideremos los siguientes conjuntos, A = {1, 3, 5, 7, 9}, B = {2, 4, 6, 8, 10}.
Entonces
A ∪ A = {1, 3, 5, 7, 9} ∪ {1, 3, 5, 7, 9} = A
A ∪ B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} = B ∪ A
1. A ∪ A = A
2. A ∪ B = B ∪ A
3. A ∪ ∅ = A
4. A ⊂ A ∪ B
5. B ⊂ A ⇐⇒ B ∪ A = A.
5
Intersección de Conjuntos
Sean A y B dos conjuntos, la intersección de A y B es un nuevo conjunto cuyos
elementos pertenecen a A y a B. En sı́mbolos matemáticos
A ∩ B = {x : x ∈ A y x ∈ B}
A∩B
A B
Ejemplo 1.2.4. Sean A = {1, 5, 7, 14, 22, 31, 33} y B = {2, 4, 5, 6, 7, 20, 22, 30}.
Entonces A ∩ B = {5, 7, 22}.
A ∩ B = {2, 3, 4} ⊂ {2, 3, 4, 5, 7, 9}
1. A ∩ A = A
2. A ∩ B = B ∩ A
3. A ∩ ∅ = ∅
4. A ∩ B ⊂ A
5. B ⊂ A ⇐⇒ A ∩ B = B
6
Diferencia de Conjuntos
Sean A y B dos conjuntos, se llama diferencia de A y B al conjunto que tiene como
elementos los que pertenecen al conjunto A y no pertenecen al conjunto B.
Simbólicamente se denota
A \ B = {x / x ∈ A y x ∈
/ B}
A\B
A B
1. A \ A = ∅
2. A \ ∅ = A
3. ∅ \ A = ∅
4. A \ (B ∪ C) = (A \ B) \ C
Complemento
Si A ⊂ B se define el complemento de A respecto de B como el conjunto cuyos
elementos pertenecen a B y no pertenecen a A. Simbólicamente,
AC
B = {x : x ∈ B y x ̸∈ A}
3. Considerar los conjuntos A = {1, 2}, B = {{1}, {2}}, C = {{1}, {1, 2}}, D =
{{1}, {2}, {1, 2}}. Indica si son verdaderas o falsas las siguientes afirmaciones justifi-
cando la respuesta
a. A=B f. B ⊂ C
b. A⊂B g. B ⊂ D
c. A⊂C
d. A∈C h. B ∈ D
e. A⊂D i. A ∈ D
a. 3 ∈
/C e. C ⊂ D
b. Si x ∈ A ⇒ x ≤ 5 f. D ⊂ A
c. Si x ≤ 8 ⇒ x ∈ B g. A ∩ B = C
d. Si x ∈ B ⇒ x ≥ 2 h. B ∩ C = B
a. De los estudiantes que no repiten ni tienen todos los textos, ¿cuántos tienen
previas?
b. De todo el grupo, ¿cuántos tienen previas?
8
Capı́tulo 2
Número real
Los números reales son básicamente aquellos que sirven para “hacer cálculo”. Siendo un
tanto esquemáticos podemos decir que existen dos enfoques, en cierta forma contrapuestos,
para abordar la definición:
La definición axiomática;
La definición constructiva.
En estas notas nos inclinaremos por la segunda alternativa, y no nos preocuparemos dema-
siado por los aspectos formales de ésta. En primer lugar, consideraremos que los números
naturales N = {0, 1, 2, 3, . . .} son las piezas fundamentales a partir de las cuales vamos a
construir todos los demás “números” (parafraseando a Leopold Kronecker, asumiremos los
naturales como dados por Dios, y construiremos todo lo demás).
9
10
piensen lógicamente!): nm
Q= : m, n ∈ Z, n ̸= 0 .
o
n
Detengámonos un momento y observemos que con los números racionales podemos realizar
tranquilamente las operaciones de suma, multiplicación, resta y división (simpre que no
tratemos de dividir entre cero) y éstas cumplirán todas las propiedades usuales a las que
estamos acostumbrados. Un sistema numérico con esas propiedades es lo que los matemáticos
denominan cuerpo. La pregunta serı́a ¿por qué no detenernos acá? La respuesta se puede
rastrear al menos hasta la antigua Grecia, y fue un pitagórico el primero en darse cuenta de
que la diagonal de un cuadrado de lado 1 tiene una longitud que no es racional (WTF!?)1 .
Dicho en términos más modernos, la raı́z cuadrada de 2 no es un número racional.
√
Proposición 2.1.1. 2 no es racional. O, equivalentemente, ∄ q ∈ Q tal que q 2 = 2.
Demostración.
Sea
m
m, n ∈ Z, con n ̸= 0.
q=
n
Podemos suponer que la fracción está reducida, i.e.2 que m y n no tienen factores en común,
con lo cual m2 y n2 tampoco tendrán factores en común. Entonces,
m2
q2 = =2
n2
si y solo si m2 = 2 y n = 1, pero no hay ningún entero cuyo cuadrado sea 2.
Siguiendo con nuestra construcción podrı́amos considerar entonces los números cons-
tructibles (aquellos que se pueden construir con regla y compás). Y por qué no, los números
que son raı́ces de polinomios con coeficientes racionales, que se llaman números algebraicos.
También están los números que se llaman computables... y ainda mais. Cada uno de los
conjuntos numéricos mencionados anteriormente es un cuerpo más grande que el anterior,
pero si seguimos ası́ no vamos a llegar muy lejos. Ası́ que vamos a intentar algo radicalmente
diferente.
1
Del inglés what a terrible fact!
2
Abreviación de la locusión latina id est que significa “esto es”.
11
Expresiones decimales
A todo número racional q ∈ Q lo podemos expresar usando decimales:
q = ±q0 .q1 q2 q3 · · ·
donde
q0 ∈ N, qi ∈ {0, 1, 2, . . . , 9}, i = 1, 2, . . .
De manera que podemos escribir
q = ± q0 + q1 10−1 + q2 10−2 + . . .
notemos que x0 ∈ Z es el único entero de manera que x ∈ [x0 , x0 + 1). Aprovechamos para
dar la siguiente definición:
Definición 2.1.4. Dado un número real x cualquiera siempre existe un único entero
x0 tal que x ∈ [x0 , x0 + 1). Tal x0 se llama parte entera de x.
10(x − x0 ).
3 4
En el dibujo tenemos x ∈ x0 + 10
, x0 + 10
, ası́ que
x = x0 + 3 × 10−2 + · · ·
x ≈ x0 ,3
Por inducción podemos hallar todos los dı́gitos decimales de x.
√
Ejemplo √2.1.5. Veamos cómo√funciona esto en el caso de 2. Es fácil ver que que la parte
entera de 2 es 1 ya que 1 < 2 < 2. Dividimos [1, 2] en 10 partes iguales:
[1, 1,1), [1,1, 1,2), · · · , [1,9, 2).
Tenemos que √
2 ∈ [1,4, 1,5) ya que (1,4)2 < 2 < (1,5)2 ,
con lo cual x1 = 4. Análogamente, podemos continuar con el mismo razonamiento,
2.2. Desigualdades
El orden en N se puede extender a un orden en R definiendo los reales positivos como las
expresiones decimales de la forma x0 .x1 x2 . . .. Diremos que x < y si 0 < y − x para x, y ∈ R.
Denotaremos por R+ al conjunto de los reales positivos,
R+ = {x ∈ R : x > 0} = {x0 .x1 . . . : x0 ∈ N, xi ∈ {1, . . . , 9} para i ⩾ 1}
x < 0, x > 0 o x = 0
De la propiedad 4 se pueden deducir las bien conocidas reglas de que “más por más
es más y menos por más es menos”. Supongamos, por ejemplo, que a y b son dos reales
positivos. Poniendo x = 0, y = a y z = b en 4, obtenemos que 0 = 0b < ab. Todas las demás
propiedades conocidas, se deducen de las propiedades anteriores. Dejamos como ejercicio
demostrar que si 0 < x entonces 0 < x1 .
Valor absoluto
La función valor absoluto | · | : R → R está definida por
x si x > 0
x ∈ R 7−→ |x| = −x si x < 0
0 si x = 0
|y − x|
x 0 y
|x| |y|
14
x < y ⇒ xn < y n ,
por inducción en n.
Si n = 1 es obvio.
Multiplicando la desigualdad x < y de ambos lados por xn , y usando que xn < y n , se tiene
que
xn+1 = xn x < xn y < y n y = y n+1 .
|x + y| ⩽ |x| + |y|
Demostración.
x ⩽ |x|
⇒ x + y ⩽ |x| + |y|
y ⩽ |y|
−x ⩽ |x|
⇒ −x − y ⩽ |x| + |y|
−y ⩽ |y|
⇒ |x + y| ⩽ |x| + |y|.
2.3. Completitud
R tiene una estructura algebraica que se denomina cuerpo: podemos sumar, restar, mul-
tiplicar y dividir usando todas las propiedades usuales.
15
¿Qué es un cuerpo?
Un cuerpo es un conjunto, usualmente denotado por K, en el que están definidas ope-
raciones de “suma” + y “multiplicación” · de manera que se verifican las siguientes
propiededes (axiomas de cuerpo):
Asociatividad : (a + b) + c = a + (b + c)
(a · b) · c = a · (b · c)
Conmutatividad : a + b = b + a
a·b=b·a
Distributiva: a · (b + c) = a · b + a · c
Vamos a definir ahora unos conjuntos especiales, que serán fundamentales para todo lo
que vamos a desarrollar más adelante.
16
Intervalos
Definición 2.3.1.
Intervalos cerrados: [a, b] = {x ∈ R : a ⩽ x ⩽ b} para a, b ∈ R.
Intervalos abiertos: (a, b) = {x ∈ R : a < x < b} para a, b ∈ R o a = −∞, o b = +∞.
En particular, (−∞, +∞) = R
Intervalos semiabiertos: (a, b], [a, b) para a, b ∈ R puediendo ser también a = −∞ en
el primer caso y b = +∞ en el segundo.
(a, b] = {x ∈ R : a < x ⩽ b}
[a, b) = {x ∈ R : a ⩽ x < b}
Es claro que tanto el supremo como el ı́nfimo, si existen, son únicos debido a la ley de
tricotomı́a.
S = (a, b) ⇒ b es el supremo de S
Demostración. 1
a
∈ R+ ⇒ ∃n ∈ N tal que 1
a
< n ⇒ 1
n
< a (multiplicando la
a
desigualdad por n ).
Ejemplo 2.3.4. Todo conjunto de enteros que está acotado superiormente tiene máximo.
Una vez demostrado el teorema para el supremo (no veremos esta demostración), para
ver lo análogo con el ı́nfimo basta considerar el conjunto −S = {−x : x ∈ S}. Si S es
acotado inferiormente, −S será acotado superiormente, tendrá un supremo, y tendremos
ı́nf(S) = − sup(−S).
S ⊂ [ı́nf(S), sup(S)]
√ √
Ya vimos que 2 ∈ / Q, ahora vamos a ver que 2 ∈ R usando lo anterior, es decir, vamos
a probar que existe un real que elevado al cuadrado es 2. De hecho vamos a probar que para
todo real positivo existe una raı́z cuadrada (para 0 es obvio).
Teorema 2.3.6. Para todo real positivo b existe un real a tal que a2 = b.
S = x ∈ R : x2 < b
Se tiene que
S ̸= ∅ pues 0 ∈ S.
Si x ∈ S, entonces x2 < b < (b + 1)2 , de donde x2 < (b + 1)2 , por lo cual x < b + 1, y b + 1
es cota superior de S.
b − a2 1 b − a2 2a + 1
∈ R+ ⇒ ∃ n ∈ N tal que < ⇒ < b − a2 .
2a + 1 n 2a + 1 n
Por lo tanto 2
1
a+ < a2 + b − a2 = b,
n
1
y a+ n
∈ S, lo cual es absurdo.
Análogamente, podemos ver que a2 no puede ser mayor que b ya que tomando n ∈ N
suficientemente grande tendremos que (a− n1 )2 > b. Ası́ que por la ley de tricotomı́a llegamos
a que a2 = b.
Ejercicio de parcial
Entonces
Solución.
2n+1 − 1
A= : n ∈ Z, n ≥ 0
2n
n+1
2 1
= − n : n ∈ Z, n ≥ 0
2n 2
1
= 2 − n : n ∈ Z, n ≥ 0
2
Dado que 21n > 0 para todo n ≥ 0, tenemos que 2 − 21n < 2 para todo n ≥ 0. Obtenemos,
entonces, que 2 es una cota superior de A. Veamos que 2 es el supremo de A. Para ello,
queremos probar que 2 es la menor cota superior de A, es decir dado ϵ > 0, hay que probar
que 2 − ϵ no es cota superior de A. Tomamos N > 0 tal que 21N < ϵ y se cumple que
1 1
2+ <2+ϵ ⇒ 2−ϵ<2−
2N 2N
Entonces x = 2 − 21N ∈ A pero 2 − ϵ < x por lo que 2 − ϵ no es cota superior de A. Por lo
tanto, sup(A) = 2 y, como 2 ∈/ A, conluı́mos que A tiene supremo pero no máximo. Luego,
la respuesta correcta es C).
20
Ejercicio de parcial
Solución.
Integración
Los matemáticos griegos también usaron el mismo método con éxito para calcular los
volúmenes de sólidos tales como las esferas, los cilindros o los conos, aproximándolos por
poliedros.
El cálculo integral moderno apareció al final del siglo XVII, cuando el matemático y
filósofo alemán Gottfried Wilhelm Leibniz (1646–1716) descubrió un vı́nculo sorprendente
entre la integración y la derivación 2 . Sin embargo, la definición de Leibniz carecı́a de una
1
El método de exhaución fue introducido por Eudoxo de Cnido (390–337 a.C.) y completado por Ar-
quı́medes de Siracusa (287–212 a. C.), quienes lo usaron para calcular múltiples áreas y volúmenes.
2
Este vı́nculo es el objeto del teorema fundamental del cálculo, que veremos más adelante en este curso.
En este capı́tulo, sólo nos interesaremos por el problema que consiste en definir rigurosamente la noción de
área.
21
22
fundamentación rigurosa, pues le faltaba una definición precisa de los números reales. (De
hecho, las nociones fundamentales de ı́nfimo y de supremo, ası́ como el axioma de completi-
tud, fueron introducidos recién en la primera mitad del siglo XIX.) La primera formalización
rigurosa de la teorı́a de la integración fue dada por el matemático alemán Bernhard Riemann
(1826–1866), y es esencialmente ésta la que vamos a presentar en este capı́tulo 3 .
Por área algebraica, se entiende el número real (positivo, negativo o nulo) obtenido contando
con un signo positivo las áreas por encima del eje x, y con un signo negativo las áreas por
debajo del eje x, como indicado en la figura anterior 4 . En matemática, el área algebraica
de la región ubicada entre el eje x y la gráfica de f se llama integral de la función f en el
intervalo [a, b], y el proceso que permite determinar dicha área se llama integración.
Formalmente, cada par de aproximaciones (una por defecto y otra por exceso) es construido
a partir de una partición P = {a, a1 , a2 , . . . , an−1 , b} del intervalo [a, b] (Sección 3.1.2), cuyos
puntos definen los lı́mites horizontales de los rectángulos que usaremos para construir dichas
aproximaciones. Considerando particiones cada vez más finas del intervalo [a, b], se obtienen
aproximaciones cada vez más precisas del área deseada, la cual puede ser definida como el
”lı́mite”(Sección 3.1.4) de las áreas de todas las aproximaciones ası́ definidas.
Notación
En lo siguiente, escribiremos sistemáticamente las particiones P del intervalo [a, b]
ordenando sus elementos de modo creciente; es decir: de la forma
Intuitivamente, una partición P = {a0 , a1 , . . . , an } del intervalo [a, b] sirve para descom-
poner dicho intervalo en una unión finita de subintervalos esencialmente disjuntos6 :
[a, b] = [a0 , a1 ] ∪ [a1 , a2 ] ∪ · · · [an−1 , an ]
Definición 3.1.2 (Orden entre las particiones). Las particiones de un intervalo [a, b]
están ordenadas por el orden de la inclusión. Ası́, dadas dos particiones P y Q del
intervalo [a, b] tales que P ⊂ Q, se dice que Q es más fina que P , o que P es más
gruesa de Q.
5
El área algebraica de un rectángulo de ancho l < 0 (positivo) y de altura L ∈ R (algebraica) es el
producto l × L. Este producto es positivo, negativo o nulo según si la altura algebraica L es positiva,
negativa o nula (siendo el ancho positivo, por convención).
6
Es decir: subintervalos que no se intersectan, salvo quizás en sus puntos extremos.
24
Observación 3.1.3. La relación de inclusión entre las particiones del intervalo [a, b] es una
relación de orden parcial, en el sentido de que es una relación
reflexiva: P ⊂ P
transitiva: si P ⊂ Q y Q ⊂ R, entonces P ⊂ R
antisimétrica: si P ⊂ Q y P ⊂ Q, entonces P = Q.
para todas las particiones P, Q, R ⊂ [a, b]. Por otro lado, esta relación no es una relación
de orden total (al contrario de la relación de orden usual sobre los números reales7 ), pues
existen pares de particiones no comparables, como lo muestra el siguiente ejemplo:
Ejemplo 3.1.4. Sean las siguientes cuatro particiones del intervalo [2, 8]:
Se observa que P0 = {2, 8} es la partición más gruesa del intervalo [2, 8], pues está incluida
en cualquier otra partición de [2, 8]. En particular, está incluida en las particiones P1 , P2
y P3 . Por otro lado, las particiones P1 y P2 no son comparables, pues P1 ̸⊂ P2 y P2 ̸⊂ P1
(aunque tengan tres elementos comunes: 2, 5 y 8). Finalmente, se observa que la partición
P3 = P1 ∪ P2 es más fina que las particiones P0 , P1 y P2 , pues P0 ⊂ P1 ⊂ P3 y P0 ⊂ P2 ⊂ P3 .
Observación 3.1.5. Dado un intervalo cerrado [a, b] ⊂ R (con a < b), se observa
más generalmente que el conjunto P0 = {a, b} es una partición del intervalo [a, b] : es
la partición más gruesa de [a, b], pues P0 ⊂ P para toda partición P de [a, b].
Dadas dos particiones P1 y P2 de [a, b], su unión P1 ∪ P2 también es una partición de
[a, b], que es más fina que P1 y P2 a la vez: P1 ⊂ P1 ∪ P2 y P2 ⊂ P1 ∪ P2 . Se dice que
la unión P1 ∪ P2 es el refinamiento común de las dos particiones P1 y P2 .
∥P ∥ = maxi=0,...,n−1 (ai+1 − ai )
7
Recordemos que para todos los números reales x e y, tenemos que x ≤ y o y ≤ x (“o” inclusivo)
25
Observación 3.1.7. Dadas dos particiones P y Q del intervalo [a, b], es claro que P ⊂ Q
implica que ∥Q∥ ≤ ∥P ∥, pero el recı́proco no se cumple en general (véase el ejercicio más
abajo).
Ejercicio 3. 1. Construir dos particiones P y Q del intervalo [0, 1] que no sean compara-
bles (es decir: P ̸⊂ Q y Q ̸⊂ P ) y tales que ∥Q∥ < ∥P ∥
2. Dada una partición P de un intervalo [a, b], demostrar que para todo ϵ > 0, existe una
partición Q ⊂ [a, b] tal que P ⊂ Q (es decir: Q es más fina que P ) y ∥Q∥ < ϵ.
Notación
Dado un subintervalo [a1 , b1 ] ⊂ [a, b] (con a ≤ a1 < b1 ≤ b), se observa que el
conjunto {f (x) : x ∈ [a1 , b1 ] ⊂ R} está acotado inferiormente por k∗ y superiormente
por k ∗ . Por el axioma de completitud, este conjunto tiene ı́nfimo y supremo, que
escribiremos:
ı́nf(f, [a1 , b1 ]) = inf {f (x) : x ∈ [a1 , b1 ]}
sup(f, [a1 , b1 ]) = sup {f (x) : x ∈ [a1 , b1 ]}
Demostración.
En cada subintervalo [ai , ai+1 ] (con i = 0, . . . , n − 1), la función f toma valores entre
los dos números ı́nf(f, [ai , ai+1 ]) y sup(f, [ai , ai+1 ]). Ası́, en dicho subintervalo, se puede
aproximar el área algebraica de la región ubicada entre el eje x y la gráfica de f por las
áreas de los siguientes dos rectángulos:
un rectángulo de ancho ai+1 − ai > 0 y de altura algebraica ı́nf(f, [ai , ai+1 ]) ∈ R, cuya
área algebraica es (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) (aproximación por defecto)
un rectángulo de ancho ai+1 − ai > 0 y de altura algebraica sup(f, [ai , ai+1 ]) ∈ R, cuya
área algebraica es (ai+1 − ai ) · sup(f, [ai , ai+1 ]) (aproximación por exceso)
Sumando estas dos familias de números para todo i = 0, . . . , n − 1, se obtienen las siguientes
dos aproximaciones del área algebraica de la región que nos interesa:
27
Definición 3.1.9 (Suma inferior y suma superior respecto a una partición.). Dada
una partición P = {a0 , a1 , . . . , an } del intervalo [a, b], definen la suma inferior S∗ (f, P )
y la suma superior S ∗ (f, P ) de la función f respecto a la partición P por:
n−1
X
S∗ (f, P ) = (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) (suma inferior de f respecto a P )
i=0
n−1
X
∗
S (f, P ) = (ai+1 − ai ) · sup(f, [ai , ai+1 ]) (suma superior de f respecto a P )
i=0
Intuitivamente, la suma inferior S∗ (f, P ) constituye una aproximación por defecto del área
algebraica de la región ubicada entre el eje x y la gráfica de la función f , mientras la suma
superior S ∗ (f, P ) constituye una aproximación por exceso de dicha área. Se demuestra que:
S∗ (f, P ) ≤ S ∗ (f, P )
Ejercicio de parcial
Solución.
3
X
S∗ (f, P ) = ı́nf(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
= ı́nf(f, [−1, 0]) ·(0 − (−1)) + ı́nf(f, [0, 1]) ·(1 − 0) + ı́nf(f, [1, 2]) ·(2 − 1))
| {z } | {z } | {z }
f (0) f (0) f (1)
= (−1) · 1 + (−1) · 1 + 0 · 1
= −2
Donde ı́nf(f, [−1, 0]) = f (0) ya que f es decreciente en el intervalo [−1, 0], ı́nf(f, [0, 1]) =
f (0) ya que f es creciente en el intervalo [0, 1] y ı́nf(f, [1, 2]) = f (1) ya que f es creciente
en el intervalo [1, 2].
Ejercicio 5. Sea f : [0, 4] → R la función definida por f (x) = 4x − x2 .
2. Demostrar que f es monótona creciente en [0, 2] y monótona decreciente en [2, 4]. (Su-
gerencia: se puede estudiar el signo de la derivada de f , o bien demostrar el resultado
directamente, observando que f (x) = 4 − (x − 2)2 .)
4. Calcular las sumas inferiores S∗ (f, P )y las sumas superiores S ∗ (f, P ) para las siguientes
particiones del intervalo [0, 4], ası́ como las normas de dichas particiones:
P0 = {0; 4}
P1 = {0; 2; 4}
P2 = {0; 1; 2; 3; 4}
P3 = {0; 0, 5; 1; 1, 5; 2; 2, 5; 3; 3, 5; 4}
Más generalmente, se puede demostrar que cuando dos particiones P y Q del intervalo
[a, b] son tales que P ⊂ Q (es decir: Q es más fina que P), las sumas S∗ (f, P ) y S ∗ (f, P )
inducidas por la partición más fina siempre constituyen un mejor par de aproximaciones del
área deseada que las sumas S∗ (f, P ) y S ∗ (f, P ) inducidas por la partición más gruesa:
Formalmente:
suponiendo que el nuevo punto a′ agregado por la partición Q se interpone entre los puntos
ak y ak+1 de la partición inicial P (para algún k = 0, . . . , n − 1). Ası́, la suma inferior de la
función f respecto a la partición P se puede descomponer del modo siguiente
n−1
X
S∗ (f, P ) = (ai+1 − ai ) · inf(f, [ai , ai+1 ])
i=0
= Si<k + (ak+1 − ak ) · inf(f, [ak , ak+1 ]) + Si>k
agrupando todos los sumandos correspondientes a los ı́ndices i < k en la suma Si<k , y todos
los sumandos correspondientes a los ı́ndices i > k en la suma Si>k . Ası́ obtenemos que
observando que inf(f, [ak , ak+1 ]) ≤ inf(f, [ak , a′ ]) y inf(f, [ak , ak+1 ]) ≤ inf(f, [a′ , ak+1 ]) por el
lema 3.1.8. De modo análogo, se demuestra que
usando de nuevo el lema 3.1.8, pero con los supremos. Ahora, consideremos el caso general,
donde P y Q son dos particiones tales que P ⊂ Q, pero de tamaños cualesquiera. Como P y
Q son conjuntos finitos tales que P ⊂ Q, se puede escribir Q = P ∪ a′1 , . . . , a′p para algún
S∗ (f, P ) ≤ S∗ (f, P ∪{a′1 }) ≤ S∗ (f, P ∪{a′1 , a′2 }) ≤ · · · ≤ S∗ (f, P ∪ a′1 , a′2 , . . . , a′p ) ≤ S∗ (f, Q)
S ∗ (f, P ) ≥ S ∗ (f, P ∪{a′1 }) ≥ S ∗ (f, P ∪{a′1 , a′2 }) ≥ · · · ≤ S ∗ (f, P ∪ a′1 , a′2 , . . . , a′p ) ≥ S ∗ (f, Q)
Una consecuencia importante de la proposición anterior es que todas las sumas inferiores
S∗ (f, P ) (las “aproximaciones por defecto”) son menores o iguales a todas la sumas supe-
riores S ∗ (f, P ) (las “aproximaciones por exceso”), independientemente de las particiones P
y Q:
Proposición 3.1.12. Para todas las particiones P, Q ⊂ [a, b], tenemos que:
S∗ (f, P ) ≤ S ∗ (f, Q)
Demostración.
Los lectores habrán observado que nunca definimos formalmente lo que es el “área alge-
braica de la región ubicada entre el eje x y la gráfica”, y que tampoco usamos esta noción
para demostrar los resultados anteriores. Hasta ahora, la noción de área es una noción
puramente intuitiva, sin definición formal, que sólo usamos como un hilo conductor para
definir (formalmente) las sumas inferiores y superiores. Al final, se obtienen dos conjuntos
de “aproximaciones”:
9
Formalmente, la demostración del caso general se efectúa por inducción sobre el número p de elementos
agregados, usando el caso particular para pasar de p a p + 1 en el paso inductivo (ejercicio).
31
el conjunto A∗ (f ) = {S∗ (f, P ) : P partición de [a, b]} formado por todas las sumas
inferiores de la función f , que se pueden considerar como aproximaciones por defecto
del área deseada (y todavı́a no definida)
conjunto A∗ (f ) = {S ∗ (f, P ) : P partición de [a, b]} formado por todas las sumas supe-
riores de la función f , que se pueden considerar como aproximaciones por exceso del
área deseada.
Además, demostramos (Proposición 3.1.12) que todos los elementos del conjunto A∗ (f ) son
menores o iguales a todos los elementos del conjunto A∗ (f ):
En particular:
Ası́:
Proposición 3.1.14.
I∗ (f ) ≤ I ∗ (f )
En lo siguiente, veremos que cuando la función f es suficientemente regular (lo que será el
caso para la gran mayorı́a de las funciones que consideraremos en este curso), los dos números
I ∗ (f ) y I ∗ (f ) son iguales. En este caso, podremos considerar que el número I ∗ (f ) = I ∗ (f )
constituye una definición del área deseada. En los otros casos, consideraremos que la región
ubicada entre el eje x y la gráfica de f no tiene área bien definida. Formalmente:
I∗ (f ) = I ∗ (f )
Cuando es el caso, este número se llama la integral de la función f en el intervalo [a, b],
y se escribe Z b Z b
f o bien f (x)dx
a a
Recordemos que, por definición, sólo las funciones acotadas pueden ser integrables.
R
En particular, el sı́mbolo viene de la caligrafı́a de la letra s11 en el siglo XVII.
En lo que sigue, usaremos con frecuencia los siguientes dos criterios para demostrar que
una función acotada es integrable:
(2) Para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que
Demostración.
(2) ⇒ (1) Como ambos números I∗ (f ) e I ∗ (f ) se intercalan entre las sumas inferior
S∗ (f, P ) y superior S ∗ (f, P ) de la función f para toda partición P ⊂ [a, b], la condición (2)
implica que
I − ϵ < I∗ (f ) < I + ϵ e I − ϵ < I ∗ (f ) < I + ϵ
para todo ϵ > 0. Por lo tanto, tenemos que I∗ (f ) = I ∗ (f ) = I .
Observación 3.1.19. El criterio anterior es un criterio de integración, que sirve (1) para
determinar si la función considerada es integrable y (2) para determinar el valor de su
integral. A veces, sólo se necesita determinar si la función considerada es integrable, sin
conocer el valor de su integral. En este caso, se usa el siguiente criterio de integrabilidad:
(2) Para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que
0 ≤ S ∗ (f, P ) − S∗ (f, P ) ≤ ϵ
Demostración.
(2) ⇒ (1) Como 0 ≤ I ∗ (f ) − I∗ (f ) ≤ S ∗ (f, P ) − S∗ (f, P ) para toda partición P ⊂ [a, b],
la condición (2) implica que 0 ≤ I ∗ (f ) − I∗ (f ) < ϵ para todo ϵ > 0. Por lo tanto, I∗ (f ) =
I ∗ (f ).
Ejemplo 3.1.21 (Integración de una función constante.). Dados un intervalo cerrado [a, b]
(con a < b) y un número k ∈ R, se considera la función constante f : [a, b] → R definida por
f (x) = k
para todo k ∈ R.
35
Por lo tanto, tenemos que A∗ (f ) = A∗ (f ) = {(b − a)k} (todas las aproximaciones son
iguales), de tal modo que I∗ (f ) = I ∗ (f ) = (b − a)k. Ası́, la función f es integrable en [a, b] y
Z b Z b
f (x)dx = kdx = (b − a)k
a a
Rb Rb
Observación 3.1.22. Como era de esperar, la integral a f (x)dx = a kdx de la función
constante f (x) = k en el intervalo [a, b] es igual al área algebraica (b−a)×k de un rectángulo
de ancho b − a > 0 y de altura algebraica k ∈ R.
En la Sección 3.3 y en resto del curso, veremos otros muchos ejemplos (menos triviales)
de funciones integrables cuyas integrales se pueden calcular sencillamente en algunos casos.
Sin embargo, también existen funciones no integrables, ası́ como lo muestra el siguiente
ejemplo:
y
n−1
X
∗
S (f, P ) = (ai+1 − ai ) · 1 = an − a0 = 1
i=0
y eso para todas las particiones P ⊂ [0, 1]. Por lo tanto, tenemos que I∗ (f ) = 0 e I ∗ (f ) = 1,
lo que demuestra que la función de Dirichlet no es integrable, aunque esté acotada.
Observación 3.1.24. Intuitivamente, la función de Dirichlet (que alterna entre los valo-
res 0 y 1 infinitas veces en cada subintervalo de [0, 1]) es tan irregular que el método de
aproximación por rectángulos no logra capturar el área de la región correspondiente12 .
12
Sin embargo, la teorı́a de la integración de Lebesgue permite definir y calcular la integral de la función
de Dirichlet, que vale 0. (Intuitivamente, este resultado extraño viene de que hay infinitamente más números
irracionales en el intervalo [0, 1] que números racionales, aunque parezcan uniformemente mezclados).
37
b−a
= · (f (b) − f (a))
n
ϵ
≤ · (f (b) − f (a)) = ϵ
f (b) − f (a)
(véase figura anterior). Ası́ para cada ϵ > 0, demostramos que existe una partición P ⊂ [a, b]
tal que 0 ≤ S ∗ (f, P ) − S∗ (f, P ) < ϵ. Por la Proposición 3.1.20, se deduce que la función f
es integrable.
Ejercicio 6. Usando como modelo la demostración del caso donde la función f es monótona-
creciente, redactar la demostración del caso donde f es monótona decreciente, modificando
el razonamiento de modo adecuado.
El resultado anterior expresa que el área algebraica de la región ubicada entre el eje x
y la gráfica de la función f siempre está bien definida cuando dicha función es monótona
(creciente o decreciente). Sin embargo, este resultado no explica como calcular dicha área.
En la práctica, el método de integración depende del ejemplo considerado. Aquı́ hay uno:
Ejemplo 3.1.26 (Integración de la función f (x) = x2 ). Dado un número a > 0, queremos
integrar la función f : [0, a] → R definida por f (x) = x2 , cuya gráfica es un arco de parábola:
Como la función f (x) = x2 es monótona creciente en el intervalo [0, a], es integrable por
el teorema anterior. Para determinar el valor de su integral, necesitaremos el siguiente lema:
38
Lema 3.1.27. Para todos los números reales x e y tales que 0 ≤ x ≤ y, tenemos que
y 3 − x3
(y − x)x2 ≤ ≤ (y − x)y 2
3
3x2 = x2 + x2 + x2 ≤ x2 + xy + y 2 ≤ y 2 + y 2 + y 2 = 3y 2
(pues 0 ≤ x ≤ y). Multiplicando los miembros extremos y el miembro central de las des-
igualdades anteriores por el número y − x ≥ 0, se deduce que:
Ahora, consideremos una partición cualquiera P = {a0 , a1 , . . . , an } del intervalo [0, a]. En
cada uno de los subintervalos [ai , ai+1 ] (i = 0, . . . , n − 1), la función f es monótona creciente,
de tal modo que ı́nf(f, [ai , ai+1 ]) = f (ai ) = a2i , mientras sup(f, [ai , ai+1 ]) = f (ai+1 ) = a2i+1 .
Entonces, tenemos que
n−1 n−1 3
a3 a3n a30 a3
X X ai+1
S∗ (f, P ) = (ai+1 − ai ) · a2i ≤ − i = − =
i=0 i=0
3 3 3 3 3
(usando de vuelta el lema anterior para la desigualdad central). Ası́ demostramos que
a
S∗ (f, P ) ≤ ≤ S ∗ (f, P )
3
para todas las particiones P del intervalo [a, b]. Pasando al supremo (en la desigualdad
izquierda) y al ı́nfimo (en la desigualdad derecha), se deduce que:
a
I∗ (f ) ≤ ≤ I ∗ (f )
3
Como la función f es integrable, tenemos que I∗ (f ) = I ∗ (f ). Luego:
Z a Z a
a3
f (x)dx = x2 dx =
0 0 3
En particular:
39
Ejercicio 7. Modificar el razonamiento del ejemplo anterior para demostrar más general-
mente que para todos los números a y b tales que 0 ≤ a < b, tenemos que
Z b
b 3 a3
x2 dx = −
a 3 3
Ejercicio 8 (Integral de la función identidad). En un intervalo cerrado [a, b] (con a < b), se
considera la función f : [a, b] → R definida por f (x) = x para todo x ∈ [a, b].
y 2 −x2
1. Demostrar que para todos los números x ≤ y, tenemos que (y−x)x ≤ 2
≤ (y−x)y.
(Sugerencia: usar la identidad notable y 2 − x2 = (y − x)(y + x).)
2. Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Usando el resul-
2 2
tado demostrado en 1, demostrar que S∗ (f, P ) ≤ b −a 2
≤ S ∗ (f, P ). (Sugerencia: usar
la misma técnica que en el ejemplo 3.1.26).
b2 −a2
3. Deducir de lo anterior que I∗ (f ) ≤ 2
≤ I ∗ (f ).
Rb b2 −a2
4. Usando la monotonı́a de la función f , concluir que f es integrable y a
f (x)dx = 2
.
5. En el caso donde 0 < a < b, se observa que la región ubicada entre el eje x y la gráfica
de la función f es un trapecio rectángulo. Calcular el área de dicho trapecio, y verificar
que el resultado obtenido es consistente con el resultado del ı́tem 4.
3.2.1. Monotonı́a
Una propiedad fundamental de la integral es que respeta el orden entre dos funciones:
40
Demostración. Sea P = {a0 , a1 , . . . .an } una partición cualquiera del intervalo [a, b]. En
cada subintervalo [ai , ai+1 ] (i = 0, . . . .n − 1), se observa que ı́nf(f, [ai , ai+1 ]) ≤ f (x) ≤ g(x)
para todo x ∈ [ai , ai+1 ], de tal modo que ı́nf(f, [ai , ai+1 ]) ≤ ı́nf(g, [ai , ai+1 ]) (pasando al
ı́nfimo). A partir de la desigualdad anterior, se deduce que
n−1
X n−1
X
S∗ (f, P ) = (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) ≤ (ai+1 − ai ) · ı́nf(g, [ai , ai+1 ]) = S∗ (g, P )
i=0 i=0
y eso para toda partición P ⊂ [a, b]. Pasando al supremo entre todas las particiones P ⊂
[a, b], obtenemos que I∗ (f ) ≤ I∗ (g). Pero como ambas funciones f y g son integrables en el
intervalo [a, b], esto quiere decir que
Z b Z b
f = I∗ (f ) ≤ I∗ (g) = g
a a
En la Sección 3.2.2 (Linealidad), veremos que la diferencia entre ambas integrales también
es igual a la integral de la diferencia:
Z b Z b Z b
g− f= (g − f )
a a a
41
Una consecuencia obvia de la proposición anterior es que toda función positiva o nula
(resp. negativa o nula) en el intervalo [a, b] tiene integral positiva o nula (resp. negativa o
nula):
Demostración. Ejercicio.
Ejercicio 9. Usando la Proposición 3.2.1 y el resultado demostrado en el Ejemplo 3.1.21,
demostrar que si una función integrable f : [a, b] → R está acotada por dos números k∗ , k ∗ ∈
R tales que
k∗ ≤ f (x) ≤ k ∗
para todo x ∈ R entonces: Z b
(b − a)k∗ ≤ f ≤ (b − a)k ∗
a
Se interpretará geométricamente el resultado.
3.2.2. Linealidad
Observación 3.2.5 (Vı́nculo con el álgebra lineal). Desde el punto de vista del álgebra
lineal, el teorema anterior expresa que:
(a) el conjunto de todas las funciones integrables es un subespacio vectorial del espacio
vectorial13 formado por todas las funciones f : [a, b] → R.
(Se puede demostrar que los tres espacios son de dimensión infinita.)
Como la demostración del Teorema 3.2.4 es algo larga, vamos a dividirla en múltiples
resultados intermedios.
Lema 3.2.6. Sean f, g : [a, b] → R dos funciones acotadas cualesquiera. Entonces, para todo
subintervalo [a′ , b′ ] ⊂ [a, b], tenemos que:
Demostración.
1. Tenemos que ı́nf(f, [a′ , b′ ]) ≤ f (x) y ı́nf(g, [a′ , b′ ]) ≤ g(x) para todo x ∈ [a′ , b′ ], de tal
modo que
ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ]) ≤ f (x) + g(x)
para todo x ∈ [a′ , b′ ]. Ası́, el número ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ]) es una cota inferior
de la función f + g en el subintervalo [a′ , b′ ]. Por lo tanto:
pues ı́nf(f +g, [a′ , b′ ]) es la cota inferior más grande de la función f +g en el subintervalo
[a′ , b′ ].
Ejercicio 10. Usando como modelo la demostración del ı́tem 1 del lema anterior, redactar
la demostración del ı́tem 2, modificando el razonamiento de modo adecuado.
43
Como el número I∗ (f ) es el supremo de todas las sumas inferiores S∗ (f, P ), existe una
partición P1 del intervalo [a, b] tal que I∗ (f ) − ϵ/2 < S∗ (f, P1 ) ≤ I∗ (f ).
Como el número I∗ (g) es el supremo de todas las sumas inferiores S∗ (g, P ), existe una
partición P2 del intervalo [a, b] tal que I∗ (g) − ϵ/2 < S∗ (g, P2 ) ≤ I∗ (g).
Ası́ demostramos que I∗ (f ) + I∗ (g) < I∗ (f + g) + ϵ para todo ϵ > 0 (desigualdad “a menos
de ϵ”), lo que implica la desigualdad I∗ (f ) + I∗ (g) ≤ I∗ (f + g) deseada.
ETAPA 3: Conclusión.
Como las funciones f y g son integrables en el intervalo [a, b], tenemos que I∗ (f ) = I ∗ (f )
e I∗ (g) = I ∗ (g). Usando las desigualdades obtenidas en las etapas 1 y 2, se deduce que
I∗ (f ) + I∗ (g) ≤ I∗ (f + g) ≤ I ∗ (f + g) ≤ I ∗ (f ) + I ∗ (g) = I∗ (f ) + I∗ (g)
Por lo tanto, tenemos que I∗ (f ) + I∗ (g) = I∗ (f + g) = I ∗ (f + g) = I ∗ (f ) + I ∗ (g), lo que
Rb Rb Rb
demuestra que la función f +g es integrable en el intervalo [a, b] y que a (f +g) = a f + a g.
Ejercicio 11. Usando como modelo la demostración de la etapa 1 de la proposición anterior,
redactar la demostración de la etapa 2, modificando el razonamiento de modo adecuado.
Ahora, nos queda demostrar el ı́tem 2 del teorema. Para ello, se necesita distinguir los
casos donde α ≥ 0 y α < 0. En primer lugar, se trata el caso donde α ≥ 0.
Lema 3.2.8. Sea f : [a, b] → R una función acotada. Entonces, para todo subintervalo
[a′ , b′ ] ⊂ [a, b] y para todo número α ≥ 0, tenemos que:
Demostración.
es decir:
ı́nf(αf, [a′ , b′ ]) ≤ αı́nf(f, [a′ , b′ ])
(multiplicando ambos lados por α > 0, y observando que α−1 αf = 1 · f = f ). Por lo
tanto:
ı́nf(αf, [a′ , b′ ]) = α · ı́nf(f, [a′ , b′ ])
Demostración. Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Por
el lema anterior, se observa que:
n−1
X
S∗ (f, P ) = (ai+1 − ai ) · inf(αf, [ai , ai+1 ])
i=0
n−1
X
= (ai+1 − ai ) · (α · inf(f, [ai , ai+1 ]))
i=0
n−1
X
=α· (ai+1 − ai ) · inf(f, [ai , ai+1 ])
i=0
= α · S∗ (f, P )
y de modo análogo, se demuestra que S ∗ (αf, P ) = αS ∗ (f, P ). Pasando al supremo (para las
sumas inferiores) y al ı́nfimo (para las sumas superiores), se deduce que I∗ (αf ) = αI∗ (f ) y
que I ∗ (αf ) = αI ∗ (f ). Como f es integrable, tenemos que I∗ (f ) = I ∗ (f ), de tal modo que
Ahora, nos queda demostrar el ı́tem 2 del teorema en el caso donde α < 0. Para ello, se
necesita relacionar las integrales de la función f y de la función opuesta −f .
Lema 3.2.10. Sea f : [a, b] → R una función acotada. Entonces para todo subintervalo
[a′ , b′ ] ⊂ [a, b], tenemos que:
Demostración. Ejercicio.
Demostración. Usando el lema anterior, se verifica sin dificultad que S∗ (−f, P ) = −S ∗ (f, P )
y S ∗ (−f, P ) = −S∗ (f, P ) para toda partición P del intervalo [a, b]. Pasando al supremo (para
la sumas inferiores) y al ı́nfimo (para las sumas superiores), se deduce que I∗ (−f ) = −I ∗ (f )
y que I ∗ (−f ) = −I∗ (f ). Como la función f es integrable en [a, b], tenemos que I∗ (f ) = I ∗ (f ),
de tal modo que
I∗ (−f ) = −I ∗ (f ) = −I∗ (f ) = I ∗ (f )
Rb Rb
Por lo tanto, la función −f es integrable en [a, b], y se cumple que a (−f ) = − a f .
Demostración. Ejercicio.
Ejercicio 13. Se considera la función f : [0, 4] → R del Ejercicio 5 p.28 , la cual está definida
por f (x) = 4x − x2 para todo x ∈ [0, 4].
47
1. Escribir la función f como una combinación lineal de las funciones f1 (x) = x (Ejercicio
8 p.39) y f2 (x) = x2 (Ejemplo 3.1.26).
área algebraica de la región ubicada entre el eje x y la gráfica de la función f , contando las
áreas arriba del eje x con un signo positivo y las áreas abajo del eje x con un signo negativo:
Para calcular el área geométrica de la misma región (contando esta vez todas las áreas
con un signo positivo), una solución sencilla consiste en remplazar la función f por su valor
absoluto |f |, es decir: por la función definida por |f |(x) = |f (x)| para todo x ∈ [a, b].
48
En efecto, es claro que las regiones inducidas por las gráficas de la función f y de su
valor absoluto |f | tienen misma área geométrica (por un argumento obvio de simetrı́a, véase
figura anterior). Por otro lado, como la función |f | es positiva o nula, el área geométrica de
la región inducida por su gráfica Rcoincide con el área algebraica de la misma región, la cual
b
se puede calcular con la integral a |f (x)|dx. Dicho de otro modo, tenemos que:
área geométrica inducida por f = área geométrica/algebraica inducida por |f |
Z b
= |f (x)|dx
a
Aunque el argumento anterior sea bastante intuitivo, plantea un problema formal que es
el siguiente: dado que una función f : [a, b] → R, ¿se puede deducir que su valor absoluto
|f | : [a, b] → R también es integrable? Para resolver este problema, se necesita introducir la
descomposición de una función en sus partes positiva y negativa:
Definición 3.2.14 (Partes positiva y negativa de una función). Dada una función
f : [a, b] → R, se llama parte positiva de la función f a la función f + : [a, b] → R
definida por (
f (x) si f (x) ≥ 0
f + (x) = máx(0, f (x)) =
0 si f (x) < 0
Se llama parte negativa de la función f a la función f − : [a, b] → R definida por
f − = (−f )+ (es decir: como la parte positiva de la función opuesta −f ).
Lema 3.2.16. Sea f : [a, b] → R una función acotada. Entonces, la parte positiva f + de la
función f también está acotada, y para todo subintervalo [a′ , b′ ] ⊂ [a, b] tenemos que:
Caso donde f (x) ≥ 0 para todo x ∈ [a′ , b′ ]. En este caso, se observa que f + (x) = f (x)
para todo x ∈ [a′ , b′ ]. Por lo tanto, tenemos que:
Caso donde f (x) ≤ 0 para todo x ∈ [a′ , b′ ]. En este caso, se observa que f + (x) = 0
para todo x ∈ [a′ , b′ ]. Por lo tanto, tenemos que:
Caso donde existen x+ , x− ∈ [a′ , b′ ] tales que f (x+ ) > 0 y f (x− ) < 0. En este caso, se
observa que:
Luego, se concluye por la Proposición 3.1.20 que la función f + es integrable en [a, b]. Para
demostrar que f − también es integrable en [a, b], basta con observar que f − = (−f )+ .
Ahora se puede demostrar la propiedad que relaciona las integrales de una función (in-
tegrable) f : [a, b] → R y de su valor absoluto |f |:
(2) Deducir que si f y g son integrables, entonces las funciones h1 y h2 también lo son.
Por construcción, la noción de integral sólo tiene sentido en un intervalo cerrado [a, b],
con a < b. Sin embargo, cuando se trabaja con una función f : I → R definida en un
intervalo I cualquiera de R, siempre se puede restringir el estudio a un subintervalo cerrado
[a, b] ⊂ I para determinar si la función f es integrable en dicho subintervalo y, llegado
Rb
el caso, calcular el valor de la integral a f . Por supuesto, la propiedad de integrabilidad
depende del subintervalo considerado, y una misma función f : I → R puede ser integrable
en algunos subintervalos de I y no ser integrable en otros subintervalos.
Ejercicio 15. A partir de los ejemplos anteriores, construir una función f : [0, 2] → R que
sea integrable en el intervalo [0, 1] y no sea integrable en el intervalo [1, 2].
Sin embargo, se puede demostrar que toda función integrable en un intervalo [a, b] tam-
bién es integrable en cualquier subintervalo [a′ , b′ ] ⊂ [a, b]:
Como la función f1 es integrable en el intervalo [a, b], existe una partición P1 ⊂ [a, b]
tal que
ϵ ϵ
I1 − < S∗ (f1 , P1 ) ≤ S ∗ (f1 , P1 ) < I1 + (1)
2 2
Como la función f2 es integrable en el intervalo [b, c], existe una partición P2 ⊂ [b, c]
tal que
ϵ ϵ
I2 − < S∗ (f2 , P2 ) ≤ S ∗ (f2 , P2 ) < I2 + (2)
2 2
Ası́ demostramos que para todo ϵ > 0, existe una partición P3 ⊂ [a, b] tal que I1 + I2 − ϵ <
I∗ (f, P3 ) ≤ I ∗ (f, P3 ) < I1 + I2 + ϵ. Por la Proposición 3.1.18 la función f3 = f [a,c] es
Rb Rc
integrable en el intervalo [a, c] y su integral vale I1 + I2 = a f + b f .
Ejercicio de parcial
A) −14 B) − 25
2
C) −10 D) 27
2
E) 16
Es decir, Z 4 Z 4 Z 2
1 5
f (x)dx = f (x)dx − f (x) = −3=−
2 0 0 2 2
54
Entonces:
Z 4 Z 4 Z 4
(5f (x) − g(x))dx = 5 f (x)dx − g(x)dx
2 2 2
5 3 28
=5· − − = − = −14
2 2 2
Rb
3.2.5. Extensión de la notación a f a los casos donde a = b y a > b
Rb
Hasta ahora, sólo definimos la notación a f en el caso donde a < b. En la práctica, es
muy cómodo extender la notación anterior a los casos donde a = b y a > b, escribiendo
Z b (
0 si a = b
f= Ra
a − b f si a > b
cuando los lados derechos están bien definidos.
Rb
Gracias a esta extensión de la notación a f , se puede generalizar la propiedad de aditi-
vidad respecto al intervalo del modo siguiente:
Proposición 3.2.23 (Aditividad generalizada respecto al intervalo). Si f : I → R es una
función localmente integrable en un intervalo I ⊂ R, entonces para todos a, b, c ∈ I, tenemos
que Z Zc Z b c
f= f+ f
a a b
(independientemente de las propiedades relativas de los tres puntos a, b, c ∈ I).
Rc Rb Rc
(1) Caso donde a = b = c. En este caso, ambos números a f y a f + b f son nulos por
definición y la igualdad deseada se cumple trivialmente.
(2) Caso donde a = b ̸= c. En este caso tenemos que
Z c Z a Z c Z b Z c
f= f+ f= f+ f
a a a a b
| {z }
0
pues a = b
(3) Caso a ̸= b = c. En este caso, tenemos que
Z c Z c Z c Z b Z c
f= f+ f= f+ f
a a c a b
| {z }
0
pues c = b
55
pues c = a.
(5) Caso donde a, b y c son distintos dos a dos. En este caso, se distinguen los siguientes
6 subcasos, según las posiciones relativas de los tres números a, b, c ∈ I:
Ejercicio 16. Verificar que la Proposición 3.2.1 (monotonı́a) y la Proposición 3.2.18 (valor
absoluto) se extienden trivialmente al caso donde a = b, y explicar por qué no se extienden
al caso donde a > b mediante contraejemplos adecuados.
Ejercicio 17. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Dado
un número µ ∈ R, se considera la función g : [a + µ, b + µ] → R definida por
g(y) = f (y − µ)
a) Demostrar que si P es una partición del intervalo [a, b], entonces P + µ es una
partición del intervalo [a + µ, b + µ]. Del mismo modo, demostrar que si Q es una
partición de [a + µ, b + µ], entonces Q − µ es una partición de [a, b].
b) Demostrar que las funciones P 7→ P + µ y Q 7→ Q − µ definen biyecciones
inversas entre el conjunto de las particiones del intervalo [a, b] y el conjunto de
las particiones del intervalo [a + µ, b + µ].
(2) Sea P = {a0 , a1 , . . . , an } una partición del intervalo [a, b]. Demostrar que
y
sup(g, [ai + µ, ai+1 + µ]) = sup(f, [ai , ai+1 ])
para todo i = 0, . . . , n − 1.
Integración en espejo
Ejercicio 18. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Se
considera la función g : [−b, −a] → R definida por
g(y) = f (−y)
Integración y dilatación
Ejercicio 19. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Dado
un número λ > 0, se considera la función g : [λa, λb] → R definida por
y
g(y) = f
λ
59
Definición 3.3.1 (Función escalonada). Se dice que una función f : [a, b] → R (con
a < b) es escalonada cuando existe una partición P = {a0 , a1 , . . . , an } del intervalo
[a, b] tal que la función f es constante en cada uno de los subintervalos abiertos
(ai , ai+1 ) (i = 0, . . . n − 1).
Observación 3.3.2. Precisemos que una función escalonada f : [a, b] → R sólo necesita
ser constante en los subintervalos abiertos (ai , ai+1 ) inducidos por la partición P , la cual
define los “escalones” de dicha función. Por otro lado, la función f puede tomar valores
cualesquiera en los puntos a0 , a1 , . . . , an de la partición P , como se puede observar en la
figura anterior.
Ejercicio 21. Demostrar que toda función escalonada f : [a, b] → R está acotada.
Ejemplo 3.3.3 (Parte entera). Se recuerda que la parte entera de un número real x está
definida como el número entero más grande que es menor o igual a x. La parte entera del
número x se escribe ⌊x⌋, y por construcción, tenemos que
para todo x ∈ R. En particular, tenemos que ⌊x⌋ = x para todo x ∈ Z. Al estar definida
en todo R, la función x 7→ ⌊x⌋ no puede ser calificada de escalonada, pero es claro que su
restricción a cualquier intervalo [a, b] ⊂ R (con a < b) define una función escalonada en
dicho intervalo. Por ejemplo, la siguiente figura representa la función x 7→ ⌊x⌋ restringida
al intervalo [− 52 , 72 ]
61
√ √ 2
f1 (x) = ⌊x2 ⌋ f3 (x) = ⌊ x⌋ f5 (x) = ⌊ x⌋
f2 (x) = ⌊x⌋2
p p
f4 (x) = ⌊x⌋ f6 (x) = ⌊x2 ⌋
Para cada una de las funciones f1 , f2 , f3 , f4 , f5 , f6 , demostrar que dicha función es escalonada
(explicitando la partición que define sus escalones), y bosquejar su gráfica.
donde a0 , a1 , . . . , an son los puntos de la partición de [a, b] que define los escalones de f ,
y k0 , . . . kn−1 son los valores tomados por f en los subintervalos (a0 , a1 ), . . . , (an−1 , an ).
62
( (
1 si x = a 0 si x < b
h1 (x) = y h2 (x) =
0 si x > a 1 si x = a
Demostremos que la función h1 es integrable en [a, b] y que su integral vale 0. Para ello se
fija ϵ > 0, y se considera la partición P ⊂ [a, b] definida por P = {a, a′ , b}, donde a′ es un
punto del intervalo (a, b) tal que a′ − a < ϵ. Se verifica por un cálculo sencillo (ejercicio) que
63
Ası́ demostramos que para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que 0 ≤ S∗ (h1 , P ) ≤
S ∗ (h1 , P ) < ϵ. Esto implica, por la proposición 3.1.18 que la función h1 es integrable en [a, b]
y que su integral es nula. De modo análogo se demuestra que la función h2 es integrable
en [a, b] y que su integral es nula. Para conluir, basta con observar que la función “casi
constante” f : [a, b] → R se puede escribir como la siguiente combinación lineal
R7
Ejercicio 23. Calcular la integral −2 5 ⌊x⌋ dx (véase el Ejemplo 3.3.3) ası́ como las integrales
2
de las funciones definidas en el Ejercicio 22.
Proposición 3.3.6. Sean f, g : [a, b] → R (con a < b) dos funciones tales que:
Entonces la función g es integrable en el intervalo [a, b], y tiene la misma integral que
f.
64
Ejercicio 24. Sea f : [a, b] → R (con a < b) una función acotada. El objetivo de este ejercicio
es demostrar que sus integrales inferior I∗ (f ) y superior I ∗ (f ) se pueden caracterizar por
Z b
I∗ (f ) = sup s tal que s : [a, b] → R escalonada y s ≤ f
a
Z b
∗
I (f ) = ı́nf t tal que t : [a, b] → R escalonada y s ≥ f
a
(2) Sea s : [a, b] → R una función acotada18 tal que s ≤ f en [a, b].
(a) Demostrar que S∗ (s, P ) ≤ S∗ (f, P ) para toda partición P ⊂ [a, b].
(b) Deducir I∗ (f ) ≤ I∗ (f ).
(4) Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Definir a partir
de la partición P una función escalonada s : [a, b] → R tal que s ≤ f y a s = S∗ (f, P ).
Rb
(5) Deducir de (4) que sup a s tal que s : [a, b] → R escalonada y s ≤ f ≥ I∗ (f ). Su-
nR o
b
gerencia: se podrá demostrar (usando (4)) que para todo ϵ > 0, existe una función
Rb
escalonada s ≤ f tal que a s > I∗ (f ) − ϵ.
. Sugerencia: se podrá usar como modelo el razonamiento efectuado en los ı́tems (2) −
(6), adáptondolo de modo adecuado.
(8) Deducir de lo anterior que si la función f es integrable en [a, b], entonces
Z b Z b
f = sup s tal que s : [a, b] → R escalonada y s ≤ f
a a
Z b
= ı́nf t tal que t : [a, b] → R escalonada y s ≥ f
a
El objetivo de esta sección es demostrar que todas las funciones polinomiales son lo-
calmente integrables, y presentar el método que permite calcular su integral en cualquier
intervalo [a, b]. Para ello, se comienza por estudiar el caso particular de la función
x 7→ xp
con p ∈ N.
pues xi ≤ y i e y p−i ≥ 0.
y−x
Multiplicando las desigualdades anteriores por p+1
≥ 0, se deduce que
p
y−x p y − x X i p−i y − x
· (p
+
1)x ≤ xy ≤ · (
p+ 1)y p
p+1
p + 1 i=0 p+1
| {z }
y p+1 −xp+1
p+1
por (∗)
(1) Caso donde [a, b] ⊂ [0, +∞), es decir: 0 ≤ a < b. En este caso, la función f es
monótona creciente en el intervalo [a, b] (pues es monótona creciente en [0, +∞)),
entonces es integrable en [a, b] por el Teorema 3.1.25. Sea P = {a0 , a1 , . . . .an } una
partición cualquiera del intervalo [a, b]. En cada uno de los subintervalos [ai , ai+1 ]
(i = 0, . . . , n − 1), tenemos que ı́nf(f, [ai , ai+1 ]) = f (ai ) = api y sup(f, [ai , ai+1 ]) =
67
f (ai+1 ) = api+1 , por la monotonı́a de f . Aplicando el Lema 3.3.8 a cada par de números
(ai , ai+1 ), obtenemos que
n−1 n−1 p+1
X X ai+1 − ap+1 bp+1 − ap+1
S∗ (f, P ) = (ai+1 − ai ) · api ≤ i
=
i=0 i=0
p+1 p+1
mientras que
n−1 n−1 p+1
∗
X p
X ai+1 − ap+1
i bp+1 − ap+1
S (f, P ) = (ai+1 − ai ) · ai+1 ≥ =
i=0 i=0
p+1 p+1
bp+1 − ap+1
I∗ (f ) ≤ ≤ I ∗ (f )
p+1
Pero como la función f (x) = xp es integrable en el intervalo [a, b], se concluye que
Z b
bp+1 − ap+1
xp dx = I∗ (f ) = I ∗ (f ) =
a p+1
(2) Caso donde [a, b] ⊂ (−∞, 0], es decir: a < b ≤ 0. En este caso, ya sabemos por el
caso (1) que la función f (x) = xp es integrable en el intervalo [−b, −a] ⊂ [0 + ∞).
Usando la propiedad de integración en espejo (Ejercicio 18), se deduce que la función
g(x) = f (−x) = (−x)p es integrable en [a, b], y
Z b Z −a
p (−a)p+1 − (−b)p+1
(−x) dx = xp dx =
a −b p+1
Ahora, se distinguen dos subcasos, según si el entero p ∈ N es par o impar.
(2.1) Subcaso donde p es par. En este subcaso, tenemos que (−x)p = xp ; luego
Z b Z b
p (−a)p+1 − (−b)p+1 bp+1 − ap+1
x dx = (−x)p dx = =
a a p+1 p+1
pues (−a)p+1 = −ap+1 y (−b)p+1 = −bp+1 , ya que el entero p + 1 es impar.
(2.2) Subcaso donde p es impar. En este subcaso, tenemos que (−x)p = −xp ; luego
Z b Z b
p (−a)p+1 − (−b)p+1 bp+1 − ap+1
x dx = − (−x)p dx = − =
a a p+1 p+1
pues (−a)p+1 = ap+1 y (−b)p+1 = bp+1 , ya que el entero p + 1 es par.
68
(3) Caso donde a < 0 y b > 0. Por los casos (1) y (2), ya sabemos que la función f (x) =
xp es integrable en los intervalos [a, 0] ⊂ (−∞, 0] y [0, b] ⊂ [0, +∞), Entonces, es
integrable en el intervalo [a, b] = [a, 0] ∪ [0, b], y
b 0 b
0p+1 − ap+1 bp+1 − 0p+1 bp+1 − ap+1
Z Z Z
p p
x dx = x dx + xp dx = + =
a a 0 p+1 p+1 p+1
Para ello, se observa que la función f es una función lineal de las tres funciones x 7→ x3 ,
x 7→ x1 y x 7→ x0 = 1. Ası́, es integrable en el intervalo [−1, 2], y
Z 2 Z 2 Z 2 Z 2
1 3 1 3 1
x − x + 1 dx = · x dx − x dx + x0 dx
−1 3 3 −1 −1 −1
1 24 − (−1)4 22 − (−1)2 21 − (−1)1
= · − +
3 4 2 1
1 15 3 3 11
= · − + =
3 4 2 1 4
Dicho de otro modo, demostramos que las siguientes dos área son iguales:
69
Ejercicio de parcial
A) n = 7 C) n = 9 E) n = 5
B) n = 8 D) n = 6 F) n = 4
Solución. Sabemos que la función f (x) = x2 es integrable en el intervalo [1, 2], por lo tanto
para todo ϵ > 0 existe una partición P tal que
En particular, en este jercicio buscamos la menor cantidad de puntos que debe tener una
partición Pn que divide al intervalo [1, 2] en n intervalos de igual longitud de forma que se
verifique
1
S ∗ (f, Pn ) − S∗ (f, Pn ) <
2
Dado que la partición Pn divide al intervalo [1, 2] en n intervalos de igual longitud, es de la
forma
a0 a1 a2 ... an−1 an
donde a0 = 1 y an = 2. Es decir,
2−1 1
ai+1 − ai = =
n n
para todo i = 0, . . . , n − 1.
70
Luego,
n−1
X
S∗ (f, Pn ) = ı́nf(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
| {z }
1
n
n−1
1X
= ı́nf(f, [ai , ai+1 ])
n i=0
n−1
1X
= f (ai )
n i=0
y
n−1
X
∗
S (f, Pn ) = sup(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
| {z }
1
n
n−1
1X
= sup(f, [ai , ai+1 ])
n i=0
n−1
1X
= f (ai+1 )
n i=0
Entonces,
n−1 n−1
∗ 1X 1X
S (f, Pn ) − S∗ (f, Pn ) = f (ai+1 ) − f (ai )
n i=0 n i=0
n−1
1X
(f (ai+1 ) − f (ai ))
n i=0
1
= (
f (a
1) − f (a0 ) +
f (a
2) −
f (a
1) + · · · + f (an ) −
f (a ))
n−1
n
1
= (f (2) − f (1))
n
3
=
n
Finalmente
3 1
< ⇔ 6<n
n 2
Ası́ que tomamos n = 7.
Vı́nculo con la derivada. A partir de ahora y hasta el final de la sección 3.3.2, se supone
conocida la noción de función derivada, que será introducida más adelante en el curso. Los
lectores que no conocen esta noción pueden omitir esta parte, e ir directamente a la sección
3.3.3.
71
F ′ (x) = f (x)
Proposición 3.3.13. Para todos a, b, λ > 0 tales que a < b, tenemos que:
Z λb Z b
1 1
dt = dt
λa t a t
(En la figura anterior, tomamos [a, b] = [1, 32 ] y λ = 2). Dicho de otro modo, la integral
Rb 1
a t
dt no depende de los extremos a, b > 0; sólo depende del cociente ab .
Rb
La integral a 1t no se puede expresar como un polinomio o como una fracción racional
en función de los extremos a y b. Para ello, se necesita introducir una nueva función:
Observación 3.3.16. La definición anterior usa la notación extendida para la integral, pues
el número x > 0 puede ser menor, igual o mayor a 1. En particular, como f (t) = 1t > 0
para todo t ∈ (0, +∞), es claro que:
R x
1
1 t dt ≥ 0
si x > 1
log(x) = 0 si x = 1
R1 1
− x t dt ≤ 0 si x < 1
Se demuestra que:
Proposición 3.3.17. La función log : (0, +∞) → R es estrictamente creciente en (0, +∞).
1
Gracias a la función logaritmo, podemos ahora expresar la integral de la función f (t) = t
en cualquier intervalo [a, b] ⊂ (0, +∞):
Proposición 3.3.19. Para todos a, b > 0, tenemos que
Z b
1 b
dt = log(b) − log(a) = log( )
a t a
(Se observa que la última expresión sólo depende del cociente ab .)
Ejercicio de parcial
B) − 52 + 6(log(3) + log(2)) E) 5
2
− 6(log(3) − log(2))
15
C) 2
+ 6(log(3) + log(2)) F) − 52 + 6(log(3) − log(2))
Solución. Primero buscamos los puntos donde los dos gráficos se intersectan, es decir bus-
camos los x ∈ R+ tales que
f (x) = g(x)
Tenemos que
6
f (x) = g(x) ⇔ = −x + 5
x
⇔ 6 = −x2 + 5x
⇔ x2 − 5x + 6 = 0
⇔x=2 ox=3
76
Es decir, el área bajo el gráfico de g y sobre el gráfico de f . Luego, el área buscada es:
Z 3 Z 3 Z 3 Z 3
6
g(x)dx − f (x)dx = dx − −x + 5dx
2 2 2 x 2
Z 3 Z 3 Z 5
1
=6 dx + xdx − 5dx
2 x 2
22
22
3
= 6(log(3) − log(2)) + − − (5 · 3 − 5 · 2)
2 2
5
= 6(log(3) − log(2)) −
2
Ejercicio 25. El objetivo de este ejercicio es demostrar las desigualdades
1
1− ≤ log(x) ≤ x − 1
x
para todo x > 0.
Lı́mites y continuidad
4.1. Lı́mite
4.1.1. Entornos
79
80
Esta observación también vale para los entornos reducidos E ∗ (x0 , ϵ) y E ∗ (x0 , ϵ′ ).
¯
Se observa que en todos los casos, tenemos I ◦ ⊂ I ⊂ I.
Para cada uno de los diez tipos de intervalos, demostrar que ambas equivalencias se cumplen.
Ejercicio 27. Demostrar la propiedad anterior, distinguiendo los casos en función del tipo
de intervalo considerado. ¿Qué pasa cuando el intervalo está reducido a un punto?
Ası́, la definición de lı́mite expresa la idea intuitiva que f (x) es arbitrariamente cer-
cano a L en cuanto x sea suficientemente cercano a x0 (sin ser igual a x0 ). Más
precisamente:
82
2. La definición de lı́mite sólo examina los valores tomados por la función f en los entor-
nos reducidos del punto x0 (que exluyen el punto x0 ), y nunca examina el valor de f
en el propio punto x0 , cuando dicho valor existe1 . Ası́, el valor tomado por la función
f en el punto x0 (cuando dicho valor existe) no influye ni en la existencia del lı́mite,
ni en el valor de dicho lı́mite. La exclusión sistemática del punto x0 del dominio de
la observación también explica por qué se puede considerar el lı́mite de la función f
en cualquier extremo del intervalo I, incluso cuando la función f no está definida en
dicho extremo.
3. Una función f : I → R no siempre tiene lı́mite en un punto x0 ∈ I¯ (veremos contra-
ejemplos más adelante), pero cuando tiene lı́mite, es único:
Como f tiene lı́mite L en el punto x0 , existe un radio δ > 0 tal que f (x) ∈ E(L, ϵ) para
todo x ∈ E ∗ (x0 , δ) ∩ I. Como f también tiene lı́mite L′ en el punto x0 , existe otro radio
δ ′ > 0 tal que f (x) ∈ E(L′ , ϵ) para todo x ∈ E ∗ (x0 , δ ′ ) ∩ I. Ahora, se elige un punto x ∈ I
tal que 0 < |x − x0 | < min(δ, δ ′ ) (tal punto existe por la Proposición 4.1.5), de tal modo
que x ∈ E ∗ (x0 , δ) ∩ I y x ∈ E ∗ (x0 , δ ′ ) ∩ I. Por lo anterior, se deduce que f (x) ∈ E(L, ϵ) y
f (x) ∈ E(L′ , ϵ), lo que es absurdo pues ambos conjuntos E(L, ϵ) y E(L′ , ϵ) son disjuntos.
1
Recordemos que el punto x0 puede no estar en el intervalo de definición I
83
Dicho de otro modo, se necesita construir alguna función ϵ 7→ δϵ (de R+ en R+ ) que asocie
a cada precisión ϵ > 0 un radio de seguridad δϵ que cumpla la condición (∗)2 . Los siguientes
ejemplos muestran cómo se puede construir tal función en la práctica.
Ejemplo 4.1.11 (Función identidad). Sea f : R → R la función identidad, definida f (x) = x
para todo x ∈ R. Entonces para todo punto x0 ∈ R, tenemos que
lı́m f (x) = x0 = f (x0 )
x→x0
2
Tal función no es única y, en la práctica, sólo se necesita construir alguna.
84
Demostración. Dada una precisión ϵ > 0 fijada, se trata de hallar un radio δϵ > 0 tal que
En efecto, para todo x ∈ R tal que 0 < |x − x0 | < δϵ , tenemos que |x − x0 | < ϵ (pues δϵ = ϵ),
es decir: |f (x) − x0 | < ϵ (pues f (x) = x).
para una precisión ϵ > 0, entonces cualquier radio δϵ′ > 0 tal que δϵ′ ≤ δϵ cumple la misma
condición (reemplazando δϵ por δϵ′ ).
(1) Demostrar que lı́m f (x) = 0, asociando el radio δϵ := ϵ a cada precisión ϵ > 0. Deducir
x→0
que la función f es discontinua en el punto x0 = 0.
85
Demostración. Sea x0 ≥ 0. Dada una precisión ϵ > 0 fijada, se trata de hallar un radio
δϵ > 0 tal que
p √
∀x ∈ [0, +∞), 0 < |x − x0 | < δϵ ⇒ | (x) − x0 | < ϵ (∗)
Caso donde x0 = 0. En este caso, se puede tomar δϵ := ϵ2 > 0. En efecto, para todo
x ∈ [0, +∞) tal que 0 < |x − 0| <√δϵ , tenemos 0 < x < ϵ2 (pues |x − 0| = x ≥ 0 y
√ que √
2
δϵ = ϵ ). Entonces, tenemos que | x − 0| = x < ϵ2 = ϵ).
Ahora, se trata de mostrar que el radio δϵ > 0 cumple la condición (∗) deseada.
86
Para ello, se considera un número x ∈ [0, +∞) tal que 0 < |x − x0 | < δϵ . Por hipótesis
sobre x, tenemos que
√ √
x < x0 + δϵ ≤ x0 + (( x0 + ϵ′ )2 − x0 ) = ( x0 + ϵ′ )2
√
pues δϵ ≤ ( x0 + ϵ′ )2 − x0 , y
√ √
x > x0 − δϵ ≥ x0 − (x0 − ( x0 − ϵ′ )2 ) = ( x0 − ϵ′ )2
√ √ √
pues δϵ ≤ x0 − ( x0 − ϵ′ )2 . Es decir:
√ ( x0 − ϵ′ )2 < x < ( x0 + ϵ′ )2 . Por la equivalencia
√ √
(∗∗), se deduce que x0 − ϵ′ < x < x0 + ϵ′ , es decir
√ √
| x − x0 | < ϵ′ ≤ ϵ
Lo que acaba de demostrar la condición (∗) en el caso donde x0 > 0.
Observación 4.1.14 (Negación de la propiedad de lı́mite). Hasta ahora, sólo vimos ejem-
plos de funciones que tienen lı́mites en todos los puntos de su intervalo de definición. Re-
cordemos que una función f : I → R tiene lı́mite en un punto x0 ∈ I¯ si y sólo si:
∃L ∈ R, ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − L| < ϵ
Ası́, para demostrar que una función f : I → R no tiene lı́mite en un punto x0 ∈ I,
¯ se
necesita demostrar la negación del enunciado anterior, es decir el enunciado:
∀L ∈ R, ∃ϵ > 0, ∀δ > 0, ∃x ∈ I, 0 < |x − x0 | < δ ∧ |f (x) − L| ≥ ϵ
Dado un número L ∈ R cualquiera, se trata de hallar una precisión ϵ > 0 tal que
Caso donde L ≥ 0. En este caso, se elige el punto x = − 2δ ∈ E ∗ (0, δ), de tal modo que
sgn(x) = −1. Entonces, tenemos que
|sgn(x) − L| = | − 1 − L| = |L + 1| = L + 1 ≥ 1
pues L ≥ 0.
Caso donde L ≤ 0. En este caso, se elige el punto x = δ
2
∈ E ∗ (0, δ), de tal modo que
sgn(x) = 1. Entonces, tenemos que
pues −L ≥ 0.
Ası́ para cada radio δ > 0, logramos hallar un punto x ∈ E ∗ (0, δ) tal que |sgn(x) − L| ≥ ϵ
(con ϵ = 1). Por lo tanto, la función sgn no tiene lı́mite en el punto x0 = 0.
Ejercicio 29. Terminar el estudio de la función sgn : R → R, demostrando que es continua
en todo punto x0 ̸= 0.
Observación 4.1.16. En el ejemplo anterior, se observa que la función sgn tiende a −1
(al ser igual a −1) cuando x tiende a 0 por la izquierda, mientras que sgn tiende a 1 (al ser
igual a 1) cuando x tiende a 0 por la derecha, lo que escribiremos:
Ası́, la función sgn tiene lı́mite laterales (por izquierda y por derecha) en el punto 0, pero
como dichos lı́mites laterales son distintos, la función sgn no tiene lı́mite en el punto 0. Las
nociones de lı́mites laterales serán definidas formalmente más adelante.
Para acabar esta sección, se presenta un ejemplo de función tan irregular que no tiene
lı́mite en ningún punto de su dominio de definición:
Ası́, dado un número L cualquiera, se trata de hallar una precisión ϵ > 0 tal que
1. Caso donde L ≤ 12 . En este caso, se toma x := x1 ∈ E ∗ (x0 , δ), de tal modo D(x) = 1
(pues x = x1 ∈ Q). Se verifica que
1
|D(x) − L| = |1 − L| = 1 − L ≥
2
1
pues L ≤ 2
2. Caso donde L ≥ 12 . En este caso, se toma x := x2 ∈ E ∗ (x0 , δ), de tal modo D(x) = 0
/ Q). Se verifica que
(pues x = x2 ∈
1
|D(x) − L| = |0 − L| = |L| = L ≥
2
1
pues L ≥ 2
Ası́, para cada radio δ > 0, logramos hallar un punto x ∈ E ∗ (0, δ) tal que |D(x) − L| ≥ ϵ
(con ϵ = 12 ). Por lo tanto, la función D no tiene lı́mite en el punto x0 .
89
son equivalentes.
Proposición 4.1.19 (Lı́mite de una suma, una resta). Sean f, g : I → R dos funciones
definidas en un intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números L, L′ ∈ R.
Demostración.
(1) Supongamos que lı́m f (x) = L y lı́m g(x) = L′ . Por hipótesis, existen dos funciones
x→x0 x→x0
ϵ 7→ δϵ y ϵ 7→ δϵ′ (de R
+
en R+ ) tales que
∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |f (x) − L| < ϵ (∗)
0 < |x − x0 | < δϵ/2 (pues δϵ′′ ≤ δϵ/2 ), entonces |f (x) − L| < ϵ/2 por (∗)
90
′
0 < |x − x0 | < δϵ/2 (pues δϵ′′ ≤ δϵ/2
′
), entonces |g(x) − L′ | < ϵ/2 por (∗′ )
Sumando las dos desigualdades obtenidas, se deduce que
|(f (x) + g(x)) − (L + L′ )| = |(f (x) − L) + (g(x) − L′ )|
≤ |f (x) − L| + |g(x) − L′ |
< ϵ/2 + ϵ/2 = ϵ
Lo que demuestra la condición (∗′′ ) para todo ϵ > 0, es decir: lı́m (f (x)+g(x)) = L+L′ .
x→x0
∀x ∈ E(x0 , r) ∩ I, |f (x)| ≤ M
Ejercicio 31. El enunciado que expresa que f está acotada en un entorno de x0 es:
∃r > 0, ∃M ≥ 0, ∀x ∈ E(x0 , r) ∩ I, |f (x)| ≤ M
Escribir la negación del enunciado anterior, es decir: el enunciado que expresa que la función
f no está acotada en ningún entorno del punto x0 .
Ejercicio 32. Sea f : R → R la función definida por
(
0 si x ≤ 0
f (x) = 1
x
si x > 0
(1) Demostrar que la función f no está acotada en ningún entorno del punto x0 = 0.
(2) Demostrar que para todo punto x0 = ̸ 0, la función f está acotada en un entorno de
x0 . (Sugerencia: distinguir los casos x0 < 0 y x0 > 0)
Proposición 4.1.21. Sea f : I → R una función definida en un intervalo I ⊂ R. Si f tiene
¯ entonces F está acotada en un entorno del punto x0 .
lı́mite en un punto x0 ∈ I,
Demostración. Suponiendo que lı́m f (x) = L ∈ R, se considera un radio δ > 0 tal que
x→x0
∗
∀x ∈ E (x0 , δ ∩ I, |f (x) − L| < 1 (∗)
(Basta con tomar el radio asociado a la precisión ϵ = 1.) Ahora se distinguen dos casos:
91
Caso donde x0 ∈ I (la función f está definida en el punto x0 ). En este caso, se toman
r := δ y M := max(|L|+1, |f (x0 )|) ≥ 0. En efecto, dado un punto x ∈ E(X −0, r)∩I =
E(x0 , δ) ∩ I, se observa que
Caso donde x0 ∈/ I (la función f no está definida en el punto x0 ), En este caso, basta
con tomar r := δ y M := |L| + 1; el razonamiento es análogo.
(i) Existen r > 0 y M ≥ 0 tales que |f (x)| ≤ M para todo x ∈ E(x0 , r) ∩ I. Sin pérdida
de generalidad, se puede suponer que M > 03 .
(ii) Existe una función ϵ 7→ δϵ (de R+ en R+ ) tal que para todo ϵ > 0, tenemos que
∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |g(x)| < ϵ (∗)
para toda precisión ϵ > 0. Para ello, se define δϵ′ := mı́n δϵ/M , r > 0 para todo ϵ > 0.
En efecto, dados una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 | < δϵ′ ,
tenemos que:
3
En efecto, siempre se puede reemplazar M ≥ 0 por M ′ := M + 1 ≥ 0 sin afectar la condición (I)
92
(1) Demostrar por inducción sobre k ∈ N que lı́m xk = xk0 para todo x0 ∈ R. deducir que la
x→x0
función x 7→ xk es continua en todo punto x0 ∈ R. (Sugerencia: en el paso inductivo,
observar que xk+1 = f (x)g(x), con f (x) = xk y g(x) = x, y usar el resultado del
Ejemplo 4.1.11.)
(2) Deducir de lo anterior que para todos a ∈ R y k ∈ N, la función monomial x 7→ axk es
continua en todo punto x0 ∈ R.
(3) Demostrar por inducción sobre n ∈ N que toda función f : R → R de la forma
n
X
n
f (x) = a0 + a1 x + · · · + an x = ak x k
k=0
1 1
lı́m =
x→x0 f (x) L
93
1 1
Demostración. Queremos demostrar que lı́m f (x)
− L
= 0. Para ello, se observa que
x→x0
1 1 L − f (x) 1 1
− = =− · · (f (x) − L)
f (x) L f (x)L L f (x)
Demostremos que la función g : I → R definida por g(x) = 1/f (x) está acotada en un
entorno del punto x0 . Como lı́m f (x) = L ̸= 0, existe un radio δ > 0 tal que
x→x0
|L|
|f (x) − L| <
2
para todo x ∈ E ∗ (x0 , δ) ∩ I (considerando el radio asociado a la precisión |L|/2 > 0).
Entonces, tenemos que
|L|
|L| = |f (x) − (f (x) − L)| ≤ |f (x)| + |f (x) − L| ≤ |f (x)| −
2
para todo x ∈ E + (x0 , δ) ∩ I, de tal modo que
|L| |L|
|f (x)| ≥ |L| − =
2 2
para todo x ∈ E ∗ (x0 , δ) ∩ I. Ahora, se distinguen dos casos:
Ası́, en ambos casos, demostramos que la función g(x) = 1/f (x) está acotada en un entorno
E(x0 , δ) del punto x0 . Además, tenemos que lı́m (f (x) − L) = 0 por hipótesis. Aplicando
x→x0
dos veces seguidas la Proposición 4.1.22, se deduce de lo anterior que
lı́m (g(x) · (f (x) − L)) = 0
x→x0
y
1 1 1
lı́m − = lı́m − · (g(x) · (f (x) − L)) = 0
x→x0 f (x) L x→x0 L
94
Observación 4.1.25. (1) Cabe destacar que para calcular el lı́mite de la función x 7→
1/f (x) en el punto x0 , se necesita verificar tres condiciones:
Por construcción, tenemos que f (x) > 0 para todo x ∈ R (condición a)). Además, la
función f tiene lı́mite en el punto x0 = 0 (condición b)), pero éste es nulo: lı́m f (x) =
x→0
0.
(2) Por otro lado, las condiciones b) y c) implican que la función f no se anula en algún
entorno reducido del punto x0 , en el sentido de que existe un radio δ > 0 tal que:
∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ̸= 0
(Véase el Ejercicio 34 más abajo). Sin embargo, en el caso donde x0 ∈ I, esta propiedad
de “no anulación local” no implica que f (x0 ) ̸= 0, salvo cuando f es continua en el
punto x0 .
f (x) L
lı́m = ′
x→x0 g(x) L
Lema 4.1.27 (Lı́mite de una función positiva o nula). Sea f : I → R una función
definida en un intervalo I ⊂ R. Si f es positiva o nula en I (es decir: |f (x)| ≥ 0 para
todo x ∈ I) y tiene lı́mite en un punto x0 ∈ I, ¯ entonces dicho lı́mite es positivo o
nulo: lı́m f (x) ≥ 0.
x→x0
Demostración. Sea L := lı́m f (x). Dado ϵ > 0, existe un radio δ > 0 tal que |f (x)−L| < ϵ
x→x0
para todo x ∈ E ∗ (x0 , δ) ∩ I. Eligiendo un punto x ∈ E ∗ (x0 , δ) ∩ I, se observa que
−L = 0 − L ≤ f (x) − L < ϵ
pues 0 ≤ f (x) por hipótesis. Ası́, demostramos que −L < ϵ para todo ϵ > 0. Luego −L ≤ 0,
es decir: L ≥ 0.
(2) ¡Cuidado! En el caso donde f (x) > 0 para todo x ∈ I (resp. f (x) < 0 para todo
x ∈ I), sólo se puede concluir que lı́m f (x) ≥ 0 (resp. lı́m f (x) ≤ 0). Un ejemplo
x→x0 x→x0
de una función estrictamente positiva con lı́mite nulo es dado por la función f de la
Observación 4.1.25 (1).
Demostración. Basta con aplicar el lema anterior con la función g − f (que es positiva o
nula en el intervalo I), observando que lı́m (g(x) − f (x)) = lı́m g(x) − lı́m f (x).
x→x0 x→x0 x→x0
El siguiente teorema, conocido como el teorema del sandwich5 , enuncia una propiedad
muy útil en la práctica para demostrar la existencia de un lı́mite:
Demostración. Por hipótesis, existen funciones ϵ 7→ δϵ′ y ϵ 7→ δϵ′′ (de R+ en R+ ) tales que
∀x ∈ I, 0 < |x − x0 | < δϵ′ ⇒ |g1 (x) − L| < ϵ (∗1 )
para todo ϵ > 0. Para ello, se define δϵ := min(δϵ′ , δϵ′′ ) > 0 para todo ϵ > 0. En efecto, dados
una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 |δϵ , tenemos que
0 < |x − x0 | < δϵ′ , entonces |g1 (x) − L| < ϵ por (∗1 ), es decir: L − ϵ < g1 (x) < L + ϵ
0 < |x − x0 | < δϵ′′ , entonces |g2 (x) − L| < ϵ por (∗2 ), es decir: L − ϵ < g2 (x) < L + ϵ
Por lo tanto, tenemos que L − ϵ < g1 (x) ≤ f (x) ≤ g2 (x) < ϵ, es decir: |f (x) − L| < L + ϵ.
Lo que demuestra la condición (∗) para todo ϵ > 0, de tal modo que lı́m f (x) = L.
x→x0
para todo x > 0. Usando las propiedades algebraicas de los lı́mites, se verifica inmediatamente
que
1 1
lı́m 1 − = 1 − = 0 y lı́m x − 1 = 1 − 1 = 0
x→1 x 1 x→1
Por el teorema del sándwich, se deduce que lı́m log(x) = 0 = log(1). Por lo tanto, la función
x→1
logaritmo es continua en el punto x0 = 1.
Ejercicio 35. Sea f : R → R la función definida por
si x ∈ Q
(
x
f (x) =
−x si x ∈ /Q
Caso donde f (x) = y0 . En este caso, es obvio que |g(f (x)) − g(y0 )| = 0 < ϵ.
Caso donde f (x) ̸= y0 . En este caso, tenemos que 0 < |f (x) − y0 | < δϵ′ . Aplicando (∗′ )
al punto y = f (x) ∈ J, se deduce que |g(f (x)) − g(y0 )| < ϵ.
Ası́, en ambos casos vimos que |g(f (x)) − g(y0 )| < ϵ, lo que acaba de de demostrar la
condición (∗′′ ) para todo ϵ > 0. Por lo tanto: lı́m g(f (x)) = g(y0 ).
x→x0
Observación 4.1.33. (1) Los lectores habrán observado que, en la proposición anterior,
no sólo se supone que la función g tiene lı́mite en el punto y0 , sino también se supone
que dicho lı́mite es igual a g(y0 ) (es decir: que la función g es continua en el punto
y0 ). En efecto, la propiedad de composición no se cumple cuando la función g tiene
lı́mite sin ser continua en el punto y0 . Un contraejemplo sencillo es el siguiente: sean
f, g : R → R las funciones definidas por
(
1 si x = 0
f (x) = 0 y g(x) =
0 si x ̸= 0
Sin embargo, tenemos que (g ◦ f )(x) = g(f (x)) = g(0) = 1 para todo x ∈ R, de tal
modo que g ◦ f tiene lı́mite 1 ̸= 0 en el punto x0 = 0.
El objetivo de este ejercicio es demostrar que la función logaritmo es continua en todo punto
x0 > 0. Ası́, en lo que sigue se fija un número x0 > 0.
(1) Sea f : R+ → R+ la función definida por f (x) = x/x0 para todo x ∈ R+ . Verificar que
la función f es continua en el punto x = x0 , es decir: lı́m f (x) = f (x0 ) = 1.
x→x0
99
(2) Combinando el resultado del Ejemplo 4.1.31 con el corolario 4.1.34, deducir que la
función g : R+ → R definida por g(x) = log(f (x)) = log(x/x0 ) es continua en el punto
x0 .
(3) Usando la propiedad fundamental del logaritmo, verificar que log(x) = g(x) + log(x0 )
para todo x ∈ R+ , y deducir que la función logaritmo es continua en el punto x0 .
En las secciones anteriores, vimos que la noción de lı́mite está ı́ntimamente vinculada con
la noción de entorno. Para precisar más este vı́nculo se introducen las siguientes notaciones:
E(a) := E(a, ϵ) : ϵ ∈ R+ = (a − ϵ, a + ϵ) : ϵ ∈ R+
al conjunto formado por todos los entornos reducidos del mismo número. Por definición
las notaciones E(a) y E ∗ (a) designan conjuntos de conjuntos.
Usando los conjuntos de entornos E(a) y E ∗ (a) definidos más arriba, se obtiene al final una
caracterización abstracta (y muy compacta) de la noción de lı́mite, que es la siguiente:
Es decir, intuitivamente:
Del mismo modo, se llama entorno izquierdo del número a a todo intervalo de la forma
(a − ϵ, a), con ϵ > 0. Ası́, el conjunto de los entornos izquierdos de a está definido por:
E(a− ) = E ∗ (a− ) := (a − ϵ, a) : ϵ ∈ R+
6
Como los pseudonúmeros ±∞ (que no son números reales) no pertenecen a ningún entorno de ±∞, las
nociones correspondientes de entorno lleno y de entorno reducido coinciden.
7
Igual que para los entornos de ±∞, las nociones de entorno lateral lleno y de entorno lateral reducido
coinciden. ¡Cuidado! Los sı́mbolos a+ y a− no son números, son notaciones cómodas para indicar el tipo de
entorno lateral considerado (derecho o izquierdo).
101
Observación 4.1.38. (1) La noción de punto generalizado no es más que una notación
cómoda para distinguir los 5 tipos de lı́mites que se pueden considerar en el dominio,
es decir:
x → a, x → +∞, x → −∞, x → a+ o x → a−
con a ∈ R. Del mismo modo, la noción de lı́mite generalizado no es más que una
notación cómoda para distinguir los 5 tipos de lı́mites que se pueden considerar en el
codominio:
con b ∈ R
(2) La definición de lı́mite generalizado sólo tiene sentido cuando todos los entornos redu-
cidos E ∈ E ∗ (k) del punto generalizado k = a, +∞, −∞, a+ , a− (con a ∈ R) intersectan
el intervalo I de definición de la función f , es decir: cuando
∀E ∈ E ∗ (k), E ∩ I ̸= ∅
Lı́mites infinitos
Definición 4.1.40 (Recta real extendida). Se llama recta real extendida (o recta real
acabada) y se escribe R̄ o [−∞, +∞] al conjunto definido por:
En este marco extendido, la propiedad de unicidad del lı́mite se generaliza del modo
siguiente:
entonces L = L′ .
Las propiedades algebraicas de los lı́mites se generalizan a los lı́mites infintos del modo
siguiente.
Proposición 4.1.42 (Lı́mite de una suma). Sean f, g : I → R dos funciones definidas en un
intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números reales extendidos L, L′ ∈ R̄. Si lı́m f (x) = L
x→x0
y lı́m g(x) = L′ , entonces el lı́mite de la función f + g en el punto x0 , cuando existe, está
x→x0
dado por la siguiente tabla (donde el sı́mbolo “?” indica un caso indeterminado):
Observación 4.1.43. En el caso indeterminado donde lı́m f (x) = +∞ y lı́m g(x) = −∞,
x→x0 x→x0
no se puede deducir nada sobre el lı́mite de la suma f + g en el punto x0 (ni siquiera si tal
lı́mite existe), ası́ como lo ilustra el siguiente ejercicio:
Ejercicio 38 (Indeterminación para la suma). En cada uno de los siguientes items, definir
dos funciones f, g : R → R que cumplen las siguientes condiciones:
(3) lı́m f (x) = +∞, lı́m g(x) = −∞ y lı́m (f (x) + g(x)) = L, con L ∈ R fijado
x→0 x→0 x→0
(4) lı́m f (x) = +∞ y lı́m g(x) = −∞ pero f + g no tiene lı́mite (finito ni infinito) en 0.
x→0 x→0
Ejercicio 39 (Indeterminación para el producto). En cada uno de los siguientes items, definir
dos funciones f, g : R → R que cumplen las siguientes condiciones:
(3) lı́m f (x) = +∞, lı́m g(x) = 0 y lı́m (f (x)g(x)) = L, con L ∈ R fijado
x→0 x→0 x→0
(4) lı́m f (x) = +∞ y lı́m g(x) = 0 pero f g no tiene lı́mite (finito ni infinito) en 0.
x→0 x→0
1
1. Si lı́m f (x) = ±∞, entonces lı́m f (x)
= 0.
x→x0 x→x0
1
2. Si lı́m f (x) = 0, entonces lı́m |f (x)|
= +∞.
x→x0 x→x0
Observación 4.1.47. En el caso donde lı́m f (x) = 0, la proposición anterior sólo permite
x→x0
determinar el lı́mite de la función 1/|f | en el punto x0 (y, en este caso, dicho lı́mite es +∞).
Sin embargo, se puede deducir en muchos casos el lı́mite de la función 1/f en el punto x0 ,
estudiando el signo de la función f en un entorno de dicho punto.
Ejercicio de parcial
√
x−b
(Ejercicio 4 - primer parcial primer semestre 2018) Se considera f (x) = x2 −1
.
Si lı́mx→1 f (x) = c ∈ R, entonces b y c son:
A) b = 1, c = 1
1
B) b = 1, c = 2
1
C) b = 1, c = 4
Entonces
√ √
lı́m x − b = 0 ⇔ lı́mx − lı́m b = 0 por linealidad
x→1 x→1 x→1
√
⇔ lı́m x = lı́m b
x→1 x→1
⇔1=b
105
Luego,
√ √
x−1 x−1
lı́m 2 = lı́m 2
x→1 x − 1 x→1 x − 1
√ √
x−b x+1
= lı́m 2 ·√
x→1 x − 1 x+1
x−1
= lı́m 2 √
x→1 (x − 1)( x + 1)
x
−1
= lı́m √
x→1 (x− 1)(x + 1)( x + 1)
1
=
4
Por lo tanto, c = 14 .
(1) Si f (x) ≤ g(x) para todo x ∈ I, y si lı́m f (x) = +∞, entonces lı́m g(x) = +∞
x→x0 x→x0
(2) Si f (x) ≤ g(x) para todo x ∈ I, y si lı́m g(x) = −∞, entonces lı́m g(x) = −∞
x→x0 x→x0
Lı́mites laterales
De modo análogo, dado un punto x0 ∈ R tal que (x0 − ϵ, x0 ) ⊂ I para algún ϵ > 0, se
definen los lı́mites laterales por la izquierda en el punto x0 por:
Las nociones de lı́mites laterales por la izquierda y por la derecha en un punto x0 tienen
esencialmente las mismas propiedades que la noción usual (bilateral) de lı́mite finito o infinito
en un punto x0 . Estas propiedades incluyen:
el lı́mite de un producto
(Se deja a los lectores la tarea de adaptar los enunciados anteriores a los lı́mites laterales.)
Lı́mites en ±∞
Como para las nociones de lı́mites laterales, las nociones de lı́mites en +∞ y −∞ tienen
esencialmente las mismas propiedades que la noción de lı́mite bilateral (finito o infinito) en
¯ Estas propiedades incluyen:
un punto x0 ∈ I.
el lı́mite de un producto
109
(Se deja a los lectores la tarea de adaptar los enunciados anteriores a los lı́mites en ±∞.)
Ejercicio de parcial
1 x2 − 1
lı́m sen(1 − x) + − (x − 3)
x→+∞ x − 1 x−1
A) No existe B) 0 C) 2 D) 4 E) +∞
1 x2 − 1 1 x2 − 1
lı́m sen(1 − x) + − (x − 3) = lı́m sen(1 − x) + lı́m − (x − 3)
x→+∞ x − 1 x−1 x→+∞ x − 1 x→+∞ x − 1
−1 ≤ sen(1 − x) ≤ 1
Además,
x2 − 1 (x−1)(x
+ 1)
lı́m − (x − 3) = lı́m − (x − 3)
x→+inf ty x − 1 x→+∞ −1
x
= lı́m (x + 1) − (x − 3)
x→+∞
x + 1 −
= lı́m x+3=4
x→+∞
110
Luego,
1 x2 − 1 1 x2 − 1
lı́m sen(1 − x) + − (x − 3) = lı́m sen(1 − x) + lı́m − (x − 3)
x→+∞ x − 1 x−1 x→+∞ x − 1 x→+∞ x − 1
=0+4=4
Ejemplo 4.1.54 (Lı́mite de la función logaritmo en +∞). Queremos demostrar que
lı́m log(x) = +∞
x→+∞
Caso donde L ≤ 0. En este caso, se elige K := 1, y se observa que para todo número
x > 1, tenemos que log(x) > log(1) = 0 ≥ L (usando la monotonı́a del logaritmo).
Caso donde L > 0. En este caso, se elige K := 2n , donde n es un entero natural tal
que n ≥ L/ log(2). (Tal entero existe por el principio de Arquı́medes.) En efecto, para
L
todo número x > 2n , tenemos que log(x) > log(2n ) = n log(2) ≥ log(2) · log(2) = L.
Ası́, para todo L ∈ R, logramos definir un número K > 0 tal que log(x) > L para todo
x > K. Por lo tanto: lı́m log(x) = +∞
x→+∞
Ejercicio 43. Deducir de lo anterior que lı́m+ log(x) = −∞. (Sugerencia: observar que para
x→0
todo x > 0, tenemos que log( x1 ) = − log(x).)
Ejercicio 44. Sea f : R → R la función definida por
x
f (x) =
1 + |x|
1
(3) Verificar que f (x) = 1+x
− 1 para todo x < 0, y deducir que lı́m f (x) = −1.
x→−∞
Ejercicio 45. Sea f : (a, +∞) → R (con a ∈ R) una función monótona creciente.
(1) Demostrar que si la función f está acotada superiormente en el intervalo (a, +∞),
entonces lı́m f (x) = L, donde L := sup {f (x) : x ∈ (a, +∞)}.
x→+∞
(2) Demostrar que si la función f no está acotada superiormente en el intervalo (a, +∞),
entonces lı́m f (x) = +∞.
x→+∞
Observación 4.2.1. Para toda precisión ϵ > 0 y para todo radio δ > 0, los enunciados
y
∀x ∈ E(x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)
son equivalentes. En efecto, cuando x = x0 , siempre tenemos que f (x) = f (x0 ) ∈ E(f (x0 ), ϵ).
Por lo tanto, la condición f (x) ∈ E(f (x0 ), ϵ) se cumple para todos los puntos x ∈ E ∗ (x0 , δ)∩
I si y sólo si se cumple para todos los puntos x ∈ E(x0 , δ) ∩ I = (E + (x0 , δ) ∩ I) ∪ {x0 }.
Ejercicio de parcial
lı́m f (x) = 2
x→1
1
Si tomamos ϵ = 3
sabemos que
existe δ > 0 tal que para todo x ∈ E ∗ (1, δ) se cumple que f (x) ∈ E(f (1), ϵ)
Ejercicio de parcial
A) 0 B) 1 C) 2 D) 3 E) 4
Para todo a ∈ R, se tiene que g ◦ fa es continua en x para todo x ∈ (−∞, a) ∪ (a, +∞) ya
que en estos intervalos está dada por polinomios.
Falta ver que g ◦ fa sea continua a y para ello se debe verificar que
El lı́mite lı́mx→a (g ◦ fa )(x) existe si existen y son iguales los lı́mites laterales:
y
lı́m (g ◦ fa )(x) = lı́m+ x2 + 2x + 1 = a2 + 2a + 1
x→a+ x→a
Luego,
para todo x ∈ I.
Para ello, necesitaremos el siguiente lema, que expresa que si una función continua es
positiva (resp. negativa) en un punto de su intervalo de definición, entonces es positiva (resp.
negativa) en un entorno de dicho punto:
116
(1) Si f (x0 ) > 0, entonces existe δ > 0 tal que f (x) > 0 para todo x ∈ E(x0 , δ) ∩ I.
(1) Si f (x0 ) < 0, entonces existe δ > 0 tal que f (x) < 0 para todo x ∈ E(x0 , δ) ∩ I.
Demostración.
(1) Supongamos que f (x0 ) > 0. Como f es continua en el punto x0 , existe un radio δ > 0
tal que |f (x) − f (x0 )| < f (x0 ) para todo x ∈ E(x0 , δ) ∩ I (considerando el radio
asociado a la precisión ϵ := f (x0 ) > 0). Esto implica que para todo x ∈ E(x0 , δ) ∩ I,
tenemos que f (x) − f (x0 ) > −f (x0 ), es decir: f (x) > 0.
Gracias al lema anterior, se puede demostrar uns primera versión del teorema de los
valores intermedios, que es la siguiente:
un punto, cuya abcisa c ∈ [a, b] constituye por construcción un cero8 de la función f . (Tal
cero no es necesariamente único, como se puede observar en la figura anterior.)
Demostración del Teorema de Bolzano. Supongamos, por ejemplo, que f (a) < 0 y
f (b) > 0. (La demostración del caso simétrico, donde f (a) > 0 y f (b) < 0 es análoga.) Se
considera el subconjunto A ⊂ [a, b] definido por A := {x ∈ [a, b] : f (x) < 0}. Por construc-
ción, tenemos que a ∈ A y b ∈ / A. Además, el conjunto A ⊂ [a, b] es no vacı́o y acotado,
entonces tiene supremo c := sup(A) ∈ [a, b]. Queremos demostrar que f (c) = 0. Para ello,
se demuestra (por el absurdo) que los dos casos f (c) < 0 y f (c) > 0 son imposibles.
Caso donde f (c) < 0. En este caso tenemos que c < b, pues f (b) > 0. Por el Lema
4.2.6, existe un radio δ > 0 tal que f (x) < 0 para todo x ∈ E(c, δ) ∩ [a, b]- Ahora se
considera el punto x := mı́n(c+ 2δ , b). Por construcción, tenemos que x ∈ E(c, δ)∩[a, b],
entonces f (x) < 0. Luego, tenemos que x ∈ A, entonces x ≤ c = sup(A). Pero esto es
absurdo, pues x > c por construcción. Por lo tanto, el caso f (c) < 0 es imposible.
Caso donde f (c) > 0. En este caso, tenemos que c > a, pues f (a) < 0. Por el lema 4.2.6,
existe un radio δ > 0 tal que f (x) > 0 para todo x ∈ E(c, δ) ∩ [a, b]. Además, como
c = sup(A), existe un punto x ∈ A tal que máx{a, c − δ} < x < c. Por construcción,
tenemos que x ∈ E(c, δ) ∩ [a, b], entonces f (x) > 0. Pero esto también es absurdo, pues
f (x) < 0, ya que x ∈ A. Por lo tanto, el caso f (c) > 0 es imposible.
En conclusión, ambos casos f (c) < 0 y f (c) > 0 son absurdos. Luego: f (c) = 0.
Ahora se puede demostrar el teorema de los valores intermeios en su forma más general:
Corolario 4.2.9 (Teorema de los valores intermedios). Sea f : [a, b] → R una función
continua en el intervalo [a, b] (con a < b). Entonces para todo valor intermedio λ entre
f (a) y f (b) (Es decir: un número λ ∈ R tal que f (a) ≤ λ ≤ f (b) o f (b) ≤ λ ≤ f (a)
según el caso), existe un punto c ∈ [a, b] tal que f (c) = λ.
Para ello, se consideran elementos y1 , y2 ∈ f (I) e y ∈ R tales que y1 < y < y2 . Como
y1 , y2 ∈ f (I), existen dos números x1 , x2 ∈ I tales que y1 = f (x1 ) y y2 = f (x2 ). Es claro que
x1 ̸= x2 , ya que f (x1 ) ̸= f (x2 ). Se distinguen los siguientes dos casos:
Caso donde x1 < x2 . Por el teorema de los valores intermedios aplicado a la función
f [x1 ,x2 ] : [x1 , x2 ] → R y al valor intermedio λ := y, existe un punto x ∈ [x1 , x2 ] tal que
f (x) = y. Y como x ∈ I, deduce que y = f (x) ∈ f (I).
Ejercicio 48. Sea I = (0, 1). Definir funciones continuas f1 , f2 , f3 , f4 : I → R tales que
f1 (I) = [0, 1], f2 (I) = (0, 1], f1 (I) = [0, +∞), f4 (I) = R
Además, se dice que la función f tiene un mı́nimo absoluto (resp. un máximo absoluto,
un extremo absoluto) en el punto x0 ∈ I cuando el punto9 (x0 , f (x0 )) es un mı́nimo absoluto
(resp. un máximo absoluto, un extremo absoluto) de la función f .
Observación 4.2.13. (1) Una función f : I → R puede tener cero, uno o múltiples mı́ni-
mos absolutos (resp. máximos absolutos, extremos absolutos). Por ejemplo, en la si-
guiente figura, los puntos (x0 , f (x0 )) y (x2 , f (x2 )) son máximos absolutos de la función
bosquejada, mientras los puntos (x1 , f (x1 )) y (x3 , f (x3 )) son mı́nimos absolutos:
9
¡Cuidado! Aquı́ se usa la palabra punto con dos sentidos distintos: para designar un elemento x0 ∈ I
(punto unidimensional), o para designar un punto (x0 , f (x0 )) de la gráfica de f (punto bidimensional).
119
El objetivo de esta sección es demostrar que toda función continua definida en un inter-
valo cerrado [a, b] (con a < b) tiene (al menos) un mı́nimo absoluto y un máximo absoluto.
Antes de demostrar este resultado importante, se necesita verificar que:
Por construcción, el conjunto A ⊂ [a.b] está acotado y no es vacı́o, pues a ∈ A. (En efecto,
la función f está trivialmente acotada en el intervalo [a, a] = {a}.) Luego A tiene supremo
s := sup(A). Queremos demostrar que s = b ∈ A. Para ello, se observa lo siguiente:
(1) Como la función f es continua en el punto s, f está acotada en un entorno del punto
s (por la Proposición 4.1.21), lo que significa que existen Ms ≥ 0 y δ > 0 tales que
|f (x)| ≤ Ms para todo punto x ∈ E(s, δ) ∩ [a, b].
(2) Además, como s = sup(A), existe un punto c ∈ A tal que s − δ < c ≤ s, y por
definición del conjunto A, sabemos que la función f está acotada en el intervalo [a, c],
lo que significa que existe Mc ≥ 0 tal que |f (x)| ≤ Mc para todo punto x ∈ [a, c].
(3) Sea s′ = mı́n(s + 2δ , b). Por construcción, tenemos que s′ ∈ E(s, δ) ∩ [a, b], y dado que
c ∈ E(s, δ) ∩ [a, b] (pues s − δ < c ≤ s), se deduce que [c, s′ ] ⊂ E(s, δ) ∩ [a, b]. Por (1),
esto implica que |f (x)| ≤ Ms para todo punto x ∈ [c, s′ ].
120
(4) Agregando los resultados obtenidos en los ı́tems (2) y (3), se deduce que
para todo x ∈ [a, s′ ] = [a, c] ∪ [c, s′ ]. Por lo tanto, f está acotada en el intervalo [a, s′ ],
lo que demuestra que s′ ∈ A.
(5) Como s′ ∈ A, tenemos que s′ ≤ s = sup(A). Por otro lado, tenemos que s + 2δ ≥ s y
b ≥ s, de tal modo que s′ = mı́n s + 2δ , b ≥ s. Luego: s = s′ . Ahora, se observa que
s′ = s < s + 2δ . Entonces s′ ̸= s + 2δ , lo que implica finalmente que s = s′ = b.
En los ı́tems (4) y (5), demostramos que s = s′ = b ∈ A. Por definición del conjunto A, esto
implica que la función f está acotada en el intervalo [a, b].
Observación 4.2.15. La proposición anterior expresa que la imagen f ([a, b]) = {f (x) : x ∈ [a, b]}
de un intervalo [a, b] por una función continua f : [a, b] → R siempre es un conjunto acotado,
lo que implica que dicho conjunto tiene ı́nfimo y supremo:
Demostración.
(2) g(a) = sup(f, [a, a]) = f (a) y g(b) = sup(f, [a, b]) = M .
Para todo x ∈ [a, b] tal que x > x1 , existe un elemento x′ ∈ S tal que x1 < x′ < x. Por
la monotonı́a de g, se deduce que g(x) ≥ g(x′ ) = M (pues x′ ∈ S), entonces g(x) = M .
Queremos demostrar que f (x1 ) = M . Para ello, se supone (por el absurdo) que f (x1 ) < M .
Sea ϵ := M −f2 (x1 ) > 0. Como la función f es continua en el punto x1 , existe un radio
δ > 0 tal que |f (x) − f (x1 )| < ϵ para todo punto x ∈ E(x1 , δ) ∩ [a, b]. Entonces, para todo
x ∈ E(x1 , δ) ∩ [a, b], tenemos que f (x) − f (x1 ) < ϵ, es decir:
f (x1 ) + M
f (x) < f (x1 ) + ϵ = =M +ϵ
2
En todos los casos, llegamos a una contradicción, lo que demuestra que la hipótesis f (x1 ) <
M es absurda. Por lo tanto, tenemos que f (x1 ) = M .
Una consecuencia obvia del teorema de Weirstrass (combinado con el Corolario 4.2.10)
es que la imagen de un intervalo cerrado por una función continua es un intervalo cerrado:
o bien tenemos que x < x′ , entonces f (x) < f (x′ ), y luego f (x) ̸= f (x′ )
o bien tenemos que x > x′ , entonces f (x) > f (x′ ), y luego f (x) ̸= f (x′ )
Demostración. Sólo se considera el caso donde f es estrictamente creciente (el caso donde
f es estrictamente decreciente es análogo). Recordemos que sólo se consideran funciones
definidas en un intervalo cuyo interior no es vacı́o, lo que significa que I ◦ ̸= ∅10 . Por la
proposición 4.2.18, ya sabemos que la función f define una biyección entre el intervalo I y
su imagen J := f (I), y que la función inversa f −1 : J → I es estrictamente creciente. Para
demostrar que f −1 es continua, se considera un punto y0 ∈ I, y se escribe x0 := f −1 (y0 ).
Dada una precisión ϵ > 0, se trata de construir un radio δ > 0 tal que
Caso donde x0 es un punto interior de I (es decir: x0 ∈ I ◦ ). En este caso, existen dos
puntos x− + − + −
0 , x0 ∈ I tales que x0 − ϵ < x0 < x0 < x0 < x0 + ϵ. Se escriben y0 := f (x0 )
+ + − +
e y0 := f (x0 ). Como f es estrictamente creciente, tenemos que y0 < y0 < y0 . Ahora,
+ +
se considera el radio δ > 0 definido por δ := mı́n y0 − y0 , y0 − y0 > 0. Dado un
punto y ∈ I tal que |y − y0 | < δ, se observa que
pues δ ≤ y0+ − y0 , e
y > y0 − δ ≥ y0 − (y0 − y0− ) = y0−
pues δ ≤ y0 − y0− de tal modo que y0− < y < y0+ . Como f −1 es estrictamente creciente,
se deduce que
x0 − ϵ < x−
0 = f
−1 −
(y0 ) < f −1 (y) < f −1 (y0+ ) = x+
0 < x0 + ϵ
En todos los casos, logramos definir un radio δ > 0 que cumple la condición (∗). Por lo
tanto, la función inversa f − : J → I es continua en el punto y0 ∈ J.
Ejemplo 4.2.20 (Función raı́z n-ésima). (1) Dado un entero n ≥ 1, se considera la fun-
ción f : [0, +∞) → [0, +∞) definida por f (x) = xn . Se verifica fácilmente que:
La función f es continua y estrictamente creciente en [0, +∞).
f (0) = 0 y lı́m f (x) = +∞, lo que implica que la imagen del intervalo [0, +∞)
x→+∞
por la función f es el intervalo [0, +∞).
Por el Teorema 4.2.19, la función f define una biyección entre [0, +∞) y [0, +∞),
y la función inversa f −1 : [0, +∞) → [0, +∞) es continua y estrictamente creciente
en el intervalo
√ [0, +∞). Dicha función inversa se llama la función raı́z n-ésima, y se
escribe x := f −1 (x) para todo x ∈ [0, +∞). Por construcción, tenemos que
n
√ √ n
n
xn = f −1 (f (x)) = x y ( n x) = f (f −1 (x)) = x
para todo x ≥ 0.
(2) En el caso donde el entero n es impar, se puede reemplazar el intervalo [0, +∞) por
R, pues la función f : R → R definida por f (x) = xn es estrictamente creciente en R.
√ biyección entre R y R, lo que permite extender
En este caso, la función f define una
la definición de la raı́z n-ésima n x := f −1 (x) a todos los números reales. Como
anteriormente, la función raı́z n-ésima (extendida a R) es continua y estrictamente
creciente en R.
126
(2) Verificar que cuando los enteros n, m ≥ 1 son impares, las igualdades anteriores se
cumplen para todos los números y, y ∈ R
lo que implica que la imagen de R+ por la función logaritmo es el intervalo (−∞, +∞) = R.
Por lo tanto, la función logaritmo define una biyección entre R+ y R, cuya función inversa se
llama la función exponencial y se escribe exp. Por el Teorema 4.2.19, la función exp: R → R+
es continua y estrictamente creciente en R.
(1) Usando la definición de la función exponencial (exp(x) = log−1 (x) para todo x ∈ R) y
la propiedad fundamental del logaritmo (log(xy) = log(x)+log(y) para todos x, y > 0),
demostrar las siguientes igualdades para todos x, y ∈ R;
127
(a) exp(0) = 1
(b) exp(x + y) = exp(x) exp(y)
1
(c) exp(−x) = exp(x)
(2) Se define la constante e por e := exp(1) ≈ 2, 718. Demostrar por inducción completa
que exp(n) = en para todo n ∈ N. Usando la relación exp(−x) = exp(x)1
, demostrar
más generalmente que exp(n) = e para todo n ∈ Z.
n
Observación 4.2.22. Por analogı́a con la igualdad exp(n) = en , se escribre más general-
mente ex := exp(x) para todo número x ∈ R. Con esta notación, las igualdades del Ejercicio
50 se escriben
(a) e0 = 1
(b) ex+y = ex ey
(c) e−x = 1
ex
para todos x, y ∈ R.
Ejercicio 51 (Potencia generalizada). Las funciones logaritmo y exponencial permiten definir
la notación xy para todos los números x > 0 r y ∈ R, escribiendo
xy := ey log(x) = exp(y log(x))
(1) Demostrar que para todos x > 0 y n ∈ N, el número xn definido por xn := en log(x) es
igual a la potencia xn definida del modo usual. (Sugerencia: demostrar por inducción
completa que la propiedad se cumple para todo n ∈ N, y extender la propiedad a todo
n ∈ Z usando la relación e−y = e1y .)
(2) Demostrar las siguientes igualdades para todos x, x′ > 0 e y, y ′ ∈ R:
(a) x0 = 1y = 1
(b) x1 = x
(c) x−1 = 1
x
′ ′
(d) xy+y = xy xy
1 y
(e) x−y = 1
xy
= x
′ ′ ′
(f) (xy )y = (xy ) = xyy y
Caso donde x0 = mı́n(I) (es decir: x0 es el extremo inferior del intervalo I). En este
caso, existe un radio δ > 0 tal que [x0 , x0 + δ] ⊂ I. Como la función f es integrable en
el intervalo [x0 , x0 + δ], está acotada en dicho intervalo. Y como
Caso donde x0 = máx(I) (es decir: x0 es el extremo superior del intervalo I). Este caso
es análogo al caso anterior.
es continua en el intervalo I.
Demostración. Sea x0 ∈ I. Por el lema anterior, sabemos que la función f está acotada
en un entorno del punto x0 , lo que significa que existen un radio δ > 0 y un número M ≥ 0
11
En el caso particular donde el intervalo I ya es de la forma I = [a, b] (con a < b), la función f es
localmente integrable en I = [a, b] si y sólo si es integrable en [a, b].
129
tales que |f (x)| ≤ M para todo x ∈ E(x0 , δ) ∩ I. Entonces, para todo x ∈ E(x0 , δ) ∩ I,
tenemos que
Z x Z x0
|F (x) − F (x0 )| = f (t)dt − f (t)dt
a a
Z x
= f (t)dt
x0
Z máx{x0 ,x}
≤ |f (t)|dt
mı́n{x0 ,x}
Z máx{x0 ,x}
≤ M dt
mı́n{x0 ,x}
= M |x − x0 |
Como lı́m M |x − x0 | = 0, se deduce por el teorema del sándwich que lı́mx→x0 |F (x) −
x→x0
F (x0 )| = 0, es decir: lı́m F (x) = F (x0 ).
x→x0
Ası́ la Proposición 4.2.24 nos da una nueva prueba de la conrinuidad de la función log.
Observación 4.3.1. Vimos que una función f : I → R es continua cuando para todo punto
x0 ∈ I y para toda precisión ϵ > 0, existe un radio δ > 0 tal que
Fijando ϵ > 0, el valor posible para el radio δ no es único: en efecto, si un radio δ cumple
la condición anterior, entonces todo radio δ ′ < δ también la cumple. Sin embargo, existe en
general un máximo radio δ que no podemos superar si queremos mantener la condición (∗).
Veamos un ejemplo.
Ejemplo 4.3.2. Sea f : R → R la función definida por f (x) = x2 para todo x ∈ R. Fijados
un punto x0 > 0 y una precisión δ > 0 tal que ϵ < x20 , queremos determinar el máximo radio
δ > 0 tal que la condición (∗) se cumple. Para todo x ≥ 0, se observa que
p p
Luego, el radio δ > 0 debe cumplir las condiciones δ ≤ x0 − x20 − ϵ y δ ≤ x20 + ϵ − x0 . Se
puede demostrar que la segunda condición
p es más restrictiva. Por lo tanto, el máximo radio
2
que cumple la condición (∗) es δ := x0 + ϵ − x0 .
Observación 4.3.3. El ejemplo anterior muestra que, en general, el radio δ > 0 no sólo
depende de la precisión ϵ > 0 pero que también depende del punto x0 . Para muchas aplica-
ciones (en particular en el cálculo integral), es útil que el radio δ > 0 sólo dependa de la
precisión ϵ > 0. (Vimos que no es el caso en el ejemplo anterior.) Para ello, se necesita
introducir una condición más exigente que la continuidad: la continuidad uniforme.
131
f es uniformemente continua en I
⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (1)
⇒ ∀ϵ > 0, ∀x ∈ I, ∃δ > 0, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (2)
⇔ ∀x ∈ I, ∀ϵ > 0, ∃δ > 0, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (3)
⇔ f es continua en I
Observación 4.3.6. En el razonamiento anterior, usamos las siguientes dos reglas lógicas,
que rigen la conmutatividad de los cuantificadores:
∃δ > 0, ∀x ∈ I, . . . ⇒ ∀x ∈ I, ∃δ > 0, . . .
que expresa que un enunciado de tipo “existe, para todo” siempre implica el enunciado
de tipo “para todo, existe” obtenido intercambiando ambos cuantificadores.
¡Cuidado! Sólo se trata de una implicación, pues el recı́proco no se cumple en general12 .
∀ϵ > 0, ∀x ∈ I, . . . ⇔ ∀x ∈ I, ∀ϵ > 0, . . .
que expresa que siempre se pueden intercambiar dos cuantificadores consecutivos del
mismo tipo (dos “∀” o dos “∃”) sin cambiar el sentido del enunciado considerado. (La
misma regla se cumple para el cuantificador existencial: “∃1 ∃2 ⇔ ∃2 ∃1 ”.)
Por otro lado, la condición de continuidad uniforme es más fuerte que la condición de
continuidad, pues existen funciones continuas que no son uniformemente continuas:
Ejemplo 4.3.7 (Continuación del Ejemplo 4.3.2). Consideremos de nuevo la función f (x) =
x2 . Es claro que f es continua en R. Queremos demostrar que f no es uniformemente
12
En efecto, uando se dice “todos los uruguayos tienen una cédula” (enunciado de tipo ∀∃), esto no implica
que “existe una cédula compartida por todos los uruguayos” (enunciado del tipo ∃∀).
132
Por otro lado,√vimos en el Ejemplo 4.3.213 que el máximo radio que cumple la condición (∗)
es el número x2 + ϵ − x (> 0). Por lo tanto, tenemos que
√
δ ≤ x2 + ϵ − x
Observación 4.3.9. El enunciado del lema se puede entender del modo siguiente. Fijado
un radio r > 0, es claro que siempre se puede cubrir el intervalo [a, b] por una sucesión
13
Aquı́, las variables x y x′ tiene el papel de las variables x0 y x (respectivamente) en el Ejemplo 4.3.2.
133
finita de entornos E(x1 , r), . . . , E(xn , r) del mismo radio r: basta con tomar un entero n
suficientemente grande para que 2nr > b − a, y definir los centros x1 , . . . , xn ∈ [a, b] por
(2i − 1)(b − a)
xi :=
2n
con i = 1, . . . , n, ası́ como lo ilustra la siguiente figura:
Para demostrar el teorema de Heine-Cantor, se necesita considerar una situación mucho más
general donde los entornos que cubren el intervalo [a, b] tienen un radio variable forzado por
una función positiva h : [a, b] → R+ . (Intuitivamente, la función h asocia a cada punto
de [a, b] el “radio autorizado” alrededor de dicho punto.) El lema expresa que, cualquiera
sea la función positiva h : [a, b] → R+ (no se requiere ninguna hipótesis de continuidad
sobre h), siempre se puede hallar una sucesión finita de puntos x1 , . . . , xn ∈ [a, b] tal que los
correspondientes entornos E(x1 , h(x1 )), . . . , E(xn , h(xn )) cubran el intervalo [a, b]:
Demostración Dado un intervalo [c, d] ⊂ [a, b], se llama h-cubrimiento finito del intervalo
[c, d] a toda sucesión finita x1 , . . . , xn ∈ [c, d] tal que
(2) Además, como A ⊂ [a, b] está acotado, tiene supremo s := sup(A) ∈ [a, b]
134
(3) Como s = sup(A), existe un punto c ∈ A tal que s − h(s) < c ≤ s. Y como c ∈ A,
existe (por definición del conjunto A) un h-cubrimiento finito x1 , . . . , xn del intervalo
[a, c], lo que significa que [a, c] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))
(4) Por otro lado, tenemos que c ∈ E(s, h(s)) (por construcción), entonces [c, s] ⊂ E(s, h(s)):
la sucesión definida por el único punto s es un h-cubrimiento finito del intervalo [c, s].
(5) Pegando los dos h-cubrimientos finitos definidos en (3) y (4), se deduce que
[a, s] ⊂ [a, c] ∪ [c, s] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn )) ∪ E(s, h(s))
Por lo tanto, la sucesión finita x1 , . . . , x : n, s (con n+1 elementos) es un h-cubrimiento
finito del intervalo [a, s], lo que demuestra que s ∈ A.
(6) Ahora, se trata demostrar que s = b. Para ello, se supone (por absurdo) que s < b
y se considera el punto s′ := mı́n(s + h(s)
2
, b). Por construcción, tenemos que s′ > s y
s ∈ E(s, h(s)). Entonces, tenemos que [s, s′ ] ⊂ E(s, h(s)), de tal modo que
′
Demostración. Fijada una precisión ϵ > 0, se trata de construir un radio δ > 0 tal que
∀x, x′ ∈ [a, b], |x − x′ | < δ ⇒ |f (x) − f (x′ )| < ϵ (∗)
Como f es continua en [a, b], se puede asociar a cada punto x0 ∈ [a, b] un radio δx0 tal que
∀x ∈ [a, b], |x − x0 | < δx0 ⇒ |f (x) − f (x0 )| < ϵ/2 (∗∗)
Sea h : [a, b] → R+ la función definida por h(x) := δx /2 para todo x ∈ [a, b]. Por el lema
4.3.8, existe una sucesión finita de puntos x1 , . . . , xn ∈ [a, b] tales que
[a, b] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))
lo que permite definir el número δ > 0 por δ := mı́n {h(x1 ), . . . , h(xn ))}. Ahora, se trata de
demostrar que el radio δ cumple la condición (∗). Para ello, se consideran puntos x, x′ ∈ [a, b]
tales que |x − x′ | < δ. Como [a, b] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn )), existe un ı́ndice i tal
que x ∈ E(xi , h(xi )). Por construcción, tenemos que |x − xi | < h(xi ) = δxi /2 < δxi , de tal
modo que |f (x) − f (xi )| < ϵ/2 por (∗∗). Por otro lado, tenemos que
|f (x′ ) − f (x)| ≤ |f (x′ ) − f (xi )| + |f (xi ) − f (x)| ≤ ϵ/2 + ϵ/2 = ϵ
lo que acaba de demostrar la condición (∗).
135
Ejemplo 4.3.11 (Continuación del Ejemplo 4.3.2). Vimos en el Ejemplo 4.3.7 la función
f (x) = x2 no es uniformemente continua en R. Sin embargo, el teorema de Heine-Cantor
implica que la misma función es uniformemente continua en todo intervalo [a, b]. Ası́, dada
una precisión ϵ > 0, no existe ningún radio δ > 0 que cumpla la condición
(donde las variables x y x′ recorren todo R), pero cuando uno se restringe a un intervalo
cerrado [a, b], siempre puede hallar un radio δa,b > 0 tal que
Proposición 4.3.12. Toda función continua en un intervalo cerrado [a, b] (con a < b)
es integrable en [a, b].
Demostración. Sea f : [a, b] → R una función continua (con a < b). Por la Proposición
4.2.14, sabemos que f está acotada en el intervalo [a, b], lo que permite definir sus sumas
inferiores y superiores. Para demostrar que f es integrable en [a, b], se usa el criterio de
integrabilidad a menos de ϵ. Fijada una precisión ϵ > 0, se elige un número η > 0 tal que
η < ϵ/(b − a)14 . Como la función f es continua en [a, b], es uniformemente continua en [a, b]
(por el Teorema 4.3.10), y existe un radio δ > 0 tal que
Ahora se elige una partición P = {a0 , a1 , . . . an } ⊂ [a, b] tal que ∥P ∥ < δ. Dado un subin-
tervalo [ai , ai+1 ] (i = 0, . . . , n − 1), se observa que para todos x, x′ ∈ [ai , ai+1 ], tenemos que
|x − x′ | < δ (pues ai+1 − ai ≤ ∥P ∥ < δ), luego |f (x) − f (x′ )| < η por (∗). Por lo tanto,
tenemos que
f (x) − f (x′ ) ≤ η
para todos x, x′ ∈ [ai , ai+1 ]. Pasando al supremo (para x ∈ [ai , ai+1 ]) y al ı́nfimo (para
x′ in[a, b]) en la desigualdad anterior, se deduce (ejercicio) que
Ası́ demostramos que para toda precisión ϵ > 0, existe una partición P del intervalo [a, b]
tal que S ∗ (f, P ) − S ∗ (f, P ) < ϵ. Por el criterio de integración a menos de ϵ, se deduce que
la función f es integrable en el intervalo [a, b].
(2) en el intervalo (ai , ai+1 ), la función f tiene lı́mites finitos en el punto ai (por la
derecha) y en el punto ai+1 (por la izquierda).
137
(1) Verificar que toda función escalonada en [a, b] es seccionalmente continua en [a, b].
(2) Demostrar que toda fucnión seccionalmente continua en [a, b] está acotada en [a, b].
Demostració[Link] f : [a, b] → R una función seccionalmente continua en [a, b]. Por defini-
ción, existe una partición P = {a0 , a1 , . . . , an } ⊂ [a, b] que cumple las condiciones (1) y (2)
de la Definición 4.3.14. En cada subintervalo [ai , ai+1 ] (i = 0, . . . , n − 1), se observa que la
función fi : [ai , ai+1 ] → R definida por
f (x) si a < x < b
fi (x) = x→a lı́m+ si x = a
lı́m
si x = b
−x→b
es continua en el intervalo [ai , ai+1 ] (por construcción), luego es integrable en dicho intervalo.
Y como la función f coincide con fi en el intervalo [ai , ai+1 ], salvo (quizá) en los dos puntos
ai y ai+1 , se deduce que la función f es integrable en el intervalo [ai , ai+1 ]15 . Por la propiedad
de aditividad respecto al intervalo, se concluye que la función f es integrable en el intervalo
[a, b] = [a0 , a1 ] ∪ · · · ∪ [an−1 , an ].
15
Veáse el capı́tulo sobre las integrales, Proposición 82 insert ref
138
Definición 4.3.17 (Valor medio de una función integrable). Sea f : [a, b] → R una
función integrable en un intervalo [a, b] (con a < b). Se llama valor medio de la función
f en el intervalo [a, b] al número µ ∈ R definido por:
Z b
1
µ := f (x)dx
b−a a
Como la altura (algebraica) del rectángulo de ancho b − a que tiene la misma área
algebraica que la región ubicada entre el eje x y la gráfica de la función f :
Ejemplo 4.3.19. Dado que las anteriores dos figuras representan la gráfica de la función
f (x) = 13 x3 − x + 1 en el intervalo [−1, 2], calcular el correspondiente valor medio µ.
139
Demostración. Como la función f es continua en el intervalo [a, b], es integrable en [a, b],
Rb 1
Rb
lo que justifica la existencia de la integral a f (x)dx y del valor medio µ = b−a a
f (x)dx.
Por el teorema de Weierstrass (Teorema 4.2.16), existen x0 .x1 ∈ [a, b] tales que f (x0 ) = m
y f (x1 ) = M , donde m representa el mı́nimo y M el máximo de la función en el intervalo
[a, b]. Por lo tanto, tenemos que m ≤ f (x) ≤ M para todo x ∈ [a, b], de tal modo que
Z b
m(b − a) ≤ f (x)dx ≤ M (b − a)
a
Derivadas
¿Por qué la derivada es tan tardı́a? Porque recoge ideas y técnicas que se elaboraron a
lo largo de mucho tiempo y que tienen diversos orı́genes. En el Renacimiento, los europeos
se familiarizaron nuevamente con la matemática de los antiguos griegos –que fueron, ante
todo, grandes geómetras–, y aprendieron el álgebra que se habı́a desarrollado en el mundo
islámico mientras Europa estaba en el medioevo. Estas dos ramas de la matemática –el álge-
bra y la geometrı́a– confluyeron en la década de 1630 en la geometrı́a analı́tica, inventada
independientemente por Pierre de Fermat y René Descartes, que permitió expresar obje-
tos geométricos (tales como curvas, superficies, regiones, trayectorias) mediante ecuaciones
algebraicas. Esto abrió la posibilidad de explorar problemas geométricos mediante cálculo
simbólico.
La derivada fue usada por diversos matemáticos para resolver problemas geométricos
antes de ser bien comprendida, y antes de ser definida como la conocemos hoy. Esto es común
al desarrollo de muchos conceptos matemáticos. Fermat, tratando de encontrar máximos y
mı́nimos de funciones, observó que éstos se dan en puntos en los cuales la tangente a la
gráfica es horizontal. Las ideas de Fermat fueron retomadas por varios matemáticos1 que
querı́an, más generalmente, encontrar la recta tangente a una curva en un punto cualquiera.
Isaac Barrow, maestro de Newton, se dio cuenta de que las tangentes a una curva estaban
relacionadas con el área encerrada por ésta. Este intenso trabajo generó un conjunto de
métodos analı́ticos que permitı́an resolver diversos problemas geométricos.
141
142
una nueva teorı́a que englobaba mucha matemática existente bajo dos conceptos centrales:
el de derivada y el de integral. Como ya habı́a intuido Barrow, estos conceptos, lejos de
ser independientes, son en cierto modo “duales”, como dos caras de una misma moneda.
Expresaron esta idea en lo que hoy conocemos como el Teorema Fundamental del Cálculo,
que demostraron con argumentos rigurosos. Es por todo esto que consideramos a Newton y
a Leibniz los creadores del Cálculo Diferencial e Integral.
Ası́, por increı́ble que parezca y en contra de lo que indica el sentido común, la noción
de derivada no fue principalmente motivada por la mecánica clásica. Hasta el siglo XVII
la velocidad habı́a sido ampliamente estudiada por numerosos y destacados fı́sicos desde
tiempos de Aristóteles, y notoriamente por Galileo Galilei. Sin embargo, fue Newton2 quien
unificó las leyes de la mecánica clásica y expresó esta última en términos del cálculo, haciendo
del cálculo diferencial e integral y la mecánica clásica dos disciplinas inseparables. Nuestra
comprensión del cálculo está sin duda muy influida por esta sı́ntesis.
Dedicaremos esta segunda mitad del curso a entender la derivada, y su ı́ntima y fascinante
relación con la integral.
5.1.1. Velocidad
¿Es importante que la carretera sea recta? No, para nada. Si la carretera no es recta,
miramos la misma gráfica y constatamos que ésta describe perfectamente el movimiento.
Los kilómetros se miden a lo largo de la carretera, y decir que a los 25 minutos de haber
salido el auto está en el kilómetro 43 tiene perfecto sentido.
Ası́, un movimiento unidimensional puede ser, por ejemplo, el de un auto en una ca-
rretera, el de una corredora en la rambla de Montevideo, el de un carrito en su riel de la
montaña rusa, o el de una manzana que cae verticalmente desde la rama de un árbol. Todos
ellos pueden ser modelados por la función f (t).
f (t + ∆t) − f (t)
vm = km/min.
∆t
Observemos en la figura que la velocidad media es la pendiente del segmento rojo.
144
Para determinar una recta en el plano, alcanza con saber su pendiente y un punto por
el que pasa. En nuestro caso, ya tenemos el punto, (x0 , f (x0 )), y vamos a determinar la
pendiente.
Si tomamos un punto x ∈ [a, b] cercano a x0 , el segmento que une (x, f (x)) y (x0 , f (x0 ))
tiene pendiente3
f (x) − f (x0 )
.
x − x0
Para hallar la pendiente de la recta tangente, tenemos que hacer que x esté cada vez más
cerca de x0 . Es decir, la pendiente de la tangente a la gráfica en el punto (x0 , f (x0 )) es el
lı́mite
f (x) − f (x0 )
lı́m . (5.1.2)
x→x0 x − x0
3
Recordemos que si en una recta tenemos dos puntos p0 = (x0 , y0 ) y p1 = (x1 , y1 ), la pendiente de la
∆y
misma es ∆x = xy11 −y
−x0 .
0
145
Este lı́mite podrı́a no existir, como no existe en el caso de la siguiente figura. Pero, si el
lı́mite existe, es la pendiente de la recta tangente.
f (x0 + h) − f (x0 )
lı́m . (5.1.3)
h→0 h
146
Observemos los lı́mites dados por las ecuaciones (5.1.1) y (5.1.3). Las variables que
aparecen en ellos tienen nombres distintos, pero por lo demás, son iguales.
f (x + h) − f (x)
. (5.1.4)
h
f (x + h) − f (x)
f ′ (x) = lı́m .
h→0 h
Cuando este lı́mite existe y es finito, decimos que f es derivable en x. En caso contrario4 ,
decimos que f no es derivable en x.
Decimos que una función f es derivable si es derivable en todos los puntos de su dominio.
Veremos más adelante resultados que nos van a permitir calcular fácilmente las deriva-
das de “funciones dadas por fórmulas”. Por “funciones dadas por fórmulas”nos referimos a
funciones que se pueden obtener haciendo sumas, productos, cocientes y composiciones de
funciones polinómicas, exponenciales, logarı́tmicas y trigonométricas. Sin embargo, siempre
hay que recordar que la derivada es, por definición, el lı́mite del cociente incremental. Esta
definición es aplicable a una clase más grande de funciones, y será usada constantemente en
lo que resta del curso.
y = mx + n,
Terminaremos esta sección con una propiedad importantı́sima de las funciones derivables:
son continuas. Más concretamente, tenemos la siguiente proposición:
o equivalentemente que
lı́m f (x + h) − f (x) = 0.
h→0
Entonces
f (x + h) − f (x)
lı́m f (x + h) − f (x) = lı́m h = 0. □
h→0 h→0 h |{z}
| {z } tiende a 0
acotado
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
c−c
= lı́m
h→0 h
= lı́m 0 = 0
h→0
Su derivada es
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
x+h−x
= lı́m
h→0 h
h
= lı́m = 1.
h→0 h
Su derivada es
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
(x + h) − x2
2
= lı́m
h→0 h
2xh + h2
= lı́m
h→0 h
= lı́m (2x + h) = 2x.
h→0
149
Para esto, recordemos antes la fórmula del binomio de Newton, que dice que para dos
números reales a y b
Xn
n
(a + b) = cnk ak bn−k ,
k=0
n!
donde cnk es el número combinatorio cnk = k!(n−k)!
.
Entonces
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
(x + h)n − xn
= lı́m
Pn hn k n−k
h→0
c x h − xn
= lı́m k=0 k
h→0 h
Pn−1 n k n−k
c x h
= lı́m k=0 k
h→0 h
n−1
X hn−k
= lı́m cnk xk
h→0
k=0
h
n−1
X
= lı́m cnk xk hn−k−1
h→0
k=0
n−1
X
= cnk xk lı́m hn−k−1
h→0
k=0
= cnn−1 xn−1 = nxn−1 .
Es decir, f ′ (x) = nxn−1 para todo x ∈ R. Esto coincide con lo que nos dio el cálculo para
n = 1 y n = 25 .
Sea f : (0, +∞) → R dada por f (x) = log(x). Calcularemos f ′ (1), es decir,
1+h
f (1 + h) − f (1)
Z
′ log(1 + h) 1 1
f (1) = lı́m = lı́m = lı́m dt.
h→0 h h→0 h h→0 h 1 t
5
En realidad, cuando x = 0 y n = 1 la fórmula anterior no es válida, porque no podemos hacer 00 . Sin
embargo, ya vimos directamente que la derivada de f (x) = x en x = 0 da 1.
150
Consideremos primero el caso en que h > 0. Tomando la partición P = {1, 1 + h}, tenemos
R 1+h
que las sumas inferior y superior para la integral 1 1t dt son, respectivamente, S∗ (f, P ) =
h
1+h
y S ∗ (f, P ) = h, por lo que
1 log(1 + h)
≤ ≤ 1.
1+h h
Por el teorema del sandwich, lı́mh→0+ log(1+h)
h
= 1. Haciendo un razonamiento análogo para
log(1+h)
h < 0 se llega a que lı́mh→0− h
= 1, por lo que
log(1 + h)
f ′ (1) = lı́m = 1.
h→0 h
Ejercicio 55. 1. Probar que para todo x > 0 y h ∈ (−x, +∞)6 el cociente incremental
log(x+h)−log(x)
h
está acotado entre x1 y x+h
1
.
2. Probar que para todo x > 0 la función logaritmo es derivable en x y log ′ (x) = x1 .
Ejemplo 5.2.6. Derivada de la función seno en 0
6
Es decir, h es tal que x + h > 0.
151
El ángulo h, que hemos tomado positivo, está medido en radianes, y un radián es una
1 h
proporción 2π del ángulo completo. Por lo tanto, el ángulo h es una proporción 2π del ángulo
completo y el área de F2 es
h
área(F2 ) = · π,
2π
pues π es el área del cı́rculo. Por otro lado, área(F1 ) = sen(h)/2 y área(F3 ) = tan(h)/2. Por
lo tanto, la ecuación (5.2.7) dice que
sen(h) h 1 sen(h)
≤ ≤ .
2 2 2 cos(h)
2
Multiplicando por sen(h)
esto queda
h 1
1≤ ≤ .
sen(h) cos(h)
sen(h)
f ′ (0) = lı́m = 1.
h→0 h
Ejercicio 56. 1. Verificar que la función coseno es derivable en 0 y calcular su derivada
cos′ (0).
probar que cos y sen son derivables en R, y que sen′ (x) = cos(x) y cos′ (x) = −sen(x).
152
Un comentario “circular”
1
En el cálculo anterior se dijo que un radián es una proporción de 2π del ángulo
completo. Esta no es la definición habitual de radián. Sin embargo, con esta definición
se puede ver que, si π es el área del cı́rculo*, el área de un sector angular de ángulo h
es h/2, que es lo que hemos usado.
Ası́, lo anterior puede considerarse una demostración de que lı́mh→0 sen(h) h
= 1.
¿Cómo podrı́amos calcular, usando esto, la longitud de la circunferencia? No hemos
definido en este curso la longitud de una curva, pero podemos pensar que la longitud
de la circunferencia es el lı́mite de los perı́metros de los n-ágonos regulares inscriptos
cuando n se hace cada vez más grande. El perı́metro del n-ágono regular se puede
calcular como ejercicio, usando un poco de trigonometrı́a. ¿A qué se aproxima este
perı́metro cuando n crece? ¡Para ver que se aproxima a 2π, tenemos que usar justa-
mente que lı́mh→0 sen(h)
h
= 1! Es decir, usamos este lı́mite para ver que la longitud de
la circunferencia es 2π.
Una vez que sabemos que la longitud de la circunferencia es 2π, podemos ver que el
arco de circunferencia determinado por un radián tiene longitud 1–lo que normalmente
se presenta como la definición de radián.
¡Pero que la longitud de la circunferncia es 2π es algo que sabemos de toda la vida!
¿Cómo lo sabemos? Porque nos lo dijeron en la escuela, pero nunca nos explicaron
realmente por qué es cierto. Si usamos este dato para calcular el lı́mite del Ejemplo
de la derivada de la función seno en 0, y usamos este lı́mite para “demostrar”que la
longitud de la circunferencia es 2π, estamos haciendo un razonamiento circular.
*Estamos tan acostumbrados a trabajar con el número π que, cuando lo vemos, no nos despierta
ninguna suspicacia. Pero, ¿qué es π? Una definición posible, y de las más razonables, es decir que es
el área del cı́rculo de radio 1.
La Proposición 5.1.6 nos dice que si una función es derivable en un punto, entonces es
continua en ese punto. ¿Será cierta la afirmación recı́proca? Es decir, ¿será cierto que si una
función es continua en un punto, también es derivable?
No, la vida del estudiante de cálculo no es tan plácida. Para ver esto, consideremos la
función valor absoluto f : R → R dada por f (x) = |x|, cuya gráfica aparece en la figura.
Esta función es continua en todos los puntos de R, y vamos a ver que no es derivable en 0.
El cociente incremental de f en 0 es
f (h) − f (0) |h|
= .
h h
153
h
Cuando h > 0, esto vale h
= 1, por lo que
f (h) − f (0)
lı́m+ = 1.
h→0 h
−h
Cuando h < 0, esto vale h
= −1, por lo que
f (h) − f (0)
lı́m− = −1.
h→0 h
f (h)−f (0)
Por lo tanto, no existe lı́mh→0 h
, es decir, f no es derivable en 0.
x sen x1 si x ̸= 0
f (x) =
0 si x = 0
Observemos la figura. La gráfica de la función f está comprendida entre las de las fun-
ciones |x| y −|x|, dos funciones continuas que valen 0 en 0. Por eso, cerca de 0, hay un
sandwich
−|x| ≤ f (x) ≤ |x|
que nos permite ver la continuidad de f en 0.
1
x2 sen x
si x ̸= 0
g(x) =
0 si x = 0
por lo que
g(h) − g(0)
g ′ (0) = lı́m = lı́m hsen(1/h) = 0.
h→0 h h→0
Observemos la figura. La gráfica de la función g está comprendida entre las de las fun-
ciones x2 y −x2 , es decir,
−x2 ≤ g(x) ≤ x2 .
Tanto −x2 como x2 son funciones derivables en 0, y su derivada vale 0. Dicho de otro modo,
las parábolas y = −x2 e y = x2 tienen recta tangente en el punto (0, 0), que es la recta
horizontal y = 0.
¿Tiene sentido decir que la gráfica de g tiene recta tangente en (0, 0), y que esta es la
recta horizontal y = 0? ¡Quién sabe! Pero sı́ tiene sentido decir que g es derivable en 0 y que
g ′ (0) = 0, porque la derivada es el lı́mite del cociente incremental, y lo acabamos de calcular.
Como la derivada es un lı́mite, las propiedades que conocemos de los lı́mites nos permiten
calcular derivadas.
Ejercicio 59. Demostrar que (f + g)′ (x) = f ′ (x) + g ′ (x), usando la linealidad del lı́mite.
Demostración de 2.
Lo que hemos hecho es, en el numerador del cociente incremental, sumar y restar
f (x)g(x + h). Luego, agrupamos los sumandos convenientemente y aplicamos la propiedad
distributiva.
Tomando lı́mite,
f (x + h)g(x + h) − f (x)g(x)
(f g)′ (x) = lı́m
h→0 h
f (x + h) − f (x) g(x + h) − g(x)
= lı́m lı́m g(x + h) + f (x) lı́m .
h→0 h h→0 h→0 h
Por la Proposición 5.1.6, lı́mh→0 g(x + h) = g(x), y
Demostración de 3.
es un espacio vectorial.
Según la Proposición 5.2.10, (f + g)′ (x) = f ′ (x) + g ′ (x) y (cf )′ (x) = cf ′ (x) para toda
constante c. Esto nos dice que la función T : V → R dada por T (f ) = f ′ (x) es una
transformación lineal.
Cuando escribimos una función “dada por una fórmula”, como por ejemplo
φ:R → R
φ(x) = sen(log(x2 + 3))
estamos, en general, haciendo sumas, productos, cocientes y composiciones de funciones
más sencillas. Para poder derivar una función ası́, lo que nos falta es saber cómo derivar una
composición de funciones. El resultado que nos dice cómo hacer esto se conoce como Regla
de la Cadena.
f (g(x0 ) + k) − g(x0 )
lı́m = f ′ (g(x0 )).
h→0 k
El problema con esta idea es que cuando dividimos entre g(x0 + h) − g(x0 ) en la ecuación
(5.2.16), no tuvimos cuidado de no dividir entre cero. Es decir, podrı́a pasar que para valores
de h ̸= 0 la diferencia g(x0 + h) − g(x0 ) fuera igual a 0.
f ◦ g(x) = x ∀x ∈ J (5.2.18)
y
g ◦ f (x) = x ∀x ∈ I. (5.2.19)
Antes de abordar este problema, recordemos algunas particularidades que tienen las
funciones biyectivas entre intervalos de R.
2. Suponer que para x < y < z se tiene que f (x) < f (y) y f (z) < f (y), ya que el otro
caso es análogo. Probar que existe λ ∈ (f (x), f (y)) ∩ (f (y), f (z)).8
En este ejercicio se usaron dos corolarios del Teorema de Bolzano, que es un teorema
fundamental sobre las funciones continuas. Dar un ejemplo de una función biyectiva entre
dos intervalos de R que no sea continua y que no sea estrictamente monótona.
Una función biyectiva f y su inversa g tienen gráficos con la siguiente propiedad geométri-
ca:
Esto se ve, por ejemplo, en las gráficas de las funciones exponencial exp : R → (0, +∞)
y logaritmo log : (0, +∞) → R.
8
Recordar el Corolario 4.2.10 del capı́tulo Lı́mites y Continuidad, que dice que la imagen por una función
continua de un intervalo es otro intervalo.
9
Corolario 4.2.9 del capı́tulo Lı́mites y Continuidad.
161
La simetrı́a axial de eje y = x lleva un punto (x, y) en el punto (y, x), por lo que la imagen
de Gr(f ) por esta simetrı́a es el conjunto
X = {(y, x) ∈ J × I / y = f (x)}.
Antes de demostrarlo, vamos a tratar de entender geométricamente lo que nos dice este
teorema.
En este caso, el punto simétrico (y0 , x0 ) = (y0 , g(y0 )) del gráfico de g tiene recta tangente,
que se obtiene simetrizando r respecto de y = x. Llamamos r′ a esta recta. Entonces r′ es
vertical si y sólo si r es horizontal, es decir, si y sólo si f ′ (x0 ) = 0. Cuando f ′ (x0 ) ̸= 0, la
recta r′ tiene pendiente f ′ (x
1
0)
.
Como f ◦ g(y) = y, derivando de ambos lados tenemos que (f ◦ g)′ (y) = 1.a Por la
regla de la cadena, (f ◦ g)′ (y0 ) = f ′ (g(y0 ))g ′ (y0 ), por lo que
1
g ′ (y0 ) = .
f ′ (g(y 0 ))
a
f ◦ g es la función identidad, que es derivable en todos los puntos de J. Por lo tanto, la igualdad
(f ◦ g)′ (y) = 1 es cierta para y ∈ J aún si f y g fueran sólo derivables en x0 e y0 , respectivamente.
función inversa,
1 1
exp′ (y) = ′ = 1 = exp(y).
log (exp(y)) exp(y)
Ejercicio de parcial
A) 12 C) 23 E) 34
B) 13 D) 25 F) 37
f ′ (0) = 22 + 1 = 23
Ejercicio de parcial
A) −2 C) 0 E) 2
B) −1 D) 1 F) 3
y = 2x y y = 2ax + 1 − 2a
sean paralelas. Para que esto suceda, ambas rectas deben tener la misma pendiente, es decir
2 = 2a
165
y, por lo tanto, a = 1.
Notar que en este ejercicio se puede trabajar directamente con f ′ (1) que es la pendiente
2
de la recta tangente a la curva y = ea(x −1) sin necesidad de hallar la ecuación de la recta
tangente.
Una aplicación muy útil de las derivadas al cálculo de lı́mites es la Regla de L’Hôpital, que
nos permite calcular muchos lı́mites “indeterminados”. Esto es, cociente de dos infinitésimos
o de dos infinitos. En esta sección sólo la vamos a enunciar, y daremos su demostración más
adelante.
f (x) f ′ (x)
lı́m = lı́m ′ .
x→x0 g(x) x→x0 g (x)
Consideremos el lı́mite
e2x − 1
lı́m .
x→0 sen(x)
2e2x
lı́m = 2.
x→0 cos(x)
Consideremos el lı́mite
6x − 2
lı́m = 4.
x→1 2x − 1
166
Consideremos el lı́mite 1
e− x
limx→0+ ,
x
que es un lı́mite indeterminado de la forma 0/0. Aplicando la regla de L’Hôpital, tenemos
que
1
−x
1 e 1
e− x 2 e− x
lı́m+ = lı́m+ x = lı́m+ 2 .
x→0 x x→0 1 x→0 x
Esto es correcto, pero no útil. Si seguimos aplicando la regla de L’Hôpital, este lı́mite solo
“empeora”, en el sentido de que el grado del denominador crece.
Consideremos el lı́mite
e1/x
lı́m .
x→0+ log(x)
Aquı́, lı́mx→0+ e1/x = +∞ y lı́mx→0+ log(x) = −∞, por lo que este lı́mite es indeterminado.
Por la regla de L’Hôpital,
1 1 1
ex − 12 e x ex
lı́m+ = lı́m+ x1 = − lı́m+ = −∞.
x→0 log(x) x→0 x→0 x
x
167
Del mismo modo en que vimos algunos teoremas importantes relativos a funciones con-
tinuas en un intervalo [a, b],11 veremos en esta sección teoremas importantes relativos a
funciones que son derivables en un intervalo. El principal, y que da nombre a la sección, es
el Teorema del valor medio de Lagrange.
Una noción similar, pero local, es la de máximo relativo que damos a continuación.
Demostración:
Supongamos que f tiene un máximo relativo en x0 , ya que el caso en que tiene un mı́nimo
es análogo. Sea U un entorno de f , contenido en (a, b), tal que
f (x) ≤ f (x0 ) ∀x ∈ U.
f (x) − f (x0 )
lı́m+ ≤ 0. (5.3.3)
x→x0 x − x0
169
Como f es derivable en x0 , los lı́mites (5.3.3) y (5.3.4) son iguales y valen f ′ (x0 ). Esto
nos dice que, f ′ (x0 ) ≤ 0 y f ′ (x0 ) ≥ 0, por lo que f ′ (x0 ) = 0. □
Como siempre, es importante tener en cuenta las hipótesis de esta proposición, a saber,
que f es derivable en el punto x0 en que tiene el extremo y que x0 es interior al dominio de
f . Cuando estas hipótesis no se cumplen, la proposición no vale, como se ve en los dibujos.
En uno de ellos hay un extremo en un punto en el que la función no es derivable, y en el
otro hay un extremo en un punto que no es interior al dominio de la función.
Teorema 5.3.6 (Teorema de Rolle). Sea f : [a, b] → R una función continua en [a, b]
y derivable en (a, b) tal que f (a) = f (b). Entonces existe c ∈ (a, b) tal que f ′ (c) = 0.
Este teorema nos dice que para una función derivable, si f (a) = f (b), hay algún punto
de la gráfica donde la tangente es horizontal. Este punto no tiene por qué ser único, como
se ve en la figura.
170
Demostración.
Nos queda en caso en que f no es constante. Como f es continua en [a, b], el Teorema
de Weierstrass nos asegura que tiene máximo y mı́nimo absolutos.
Los extremos absolutos pueden darse en el interior de [a, b] o en el borde de [a, b], pero
como f (a) = f (b), algún extremo absoluto tiene que darse en un punto de (a, b). En efecto,
si el máximo absoluto se da en a también se da en b, y como f no es constante el máximo
y el mı́nimo no coinciden. Esto asegura que el mı́nimo se da en algún punto de (a, b). Lo
mismo pasa si en a y b hay un mı́nimo.
Sea entonces c ∈ (a, b) un punto donde hay un extremo absoluto. Entonces, como f es
derivable en c, f ′ (c) = 0. □
El teorema del valor medio de Lagrange se demuestra a partir del de Rolle, y es más
general. Dice lo siguiente:
171
Teorema 5.3.7 (Teorema del valor medio de Lagrange). Sea f : [a, b] → R una
función que es continua en [a, b] y derivable en (a, b). Entonces existe c ∈ (a, b) tal
que
f (b) − f (a)
f ′ (c) = .
b−a
La velocidad máxima permitida es 110 km/h. ¿Es correcto que al llegar al peaje Solı́s
el auto sea multado? ¡Claro que sı́! El teorema del valor medio de Lagrange nos
asegura que en algún momento entre las 3:00 y las 3:20 la velocidad instantánea fue
de 145, 8 km/h, lo cual supera en mucho la velocidad máxima permitida.
Observemos, en la figura, la gráfica de f y el segmento s, que une los puntos (a, f (a)) y
(b, f (b)). El segmento s es la gráfica de una función lineal h : [a, b] → R.
Observación 5.3.8. La función h que tomamos está dada por h(x) = f (b)−f
b−a
(a)
(x−a)+f (a).
f (b)−f (a)
Lo único que nos importa de ella es que es una función lineal con derivada b−a , por lo
que con cualquier función ası́ se puede hacer el mismo argumento.12
Observación 5.3.9. El Teorema 5.3.6 es un caso particular del Teorema 5.3.7. En efecto,
cuando f (b) = f (a), el cociente f (b)−f
b−a
(a)
vale 0, y en el punto intermedio c dado por el
teorema de Lagrange se cumple que f ′ (c) = 0.
En esta sección daremos (¡al fin!) una prueba del Teorema 5.2.22, la Regla de L’Hôpital
I.
Lema 5.3.10. Observemos que, bajo las hipótesis del Teorema 5.2.22, existe un entorno
reducido de x0 donde g(x) ̸= 0.
12 f (b)−f (a)
¿Por qué para cualquier función lineal h con derivada b−a se cumple que (f − h)(a) = (f − h)(b)?
173
Demostración.
Sabemos por hipótesis que existe un entorno de x0 donde g ′ (x) ̸= 0. Es decir, existe δ > 0
tal que g ′ (x) ̸= 0 para todo x ∈ E ∗ (x0 , δ).
Si y0 e y1 son ambos mayores que x0 , tenemos que x0 < y1 < y0 < x0 + δ. La función g
es derivable en el intervalo (y1 , y0 ), continua en [y1 , y0 ] y g(y1 ) = g(y0 ) = 0. Por el teorema
de Rolle, existe c ∈ (y1 , y0 ) tal que g ′ (c) = 0. Esto es absurdo porque, por hipótesis, no hay
ceros de g ′ en E ∗ (x0 , δ).
Si (y0 −x0 )(y1 −x0 ) < 0, tomemos δ2 = d(x0 , y1 ). Existe y2 ∈ E ∗ (x0 , δ2 ) tal que g(y2 ) = 0.
De los tres puntos y0 , y1 e y2 , dos deben estar del mismo lado de x0 , y podemos aplicarles
el razonamiento anterior. □
Las funciones f y g pueden no estar definidas en x0 , por lo que consideramos las nuevas
funciones con dominio (a, b) dadas por
f (x) si x ̸= x0
F (x) =
0 si x = x0
y
g(x) si x ̸= x0
G(x) =
0 si x = x0
Son continuas en x0 . Fijemos x ∈ (a, b), x ̸= x0 . Supongamos que x > x0 , ya que el otro
caso es análogo. Sea
h : [x0 , x] → R
la función dada por
h(y) = F (y)G(x) − G(y)F (x).
Entonces h es continua en [x0 , x] y derivable en (x0 , x). Además, h(x) = h(x0 ).13 Por el
teorema de Rolle, existe cx ∈ (x0 , x) tal que h′ (cx ) = 0.
Como h′ (y) = F ′ (y)G(x) − G′ (y)F (x) = f ′ (y)g(x) − g ′ (y)f (x), esto quiere decir que
f ′ (cx ) f (x)
′
= .
g (cx ) g(x)
13
¡Verificarlo!
174
Cuando x → x+ +
0 , cx → x0 , por lo que tomando lı́mite de ambos lados de esta igualdad
tenemos que
f ′ (cx ) f ′ (x) f (x)
lı́m+ ′ = lı́m+ ′ = lı́m+ .
x→x0 g (cx ) x→x0 g (x) x→x0 g(x)
El Teorema del valor medio de Lagrange tiene muchas consecuencias geométricas impor-
tantes para las funciones derivables. Una de ellas es que nos indica cuándo una tal función
crece, decrece o permanece constante.
Demostración.
Para ver que f es constante, tenemos que demostrar que para cualquier par de puntos
a, b ∈ I, f (a) = f (b). Tomemos entonces a, b ∈ I con a < b. La restricción de f al intervalo
[a, b] está en las hipótesis del Teorema 5.3.7, por lo que existe c ∈ (a, b) tal que
Demostración.
Como f ′ (c) > 0, esto nos dice que f (b) > f (a). □
f ′ se anula en −1 y en 3.
De lo anterior podemos concluir que f es estrictamente decreciente en (−1, 3), que es estric-
tamente creciente en (−∞, −1) y que también es estrictamente creciente en (3, +∞).
Ejercicio 64. Sea g : (−∞, −1) ∪ (3, +∞) → R la restricción de la función f del ejemplo
anterior al conjunto (−∞, −1) ∪ (3, +∞). ¿Es g una función creciente?
Ejemplo 5.4.4. La condición dada en el Teorema 5.4.2 para que f sea estrictamente cre-
ciente es suficiente, pero no necesaria.
Esta función es derivable en R −{0} porque se obtiene haciendo sumas, productos, cocien-
tes y composiciones de funciones derivables. También es derivable en 0 (ver el Ejemplo 5.2.9),
y f ′ (0) = 10
1
.
Para x ̸= 0,
′ 1 1 1
f (x) = + 2xsen − cos .
10 x x
Ejercicio 65. Demostrar que para todo ε > 0, la derivada f ′ toma valores positivos y
negativos en el intervalo (0, ε).
Del ejercicio y de la observación anterior podemos concluir que en (0, ε) hay subintervalos
donde la función f crece y donde la función f decrece. Por lo tanto, a pesar de que f ′ (0) > 0,
no hay ningún entorno de 0 donde f sea creciente.
177
Usando esta definición, podemos reescribir la Proposición 5.3.2 diciendo que si f : [a, b] →
R es derivable en x0 ∈ (a, b) y f tiene un extremo relativo en x0 , entonces x0 es un punto
crı́tico de f .14
Hasta ahora, vimos cómo el signo de f ′ nos sirve para estudiar el crecimiento de f en
los intervalos que no contienen puntos crı́ticos. Ahora veremos lo que el signo de f ′ nos dice
sobre los puntos crı́ticos de f . Comenzaremos con un par de ejemplos.
¿Qué podemos decir de los puntos -1 y 3? Como en esos puntos f ′ vale 0, de acuerdo a
la Proposición 5.3.2 podrı́a haber en ellos extremos relativos.
Por lo tanto,
f ′ se anula únicamente en 1.
Teorema 5.4.9. Sea f : [a, b] → R es una función dos veces derivable en (a, b) y tal
que f ′′ es continua. Sea x0 ∈ (a, b) un punto crı́tico de f .
Demostración.
Como f ′′ (x0 ) > 0 y f ′′ es continua, por el Teorema de conservación del signo existe δ > 0
tal que f ′′ es positiva en (x0 − δ, x0 + δ). El Teorema 5.4.2 nos dice por lo tanto que f ′ es
estrictamente creciente en ese entorno.
Como f ′ (x0 ) = 0, lo anterior implica que f ′ < 0 en (x0 − δ, x0 ) y f ′ > 0 en (x0 , x0 + δ).
Es decir, f decrece a la izquierda de x0 y crece a la derecha de x0 . Concluimos que f tiene
en x0 un mı́nimo relativo. □
Ejemplo 5.4.10. Clasificación de extremo usando la derivada segunda.
f ′′ (x) = 6x − 6,
que por ser una función polinómica es continua. Como f ′′ (−1) = −12 < 0 y f ′′ (3) = 12 > 0,
concluimos que f tiene un máximo relativo en x = −1 y un mı́nimo relativo en x = 3.
Ejemplo 5.4.11. ¿Qué pasa cuando f ′′ (x0 ) = 0?
El criterio anterior no nos dice lo que pasa en un punto crı́tico x0 cuando f ′′ (x0 ) = 0.
En este caso, la derivada segunda no sirve para clasificar el punto crı́tico. Veámoslo en los
siguientes ejemplos.
179
Para todas ellas, 0 es un punto crı́tico. Es decir, f1′ (0) = f2′ (0) = f3′ (0) = 0. Además, para
todas ellas, la derivada segunda se anula en 0. Es decir, f1′′ (0) = f2′′ (0) = f3′′ (0) = 0.
Si además f es derivable en (a, b), los extremos relativos que se den en puntos de (a, b)
deben darse en puntos crı́ticos. Por lo tanto, para encontrar los extremos relativos,
buscamos primero puntos x0 ∈ (a, b) tales que f ′ (x0 ) = 0. Estudiando el signo de f ′
en un entorno de x0 , a veces podemos determinar si en x0 hay un máximo relativo,
un mı́nimo relativo, o si no hay un extremo relativo.
Su derivada es
f ′ (x) = 12x3 − 48x2 + 60x − 24 = 12(x − 1)2 (x − 2),
180
Como f ′′ (2) > 0, podemos concluir que f tiene en x = 2 un mı́nimo relativo. Sin embargo,
f ′′ (1) = 0, por lo que la derivada segunda de f no nos sirve para determinar si en x = 1
hay o no un extremo. Sin embargo, si miramos el signo de f ′ , vemos que f ′ < 0 en (0, 1)
y en (1, 2), por lo que f es decreciente en estos intervalos. De esta información sı́ podemos
concluir que f no tiene un extremo en x = 1.
Veamos qué pasa en los puntos 0 y 3, ya que, al ser [0, 3] el dominio de f , podrı́a haber
extremos relativos en esos puntos aunque no se anule la derivada. Como f ′ < 0 en (0, 1),
ahı́ la función f es estrictamente decreciente, por lo que f tiene un máximo relativo en 0.
Análogamente, como f ′ > 0 en (2, 3), ahı́ f es estrictamente creciente, por lo que f tiene un
máximo relativo en 3.
¿Qué pasa con los extremos absolutos? El mı́nimo absoluto de f debe darse en el único
punto en que hay un mı́nimo relativo, es decir, en x = 2. Por lo tanto el mı́nimo absoluto
de f es f (2) = −5. El máximo absoluto puede darse en x = 0 o en x = 3. Como f (0) = 3 y
f (3) = 12, el máximo absoluto es f (3) = 12.
181
Ejercicio de parcial
Solución. Notemos que el intervalo (0, 1) donde buscamos el valor mı́nimo alcanzado por
la función es un intervalo abierto. Comenzamos calculando la derivada de f . Por la regla del
producto y la regla de la cadena, tenemos que
Luego, para encontrar el mı́nimo alcanzado por la función, buscamos los valores de x donde
f tiene un extremo relativo, es decir los valores de x tales que f ′ (x) = 0.
Ejercicio de parcial
D) mM = 2e
E) mM = 3e
Solución. Notemos que el intervalo [0, 2] donde buscamos el máximo y el mı́nimo alcanzado
por la función es un intervalo cerrado. En tal sentido comenzaremos buscando extremos
relativos en el intervalo abierto (0, 2) y luego estudiaremos lo que ocurre en los extremos
del intervalo [0, 2], es decir lo que ocurre en 0 y en 2. Para buscar extremos relativos en
el intervalo (0, 2), comenzamos calculando la derivada de f . Por la regla del producto y la
regla de la cadena, obtenemos:
por lo tanto
f ′′ (1) = e−1 (1 − 5 + 5) = e−1 > 0
es decir, f alcanza un mı́nimo relativo en x = 1, y
¡Cuidado! Dado que estamos buscando los extremos absolutos de f en [0, 2] que es un
intervalo cerrado, f podrı́a alcanzar un máximo o un mı́nimo en los extremos del intervalo
[0, 2] sin que estos sean necesariamente puntos donde se anule la derivda de f. Luego, para
encontrar los extemos absolutos de f en [0, 2] comparamos el mı́nimo y el máximo relativos
que encontramos a los valores que toma f en 0 y 2:
183
Tenemos que f (2) = 3e−2 es un máximo relativo de f pero f (2) < f (0) por lo que f (2) no
es el máximo de f en [0, 2]. Finalmente,
M = 1 y m = e−1
Ejercicio de parcial
√ √
A) 12 3m × 25 3m D) 15m × 60m
√ √ √ √
B) 30 3m × 10 3m E) 15 2m × 30 2m
√ √
C) 30m × 30m F) 18 5m × 10 5m
900
f (x) = 2 · + 6x
x
Comenzamos calculando la derivada de f :
1
f ′ (x) = −1800 · +6
x2
184
El Teorema Fundamental del Cálculo es, como su nombre lo indica, el resultado central
de este curso. Es, además, el motivo por el cual el cálculo diferencial y el cálculo integral se
consideran un único objeto de estudio, e invariablemente se enseñan juntos.
El Teorema Fundamental del Cálculo nos dice, por lo tanto, algo sorprendente por lo poco
intuitivo: que el problema de derivar y el problema de integrar son esencialmente problemas
inversos.
g ′ = f.
El Teorema Fundamental del Cálculo nos dice que las funciones continuas siempre tienen
primitivas, y que estas primitivas se calculan integrando.
En este capı́tulo veremos este importante resultado, y una de sus consecuencias más
importantes: podemos usar nuestro conocimiento de derivadas para calcular integrales.
185
186
Cuando tenemos una función f : [a, b] → R que es integrable, podemos definir una nueva
función F : [a, b] → R por la expresión
Z x
F (x) = f (t) dt.
a
La Proposición 4.2.24 del capı́tulo Lı́mites y continuidad de las notas de este curso nos
dice que la función F es continua.
Ejercicio 66. Observemos que para definir F es necesario que f sea integrable en [a, x], para
todo x ∈ [a, b]. En este ejercicio demostraremos que si f es integrable en [a, b], también es
integrable en [a, x] para todo x ∈ [a, b].
Para esto, fijemos x ∈ [a, b] y definamos una nueva función g : [a, b] → R dada por
f (t) si t < x
g(t) =
0 si t ≥ x
1. Sea P una partición de [a, b] que contiene al punto x. Probar que S ∗ (g, P )−S∗ (g, P ) ≤
S ∗ (f, P ) − S∗ (f, P ).
2. Probar que, dado ε > 0, existe una partición P de [a, b] tal que S ∗ (g, P )−S∗ (g, P ) < ε.
Concluir que g es integrable en [a, b].
187
3. Observar que g es integrable en [x, b], y concluir que es integrable en [a, x].
Ahora veremos que, en los puntos en que f es continua, F es no solo continua sino
derivable.
Teorema 6.1.1 (Teorema Fundamental del Cálculo, o TFC). Sea f : [a, b] → R una
función que es integrable en [a, b], y definamos F : [a, b] → R por
Z x
F (x) = f (t) dt.
a
Demostración.
Es
F (x0 + h) − F (x0 )
.
h
En la figura, toda el área pintada es F (x0 + h) y el área pintada de celeste es F (x0 ). La
diferencia F (x0 + h) − F (x0 ) es el área rosada.
188
F (x0 + h) − F (x0 )
F ′ (x0 ) = lı́m
h→0 h
Z x0 +h Z x0
1
= lı́m f (t) dt − f (t) dt
h→0 h a a
1 x0 +h
Z
= lı́m f (t) dt
h→0 h x
0
1 x0 +h
Z
= lı́m f (x0 ) + (f (t) − f (x0 )) dt
h→0 h x
0
Z x0 +h
1
= lı́m f (x0 )h + (f (t) − f (x0 )) dt
h→0 h x0
1 x0 +h
Z
= f (x0 ) + lı́m (f (t) − f (x0 )) dt
h→0 h x
0
Para ver que F ′ (x0 ) = f (x0 ), sólo nos queda probar que
1 x0 +h
Z
lı́m (f (t) − f (x0 )) dt = 0. (6.1.2)
h→0 h x
0
Como f es continua en x0 , para todo ε > 0 existe δ > 0 tal que |f (x) − f (x0 )| < ε si
|x − x0 | < δ. Entonces, si tomamos h con |h| < δ, tendremos que |f (t) − f (x0 )| es menor
que ε para t entre x0 y x0 + h. Por to tanto, para |h| < δ,
1 x0 +h 1 x0 +h
Z Z
(f (t) − f (x0 )) dt ≤ |f (t) − f (x0 )| dt < ε.
h x0 h x0
Como ε es arbitrario, esto demuestra 6.1.2. □
189
Ra
Como es usual, cuando x < a, esto simplemente quiere decir que F (x) = − x
f (t) dt.
Veámoslo.
El corolario anterior nos dice que las funciones continuas tienen primitiva. Pero... ¿hay
funciones que no tengan primitiva? ¿Podremos conocer alguna?
Tomemos la función f : R → R dada por
0 si x < 0
f (x) =
1 si x ≥ 0
g(0) − g(a)
= g ′ (c) = f (c) = 0,
0−a
por lo que g(a) = 0. Es decir, g vale 0 en (−∞, 0).
Si b > 0, podemos aplicar el Teorema del valor medio de Lagrange a g en [0, b], y
obtenemos c ∈ (0, b) tal que
g(b) − g(0)
= g ′ (c) = f (c) = 1,
b−0
por lo que g(b) = b. Es decir, g es la función identidad en (0, +∞).
Es decir,
0 si x < 0
g(x) =
x si x > 0
Como g es continua en 0, g(0) = lı́mx→0 g(x) = 0 y
0 si x ≤ 0
g(x) =
x si x > 0
¡Pero esta función no puede ser la primitiva de f , porque no es una función derivable!
Esto demuestra que f , en realidad, no tiene primitiva.
El Teorema Fundamental del Cálculo no nos da solo una primitiva de f . En general, nos
da infinitas. Esto es porque si a, a′ ∈ I son dos puntos distintos, las funciones dadas por
Z x Z x
Fa (x) = f (t) dt y Fa′ (x) = f (t) dt
a a′
191
Aquı́ surge una pregunta natural: ¿habrá otras primitivas de f, que no se obtengan
sumando una constante a Fa ? Como veremos a continuación, la respuesta es no.
Sean a y b dos puntos de I; tenemos que probar que g(a) = g(b). Sin pérdida de generali-
dad, supongamos que a < b. Aplicando el Teorema del valor medio de Lagrange a la función
g en el intervalo [a, b], tenemos que existe c ∈ (a, b) para el cual
Como g ′ (c) = 0, esto nos dice que g(b) − g(a) = 0, es decir, que g(b) = g(a).□
192
Notación
Una notación muy usual es la llamada notación de Leibniz para las primitivas, que
explicaremos en este recuadro.
Cuando se escribe Z
g(x) = f (x) dx
Observemos que esto no es una igualdad de funciones, porque hay muchas primitvas
de f .a
Otra notación usual es Z
f (x) dx = g(x) + C,
a
La notación de Leibniz, si bien es muy usual, no es muy “correcta” para los estándares de escritura
de la matemática moderna. Normalmente al escribir el signo de igual (=), lo que está a su izquierda
es igual a lo que está a su derecha. Por ejemplo, la expresión “2 + 2 = 4”, que es una igualdad entre
números, dice que el número 2 + 2 es igual al número 4. En particular, si a la izquierda del signo “=”
hay un número, a la derecha tiene que haber también un número. Del mismo modo, si a la izquierda
del signo “=” hay una función, a la derecha tendrı́a que haber también una función. La notación de
Leibniz no debe leerse de este modo.
Ejemplo 6.1.9.
Ejemplo 6.1.10. Función dada por una expresión integral con otros lı́mites de integración.
El TFC, por sı́ mismo, no nos dice que esta función sea derivable ni nos da la derivada de
esta función. Sin embargo, observemos que J(x) = F (x2 ). Es decir, J es la composición de
F y la función g : R → R dada por g(x) = x2 . Por la Regla de la Cadena, J es derivable y
su derivada vale
2
J ′ (x) = F ′ (g(x))g ′ (x) = F ′ (x2 )2x = (x4 cos(x6 − 1)e−sen(x ) )2x.
Ejemplo 6.1.11.
Si tomamos las funciones g, h : R → R dadas por g(x) = x2 y h(x) = e−x , la función K nos
queda
K(x) = F ◦ g(x) − F ◦ h(x),
siendo F , como hasta ahora, la función del Ejemplo 6.1.8.
194
Ejercicio 67. Demostrar la Proposición 6.1.12 usando el Teorema Fundamental del Cálculo
y la Regla de la Cadena.
Ejercicio de parcial
A) 4e4 + 4 C) 4e4 + 2 E) e4 + 1
B) 4e2 + 4 D) 4e2 + 2 F) e4 − 1
F (x) = g(h(x))
Rx
donde g(x) = 0
(et + 1)dt y h(x) = x2 . Luego, por la regla de la cadena, tenemos que
g ′ (x) = ex + 1
Ahora veremos cómo a partir del Teorema Fundamental del Cálculo surgen los llamados
“métodos de integración”. Éstos consisten en usar las propiedades de la derivación para
calcular primitivas e integrales de funciones continuas. Se basan en una consecuencia sencilla
pero importante del TFC, conocida como la Regla de Barrow.
Notación
b
g(x) = g(b) − g(a)
a
Ejemplo 6.2.2.
(f g)′ = f ′ g + f g ′ .
Observemos que este teorema nos dice dos cosas: cómo calcular la integral de f ′ g en un
intervalo y cómo calcular una primitiva de la función f ′ g.
R
Observación
R 6.2.4. Recordemos cómo se usa la notación h(x) dx. Cuando escribimos
H(x) = h(x) dx, estamos diciendo que H es una primitiva de h. Equivalentemente, que
H ′ = h.
Sabemos que
(f g)′ = f ′ g + f g ′ .
Por lo tanto,
Z b Z b
′
(f g) (x) dx = (f ′ (x)g(x) + f (x)g ′ (x)) dx
a a
Z b Z b
′
= f (x)g(x) dx + f (x)g ′ (x)) dx.
a a
b
Rb ′
Usando la Regla de Barrow, sabemos que a
(f g) (x) dx = f (x)g(x) , por lo que
a
b Z b Z b
′
f (x)g(x) = f (x)g(x) dx + f (x)g ′ (x) dx, (6.2.5)
a a a
es decir, Z x Z x
′
f (t)g(t) dt = f (x)g(x) − f (t)g ′ (t) dt − f (a)g(a). (6.2.7)
a a
Rx ′
Por
Rx el TFC, la expresión F (x) = a
f (t)g(t) dt da una primitiva de f ′ g y la expresión G(x) =
a
f (t)g ′ (t) dt da una primitiva de f g ′ . Como f (a)g(a) es una constante, G(x) + f (a)g(a)
también es una primitiva de f g ′ . Por lo tanto, la ecuación 6.2.7 dice que la resta de f g y
una primitiva de f g ′ es una primitiva de f ′ g, es decir,
Z Z
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx. □
′
R1
Para calcular 0 xex dx, aplicaremos el Teorema 6.2.3 a las funciones f y g dadas por
f (x) = ex y g(x) = x. Observemos que f ′ (x)g(x) = ex x. Entonces
Z 1 Z 1
x
xe dx = f ′ (x)g(x) dx
0 0
1 Z 1
= f (x)g(x) − f (x)g ′ (x) dx
0 0
1 Z 1
= xex − ex dx
0 0
1 1
x x
= xe −e = 1.
0 0
Rπ
Ejemplo 6.2.9. 0
2
cos(x)sen(x) dx.
Tomaremos f (x) = g(x) = sen(x), con lo cual f ′ (x)g(x) = cos(x)sen(x). Tenemos que
Z π π Z π
2 2 2
2
cos(x)sen(x) dx = sen (x) − sen(x) cos(x) dx.
0 0 0
¡Llegamos a la misma integral que al principio! Pero de esta igualdad, podemos despejarla,
y obtenemos π
Z π 2
2
2
2 cos(x)sen(x) dx = sen (x) = 1,
0 0
Rπ 1
por lo que 0
2
cos(x)sen(x) dx = 2
.
198
R
Ejemplo 6.2.10. sen2 (x) dx.
Este ejemplo es similar al anterior, pero en vez de calcular una integral vamos a hallar
una primitiva de la función sen2 (x). Cualquier otra primitiva se puede obtener a partir de
ésta sumando una constante.
Z Z
2
sen (x) dx = − cos(x)sen(x) + cos2 (x) dx
Z
= − cos(x)sen(x) + (1 − sen2 (x)) dx
Z
= − cos(x)sen(x) + x − sen2 (x) dx
Z Z
log(x) dx = 1 · log(x) dx
Z
1
= x log(x) − x dx
x
Z
= x log(x) − 1 dx = x(log(x) − 1).
Ejercicio de examen
Solución. Usamos el método de integración por partes para encontrar una primitiva de
sen(x)e3x . Tomando f (x) = e3x y g(x) = − cos(x) obtenemos
Z Z
sen(x)e dx = −e cos(x) − −3e3x cos(x)dx
3x 3x
| R
{z }
3 e3x cos(x)dx
R
Aplicamos partes a e3x cos(x)dx tomando f (x) = e3 x y g(x) = sen(x) y obtenemos
Z Z
e cos(x)dx = e sen(x) − 3e3x sen(x)dx
3x 3x
Entonces
Z Z
3x 3x 3x 3x
sen(x)e dx = −e cos(x) + 3 e sen(x) − 3 sen(x)e dx
Z
= e (− cos(x) + 3 sen(x)) − 9 sen(x)e3x dx
3x
Por lo tanto, Z
10 sen(x)e3x dx = e3x (− cos(x) + 3 sen(x))
es decir, Z
1 3x
sen(x)e3x dx = e (− cos(x) + 3 sen(x))
10
Finalmente, por la regla de Barrow,
Z π π
2 1 2
3x
sen(x)e dx = e3x (− cos(x) + 3 sen(x))
0 10 0
1 3π π π 1
= e 2 (− cos +3 sen ) − e0 ((− cos(0) +3 sen(0))
10 | {z 2 } | {z 2 } 10 | {z } | {z }
1 0
0 1
1 3π
= (3e 2 + 1)
10
a
Es decir, el intervalo [g(a), g(b)] o [g(b), g(a)], según si g(a) ≤ g(b) o g(a) > g(b).
Sea I el intervalo cerrado delimitado por g(a) y g(b). Como f es continua en I, tiene una
primitiva que llamaremos F . Entonces, por la regla de Barrow,
Z g(b)
f (x) dx = F (g(b)) − F (g(a)) = F ◦ g(b) − F ◦ g(a).
g(a)
Rπ
Ejemplo 6.2.13. 0
2
cos(x)sen(x) dx.
Esta integral ya fue calculada en el Ejemplo 6.2.9 usando el método de integración por
partes, por lo que ya sabemos que vale 12 .
Para aplicar el teorema de cambio de variable, tomemos g : [0, π2 ] → R dada por g(x) =
sen(x), y la función f : R → R dada por f (x) = x. Entonces f ◦ g(x) = g(x) = sen(x). Como
g ′ (x) = cos(x), la función que queremos integrar es (f ◦ g)g ′ . El Teorema 6.2.12 nos dice que
Rπ
0
2
cos(x)sen(x) dx es igual a
Z g(π/2)
f (x) dx,
g(0)
es decir, a Z 1
1
x dx = .
0 2
Aquı́ nuevamente podemos tomar g(x) = sen(x), cuya derivada es g ′ (x) = cos(x). Como
ahora en el integrando sen(x) aparece elevado a la potencia n, tomaremos f (x) = xn . La
función que queremos integrar es por lo tanto (f ◦ g)g ′ .
Rπ
Por el teorema de cambio de variable, 0
2
cos(x)senn (x) dx es igual a
Z g(π/2)
f (x) dx,
g(0)
es decir, a Z 1
1
xn dx = .
0 n+1
Ejemplo 6.2.15. Primitiva de h(x) = cos(x)sen3 (x).
Es decir,
sen4 (x)
F (x) = .
4
Ejercicio 69. Verificar, derivando, que F efectivamente es una primitiva de la función h.
Rπ
Ejemplo 6.2.16. 02 cos(x)esen(x) dx.
Para calcular esta integral tomaremos de nuevo g(x) = sen(x), y la función f será
Rπ
f (x) = ex . La integral que queremos calcular, 02 cos(x)esen(x) dx, queda en este caso igual a
Z 1
ex dx = e − 1.
0
202
Notación
Los ejemplos anteriores tienen en común que en el integrando aparece una expresión
que depende de g(x) = sen(x) (que es sen(x), senn (x) o esen(x) ) multiplicada por
g ′ (x) = cos(x). Sin importar cuál sea la función continua f y cuáles sean los lı́mites
de integración a y b,
Z b Z g(b)
cos(x)f (sen(x)) dx = f (x) dx.
a g(a)
Por este motivo, al aplicar el teorema de cambio de variable suele utilizarse una no-
tación diferente a la presentada en estos ejemplos. Solemos decir que la nueva variable
es u = sen(x), y que du = cos(x) dx. Entonces escribimos
Z b Z g(b)
cos(x)f (sen(x)) dx = f (u) du.
a g(a)
La expresión du = cos(x) dx es solamente una notación, pero es muy útil para recordar
que al hacer el cambio de variable que consiste en cambiar sen(x) por u, no podemos
simplemente cambiar dx por du.
R4 √
e√ x
Ejemplo 6.2.17. 1 x
dx.
Para aplicar el teorema de cambio de variable, busquemos una nueva variable u (corres-
pondiente a u = g(x)) de modo que du (es decir, g ′ (x)dx) aparezca también en el integrando.
√ 1
Si tomáramos u = x, tendrı́amos du = √
2 x
dx. Modifiquemos ligeramente el aspecto de
nuestra integral: √ √
4 4
e x e x
Z Z
√ dx = 2 √ dx.
1 x 1 2 x
√
Ahora sı́ estamos en condiciones de hacer el cambio de variable u = x. ¡Recordemos que
hay que cambiar los lı́mites de integración! Cuando x = 1, u = 1 y cuando x = 4, u = 2.
Por lo tanto Z 4 √x Z 2
e
2 √ dx = 2 eu du = 2(e2 − e).
1 2 x 1
cos(log(1+x))
Ejemplo 6.2.18. Cálculo de una primitiva de h(x) = 1+x
.
Rx
Calcularemos F (x) = 0 cos(log(1+t))
1+t
dt, que está definida para x ∈ (−1, +∞) y es una
1
primitiva de h. Haremos el cambio de variable u = log(1 + t), para el cual du = 1+t dt. Con
este cambio de variable,
Z log(1+x) log(1+x)
F (x) = cos(u) du = sen(u) = sen(log(1 + x)).
0 0
203
Rπ
Ejemplo 6.2.19. 0
2
e2x cos(2x) dx.
Para resolver esta integral aplicaremos los dos métodos de integración que hemos visto
hasta el momento: integración por partes y cambio de variable.
Primero haremos el cambio u = 2x. Como du = 2dx, reescribimos la integral que quere-
mos calcular como Z π Z π
2
2x 1 2 2x
e cos(2x) dx = 2e cos(2x) dx,
0 2 0
que tras el cambio de variable queda
1 π u
Z
e cos(u) du.
2 0
Z π π Z π
u u
e cos(u) du = e sen(u) − eu sen(u) du
0 0 0
Z π
= − eu sen(u) du.
0
Z π π Z π
u u
e (−sen(u)) du = e cos(u) − eu cos(u) du
0 0
Z π0
= −eπ − 1 − eu cos(u) du.
0
Hasta ahora hemos visto ejemplos en los que la función u = g(x) aparece explı́citamente
en el integrando. Sin embargo, el teorema de cambio de variable puede ser aplicado, con
cierta astucia, en otros casos.
204
R1 √
Calcularemos −1 1 − x2 dx, que es el área del semicı́rculo de radio 1. ¡Nos deberı́a
dar π2 ! Haremos un pequeño cambio cosmético, que es cambiar el nombre de la variable de
integración de x a u. Entonces, la integral queda:
Z 1 √
1 − u2 du.
−1
√
Si u fuera sen(x), tendrı́amos que 1 − u2 = cos(x). Intentemos hacer este cambio de
variable. Para ello, debemos tener en cuenta que du = cos(x)dx. Entonces,
Z 1 √ Z bp
1− u2 du = 1 − sen2 (x) cos(x) dx,
−1 a
para lı́mites de integración a y b elegidos apropiadamente. Éstos deben cumplir que sen(a) =
−1 y sen(b) = 1, ası́ que podemos tomar a = − π2 y b = π2 .
Ejercicio 70. Calcular esta integral usando el método de integración por partes, verificando
ası́ que efectivamente da π2 .
Ejercicio 71. El coseno hiperbólico y el seno hiperbólico son las funciones definidas por
ex + e−x ex − e−x
cosh(x) = y senh(x) = .
2 2
Probar que:
senh : R → R es biyectiva.
√
Consideremos la función f : R → R dada por f (x) = 1 + x2 . De acuerdo al TFC, una
primitiva de f está dada por Z x√
F (x) = 1 + t2 dt.
0
Entonces
Z x √ Z arcsenh(x) q
1 + t2 dt = 1 + senh2 (u) cosh(u) du
0 0
Z arcsenh(x)
= cosh2 (u) du
0
Ejercicio de parcial
3 1
Luego, consideramos el cambio de variable u = x 2 , para el cual du = 32 x 2 , y obtenemos
Z 1 Z 1
1 3
x2 2 3 1 x 32
4x e dx =
2 4· · x 2 e dx
0 0 3 2
8 1
Z
3 1 x 23
= x 2 e dx
3 0 2
8 1 u
Z
= e du cuando x = 1, u = 1 y cuando x = 0, u = 0
3 0
1
8 u
= e
3 0
8
= (e − 1)
3
8e − 8
=
3
Una función racional es una función dada por un cociente de funciones polinómicas, es
decir, una función de la forma
p(x)
R(x) = ,
q(x)
donde p y q son polinomios. Hay un método general que permite hallar sus primitivas. Esto
es lo que veremos en esta sección.
Siempre que hablemos de un polinomio éste tendrá coeficientes reales. Es decir, siempre
estaremos hablando de un elemento de R[x].
207
División de polinomios
Si p y q son polinomios, existen polinomios c y r tales que
p = cq + r,
p(x) = x4 + x3 − x2 + x − 2
se descompone como
p(x) = (x − 1)(x + 2)(x2 + 1).
El polinomio
q(x) = x5 − 2x3 + 2x2 − 3x + 2
1
Si no recuerdan cómo dividir polinomios, pueden por supuesto recurrir a youtube. Sin embargo, es un
ejercicio provechoso recordar cómo es la división entera y tratar de hacer un razonamiento similar con los
polinomios. Es decir, recordando lo que quiere decir
1538 | 23
20 66
pueden plantear
x5 + x4 + 2x3 − 4x + 1 | x3 − x
e intentar hacer este cálculo guiados por su intuición.
208
es
q(x) = (x − 1)2 (x + 2)(x2 + 1).
Observemos que q tiene los mismos factores irreducibles que p, pero en q el factor x − 1
aparece dos veces.
El objetivo de esta sección es integrar funciones racionales, es decir, funciones que son
cocientes de funciones polinómicas. Antes de integrarlas, es conveniente expresarlas de la
forma más simple posible.
x4 + x3 − x2 + x − 2 1
R1 (x) = 5 3 2
= .
x − 2x + 2x − 3x + 2 x−1
Ambas son funciones que sabemos integrar, cuando las escribimos en la forma apropiada.
Ejemplo 6.2.22. Función racional con numerador de mayor grado que el denominador.
Si
x5 + x4 + 2x3 − 4x + 1
R(x) = ,
x3 − x
el numerador de R es p(x) = x5 + x4 + 2x3 − 4x + 1 y el denominador es q(x) = x3 − x.
Como el grado de p es mayor que el de q, es conveniente dividir p entre q, lo que nos da
p(x) = (x2 + x + 3)q(x) + x2 − x + 1.
Ahora podemos expresar R como
(x2 + x + 3)(x3 − x) + x2 − x + 1 2 x2 − x + 1
R(x) = = x + x + 3 + ,
x3 − x x3 − x
que es la suma de un polinomio y una función racional de grado más pequeño.
Por lo tanto, para integrar funciones racionales es suficiente saber integrar funciones
para las cuales el numerador tiene grado menor que el denominador.
p(x)
R(x) =
q(x)
donde a ∈ R y 1 ≤ k ≤ ni , o de la forma
bx + c
,
si (x)k
donde a, b ∈ R y 1 ≤ k ≤ mi .
p(x) a1 a2 a3 a4 a5
= + + + 2
+ ,
q(x) x + 2 x − 1 (x + 5) (x + 5) (x + 5)3
donde a1 , . . . , a5 son números reales que dependen, por supuesto, de quién sea p.
En este caso, en la descomposición en fracciones simples hay dos sumandos, uno por
cada factor irreducible de q. Tiene la forma:
p(x) a bx + c
= + 2 .
q(x) x+3 x +1
Este polinomio tiene los mismos factores irreducibles que el del ejemplo anterior, pero
cada uno aparece varias veces. En la descomposición en fracciones simples de p(x)
q(x)
hay ahora
5 sumandos:
p(x) a1 a2 b1 x + c 1 b2 x + c 2 b3 x + c 3
= + + + + .
q(x) x + 3 (x + 3)2 x2 + 1 (x2 + 1)2 (x2 + 1)3
El objetivo de este curso no es aprender a integrar todos los sumandos que pueden apare-
cer en la descomposición en fracciones simples. Esto puede hacerse, y hay métodos generales
que permiten hacerlo en todos los casos. Por lo tanto, si tuviéramos que integrar una fun-
ción racional cualquiera, podrı́amos hacerlo2 , siempre y cuando lográramos descomponer su
denominador como producto de polinomos irreducibles3 .
a bx + c
+ 2 .
x+3 x +1
2
Es laborioso pero fácil.
3
¡Esto no siempre es fácil!
211
Esta función es
1 x 1
a +b 2 +c 2 ,
x+3 x +1 x +1
donde, recordemos, a, b y c son números reales.
1
Una primitiva de x+3
.
x
Una primitiva de x2 +1
.
1
Una primitiva de x2 +1
.
1
Ejercicio 72. Una primitiva de x+3 es log(x+3). Se obtiene aplicando el teorema
de cambio de variable, tomando como nueva variable u = x + 3.
1
Ejemplo 6.2.29. Primitiva de x2 −2x+5
.
1
¿Cómo podemos calcular una primitiva de q(x) ? Conocemos la primitiva de x21+1 que es
1
arctan(x), y haremos manipulaciones algebraicas sobre la expresión q(x) para llevarla a algo
de este tipo.
x2 − 2x + = (x + α)2 ,
x2 − 2x + 1 = (x − 1)2 .
Entonces
q(x) = x2 − 2x + 5 = x2 − 2x + 1 + 4 = (x − 1)2 + 4.
212
1 1
Lo que sabemos integrar es x2 +1
. Lo que queremos integrar es (x−1)2 +4
. Estas expresiones
se empiezan a parecer...
1
y por lo tanto q(x)
nos queda
1 1 1
= .
2
(x − 1) + 4 4 x−1 2
2
+1
1
Esto ya se parece bastante a x2 +1
, ¿no?
Calculemos Z
1 1
dx.
4 x−1 2
2
+1
x−1 1
Haciendo el cambio de variable u = 2
, tenemos que du = 2
y la primitiva que estamos
calculando es Z
1 1
du,
2 u2 + 1
1
que es 2
arctan(u). No olvidemos deshacer el cambio de variable. Hemos llegado a que
x−1
Z
1 1
dx = arctan .
x2 − 2x + 5 2 2
1
¿Será posible hacer esto mismo para una función racional de la forma q(x)
, donde q es
cualquier polinomio irreducible de grado 2? Sı́, por supuesto que sı́.4
4
Nos alcanza con hacerlo para los polinomios mónicos, es decir, cuyo coeficiente principal es 1.
213
Ejercicio 73. Tomemos un polinomio q(x) = x2 + bx + c sin raı́ces reales, es decir, tal
que b2 − 4c < 0.
q(x) = (x − α)2 + β.
1
Hallar una primitiva de q(x)
haciendo un cambio de variable apropiado.
a b
Queda α = 2 y β = c − α2 .
Hasta ahora, hemos visto cómo el teorema de descomposición en fracciones simples nos
permite escribir una función racional como em suma de términos que sabemos integrar y
términos que aprenderı́amos a integrar, si tuviéramos que hacerlo.5 Pero...¿cómo encontra-
mos la descomposición en fracciones simples? Lo veremos en algunos ejemplos.
Ejemplo 6.2.30.
1
R(x) =
(x + 2)(x − 1)
1 A(x − 1) + B(x + 2)
= . (6.2.32)
(x + 2)(x − 1) (x + 2)(x − 1)
Para que se cumpla, como las funciones racionales a la izquierda y a la derecha de (6.2.32)
tienen el mismo denominador, alcanza con que
Observemos que esta igualdad tiene que cumplirse para todos los x ∈ R, es decir, la función
polinómica dada por (A + B)x + (2B − A) tiene que ser constante igual a 1. Por lo tanto,
5 1
Como por ejemplo, (x2 −2x+5)2 .
214
el término lineal tiene que tener coeficiente 0 y el término independiente tiene que valer 1.
Hallamos A y B resolviendo el sistema lineal de ecuaciones
A+B = 0
−A + 2B = 1,
A+B+C = 0
−6A − 3B + C = 0
5A − 10B − 2C = 1
Ejemplo 6.2.38.
2x + 3
R(x) =
(x + 2)(x − 1)(x + 5)
A+B+C = 0
−6A − 3B + C = 2
5A − 10B − 2C = 3
Método de la tapadita
Hay un “método”para hallar rápidamente los coeficientes que aparecen en la des-
composición en fracciones simples. Para entenderlo, miremos la ecuación (6.2.31), que
es una igualdad de funciones racionales. Si multiplicamos a ambos lados por (x − 1),
obtenemos
1 A(x − 1)
= + B.
x+2 x+2
1
Cuando evaluamos esto en x = 1, nos queda 1+2 = B, es decir B = 1/3. Análogamente,
si multiplicamos la ecuación (6.2.31) por x + 2, obtenemos
1 B(x + 2)
=A+ ,
x−1 x−1
1
y evaluando en x = −2 obtenemos −2−1 = A, es decir, A = −1/3.
Este truco se llama “método de la tapadita”porque se aplica ası́: tomamos
1
,
(x + 2)(x − 1)
1/3
.
x−1
Como ejercicio, verificar que este “método”también funciona para los otros dos
ejemplos que vimos, y pensar por qué.
¿Es recordar esto más fácil que resolver un sistema lineal de ecuaciones? Probable-
mente no, pero este es un truco muy popular que se incluye en estas notas a pedido
del público.
Ejemplo 6.2.39.
2x + 3
R(x) = .
(x + 2)(x2 + 1)
216
Al igualar los numeradores, nos queda el sistema lineal que debemos resolver para obtener
A, B y C:
A+B = 0
2B + C = 2
A + 2C = 3.
Ejercicio de parcial
es igual a:
A) log(2) + π
π
B) 3 log(2) + 4
π
C) 2 log(2) − 4
D) log(3) + π
π
E) − log(2) + 4
x3 + x2 + x + 1 = (x + 1)(x2 + 1)
4x2 + 3x + 3 4x2 + 3x + 3
=
x3 + x2 + x + 1 (x + 1)(x2 + 1)
A Bx + C
= + 2
x+1 x +1
217
y, al igualar los numeradores, nos queda el sistema lineal que debemos resolver para obtener
A, B y C:
A+B = 4
B+C = 3
A+C = 3
4x2 + 3x + 3
Z Z
2 2x + 1
3 2
dx = + 2 dx
x +x +x+1 x+1 x +1
Z
2 2x 1
= + 2 + 2 dx
x+1 x +1 x +1
Z Z Z
1 2x 1
=2 dx + 2
dx + 2
dx
x+1 x +1 x +1
= 2 log(x + 1) + log(x2 + 1) + arctan(x)
Por lo tanto,
1 1
4x2 + 3x + 3
Z
dx = 2 log(x + 1) + log(x2 + 1) + arctan(x)
0 x3 + x2 + x + 1 0
= 2 log(2) + log(2) + arctan(1) −(2 log(1) + log(1) + arctan(0))
| {z } | {z } | {z } | {z }
π 0 0 0
4
π
= 3 log(2) +
4
218
Capı́tulo 7
Polinomio de Taylor
es decir, es la gráfica de la función lineal dada por p(x) = f (a)+f ′ (a)(x−a). Intuitivamente,
esta función es la función lineal “cuya gráfica más se parece a la de f cerca del punto a”.
Exploremos un poco más esta idea.
Observemos que
En este curso hemos visto que hay funciones no lineales con las cuales es difı́cil trabajar.
Por ejemplo, es difı́cil calcular sus valores. (¿Cuánto vale el seno de 8? ¿Y eπ ?) Es muy natural
la idea de aproximar estas funciones difı́ciles por funciones sencillas, que entendemos mejor
y con las que operamos fácilmente, como las funciones lineales. La derivada nos permite
hacer esto, al menos en el entorno de un punto. Pero no siempre la aproximación lineal de
una función es suficientemente buena.
219
220
A este problema responde el Teorema de Taylor, que nos permite aproximar funciones
por polinomios. Lleva el nombre de Brook Taylor, que lo enunció y demostró en 1715. Es
un teorema asombrosamente potente y útil, dentro de la matemática y en otras ciencias.
Sin embargo, no todos los contemporáneos de Taylor comprendieron su importancia. Se
popularizó recién en 1772, cuando el famoso matemático Joseph-Louis Lagrange lo llamó
“el fundamento principal del cálculo diferencial”.1
A más de trescientos años del artı́culo de Taylor, nuestra herramienta principal de cálculo
es la computadora. Con ella, el Teorema de Taylor no ha hecho sino ganar en importancia,
porque este resultado está en la base de muchos de los algoritmos con los que nuestro software
hace cuentas.
Claramente hay una única función polinómica p0 de grado 0 tal que p0 (0) = 5, que es,
justamente, la función constante igual a 5. Hay infinitas funciones lineales que en 0 valen 5,
pero hay una sola, p1 , para la cual p1 (0) = 5 y p′1 (0) = 8, a saber, p1 (x) = 5 + 8x. Hay una
única función polinómica de grado 2, p2 , tal que p2 (0) = 5, p′2 (0) = 8 y p′′2 (0) = −3, que está
dada por p2 (x) = 5 + 8x − 23 x2 .
p3 (0) = 5
p′3 (0) = 8
p′′3 (0) = −3 y
p′′′
3 (0) = 1?
Podemos hacer esto con las derivadas en 0 hasta cualquier orden, mediante el razona-
miento siguiente.
p(x) = a0 + a1 x + a2 x2 + · · · + an xn ,
y derivémosla k veces, con k ≤ n. Al hacer esto, los primeros sumandos van a desaparecer,
pues la derivada de orden k de a0 + a1 x + · · · + ak−1 xk−1 es 0. Por otro lado, para j > k, la
derivada de aj xj es
aj j(j − 1)(j − 2) · · · (j − k + 1)xj−k .
En esta expresión, x aparece con una potencia mayor o igual que uno. En resumen,
Si queremos elegir el polinomio p para que p(k) (0) = f (k) (0), tenemos que tomar ak =
f (k) (0)
k!
. Es decir, el polinomio
n
X f (k) (0) k
p(x) = x
k=0
k!
cumple que p(k) (0) = f (k) (0) para todo k ≤ n, y es el único polinomio de grado menor o
igual que n con esta propiedad.
Hasta aquı́ nos hemos limitado a mirar el valor de las derivadas de una función en 0.
Podemos hacer lo mismo en cualquier punto, como veremos más adelante. Antes, haremos
una observación.
−2 + 3(x − 1) + (x − 1)2
es igual a
−4 + x + x2 .
Las dos expresiones determinan la misma función, pero presentan un aspecto distinto.
222
a0 + a1 x + · · · + an x n ,
b0 + b1 (x − 1) + · · · + bn (x − 1)n .
Nomenclatura
Si a ∈ R y escribimos un polinomio p(x) como
b0 + b1 (x − a) + · · · + bn (x − a)n ,
para todo k = 0, . . . , n.
Para k = 0, . . . , n, calcular p(k) (x). Concluir que p(k) (a) = f (k) (a).
Lema 7.1.3. Sea a ∈ R. Si q(x) es un polinomio de grado menor o igual que n tal que
q (k) (a) = 0 para todo k ≤ n, entonces q es el polinomio nulo.
La derivada de orden k de q es constante e igual a k!ak . Como q (k) (a) = 0, tenemos que
ak = 0, lo cual es absurdo por cómo hemos definido k. Llegamos a una contradicción que
surgió de suponer que q no era el polinomio nulo, por lo que q es el polinomio nulo.□
Es decir, es el polinomio
f (n) (a)
Pn (f, a)(x) = f (a) + f ′ (a)(x − a) + · · · + (x − a)n .
n!
Ejercicio de examen
A) 4 C) 9 E) 17
B) 8 D) 15 F) 23
Entonces
2
P2 (f, 0)(x) = x2 = x2
2
por lo que p(2) = P2 (f, 0)(2) = 4.
7.2. Ejemplos
¿Qué pasa con Pk (f, a) para a ̸= 0? Consideremos por ejemplo, la función dada por
f (x) = −4 + x + x2
1
Ejemplo 7.2.2. f (x) = 1+x
, a = 0.
1 2 (−1)n n!
f ′ (x) = − , f ′′
(x) = , . . . , f (n)
(x) = .
(1 + x)2 (1 + x)3 (1 + x)n+1
Por lo tanto
f (0) = 1, f ′ (0) = −1, f ′′ (0) = 2, . . . , f (n) (0) = (−1)n n!
y el polinomio de Taylor de f de orden n en el punto 0 es
Observemos que g(0) = 0, y que g ′ (x) = f (x), donde f es la función del ejemplo anterior.
Por lo tanto, g (k) (0) = f (k−1) (0) para todo k ≥ 1 y el polinomio de Taylor de g de orden n
en el punto 0 es
x2 x3 (−1)n−1 xn
Pn (g, 0)(x) = x − + − ··· + .
2 3 n
Como f (k) (x) = f (x) para todo k ≥ 0, resulta que f (k) (0) = 1 para todo k ≥ 0. El
polinomo de Taylor de f de orden n en el punto 0 es
n
x2 xn X xk
Pn (x) = 1 + x + + ··· + = .
2! n! k=0
k!
Como sabemos, f ′ (x) = cos(x), f ′′ (x) = −sen(x), f ′′′ (x) = − cos(x) y f (4) (x) = sen(x) =
f (x). Por lo tanto, a partir de la derivada de orden 4, las derivadas de f empiezan a repetirse.
Por ejemplo, f (23) (x) = f ′′′ (x) = − cos(x), porque 23 = 20 + 3 y 20 es múltiplo de 4, por lo
que derivar f veinte veces dará f nuevamente.
2
Aquellos que cursan Matemática Discreta 1, pueden demostrar esto por inducción completa.
226
Observemos que, para cualquier n, el polinomio de Taylor Pn (f, 0) no tiene términos de grado
par. Entonces, si n es par, Pn (f, 0) = Pn−1 (f, 0), por lo que alcanza con dar los polinomios
de Taylor cuyo orden es impar.
Para n impar,
n−1
x3 x5 (−1) 2 xn
Pn (f, 0)(x) = x − + − ... + .
3! 5! n!
Ejercicio 76. Probar que si f y g son funciones con derivadas hasta orden n en el
punto a, entonces Pn (f + g, a) = Pn (f, a) + Pn (g, a).
Habı́amos dicho que la función lineal P1 (f, a), cuya gráfica es la recta tangente al gráfico
de f en el punto (a, f (a)), “se parece” a f cerca de a. Las dos funciones valen lo mismo en
el punto a y tienen igual derivada. Tenemos la esperanza de que P2 (f, a), al tener derivadas
hasta orden 2 iguales a las de f en a, se le parezca aun más, y que el parecido de P3 (f, a)
sea aun mayor, etc.
Los dibujos muestran las gráficas de una función f y de sus polinomios de Taylor hasta
orden 4 en a = 1. (Para esta función, f (1) = 0, pero eso no tiene importancia). Para valores
de x lejanos a a la función f y los polinomios son muy diferentes. Sin embargo, cerca de a,
los polinomios parecen aproximar cada vez mejor a f a medida que crece su orden.
Esta es la gráfica de f .
227
Su polinomio de Taylor de orden 2 tiene como gráfica una parábola, que cerca de (a, f (a))
se parece aun más a la gráfica de f .
Su polinomio de Taylor de orden 3 tiene como gráfica una cúbica, que se parece aún más.
228
Tenemos que hacer precisa esta noción de aproximación. Cuando decimos que Pn (f, a)
“se parece” a f o que “aproxima” a f (para x cerca de a), lo que estamos diciendo es que
la diferencia f (x) − Pn (f, a)(x) es pequeña (para x cerca de a). El teorema de Taylor nos
habla, justamente, de esta diferencia, que por su importancia tiene un nombre: el resto.
Observación 7.3.2. Por como lo hemos definido, Rn (f, a) vale 0 en a, y todas sus derivadas
hasta orden n también valen 0 en a.
Rn (f, a)(x)
lı́m = 0,
x→a (x − a)n
Demostración.
229
para k ≤ n.
embargo, la función f está definida únicamente para x > −1, y lı́mx→−1+ f (x) = +∞, por
lo que
lı́m + Rn (x) = lı́m + (f (x) − Pn (x)) = +∞,
x→−1 x→−1
pues lı́mx→−1+ Pn (x) = Pn (−1) = n.
Es decir, aunque n sea muy grande, la aproximación de f por Pn es muy mala cuando
nos acercamos a x = −1.
Más adelante volveremos a este ejemplo para entender mejor qué pasa con el resto Rn (x)
en el intervalo abierto (−1, 1).
230
f y su polinomio de Taylor
de orden 2 f y su polinomio de Taylor
de orden 3
f y su polinomio de Taylor
de orden 4
Para terminar esta sección, veremos que no hay otros polinomios que aproximen a f
cerca de a como lo hace el polinomio de Taylor.
231
P (x)
lı́m = 0,
x→a (x − a)n
P (x) − Q(x)
lı́m = 0,
x→a (x − a)n
entonces P = Q.
P (x) = b0 + b1 (x − a) + · · · + bn (x − a)n .
En el cociente
P (x)
(x − a)n
el denominador tiende a 0 cuando x tiende a a. Para que el cociente tienda a cero, el
numerador P (x) también tiene que tender a 0, por lo que b0 = 0. Entonces
P (x) b1 + b2 (x − a) + · · · + bn (x − a)n−1
= .
(x − a)n (x − a)n−1
Por hipótesis
f (x) − Q(x)
lı́m = 0,
x→a (x − a)n
y por el Teorema de Taylor
f (x) − P (x)
lı́m = 0,
x→a (x − a)n
lo que nos permite concluir que
P (x) − Q(x)
lı́m = 0.
x→a (x − a)n
Ejercicio de examen
(Ejercicio 9 - examen febrero 2024) Sea f : R → R tal que f (x) = 1 e−t dt.
R x2 2
Indicar cuál de los siguientes polinomios es el que mejor aproxima a f (x) si x está
cerca de 1
1
A) e(10x2 − 18x + 8) D) e
(−6x2 + 14x − 8)
1
B) e(5x2 − 8x + 3) E) e
(−3x2 + 2x)
1
C) e(5x2 + 2x) F) e
(−3x2 + 8x − 5)
f ′′ (1)
P2 (f, 1)(x) = f (1) + f ′ (1)(x − 1) + (x − 1)2
2
y se tiene que:
R1 2
f (1) = 1
e−t dt = 0
Entonces:
f ′′ (1)
P2 (f, 1)(x) = f (1) + f ′ (1)(x − 1) + (x − 1)2
2
1 1
=0+ · 2(x − 1) + (−6)(x2 − 2x + 1)
e e
1
= (−6x2 + 14x − 8)
e
Ejercicio 77. Probar que si f y g son funciones con derivadas hasta orden n continuas
en el punto a, y
N
X
Pn (f, a)(x)Pn (g, a)(x) = ak (x − a)k ,
k=0
entonces n
X
Pn (f g, a) = ak (x − a)k .
k=0
Leamos cuidadosamente lo que pide este ejercicio. Los polinomios Pn (f, a) y Pn (g, a) son
polinomios de grado menor o igual que n, cuyo producto podrı́a tener (y con frecuencia
tiene) grado mayor. Digamos que el grado de Pn (f, a)Pn (g, a) es N , con lo que podemos
escribir
N
X
Pn (f, a)(x)Pn (g, a)(x) = ak (x − a)k .
k=0
Por otro lado Pn (f g, a) es, por definición, un polinomio de grado menor o igual que n. El
ejercicio nos pide probar que éste se obtiene tomando el producto Pn (f, a)(x)Pn (g, a)(x) y
borrando todos los términos de grado mayor que n que aparezcan en él.
1
Por ejemplo, si f (x) = ex y g(x) = 1+x
, entonces
1
P2 (f, 0)(x) = 1 + x + x2 y P2 (g, 0)(x) = 1 − x + x2 .
2
Su producto es 1 + 21 x2 + 12 x3 + 12 x4 . El polinomio de Taylor de orden 2, en 0, de la función
ex
f g(x) = 1+x es
1
P2 (f g, 0)(x) = 1 + x2 .
2
¡El ejercicio del recuadro brinda una excelente oportunidad de usar la Proposición 7.3.7!
234
pues
Rn (x)
lı́m = 0.
x→a (x − a)n
Ejemplo 7.4.2.
sen(x) − x
lı́m .
x→0 x3
3
El polinomio de Taylor de orden 3 en 0 de la función seno es x − x6 . Por lo tanto, Si
f (x) = sen(x) − x, el polinomio de Taylor de orden 3 de f en el punto 0 es
−x3
P3 (x) = .
6
Entonces
sen(x) − x P3 (x) 1
lı́m = lı́m = − .
x→0 x3 x→0 x3 6
Ejemplo 7.4.3.
2
ex − 1
lı́m
x→0 x2
2
Tomemos la función f (x) = ex − 1. Su polinomio de Taylor de orden 2 es x2 , por lo que
2
ex − 1 P2 (x)
lı́m = lı́m = 1.
x→0 x2 x→0 x2
Ejemplo 7.4.4.
2
ex − 1
lı́m
x→0 log(1 + x) − x
Podemos escribir
2 2
ex − 1 ex − 1 x2
lı́m = lı́m .
x→0 log(1 + x) − x x→0 x2 log(1 + x) − x
235
Ejercicio de parcial
1 − cos(3x)
lı́m
x→0 xsen(4x)
Por otro lado, el polinomio de Taylor de orden 2 de la función seno en 0 es q(x) = x por lo
que el polinomio de Taylor de orden 2 de la función x sen(4x) en 0 es
Por lo tanto
9 2
1 − cos(3x) x
lı́m = lı́m 2 2
x→0 x sen(4x) x→0 4x
9x2
= lı́m
x→0 8x2
9
=
8
Ejercicio de examen
El Teorema de Taylor nos dice que una función f (x) puede ser aproximada por un
polinomio Pn (f, a)(x) localmente, cerca del punto a. ¿Cuán cerca? No lo sabemos. Como el
237
enunciado del teorema nos da el valor de un lı́mite, no tenemos información relevante sobre
cuánto se parecen f (x) y Pn (f, a)(x) en un punto x ̸= a. Para esto, quisiéramos tener una
acotación de
Rn (f, a)(x)
que sea válida al menos en un entorno de a cuyo tamaño conozcamos. Esto nos permitirı́a
hacer un cálculo aproximado de valores de f (x) aún cuando x ̸= a.
Como vimos en el Ejemplo 7.3.6, no siempre podemos esperar que el polinomio de Taylor
Pn (f, a) aproxime a la función f en todo su dominio. Para f : (−1, +∞) → R dada por
1
f (x) = 1+x , el polinomio Pn (f, 0)(x) no se parece a f en x = 1, aunque tomemos n muy,
muy grande. Sin embargo, Pn (f, 0) sı́ parece, al menos en las gráficas que acompañan el
Ejemplo 7.3.6, estarse aproximando a f (x) en (−1, 1) a medida que crece n.
Para responder a estas preguntas vamos a ver un resultado que nos dará una expresión
para Rn (f, a)(x).
238
Antes de demostrar este teorema, veremos cómo es útil para acotar el resto Rn (f, a)(x)
para x en un intervalo. Es decir, para ver que Rn (f, a)(x) es, en valor absoluto, menor que
algo que depende de a, n y, por supuesto, de cuál sea la función f . Ası́ al aproximar f por
Pn (f, a), tendremos una estimación del error cometido.
Digamos que queremos calcular sen(2) con un error menor a 10−3 . En primer lugar,
tenemos que hallar n tal que
2n+1
< 10−3 .
(n + 1)!
El valor n = 9 es el primero que cumple esto. Por lo tanto,
210
|sen(2) − P9 (2)| = |R9 (2)| < < 10−3 .
10!
x3 x5 x7 x9
Como P9 (x) = x − 3!
+ 5!
− 7!
+ 9!
, el valor aproximado de sen(2) que obtenemos es
P9 (2) = 0, 90934744268077601410934744268078.
¡Por supuesto que no todas estas cifras decimales son correctas para sen(2)! Pero este es un
número que aproxima a sen(2) con un error menor a un milésimo.
239
si c 1 ∈ (0, 21 ).
2
Si no sabemos cuánto vale e1/2 , ¿de qué nos sirve esta acotación? Sabemos que e < 4,
por lo que e1/2 < 41/2 = 2. Por lo tanto,
c1
f (n+1) (c 1 ) = e 2 < 2,
2
si c 1 ∈ (0, 21 ).
2
f (n+1) (c 1 ) 1
1 2
1
Rn = n+1
< .
2 (n + 1)! 2 (n + 1)!2n
Eligiendo n = 4, 1
(n+1)!2n
= 1
5!24
< 10−3 . Por lo tanto
1 1 1 1 1 1 1 1
P4 =1+ + 2 + 3 + 4
2 2 2 2! 2 3! 2 4!
1
Ejercicio 78. Tomemos la función del Ejemplo 7.3.6, es decir, f (x) = 1+x
. Para n ≥ 0, sean
Pn su polinomio de Taylor de orden n en 0, y Rn = f − Pn el resto.
2. Investigar si, para x ∈ (0, 1), el valor de Pn (x) aproxima a f (x) cuando n es suficien-
temente grande.
3. Investigar si, para x ∈ (−1, 0), el valor de Pn (x) aproxima a f (x) cuando n es sufi-
cientemente grande.
240
Expansión decimal
α0 = 1 − 10−4 y α1 = 1 + 10−4
están a distancia menor que 10−3 y difieren en la cifra de las unidades. Efectivamente,
α0 = 0, 9999 y α1 = 1, 0001.
Entonces, si sólo podemos calcular el número π aproximadamente, ¿cómo estamos
seguros de que su segunda cifra después de la coma es un 4?
Recordemos cómo se escribe la expansión decimal. Digamos que α es un número
entre 0 y 1, es decir, es de la forma α = 0, . . .. Dividimos el intervalo [0, 1] en diez
subintervalos iguales:
1 1 2 2 3 3 4 4 5
0, , , , , , , , , ,
10 10 10 10 10 10 10 10 10
5 6 6 7 7 8 8 9 9
, , , , , , , , y ,1 .
10 10 10 10 10 10 10 10 10
6 7
Si α está, por ejemplo, entre 10
y 10
, su expansión decimal comienza con un 6. Es
decir, α = 0, 6 . . ..
6 7
Para saber la segunda cifra decimal de α, dividimos el intervalo [ 10 , 10 ] en diez
62 63
subintervalos iguales. Si α está, por ejemplo, en el subintervalo [ 100 , 100 ], su segunda
cifra decimal será un 2.
63
¿Qué pasa si α es el número 100
? ¿Es de la forma
0, 62 . . .
62 63
por pertenecer a [ 100 , 100 ], o de la forma
0, 63 . . .
63 64
por pertenecer a [ 100 , 100 ]? ¡Lo podemos escribir de cualquiera de las dos maneras! En
efecto,
63
= 0, 63 = 0, 629999999999999999 . . . ,
100
donde la sucesión de nueves es infinita.
63
Tan cerca como queramos del 100 , habrá otros números cuya segunda cifra decimal
sea 2 y números cuya segunda cifra decimal sea 3.
k
En realidad, todos los números que son de la forma n , donde k ∈ Z y n ∈ N,
10
tienen dos expansiones decimales distintas. Son los números enteros y los números
que, al subdividir un intervalo de extremos enteros [N, N + 1] primero en 10, luego
en 102 , luego en 103 , etc., en algún momento caen en el borde de dos subintervalitos.
Pero todos los demás números tienen una expansión decimal única.
241
f (n+1) (c)
Fijados a, n y x, queremos probar que Rn (f, a)(x) = (n+1)!
(x − a)n+1 para algún valor
de c entre a y x.
R
Con esta definición, el resto Rn (f, a)(x) es igual a (n+1)! (x − a)n+1 . Por lo tanto, tenemos
que probar que existe un c entre a y x para el cual R = f (n+1) (c).
Observemos que F (x) = F (a) = f (x), y que F es una función derivable. Por el Teorema de
Rolle, existe c entre a y x tal que F ′ (c) = 0.
f (n+1) (c)
Que F ′ (c) = 0 quiere decir que R
n!
(x − c)n = n!
(x − c)n , es decir, R = f (n+1) (c).
Esto es lo que querı́amos probar.□