0% encontró este documento útil (0 votos)
21 vistas248 páginas

Libro FING

El documento es un texto académico sobre Cálculo Diferencial e Integral en una variable, que cubre temas fundamentales como conjuntos, números reales, integración, límites, continuidad, derivadas y el teorema fundamental del cálculo. Está estructurado en secciones que abordan definiciones, propiedades y ejemplos prácticos, proporcionando una base sólida para el estudio de estas áreas matemáticas. Escrito por varios autores y editado por Jazmín Finot, el contenido es adecuado para estudiantes de ingeniería.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
21 vistas248 páginas

Libro FING

El documento es un texto académico sobre Cálculo Diferencial e Integral en una variable, que cubre temas fundamentales como conjuntos, números reales, integración, límites, continuidad, derivadas y el teorema fundamental del cálculo. Está estructurado en secciones que abordan definiciones, propiedades y ejemplos prácticos, proporcionando una base sólida para el estudio de estas áreas matemáticas. Escrito por varios autores y editado por Jazmín Finot, el contenido es adecuado para estudiantes de ingeniería.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Cálculo Diferencial e Integral en una

variable

IMERL
Facultad de Ingenierı́a
Universidad de la República
2

Gonzalo Cousillas escribió “Conjuntos”


Richard Muñiz escribió “Número Real”
Alexandre Miquel escribió “Integración”, “Lı́mites y continuidad”
Matilde Martı́nez escribió “Derivadas”, “Teorema fundamental del cálculo y métodos de
integración”, “Polinomio de Taylor”
Edición: Jazmı́n Finot
Índice general

1. Conjuntos 1
1.1. Conjuntos, elementos y pertenencia . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Operaciones con conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Número real 9
2.1. ¿Qué es un número real? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2. Desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3. Completitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3. Integración 21
3.1. Integral de una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.1. Objetivo y método . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.1.2. Particiones de un intervalo . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.3. Sumas inferiores y superiores . . . . . . . . . . . . . . . . . . . . . . 25
3.1.4. Integral inferior y superior . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.5. Ejemplos y contraejemplo . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2. Propiedades de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.1. Monotonı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.2. Linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.3. Integral y valor absoluto . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4. Aditividad respecto al intervalo
Rb . . . . . . . . . . . . . . . . . . . . . 51
3.2.5. Extensión de la notación a f a los casos donde a = b y a>b . . . . 54
3.2.6. Otras propiedades geométricas de la integral . . . . . . . . . . . . . . 56
3.3. Ejemplos de funciones integrables . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.1. Funciones escalonadas . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2. Integración de funciones polinomiales . . . . . . . . . . . . . . . . . . 65
3.3.3. Integral de la función t 7→ 1/t . . . . . . . . . . . . . . . . . . . . . . 72

4. Lı́mites y continuidad 79
4.1. Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.1. Entornos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.1.2. Noción de lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.1.3. Ejemplos y contraejemplos . . . . . . . . . . . . . . . . . . . . . . . . 83
4.1.4. Propiedades algebraicas de los lı́mites . . . . . . . . . . . . . . . . . . 89
4.1.5. Propiedades de monotonı́a . . . . . . . . . . . . . . . . . . . . . . . . 95
4.1.6. Composición de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . . 97

3
4

4.1.7. Generalización de la noción de lı́mite . . . . . . . . . . . . . . . . . . 99


4.2. Funciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2.1. Observación y definición . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2.2. Propiedades algebraicas . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2.3. Valores intermedios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.2.4. Extremos absolutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.2.5. Funciones inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.2.6. Función continua definida por una integral . . . . . . . . . . . . . . . 128
4.3. Continuidad uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.1. Observaciones y definición . . . . . . . . . . . . . . . . . . . . . . . . 130
4.3.2. Teorema de Heine-Cantor . . . . . . . . . . . . . . . . . . . . . . . . 132
4.3.3. Más funciones integrables . . . . . . . . . . . . . . . . . . . . . . . . 135
4.3.4. Aplicación: el teorema del valor medio . . . . . . . . . . . . . . . . . 138

5. Derivadas 141
5.1. Definición de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.1.1. Velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.1.2. Pendiente de la recta tangente . . . . . . . . . . . . . . . . . . . . . . 144
5.1.3. Lı́mite del cociente incremental . . . . . . . . . . . . . . . . . . . . . 146
5.1.4. Continuidad de las funciones derivables . . . . . . . . . . . . . . . . . 147
5.2. Cálculo de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.2.1. Primeros ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.2.2. Un ejemplo que desafı́a la intuición . . . . . . . . . . . . . . . . . . . 153
5.2.3. Álgebra de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.2.4. Regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.2.5. Teorema de la función inversa . . . . . . . . . . . . . . . . . . . . . . 159
5.2.6. Regla de L’Hôpital . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.3. Teorema del valor medio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.1. Extremos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
5.3.2. Teorema de Rolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.3.3. Teorema del valor medio de Lagrange . . . . . . . . . . . . . . . . . . 170
5.3.4. Demostración de la Regla de L’Hôpital . . . . . . . . . . . . . . . . . 172
5.4. Crecimiento y clasificación de extremos . . . . . . . . . . . . . . . . . . . . . 174
5.4.1. Crecimiento y signo de la derivada . . . . . . . . . . . . . . . . . . . 174
5.4.2. Clasificación de extremos a partir del signo de la derivada . . . . . . 177
5.4.3. Clasificación de extremos con la derivada segunda . . . . . . . . . . . 178

6. Teorema fundamental del cálculo y métodos de integración 185


6.1. Teorema Fundamental del Cálculo . . . . . . . . . . . . . . . . . . . . . . . . 186
6.1.1. Teorema Fundamental del Cálculo: enunciado y demostración . . . . 186
6.1.2. Primitivas de una función . . . . . . . . . . . . . . . . . . . . . . . . 190
6.1.3. Derivada de funciones dadas por expresiones integrales . . . . . . . . 192
6.2. Métodos de integración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.2.1. Regla de Barrow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.2.2. Integración por partes . . . . . . . . . . . . . . . . . . . . . . . . . . 196
6.2.3. Integración por sustitución o cambio de variable . . . . . . . . . . . . 199
5

6.2.4. Integración de funciones racionales . . . . . . . . . . . . . . . . . . . 206

7. Polinomio de Taylor 219


7.1. Definición del polinomio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . 220
7.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
7.3. El teorema de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
7.4. Aplicación al cálculo de lı́mites . . . . . . . . . . . . . . . . . . . . . . . . . 234
7.5. Forma del resto de Lagrange y estimación de errores . . . . . . . . . . . . . . 236
6
Capı́tulo 1

Conjuntos

1.1. Conjuntos, elementos y pertenencia


En matemática se utilizan diferentes lenguajes para comunicarse; existen tres grandes
categorı́as: el lenguaje coloquial, el lenguaje simbólico y el lenguaje gráfico. El lenguaje co-
loquial se utiliza para expresar ideas y conceptos en forma escrita u oral usando el lenguaje
ordinario. El lenguaje simbólico se utiliza para expresar con sı́mbolos en forma precisa los
conceptos dados en lenguaje coloquial. El lenguaje gráfico se utiliza para aclarar conceptos
y situaciones.
Al usar el lenguaje simbólico, usualmente utilizamos letras mayúsculas (A, B, C, . . .)
para designar los conjuntos y letras minúsculas (a, b, c, . . .) para designar los elementos. Se
considera un sı́mbolo que relaciona un elemento con un conjunto (∈). Se escribe

a∈A

y se lee, a pertenece al conjunto A. Para indicar que un elemento no pertenece a un conjunto


se escribe
a∈/A
Los sı́mbolos N, Z, Q, R denotan determinados conjuntos numéricos. N es el conjunto de los
números naturales, Z el conjunto de los números enteros, Q el conjunto de los números ra-
cionales, R el conjunto de los números reales.
No ahondaremos aquı́ en la construcción de estos conjuntos numéricos y los supondremos
conocidos.

Una de las primeras interrogantes que aparecen al trabajar con conjuntos es la forma
de determinarlos. Se debe indicar de una forma precisa y sin ambigüedades, cuáles son sus
elementos. Se pueden distinguir varias formas, una de estas es determinar al conjunto por
extensión, esto es, listar todos los elementos del conjunto. Por ejemplo, si A es el conjunto
de los números naturales mayores o iguales que 10 y menores que 20, entonces

A = {10, 11, 12, 13, 14, 15, 16, 17, 18, 19}

Podemos observar que cada elemento está separado por una coma, y los mismos se encuen-
tran entre llaves.

1
2

Otra forma de describir un conjunto es por comprensión, la misma consiste en indicar una
propiedad que deben cumplir sus elementos y sólo estos (para no generar ambigüedades).
Consideremos B como el conjunto de los números naturales que son pares y menores que
nueve, entonces
B = {n ∈ N : n < 9 y n = 2̇}
Como última observación recordemos que el conjunto que no tiene elementos se denomina
conjunto vacı́o, se lo denota usualmente { } o ∅.
Ejemplo 1.1.1. Determinar los siguientes conjuntos por extensión y por comprensión:
1. A es el conjunto formado por los cuadrados de los primeros diez números naturales.
2. B es el conjunto formado por las raı́ces cuadradas de los primeros cincuenta naturales
y que además sean naturales.
3. C es el conjunto formado por los naturales múltiplos de tres que además son menores
que diecisiete o múltiplos de cinco menores que treinta.
Solución:
1. Si deseamos determinar A por extensión, debemos elevar al cuadrado cada uno de
los diez primeros números naturales y el elemento obtenido pertenecerá al conjunto.
Realicemos los cálculos: 02 = 0, 12 = 1, 22 = 4, 32 = 9, 42 = 16, 52 = 25,
62 = 36, 72 = 49, 82 = 64, 92 = 81, 102 = 100. Obtenemos entonces que

A = {0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100}

Ahora bien, para determinar por comprensión A, debemos indicar que propiedad cum-
plen sus elementos
A = {x : x = n2 , n ∈ N, n ≤ 10}

2. Para determinar por extensión este conjunto podrı́amos probar aplicar raı́z cuadrada a
cada número entre 0 y 50 y ver si el resultado es un número natural. Luego de algunos
cálculos obtenemos que
B = {7, 6, 5, 4, 3, 2, 1, 0}
Para expresar B por comprensión indicamos las propiedades que se deben cumplir:

B = {x ∈ N : x = n, n ∈ N, n ≤ 50}

3. Al determinar C debemos tener en cuenta las dos condiciones, la primera es ser múlti-
plo de tres menor que diecisiete, la segunda es ser múltiplo de cinco y menor que
treinta. Entonces
C = {3, 6, 9, 12, 15, 5, 10, 20, 25}
Determinemos C por comprensión:

C = {x : x = 3n, n ≤ 5, n ∈ N o x = 5m, m ≤ 5, m ∈ N}

Más adelante veremos una forma mas sencilla de determinar este conjunto teniendo
en cuenta las operaciones entre conjuntos.
3

Observación 1.1.2. Al determinar un conjunto por extensión, el orden en el cual aparecen


los elementos no tiene importancia y si los elementos son repetidos, se cuentan una vez sola.
A modo de ejemplo, si escribimos T = {1, 2, 3, 2, 3}, en realidad se considera T = {1, 2, 3}.

Veamos ahora una representación en modo gráfico de los conjuntos, es claro que en ciertos
casos manejar diferentes registros ayuda a la comprensión de la situación. Los conjuntos
pueden representarse gráficamente utilizando diagramas de Venn, la idea es bastante simple
y conocida,

denota el conjunto B = {0, 1, 2, 3, 4, 5, 6, 7}


Veamos algunas relaciones básicas.

Definición 1.1.3. Sean A y B dos conjuntos, se dice que A está incluido en B o


que A es un subconjunto de B y se denota A ⊂ B si todo elemento que pertenece al
conjunto A también pertenece al conjunto B.
En lenguaje simbólico:

A ⊂ B si ∀ x / x ∈ A ⇒ x ∈ B

La concatenación de sı́mbolos (∀ x / x ∈ A) se leen como “para todo elemento x


perteneciente al conjunto A”.

Decir que dos conjuntos son iguales (A = B), es decir que tienen los mismos elementos,
por tanto todo elemento de A debe pertenecer a B y asimismo, todo elemento de B debe
pertenecer a A. En resumidas cuentas, A = B si A ⊂ B y B ⊂ A. En el caso que A ⊂ B
pero A ̸= B se dice que A está incluido estrictamente en B o que A es un subconjunto
propio de B y se denota A ⊊ B. En este caso todo elemento del conjunto A pertenece al
conjunto B, pero existe al menos un elemento b que pertenece al conjunto B tal que éste no
pertenece al conjunto A. En sı́mbolos

A ⊊ B si ∀ a ∈ A ⇒ a ∈ B y ∃ b ∈ B / b ∈
/A
4

1.2. Operaciones con conjuntos


Unión de Conjuntos
Sean A y B dos conjuntos, la unión de A y B es un nuevo conjunto cuyos elementos
pertenecen a A o pertenecen a B. En sı́mbolos matemáticos este concepto se expresa
de la siguiente manera
A ∪ B = {x / x ∈ A o x ∈ B}

La representación de la unión en diagramas de Venn es

A∪B

A B

Ejemplo 1.2.1. Sean A = {1, 5, 7, 14, 22, 31, 33} y B = {2, 4, 5, 6, 7, 20, 22, 30}.
Entonces A ∪ B = {1, 2, 4, 5, 6, 7, 14, 20, 22, 30, 31, 33}.

Ejemplo 1.2.2. Consideremos los siguientes conjuntos, A = {1, 3, 5, 7, 9}, B = {2, 4, 6, 8, 10}.
Entonces

A ∪ A = {1, 3, 5, 7, 9} ∪ {1, 3, 5, 7, 9} = A

A ∪ B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} = B ∪ A

A = {1, 3, 5, 7, 9} ⊂ {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} = A ∪ B

Proposición 1.2.3 (Propiedades de la Unión de Conjuntos). Sean A y B dos con-


juntos. Entonces:

1. A ∪ A = A

2. A ∪ B = B ∪ A

3. A ∪ ∅ = A

4. A ⊂ A ∪ B

5. B ⊂ A ⇐⇒ B ∪ A = A.
5

Intersección de Conjuntos
Sean A y B dos conjuntos, la intersección de A y B es un nuevo conjunto cuyos
elementos pertenecen a A y a B. En sı́mbolos matemáticos

A ∩ B = {x : x ∈ A y x ∈ B}

La representación de la intersección con diagramas de Venn es

A∩B

A B

Ejemplo 1.2.4. Sean A = {1, 5, 7, 14, 22, 31, 33} y B = {2, 4, 5, 6, 7, 20, 22, 30}.
Entonces A ∩ B = {5, 7, 22}.

Ejemplo 1.2.5. Consideremos A = {1, 2, 3, 4, 6, 8, 10}, B = {2, 3, 4, 5, 7, 9}. Entonces

A ∩ A = {1, 2, 3, 4, 6, 8, 10} ∩ {1, 2, 3, 4, 6, 8, 10} = {1, 2, 3, 4, 6, 8, 10} = A

A ∩ B = {1, 2, 3, 4, 6, 8, 10} ∩ {2, 3, 4, 5, 7, 9} = {2, 3, 4} = B ∩ A

A ∩ B = {2, 3, 4} ⊂ {2, 3, 4, 5, 7, 9}

Proposición 1.2.6 (Propiedades de la intersección de conjuntos). Sean A y B con-


juntos. Entonces:

1. A ∩ A = A

2. A ∩ B = B ∩ A

3. A ∩ ∅ = ∅

4. A ∩ B ⊂ A

5. B ⊂ A ⇐⇒ A ∩ B = B
6

Diferencia de Conjuntos
Sean A y B dos conjuntos, se llama diferencia de A y B al conjunto que tiene como
elementos los que pertenecen al conjunto A y no pertenecen al conjunto B.
Simbólicamente se denota

A \ B = {x / x ∈ A y x ∈
/ B}

Es usual escribir también A − B para notar A \ B.

La representación de la diferencia de conjuntos en diagramas de Venn es

A\B

A B

Ejercicio 1. Determinar si es cierto que si A y B son dos conjuntos, se cumple que A \ B =


B \ A.

Proposición 1.2.7 (Propiedades de la Diferencia de Conjuntos). Sean A, B y C


conjuntos. Entonces:

1. A \ A = ∅

2. A \ ∅ = A

3. ∅ \ A = ∅

4. A \ (B ∪ C) = (A \ B) \ C

Complemento
Si A ⊂ B se define el complemento de A respecto de B como el conjunto cuyos
elementos pertenecen a B y no pertenecen a A. Simbólicamente,

AC
B = {x : x ∈ B y x ̸∈ A}

. Observar que el subı́ndice indica el conjunto respecto del cual se complementa.

Observación 1.2.8. Si no se indica el conjunto respecto al cual se complementa entonces


B C = {x : x ̸∈ B} quedando implı́cito el conjunto universal al cual pertenecen los elementos.
Ejercicio 2. 1. Sean A, B, C tres conjuntos. Sabiendo que A ∪ C = {n ∈ N / n < 9 y n ̸=
6}, B ∪ C = {2, 5, 7, 8, 9} B ∩ C = {5, 7}, A ∩ C = {2} y C \ (B ∪ A) = {8}, hallar
A, B y C.
7

2. Dados B = {x ∈ N / 2 divide x y 3 < x < 9} y C = {x ∈ N : 3 < x < 9}.


Hallar todos los conjuntos D que verifican simultáneamente D ⊂ C, {6, 7} ⊂ D y
B ∩ D = {6, 8}.

3. Considerar los conjuntos A = {1, 2}, B = {{1}, {2}}, C = {{1}, {1, 2}}, D =
{{1}, {2}, {1, 2}}. Indica si son verdaderas o falsas las siguientes afirmaciones justifi-
cando la respuesta

a. A=B f. B ⊂ C
b. A⊂B g. B ⊂ D
c. A⊂C
d. A∈C h. B ∈ D
e. A⊂D i. A ∈ D

4. Dados los conjuntos A = {x ∈ N / 1 ≤ x ≤ 2} y B = {x ∈ N / 1 ≤ x ≤ 4}.


Hallar los conjuntos C tales que A ⊂ C ⊂ B.

5. Considere los conjuntos A = {x ∈ N : 0 ≤ x ≤ 6}, B = {x ∈ N : 2 ≤ x ≤ 8},


C = {x ∈ N : 2 ≤ x ≤ 6}, D = {x ∈ N : 3 ≤ x ≤ 4}.
Indicar si son verdaderas o falsas las siguientes afirmaciones, justificando la respuesta.

a. 3 ∈
/C e. C ⊂ D
b. Si x ∈ A ⇒ x ≤ 5 f. D ⊂ A
c. Si x ≤ 8 ⇒ x ∈ B g. A ∩ B = C
d. Si x ∈ B ⇒ x ≥ 2 h. B ∩ C = B

6. Se le realizó a un grupo de 43 estudiantes un cuestionario que contenı́a las siguientes


preguntas: ¿repite?, ¿tiene previas?, ¿posee todos los textos recomendados? Se obtu-
vieron los siguientes datos:

(i) 12 estudiantes repiten


(ii) 15 estudiantes poseen todos los textos
(iii) 6 estudiantes repiten y tienen los textos
(iv) 17 respondieron negativamente a las tres preguntas
(v) 1 estudiante respondió afirmativamente a las tres preguntas
(vi) 10 respondieron afirmativamente sólo a dos preguntas
(vii) 15 estudiantes respondieron afirmativamente sólo a una pregunta

a. De los estudiantes que no repiten ni tienen todos los textos, ¿cuántos tienen
previas?
b. De todo el grupo, ¿cuántos tienen previas?
8
Capı́tulo 2

Número real

2.1. ¿Qué es un número real?

Los números reales son básicamente aquellos que sirven para “hacer cálculo”. Siendo un
tanto esquemáticos podemos decir que existen dos enfoques, en cierta forma contrapuestos,
para abordar la definición:

La definición axiomática;
La definición constructiva.

En estas notas nos inclinaremos por la segunda alternativa, y no nos preocuparemos dema-
siado por los aspectos formales de ésta. En primer lugar, consideraremos que los números
naturales N = {0, 1, 2, 3, . . .} son las piezas fundamentales a partir de las cuales vamos a
construir todos los demás “números” (parafraseando a Leopold Kronecker, asumiremos los
naturales como dados por Dios, y construiremos todo lo demás).

La primera construcción que surge a partir de los naturales es la de las proporciones o


razones, que son cocientes de naturales
1 2
, ,···
2 3
y que tienen un significado claro (sobre todo si uno tiene hermanos). Por otro lado, para
poder restar números naturales sin problema, se puede agregar el 0 y los negativos de los
naturales, obteniéndose ası́ los números enteros:

Z = {· · · , −3, −2, −1, 0, 1, 2, 3, · · · }.


Y por qué no, considerar también las proporciones entre números enteros, que es los que se
conoce como los números racionales (se denominan ası́ porque son proporciones, ¡no porque

9
10

piensen lógicamente!): nm
Q= : m, n ∈ Z, n ̸= 0 .
o
n
Detengámonos un momento y observemos que con los números racionales podemos realizar
tranquilamente las operaciones de suma, multiplicación, resta y división (simpre que no
tratemos de dividir entre cero) y éstas cumplirán todas las propiedades usuales a las que
estamos acostumbrados. Un sistema numérico con esas propiedades es lo que los matemáticos
denominan cuerpo. La pregunta serı́a ¿por qué no detenernos acá? La respuesta se puede
rastrear al menos hasta la antigua Grecia, y fue un pitagórico el primero en darse cuenta de
que la diagonal de un cuadrado de lado 1 tiene una longitud que no es racional (WTF!?)1 .
Dicho en términos más modernos, la raı́z cuadrada de 2 no es un número racional.

Proposición 2.1.1. 2 no es racional. O, equivalentemente, ∄ q ∈ Q tal que q 2 = 2.

Demostración.

Sea
m
m, n ∈ Z, con n ̸= 0.
q=
n
Podemos suponer que la fracción está reducida, i.e.2 que m y n no tienen factores en común,
con lo cual m2 y n2 tampoco tendrán factores en común. Entonces,

m2
q2 = =2
n2
si y solo si m2 = 2 y n = 1, pero no hay ningún entero cuyo cuadrado sea 2.

Siguiendo con nuestra construcción podrı́amos considerar entonces los números cons-
tructibles (aquellos que se pueden construir con regla y compás). Y por qué no, los números
que son raı́ces de polinomios con coeficientes racionales, que se llaman números algebraicos.
También están los números que se llaman computables... y ainda mais. Cada uno de los
conjuntos numéricos mencionados anteriormente es un cuerpo más grande que el anterior,
pero si seguimos ası́ no vamos a llegar muy lejos. Ası́ que vamos a intentar algo radicalmente
diferente.
1
Del inglés what a terrible fact!
2
Abreviación de la locusión latina id est que significa “esto es”.
11

Expresiones decimales
A todo número racional q ∈ Q lo podemos expresar usando decimales:

q = ±q0 .q1 q2 q3 · · ·

donde
q0 ∈ N, qi ∈ {0, 1, 2, . . . , 9}, i = 1, 2, . . .
De manera que podemos escribir

q = ± q0 + q1 10−1 + q2 10−2 + . . .


Notar que la expresión decimal de cualquier racional es necesariamente periódica a partir


de cierto momento (esto se deduce del algoritmo de la división de Euclides), por lo que no
toda expresión decimal corresponde a un número racional. Podrı́amos considerar entonces
el conjunto de todas las expresiones decimales posibles. ¿Acaso eso no serı́a el conjunto de
todos los números posibles? Para nuestros intereses la respuesta es que sı́.
Observación 2.1.2. Las expresiones decimales no están univocamente determinadas, o di-
cho de otra forma, dos expresiones decimales diferentes pueden corresponder a un mismo
racional. El único caso de discrepancia, sin embargo, es cuando se repite el dı́gito 9 indefi-
nidamente y esto se debe a que 0,999 . . . = 1,000 . . . Una forma muy simple de ver esto es
la siguiente:
1

= 0,333 . . .
 1 2
3 ⇒ 1 = + = 0,999 . . .
2 3 3
= 0,666 . . .

3
En las expresiones decimales descartaremos entonces las que terminan con una repetición
de infinitos nueves, utilizando en su lugar la expresión decimal finita correspondiente.

Definición 2.1.3. Llamaremos número irracional a las expresiones decimales que no


representan un número racional. Notemos que acá no hay ambigüedad, un número
irracional tiene una única expresión decimal. Los números reales serán la unión de los
racionales y los irracionales, y los denotaremos por R. Entonces,

R := {±x0 .x1 x2 . . . : x0 ∈ N, xi ∈ {0, 1, . . . , 9} para i = 1, 2, . . .}.

Consideremos un número real


x ∈ R+ , x = x0 + x2 10−1 + x2 10−2 + · · ·
x = x0 .x1 x2 x3 . . .
12

notemos que x0 ∈ Z es el único entero de manera que x ∈ [x0 , x0 + 1). Aprovechamos para
dar la siguiente definición:

Definición 2.1.4. Dado un número real x cualquiera siempre existe un único entero
x0 tal que x ∈ [x0 , x0 + 1). Tal x0 se llama parte entera de x.

Si dividimos el intervalo [x0 , x0 + 1) en 10 partes iguales


x0 + 10i , x0 + i+1
 
10
con i = 0, . . . , 9,
existirá un único x1 ∈ {0, . . . , 9} tal que x ∈ x0 + x101 , x0 + x110+1 ; x1 es la parte entera de
 

10(x − x0 ).

3 4
 
En el dibujo tenemos x ∈ x0 + 10
, x0 + 10
, ası́ que
x = x0 + 3 × 10−2 + · · ·
x ≈ x0 ,3
Por inducción podemos hallar todos los dı́gitos decimales de x.

Ejemplo √2.1.5. Veamos cómo√funciona esto en el caso de 2. Es fácil ver que que la parte
entera de 2 es 1 ya que 1 < 2 < 2. Dividimos [1, 2] en 10 partes iguales:
[1, 1,1), [1,1, 1,2), · · · , [1,9, 2).
Tenemos que √
2 ∈ [1,4, 1,5) ya que (1,4)2 < 2 < (1,5)2 ,
con lo cual x1 = 4. Análogamente, podemos continuar con el mismo razonamiento,

2.2. Desigualdades

Los naturales están ordenados


0 < 1 < 2 < 3 < ... < n < n + 1 < ...
13

Dados dos naturales m, m se cumple la ley de tricotomı́a:


vale una y sólo una de las relaciones m < n, n < m, o m = n.

Si m < n ⇒ m + p < n + p ∀ p ∈ N. De lo cual también tendremos pm < pn ∀ p ∈ N.

El orden en N se puede extender a un orden en R definiendo los reales positivos como las
expresiones decimales de la forma x0 .x1 x2 . . .. Diremos que x < y si 0 < y − x para x, y ∈ R.
Denotaremos por R+ al conjunto de los reales positivos,
R+ = {x ∈ R : x > 0} = {x0 .x1 . . . : x0 ∈ N, xi ∈ {1, . . . , 9} para i ⩾ 1}

Teorema 2.2.1. El orden en R satisfece:


1. Transitividad: x < y, y < z ⇒ x < z.

2. Tricotomı́a: se cumple una y sólo una de las siguientes relaciones

x < 0, x > 0 o x = 0

3. Monotonı́a con respecto a la adición: x < y ⇒ x + z < y + z

4. Monotonı́a con respecto a la multiplicación: x < y, z > 0 ⇒ xz < yz.

De la propiedad 4 se pueden deducir las bien conocidas reglas de que “más por más
es más y menos por más es menos”. Supongamos, por ejemplo, que a y b son dos reales
positivos. Poniendo x = 0, y = a y z = b en 4, obtenemos que 0 = 0b < ab. Todas las demás
propiedades conocidas, se deducen de las propiedades anteriores. Dejamos como ejercicio
demostrar que si 0 < x entonces 0 < x1 .

Valor absoluto
La función valor absoluto | · | : R → R está definida por

 x si x > 0
x ∈ R 7−→ |x| = −x si x < 0
0 si x = 0

Geométricamente |x| = “distancia de x a 0”. Si x, y ∈ R, entonces |y − x| = será la


“distancia de x a y”.

|y − x|

x 0 y
|x| |y|
14

Proposición 2.2.2. Si x, y ∈ R+ son tales que xn > y n para algún n ∈ N, entonces


x > y.

Demostración. Demostraremos el contrarrecı́proco

x < y ⇒ xn < y n ,

por inducción en n.

Si n = 1 es obvio.

Supongamos que xn < y n .

Multiplicando la desigualdad x < y de ambos lados por xn , y usando que xn < y n , se tiene
que
xn+1 = xn x < xn y < y n y = y n+1 .

Teorema 2.2.3 (Desigualdad triangular). Si x, y ∈ R

|x + y| ⩽ |x| + |y|

Demostración. 
x ⩽ |x|
⇒ x + y ⩽ |x| + |y|
y ⩽ |y|

−x ⩽ |x|
⇒ −x − y ⩽ |x| + |y|
−y ⩽ |y|

⇒ |x + y| ⩽ |x| + |y|.

2.3. Completitud

R tiene una estructura algebraica que se denomina cuerpo: podemos sumar, restar, mul-
tiplicar y dividir usando todas las propiedades usuales.
15

¿Qué es un cuerpo?
Un cuerpo es un conjunto, usualmente denotado por K, en el que están definidas ope-
raciones de “suma” + y “multiplicación” · de manera que se verifican las siguientes
propiededes (axiomas de cuerpo):

Asociatividad : (a + b) + c = a + (b + c)
(a · b) · c = a · (b · c)

Conmutatividad : a + b = b + a
a·b=b·a

Existencia de neutros: ∃ 0 ∈ K tal que a + 0 = a ∀ a ∈ K.


∃ 1 ∈ K tal que a · 1 = a ∀ a ∈ K

Distributiva: a · (b + c) = a · b + a · c

Existencia de inversos: ∀ a ∈ K ∃ − a ∈ K tal que a + (−a) = 0. .


∀a ∈ K, a ̸= 0 ∃a−1 ∈ K tal que a · a−1 = 1

N no es un cuerpo porque no podemos restar ni dividir, Z no es un cuerpo porque no


podemos dividir, Q y R son cuerpos. Pero además Q y R son cuerpos ordenados. Un cuerpo
se llama ordenado cuando existe un orden que es compatible con las operaciones de cuerpo
en el sentido del teorema 2.2.1 (normalmente esas propiedades se enuncian como axiomas
de orden, agregando que 0 < 1 para que todo quede ordenado de la manera usual). El
orden en R nos permite pensar los números reales como puntos en una recta. Además Q
tiene la propiedad de densidad : entre dos racionales siempre habrá otro racional, i.e. dados
racionales p < q existe r ∈ Q tal que p < r < q. Como Q ⊂ R los reales son también√densos.
Sabemos que los racionales no son todos los puntos de la recta porque por ejemplo 2 ̸= Q,
es decir, la recta racional tiene agujeros. Vamos a ver a continuación que R es el cuerpo que
se obtiene al “rellenar” esos agujeros y esa será la diferencia fundamental entre R y Q que
nos permite desarrollar el cálculo infinitesimal.

Vamos a definir ahora unos conjuntos especiales, que serán fundamentales para todo lo
que vamos a desarrollar más adelante.
16

Intervalos
Definición 2.3.1.
Intervalos cerrados: [a, b] = {x ∈ R : a ⩽ x ⩽ b} para a, b ∈ R.
Intervalos abiertos: (a, b) = {x ∈ R : a < x < b} para a, b ∈ R o a = −∞, o b = +∞.
En particular, (−∞, +∞) = R
Intervalos semiabiertos: (a, b], [a, b) para a, b ∈ R puediendo ser también a = −∞ en
el primer caso y b = +∞ en el segundo.

(a, b] = {x ∈ R : a < x ⩽ b}
[a, b) = {x ∈ R : a ⩽ x < b}

En términos geométricos, un intervalo es un segmento de recta, que puede ser finito o


infinito y que puede contener a los extremos o no.

Cotas superiores e inferiores


Definición 2.3.2. Sea S ⊂ R un subconjunto no vacı́o.

1. Decimos que S es acotado superiormente si existe K ∈ R tal que ∀ x ∈ S se tiene


que x ⩽ K. En palabras, hay un número real de manera que ningún número de
S es más grande que él. Utilizando intervalos podemos decir que S ⊂ (−∞, K]
para algún K ∈ R. Análogamente, decimos que S es acotado inferiormente, si
existe K ∈ R tal que S ⊂ [K, +∞). Nos referimos a K como siendo cota superior
o inferior de S, respectivamente.

2. Si S es acotado superiormente decimos que K ∈ R es el supremo de S si es


cota superior de S y no hay una cota superior que sea menor. Análogamente, se
define ı́nfimo como la mayor de las cotas inferiores.

3. Si sup(S) ∈ S decimos que S tiene máximo y lo denotaremos como máx(S). Si


ı́nf(S) ∈ S decimos que S tiene mı́nimo y lo denotamos por mı́n(S).

Es claro que tanto el supremo como el ı́nfimo, si existen, son únicos debido a la ley de
tricotomı́a.

Ejemplo 2.3.3. Sean a, b ∈ R con a < b.

S = (a, b) ⇒ b es el supremo de S

S = [a, b] ⇒ max(S) = a, mı́n(S) = b

S = (a, b) no tiene máximo ni mı́nimo

S = [a, b) ⇒ S no tiene máximo pero tiene mı́nimo mı́n(S) = a

S = (a, b] ⇒ S no tiene mı́nimo pero tiene máximo máx(S) = b


17

Notemos que N no está acotado superiormente ya que si x ∈ R+ , entonces ∃ m ∈ N tal


que
m < x < m + 1.

Consecuencia. ∀a > 0 existe n ∈ N tal que a > 1


n
> 0.

Demostración. 1
a
∈ R+ ⇒ ∃n ∈ N tal que 1
a
< n ⇒ 1
n
< a (multiplicando la
a
desigualdad por n ).
Ejemplo 2.3.4. Todo conjunto de enteros que está acotado superiormente tiene máximo.

Para la definición de R que dimos, es posible demostrar que se cumple la siguiente


propiedad, que normalmente se enuncia como axioma.

Teorema 2.3.5 (Axioma de Completitud). Todo conjunto no vacı́o y acotado supe-


riormente (inferiormente), de números reales, tiene un supremo (ı́nfimo).

Una vez demostrado el teorema para el supremo (no veremos esta demostración), para
ver lo análogo con el ı́nfimo basta considerar el conjunto −S = {−x : x ∈ S}. Si S es
acotado inferiormente, −S será acotado superiormente, tendrá un supremo, y tendremos
ı́nf(S) = − sup(−S).

Si S ⊂ R es acotado superiormente y no vacı́o,

cotas superiores de S = [sup(S), +∞).

y análogamente, si S es no vacı́o y acotado inferiormente,

cotas inferiores de S = (−∞,ı́nf(S)].

Si S ⊂ R es acotado inferior y superiormente, entonces

S ⊂ [ı́nf(S), sup(S)]

Por cuestiones prácticas, conviene extender la noción de supremo e ı́nfimo a conjuntos


no acotados. Si S no es acotado superiormente pondremos sup(S) = +∞ y si no es acotado
inferiormente escribiremos ı́nf(S) = −∞.

Una observación sobre la unicidad del cuerpo de los reales.


Un cuerpo ordenado que satisface la propiedad del teorema anterior se denomina com-
pleto. Es posible demostrar que todo cuerpo ordenado y completo es escencialmente
igual a R, es decir, es escencialmente único. Por esta razón los axiomas cuerpo + orden
+ completitud podemos decir que “definen” R (la mala noticia es que no sabemos si
existe, ¡por eso preferimos la definición constructiva!).
18

√ √
Ya vimos que 2 ∈ / Q, ahora vamos a ver que 2 ∈ R usando lo anterior, es decir, vamos
a probar que existe un real que elevado al cuadrado es 2. De hecho vamos a probar que para
todo real positivo existe una raı́z cuadrada (para 0 es obvio).

Teorema 2.3.6. Para todo real positivo b existe un real a tal que a2 = b.

Demostración. Consideremos el conjunto

S = x ∈ R : x2 < b


Se tiene que

S ̸= ∅ pues 0 ∈ S.

S está acotado superiormente:

Si x ∈ S, entonces x2 < b < (b + 1)2 , de donde x2 < (b + 1)2 , por lo cual x < b + 1, y b + 1
es cota superior de S.

Por el teorema de completitud sabemos que existe sup(S) ∈ R. Afirmamos que si a =


sup(S), entonces a2 = b. Lo demostraremos usando la ley de tricotomı́a. Primero supongamos
que a2 < b. Notemos que
 2
1 2a 1 2a + 1
a+ = a2 + + 2 < a2 + .
n n n n

Por otro lado,

b − a2 1 b − a2 2a + 1
∈ R+ ⇒ ∃ n ∈ N tal que < ⇒ < b − a2 .
2a + 1 n 2a + 1 n
Por lo tanto  2
1
a+ < a2 + b − a2 = b,
n
1
y a+ n
∈ S, lo cual es absurdo.

Análogamente, podemos ver que a2 no puede ser mayor que b ya que tomando n ∈ N
suficientemente grande tendremos que (a− n1 )2 > b. Ası́ que por la ley de tricotomı́a llegamos
a que a2 = b.

Observación 2.3.7. Si b > 0 y a2 = b, entonces (−a)2 = b. √ El real positivo que verifica


2
a = b es único y se llama raı́z cuadrada de b, y se denota por b. Análogamente podemos
considerar la raı́z n-ésima de un número:

n ∈ N impar ⇒ ∀ b ∈ R ∃! a ∈ R tal que an = b


19

n√∈ N par ⇒ ∀ b ∈ R+ ∃! a > 0 tal que an = b.


n 1
b es la notación para la raı́z n-ésima de b, aunque es más conveniente escribir b n .

Ejercicio de parcial

(Ejercicio 1 - Primer parcial segundo semestre 2023) Se considera el conjunto


 n+1 
2 −1
A= : n ∈ Z, n ≥ 0
2n

Entonces

A) A no está acotado inferiormente.

B) A tiene ı́nfimo pero no mı́nimo.

C) A tiene supremo pero no máximo.

D) A tiene supremo y máximo.

E) A no está acotado superiormente.

Solución.
2n+1 − 1
 
A= : n ∈ Z, n ≥ 0
2n
 n+1 
2 1
= − n : n ∈ Z, n ≥ 0
2n 2
 
1
= 2 − n : n ∈ Z, n ≥ 0
2

Dado que 21n > 0 para todo n ≥ 0, tenemos que 2 − 21n < 2 para todo n ≥ 0. Obtenemos,
entonces, que 2 es una cota superior de A. Veamos que 2 es el supremo de A. Para ello,
queremos probar que 2 es la menor cota superior de A, es decir dado ϵ > 0, hay que probar
que 2 − ϵ no es cota superior de A. Tomamos N > 0 tal que 21N < ϵ y se cumple que

1 1
2+ <2+ϵ ⇒ 2−ϵ<2−
2N 2N
Entonces x = 2 − 21N ∈ A pero 2 − ϵ < x por lo que 2 − ϵ no es cota superior de A. Por lo
tanto, sup(A) = 2 y, como 2 ∈/ A, conluı́mos que A tiene supremo pero no máximo. Luego,
la respuesta correcta es C).
20

Ejercicio de parcial

(Ejercicio 1 - Primer parcial primer semestre 2019) Consideremos el conjunto

A = x ∈ Q : x2 < 2 ∩ [0, +∞)




Elija la opción correcta:

A) Este conjunto tiene supremo, ı́nfimo, máximo y mı́nimo.

B) El mı́nimo de este conjunto es 0 y no hay máximo.

C) Este conjunto tiene supremo e ı́nfimo, pero no tiene ni máximo ni mı́nimo.

D) Este conjunto tiene ı́nfimo pero no supremo.

E) Este conjunto tiene supremo pero no ı́nfimo.

Solución.

A = x ∈ Q : x2 < 2 ∩ [0, +∞)




= x ∈ R : x2 < 2 ∩ Q ∩ [0, +∞)



√ √
= (− 2, 2) ∩ Q ∩ [0, +∞)

= [0, 2) ∩ Q

Dado que A ⊂ [0, 2), tenemos que 0 ≤ x para todo x ∈ A. Como además √ 0 ∈ A, tenemos
que √0 es el mı́nimo del conjunto √A. Por otro lado, dado que A ⊂ [0, 2), tenemos que
√ si y ∈ R verifica
√ todo x ∈ A, es decir 2 es una cota superior√de A. Además,
x < 2 para
0 < y < 2 entonces existe un racional√z tal que y < z < 2,√es decir, 2 es la menor cota
superior de A. Por lo tanto sup(A) = 2. Luego, dado que 2 ∈ / A, concluı́mos que A no
tiene máximo y la respuesta correcta es la B).
Capı́tulo 3

Integración

La teorı́a de la integración es una herramienta fundamental para calcular las áreas de


las regiones del plano definidas a partir de curvas. Sus orı́genes se remontan a más de 2300
años, cuando los matemáticos griegos calculaban áreas por el método de exhaución 1 . Este
método consistı́a en aproximar las figuras curvas (tales como los cı́rculos, las elipses o las
parábolas) por polı́gonos para obtener aproximaciones del área de dichas figuras. Por ejem-
plo, la siguiente figura muestra cómo se puede aproximar un cı́rculo por pares de polı́gonos
regulares (uno adentro, y otro afuera), para obtener aproximaciones por defecto y por exceso
de su área:

Los matemáticos griegos también usaron el mismo método con éxito para calcular los
volúmenes de sólidos tales como las esferas, los cilindros o los conos, aproximándolos por
poliedros.

El cálculo integral moderno apareció al final del siglo XVII, cuando el matemático y
filósofo alemán Gottfried Wilhelm Leibniz (1646–1716) descubrió un vı́nculo sorprendente
entre la integración y la derivación 2 . Sin embargo, la definición de Leibniz carecı́a de una
1
El método de exhaución fue introducido por Eudoxo de Cnido (390–337 a.C.) y completado por Ar-
quı́medes de Siracusa (287–212 a. C.), quienes lo usaron para calcular múltiples áreas y volúmenes.
2
Este vı́nculo es el objeto del teorema fundamental del cálculo, que veremos más adelante en este curso.
En este capı́tulo, sólo nos interesaremos por el problema que consiste en definir rigurosamente la noción de
área.

21
22

fundamentación rigurosa, pues le faltaba una definición precisa de los números reales. (De
hecho, las nociones fundamentales de ı́nfimo y de supremo, ası́ como el axioma de completi-
tud, fueron introducidos recién en la primera mitad del siglo XIX.) La primera formalización
rigurosa de la teorı́a de la integración fue dada por el matemático alemán Bernhard Riemann
(1826–1866), y es esencialmente ésta la que vamos a presentar en este capı́tulo 3 .

3.1. Integral de una función

3.1.1. Objetivo y método

El problema de la teorı́a de la integración es el siguiente: dada una función f : [a, b] → R


definida en un intervalo cerrado [a, b] (con a < b), ¿cómo medir el área algebraica de la
región del plano ubicada entre el eje x y la gráfica de la función f ?

Por área algebraica, se entiende el número real (positivo, negativo o nulo) obtenido contando
con un signo positivo las áreas por encima del eje x, y con un signo negativo las áreas por
debajo del eje x, como indicado en la figura anterior 4 . En matemática, el área algebraica
de la región ubicada entre el eje x y la gráfica de f se llama integral de la función f en el
intervalo [a, b], y el proceso que permite determinar dicha área se llama integración.

El método: Para determinar la integral de la función f en el intervalo [a, b], el método


de Riemann consiste en aproximar (por defecto y por exceso) la región correspondiente por
regiones poligonales construidas a partir de rectángulos, y cuya área (algebraica) se calcula
3
Existe otra teorı́a de la integración, debida al matemático francés Henri Lebesgue (1875–1941), que
permite integrar más funciones, y que constituye hoy el marco de referencia de la teorı́a de la integración.
En este curso, nos restringiremos a la teorı́a de Riemann, cuyas definiciones son más sencillas y que es (más
que) suficiente para las necesidades de este curso introductorio.
4
El área algebraica de la región ubicada entre entre el eje x y la gráfica de la función f tiene propieda-
des algebraicas mucho mejores que el área geométrica correspondiente (obtenida contando todas las áreas
involucradas con un signo positivo), y es la razón por qué la teorı́a de la integración sólo considera ésa. Por
otro lado, ambas nociones de área (algebraica y geométrica) coinciden para las funciones positivas o nulas,
y cuando se trata de calcular el área geométrica de la región ubicada entre el eje x y la gráfica de un función
f con un signo cualquiera, basta con remplazar la función f por la función x 7→ |f (x)| (véase Sección 3.2.3).
23

fácilmente sumando las áreas (algebraicas) de dichos rectángulos5 (Sección 3.1.3):

Formalmente, cada par de aproximaciones (una por defecto y otra por exceso) es construido
a partir de una partición P = {a, a1 , a2 , . . . , an−1 , b} del intervalo [a, b] (Sección 3.1.2), cuyos
puntos definen los lı́mites horizontales de los rectángulos que usaremos para construir dichas
aproximaciones. Considerando particiones cada vez más finas del intervalo [a, b], se obtienen
aproximaciones cada vez más precisas del área deseada, la cual puede ser definida como el
”lı́mite”(Sección 3.1.4) de las áreas de todas las aproximaciones ası́ definidas.

3.1.2. Particiones de un intervalo

Definición 3.1.1 (Partición de un intervalo). Sea un intervalo cerrado [a, b] ⊂ R, con


a < b. Se llama partición de [a, b] a todo subconjunto finito P ⊂ [a, b] tal que a ∈ P
y b ∈ P.

Notación
En lo siguiente, escribiremos sistemáticamente las particiones P del intervalo [a, b]
ordenando sus elementos de modo creciente; es decir: de la forma

P = {a0 , a1 , a2 , . . . , an } , con a = a0 < a1 < a2 < . . . < an = b

Intuitivamente, una partición P = {a0 , a1 , . . . , an } del intervalo [a, b] sirve para descom-
poner dicho intervalo en una unión finita de subintervalos esencialmente disjuntos6 :
[a, b] = [a0 , a1 ] ∪ [a1 , a2 ] ∪ · · · [an−1 , an ]

Definición 3.1.2 (Orden entre las particiones). Las particiones de un intervalo [a, b]
están ordenadas por el orden de la inclusión. Ası́, dadas dos particiones P y Q del
intervalo [a, b] tales que P ⊂ Q, se dice que Q es más fina que P , o que P es más
gruesa de Q.
5
El área algebraica de un rectángulo de ancho l < 0 (positivo) y de altura L ∈ R (algebraica) es el
producto l × L. Este producto es positivo, negativo o nulo según si la altura algebraica L es positiva,
negativa o nula (siendo el ancho positivo, por convención).
6
Es decir: subintervalos que no se intersectan, salvo quizás en sus puntos extremos.
24

Observación 3.1.3. La relación de inclusión entre las particiones del intervalo [a, b] es una
relación de orden parcial, en el sentido de que es una relación

reflexiva: P ⊂ P
transitiva: si P ⊂ Q y Q ⊂ R, entonces P ⊂ R
antisimétrica: si P ⊂ Q y P ⊂ Q, entonces P = Q.

para todas las particiones P, Q, R ⊂ [a, b]. Por otro lado, esta relación no es una relación
de orden total (al contrario de la relación de orden usual sobre los números reales7 ), pues
existen pares de particiones no comparables, como lo muestra el siguiente ejemplo:
Ejemplo 3.1.4. Sean las siguientes cuatro particiones del intervalo [2, 8]:

Se observa que P0 = {2, 8} es la partición más gruesa del intervalo [2, 8], pues está incluida
en cualquier otra partición de [2, 8]. En particular, está incluida en las particiones P1 , P2
y P3 . Por otro lado, las particiones P1 y P2 no son comparables, pues P1 ̸⊂ P2 y P2 ̸⊂ P1
(aunque tengan tres elementos comunes: 2, 5 y 8). Finalmente, se observa que la partición
P3 = P1 ∪ P2 es más fina que las particiones P0 , P1 y P2 , pues P0 ⊂ P1 ⊂ P3 y P0 ⊂ P2 ⊂ P3 .
Observación 3.1.5. Dado un intervalo cerrado [a, b] ⊂ R (con a < b), se observa
más generalmente que el conjunto P0 = {a, b} es una partición del intervalo [a, b] : es
la partición más gruesa de [a, b], pues P0 ⊂ P para toda partición P de [a, b].
Dadas dos particiones P1 y P2 de [a, b], su unión P1 ∪ P2 también es una partición de
[a, b], que es más fina que P1 y P2 a la vez: P1 ⊂ P1 ∪ P2 y P2 ⊂ P1 ∪ P2 . Se dice que
la unión P1 ∪ P2 es el refinamiento común de las dos particiones P1 y P2 .

Definición 3.1.6 (Norma de una partición). Dada una partición P = {a0 , a1 , . . . , an }


del intervalo [a, b], se llama norma de P y se escribe ∥P ∥ a la longitud del subintervalo
[ai , ai+1 ] ⊂ [a, b], más grande definido por la partición P :

∥P ∥ = maxi=0,...,n−1 (ai+1 − ai )

7
Recordemos que para todos los números reales x e y, tenemos que x ≤ y o y ≤ x (“o” inclusivo)
25

Por construcción, tenemos que: 0 ≤ ∥P ∥ ≤ b − a.

Observación 3.1.7. Dadas dos particiones P y Q del intervalo [a, b], es claro que P ⊂ Q
implica que ∥Q∥ ≤ ∥P ∥, pero el recı́proco no se cumple en general (véase el ejercicio más
abajo).

Ejercicio 3. 1. Construir dos particiones P y Q del intervalo [0, 1] que no sean compara-
bles (es decir: P ̸⊂ Q y Q ̸⊂ P ) y tales que ∥Q∥ < ∥P ∥

2. Dada una partición P de un intervalo [a, b], demostrar que para todo ϵ > 0, existe una
partición Q ⊂ [a, b] tal que P ⊂ Q (es decir: Q es más fina que P ) y ∥Q∥ < ϵ.

3.1.3. Sumas inferiores y superiores

En esta sección, se considera una función f : [a, b] → R definida sobre un intervalo


cerrado [a, b] ⊂ R (con a < b). Además, asumiremos que la función f está acotada8 en el
intervalo [a, b], en el sentido de que existen dos números k∗ y k ∗ tales que

k∗ ≤ f (x) ≤ k ∗ para todo x ∈ [a, b]

Notación
Dado un subintervalo [a1 , b1 ] ⊂ [a, b] (con a ≤ a1 < b1 ≤ b), se observa que el
conjunto {f (x) : x ∈ [a1 , b1 ] ⊂ R} está acotado inferiormente por k∗ y superiormente
por k ∗ . Por el axioma de completitud, este conjunto tiene ı́nfimo y supremo, que
escribiremos:
ı́nf(f, [a1 , b1 ]) = inf {f (x) : x ∈ [a1 , b1 ]}
sup(f, [a1 , b1 ]) = sup {f (x) : x ∈ [a1 , b1 ]}

Por construcción, tenemos que: k∗ ≤ ı́nf(f, [a1 , b1 ]) ≤ sup(f, [a1 , b1 ]) ≤ k ∗ .

Lema 3.1.8. Si [a2 , b2 ] ⊂ [a1 , b1 ] ⊂ [a, b], entonces:

ı́nf(f, [a1 , b1 ]) ≤ ı́nf(f, [a2 , b2 ]) ≤ sup(f, [a2 , b2 ]) ≤ sup(f, [a1 , b1 ])

Demostración.

Sean A1 = {f (x) : x ∈ [a1 , b1 ]} y A2 = {f (x) : x ∈ [a2 , b2 ]}. Por construcción, tenemos


que A2 ⊂ A1 pues [a2 , b2 ] ⊂ [a1 , b1 ]:
8
En lo siguiente, sólo integraremos funciones definidas en un intervalo cerrado [a, b], y cuyos valores están
acotados por dos números k∗ y k ∗ fijados. Ambas condiciones sirven para asegurarnos que la región que nos
interesa está incluida en un rectángulo (aquı́: el producto cartesiano [a, b] × [k∗ , k ∗ ]) y que su área es finita.
26

Se trata de demostrar que ı́nf(A1 ) ≤ ı́nf(A2 ) ≤ sup(A2 ) ≤ sup(A1 ). Demostremos la primera


desigualdad. Por construcción, el número ı́nf(A1 ) es una cota inferior del conjunto A1 , y como
A2 ⊂ A1 , el mismo número también es una cota inferior del conjunto A2 . Pero como todas
las cotas inferiores de A2 son menores o iguales a ı́nf(A2 ) (que es la cota inferior más grande
de A2 ), se deduce que ı́nf(A1 ) ≤ ı́nf(A2 ). La desigualdad sup(A2 ) ≤ sup(A1 ) se demuestra
de manera análoga, y la desigualdad central ı́nf(A2 ) ≤ sup(A2 ) es obvia.

Ahora, consideremos una partición P = {a0 , a1 , . . . , an } del intervalo [a, b].

En cada subintervalo [ai , ai+1 ] (con i = 0, . . . , n − 1), la función f toma valores entre
los dos números ı́nf(f, [ai , ai+1 ]) y sup(f, [ai , ai+1 ]). Ası́, en dicho subintervalo, se puede
aproximar el área algebraica de la región ubicada entre el eje x y la gráfica de f por las
áreas de los siguientes dos rectángulos:

un rectángulo de ancho ai+1 − ai > 0 y de altura algebraica ı́nf(f, [ai , ai+1 ]) ∈ R, cuya
área algebraica es (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) (aproximación por defecto)

un rectángulo de ancho ai+1 − ai > 0 y de altura algebraica sup(f, [ai , ai+1 ]) ∈ R, cuya
área algebraica es (ai+1 − ai ) · sup(f, [ai , ai+1 ]) (aproximación por exceso)

Sumando estas dos familias de números para todo i = 0, . . . , n − 1, se obtienen las siguientes
dos aproximaciones del área algebraica de la región que nos interesa:
27

Definición 3.1.9 (Suma inferior y suma superior respecto a una partición.). Dada
una partición P = {a0 , a1 , . . . , an } del intervalo [a, b], definen la suma inferior S∗ (f, P )
y la suma superior S ∗ (f, P ) de la función f respecto a la partición P por:
n−1
X
S∗ (f, P ) = (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) (suma inferior de f respecto a P )
i=0

n−1
X

S (f, P ) = (ai+1 − ai ) · sup(f, [ai , ai+1 ]) (suma superior de f respecto a P )
i=0

Gráficamente, la suma inferior S∗ (f, P ) y la suma superior S ∗ (f, P ) de la función f res-


pecto a la partición P representan las áreas algebraicas de la regiones poligonales dibujadas
en la siguiente figura (a la izquierda para la suma inferior y a la derecha para la suma
superior):

Intuitivamente, la suma inferior S∗ (f, P ) constituye una aproximación por defecto del área
algebraica de la región ubicada entre el eje x y la gráfica de la función f , mientras la suma
superior S ∗ (f, P ) constituye una aproximación por exceso de dicha área. Se demuestra que:

Proposición 3.1.10. Para toda partición P ⊂ [a, b], tenemos que:

S∗ (f, P ) ≤ S ∗ (f, P )

Demostración. Escribamos P = {a0 , a1 , . . . , an } con a = a0 < a1 < . . . < an = b. Para


cada i = 0, . . . , n−1, se observa que ı́nf(f, [ai , ai+1 ]) ≤ sup(f, [ai , ai+1 ]). Multiplicando ambos
lados de la desigualdad anterior por el número ai+1 − ai > 0, se obtiene la desigualdad
(ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) ≤ (ai+1 − ai ) · sup(f, [ai , ai+1 ])
y sumándola para todo i = 0, . . . , n − 1, se deduce S∗ (f, P ) ≤ S ∗ (f, P ).
Ejercicio 4. A partir de lo anterior, demostrar que
(b − a)k∗ ≤ S∗ (f, P ) ≤ S ∗ (f, P ) ≤ (b − a)k ∗
para toda partición P = {a0 , a1 , . . . , an } ⊂ [a, b].
28

Ejercicio de parcial

(Ejercicio 2 - primer parcial segundo semestre 2023) Sea f : R → R tal que


f (x) = x2 − 1 y P = {−1, 0, 1, 2} una partición del intervalo [−1, 2]. Si S∗ (f, P ) es la
suma inferior correspondiente a la partición P , entonces S∗ (f, P ) vale:
2
A) −2 B) 0 C) 3
D) 3 E) 5

Solución.
3
X
S∗ (f, P ) = ı́nf(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
= ı́nf(f, [−1, 0]) ·(0 − (−1)) + ı́nf(f, [0, 1]) ·(1 − 0) + ı́nf(f, [1, 2]) ·(2 − 1))
| {z } | {z } | {z }
f (0) f (0) f (1)

= (−1) · 1 + (−1) · 1 + 0 · 1
= −2

Donde ı́nf(f, [−1, 0]) = f (0) ya que f es decreciente en el intervalo [−1, 0], ı́nf(f, [0, 1]) =
f (0) ya que f es creciente en el intervalo [0, 1] y ı́nf(f, [1, 2]) = f (1) ya que f es creciente
en el intervalo [1, 2].
Ejercicio 5. Sea f : [0, 4] → R la función definida por f (x) = 4x − x2 .

1. Bosquejar la gráfica de la función f .

2. Demostrar que f es monótona creciente en [0, 2] y monótona decreciente en [2, 4]. (Su-
gerencia: se puede estudiar el signo de la derivada de f , o bien demostrar el resultado
directamente, observando que f (x) = 4 − (x − 2)2 .)

3. Rellenar la siguiente tabla de valores:

x= 0 0,5 1 1,5 2 2,5 3 3,5 4


f (x) =

4. Calcular las sumas inferiores S∗ (f, P )y las sumas superiores S ∗ (f, P ) para las siguientes
particiones del intervalo [0, 4], ası́ como las normas de dichas particiones:

P0 = {0; 4}
P1 = {0; 2; 4}
P2 = {0; 1; 2; 3; 4}
P3 = {0; 0, 5; 1; 1, 5; 2; 2, 5; 3; 3, 5; 4}

Observación: Para determinar los ı́nfimos y supremos de la función f en los subinter-


valos definidos por las particiones P0 , P1 , P2 y P3 , conviene usar las propiedades de
monotonı́a demostradas en 2.
29

5. Comparar los pares de aproximaciones S∗ (f, P ) y S ∗ (f, P ) para P = P0 , P1 , P2 , P3 .


¿Cuál es el mejor par de aproximaciones? ¿y el peor?

Más generalmente, se puede demostrar que cuando dos particiones P y Q del intervalo
[a, b] son tales que P ⊂ Q (es decir: Q es más fina que P), las sumas S∗ (f, P ) y S ∗ (f, P )
inducidas por la partición más fina siempre constituyen un mejor par de aproximaciones del
área deseada que las sumas S∗ (f, P ) y S ∗ (f, P ) inducidas por la partición más gruesa:

Formalmente:

Proposición 3.1.11. Si dos particiones P, Q ⊂ [a, b] son tales que P ⊂ Q, entonces

S∗ (f, P ) ≤ S∗ (f, Q) ≤ S ∗ (f, Q) ≤ S ∗ (f, P )

Demostración. En primer lugar, se considera el caso particular donde las particiones P y


Q sólo difieren por un punto, es decir: Q = P ∪ {a′ }, con a′ ∈
/ P . En este caso, se pueden
escribir

P = {a0 , . . . , ak , ak+1 , . . . , an } y Q = {a0 , . . . , ak , a′ , ak+1 , . . . , an }

suponiendo que el nuevo punto a′ agregado por la partición Q se interpone entre los puntos
ak y ak+1 de la partición inicial P (para algún k = 0, . . . , n − 1). Ası́, la suma inferior de la
función f respecto a la partición P se puede descomponer del modo siguiente
n−1
X
S∗ (f, P ) = (ai+1 − ai ) · inf(f, [ai , ai+1 ])
i=0
= Si<k + (ak+1 − ak ) · inf(f, [ak , ak+1 ]) + Si>k

agrupando todos los sumandos correspondientes a los ı́ndices i < k en la suma Si<k , y todos
los sumandos correspondientes a los ı́ndices i > k en la suma Si>k . Ası́ obtenemos que

S∗ (f, P ) = Si<k + (ak+1 − ak ) · inf(f, [ak , ak+1 ]) + Si>k


= Si<k + ((a′ − ak ) + (ak+1 − a′ )) · inf(f, [ak , ak+1 ]) + Si>k
= Si<k + (a′ − ak ) · inf(f, [ak , ak+1 ]) + (ak+1 − a′ ) · inf(f, [ak , ak+1 ]) + Si>k
≤ Si<k + (a′ − ak ) · inf(f, [ak , a′ ]) + (ak+1 − a′ ) · inf(f, [a′ , ak+1 ]) + Si>k
= S∗ (f, P ∪ {a′ })
= S∗ (f, Q)
30

observando que inf(f, [ak , ak+1 ]) ≤ inf(f, [ak , a′ ]) y inf(f, [ak , ak+1 ]) ≤ inf(f, [a′ , ak+1 ]) por el
lema 3.1.8. De modo análogo, se demuestra que

S ∗ (f, P ) ≥ S ∗ (f, P ∪ {a′ }) = S ∗ (f, Q)

usando de nuevo el lema 3.1.8, pero con los supremos. Ahora, consideremos el caso general,
donde P y Q son dos particiones tales que P ⊂ Q, pero de tamaños cualesquiera. Como P y
Q son conjuntos finitos tales que P ⊂ Q, se puede escribir Q = P ∪ a′1 , . . . , a′p para algún


p ∈ N. Usando de modo repetido el caso particular demostrado anteriormente, obtenemos9


que

S∗ (f, P ) ≤ S∗ (f, P ∪{a′1 }) ≤ S∗ (f, P ∪{a′1 , a′2 }) ≤ · · · ≤ S∗ (f, P ∪ a′1 , a′2 , . . . , a′p ) ≤ S∗ (f, Q)


S ∗ (f, P ) ≥ S ∗ (f, P ∪{a′1 }) ≥ S ∗ (f, P ∪{a′1 , a′2 }) ≥ · · · ≤ S ∗ (f, P ∪ a′1 , a′2 , . . . , a′p ) ≥ S ∗ (f, Q)


lo que acaba demostrar que S∗ (f, P ) ≤ S∗ (f, Q) ≤ S ∗ (f, Q) ≤ S ∗ (f, P ).

Una consecuencia importante de la proposición anterior es que todas las sumas inferiores
S∗ (f, P ) (las “aproximaciones por defecto”) son menores o iguales a todas la sumas supe-
riores S ∗ (f, P ) (las “aproximaciones por exceso”), independientemente de las particiones P
y Q:

Proposición 3.1.12. Para todas las particiones P, Q ⊂ [a, b], tenemos que:

S∗ (f, P ) ≤ S ∗ (f, Q)

Demostración.

Por la proposición anterior, tenemos que

S∗ (f, P ) ≤ S∗ (f, P ∪ Q) ≤ S ∗ (f, P ∪ Q) ≤ S ∗ (f, Q)

3.1.4. Integral inferior y superior

Los lectores habrán observado que nunca definimos formalmente lo que es el “área alge-
braica de la región ubicada entre el eje x y la gráfica”, y que tampoco usamos esta noción
para demostrar los resultados anteriores. Hasta ahora, la noción de área es una noción
puramente intuitiva, sin definición formal, que sólo usamos como un hilo conductor para
definir (formalmente) las sumas inferiores y superiores. Al final, se obtienen dos conjuntos
de “aproximaciones”:
9
Formalmente, la demostración del caso general se efectúa por inducción sobre el número p de elementos
agregados, usando el caso particular para pasar de p a p + 1 en el paso inductivo (ejercicio).
31

el conjunto A∗ (f ) = {S∗ (f, P ) : P partición de [a, b]} formado por todas las sumas
inferiores de la función f , que se pueden considerar como aproximaciones por defecto
del área deseada (y todavı́a no definida)

conjunto A∗ (f ) = {S ∗ (f, P ) : P partición de [a, b]} formado por todas las sumas supe-
riores de la función f , que se pueden considerar como aproximaciones por exceso del
área deseada.

Además, demostramos (Proposición 3.1.12) que todos los elementos del conjunto A∗ (f ) son
menores o iguales a todos los elementos del conjunto A∗ (f ):

En particular:

el conjunto A∗ (f ) está acotado superiormente (por cualquier elemento de A∗ (f ))

el conjunto A∗ (f ) está acotado inferiormente (por cualquier elemento de A∗ (f ))

Lo que justifica la siguiente definición:

Definición 3.1.13 (Integral inferior y superior.). Se llaman integral inferior e integral


superior de la función f a los dos números I∗ (f ) y I ∗ (f ) definidos por:

I∗ (f ) = sup(A∗ (f )) = sup S∗ (f, P ) (integral inferior de f )


P ⊂[a,b]

I ∗ (f ) = ı́nf(A∗ (f )) = ı́nf S ∗ (f, P ) (integral superior de f )


P ⊂[a,b]

Ası́:

La integral inferior I∗ (f ) de la función f es definida como el supremo de todas las


sumas inferiores de la función f . Intuitivamente, este número constituye la mejor
aproximación por defecto del área algebraica de la región ubicada entre el eje x y la
gráfica de f

La integral superior I ∗ (f ) de la función f es definida como el ı́nfimo de todas las


sumas superiores de la función f . Intuitivamente, este número constituye la mejor
aproximación por exceso de la misma área.
32

En particular, se verifica fácilmente que:

Proposición 3.1.14.
I∗ (f ) ≤ I ∗ (f )

Demostración. Se sigue de la proposición 3.1.12 (ejercicio).

Observación 3.1.15. Por definición de las integrales inferior I∗ (f ) y superior I ∗ (f ), tene-


mos que S∗ (f, P ) ≤ I∗ (f ) ≤ I ∗ (f ) ≤ S ∗ (f, P ) para toda partición P ⊂ [a, b], lo que implica
que
0 ≤ I ∗ (f ) − I∗ (f ) ≤ S ∗ (f, P ) − S∗ (f, P )
como se puede observar en la siguiente figura:

Más generalmente, se verifica de mismo modo (usando la proposición 3.1.11) que si


P, Q, R, . . . son particiones del intervalo [a, b] tales que P ⊂ Q ⊂ R ⊂ . . . entonces:

0 ≤ I ∗ − I∗ (f ) ≤ · · · ≤ S ∗ (f, R) − S∗ (f, R) ≤ S ∗ (f, Q) − S∗ (f, Q) ≤ S ∗ (f, P ) − S∗ (f, P )

En lo siguiente, veremos que cuando la función f es suficientemente regular (lo que será el
caso para la gran mayorı́a de las funciones que consideraremos en este curso), los dos números
I ∗ (f ) y I ∗ (f ) son iguales. En este caso, podremos considerar que el número I ∗ (f ) = I ∗ (f )
constituye una definición del área deseada. En los otros casos, consideraremos que la región
ubicada entre el eje x y la gráfica de f no tiene área bien definida. Formalmente:

Definición 3.1.16 (Función integrable). Se dice que una función f : [a, b] → R


(acotada) es integrable cuando sus integrales inferior y superior coinciden:

I∗ (f ) = I ∗ (f )

Cuando es el caso, este número se llama la integral de la función f en el intervalo [a, b],
y se escribe Z b Z b
f o bien f (x)dx
a a

Ası́, por construcción, la integral de la función f : [a, b] → R representa el área algebraica


de la región ubicada entre el eje x y la gráfica de f :
33

Recordemos que, por definición, sólo las funciones acotadas pueden ser integrables.

Observación 3.1.17. Históricamente, la notación anterior fue introducida en 1686 por


Leibniz, que definı́a la integral de una función f como una “suma continua”10 de áreas de
rectángulos infinitamente finos, de altura f (x) y de ancho infinitesimal dx:
Z b X
f (x)dx = “ ”f (x) · dx
a a∈[a,b]

R
En particular, el sı́mbolo viene de la caligrafı́a de la letra s11 en el siglo XVII.

En lo que sigue, usaremos con frecuencia los siguientes dos criterios para demostrar que
una función acotada es integrable:

Proposición 3.1.18 (Criterio de integración “a menos de ϵ”). Para toda función


f : [a, b] → R acotada y para todo número I ∈ R, las siguientes dos condiciones son
equivalentes:

(1) La función f es integrable en [a, b] y su integral vale I.

(2) Para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que

I − ϵ < S∗ (f, P ) ≤ S ∗ (f, P ) < I + ϵ

Demostración.

(1) ⇒ (2) Supongamos que I∗ (f ) = I ∗ (f ) = I. Dado ϵ > 0, queremos construir una


partición P que cumpla las desigualdades deseadas. Como I = I∗ (f ) es el supremo de las
sumas inferiores de f , existe una partición P1 ⊂ [a, b] tal que tal que I − ϵ < S∗ (f, P1 ) ≤ I.
Y como I = I ∗ (f ) es el ı́nfimo de las sumas superiores de f , existe una partición P2 ⊂ [a, b]
tal que I ≤ S ∗ (f, P2 ) < I + ϵ. Tomando P = P1 ∪ P2 , se deduce de lo anterior (por la
proposición 3.1.11)) que

I − ϵ < S∗ (f, P1 ) ≤ S∗ (f, P ) ≤ S ∗ (f, P ) ≤ S ∗ (f, P2 ) < I + ϵ


10
Aunque la definición de Leibniz ya no sea considerada como correcta según los criterios modernos, las
intuiciones subyacentes todavı́a son muy útiles en fı́sica y a veces Rtambién en matemática.
11
La s de la palabra latina ≪summa≫ (suma), que se escribı́a ≪ umma≫ en el tiempo de Leibniz.
34

(2) ⇒ (1) Como ambos números I∗ (f ) e I ∗ (f ) se intercalan entre las sumas inferior
S∗ (f, P ) y superior S ∗ (f, P ) de la función f para toda partición P ⊂ [a, b], la condición (2)
implica que
I − ϵ < I∗ (f ) < I + ϵ e I − ϵ < I ∗ (f ) < I + ϵ
para todo ϵ > 0. Por lo tanto, tenemos que I∗ (f ) = I ∗ (f ) = I .

Observación 3.1.19. El criterio anterior es un criterio de integración, que sirve (1) para
determinar si la función considerada es integrable y (2) para determinar el valor de su
integral. A veces, sólo se necesita determinar si la función considerada es integrable, sin
conocer el valor de su integral. En este caso, se usa el siguiente criterio de integrabilidad:

Proposición 3.1.20 (Criterio de integrabilidad “a menos de ϵ”). Para toda función


f : [a, b] → R acotada y para todo número I ∈ R, las siguientes dos condiciones son
equivalentes:

(1) La función f es integrable en [a, b] y su integral vale I.

(2) Para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que

0 ≤ S ∗ (f, P ) − S∗ (f, P ) ≤ ϵ

Demostración.

(1) ⇒ (2) Supongamos que la función f es integrable en [a, b], y llamaremos I a su


integral. Dado ϵ > 0, existe por la proposición anterior una partición P ⊂ [a, b] tal que

I − ϵ/2 < S∗ (f, P ) ≤ S ∗ (f, P ) < I + ϵ/2

Entonces, tenemos que 0 ≤ S ∗ (f, P ) − S∗ (f, P ) < (I + ϵ/2) − (I − ϵ/2) = ϵ.

(2) ⇒ (1) Como 0 ≤ I ∗ (f ) − I∗ (f ) ≤ S ∗ (f, P ) − S∗ (f, P ) para toda partición P ⊂ [a, b],
la condición (2) implica que 0 ≤ I ∗ (f ) − I∗ (f ) < ϵ para todo ϵ > 0. Por lo tanto, I∗ (f ) =
I ∗ (f ).

3.1.5. Ejemplos y contraejemplo

Ejemplo 3.1.21 (Integración de una función constante.). Dados un intervalo cerrado [a, b]
(con a < b) y un número k ∈ R, se considera la función constante f : [a, b] → R definida por

f (x) = k

para todo k ∈ R.
35

Para demostrar que la función f es integrable, se considera una partición P = {a0 , a1 , . . . , an }


(cualquiera) del intervalo [a, b], y se observa que en cada subintervalo [ai , ai+1 ] (con i =
0, . . . , n − 1), tenemos que ı́nf(f, [ai , ai+1 ]) = sup(f, [ai , ai+1 ]) = k. Ası́, la sumas inferior
S∗ (f, P ) y superior S ∗ (f, P ) de la función f respecto a la partición P son iguales, y:
n−1
X n−1
X

S∗ (f, P ) = S (f, P ) = (ai+1 − ai ) · k = k · (ai+1 − ai ) = k · (an − a0 ) = k · (b − a)
i=0 i=0

Por lo tanto, tenemos que A∗ (f ) = A∗ (f ) = {(b − a)k} (todas las aproximaciones son
iguales), de tal modo que I∗ (f ) = I ∗ (f ) = (b − a)k. Ası́, la función f es integrable en [a, b] y
Z b Z b
f (x)dx = kdx = (b − a)k
a a
Rb Rb
Observación 3.1.22. Como era de esperar, la integral a f (x)dx = a kdx de la función
constante f (x) = k en el intervalo [a, b] es igual al área algebraica (b−a)×k de un rectángulo
de ancho b − a > 0 y de altura algebraica k ∈ R.

En la Sección 3.3 y en resto del curso, veremos otros muchos ejemplos (menos triviales)
de funciones integrables cuyas integrales se pueden calcular sencillamente en algunos casos.
Sin embargo, también existen funciones no integrables, ası́ como lo muestra el siguiente
ejemplo:

Ejemplo 3.1.23 (Función de Dirichlet). Consideremos la función de Dirichlet f : [0, 1] → R,


que está definida por
1 x∈Q
(
f (x) =
0 x∈ /Q
Sea una partición P = {a0 , a1 , . . . , an } cualquiera del intervalo [0, 1]. Se observa que en cada
subintervalo [ai , ai+1 ] (con i = 0, . . . , n − 1), existen a la vez números racionales (para los
cuales f (x) = 1) y números irracionales (para los cuales f (x) = 0, de tal modo que

ı́nf(f, [ai , ai+1 ]) = 0 mientras sup(f, [ai , ai+1 ]) = 1

. Calculando las sumas inferior y superior correspondientes, se obtiene


n−1
X
S∗ (f, P ) = (ai+1 − ai ) · 0 = 0
i=0
36

y
n−1
X

S (f, P ) = (ai+1 − ai ) · 1 = an − a0 = 1
i=0

y eso para todas las particiones P ⊂ [0, 1]. Por lo tanto, tenemos que I∗ (f ) = 0 e I ∗ (f ) = 1,
lo que demuestra que la función de Dirichlet no es integrable, aunque esté acotada.

Observación 3.1.24. Intuitivamente, la función de Dirichlet (que alterna entre los valo-
res 0 y 1 infinitas veces en cada subintervalo de [0, 1]) es tan irregular que el método de
aproximación por rectángulos no logra capturar el área de la región correspondiente12 .

El primer resultado importante de la teorı́a de la integración es que todas las funciones


monótonas (crecientes o decrecientes) son integrables:

Teorema 3.1.25 (Funciones monótonas). Si f : [a, b] → R es una función monótona


creciente o decreciente en el intervalo [a, b], entonces f es integrable en dicho intervalo.

Demostración. Sólo consideraremos el caso donde f es monótona creciente; el caso donde


es monótona decreciente es análogo. Como la función f es monótona creciente en el intervalo
[a, b] está acotada entre f (a) y f (b). En el caso particular donde f (a) = f (b), la función f es
constante, y ya vimos que es integrable. A partir de ahora, se supone que f (a) < f (b). Para
demostrar que la función f es integrable, se usa el criterio de integrabilidad a menos de ϵ. Dado
ϵ > 0 fijado, se puede hallar un entero n ≥ 1 suficientemente grande para que b−a n
ϵ
< f (b)−f (a)
(por el principio de Arquı́medes). Luego se considera la partición P = {a0 , a1 , . . . , an } del
intervalo [a, b] definida por
b−a
ai = a + i ·
n
para todo i = 0, . . . , n, de tal modo que todos los subintervalos [ai , ai+1 ] tengan la misma
longitud b−a n
.

12
Sin embargo, la teorı́a de la integración de Lebesgue permite definir y calcular la integral de la función
de Dirichlet, que vale 0. (Intuitivamente, este resultado extraño viene de que hay infinitamente más números
irracionales en el intervalo [0, 1] que números racionales, aunque parezcan uniformemente mezclados).
37

Ahora, se observa que en cada subintervalo [ai , ai+1 ] (i = 0, . . . , n − 1), la función f es


monótona creciente, de tal modo que ı́nf(f, [ai , ai+1 ]) = f (ai ) mientras sup(f, [ai , ai+1 ]) =
f (ai+1 ). Por lo tanto, tenemos que
n
X n
X

0 ≤ S (f, P ) − S∗ (f, P ) = (ai+1 − ai ) · f (ai+1 ) − (ai+1 − ai ) · f (ai )
i0 i0
n
X
= (ai+1 − ai ) · (f (ai+1 ) − f (ai ))
i0
n
b−aX
= (f (ai+1 ) − f (ai ))
n i
0

b−a
= · (f (b) − f (a))
n
ϵ
≤ · (f (b) − f (a)) = ϵ
f (b) − f (a)
(véase figura anterior). Ası́ para cada ϵ > 0, demostramos que existe una partición P ⊂ [a, b]
tal que 0 ≤ S ∗ (f, P ) − S∗ (f, P ) < ϵ. Por la Proposición 3.1.20, se deduce que la función f
es integrable.
Ejercicio 6. Usando como modelo la demostración del caso donde la función f es monótona-
creciente, redactar la demostración del caso donde f es monótona decreciente, modificando
el razonamiento de modo adecuado.

El resultado anterior expresa que el área algebraica de la región ubicada entre el eje x
y la gráfica de la función f siempre está bien definida cuando dicha función es monótona
(creciente o decreciente). Sin embargo, este resultado no explica como calcular dicha área.
En la práctica, el método de integración depende del ejemplo considerado. Aquı́ hay uno:
Ejemplo 3.1.26 (Integración de la función f (x) = x2 ). Dado un número a > 0, queremos
integrar la función f : [0, a] → R definida por f (x) = x2 , cuya gráfica es un arco de parábola:

Como la función f (x) = x2 es monótona creciente en el intervalo [0, a], es integrable por
el teorema anterior. Para determinar el valor de su integral, necesitaremos el siguiente lema:
38

Lema 3.1.27. Para todos los números reales x e y tales que 0 ≤ x ≤ y, tenemos que

y 3 − x3
(y − x)x2 ≤ ≤ (y − x)y 2
3

Demostración. Se observa que y 3 − x3 = (y − x)(x2 + xy + y 2 ). Además, tenemos que:

3x2 = x2 + x2 + x2 ≤ x2 + xy + y 2 ≤ y 2 + y 2 + y 2 = 3y 2

(pues 0 ≤ x ≤ y). Multiplicando los miembros extremos y el miembro central de las des-
igualdades anteriores por el número y − x ≥ 0, se deduce que:

3(y − x)x2 ≤ (x − y)(x2 + xy + y 2 ) ≤ 3(y − x)y 2


| {z }
y 3 −x3

lo que implica inmediatamente las desigualdades deseadas.

Ahora, consideremos una partición cualquiera P = {a0 , a1 , . . . , an } del intervalo [0, a]. En
cada uno de los subintervalos [ai , ai+1 ] (i = 0, . . . , n − 1), la función f es monótona creciente,
de tal modo que ı́nf(f, [ai , ai+1 ]) = f (ai ) = a2i , mientras sup(f, [ai , ai+1 ]) = f (ai+1 ) = a2i+1 .
Entonces, tenemos que
n−1 n−1  3
a3 a3n a30 a3

X X ai+1
S∗ (f, P ) = (ai+1 − ai ) · a2i ≤ − i = − =
i=0 i=0
3 3 3 3 3

(usando el lema anterior para establecer la desigualdad central), mientras


n−1 n−1  3
a3 a3n a30 a3


X X ai+1
S (f, P ) = (ai+1 − ai ) · a2i+1 ≥ − i = − =
i=0 i=0
3 3 3 3 3

(usando de vuelta el lema anterior para la desigualdad central). Ası́ demostramos que
a
S∗ (f, P ) ≤ ≤ S ∗ (f, P )
3
para todas las particiones P del intervalo [a, b]. Pasando al supremo (en la desigualdad
izquierda) y al ı́nfimo (en la desigualdad derecha), se deduce que:
a
I∗ (f ) ≤ ≤ I ∗ (f )
3
Como la función f es integrable, tenemos que I∗ (f ) = I ∗ (f ). Luego:
Z a Z a
a3
f (x)dx = x2 dx =
0 0 3
En particular:
39

Ejercicio 7. Modificar el razonamiento del ejemplo anterior para demostrar más general-
mente que para todos los números a y b tales que 0 ≤ a < b, tenemos que
Z b
b 3 a3
x2 dx = −
a 3 3

Ejercicio 8 (Integral de la función identidad). En un intervalo cerrado [a, b] (con a < b), se
considera la función f : [a, b] → R definida por f (x) = x para todo x ∈ [a, b].

y 2 −x2
1. Demostrar que para todos los números x ≤ y, tenemos que (y−x)x ≤ 2
≤ (y−x)y.
(Sugerencia: usar la identidad notable y 2 − x2 = (y − x)(y + x).)

2. Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Usando el resul-
2 2
tado demostrado en 1, demostrar que S∗ (f, P ) ≤ b −a 2
≤ S ∗ (f, P ). (Sugerencia: usar
la misma técnica que en el ejemplo 3.1.26).
b2 −a2
3. Deducir de lo anterior que I∗ (f ) ≤ 2
≤ I ∗ (f ).
Rb b2 −a2
4. Usando la monotonı́a de la función f , concluir que f es integrable y a
f (x)dx = 2
.

5. En el caso donde 0 < a < b, se observa que la región ubicada entre el eje x y la gráfica
de la función f es un trapecio rectángulo. Calcular el área de dicho trapecio, y verificar
que el resultado obtenido es consistente con el resultado del ı́tem 4.

3.2. Propiedades de la integral

3.2.1. Monotonı́a

Una propiedad fundamental de la integral es que respeta el orden entre dos funciones:
40

Proposición 3.2.1 (Monotonı́a). Sean dos funciones integrables f, g : [a, b] → R


definidas en un mismo intervalo [a, b] (con a < b). Si f (x) ≤ g(x) para todo x ∈ [a, b],
entonces Z Z b b
f≤ g
a a

Demostración. Sea P = {a0 , a1 , . . . .an } una partición cualquiera del intervalo [a, b]. En
cada subintervalo [ai , ai+1 ] (i = 0, . . . .n − 1), se observa que ı́nf(f, [ai , ai+1 ]) ≤ f (x) ≤ g(x)
para todo x ∈ [ai , ai+1 ], de tal modo que ı́nf(f, [ai , ai+1 ]) ≤ ı́nf(g, [ai , ai+1 ]) (pasando al
ı́nfimo). A partir de la desigualdad anterior, se deduce que
n−1
X n−1
X
S∗ (f, P ) = (ai+1 − ai ) · ı́nf(f, [ai , ai+1 ]) ≤ (ai+1 − ai ) · ı́nf(g, [ai , ai+1 ]) = S∗ (g, P )
i=0 i=0

y eso para toda partición P ⊂ [a, b]. Pasando al supremo entre todas las particiones P ⊂
[a, b], obtenemos que I∗ (f ) ≤ I∗ (g). Pero como ambas funciones f y g son integrables en el
intervalo [a, b], esto quiere decir que
Z b Z b
f = I∗ (f ) ≤ I∗ (g) = g
a a

Observación 3.2.2 (Interpretación geométrica). La desigualdad f (x) ≤ g(x) para todo


x ∈ [a, b] (que a veces, escribiremos f ≤ g) expresa que la gráfica de la función f se ubica
debajo de la gráfica de la función g cuando x recorre el intervalo [a, b]. En este caso, es obvio
que el área (geométrica) de la región ubicada entre las dos gráficas es dada por la diferencia:
Z b Z b
área de la región ubicada entre f y g = g− f
a a

En la Sección 3.2.2 (Linealidad), veremos que la diferencia entre ambas integrales también
es igual a la integral de la diferencia:
Z b Z b Z b
g− f= (g − f )
a a a
41

Una consecuencia obvia de la proposición anterior es que toda función positiva o nula
(resp. negativa o nula) en el intervalo [a, b] tiene integral positiva o nula (resp. negativa o
nula):

Proposición 3.2.3. Sea f : [a, b] → R una función integrable:


Rb
1. Si f (x) ≥ 0 para todo x ∈ [a, b], entonces a f ≥ 0
Rb
2. Si f (x) ≤ 0 para todo x ∈ [a, b], entonces a f ≤ 0

Demostración. Ejercicio.
Ejercicio 9. Usando la Proposición 3.2.1 y el resultado demostrado en el Ejemplo 3.1.21,
demostrar que si una función integrable f : [a, b] → R está acotada por dos números k∗ , k ∗ ∈
R tales que
k∗ ≤ f (x) ≤ k ∗
para todo x ∈ R entonces: Z b
(b − a)k∗ ≤ f ≤ (b − a)k ∗
a
Se interpretará geométricamente el resultado.

3.2.2. Linealidad

El objetivo de esta sección es demostrar el siguiente teorema:

Teorema 3.2.4 (Linealidad). Sean f, g : [a, b] → R dos funciones integrables. Enton-


ces:
Rb Rb Rb
1. La función f + g es integrable en [a, b]; además: a (f + g) = a f + a g

2. Para todo α ∈ R, la función αf es integrable en [a, b]; además: a (αf ) = α · a


Rb Rb

Observación 3.2.5 (Vı́nculo con el álgebra lineal). Desde el punto de vista del álgebra
lineal, el teorema anterior expresa que:

(a) el conjunto de todas las funciones integrables es un subespacio vectorial del espacio
vectorial13 formado por todas las funciones f : [a, b] → R.

(b) la operación f 7→ a f (que a cada función integrable f : [a, b] → R asocia su integral)


Rb

es una transformación lineal del espacio de las funciones integrables hasta R.


13
Recordemos que el conjunto de las funciones f : [a, b] → R es un R−espacio vectorial, cuya suma es la
suma de funciones, y cuyo producto por escalares es el producto αf de una función f por un número α ∈ R.
(Ejercicio: verificar que esta suma y que este producto por escalares cumplen los axiomas de los espacios
vectoriales.)
42

Más precisamente, se observa que el conjunto de las funciones integrables en el intervalo


[a, b] es un subespacio vectorial del espacio de las funciones acotadas de [a, b] en R, que es
a su vez un subespacio vectorial del espacio vectorial de las funciones (no necesariamente
acotadas) de [a, b] en R, como indicado en el siguiente diagrama:

(Se puede demostrar que los tres espacios son de dimensión infinita.)

Como la demostración del Teorema 3.2.4 es algo larga, vamos a dividirla en múltiples
resultados intermedios.

Lema 3.2.6. Sean f, g : [a, b] → R dos funciones acotadas cualesquiera. Entonces, para todo
subintervalo [a′ , b′ ] ⊂ [a, b], tenemos que:

1. ı́nf(f + g, [a′ , b′ ]) ≥ ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ])

2. sup(f + g, [a′ , b′ ]) ≤ sup(f, [a′ , b′ ]) + sup(g, [a′ , b′ ])

Demostración.

1. Tenemos que ı́nf(f, [a′ , b′ ]) ≤ f (x) y ı́nf(g, [a′ , b′ ]) ≤ g(x) para todo x ∈ [a′ , b′ ], de tal
modo que
ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ]) ≤ f (x) + g(x)
para todo x ∈ [a′ , b′ ]. Ası́, el número ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ]) es una cota inferior
de la función f + g en el subintervalo [a′ , b′ ]. Por lo tanto:

ı́nf(f, [a′ , b′ ]) + ı́nf(g, [a′ , b′ ]) ≤ ı́nf(f + g, [a′ , b′ ])

pues ı́nf(f +g, [a′ , b′ ]) es la cota inferior más grande de la función f +g en el subintervalo
[a′ , b′ ].

2. Análogo al ı́tem 1, remplazando los ı́nfimos por supremos.

Ejercicio 10. Usando como modelo la demostración del ı́tem 1 del lema anterior, redactar
la demostración del ı́tem 2, modificando el razonamiento de modo adecuado.
43

La siguiente proposición establece el ı́tem 1 del Teorema:

Proposición 3.2.7 (Aditividad). Si f, g : [a, b] → R son dos funciones integrables,


entonces la función f + g también es integrable en [a, b]; además:
Z b Z b Z b
(f + g) = f+ g
a a a

Demostración. La demostración se efectúa en tres etapas.

ETAPA 1: Demostración de la desigualdad I∗ (f + g) ≥ I∗ (f ) + I∗ (g).

Dada una partición P = {a0 , a1 , . . . , an } ⊂ [a, b] cualquiera, se observa (por el Lema


3.2.6) que:
n−1
X
S∗ (f + g, P ) = (ai+1 − ai ) · inf(f + g, [ai , ai+1 ])
i=0
n−1
X
≥ (ai+1 − ai ) · (inf(f, [ai , ai+1 ]) + inf(g, [ai , ai+1 ]))
i=0
n−1
X n−1
X
= (ai+1 − ai ) · inf(f, [ai , ai+1 ]) + (ai+1 − ai ) · inf(g, [ai , ai+1 ])
i=0 i=0
= S∗ (f, P ) + S∗ (g, P )
lo que demuestra que
S∗ (f, P ) + S∗ (g, P ) ≤ S∗ (f + g, P ) ≤ I∗ (f + g) (∗)
(para toda partición P ). Ahora, queremos demostrar que I∗ (f ) + I∗ (g) ≤ I∗ (f + g). Para
ello, se fija ϵ > 0.

Como el número I∗ (f ) es el supremo de todas las sumas inferiores S∗ (f, P ), existe una
partición P1 del intervalo [a, b] tal que I∗ (f ) − ϵ/2 < S∗ (f, P1 ) ≤ I∗ (f ).
Como el número I∗ (g) es el supremo de todas las sumas inferiores S∗ (g, P ), existe una
partición P2 del intervalo [a, b] tal que I∗ (g) − ϵ/2 < S∗ (g, P2 ) ≤ I∗ (g).

Tomando la partición P = P1 ∪ P2 , se observa (usando la Proposición 3.1.11) que


S∗ (f, P ) ≥ S∗ (f, P1 ) > I∗ (f ) − ϵ/2
y
S∗ (g, P ) ≥ S∗ (g, P2 ) > I∗ (g) − ϵ/2
y combinando ambas desigualdades anteriores con (∗), se deduce que:
I∗ (f + g) ≥ S∗ (f, P ) + S∗ (g, P ) > (I∗ (f ) − ϵ/2) + (I∗ (g) − ϵ/2) = I∗ (f ) + I∗ (g) − ϵ
44

Ası́ demostramos que I∗ (f ) + I∗ (g) < I∗ (f + g) + ϵ para todo ϵ > 0 (desigualdad “a menos
de ϵ”), lo que implica la desigualdad I∗ (f ) + I∗ (g) ≤ I∗ (f + g) deseada.

ETAPA 2: Demostración de la desigualdad I ∗ (f + g) ≤ I ∗ (f ) + I ∗ (g)

Análoga a la demostración de la Etapa 1, reemplazando los ı́nfimos por supremos.

ETAPA 3: Conclusión.

Como las funciones f y g son integrables en el intervalo [a, b], tenemos que I∗ (f ) = I ∗ (f )
e I∗ (g) = I ∗ (g). Usando las desigualdades obtenidas en las etapas 1 y 2, se deduce que
I∗ (f ) + I∗ (g) ≤ I∗ (f + g) ≤ I ∗ (f + g) ≤ I ∗ (f ) + I ∗ (g) = I∗ (f ) + I∗ (g)
Por lo tanto, tenemos que I∗ (f ) + I∗ (g) = I∗ (f + g) = I ∗ (f + g) = I ∗ (f ) + I ∗ (g), lo que
Rb Rb Rb
demuestra que la función f +g es integrable en el intervalo [a, b] y que a (f +g) = a f + a g.
Ejercicio 11. Usando como modelo la demostración de la etapa 1 de la proposición anterior,
redactar la demostración de la etapa 2, modificando el razonamiento de modo adecuado.

Ahora, nos queda demostrar el ı́tem 2 del teorema. Para ello, se necesita distinguir los
casos donde α ≥ 0 y α < 0. En primer lugar, se trata el caso donde α ≥ 0.
Lema 3.2.8. Sea f : [a, b] → R una función acotada. Entonces, para todo subintervalo
[a′ , b′ ] ⊂ [a, b] y para todo número α ≥ 0, tenemos que:

1. ı́nf(αf, [a′ , b′ ]) = α · ı́nf(f, [a′ , b′ ])


2. sup(αf, [a′ , b′ ]) = α · sup(f, [a′ , b′ ])

Demostración.

1. En primer lugar, se observa que la propiedad es obvia cuando α = 0, pues


ı́nf(0f, [a′ , b′ ]) = 0 = 0 · ı́nf(f, [a′ , b′ ])
Ahora, se supone que α > 0. Para todo x ∈ [a′ , b′ ], tenemos que ı́nf(f, [a′ , b′ ]) ≤ f (x).
Multiplicando la desigualdad anterior por α > 0, se obtiene que
α · ı́nf(f, [a′ , b′ ]) ≤ α · f (x)
para todo x ∈ [a′ , b′ ] y pasando al ı́nfimo, se deduce que
α · ı́nf(f, [a′ , b′ ]) ≤ ı́nf(αf, [a′ , b′ ])
Pero el mismo razonamiento también se aplica a la función αf (en lugar de f ) y al
factor α−1 (en lugar de α), lo que nos da:
α−1 · ı́nf(αf, [a′ , b′ ]) ≤ ı́nf(α−1 αf, [a′ , b′ ])
45

es decir:
ı́nf(αf, [a′ , b′ ]) ≤ αı́nf(f, [a′ , b′ ])
(multiplicando ambos lados por α > 0, y observando que α−1 αf = 1 · f = f ). Por lo
tanto:
ı́nf(αf, [a′ , b′ ]) = α · ı́nf(f, [a′ , b′ ])

2. Análogo al ı́tem 1, remplazando los ı́nfimos por supremos.


Ejercicio 12. Usando como modelo la demostración del ı́tem 1 del lema anterior, redactar
la demostración del ı́tem 2, modificando el razonamiento de modo adecuado.

Proposición 3.2.9. Si f : [a, b] → R es una función integrable, entonces para todo


número α ≥ 0, la función αf es integrable en el intervalo [a, b] y, además:
Z b Z b
αf = α f
a a

Demostración. Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Por
el lema anterior, se observa que:

n−1
X
S∗ (f, P ) = (ai+1 − ai ) · inf(αf, [ai , ai+1 ])
i=0
n−1
X
= (ai+1 − ai ) · (α · inf(f, [ai , ai+1 ]))
i=0
n−1
X
=α· (ai+1 − ai ) · inf(f, [ai , ai+1 ])
i=0
= α · S∗ (f, P )

y de modo análogo, se demuestra que S ∗ (αf, P ) = αS ∗ (f, P ). Pasando al supremo (para las
sumas inferiores) y al ı́nfimo (para las sumas superiores), se deduce que I∗ (αf ) = αI∗ (f ) y
que I ∗ (αf ) = αI ∗ (f ). Como f es integrable, tenemos que I∗ (f ) = I ∗ (f ), de tal modo que

I∗ (αf ) = αI∗ (f ) = αI ∗ (f ) = I ∗ (αf )


Rb Rb
Por lo tanto, la función αf es integrable, y se cumple que a αf = α a f .

Ahora, nos queda demostrar el ı́tem 2 del teorema en el caso donde α < 0. Para ello, se
necesita relacionar las integrales de la función f y de la función opuesta −f .
Lema 3.2.10. Sea f : [a, b] → R una función acotada. Entonces para todo subintervalo
[a′ , b′ ] ⊂ [a, b], tenemos que:

1. inf(−f, [a′ , b′ ]) = − sup(f, [a′ , b′ ])


46

2. sup(−f, [a′ , b′ ]) = − inf(f, [a′ , b′ ])

Demostración. Ejercicio.

Proposición 3.2.11. Si f : [a, b] → R es una función integrable en [a, b], entonces la


función −f también es integrable en [a, b] y, además:
Z b Z b
(−f ) = − f
a a

Demostración. Usando el lema anterior, se verifica sin dificultad que S∗ (−f, P ) = −S ∗ (f, P )
y S ∗ (−f, P ) = −S∗ (f, P ) para toda partición P del intervalo [a, b]. Pasando al supremo (para
la sumas inferiores) y al ı́nfimo (para las sumas superiores), se deduce que I∗ (−f ) = −I ∗ (f )
y que I ∗ (−f ) = −I∗ (f ). Como la función f es integrable en [a, b], tenemos que I∗ (f ) = I ∗ (f ),
de tal modo que
I∗ (−f ) = −I ∗ (f ) = −I∗ (f ) = I ∗ (f )
Rb Rb
Por lo tanto, la función −f es integrable en [a, b], y se cumple que a (−f ) = − a f .

Ahora se puede concluir que:

Proposición 3.2.12 (Homogeneidad). Si f : [a, b] → R es una función integrable,


entonces para todo número α ∈ R, la función αf también lo es y, además:
Z b Z b
(αf ) = α f
a a

Demostración. Ya demostramos la propiedad en el caso donde α ≥ 0 (Proposición 3.2.9),


y la demostración en el caso α < 0 se sigue directamente de las Proposiciones 3.2.9 y 3.2.11
(ejercicio).

Esto acaba la demostración del teorema.

Más en general, se demuestra que:

Corolario 3.2.13 (Combinaciones lineales). Si f1 , . . . , fn : [a, b] → R son funciones


integrables, entonces para todos α1 , . . . , αn ∈ R, la función α1 f1 + · · · + αn fn (combi-
nación lineal de las funciones f1 , . . . , fn ) también lo es. Además, su integral está dada
por: Z b Z Z b b
(α1 f1 + · · · + αn fn ) = α1 f 1 + · · · αn fn
a a a

Demostración. Ejercicio.
Ejercicio 13. Se considera la función f : [0, 4] → R del Ejercicio 5 p.28 , la cual está definida
por f (x) = 4x − x2 para todo x ∈ [0, 4].
47

1. Escribir la función f como una combinación lineal de las funciones f1 (x) = x (Ejercicio
8 p.39) y f2 (x) = x2 (Ejemplo 3.1.26).

2. Usando la linealidad de la integral ası́ como los resultados


R4 demostrados en el Ejemplo
3.1.26 y en el Ejercicio 8 p.39, calcular la integral 0 f (x)dx.

3. Comparar el resultado con las aproximaciones construidas en el Ejercicio 5 p.28.

3.2.3. Integral y valor absoluto

Por construcción, la integral a f de una función integrable f : [a, b] → R representa el


Rb

área algebraica de la región ubicada entre el eje x y la gráfica de la función f , contando las
áreas arriba del eje x con un signo positivo y las áreas abajo del eje x con un signo negativo:

Para calcular el área geométrica de la misma región (contando esta vez todas las áreas
con un signo positivo), una solución sencilla consiste en remplazar la función f por su valor
absoluto |f |, es decir: por la función definida por |f |(x) = |f (x)| para todo x ∈ [a, b].
48

En efecto, es claro que las regiones inducidas por las gráficas de la función f y de su
valor absoluto |f | tienen misma área geométrica (por un argumento obvio de simetrı́a, véase
figura anterior). Por otro lado, como la función |f | es positiva o nula, el área geométrica de
la región inducida por su gráfica Rcoincide con el área algebraica de la misma región, la cual
b
se puede calcular con la integral a |f (x)|dx. Dicho de otro modo, tenemos que:
área geométrica inducida por f = área geométrica/algebraica inducida por |f |
Z b
= |f (x)|dx
a

Aunque el argumento anterior sea bastante intuitivo, plantea un problema formal que es
el siguiente: dado que una función f : [a, b] → R, ¿se puede deducir que su valor absoluto
|f | : [a, b] → R también es integrable? Para resolver este problema, se necesita introducir la
descomposición de una función en sus partes positiva y negativa:

Definición 3.2.14 (Partes positiva y negativa de una función). Dada una función
f : [a, b] → R, se llama parte positiva de la función f a la función f + : [a, b] → R
definida por (
f (x) si f (x) ≥ 0
f + (x) = máx(0, f (x)) =
0 si f (x) < 0
Se llama parte negativa de la función f a la función f − : [a, b] → R definida por
f − = (−f )+ (es decir: como la parte positiva de la función opuesta −f ).

Observación 3.2.15. Por construcción, ambas funciones f + y f − son positivas o nulas, y


permiten descomponer las funciones f y |f | del modo siguiente:
f = f+ − f− y |f | = f + + f −
49

(Ejercicio: demostrar ambas igualdades.)

Lema 3.2.16. Sea f : [a, b] → R una función acotada. Entonces, la parte positiva f + de la
función f también está acotada, y para todo subintervalo [a′ , b′ ] ⊂ [a, b] tenemos que:

sup(f + , [a′ , b′ ]) − ı́nf(f + , [a′ , b′ ]) ≤ sup(f, [a′ , b′ ]) − ı́nf(f, [a′ , b′ ])

Demostración. Es claro que la función f + está acotada inferiormente por 0, y superior-


mente por el máximo de los dos números 0 y sup(f, [a, b]). Ahora, se distinguen los siguientes
tres casos, en función de la posición de la gráfica de f respecto al eje x en el subintervalo
[a′ , b′ ]:

Caso donde f (x) ≥ 0 para todo x ∈ [a′ , b′ ]. En este caso, se observa que f + (x) = f (x)
para todo x ∈ [a′ , b′ ]. Por lo tanto, tenemos que:

sup(f + , [a′ , b′ ]) − ı́nf(f + , [a′ , b′ ]) = sup(f, [a′ , b′ ]) − ı́nf(f, [a′ , b′ ])

Caso donde f (x) ≤ 0 para todo x ∈ [a′ , b′ ]. En este caso, se observa que f + (x) = 0
para todo x ∈ [a′ , b′ ]. Por lo tanto, tenemos que:

sup(f + , [a′ , b′ ]) − inf(f + , [a′ , b′ ]) = 0 − 0 ≤ sup(f, [a′ , b′ ]) − inf(f, [a′ , b′ ])

Caso donde existen x+ , x− ∈ [a′ , b′ ] tales que f (x+ ) > 0 y f (x− ) < 0. En este caso, se
observa que:

ˆ sup(f + , [ai , ai+1 ]) = sup(f, [ai , ai+1 ]) > 0 (ejercicio)


ˆ ı́nf(f + , [a′ , b′ ]) = 0 (ya que f + ≥ 0 y f + (x− ) = 0)
ˆ ı́nf(f, [a′ , b′ ]) < 0 (ya que f (x− ) < 0)

Por lo tanto, tenemos que

sup(f + , [a′ , b′ ]) − ı́nf(f + , [a′ , b′ ]) = sup(f, [a′ , b′ ]) − 0


< sup(f, [a′ , b′ ]) − ı́nf(f, [a′ , b′ ])

Proposición 3.2.17. Si una función f : [a, b] → R (con a < b) es integrable, entonces


sus partes positiva y negativa f + , f − : [a, b] → R también son integrables en [a, b].

Demostración. Para demostrar que la función f + : [a, b] → R es integrable, se usa el


criterio de integrabilidad a menos de ϵ. Dado ϵ > 0, como f es integrable en [a, b], existe una
50

partición P ⊂ [a, b] tal que 0 ≤ S ∗ (f, P ) − S∗ (f, P ) < ϵ. Escribiendo P = {a0 , a1 , . . . , an },


se observa (por el lema anterior) que:
n−1
X
∗ + +
0 ≤ S (f , P ) − S∗ (f , P ) = (ai+1 − ai ) · (sup(f + , [ai , ai+1 ]) − ı́nf(f + , [ai , ai+1 ]))
i=0
n−1
X
≤ (ai+1 − ai ) · (sup(f, [ai , ai+1 ]) − ı́nf(f, [ai , ai+1 ]))
i=0

= S (f, P ) − S∗ (f, P ) < ϵ

Luego, se concluye por la Proposición 3.1.20 que la función f + es integrable en [a, b]. Para
demostrar que f − también es integrable en [a, b], basta con observar que f − = (−f )+ .

Ahora se puede demostrar la propiedad que relaciona las integrales de una función (in-
tegrable) f : [a, b] → R y de su valor absoluto |f |:

Proposición 3.2.18 (Valor absoluto). Si una funcón f : [a, b] → R es integrable,


entonces la función x 7→ |f (x)| (valor absoluto de f ) también es integrable en el
intervalo [a, b] y
Z b Z b
f (x)dx ≤ |f (x)|dx
a a

Demostración. Por la proposición anterior, sabemos que ambas funciones f + , f − : [a, b] →


R son integrables, lo que implica que la función |f | = f + +f − también es integrable. Además,
como f = f + − f − y |f | = f + + f − (con f + , f − ≤ 0), obtenemos que
Z b Z b
f = (f + − f − )
a a
Z b Z b
= +
f − f−
a a
Z b Z b
≤ +
f + f−
a a
Z b Z b
= f+ + f−
a a
Z b
= (f + + f − )
a
Z b
= |f |
a

Observación 3.2.19. Intuitivamente, la proposición anterior expresa que el área algebraica


de la región ubicada entre el eje x y la gráfica de la función f siempre es menor o igual al
área geométrica de la misma región en valor absoluto.
51

Ejercicio 14 (Máximo y mı́nimo de dos funciones). Dadas dos funciones f, g : [a, b] → R


(con a < b), se consideran las funciones h1 , h2 : [a, b] → R definidas por

h1 (x) = mı́n {f (x), g(x)} y h2 (x) = máx {f (x), g(x)}

(1) Demostrar que h1 = f − (f − g)+ y h2 = f + (g − f )+ .

(2) Deducir que si f y g son integrables, entonces las funciones h1 y h2 también lo son.

3.2.4. Aditividad respecto al intervalo

Por construcción, la noción de integral sólo tiene sentido en un intervalo cerrado [a, b],
con a < b. Sin embargo, cuando se trabaja con una función f : I → R definida en un
intervalo I cualquiera de R, siempre se puede restringir el estudio a un subintervalo cerrado
[a, b] ⊂ I para determinar si la función f es integrable en dicho subintervalo y, llegado
Rb
el caso, calcular el valor de la integral a f . Por supuesto, la propiedad de integrabilidad
depende del subintervalo considerado, y una misma función f : I → R puede ser integrable
en algunos subintervalos de I y no ser integrable en otros subintervalos.
Ejercicio 15. A partir de los ejemplos anteriores, construir una función f : [0, 2] → R que
sea integrable en el intervalo [0, 1] y no sea integrable en el intervalo [1, 2].

Sin embargo, se puede demostrar que toda función integrable en un intervalo [a, b] tam-
bién es integrable en cualquier subintervalo [a′ , b′ ] ⊂ [a, b]:

Proposición 3.2.20 (Restricción del intervalo de integración). Si una función f :


[a, b] → R es integrable en el intervalo [a, b] (con a < b), entonces también es integrable
en cualquier subintervalo [a′ , b′ ] ⊂ [a, b] (con a ≤ a′ < b′ ≤ b).

Demostración. Sea f1 = f [a′ ,b′ ] la restricción14 de la función f : I → R al intervalo


[a′ , b′ ] ⊂ [a, b]. Dado que la función f : [a, b] → R es integrable, queremos demostrar que la
función f1 : [a′ , b′ ] → R también es integrable. Para ello, se usa el criterio de integrabilidad a
menos de ϵ, y se fija ϵ > 0. Como la función f es integrable en el intervalo [a, b], existe (por
la Propiedad 3.1.20) una partición P ⊂ [a, b] tal que 0 ≤ S ∗ (f, P ) − S∗ (f, P ) < ϵ. Ahora, se
considera la partición Q ⊂ [a, b] definida pot Q = P ∪ {a′ , b′ }. Por construcción, la partición
Q es más fina que P , de tal modo que

0 ≤ S ∗ (f, Q) − S∗ (f, Q) ≤ S ∗ (f, P ) − S∗ (f, P ) < ϵ

(por la Proposición 3.1.11). Escribimos Q = {a0 , a1 , . . . , an }, con a = a0 < a1 < · · · < an = b.


Como a′ , b′ ∈ Q (por construcción), tenemos que a′ = ap y b′ = aq para algunos ı́ndices p < q
14
Formalmente, la restricción de la funcipon f al subintervalo [a′ , b′ ] ⊂ [a, b] es la función f [a′ ,b′ ]
definida
por dom(f [a′ ,b′ ]
′ ′
) = [a , b ], cod(f [a′ ,b′ ]
)=Ryf [a′ ,b′ ]
′ ′
(x) = f (x) para todo x ∈ [a , b ].
52

entre 0 y n. Escribiendo Q′ = Q ∩ [a′ , b′ ] = {ap , ap+1 , . . . , aq }, se observa que el subconjunto


Q′ ⊂ Q es una partición del subintervalo [a′ , b′ ] ⊂ [a, b]. Respecto a dicha partición, tenemos
que15 :
q−1
X
∗ ′ ′
0 ≤ S (f1 , Q ) − S∗ (f1 , Q ) = (ai+1 − ai ) · · · (sup(f, [ai , ai+1 ]) − ı́nf(f, [ai , ai+1 ]))
i=p
n−1
X
≤ (ai+1 − ai ) · · · (sup(f, [ai , ai+1 ]) − ı́nf(f, [ai , ai+1 ]))
i=0

= S (f, Q) − S∗ (f, Q) < ϵ

Se concluye por la Proposición 3.1.20 que la función f1 = f [a′ ,b′ ]


es integrable.

Observación 3.2.21. En lo siguiente, diremos que una fucnión f : I → R (definida en


un intervalo I ⊂ R) es localmente integrable cuando es integrable en todos los subintervalos
[a, b] ⊂ I (con a < b). Por la proposición anterior, es claro que cuando el intervalo de
definición ya es de la forma I = [a, b] (con a < b), una función f : I → R es localmente
integrable en I = [a, b] si y sólo si es integrable16 en [a, b].

Proposición 3.2.22 (Aditividad respecto al intervalo). Sean f : I → R una función


definida en un intervalo I ⊂ R, y tres puntos a, b, c ∈ I tales que a < b < c. Si la
función f es integrable en ambos intervalos [a, b] y [b, c], entonces es integrable en el
intervalo [a, c] = [a, b] ∪ [b, c] también, y se cumple que
Z c Z b Z c
f= f+ f
a a b

Demostración. Sean f1 = f [a,b] , f2 = f [b,c] y f3 = f [a,c] las restricciones de la función f a


los tres intervalos [a, b], [b, c] y [a, c] = [a, b] ∪ [b, c]. Por hipótesis, las funciones f1 : [a, b] → R
R
Rb Rb Rc
yf 2 : [b, c] → son integrables, lo que nos permite escribir I1 = a
f 1 = a
f e I2 = f =
b 2
R
Rc
b
f . Queremos demostrar que la función f 3 : [a, c] → es integrable y que su integral vale
I1 + I2 . Para ello, se usa el criterio de integración a menos de ϵ, y se fija un número ϵ > 0.
15
Pq−1 Pn−1
La desigualdad i=p · · · ≤ i=0 · · · viene de que todos los sumandos de ambas sumatorias son positivos
o nulos, y de que la segunda sumatoria contiene todos los sumandos de la primera.
16
Ası́, la noción de función localmente integrable sólo tiene interés cuando la función considerada es definida
en un intervalo que no es de la forma [a, b], con a < b.
53

Como la función f1 es integrable en el intervalo [a, b], existe una partición P1 ⊂ [a, b]
tal que
ϵ ϵ
I1 − < S∗ (f1 , P1 ) ≤ S ∗ (f1 , P1 ) < I1 + (1)
2 2
Como la función f2 es integrable en el intervalo [b, c], existe una partición P2 ⊂ [b, c]
tal que
ϵ ϵ
I2 − < S∗ (f2 , P2 ) ≤ S ∗ (f2 , P2 ) < I2 + (2)
2 2

Sea P3 = P1 ∪ P2 . Por construcción, el conjunto (finito) P3 constituye una partición del


intervalo [a, c] = [a, b] ∪ [b, c], obtenida “pegando” ambas particiones P1 ⊂ [a, b] y P2 ⊂ [b, c]
en su punto común b ∈ P1 ∩ P2 . Se verifica sin dificultad (ejercicio) que
S∗ (f3 , P3 ) = S∗ (f1 , P1 ) + S∗ (f2 , P2 )
y
S ∗ (f3 , P3 ) = S ∗ (f1 , P1 ) + S ∗ (f2 , P2 )
Sumando las desigualdades (1) y (2), se deduce que:
I1 + I2 − ϵ < S∗ (f1 , P1 ) + S∗ (f2 , P2 ) ≤ S ∗ (f1 , P1 ) + S ∗ (f2 , P2 ) < I1 + I2 + ϵ
| {z } | {z }
S∗ (f3 ,P3 ) S ∗ (f3 ,P3 )

Ası́ demostramos que para todo ϵ > 0, existe una partición P3 ⊂ [a, b] tal que I1 + I2 − ϵ <
I∗ (f, P3 ) ≤ I ∗ (f, P3 ) < I1 + I2 + ϵ. Por la Proposición 3.1.18 la función f3 = f [a,c] es
Rb Rc
integrable en el intervalo [a, c] y su integral vale I1 + I2 = a f + b f .

Ejercicio de parcial

(Primer parcial - segundo semestre 2023) Sean f, g : R → R dos funciones


integrables tales que:
R4 R2 R4
0
f (x)dx = 21 , 0 f (x)dx = 3, y 2 g(x)dx = 32 .
R4
La integral 2 (5f (x) − g(x))dx es igual a

A) −14 B) − 25
2
C) −10 D) 27
2
E) 16

Solución. Por linealidad de la integral, tenemos que


Z 4 Z 4 Z 4
(5f (x) − g(x))dx = 5 f (x)dx − g(x)dx
2 2 2

Además, por aditividad sobre el intervalo, se tiene que


Z 4 Z 2 Z 4
f (x)dx = f (x)dx + f (x)dx
0 0 2

Es decir, Z 4 Z 4 Z 2
1 5
f (x)dx = f (x)dx − f (x) = −3=−
2 0 0 2 2
54

Entonces:
Z 4 Z 4 Z 4
(5f (x) − g(x))dx = 5 f (x)dx − g(x)dx
2 2 2
 
5 3 28
=5· − − = − = −14
2 2 2

Rb
3.2.5. Extensión de la notación a f a los casos donde a = b y a > b

Rb
Hasta ahora, sólo definimos la notación a f en el caso donde a < b. En la práctica, es
muy cómodo extender la notación anterior a los casos donde a = b y a > b, escribiendo
Z b (
0 si a = b
f= Ra
a − b f si a > b
cuando los lados derechos están bien definidos.
Rb
Gracias a esta extensión de la notación a f , se puede generalizar la propiedad de aditi-
vidad respecto al intervalo del modo siguiente:
Proposición 3.2.23 (Aditividad generalizada respecto al intervalo). Si f : I → R es una
función localmente integrable en un intervalo I ⊂ R, entonces para todos a, b, c ∈ I, tenemos
que Z Zc Z b c
f= f+ f
a a b
(independientemente de las propiedades relativas de los tres puntos a, b, c ∈ I).

Demostración. Se distinguen los siguientes 5 casos:

Rc Rb Rc
(1) Caso donde a = b = c. En este caso, ambos números a f y a f + b f son nulos por
definición y la igualdad deseada se cumple trivialmente.
(2) Caso donde a = b ̸= c. En este caso tenemos que
Z c Z a Z c Z b Z c
f= f+ f= f+ f
a a a a b
| {z }
0

pues a = b
(3) Caso a ̸= b = c. En este caso, tenemos que
Z c Z c Z c Z b Z c
f= f+ f= f+ f
a a c a b
| {z }
0

pues c = b
55

(4) Caso donde a = c ̸= b. En este caso, tenemos que


Z c Z c Z c Z b Z c
f = 0 = f+ f= f+ f
a Def. Def. a b a b

pues c = a.

(5) Caso donde a, b y c son distintos dos a dos. En este caso, se distinguen los siguientes
6 subcasos, según las posiciones relativas de los tres números a, b, c ∈ I:

(5.1) Subcaso donde a < b < c. Obvio por la Proposición 3.2.22.


(5.2) Subcaso donde a < c < b. En este subcaso, tenemos que:
Z c Z b Z b Z b Z c
f = f− f = + f
a Prop,3,2,22 a c Def. a b

(5.3) Subcaso donde b < a < c. En este subcaso, tenemos que:


Z c Z c Z a Z b Z c
f = f− f = + f
a Prop,3,2,22 b b Def. a b

(5.4) Subcaso donde b < c < c: En este subcaso, tenemos que:


Z c Z a Z a Z c  Z a Z c Z b Z c
f = − f = − f− f =− f+ f = f+ f
a Def. c Prop,3,2,22 b b b b Def. a b

(5.5) Subcaso donde c < a < b. En este caso, tenemos que:


Z c Z a Z b Z b  Z b Z b Z b Z c
f = − f = − f− f =− f+ f = f+ f
a Def. c Prop,3,2,22 c a c a Def. a b

(5.6) Subcaso donde c < b < a. En este subcaso, tenemos que:


Z c Z a Z b Z a  Z b Z a Z b Z c
f = − f = − f+ f =− f− f = f+ f
a Def. c Prop,3,2,22 c b c b Def. a b

Lo que acaba de demostrar la propiedad deseada.

Observación 3.2.24. De mismo modo se extiende la propiedad de linealidad (Teorema


3.2.4) a los caos donde a = b y a > b (ejercicio). Por otro lado, la propiedad de monotonı́a
(Proposición 3.2.1) y la propiedad del valor absoluto (Proposición 3.2.18) sólo se cumplen
en el caso donde a ≤ b, y no se extienden al caso donde a > b. Se encontrará en el Cuadro
1 más abajo un resumen de las propiedades algebraicas de la integral extendida.
56

Ejercicio 16. Verificar que la Proposición 3.2.1 (monotonı́a) y la Proposición 3.2.18 (valor
absoluto) se extienden trivialmente al caso donde a = b, y explicar por qué no se extienden
al caso donde a > b mediante contraejemplos adecuados.

3.2.6. Otras propiedades geométricas de la integral

En esta sección, se presentan algunas propiedades geométricas notables de la integral,


en forma de ejercicios para el lector.

Invarianza por traslación

Ejercicio 17. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Dado
un número µ ∈ R, se considera la función g : [a + µ, b + µ] → R definida por

g(y) = f (y − µ)

Por construcción, g es la función cuya gráfica se deduce de la gráfica de la función f por la


traslación horizontal según el número µ:
57

El objetivo del ejercicio es demostrar que f es integrable en [a, b] si y sólo si g es integrable


en [a + µ, b + µ], y que cuando es el caso, las correspondientes integrales son iguales:
Z b+µ Z b+µ Z b
g(y)dy = f (y − µ)dy = f (x)dx
a+µ a+µ a

(1) Dados un subconjunto S ⊂ R y un número k ∈ R, se escribe S + k := {x + k : x ∈ S}.

a) Demostrar que si P es una partición del intervalo [a, b], entonces P + µ es una
partición del intervalo [a + µ, b + µ]. Del mismo modo, demostrar que si Q es una
partición de [a + µ, b + µ], entonces Q − µ es una partición de [a, b].
b) Demostrar que las funciones P 7→ P + µ y Q 7→ Q − µ definen biyecciones
inversas entre el conjunto de las particiones del intervalo [a, b] y el conjunto de
las particiones del intervalo [a + µ, b + µ].

(2) Sea P = {a0 , a1 , . . . , an } una partición del intervalo [a, b]. Demostrar que

ı́nf(g, [ai + µ, ai+1 + µ]) = ı́nf(f, [ai , ai+1 ])

y
sup(g, [ai + µ, ai+1 + µ]) = sup(f, [ai , ai+1 ])
para todo i = 0, . . . , n − 1.

(3) Deducir de anterior que I∗ (g) = I∗ (f ) e I ∗ (g) = I ∗ (f ).

(4) Concluir que f es integrable en [a, b] si y sólo si g es integrable en [a + µ, b + µ], y que


cuando es el caso, las integrables son iguales.

Integración en espejo

Ejercicio 18. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Se
considera la función g : [−b, −a] → R definida por

g(y) = f (−y)

Por construcción, g es la función cuya gráfica se deduce de la gráfica de la fucnión f por la


simetrı́a axial respecto al eje y:
58

El objetivo del ejercicio es demostrar que f es integrable en [a, b] si y sólo si g es integrable


en [−b, −a], y que cuando es el caso, las correspondientes integrales son iguales:
Z −a Z −a Z b
g(y)dy = f (−y)dy = f (x)dx
−b −b a

(1) Dado un subconjunto S ⊂ R, se escribe −S := {−x : x ∈ S}.


(a) Demostrar que si P es una partición del intervalo [a, b], entonces −P es una
partición del intervalo [−a, −b], y viceversa.
(b) Deducir que la función P 7→ −P define una biyección entre el conjunto de parti-
ciones del intervalo [a, b] y el conjunto de particiones del intervalo [−a, −b].
(2) Sea P = {a0 , a1 , . . . , an } una partición del intervalo [a, b]. Demostrar que
ı́nf(g, [−ai+1 , −ai ]) = ı́nf(f, [ai , ai+1 ])
y
sup(g, [−ai+1 , −ai ]) = sup(f, [ai , ai+1 ])
para todo i = 0, . . . , n − 1. Deducir que S∗ (g, −P ) = S∗ (f, P ) y S ∗ (g, −P ) = S ∗ (f, P ).
(3) Deducir de lo anterior que I∗ (g) = I∗ (f ) e I ∗ (g) = I ∗ (f ).
(4) Concluir que f es integrable en [a, b] si y sólo si g es integrable en [−b, −a], y que
cuando es el caso, las integrales son iguales.

Observación 3.2.25. Intercambiando los extremos del intervalo de integración de la función


g(y) = f (−y), se deduce que:
Z −b Z −a Z b
f (−y)dy = − f (−y)dy = − f (x)dx
−a −b a

Integración y dilatación

Ejercicio 19. Sea f : [a, b] → R una función definida en un intervalo [a, b], con a < b. Dado
un número λ > 0, se considera la función g : [λa, λb] → R definida por
y
g(y) = f
λ
59

Por construcción, g es la función cuya gráfica se deduce de la la gráfica de la función f


por una “dilatación” horizontal de factor λ > 0, como indicado en la siguiente figura, que
muestra un ejemplo de dilatación para λ = 2:

El objetivo del ejercicio es demostrar que f es integrable en [a, b] si y sólo si g es integrable


en [λa, λb], y que cuando es el caso, las correspondientes integrales están relacionadas por:
Z λb Z λb   Z b
y
g(y)dy = f =λ· f (x)dx
λa λa λ a

1. Dados un subconjunto S ⊂ R y un número k > 0, se escribe kS := {kx : x ∈ S}.


(a) Demostrar que si P es una partición del intervalo [a, b], entonces λP es una
partición del intervalo [λa, λb]. Del mismo modo, demostrar que si Q es una
partición de [λa, λb], entonces λ1 Q es una partición de [a, b].
(b) Demostrar que las funciones P 7→ λP y Q 7→ λ1 Q definen biyecciones inversas en-
tre el conjunto de las particiones del intervalo [a, b] y el conjunto de las particiones
del intervalo [λa, λb].
2. Sea P = {a0 , a1 , . . . , an } una partición del intervalo [a, b]. Demostrar que
ı́nf(g, [λai , λai+1 ]) = ı́nf(f, [ai , ai+1 ])
y
sup(g, [λai , λai+1 ]) = sup(f, [ai , ai+1 ])
para todo i = 0, . . . , n − 1.
Deducir que S∗ (g, λP ) = λS∗ (f, P ) y S ∗ (g, λP ) = λS ∗ (f, P ).
3. Deducir de lo anterior que I∗ (g) = λI∗ (f ) e I ∗ (g) = λI ∗ (f )
4. Concluir que f es integrable en [a, b] si y sólo si g es integrable en [λa, λb], y que
R λb Rb
cuando es el caso, tenemos que λa g = λ · a f .
Ejercicio 20. Combinando los resultados obtenidos en los Ejercicios 17, 18 y 19, demostrar
que si f es una función integrable en el intervalo [a, b], entonces para todos los números
λ ̸= 0 y µ ∈ R, la función y 7→ f y−µλ
es integrable en el intervalo [λa + µ, λb + µ]17 y
Z λb+µ   Z b
y−µ
f dy = λ · f (x)dx
λa+µ λ a

(Sugerencia: distinguir los casos donde λ > 0 y λ < 0.)


17
De hecho: en el intervalo [λa + µ, λb + µ] si λ > 0, o el intervalo [λb + µ, λa + µ] si λ < 0.
60

3.3. Ejemplos de funciones integrables

3.3.1. Funciones escalonadas

Definición 3.3.1 (Función escalonada). Se dice que una función f : [a, b] → R (con
a < b) es escalonada cuando existe una partición P = {a0 , a1 , . . . , an } del intervalo
[a, b] tal que la función f es constante en cada uno de los subintervalos abiertos
(ai , ai+1 ) (i = 0, . . . n − 1).

Observación 3.3.2. Precisemos que una función escalonada f : [a, b] → R sólo necesita
ser constante en los subintervalos abiertos (ai , ai+1 ) inducidos por la partición P , la cual
define los “escalones” de dicha función. Por otro lado, la función f puede tomar valores
cualesquiera en los puntos a0 , a1 , . . . , an de la partición P , como se puede observar en la
figura anterior.

Ejercicio 21. Demostrar que toda función escalonada f : [a, b] → R está acotada.

Ejemplo 3.3.3 (Parte entera). Se recuerda que la parte entera de un número real x está
definida como el número entero más grande que es menor o igual a x. La parte entera del
número x se escribe ⌊x⌋, y por construcción, tenemos que

⌊x⌋ ∈ Z y ⌊x⌋ ≤ x < ⌊x⌋ + 1

para todo x ∈ R. En particular, tenemos que ⌊x⌋ = x para todo x ∈ Z. Al estar definida
en todo R, la función x 7→ ⌊x⌋ no puede ser calificada de escalonada, pero es claro que su
restricción a cualquier intervalo [a, b] ⊂ R (con a < b) define una función escalonada en
dicho intervalo. Por ejemplo, la siguiente figura representa la función x 7→ ⌊x⌋ restringida
al intervalo [− 52 , 72 ]
61

y, en este caso, la partición que define los escalones es P = − 52 , −2, −1, 0, 1, 2, 3, 27 .




En la práctica, la función parte entera x 7→ ⌊x⌋ permite construir múltiples ejemplos de


funciones escalonadas, ası́ como lo ilustra el siguiente ejercicio.
Ejercicio 22. Se consideran las funciones f1 , f2 , f3 , f4 , f5 , f6 : [0, 4] → R definidas por:

√ √ 2
f1 (x) = ⌊x2 ⌋ f3 (x) = ⌊ x⌋ f5 (x) = ⌊ x⌋

f2 (x) = ⌊x⌋2
p p
f4 (x) = ⌊x⌋ f6 (x) = ⌊x2 ⌋

Para cada una de las funciones f1 , f2 , f3 , f4 , f5 , f6 , demostrar que dicha función es escalonada
(explicitando la partición que define sus escalones), y bosquejar su gráfica.

Proposición 3.3.4 (Integral de una función escalonada). Toda función escalonada


f : [a, b] → R es integrable, y su integral en [a, b] está dada por
Z b n−1
X
f= (ai+1 − ai )ki
a i=0

donde a0 , a1 , . . . , an son los puntos de la partición de [a, b] que define los escalones de f ,
y k0 , . . . kn−1 son los valores tomados por f en los subintervalos (a0 , a1 ), . . . , (an−1 , an ).
62

Conceptualmente, la demostración de la proposición anterior es sencilla: consiste en calcu-


lar la integral de la función f en cada subintervalo [ai , ai+1 ] (i = 0, . . . , n − 1), y en pegar
los resultados obtenidos usando la propiedad de aditividad respecto al intervalo (Proposi-
ción 3.2.22). La única dificultad viene del comportamiento de la función f en los puntos
a0 , a1 , . . . , an , donde puede tomas valores cualesquiera (que al final no contribuyen al resul-
tado).

Ası́, empezaremos por tratar esta dificultad:


Lema 3.3.5. Si una función f : [a, b] → R es constante en el intervalo abierto (a, b) y
vale k en dicho intervalo (aunque pueda tomar valores cualesquiera en los extremos a y b),
entonces f es integrable en el intervalo [a, b] y su integral está dada por
Z b
f = (b − a)k
a

Demostración Sea f0 : [a, b] → R la función (realmente) constante definida por f0 (x) = k


para todo x ∈ [a, b]. Ya sabemos que la función f0 es integrable en el intervalo [a, b] y
Rb
que su integral está dada por a f0 = (b − a)k. Ahora se consideran las dos funciones
h1 , h2 : [a, b] → R definidas por

( (
1 si x = a 0 si x < b
h1 (x) = y h2 (x) =
0 si x > a 1 si x = a

Demostremos que la función h1 es integrable en [a, b] y que su integral vale 0. Para ello se
fija ϵ > 0, y se considera la partición P ⊂ [a, b] definida por P = {a, a′ , b}, donde a′ es un
punto del intervalo (a, b) tal que a′ − a < ϵ. Se verifica por un cálculo sencillo (ejercicio) que
63

S∗ (h1 , P ) = 0 mientras que S ∗ (h1 , P ) = (a′ − a) · 1 < ϵ

Ası́ demostramos que para todo ϵ > 0, existe una partición P ⊂ [a, b] tal que 0 ≤ S∗ (h1 , P ) ≤
S ∗ (h1 , P ) < ϵ. Esto implica, por la proposición 3.1.18 que la función h1 es integrable en [a, b]
y que su integral es nula. De modo análogo se demuestra que la función h2 es integrable
en [a, b] y que su integral es nula. Para conluir, basta con observar que la función “casi
constante” f : [a, b] → R se puede escribir como la siguiente combinación lineal

f = f0 + (f (a) − k)h1 + (f (b) − k)h2

de las tres funciones integrables f0 , h1 y h2 (ejercicio). Por lo tanto, la función f es integrable


en el intervalo [a, b], y su integral está dada por
Z b Z b Z b Z b Z b
f= f0 + (f (a) − k) h1 +(f (b) − k) h2 = f0 = (b − a)k
a a a a a
| {z } | {z }
0 0

Ahora podemos demostrar la proposición anterior:

Demostración de la Proposición 3.3.4. Sea f : [a, b] → R una función escalonada cuyos


escalones están definidos por una partición P = {a0 , a1 , . . . , an } ⊂ [a, b], y que toma los
valores k0 , . . . , kn−1 en los intervalos abiertos (a0 , a1 ), . . . , (an−1 , an ). Por el lema anterior,
sabemosRque la función f es integrable en cada uno de los intervalos [ai , ai+1 ] (i = 0, . . . , n −
a
1), con aii+1 f = (ai+1 − ai )ki . Por la Proposición 3.2.22, se deduce que la función f es
integrable en [a, b], y
Z b n−1 Z ai+1
X n−1
X
f= f= (ai+1 − ai )ki
a i=0 ai i=0

R7
Ejercicio 23. Calcular la integral −2 5 ⌊x⌋ dx (véase el Ejemplo 3.3.3) ası́ como las integrales
2
de las funciones definidas en el Ejercicio 22.

Una consecuencia importante de la proposición anterior es que siempre se pueden cambiar


los valores tomados por una función integrable en un número finito de puntos de su intervalo
de definición sin cambiar su integral ni su carácter integrable:

Proposición 3.3.6. Sean f, g : [a, b] → R (con a < b) dos funciones tales que:

(1) f es integrable en [a, b]

(2) g = f en [a, b], salvo en un número finito de puntos de [a, b]

Entonces la función g es integrable en el intervalo [a, b], y tiene la misma integral que
f.
64

Demostración. Sean a1 , · · · , an los puntos de [a, b] donde las funciones f y g difieren. Se


observa que la función s : [a, b] → R definida por s(x) = g(x)−f (x) para todo x ∈ [a, b] es una
función escalonada cuyos escalones son definidos por la partición P = {a1 , . . . , an } ∪ (a, b),
y que toma el valor 0 en cada uno de los subintervalos inducidos por la partición P . Por
la Proposición 3.3.4, la función escalonada s es integrable en el intervalo [a, b] y su integral
vale 0. Por lo tanto, la función g = f + s es integrable en el intervalo [a, b], y
Z b Z b Z b Z b Z b
g= (f + s) = f+ s= f
a a a a a
|{z}
0

Ejercicio 24. Sea f : [a, b] → R (con a < b) una función acotada. El objetivo de este ejercicio
es demostrar que sus integrales inferior I∗ (f ) y superior I ∗ (f ) se pueden caracterizar por
Z b 
I∗ (f ) = sup s tal que s : [a, b] → R escalonada y s ≤ f
a
Z b 

I (f ) = ı́nf t tal que t : [a, b] → R escalonada y s ≥ f
a

(1) Demostrar que existen funciones escalonadas s0 , t0 : [a, b] → R tales que s0 ≤ f ≤ t0 .

(2) Sea s : [a, b] → R una función acotada18 tal que s ≤ f en [a, b].

(a) Demostrar que S∗ (s, P ) ≤ S∗ (f, P ) para toda partición P ⊂ [a, b].
(b) Deducir I∗ (f ) ≤ I∗ (f ).

(3) Deducir de (2) que sup a s tal que s : [a, b] → R escalonada y s ≤ f ≤ I∗ (f ).


nR o
b

(4) Sea P = {a0 , a1 , . . . , an } una partición cualquiera del intervalo [a, b]. Definir a partir
de la partición P una función escalonada s : [a, b] → R tal que s ≤ f y a s = S∗ (f, P ).
Rb

(¡Cuidado con la definición de la función s en los puntos a0 , a1 , . . . , an !)

(5) Deducir de (4) que sup a s tal que s : [a, b] → R escalonada y s ≤ f ≥ I∗ (f ). Su-
nR o
b

gerencia: se podrá demostrar (usando (4)) que para todo ϵ > 0, existe una función
Rb
escalonada s ≤ f tal que a s > I∗ (f ) − ϵ.

(6) Deducir de lo anterior que


Z b 
sup s tal que s : [a, b] → R escalonada y s ≤ f = I∗ (f )
a
.
18
En este ı́tem, no se necesita suponder que s es una función escalonada.
65

(7) De modo análogo, demostrar que


Z b 
ı́nf t tal que t : [a, b] → R escalonada y s ≥ f = I ∗ (f )
a

. Sugerencia: se podrá usar como modelo el razonamiento efectuado en los ı́tems (2) −
(6), adáptondolo de modo adecuado.
(8) Deducir de lo anterior que si la función f es integrable en [a, b], entonces
Z b Z b 
f = sup s tal que s : [a, b] → R escalonada y s ≤ f
a a
Z b 
= ı́nf t tal que t : [a, b] → R escalonada y s ≥ f
a

3.3.2. Integración de funciones polinomiales

El objetivo de esta sección es demostrar que todas las funciones polinomiales son lo-
calmente integrables, y presentar el método que permite calcular su integral en cualquier
intervalo [a, b]. Para ello, se comienza por estudiar el caso particular de la función
x 7→ xp
con p ∈ N.

Proposición 3.3.7 (Integral de la función x 7→ xp ). Para todo p ∈ N, la función


x 7→ xp es integrable en cualquier intervalo [a, b] (con a < b) y
b
bp+1 − ap+1
Z
xp dx =
a p+1

La demostración se basa en el siguiente lema:


Lema 3.3.8. Para todos los números x, y ∈ R tales que 0 ≤ x ≤ y, tenemos que
y p+1 − xp+1
(y − x)xp ≤ ≤ (y − x)y p
p+1

Demostración. En primer lugar, se demuestra por inducción sobre p ∈ N que


p
X
(y − x) xi y p−i = (y − x)(y p + xy p−1 + · · · xp−1 + xp ) = y p+1 − xp+1 (∗)
i=0

Caso base. En el caso donde p = 0, tenemos que


0
X
(y − x) xi y 0−i = (y − x)x0 y 0 = (y − x) · 1 = y 0+1 − x0+1
i=0
66

Paso inductivo. Supongamos que la propiedad deseada se cumple para algún p ∈ N


(hipotesis de inductiva: HI). Queremos demostrar que la misma propiedad también se
cumple para p + 1. Para ello, basta observar que
p+1 p
X X
(y − x) xi y p+1−i = (y − x)(y · xi y p−i + xp+1 )
i=0 i=0
p
!
X
= y (y − x) xi y p−i + (y − x)xp+1
i=0
p+1
= y(y − x ) + (y − x)xp+1
p+1
(por HI)
= y p+2 − yxp+1 + yxp+1 − xp+2
= y p+2 − xp+2

(lo que acaba la demostración de la igualdad deseada). Ahora, se oberva que


p p
X X
i p−i
xy ≥ xi xp−i = (p + 1)xp
i=0 i=0

pues xi ≥ 0 e y p−i ≥ xp−i , mientras


p p
X X
i p−i
xy ≤ y i y p−i = (p + 1)y p
i=0 i=0

pues xi ≤ y i e y p−i ≥ 0.
y−x
Multiplicando las desigualdades anteriores por p+1
≥ 0, se deduce que
p
y−x p y − x X i p−i y − x
· (p
 +
1)x ≤ xy ≤ · (
p+ 1)y p

p+1
  p + 1 i=0 p+1
 
| {z }
y p+1 −xp+1
p+1
por (∗)

Demostración de la Proposición 3.3.7. Queremos demostrar que la función f (x) = xp


(p ∈ N) es integrable en cualquier intervalo [a, b], con a < b. Para ello, distinguiremos tres
casos, según la posición relativa del intervalo [a, b] respecto a 0.

(1) Caso donde [a, b] ⊂ [0, +∞), es decir: 0 ≤ a < b. En este caso, la función f es
monótona creciente en el intervalo [a, b] (pues es monótona creciente en [0, +∞)),
entonces es integrable en [a, b] por el Teorema 3.1.25. Sea P = {a0 , a1 , . . . .an } una
partición cualquiera del intervalo [a, b]. En cada uno de los subintervalos [ai , ai+1 ]
(i = 0, . . . , n − 1), tenemos que ı́nf(f, [ai , ai+1 ]) = f (ai ) = api y sup(f, [ai , ai+1 ]) =
67

f (ai+1 ) = api+1 , por la monotonı́a de f . Aplicando el Lema 3.3.8 a cada par de números
(ai , ai+1 ), obtenemos que
n−1 n−1 p+1
X X ai+1 − ap+1 bp+1 − ap+1
S∗ (f, P ) = (ai+1 − ai ) · api ≤ i
=
i=0 i=0
p+1 p+1

mientras que
n−1 n−1 p+1

X p
X ai+1 − ap+1
i bp+1 − ap+1
S (f, P ) = (ai+1 − ai ) · ai+1 ≥ =
i=0 i=0
p+1 p+1

Ası́, demostramos que


bp+1 − ap+1
S∗ (f, P ) ≤ ≤ S ∗ (f, P )
p+1
para todas las particiones P del intervalo [a, b]. Pasando al supremo (en la desigualdad
izquierda) y al ı́nfimo (en la desigualdad derecha), se deduce que:

bp+1 − ap+1
I∗ (f ) ≤ ≤ I ∗ (f )
p+1
Pero como la función f (x) = xp es integrable en el intervalo [a, b], se concluye que
Z b
bp+1 − ap+1
xp dx = I∗ (f ) = I ∗ (f ) =
a p+1

(2) Caso donde [a, b] ⊂ (−∞, 0], es decir: a < b ≤ 0. En este caso, ya sabemos por el
caso (1) que la función f (x) = xp es integrable en el intervalo [−b, −a] ⊂ [0 + ∞).
Usando la propiedad de integración en espejo (Ejercicio 18), se deduce que la función
g(x) = f (−x) = (−x)p es integrable en [a, b], y
Z b Z −a
p (−a)p+1 − (−b)p+1
(−x) dx = xp dx =
a −b p+1
Ahora, se distinguen dos subcasos, según si el entero p ∈ N es par o impar.

(2.1) Subcaso donde p es par. En este subcaso, tenemos que (−x)p = xp ; luego
Z b Z b
p (−a)p+1 − (−b)p+1 bp+1 − ap+1
x dx = (−x)p dx = =
a a p+1 p+1
pues (−a)p+1 = −ap+1 y (−b)p+1 = −bp+1 , ya que el entero p + 1 es impar.
(2.2) Subcaso donde p es impar. En este subcaso, tenemos que (−x)p = −xp ; luego
Z b Z b
p (−a)p+1 − (−b)p+1 bp+1 − ap+1
x dx = − (−x)p dx = − =
a a p+1 p+1
pues (−a)p+1 = ap+1 y (−b)p+1 = bp+1 , ya que el entero p + 1 es par.
68

(3) Caso donde a < 0 y b > 0. Por los casos (1) y (2), ya sabemos que la función f (x) =
xp es integrable en los intervalos [a, 0] ⊂ (−∞, 0] y [0, b] ⊂ [0, +∞), Entonces, es
integrable en el intervalo [a, b] = [a, 0] ∪ [0, b], y
b 0 b
0p+1 − ap+1 bp+1 − 0p+1 bp+1 − ap+1
Z Z Z
p p
x dx = x dx + xp dx = + =
a a 0 p+1 p+1 p+1

La proposición anterior no sólo permite integrar la función x 7→ xp (p ∈ N) en cualquier


intervalo [a, b] (con a < b); además permite integrar todas las funciones polinomiales, usando
la propiedad de linealidad de la integral. Aquı́ hay un ejemplo.

Ejemplo 3.3.9. Queremos integrar la función f (x) = 13 x3 − x + 1 en el intervalo [−1, 2].

Para ello, se observa que la función f es una función lineal de las tres funciones x 7→ x3 ,
x 7→ x1 y x 7→ x0 = 1. Ası́, es integrable en el intervalo [−1, 2], y
Z 2  Z 2 Z 2 Z 2
1 3 1 3 1
x − x + 1 dx = · x dx − x dx + x0 dx
−1 3 3 −1 −1 −1
1 24 − (−1)4 22 − (−1)2 21 − (−1)1
= · − +
3 4 2 1
1 15 3 3 11
= · − + =
3 4 2 1 4
Dicho de otro modo, demostramos que las siguientes dos área son iguales:
69

Ejercicio de parcial

(Ejercicio 4 - primer parcial segundo semestre 2024) Consideramos la función


f : [1, 2] → R definida como f (x) = x2 y la partición Pn = {a0 , a1 , . . . , an } del intervalo
[1, 2] que divide al intervalo [1, 2] en n intervalos de igual longitud.
Indicar el mı́nimo valor de n ∈ N tal que S ∗ (f, Pn ) − S ∗ (f, Pn ) < 12 .

A) n = 7 C) n = 9 E) n = 5

B) n = 8 D) n = 6 F) n = 4

Solución. Sabemos que la función f (x) = x2 es integrable en el intervalo [1, 2], por lo tanto
para todo ϵ > 0 existe una partición P tal que

S ∗ (f, P ) − S∗ (f, P ) < ϵ

En particular, en este jercicio buscamos la menor cantidad de puntos que debe tener una
partición Pn que divide al intervalo [1, 2] en n intervalos de igual longitud de forma que se
verifique
1
S ∗ (f, Pn ) − S∗ (f, Pn ) <
2
Dado que la partición Pn divide al intervalo [1, 2] en n intervalos de igual longitud, es de la
forma

a0 a1 a2 ... an−1 an

2−1 2−1 2−1


n n n

donde a0 = 1 y an = 2. Es decir,
2−1 1
ai+1 − ai = =
n n
para todo i = 0, . . . , n − 1.
70

Luego,
n−1
X
S∗ (f, Pn ) = ı́nf(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
| {z }
1
n
n−1
1X
= ı́nf(f, [ai , ai+1 ])
n i=0
n−1
1X
= f (ai )
n i=0
y
n−1
X

S (f, Pn ) = sup(f, [ai , ai+1 ]) · (ai+1 − ai )
i=0
| {z }
1
n
n−1
1X
= sup(f, [ai , ai+1 ])
n i=0
n−1
1X
= f (ai+1 )
n i=0

ya que f (x) = x2 es creciente en el intervalo [1, 2].

Entonces,
n−1 n−1
∗ 1X 1X
S (f, Pn ) − S∗ (f, Pn ) = f (ai+1 ) − f (ai )
n i=0 n i=0
n−1
1X
(f (ai+1 ) − f (ai ))
n i=0
1
= (
f (a
1) − f (a0 ) + 
f (a
2) −
f (a
1) + · · · + f (an ) − 
f (a ))
n−1
n
1
= (f (2) − f (1))
n
3
=
n
Finalmente
3 1
< ⇔ 6<n
n 2
Ası́ que tomamos n = 7.

Vı́nculo con la derivada. A partir de ahora y hasta el final de la sección 3.3.2, se supone
conocida la noción de función derivada, que será introducida más adelante en el curso. Los
lectores que no conocen esta noción pueden omitir esta parte, e ir directamente a la sección
3.3.3.
71

Observación 3.3.10. La fórmula que expresa la integral de la función f (x) = xp (p ∈ N)


en el intervalo [a, b] (con a < b) también se puede escribit
Z b
bp+1 − ap+1
xp dx = = F (b) − F (a)
a p+1
con
xp+1
F (x) =
p+1
p+1
Se observa que la función F (x) = xp+1 que permite expresar dicha integral es una primitiva
de la función f (x) = xp , es decir: una función derivable cuya derivada es igual a f :

F ′ (x) = f (x)

Usando la propiedad de linealidad de la integral, se puede generalizar esta observación a


todas las funciones polinomiales del modo siguiente.
Proposición 3.3.11. Si f : R → R es una función polinomial, entonces f es integrable en
cualquier intervalo [a, b] (con a < b), y su integral en dicho intervalo está dada por
Z b
f (x)dx = F (b) − F (a)
a

donde F : R → R es cualquier función polinomial tal que F ′ = f .

Demostración. Escribamos f (x) = np=0 αp xp y F (x) = n+1 p


P P
p=0 βp x , suponiendo que f y
F son polinomios de grados n y n + 1, respectivamente. Como F ′ = f , tenemos que
n+1
X n
X n
X
′ p+1 p
F (x) = pβp x = (p + 1)βp+1 x = f (x) = α p xp
p=1 p=0 p=0

de tal modo que αp = (p + 1)βp+1 para todo P = 0, . . . , n (indentificando los coeficientes de


los polinomios F ′ y f ). Combinando la linealidad de la integral con la Proposición 3.3.7, se
deduce que
Z b Z b X n
! n Z b
X
p
f (x)dx = αp x dx = αp · xp dx
a a p=0 p=0 a
n n
X bp+1 − ap+1 X
= αp · = βp+1 (bp+1 − ap+1 ) (pues αp /(p + 1) = βp+1 )
p=0
p+1 p=0
n+1
X n+1
X
p p
= βp (b − a ) = βp (bp − ap ) (pues b0 − a0 = 1 − 1 = 0)
p=1 p=0
n+1
X n+1
X
= βp bp − βp ap = F (b) − F (a)
p=0 p=0
72

Ejemplo 3.3.12. Volviendo a la función polinomial f (x) = 31 x3 − x + 1 del Ejemplo 3.3.9,


se observa que una primitiva de la función f es la función
1 4 1 2
F (x) = x − x +x
12 2
Ası́ tenemos que
Z 2  
4 17 16 + 17 11
f (x)dx = F (2) − F (−1) = − − = =
−1 3 12 12 4

3.3.3. Integral de la función t 7→ 1/t

En esta sección, nos interesa el caso particular de la función f (t) = 1t en el intervalo


(0, +∞). Como f es monótona decreciente en dicho intervalo, es integrable en cualquier
intervalo [a, b] tal que 0 < a < b por el Teorema 3.1.25. Una propiedad notable de la integral
de la función f (t) = 1t es la siguiente:

Proposición 3.3.13. Para todos a, b, λ > 0 tales que a < b, tenemos que:
Z λb Z b
1 1
dt = dt
λa t a t

Demostración. Como la función f (t) = 1t es integrable en el intervalo [a, b], la función


g(t) = f ( λt ) es integrable en el intervalo [λa, λb] (por el Ejercicio 19) y
Z λb Z b Z b
1
g(t)dt = λ · f (t)dt = λ · dt
λa a a t

Pero también se observa que g(t) = f ( λt ) = λt , de tal modo que


Z λb Z λb Z λb
λ 1
g(t)dt = dt = λ · dt
λa λa t λa t
Dividiendo ambos lados derechos por λ > 0, se deduce la igualdad deseada.

Observación 3.3.14. Geométricamente, la igualdad anterior se puede interpretar del modo


siguiente: cuando se dilata (horizontalmente) el intervalo de trabajo [a, b] según un factor
λ > 0, la región correspondiente abajo de la gráfica de f se dilata (verticalmente) según el
factor λ1 , debido a la definición particular de la función f . Al final, las dilataciones horizontal
y vertical se compensan de tal modo que el área de la región correspondiente no cambia:
73

(En la figura anterior, tomamos [a, b] = [1, 32 ] y λ = 2). Dicho de otro modo, la integral
Rb 1
a t
dt no depende de los extremos a, b > 0; sólo depende del cociente ab .

Rb
La integral a 1t no se puede expresar como un polinomio o como una fracción racional
en función de los extremos a y b. Para ello, se necesita introducir una nueva función:

Definición 3.3.15. Dado un número real x > 0, se llama logaritmo de x y se escribe


log(x) al número real definido por
Z x
1
log(x) = dt
1 t

Observación 3.3.16. La definición anterior usa la notación extendida para la integral, pues
el número x > 0 puede ser menor, igual o mayor a 1. En particular, como f (t) = 1t > 0
para todo t ∈ (0, +∞), es claro que:
R x
1
 1 t dt ≥ 0
 si x > 1
log(x) = 0 si x = 1
 R1 1

− x t dt ≤ 0 si x < 1

Ası́, el número log(x) representa el área algebraica de la región abajo de la gráfica de la


función f (t) = 1t entre los dos extremos t = 1 y t = x, expresada con un signo positivo si
x > 1, y con un signo negativo si x < 1:
74

Se demuestra que:

Proposición 3.3.17. La función log : (0, +∞) → R es estrictamente creciente en (0, +∞).

Demostración. Sean x, y > 0 tales que x < y. Tenemos que


Z y Z x Z y
1 1 1 1
log(y) − log(x) = dt − dt = dt ≥ (y − x) · > 0
1 t 1 t x t y
1 1
pues x < y y f (t) = t
≥ y
para todo t ∈ [x, y]. Luego, tenemos que log(x) < log(y).

Proposición 3.3.18. Para todos x, y > 0, tenemos que:

log(xy) = log(x) + log(y)


75

log(x/y) = log(x) log(y)


log(1/x) = − log(x).

Demostración. Primera igualdad: se observa que


Z xy Z x Z xy
1 1  1
log(xy) = dt = dt + dt = log(x) + log(y)
1 t 1 t x1

t

Segunda igualdad: se sigue de que


log(x) = log((x/y) · y) = log(x/y) + log(y)

Tercera igualdad: se sigue de la igualdad anterior, observando que log(1) = 0.

1
Gracias a la función logaritmo, podemos ahora expresar la integral de la función f (t) = t
en cualquier intervalo [a, b] ⊂ (0, +∞):
Proposición 3.3.19. Para todos a, b > 0, tenemos que
Z b
1 b
dt = log(b) − log(a) = log( )
a t a
(Se observa que la última expresión sólo depende del cociente ab .)

Demostración. Inmediato por la definición de la función logaritmo (ejercicio).

Ejercicio de parcial

(Primer parcial - primer semestre 2023) Sean f, g : R+ → R definidas por


f (x) = x6 y g(x) = −x + 5. En área encerrada entre los gráficos de las funciones f y
g es:
5 15
A) 2
− 6(log(3) + log(2)) D) 2
+ (log(3) − log(2))

B) − 52 + 6(log(3) + log(2)) E) 5
2
− 6(log(3) − log(2))
15
C) 2
+ 6(log(3) + log(2)) F) − 52 + 6(log(3) − log(2))

Solución. Primero buscamos los puntos donde los dos gráficos se intersectan, es decir bus-
camos los x ∈ R+ tales que
f (x) = g(x)
Tenemos que
6
f (x) = g(x) ⇔ = −x + 5
x
⇔ 6 = −x2 + 5x
⇔ x2 − 5x + 6 = 0
⇔x=2 ox=3
76

Luego, el área buscada es la siguiente:

Es decir, el área bajo el gráfico de g y sobre el gráfico de f . Luego, el área buscada es:
Z 3 Z 3 Z 3 Z 3
6
g(x)dx − f (x)dx = dx − −x + 5dx
2 2 2 x 2
Z 3 Z 3 Z 5
1
=6 dx + xdx − 5dx
2 x 2
 22
22

3
= 6(log(3) − log(2)) + − − (5 · 3 − 5 · 2)
2 2
5
= 6(log(3) − log(2)) −
2
Ejercicio 25. El objetivo de este ejercicio es demostrar las desigualdades
1
1− ≤ log(x) ≤ x − 1
x
para todo x > 0.

(1) Verificar que las desigualdades anteriores se cumplen (trivialmente) cuando x = 1.

(2) Ahora, se considera el caso donde x > 1.


1 1
(a) Verificar que x
≤ t
≤ 1 para todo t ∈ [1, x].
(b) Usando la monotonı́a de la integral, deducir que
1 1
1− = (x − 1) · ≤ log(x) ≤ x − 1
x x

(3) Adaptar el razonamiento efectuado en (2) para el caso donde x < 1.


77
78
Capı́tulo 4

Lı́mites y continuidad

4.1. Lı́mite

4.1.1. Entornos

Las nociones de continuidad y de lı́mite de una función f en un punto x0 están ı́nti-


mamente vinculadas con el comportamiento de dicha función “alrededor del punto x0 ”. En
matemática, se formaliza la noción intuitiva de proximidad mediante la noción de entorno:

Definición 4.1.1 (Entorno de un punto). Dados un punto x0 ∈ R y un número ϵ > 0,


se llama entorno de centro x0 y de radio ϵ al conjunto E(x0 , ϵ) definido por

E(x0 , ϵ) := {x ∈ R : |x − x0 | < ϵ} = (x0 − ϵ, x0 + ϵ)

De modo similar se define el entorno reducido E ∗ (x0 , ϵ), excluyendo el punto x0 :

E ∗ (x0 , ϵ) := E(x0 , ϵ) \ {x0 }


= {x ∈ R : 0 < |x − x0 | < ϵ}
= (x0 − ϵ, x0 ) ∪ (x0 , x0 + ϵ)

Observación 4.1.2. Intuitivamente, el entorno E(x0 , ϵ) de centro x0 y de radio ϵ > 0


representa el conjunto de las aproximaciones del número x0 con precisión ϵ. Es claro que
cuando se reemplaza el radio ϵ por otro radio ϵ′ ≤ ϵ (es decir: por una precisión mejor), se

79
80

obtiene un entorno contenido en el entorno anteior:

0 < ϵ′ ≤ ϵ ⇒ E(x0 , ϵ′ ) ⊂ E(x0 , ϵ)

Esta observación también vale para los entornos reducidos E ∗ (x0 , ϵ) y E ∗ (x0 , ϵ′ ).

Definición 4.1.3 (Interior y clausura de un intervalo). Sea un intervalo I ⊂ R.

El interior de I es el subintervalo I ◦ ⊂ I obtenido excluyendo los extremos de


I.

La clausura de I es el supraintervalo I¯ ⊃ I obtenido incluyendo los extremos de


I.

La siguiente tabla resume la definición del interior y de la claura de un intervalo en


función del tipo de intervalo considerado:

¯
Se observa que en todos los casos, tenemos I ◦ ⊂ I ⊂ I.

Definición 4.1.4 (Punto interior, punto adherente). Dado un intervalo I ⊂ R, se dice


que un número real x0 es un punto interior de I cuando x0 ∈ I ◦ , y que es un punto
¯ Dicho de otro modo:
adherente a I cuando x0 ∈ I.

un punto interior de I es un punto del intervalo I distinto de sus extremos

un punto aherente a I es o bien un punto del intervalo I, o bien uno de sus


extremos (el o es inclusivo, pues los extremos del intervalo I pueden pertenecer
a I).

Ejercicio 26 (Caracterización de los puntos interiores y adherentes). Dados un intervalo


I ⊂ R y un número real x0 , se consideran las siguientes dos equivalencias:

(a) x0 es un punto interior de I si y sólo si existe ϵ > 0 tal que E(x0 , ϵ) ⊂ I

(b) x0 es un punto adherente a I si y sólo si E(x0 , ϵ) ∩ I ̸= ∅ para todo ϵ > 0


81

Para cada uno de los diez tipos de intervalos, demostrar que ambas equivalencias se cumplen.

En lo siguiente, sólo consideraremos funciones definidas en un intervalo I ⊂ R cuyo


interior no es vacı́o, es decir, tal que I ◦ ̸= ∅. Ası́, cuando escribiremos

Sea f : I → R una función definida en un intervalo I ⊂ R...

habrá que leer:

Sea f : I → R una función definida en un intervalo I ⊂ R tal que I ◦ ̸= ∅...

En la práctica, la convención anterior sólo excluye las funciones definidas en el intervalo


vacı́o I = ∅ y en los intervalos I = {a} = [a, a] reducidos a un punto, que tienen poco interés
en análisis. En lo que sigue, usaremos a menudo la siguiente propiedad, que sólo se cumple
para los intervalos cuyo interior no es vacı́o:

Proposición 4.1.5. Si I ⊂ R es un intervalo cuyo interior no es vacı́o (I ◦ ̸= ∅), entonces


para todo punto x0 adherente a I y para todo ϵ > 0, tenemos que E ∗ (x0 , ϵ) ∩ I ̸= ∅.

Ejercicio 27. Demostrar la propiedad anterior, distinguiendo los casos en función del tipo
de intervalo considerado. ¿Qué pasa cuando el intervalo está reducido a un punto?

4.1.2. Noción de lı́mite

Definición 4.1.6 (Lı́mite de una función en un punto). Sea f : I → R una función


real definida en un intervalo I ⊂ R. Dados un punto x0 ∈ I¯ y un número L ∈ R, se
dice que f (x) tiende a L cuando x tiende a x0 , o que f tiene lı́mite L en el punto x0
cuando:
∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − L| < ϵ
En este caso, se escribe

f (x) −−−→ L o bien lı́m f (x) = L


x→x0 x→x0

Observación 4.1.7. 1. Formalmente, tenemos que

f (x) −−−→ L ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − L| < ϵ


x→x0

es decir, usando las notaciones para los entornos:

f (x) −−−→ L ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ∈ E(L, ϵ)


x→x0

Ası́, la definición de lı́mite expresa la idea intuitiva que f (x) es arbitrariamente cer-
cano a L en cuanto x sea suficientemente cercano a x0 (sin ser igual a x0 ). Más
precisamente:
82

2. La definición de lı́mite sólo examina los valores tomados por la función f en los entor-
nos reducidos del punto x0 (que exluyen el punto x0 ), y nunca examina el valor de f
en el propio punto x0 , cuando dicho valor existe1 . Ası́, el valor tomado por la función
f en el punto x0 (cuando dicho valor existe) no influye ni en la existencia del lı́mite,
ni en el valor de dicho lı́mite. La exclusión sistemática del punto x0 del dominio de
la observación también explica por qué se puede considerar el lı́mite de la función f
en cualquier extremo del intervalo I, incluso cuando la función f no está definida en
dicho extremo.
3. Una función f : I → R no siempre tiene lı́mite en un punto x0 ∈ I¯ (veremos contra-
ejemplos más adelante), pero cuando tiene lı́mite, es único:

Proposición 4.1.8 (Unicidad del lı́mite). Sean una función f : I → R definida en un


intervalo I ⊂ R y un punto x0 ∈ I.
¯ Si f tiene lı́mites L y L′ en el punto x0 , entonces
L = L′ .

Demostración. Supongamos (por el absurdo) que L ̸= L′ . Se considera la precisión ϵ > 0


definida por ϵ := |L − L′ |/2, de tal modo que los entornos E(L, ϵ) y E(L′ , ϵ) sean disjuntos:

Como f tiene lı́mite L en el punto x0 , existe un radio δ > 0 tal que f (x) ∈ E(L, ϵ) para
todo x ∈ E ∗ (x0 , δ) ∩ I. Como f también tiene lı́mite L′ en el punto x0 , existe otro radio
δ ′ > 0 tal que f (x) ∈ E(L′ , ϵ) para todo x ∈ E ∗ (x0 , δ ′ ) ∩ I. Ahora, se elige un punto x ∈ I
tal que 0 < |x − x0 | < min(δ, δ ′ ) (tal punto existe por la Proposición 4.1.5), de tal modo
que x ∈ E ∗ (x0 , δ) ∩ I y x ∈ E ∗ (x0 , δ ′ ) ∩ I. Por lo anterior, se deduce que f (x) ∈ E(L, ϵ) y
f (x) ∈ E(L′ , ϵ), lo que es absurdo pues ambos conjuntos E(L, ϵ) y E(L′ , ϵ) son disjuntos.

Cuando la función f : I → R tiene lı́mite en el punto x0 ∈ I, ¯ dicho lı́mite es único y


se escribe lı́m f (x). ¡Cuidado! Esta notación sólo tiene sentido cuando la función f
x→x0
tiene lı́mite en el punto x0 , y no está definida si no.

Observación 4.1.9. En el caso donde x0 ∈ I, tenemos tres situaciones posibles:

o bien f no tiene lı́mite en el punto x0 : lı́m f (x) no existe


x→x0

1
Recordemos que el punto x0 puede no estar en el intervalo de definición I
83

o bien f tiene lı́mite distinto de f (x0 ) en el punto x0 : lı́m f (x) ̸= f (x0 )


x→x0

o bien f tiene lı́mite igual a f (x0 ) en el punto x0 : lı́m f (x) = f (x0 )


x→x0

En este último caso, diremos que la función f es continua en el punto x0 . Formalmente:

Definición 4.1.10 (Función continua en un punto). Se dice que una función f : I → R


es continua en un punto x0 ∈ I cuando tiene lı́mite igual a f (x0 ) en el punto x0 :

f continua en x0 ∈ I ⇔ f (x) −−−→ f (x0 )


x→x0

En caso contrario, cuando la función f no tiene lı́mite en el punto x0 , o cuando tiene


lı́mite distinto de f (x0 ) en el punto x0 , se dice que la función f es discontinua en el
punto x0 .

4.1.3. Ejemplos y contraejemplos

Para demostrar que una función f : I → R tiene lı́mite L ∈ R en un punto x0 adherente


a su intervalo de definición I, se necesita construir para cada precisión ϵ > 0 un radio δϵ > 0
(que depende en general de la precisión ϵ > 0) tal que:
∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |f (x) − L| < ϵ (∗)

Dicho de otro modo, se necesita construir alguna función ϵ 7→ δϵ (de R+ en R+ ) que asocie
a cada precisión ϵ > 0 un radio de seguridad δϵ que cumpla la condición (∗)2 . Los siguientes
ejemplos muestran cómo se puede construir tal función en la práctica.
Ejemplo 4.1.11 (Función identidad). Sea f : R → R la función identidad, definida f (x) = x
para todo x ∈ R. Entonces para todo punto x0 ∈ R, tenemos que
lı́m f (x) = x0 = f (x0 )
x→x0

2
Tal función no es única y, en la práctica, sólo se necesita construir alguna.
84

Por lo tanto, la función identidad f (x) = x es continua en todo punto x0 ∈ R.

Demostración. Dada una precisión ϵ > 0 fijada, se trata de hallar un radio δϵ > 0 tal que

∀x ∈ R, 0 < |x − x0 | < δϵ ⇒ |f (x) − x0 | < ϵ

Aquı́, como f (x) = x para todo x ∈ R, es natural tomar δϵ := ϵ.

En efecto, para todo x ∈ R tal que 0 < |x − x0 | < δϵ , tenemos que |x − x0 | < ϵ (pues δϵ = ϵ),
es decir: |f (x) − x0 | < ϵ (pues f (x) = x).

Observación 4.1.12. En el ejemplo anterior, asociamos el radio δϵ := ϵ a cada precisión


ϵ > 0, pero también hubiéramos podido asociar caulquier radio menor o igual a ϵ, por ejemplo
δϵ := ϵ/2 o ϵ/1000. Más generalmente, dados una función f : I → R, un punto x0 ∈ I¯ y un
número L ∈ R, es claro que si un radio δϵ > 0 cumple la condición

∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |f (x) − L| < ϵ

para una precisión ϵ > 0, entonces cualquier radio δϵ′ > 0 tal que δϵ′ ≤ δϵ cumple la misma
condición (reemplazando δϵ por δϵ′ ).

Ejercicio 28 (Función identidad modificada). Sea f : R → R la función definida por


(
1 si x = 0
f (x) =
x si x ̸= 0

El objetivo del ejercicio es demostrar que lı́m f (x) = x0 para todo x0 ∈ R.


x→x0

(1) Demostrar que lı́m f (x) = 0, asociando el radio δϵ := ϵ a cada precisión ϵ > 0. Deducir
x→0
que la función f es discontinua en el punto x0 = 0.
85

(2) Ahora, se considera un punto x0 ̸= 0. Demostrar que lı́m f (x) = x0 , asociando el


x→x0
radio δϵ := min(ϵ, |x0 |) a cada precisión ϵ > 0. ¿Por qué no se puede tomar δϵ := ϵ?
Deducir que la función f es continua en cada punto x0 ̸= 0.

Ejemplo 4.1.13 (Función


√ raı́z cuadrada). Sea f : [0, +∞) → R la función raı́z cuadrada,
definida por f (x) = x para todo x ∈ [0, +∞). Entonces para todo punto x0 ∈ [0, +∞)
tenemos que

lı́m f (x) = x0 = f (x0 )
x→x0

Por lo tanto, la función raı́z cuadrada f (x) = x es continua en todo punto x0 ∈ [0, +∞).

Demostración. Sea x0 ≥ 0. Dada una precisión ϵ > 0 fijada, se trata de hallar un radio
δϵ > 0 tal que
p √
∀x ∈ [0, +∞), 0 < |x − x0 | < δϵ ⇒ | (x) − x0 | < ϵ (∗)

Para ello, se distinguen dos casos:

Caso donde x0 = 0. En este caso, se puede tomar δϵ := ϵ2 > 0. En efecto, para todo
x ∈ [0, +∞) tal que 0 < |x − 0| <√δϵ , tenemos 0 < x < ϵ2 (pues |x − 0| = x ≥ 0 y
√ que √
2
δϵ = ϵ ). Entonces, tenemos que | x − 0| = x < ϵ2 = ϵ).

Caso donde x0 > 0. Queremos construir un radio δϵ > 0 tal que


√ √ √
∀x ∈ [0, +∞), 0 < |x − x0 | < δϵ ⇒ x0 − ϵ < x < x0 + ϵ

Para evitar que el número x0 − ϵ sea negativo, se reemplaza la precisión ϵ > 0 por
√ √
la precisión (más fina) ϵ′ := min(ϵ, x0 ) > 0, de tal modo que x0 − ϵ′ ≥ 0, mientras
ϵ′ ≤ ϵ. Luego, se observa que para todo x ∈ [0, +∞), tenemos que
√ √ √ √ √
x0 − ϵ′ < x < x0 + ϵ′ ⇔ ( x0 − ϵ′ )2 < x < ( x0 + ϵ′ )2 (∗∗)
√ √ √
pues los tres números x0 − ϵ′ , x y x0 + ϵ′ son positivos o nulos. En particular,
cuando x = x0 , se observa que
√ √
( x0 − ϵ′ )2 < x0 < ( x0 + ϵ′ )2

lo que nos permite definir el radio δϵ > 0, escribiendo


√ √
δϵ := min(x0 − ( x0 − ϵ′ )2 , ( x0 ) + ϵ′ )2 − x0 ) > 0

Ahora, se trata de mostrar que el radio δϵ > 0 cumple la condición (∗) deseada.
86

Para ello, se considera un número x ∈ [0, +∞) tal que 0 < |x − x0 | < δϵ . Por hipótesis
sobre x, tenemos que
√ √
x < x0 + δϵ ≤ x0 + (( x0 + ϵ′ )2 − x0 ) = ( x0 + ϵ′ )2

pues δϵ ≤ ( x0 + ϵ′ )2 − x0 , y
√ √
x > x0 − δϵ ≥ x0 − (x0 − ( x0 − ϵ′ )2 ) = ( x0 − ϵ′ )2
√ √ √
pues δϵ ≤ x0 − ( x0 − ϵ′ )2 . Es decir:
√ ( x0 − ϵ′ )2 < x < ( x0 + ϵ′ )2 . Por la equivalencia
√ √
(∗∗), se deduce que x0 − ϵ′ < x < x0 + ϵ′ , es decir
√ √
| x − x0 | < ϵ′ ≤ ϵ
Lo que acaba de demostrar la condición (∗) en el caso donde x0 > 0.
Observación 4.1.14 (Negación de la propiedad de lı́mite). Hasta ahora, sólo vimos ejem-
plos de funciones que tienen lı́mites en todos los puntos de su intervalo de definición. Re-
cordemos que una función f : I → R tiene lı́mite en un punto x0 ∈ I¯ si y sólo si:
∃L ∈ R, ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − L| < ϵ
Ası́, para demostrar que una función f : I → R no tiene lı́mite en un punto x0 ∈ I,
¯ se
necesita demostrar la negación del enunciado anterior, es decir el enunciado:
∀L ∈ R, ∃ϵ > 0, ∀δ > 0, ∃x ∈ I, 0 < |x − x0 | < δ ∧ |f (x) − L| ≥ ϵ

El siguiente ejemplo presenta una función que no tiene lı́mite en el punto x0 = 0.


Ejemplo 4.1.15 (Función signo). Se considera la función sgn : R → R, definida por

1
 si x > 0
sgn(x) = 0 si x = 0

−1 si x < 0

87

Entonces la función sgn no tiene lı́mite en el punto x0 = 0.

Demostración. Queremos demostrar que:

∀L ∈ R, ∃ϵ > 0, ∀δ > 0, ∃x ∈ I, 0 < |x − x0 | < δ ∧ |sgn(x) − L| ≥ ϵ

Dado un número L ∈ R cualquiera, se trata de hallar una precisión ϵ > 0 tal que

∀δ > 0, ∃x ∈ I, 0 < |x − x0 | < δ ∧ |sgn(x) − L| ≥ ϵ

es decir, tal que:


∀δ > 0, ∃x ∈ E ∗ (0, δ), |sgn(x) − L| ≥ ϵ
Se elige la precisión ϵ := 1. Dado un radio δ > 0 cualquiera, queremos hallar un punto
x ∈ E ∗ (0, δ) tal que |f (x) − L| ≥ 1 = ϵ. Para ello, se distinguen dos casos:

Caso donde L ≥ 0. En este caso, se elige el punto x = − 2δ ∈ E ∗ (0, δ), de tal modo que
sgn(x) = −1. Entonces, tenemos que

|sgn(x) − L| = | − 1 − L| = |L + 1| = L + 1 ≥ 1

pues L ≥ 0.
Caso donde L ≤ 0. En este caso, se elige el punto x = δ
2
∈ E ∗ (0, δ), de tal modo que
sgn(x) = 1. Entonces, tenemos que

|sgn(x) − L| = |1 + (−L)| = 1 + (−L) ≥ 1

pues −L ≥ 0.

Ası́ para cada radio δ > 0, logramos hallar un punto x ∈ E ∗ (0, δ) tal que |sgn(x) − L| ≥ ϵ
(con ϵ = 1). Por lo tanto, la función sgn no tiene lı́mite en el punto x0 = 0.
Ejercicio 29. Terminar el estudio de la función sgn : R → R, demostrando que es continua
en todo punto x0 ̸= 0.
Observación 4.1.16. En el ejemplo anterior, se observa que la función sgn tiende a −1
(al ser igual a −1) cuando x tiende a 0 por la izquierda, mientras que sgn tiende a 1 (al ser
igual a 1) cuando x tiende a 0 por la derecha, lo que escribiremos:

lı́m sgn(x) = −1 y lı́m sgn(x) = 1


x→0− x→0+
88

Ası́, la función sgn tiene lı́mite laterales (por izquierda y por derecha) en el punto 0, pero
como dichos lı́mites laterales son distintos, la función sgn no tiene lı́mite en el punto 0. Las
nociones de lı́mites laterales serán definidas formalmente más adelante.

Para acabar esta sección, se presenta un ejemplo de función tan irregular que no tiene
lı́mite en ningún punto de su dominio de definición:

Ejemplo 4.1.17 (Función de Dirichlet). Sea D : R → R la función de Dirichlet, definida


por
1 si x ∈ Q
(
D(x) =
0 si x ∈/Q
Entonces la función D no tiene lı́mite en ningún punto x0 ∈ R

Demostración. Dado X0 ∈ R fijado, se trata de demostrar que

∀L ∈ R, ∃ϵ > 0, ∀δ > 0, ∃x ∈ E ∗ (x0 , δ), |D(x) − L| ≥ ϵ

Ası́, dado un número L cualquiera, se trata de hallar una precisión ϵ > 0 tal que

∀δ > 0, ∃x ∈ E ∗ (x0 , δ), |D(x) − L| ≥ ϵ

Se elige la precisión ϵ := 21 . Dado un radio α > 0, queremos hallar un punto x ∈ E ∗ (x0 , δ)


tal que |D(x) − L| ≥ 12 = ϵ. Para ello, se observa que el intervalo (x0 , x0 + δ) ⊂ E ∗ (x0 , δ)
contiene a la vez números racionales y números irracionales (como todos los intervalos cuyo
interior no es vacı́o), lo que nos permite elegir dos puntos x1 , x2 ∈ (x0 , x0 + δ) ⊂ E ∗ (x0 , δ)
tales que x1 ∈ Q y x2 ∈ / Q. Ahora, se distinguen los siguientes dos casos:

1. Caso donde L ≤ 12 . En este caso, se toma x := x1 ∈ E ∗ (x0 , δ), de tal modo D(x) = 1
(pues x = x1 ∈ Q). Se verifica que
1
|D(x) − L| = |1 − L| = 1 − L ≥
2
1
pues L ≤ 2

2. Caso donde L ≥ 12 . En este caso, se toma x := x2 ∈ E ∗ (x0 , δ), de tal modo D(x) = 0
/ Q). Se verifica que
(pues x = x2 ∈
1
|D(x) − L| = |0 − L| = |L| = L ≥
2
1
pues L ≥ 2

Ası́, para cada radio δ > 0, logramos hallar un punto x ∈ E ∗ (0, δ) tal que |D(x) − L| ≥ ϵ
(con ϵ = 12 ). Por lo tanto, la función D no tiene lı́mite en el punto x0 .
89

4.1.4. Propiedades algebraicas de los lı́mites

Antes de estudiar las propiedades de los lı́mites, se necesita observar lo siguiente:


Observación 4.1.18. Dados una función f : I → R definida en un intervalo I ⊂ R, un
punto x0 ∈ I¯ adherente al intervalo de definición y un número L ∈ R, los tres enunciados

lı́m f (x) = L, lı́m (f (x) − L) = 0 y lı́m |f (x) − L| = 0


x→x0 x→x0 x→x0

son equivalentes.

Demostración. En efecto tenemos que

lı́m f (x) = L ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, |f (x) − L| < ϵ


x→x0

lı́m (f (x) − L) = 0 ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, |(f (x) − L) − 0| < ϵ


x→x0

lı́m |f (x) − L| = 0 ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, ||f (x) − L| − 0| < ϵ


x→x0

Se concluye observando que ||f (x) − L| − 0| = |f (x) − L| = |(f (x) − L) − 0|.

Proposición 4.1.19 (Lı́mite de una suma, una resta). Sean f, g : I → R dos funciones
definidas en un intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números L, L′ ∈ R.

(1) Si lı́m f (x) = L y lı́m g(x) = L′ , entonces lı́m (f (x) + g(x)) = L + L′ .


x→x0 x→x0 x→x0

(2) Si lı́m f (x) = L y lı́m g(x) = L′ , entonces lı́m (f (x) − g(x)) = L − L′ .


x→x0 x→x0 x→x0

Demostración.

(1) Supongamos que lı́m f (x) = L y lı́m g(x) = L′ . Por hipótesis, existen dos funciones
x→x0 x→x0
ϵ 7→ δϵ y ϵ 7→ δϵ′ (de R
+
en R+ ) tales que
∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |f (x) − L| < ϵ (∗)

∀x ∈ I, 0 < |x − x0 | < δϵ′ ⇒ |g(x) − L′ | < ϵ (∗′ )


para toda precisión ϵ > 0. Queremos construir una función ϵ 7→ δϵ′′ (de R+ en R+ ) tal
que
∀x ∈ I, 0 < |x − x0 | < δϵ′′ ⇒ |(f (x) − g(x)) − (L + L′ )| < ϵ (∗′′ )
para toda precisión ϵ > 0. Para ello, se define δϵ′′ := min(δϵ/2 , δϵ/2

) > 0 para todo ϵ > 0.
En efecto, dados una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 | < δϵ′′ ,
tenemos que

0 < |x − x0 | < δϵ/2 (pues δϵ′′ ≤ δϵ/2 ), entonces |f (x) − L| < ϵ/2 por (∗)
90


0 < |x − x0 | < δϵ/2 (pues δϵ′′ ≤ δϵ/2

), entonces |g(x) − L′ | < ϵ/2 por (∗′ )
Sumando las dos desigualdades obtenidas, se deduce que
|(f (x) + g(x)) − (L + L′ )| = |(f (x) − L) + (g(x) − L′ )|
≤ |f (x) − L| + |g(x) − L′ |
< ϵ/2 + ϵ/2 = ϵ
Lo que demuestra la condición (∗′′ ) para todo ϵ > 0, es decir: lı́m (f (x)+g(x)) = L+L′ .
x→x0

(2) El caso de la resta es análogo al caso de la suma.


Ejercicio 30. Demostrar el item (2) de la proposición anterior, adaptando la demostración
del item (1) de modo adecuado. (Sugerencia: en la demostración del item (1), sólo se necesita
reemplazar 5 ocurrencias del sı́mbolo + por el sı́mbolo -.)

Ahora, queremos demostrar la propiedad análoga para el producto y el cociente. Para


ello, se necesita establecer algunos resultados intermedios.

Definición 4.1.20 (Función acotada en un entorno de un punto). Sea f : I → R una


función definida en un intervalo I ⊂ R, y un punto x0 ∈ I.
¯ Se dice que la función f
está acotada en un entorno del punto x0 cuando existen r > 0 y M ≥ 0 tales que

∀x ∈ E(x0 , r) ∩ I, |f (x)| ≤ M

Ejercicio 31. El enunciado que expresa que f está acotada en un entorno de x0 es:
∃r > 0, ∃M ≥ 0, ∀x ∈ E(x0 , r) ∩ I, |f (x)| ≤ M
Escribir la negación del enunciado anterior, es decir: el enunciado que expresa que la función
f no está acotada en ningún entorno del punto x0 .
Ejercicio 32. Sea f : R → R la función definida por
(
0 si x ≤ 0
f (x) = 1
x
si x > 0

(1) Demostrar que la función f no está acotada en ningún entorno del punto x0 = 0.
(2) Demostrar que para todo punto x0 = ̸ 0, la función f está acotada en un entorno de
x0 . (Sugerencia: distinguir los casos x0 < 0 y x0 > 0)
Proposición 4.1.21. Sea f : I → R una función definida en un intervalo I ⊂ R. Si f tiene
¯ entonces F está acotada en un entorno del punto x0 .
lı́mite en un punto x0 ∈ I,

Demostración. Suponiendo que lı́m f (x) = L ∈ R, se considera un radio δ > 0 tal que
x→x0

∀x ∈ E (x0 , δ ∩ I, |f (x) − L| < 1 (∗)

(Basta con tomar el radio asociado a la precisión ϵ = 1.) Ahora se distinguen dos casos:
91

Caso donde x0 ∈ I (la función f está definida en el punto x0 ). En este caso, se toman
r := δ y M := max(|L|+1, |f (x0 )|) ≥ 0. En efecto, dado un punto x ∈ E(X −0, r)∩I =
E(x0 , δ) ∩ I, se observa que

ˆ o bien x = x0 , y en este caso, tenemos que |f (x)| = |f (x0 )| ≤ M


ˆ o bien x ̸= x0 , y en este caso, tenemos que x ∈ E ∗ (x0 , δ)∩I. Por lo tanto, tenemos
que |f (x) − L| < 1 por (∗), de tal modo que

|f (x)| = |L + (f (x) − L)| ≤ |L| + |f (x) − L| < |L| + 1 ≤ M

Ası́, para todo x ∈ E(x0 , r) ∩ I, tenemos que |f (x)| ≤ M .

Caso donde x0 ∈/ I (la función f no está definida en el punto x0 ), En este caso, basta
con tomar r := δ y M := |L| + 1; el razonamiento es análogo.

Proposición 4.1.22. Sean f, g : I → R dos funciones definidas en un intervalo I ⊂ R


¯ Si f está acotada en un entorno de x0 , y si lı́m g(x) = 0, entonces
y un punto x0 ∈ I.
x→x0
lı́m f (x)g(x) = 0.
x→x0

Demostración. Por hipótesis, sabemos que

(i) Existen r > 0 y M ≥ 0 tales que |f (x)| ≤ M para todo x ∈ E(x0 , r) ∩ I. Sin pérdida
de generalidad, se puede suponer que M > 03 .

(ii) Existe una función ϵ 7→ δϵ (de R+ en R+ ) tal que para todo ϵ > 0, tenemos que
∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |g(x)| < ϵ (∗)

Se trata de construir una función ϵ 7→ δϵ′ (de R+ en R+ ) tal que


∀x ∈ I, 0 < |x − x0 | < δϵ′ ⇒ |f (x)g(x)| < ϵ (∗′ )

para toda precisión ϵ > 0. Para ello, se define δϵ′ := mı́n δϵ/M , r > 0 para todo ϵ > 0.


En efecto, dados una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 | < δϵ′ ,
tenemos que:

|x − x0 | < r (pues δϵ′ ≤ r), entonces |f (x)| ≤ M por (I).


0 < |x − x0 | < δϵ/M (δϵ′ ≤ δϵ/M ), entonces |g(x)| < ϵ/M por (∗).

Por lo tanto, se deduce que


ϵ
|f (x)g(x)| = |f (x)| · |g(x)| < M · =ϵ
M
Esto demuestra la condición (∗′ ) para todo ϵ > 0, es decir: lı́m f (x)g(x) = 0.
x→x0

3
En efecto, siempre se puede reemplazar M ≥ 0 por M ′ := M + 1 ≥ 0 sin afectar la condición (I)
92

Ahora, se puede demostrar la propiedad de lı́mite para el producto:

Proposición 4.1.23 (Lı́mite de un producto). Sean f, g : I → R dos funciones


definidas en un intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números L, L′ ∈ R. Si
lı́m f (x) = L y lı́m g(x) = L′ , entonces lı́m f (x)g(x) = LL′ .
x→x0 x→x0 x→x0

Demostración. Por hipótesis, tenemos que lı́m (f (x) − L) = 0 y lı́m (g(x) − L′ ) = 0.


x→x0 x→x0
Ahora, se observa que para todo x ∈ I, tenemos que
f (x)g(x) − LL′ = (f (x) − L)L′ + f (x)(g(x) − L′ )
Como lı́m (f (x) − L) = 0, y como la función constante iguala L′ está (trivialmente) acotada
x→x0
en un entorno de x0 , tenemos que lı́m (f (x) − L)L′ = 0 por la Proposición 4.1.22. Por otro
x→x0
lado, como f tiene lı́mite en el punto x0 , está acotada en un entorno de x0 por la Proposición
4.1.21. Y como lı́m (g(x) − L′ ) = 0, tenemos que lı́m f (x)(g(x) − L′ ) = 0, usando de nuevo
x→x0 x→x0
la Proposición 4.1.22. Sumando los dos lı́mites anteriores, se deduce por la Proposición 4.1.19
que
lı́m (f (x)g(x) − LL′ ) = lı́m ((f (x) − L)L′ ) + lı́m (f (x)(g(x) − L′ )) = 0 + 0 = 0
x→x0 x→x0 x→x0

lo que demuestra que lı́m f (x)g(x) = LL′ .


x→x0
Ejercicio 33. El objetivo del ejercicio es demostrar que todas las funciones polinomiales son
continuas en todos los puntos de R.

(1) Demostrar por inducción sobre k ∈ N que lı́m xk = xk0 para todo x0 ∈ R. deducir que la
x→x0
función x 7→ xk es continua en todo punto x0 ∈ R. (Sugerencia: en el paso inductivo,
observar que xk+1 = f (x)g(x), con f (x) = xk y g(x) = x, y usar el resultado del
Ejemplo 4.1.11.)
(2) Deducir de lo anterior que para todos a ∈ R y k ∈ N, la función monomial x 7→ axk es
continua en todo punto x0 ∈ R.
(3) Demostrar por inducción sobre n ∈ N que toda función f : R → R de la forma
n
X
n
f (x) = a0 + a1 x + · · · + an x = ak x k
k=0

con a0 , . . . , an ∈ R es continua en todo punto x0 ∈ R.

Proposición 4.1.24 (Lı́mite de la función 1/f ). Sea f : I → R una función definida


en un intervalo I ⊂ R, tal que f (x) ̸= 0 para todo x ∈ I. Si x0 ∈ I¯ es un punto tal
que lı́m f (x) = L ̸= 0, entonces
x→x0

1 1
lı́m =
x→x0 f (x) L
93

 
1 1
Demostración. Queremos demostrar que lı́m f (x)
− L
= 0. Para ello, se observa que
x→x0

1 1 L − f (x) 1 1
− = =− · · (f (x) − L)
f (x) L f (x)L L f (x)
Demostremos que la función g : I → R definida por g(x) = 1/f (x) está acotada en un
entorno del punto x0 . Como lı́m f (x) = L ̸= 0, existe un radio δ > 0 tal que
x→x0

|L|
|f (x) − L| <
2
para todo x ∈ E ∗ (x0 , δ) ∩ I (considerando el radio asociado a la precisión |L|/2 > 0).
Entonces, tenemos que
|L|
|L| = |f (x) − (f (x) − L)| ≤ |f (x)| + |f (x) − L| ≤ |f (x)| −
2
para todo x ∈ E + (x0 , δ) ∩ I, de tal modo que
|L| |L|
|f (x)| ≥ |L| − =
2 2
para todo x ∈ E ∗ (x0 , δ) ∩ I. Ahora, se distinguen dos casos:

Caso x0 ∈ I (la función f está definida en el punto x0 ). En este caso, se deduce de lo


anterior que |g(x)| = 1/|f (x)| ≤ 2/|L| para todo x ∈ E ∗ (x0 , δ) ∩ I, de tal modo que
 
1 2 1
g(x) = ≤ máx ,
f (x) |L| f (x0 )
para todo x ∈ E(x0 , δ) ∩ I (distinguiendo los casos x ̸= x0 y x = x0 ).
Caso x0 ∈
/ I (la función f no está definida en el punto x0 ). En este caso, se observa
que E(x0 , δ) ∩ I = E ∗ (x0 , δ) ∩ I (pues x0 ∈
/ I), de tal modo que
1 2
|g(x)| = ≤
|f (x)| |L|
para todo x ∈ E(x0 , δ) ∩ I

Ası́, en ambos casos, demostramos que la función g(x) = 1/f (x) está acotada en un entorno
E(x0 , δ) del punto x0 . Además, tenemos que lı́m (f (x) − L) = 0 por hipótesis. Aplicando
x→x0
dos veces seguidas la Proposición 4.1.22, se deduce de lo anterior que
lı́m (g(x) · (f (x) − L)) = 0
x→x0

y    
1 1 1
lı́m − = lı́m − · (g(x) · (f (x) − L)) = 0
x→x0 f (x) L x→x0 L
94

Observación 4.1.25. (1) Cabe destacar que para calcular el lı́mite de la función x 7→
1/f (x) en el punto x0 , se necesita verificar tres condiciones:

a) la función f : I → R no se anula4 en I: f (x) ̸= 0 para todo x ∈ I


b) la función f tiene lı́mite en el punto x0 ∈ I¯
c) el lı́mite de la función f en el punto x0 no es nulo: lı́m f (x) ̸= 0
x→x0

¡Cuidado! Las condiciones a) y b) no implican la condición c). Un contraejemplo es la


función f : R → R definida por
(
|x| si x ̸= 0
f (x) =
1 si x = 0

Por construcción, tenemos que f (x) > 0 para todo x ∈ R (condición a)). Además, la
función f tiene lı́mite en el punto x0 = 0 (condición b)), pero éste es nulo: lı́m f (x) =
x→0
0.

(2) Por otro lado, las condiciones b) y c) implican que la función f no se anula en algún
entorno reducido del punto x0 , en el sentido de que existe un radio δ > 0 tal que:

∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ̸= 0

(Véase el Ejercicio 34 más abajo). Sin embargo, en el caso donde x0 ∈ I, esta propiedad
de “no anulación local” no implica que f (x0 ) ̸= 0, salvo cuando f es continua en el
punto x0 .

Ejercicio 34 (Lı́mite no nulo). Sea f : I → R una función definida en un intervalo I ⊂ R, y


tal que lı́m f (x) = L ∈ R en algún punto x0 ∈ I.
¯
x→x0

1. Demostrar que si L > 0, entonces existe un radio δ > 0 tal que

∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) > 0

(Sugerencia: considerar el radio asociado a la precisión ϵ := L > 0.)

2. Demostrar que si L < 0, entonces existe un radio δ > 0 tal que

∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) < 0

(Sugerencia: considerar el radio asociado a la precisión ϵ := −L > 0.)

3. Deducir de lo anterior que si L ̸= 0, entonces la función f no se anula en algún


entorno reducido del punto x0 . Mediante un contraejemplo adecuado, explicar por qué
la propiedad no se puede extender (en general) a un entorno lleno (no reducido) del
punto x0 .
4
Esta condición sirve para asegurarnos uqe la funcipon 1/f está definida en el intervalo I.
95

Corolario 4.1.26 (Lı́mite de un cociente). Sean f, g : I → R dos funciones definidas


en un intervalo I ⊂ R, tales que g(x) ̸= 0 para todo x ∈ I. Si x0 ∈ I¯ es un punto tal
que lı́m f (x) = L ∈ R y lı́m g(x) = L′ ̸= 0, entonces
x→x0 x→x0

f (x) L
lı́m = ′
x→x0 g(x) L

Demostración. Se sigue de la Proposición 4.1.23 y de la Proposición 4.1.24, observando


que f /g = f · (1/g).

4.1.5. Propiedades de monotonı́a

Lema 4.1.27 (Lı́mite de una función positiva o nula). Sea f : I → R una función
definida en un intervalo I ⊂ R. Si f es positiva o nula en I (es decir: |f (x)| ≥ 0 para
todo x ∈ I) y tiene lı́mite en un punto x0 ∈ I, ¯ entonces dicho lı́mite es positivo o
nulo: lı́m f (x) ≥ 0.
x→x0

Demostración. Sea L := lı́m f (x). Dado ϵ > 0, existe un radio δ > 0 tal que |f (x)−L| < ϵ
x→x0
para todo x ∈ E ∗ (x0 , δ) ∩ I. Eligiendo un punto x ∈ E ∗ (x0 , δ) ∩ I, se observa que

−L = 0 − L ≤ f (x) − L < ϵ

pues 0 ≤ f (x) por hipótesis. Ası́, demostramos que −L < ϵ para todo ϵ > 0. Luego −L ≤ 0,
es decir: L ≥ 0.

Observación 4.1.28. (1) De modo análogo, se demuestra que si f es negativa o nula


en I (es decir: f (x) ≤ 0 para todo x ∈ I) y tiene lı́mite en el punto x0 , entonces
lı́m f (x) ≤ 0.
x→x0

(2) ¡Cuidado! En el caso donde f (x) > 0 para todo x ∈ I (resp. f (x) < 0 para todo
x ∈ I), sólo se puede concluir que lı́m f (x) ≥ 0 (resp. lı́m f (x) ≤ 0). Un ejemplo
x→x0 x→x0
de una función estrictamente positiva con lı́mite nulo es dado por la función f de la
Observación 4.1.25 (1).

Más generalmente, se demuestra que:

Proposición 4.1.29 (Monotonı́a de los lı́mites). Sean f, g : I → R dos funciones


definidas en un mismo intervalo I ⊂ R. Si f (x) ≥ g(x) para todo x ∈ I, y si ambas
¯ entonces lı́m f (x) ≤ lı́m g(x).
funciones tienen lı́mites en un punto x0 ∈ I,
x→x0 x→x0
96

Demostración. Basta con aplicar el lema anterior con la función g − f (que es positiva o
nula en el intervalo I), observando que lı́m (g(x) − f (x)) = lı́m g(x) − lı́m f (x).
x→x0 x→x0 x→x0

El siguiente teorema, conocido como el teorema del sandwich5 , enuncia una propiedad
muy útil en la práctica para demostrar la existencia de un lı́mite:

Teorema 4.1.30 (Teorema del sándwich). Sean f, g1 , g2 : I → R tres funciones


definidas en un mismo intervalo I ⊂ R, y tales que g1 (x) ≤ f (x) ≤ g2 (x) para todo
x ∈ I. Si las funciones g1 y g2 tienen el mismo lı́mite L ∈ R en un punto x0 ∈ I, ¯
entonces la función f también tiene lı́mite L en el punto x0 :

g1 ≤ f ≤ g2 ∧ lı́m g1 (x) = lı́m g2 (x) = L ⇒ lı́m f (x) = L


x→x0 x→x0 x→x0

Demostración. Por hipótesis, existen funciones ϵ 7→ δϵ′ y ϵ 7→ δϵ′′ (de R+ en R+ ) tales que
∀x ∈ I, 0 < |x − x0 | < δϵ′ ⇒ |g1 (x) − L| < ϵ (∗1 )

∀x ∈ I, 0 < |x − x0 | < δϵ′′ ⇒ |g2 (x) − L| < ϵ (∗2 )


para toda precisión ϵ > 0. Queremos construir una función ϵ 7→ δϵ (de R+ en R+ ) tal que
∀x ∈ I, 0 < |x − x0 | < ⇒ |f (x) − L| < ϵ (∗)

para todo ϵ > 0. Para ello, se define δϵ := min(δϵ′ , δϵ′′ ) > 0 para todo ϵ > 0. En efecto, dados
una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 |δϵ , tenemos que

0 < |x − x0 | < δϵ′ , entonces |g1 (x) − L| < ϵ por (∗1 ), es decir: L − ϵ < g1 (x) < L + ϵ

0 < |x − x0 | < δϵ′′ , entonces |g2 (x) − L| < ϵ por (∗2 ), es decir: L − ϵ < g2 (x) < L + ϵ

Por lo tanto, tenemos que L − ϵ < g1 (x) ≤ f (x) ≤ g2 (x) < ϵ, es decir: |f (x) − L| < L + ϵ.
Lo que demuestra la condición (∗) para todo ϵ > 0, de tal modo que lı́m f (x) = L.
x→x0

Ejemplo 4.1.31 (Continuidad de la función logaritmo en el punto x0 = 1). En el capı́tulo


sobre las integrales, definimos la función
Z x
1
log(x) := dt
1 t

y demostramos en el Ejercicio 25 las desigualdades


1
1− ≤ log(x) ≤ x − 1
x
5
Según la analogı́a del sándwich, las funciones g1 y g2 representan las trayectorias de dos rebanadas de
pan que intentan capturar una loncha de jamón f . En Francia, este resultado también es conocido como el
teorema de los gendarmes, al ser g1 y g2 dos gendarmes que intentan detener a un ladrón f .
97

para todo x > 0. Usando las propiedades algebraicas de los lı́mites, se verifica inmediatamente
que  
1 1
lı́m 1 − = 1 − = 0 y lı́m x − 1 = 1 − 1 = 0
x→1 x 1 x→1

Por el teorema del sándwich, se deduce que lı́m log(x) = 0 = log(1). Por lo tanto, la función
x→1
logaritmo es continua en el punto x0 = 1.
Ejercicio 35. Sea f : R → R la función definida por
si x ∈ Q
(
x
f (x) =
−x si x ∈ /Q

(1) Verificar que −x ≤ f (x) ≤ x para todo x ∈ R.


(2) Dedudir (por el teorema del sándwich) que lı́m f (x) = 0 = f (0)
x→0

(3) ¿Existe un punto x0 ̸= 0 donde f tenga lı́mite?

4.1.6. Composición de lı́mites

Sea f : I → R y g : J → R dos funciones definidas en intervalos I, J ⊂ R, y tales que


f (x) ∈ J para todo x ∈ I (lo que escribiremos f (I) ⊂ J). En tal situación, se puede definir
la función compuesta g ◦ f : I → R por
(g ◦ f )(x) := g(f (x))
Ahora, se demuestra que:

Proposición 4.1.32 (Composición de lı́mites). Si la función f tiene lı́mite y0 en un


¯ con y0 ∈ J, y si la función g es continua en el punto y0 ∈ J (es decir:
punto x0 ∈ I,
lı́m g(y) = g(y0 )), entonces la función g ◦ f tiene lı́mite g(y0 ) en el punto x0 :
y→y0

lı́m (g ◦ f )(x) = lı́m g(f (x)) = g(y0 )


x→x0 x→x0

Demostración. Por hipótesis, existen funciones ϵ 7→ δϵ y ϵ 7→ δϵ′ (de R+ en R+ ) tales que:


∀x ∈ I, 0 < |x − x0 | < δϵ ⇒ |f (x) − y0 | < ϵ (∗)
∀y ∈ I, 0 < |y − y0 | < δϵ′ ⇒ |g(y) − g(y0 )| < ϵ (∗′ )
para toda precisión ϵ > 0. Queremos construir una función ϵ 7→ δϵ′′ (de R+ en R+ ) tal que
∀x ∈ I, 0 < |x − x0 | < δϵ′′ ⇒ |g(f (x)) − g(y0 )| < ϵ (∗∗′ )
para toda precisión ϵ > 0. Para ello, se define δϵ′′ := δδϵ′ para todo ϵ > 0. En efecto, dados
una precisión ϵ > 0 y un punto x ∈ I tal que 0 < |x − x0 | < δϵ′′ , tenemos que |f (x) − y0 | < δϵ′
por (∗), pues δϵ′′ = δδϵ′ . Ahora, se distinguen los siguientes dos casos:
98

Caso donde f (x) = y0 . En este caso, es obvio que |g(f (x)) − g(y0 )| = 0 < ϵ.

Caso donde f (x) ̸= y0 . En este caso, tenemos que 0 < |f (x) − y0 | < δϵ′ . Aplicando (∗′ )
al punto y = f (x) ∈ J, se deduce que |g(f (x)) − g(y0 )| < ϵ.

Ası́, en ambos casos vimos que |g(f (x)) − g(y0 )| < ϵ, lo que acaba de de demostrar la
condición (∗′′ ) para todo ϵ > 0. Por lo tanto: lı́m g(f (x)) = g(y0 ).
x→x0

Observación 4.1.33. (1) Los lectores habrán observado que, en la proposición anterior,
no sólo se supone que la función g tiene lı́mite en el punto y0 , sino también se supone
que dicho lı́mite es igual a g(y0 ) (es decir: que la función g es continua en el punto
y0 ). En efecto, la propiedad de composición no se cumple cuando la función g tiene
lı́mite sin ser continua en el punto y0 . Un contraejemplo sencillo es el siguiente: sean
f, g : R → R las funciones definidas por
(
1 si x = 0
f (x) = 0 y g(x) =
0 si x ̸= 0

Escribiendo x0 := 0 e y0 := 0, es claro que

lı́m f (x) = 0 = y0 y lı́m g(y) = 0


x→x0 y→y0

Sin embargo, tenemos que (g ◦ f )(x) = g(f (x)) = g(0) = 1 para todo x ∈ R, de tal
modo que g ◦ f tiene lı́mite 1 ̸= 0 en el punto x0 = 0.

(2) En la práctica, casi siempre usaremos la proposición anterior en el caso particular


donde las funciones f y g son conntinuas en los puntos x0 ∈ I e y0 := f (x0 ) ∈ I,
respectivamente:
Corolario 4.1.34 (Composición de lı́mites en el caso continuo). Sean f : I → R y g : J → R
dos funciones definidas en intervalos I, J ⊂ R, y tales que f (I) ⊂ J. Si la función f es
continua en un punto x0 ∈ I, y si la función g es continua en el punto y0 := f (x0 ) ∈ J,
entonces la función g ◦ f es continua en el punto x0 ∈ I.

Demostración. Inmediato por la Proposición 4.1.32.


Ejercicio 36 (Continuidad de la función logaritmo). En el Ejemplo 4.1.31, demostramos que
la función logaritmo es continua en el punto x0 = 1, es decir:

lı́m log(x) = 0 = log(1)


x→1

El objetivo de este ejercicio es demostrar que la función logaritmo es continua en todo punto
x0 > 0. Ası́, en lo que sigue se fija un número x0 > 0.

(1) Sea f : R+ → R+ la función definida por f (x) = x/x0 para todo x ∈ R+ . Verificar que
la función f es continua en el punto x = x0 , es decir: lı́m f (x) = f (x0 ) = 1.
x→x0
99

(2) Combinando el resultado del Ejemplo 4.1.31 con el corolario 4.1.34, deducir que la
función g : R+ → R definida por g(x) = log(f (x)) = log(x/x0 ) es continua en el punto
x0 .

(3) Usando la propiedad fundamental del logaritmo, verificar que log(x) = g(x) + log(x0 )
para todo x ∈ R+ , y deducir que la función logaritmo es continua en el punto x0 .

4.1.7. Generalización de la noción de lı́mite

En las secciones anteriores, vimos que la noción de lı́mite está ı́ntimamente vinculada con
la noción de entorno. Para precisar más este vı́nculo se introducen las siguientes notaciones:

Notaciones: Conjunto de los entornos de un número


Dado un número real a, se denota por

E(a) := E(a, ϵ) : ϵ ∈ R+ = (a − ϵ, a + ϵ) : ϵ ∈ R+
 

al conjunto formado por todos los entornos de número a, y por

E ∗ (a) := E ∗ (a, ϵ) : ϵ ∈ R+ = (a − ϵ, a) ∪ (a, a + ϵ) : ϵ ∈ R+


 

al conjunto formado por todos los entornos reducidos del mismo número. Por definición
las notaciones E(a) y E ∗ (a) designan conjuntos de conjuntos.

Dados una función f : I → R (definida en un intervalo I ⊂ R), un punto x0 ∈ I¯ y un


número L ∈ R, se recuerda que

lı́m f (x) = L ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − L| < ϵ


x→x0

⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ∈ E(L, ϵ)


⇔ ∀ϵ > 0, ∃δ > 0, f (E ∗ (x0 , δ) ∩ I) ⊂ E(L, ϵ)

Usando los conjuntos de entornos E(a) y E ∗ (a) definidos más arriba, se obtiene al final una
caracterización abstracta (y muy compacta) de la noción de lı́mite, que es la siguiente:

Observación 4.1.35 (Caracterización del lı́mite en términos de entornos abstractos). Dados


una función f : I → R, un punto x0 ∈ I¯ y un número L ∈ R, tenemos la equivalencia

lı́m f (x) = L ⇔ ∀F ∈ E(L), ∃E ∈ E ∗ (x0 ), f (E ∩ I) ⊂ F


x→x0

Es decir, intuitivamente:

Para todo entorno F de L, existe un entorno reducido E de x0 tal que f (E ∩ I) ⊂ F .


100

Desde el punto de vista de la teorı́a, el interés de esta caracterización abstracta es que


permite reemplazar las nociones de entornos definidas por los conjunto E(a) y E ∗ (a) por
otras nociones de entornos (definidas a partir de otros conjuntos de conjuntos) sin cambiar
el esquema general de la definición de lı́mite. Ası́, en lo siguiente, cada vez que necesite-
mos introducir una nueva noción de lı́mite (por ejemplo: los lı́mites infinitos, o los lı́mites
laterales), sólo tendremos que definir las nociones de entornos (llenos y reducidos) corres-
pondientes.

En lo que sigue, consideraremos las siguientes nociones de entornos además de la noción


usual definida a partir de los conjuntos E(a) y E ∗ (a):

Entornos de ±∞ Se llama entorno de +∞ a todo intervalo de la forma (L, +∞),


con L ∈ R. Ası́, el conjunto de los entornos (llenos o reducidos6 ) de +∞ está definido por:
E(+∞) = E ∗ (+∞) := {(L, +∞) : L ∈ R}
Del mismo modo, se llama entorno de −∞ a todo intervalo de la forma (−∞, L), con L ∈ R.
Ası́, el conjunto de los entornos de −∞ está definido por:
E(−∞) = E ∗ (−∞) := {(−∞, L) : L ∈ R}

Entornos laterales de un número a ∈ R Dados un número a ∈ R, se llama entorno


derecho del número a a todo intervalo de la forma (a, a + ϵ) con ϵ > 0. Ası́, el conjunto de
los entornos derechos (llenos o reducidos7 ) de a está definido por:
E(a+ ) = E ∗ (a+ ) := (a, a + ϵ) : ϵ ∈ R+


Del mismo modo, se llama entorno izquierdo del número a a todo intervalo de la forma
(a − ϵ, a), con ϵ > 0. Ası́, el conjunto de los entornos izquierdos de a está definido por:
E(a− ) = E ∗ (a− ) := (a − ϵ, a) : ϵ ∈ R+


Al final, se obtienen 5 nociones distintas de entornos llenos y reducidos:


Definición 4.1.36 (Conjuntos de entornos generalizados). Dado un número real a, se de-
finen los siguientes conjuntos de entornos generalizados (llenos y reducidos):

6
Como los pseudonúmeros ±∞ (que no son números reales) no pertenecen a ningún entorno de ±∞, las
nociones correspondientes de entorno lleno y de entorno reducido coinciden.
7
Igual que para los entornos de ±∞, las nociones de entorno lateral lleno y de entorno lateral reducido
coinciden. ¡Cuidado! Los sı́mbolos a+ y a− no son números, son notaciones cómodas para indicar el tipo de
entorno lateral considerado (derecho o izquierdo).
101

Estas 5 nociones de entornos inducen 5 × 5 = 25 nociones distintas de lı́mites:

Definición 4.1.37 (Lı́mite generalizado). Dados

una función f : I → R definida en un intervalo I ⊂ R,

un “punto generalizado” k = a, +∞, −∞, a+ , a− (con a ∈ R)

un “lı́mite generalizado” l = b, +∞, −∞, b+ , b− (con b ∈ R)

se define la noción de lı́mite correspondiente por:

lı́m f (x) = l ⇔ ∀F ∈ E(l), ∃E ∈ E ∗ (k), f (E ∩ I) ⊂ F


x→k

Observación 4.1.38. (1) La noción de punto generalizado no es más que una notación
cómoda para distinguir los 5 tipos de lı́mites que se pueden considerar en el dominio,
es decir:
x → a, x → +∞, x → −∞, x → a+ o x → a−
con a ∈ R. Del mismo modo, la noción de lı́mite generalizado no es más que una
notación cómoda para distinguir los 5 tipos de lı́mites que se pueden considerar en el
codominio:

f (x) → b, f (x) → +∞, f (x) → −∞, f (x) → b+ o f (x) → b−

con b ∈ R

(2) La definición de lı́mite generalizado sólo tiene sentido cuando todos los entornos redu-
cidos E ∈ E ∗ (k) del punto generalizado k = a, +∞, −∞, a+ , a− (con a ∈ R) intersectan
el intervalo I de definición de la función f , es decir: cuando

∀E ∈ E ∗ (k), E ∩ I ̸= ∅

En el caso particular donde k = a ∈ R (noción usual de lı́mite en el punto a), esta


condición significa que el punto a es adherente al intervalo I.

En lo siguiente, se estudian algunos casos particulares de lı́mites generalizados, dejando


las demostraciones a los lectores como ejercicios.
102

Lı́mites infinitos

Definición 4.1.39 (Lı́mites infinitos). Sea f : I → R una función definida en un


intervalo I ⊂ R. Dado un punto x0 ∈ I, ¯ se definen las notaciones lı́m f (x) = +∞ y
x→x0
lı́m f (x) = −∞ por:
x→x0

lı́m f (x) = +∞ ⇔ ∀F ∈ E(+∞), ∃E ∈ E ∗ (x0 ), f (E ∩ I) ⊂ F


x→x0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ f (x) > L

lı́m f (x) = −∞ ⇔ ∀F ∈ E(−∞), ∃E ∈ E ∗ (x0 ), f (E ∩ I) ⊂ F


x→x0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ f (x) < L

Cuando se trabaja con lı́mites finitos (L ∈ R) e infinitos (L = ±∞), es cómodo extender


la recta real con los dos pseudonúmeros −∞ y +∞:

Definición 4.1.40 (Recta real extendida). Se llama recta real extendida (o recta real
acabada) y se escribe R̄ o [−∞, +∞] al conjunto definido por:

R̄ = [−∞, +∞] := R ∪ {−∞, +∞}


(Recordemos que los pseudinúmeros −∞ y +∞ no son números reales.)

En este marco extendido, la propiedad de unicidad del lı́mite se generaliza del modo
siguiente:

Proposición 4.1.41 (Unicidad del lı́mite). Sean f : I → R una función definida en un


intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números reales extendidos L, L′ ∈ R̄: Si

lı́m f (x) = L y lı́m f (x) = L′


x→x0 x→x0

entonces L = L′ .

Ejercicio 37. Sea f : R → R la función definida por


(
0 six = 0
f (x) = 1
|x|
six ̸= 0

(1) Bosquejar la gráfica de la función f .

(2) Demostrar que la función f es continua en todo punto x0 ̸= 0.

(3) Usando la definición anterior, demostrar que lı́m f (x) = +∞.


x→0
103

Las propiedades algebraicas de los lı́mites se generalizan a los lı́mites infintos del modo
siguiente.
Proposición 4.1.42 (Lı́mite de una suma). Sean f, g : I → R dos funciones definidas en un
intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números reales extendidos L, L′ ∈ R̄. Si lı́m f (x) = L
x→x0
y lı́m g(x) = L′ , entonces el lı́mite de la función f + g en el punto x0 , cuando existe, está
x→x0
dado por la siguiente tabla (donde el sı́mbolo “?” indica un caso indeterminado):

Observación 4.1.43. En el caso indeterminado donde lı́m f (x) = +∞ y lı́m g(x) = −∞,
x→x0 x→x0
no se puede deducir nada sobre el lı́mite de la suma f + g en el punto x0 (ni siquiera si tal
lı́mite existe), ası́ como lo ilustra el siguiente ejercicio:
Ejercicio 38 (Indeterminación para la suma). En cada uno de los siguientes items, definir
dos funciones f, g : R → R que cumplen las siguientes condiciones:

(1) lı́m f (x) = +∞, lı́m g(x) = −∞ y lı́m (f (x) + g(x)) = +∞


x→0 x→0 x→0

(2) lı́m f (x) = +∞, lı́m g(x) = −∞ y lı́m (f (x) + g(x)) = −∞


x→0 x→0 x→0

(3) lı́m f (x) = +∞, lı́m g(x) = −∞ y lı́m (f (x) + g(x)) = L, con L ∈ R fijado
x→0 x→0 x→0

(4) lı́m f (x) = +∞ y lı́m g(x) = −∞ pero f + g no tiene lı́mite (finito ni infinito) en 0.
x→0 x→0

Proposición 4.1.44 (Lı́mite de un producto). Sean f, g : I → R dos funciones definidas


en un intervalo I ⊂ R, un punto x0 ∈ I¯ y dos números reales extendidos L, L′ ∈ R̄. Si
lı́m f (x) = L y lı́m g(x) = L′ , entonces el lı́mite de la función f g en el punto x0 , cuando
x→x0 x→x0
existe, está dado por la siguiente tabla (donde el sı́mbolo “?” indica un caso indeterminado):

Observación 4.1.45. En el caso indeterminado donde lı́m f (x) = ±∞ y lı́m g(x) = 0,


x→x0 x→x0
no se puede deducir nada sobre el lı́mite del producto f g en el punto x0 (ni siquiera si tal
lı́mite existe), ası́ como lo ilustra el siguiente ejercicio:
104

Ejercicio 39 (Indeterminación para el producto). En cada uno de los siguientes items, definir
dos funciones f, g : R → R que cumplen las siguientes condiciones:

(1) lı́m f (x) = +∞, lı́m g(x) = 0 y lı́m (f (x)g(x)) = +∞


x→0 x→0 x→0

(2) lı́m f (x) = +∞, lı́m g(x) = 0 y lı́m (f (x)g(x)) = −∞


x→0 x→0 x→0

(3) lı́m f (x) = +∞, lı́m g(x) = 0 y lı́m (f (x)g(x)) = L, con L ∈ R fijado
x→0 x→0 x→0

(4) lı́m f (x) = +∞ y lı́m g(x) = 0 pero f g no tiene lı́mite (finito ni infinito) en 0.
x→0 x→0

Proposición 4.1.46 (Lı́mite de la función 1/f ). Sea f : I → R una función definida en un


intervalo I ⊂ R, tal que f (x) ̸= 0 para todo x ∈ I. Dado un punto x0 ∈ I:
¯

 
1
1. Si lı́m f (x) = ±∞, entonces lı́m f (x)
= 0.
x→x0 x→x0
 
1
2. Si lı́m f (x) = 0, entonces lı́m |f (x)|
= +∞.
x→x0 x→x0

Observación 4.1.47. En el caso donde lı́m f (x) = 0, la proposición anterior sólo permite
x→x0
determinar el lı́mite de la función 1/|f | en el punto x0 (y, en este caso, dicho lı́mite es +∞).
Sin embargo, se puede deducir en muchos casos el lı́mite de la función 1/f en el punto x0 ,
estudiando el signo de la función f en un entorno de dicho punto.

Ejercicio de parcial

x−b
(Ejercicio 4 - primer parcial primer semestre 2018) Se considera f (x) = x2 −1
.
Si lı́mx→1 f (x) = c ∈ R, entonces b y c son:

A) b = 1, c = 1
1
B) b = 1, c = 2
1
C) b = 1, c = 4

D) Para todo b existe el lı́mite y se cumple b = c

E) Ningún par b, c cumple lo pedido



x−b
Solución. Dado que lı́mx→1 x2 − 1 = 0, para que exista lı́mx→1 x2 −1
y sea un número real

c, se debe cumplir que lı́mx→1 x − b = 0.

Entonces
√ √
lı́m x − b = 0 ⇔ lı́mx − lı́m b = 0 por linealidad
x→1 x→1 x→1

⇔ lı́m x = lı́m b
x→1 x→1
⇔1=b
105

Luego,
√ √
x−1 x−1
lı́m 2 = lı́m 2
x→1 x − 1 x→1 x − 1
√ √
x−b x+1
= lı́m 2 ·√
x→1 x − 1 x+1
x−1
= lı́m 2 √
x→1 (x − 1)( x + 1)
x
 −1
= lı́m √
x→1 (x− 1)(x + 1)( x + 1)


1
=
4
Por lo tanto, c = 14 .

Proposición 4.1.48. Sean f, g : I → R dos funciones definidas en un mismo intervalo


I ⊂ R, y un punto x0 ∈ I.
¯

(1) Si f (x) ≤ g(x) para todo x ∈ I, y si lı́m f (x) = +∞, entonces lı́m g(x) = +∞
x→x0 x→x0

(2) Si f (x) ≤ g(x) para todo x ∈ I, y si lı́m g(x) = −∞, entonces lı́m g(x) = −∞
x→x0 x→x0

Ejercicio 40. Demostrar la proposición anterior.

Lı́mites laterales

Definición 4.1.49 (Lı́mites laterales). Sean f : I → R una función definida en un


intervalo I ⊂ R y un número L ∈ R. Dado un punto x0 ∈ R tal que (x0 , x0 + ϵ) ⊂ I
para algún ϵ > 0, se definen los lı́mites laterales por la derecha en el punto x0 por:

lı́m+ f (x) = L ⇔ ∀F ∈ E(L), ∃E ∈ E ∗ (x+


0 ), f (E ∩ I) ⊂ F
x→x0

⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, x0 < x < x0 + δ ⇒ |f (x) − L| < ϵ

lı́m+ f (x) = +∞ ⇔ ∀F ∈ E(+∞), ∃E ∈ E ∗ (x+


0 ), f (E ∩ I) ⊂ F
x→x0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, x0 < x < x0 + δ ⇒ f (x) > L

lı́m f (x) = −∞ ⇔ ∀F ∈ E(−∞), ∃E ∈ E ∗ (x+


0 ), f (E ∩ I) ⊂ F
x→x+
0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, x0 < x < x0 + δ ⇒ f (x) < L


106

De modo análogo, dado un punto x0 ∈ R tal que (x0 − ϵ, x0 ) ⊂ I para algún ϵ > 0, se
definen los lı́mites laterales por la izquierda en el punto x0 por:

lı́m− f (x) = L ⇔ ∀F ∈ E(L), ∃E ∈ E ∗ (x−


0 ), f (E ∩ I) ⊂ F
x→x0

⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, x0 − δ < x < x0 ⇒ |f (x) − L| < ϵ

lı́m− f (x) = +∞ ⇔ ∀F ∈ E(+∞), ∃E ∈ E ∗ (x0 −), f (E ∩ I) ⊂ F


x→x0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, x0 − δ < x < x0 ⇒ f (x) > L

lı́m f (x) = −∞ ⇔ ∀F ∈ E(−∞), ∃E ∈ E ∗ (x−


0 ), f (E ∩ I) ⊂ F
x→x−
0

⇔ ∀L ∈ R, ∃δ > 0, ∀x ∈ I, x0 − δ < x < x0 ⇒ f (x) < L

Observación 4.1.50. En la definición anterior, cabe destacar que:

La noción de lı́mite por la derecha en el punto x0 (notación: x → x+


0 ) sólo tiene sentido
cuando la función f está definida en un intervalo de la forma (x0 , x0 + ϵ) para algún
ϵ > 0: (x0 , x0 + ϵ) ⊂ I. En efecto, esta condición nos asegura que todos los entornos
derechos del punto x0 intersectan el intervalo I, es decir: ∀E ∈ E ( x+ 0 ), E ∩ I ̸= ∅.

La noción de lı́mite por la izquierda en el punto x0 (notación: x → x− 0 ) sólo tiene


sentido cuando la función f está definida en un intervalo de la forma (x0 − ϵ, x0 ) para
algún ϵ > 0: (x0 − ϵ, x0 ) ⊂ I. En efecto, esta condición nos asegura que todos los
entornos izquierdos del punto x0 intersectan el intervalo I, es decir: ∀E ∈ E ∗ (x−0 ), E ∩
I ̸= ∅.

Las nociones de lı́mites laterales por la izquierda y por la derecha en un punto x0 tienen
esencialmente las mismas propiedades que la noción usual (bilateral) de lı́mite finito o infinito
en un punto x0 . Estas propiedades incluyen:

la unicidad del lı́mite

el lı́mite de una suma

el lı́mite de un producto

el lı́mite de la función 1/f

la monotonı́a de los lı́mites

el Teorema del sándwich


107

(Se deja a los lectores la tarea de adaptar los enunciados anteriores a los lı́mites laterales.)

Una propiedad importante de los lı́mites laterales es la siguiente:

Proposición 4.1.51 (Pegado de lı́mites laterales). Sea f ; I → R una función definida


en un intervalo I ⊂ R. Para todo punto x0 ∈ I ◦ interior al intervalo de definición y
para todo número real extendido L ∈ R̄, tenemos la equivalencia

lı́m f (x) = L ⇔ lı́m f (x) = L ∧ lı́m− f (x) = L


x→x0 x→x+ x→x0
0

Observación 4.1.52. En la práctica, la proposición anterior permite descomponer el estudio


del lı́mite de una función f : I → R en un punto interior x0 ∈ I ◦ del modo siguiente:

1. Determinar, si existe, el lı́mite L− := lı́m− f (x) (finito o infinito).


x→x0

2. Determinar, si existe, el lı́mite L+ := lı́m+ f (x) (finito o infinito).


x→x0

3. Si L− y L+ existen y son iguales, entonces lı́m f (x) = L− = L+ . Si no, la función f


x→x0
no tiene lı́mite (finito o infinito) en el punto x0 .

Ejercicio 41. Sea f : R → R la función definida por


(
1/x si x ̸= 0
f (x) =
0 si x = 0

1. Demostrar que lı́m+ f (x) = +∞.


x→0

2. Demostrar que lı́m− f (x) = −∞.


x→0

3. Deducir que la función f no tiene lı́mite (finito o infinito) en el punto 0.


108

Lı́mites en ±∞

Definición 4.1.53 (Lı́mites en ±∞). Sea f : I → R una función definida en un


intervalo I ⊂ R. Cuando el intervalo de definición I es de la forma I = R, I = (a, +∞)
o I = [a, +∞) para algún a ∈ R, se definen los lı́mites (finitos e infinitos) en +∞ por:

lı́m f (x) = L ⇔ ∀F ∈ E(L), ∃E ∈ E ∗ (+∞), f (E ∩ I) ⊂ F


x→+∞

⇔ ∀ϵ > 0, ∃K ∈ R, ∀x ∈ I, x > K ⇒ |f (x) − L| < ϵ

lı́m f (x) = +∞ ⇔ ∀F ∈ E(+∞), ∃E ∈ E ∗ (+∞), f (E ∩ I) ⊂ F


x→+∞

⇔ ∀L ∈ R, ∃K ∈ R, ∀x ∈ I, x > K ⇒ f (x) > L

lı́m f (x) = −∞ ⇔ ∀F ∈ E(−∞), ∃E ∈ E ∗ (+∞), f (E ∩ I) ⊂ F


x→+∞

⇔ ∀L ∈ R, ∃K ∈ R, ∀x ∈ I, x > K ⇒ f (x) < L

De modo análogo, cuando el intervalo de definición I es de la forma I = R, I = (−∞, a)


a I = (−∞, a] para algún a ∈ R, se definen los lı́mites (finitos e infinitos) en −∞ por:

lı́m f (x) = L ⇔ ∀F ∈ E(L), ∃E ∈ E ∗ (−∞), f (E ∩ I) ⊂ F


x→−∞

⇔ ∀ϵ > 0, ∃K ∈ R, ∀x ∈ I, x < K ⇒ |f (x) − L| < ϵ

lı́m f (x) = +∞ ⇔ ∀F ∈ E(+∞), ∃E ∈ E ∗ (−∞), f (E ∩ I) ⊂ F


x→−∞

⇔ ∀L ∈ R, ∃K ∈ R, ∀x ∈ I, x < K ⇒ f (x) > L

lı́m f (x) = −∞ ⇔ ∀F ∈ E(−∞), ∃E ∈ E ∗ (−∞), f (E ∩ I) ⊂ F


x→−∞

⇔ ∀L ∈ R, ∃K ∈ R, ∀x ∈ I,x < K ⇒ f (x) < L



Ejercicio 42. Usando la definición de lı́mite en +∞, demostrar que lı́m x = +∞
x→+∞

Como para las nociones de lı́mites laterales, las nociones de lı́mites en +∞ y −∞ tienen
esencialmente las mismas propiedades que la noción de lı́mite bilateral (finito o infinito) en
¯ Estas propiedades incluyen:
un punto x0 ∈ I.

la unicidad del lı́mite

el lı́mite de una suma

el lı́mite de un producto
109

el lı́mite de la función 1/f

la monotonı́a de los lı́mites

el Teorema del sándwich

(Se deja a los lectores la tarea de adaptar los enunciados anteriores a los lı́mites en ±∞.)

Ejercicio de parcial

(Ejercicio 4 - segundo semestre 2023) Indique cuánto vale el siguiente lı́mite:

1 x2 − 1
lı́m sen(1 − x) + − (x − 3)
x→+∞ x − 1 x−1
A) No existe B) 0 C) 2 D) 4 E) +∞

Solución. Por linealidad del lı́mite, tenemos que

1 x2 − 1 1 x2 − 1
lı́m sen(1 − x) + − (x − 3) = lı́m sen(1 − x) + lı́m − (x − 3)
x→+∞ x − 1 x−1 x→+∞ x − 1 x→+∞ x − 1

Calculemos estos dos lı́mites por separado.

Primero, dado que −1 ≤ sen(y) ≤ 1 para todo y ∈ R, tenemos que

−1 ≤ sen(1 − x) ≤ 1

para todo x ∈ R. Por lo tanto


1 1 1
− ≤ sen(1 − x) ≤
x−1 x−1 x−1
y, por el teorema del sandwich:
1 1 1
lı́m − ≤ lı́m sen(1 − x) ≤ lı́m
x→+∞ x−1 x→+∞ x−1 x→+∞ x−1
es decir
1
0 ≤ lı́m sen(1 − x) ≤ 0
x→+∞ x − 1
1
y, por lo tanto lı́mx→+∞ x−1
sen(1 − x) = 0.

Además,

x2 − 1 (x−1)(x

+ 1)
lı́m − (x − 3) = lı́m − (x − 3)

x→+inf ty x − 1 x→+∞  −1
x 

= lı́m (x + 1) − (x − 3)
x→+∞

x + 1 −
= lı́m  x+3=4
x→+∞
110

Luego,
1 x2 − 1 1 x2 − 1
lı́m sen(1 − x) + − (x − 3) = lı́m sen(1 − x) + lı́m − (x − 3)
x→+∞ x − 1 x−1 x→+∞ x − 1 x→+∞ x − 1

=0+4=4
Ejemplo 4.1.54 (Lı́mite de la función logaritmo en +∞). Queremos demostrar que
lı́m log(x) = +∞
x→+∞

Para ello, se considera un número L ∈ R, y se trata de hallar un número K ∈ R tal que


∀x > 0, x > K ⇒ log(x) > L
Se distinguen dos casos:

Caso donde L ≤ 0. En este caso, se elige K := 1, y se observa que para todo número
x > 1, tenemos que log(x) > log(1) = 0 ≥ L (usando la monotonı́a del logaritmo).
Caso donde L > 0. En este caso, se elige K := 2n , donde n es un entero natural tal
que n ≥ L/ log(2). (Tal entero existe por el principio de Arquı́medes.) En efecto, para
L
todo número x > 2n , tenemos que log(x) > log(2n ) = n log(2) ≥ log(2) · log(2) = L.

Ası́, para todo L ∈ R, logramos definir un número K > 0 tal que log(x) > L para todo
x > K. Por lo tanto: lı́m log(x) = +∞
x→+∞

Ejercicio 43. Deducir de lo anterior que lı́m+ log(x) = −∞. (Sugerencia: observar que para
x→0
todo x > 0, tenemos que log( x1 ) = − log(x).)
Ejercicio 44. Sea f : R → R la función definida por
x
f (x) =
1 + |x|

(1) Demostrar que la función f es continua en todo punto x0 ∈ R.


1
(2) Verificar que f (x) = 1 − 1+x
para todo x > 0, y deducir que lı́m f (x) = 1.
x→+∞

1
(3) Verificar que f (x) = 1+x
− 1 para todo x < 0, y deducir que lı́m f (x) = −1.
x→−∞

Ejercicio 45. Sea f : (a, +∞) → R (con a ∈ R) una función monótona creciente.

(1) Demostrar que si la función f está acotada superiormente en el intervalo (a, +∞),
entonces lı́m f (x) = L, donde L := sup {f (x) : x ∈ (a, +∞)}.
x→+∞

(2) Demostrar que si la función f no está acotada superiormente en el intervalo (a, +∞),
entonces lı́m f (x) = +∞.
x→+∞

(3) ¿Qué pasa cuando la función f es monótona decreciente?


111

4.2. Funciones continuas

4.2.1. Observación y definición

Se recuerda que una función f : I → R definida en un intervalo I ⊂ R es continua en


un punto x0 ∈ R cuando la función f tiene lı́mite igual a f (x0 ) en el punto x0 . Aplicando la
definición de lı́mite, se obtienen las siguientes equivalencias:

f continua en x0 ⇔ lı́m f (x) = f (x0 )


x→x0

⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)


⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, 0 < |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ϵ

Además, como el lı́mite considerado es el propio valor de la función f en el punto x0 , se


puede observar que:

Observación 4.2.1. Para toda precisión ϵ > 0 y para todo radio δ > 0, los enunciados

∀x ∈ E ∗ (x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)

y
∀x ∈ E(x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)
son equivalentes. En efecto, cuando x = x0 , siempre tenemos que f (x) = f (x0 ) ∈ E(f (x0 ), ϵ).
Por lo tanto, la condición f (x) ∈ E(f (x0 ), ϵ) se cumple para todos los puntos x ∈ E ∗ (x0 , δ)∩
I si y sólo si se cumple para todos los puntos x ∈ E(x0 , δ) ∩ I = (E + (x0 , δ) ∩ I) ∪ {x0 }.

Gracias a la observación anterior, se puede simplificar la definición de la noción de


continuidad en un punto, reemplazando los entornos reducidos por entornos llenos.

Proposición 4.2.2 (Continuidad en un punto). Sea f : I → R una función definida


en un intervalo I ⊂ R. Para todo x0 ∈ I, tenemos que

f continua en x0 ⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E(x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)


⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ϵ

Demostración. Obvio por la Observación 4.2.1.

En lo siguiente, usaremos sistemáticamente la caracterización anterior para estudiar la


continuidad de una función (en un punto o en un intervalo), lo que nos permitirá trabajar
sólo con entornos llenos, en el dominio (con entornos de la forma E(x0 , δ)) como en el
codominio (con entornos de la forma E(f (x0 ), ϵ)).
112

Definición 4.2.3. Se dice que una función f : I → R es continua en el intervalo I


cuando es continua en todo punto de I, es decir:

f continua en x0 ⇔ lı́m f (x) = f (x0 )


x→x0

⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ E(x0 , δ) ∩ I, f (x) ∈ E(f (x0 ), ϵ)


⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ϵ

4.2.2. Propiedades algebraicas

Ya vimos en la Sección 4.1 que:

toda función constante es continua


la función identidad x 7→ x es continua en R

la función raı́z cuadrada x 7→ x es continua en [0, +∞)
la función logaritmo x 7→ log(x) es continua en (0, +∞)
Ejercicio 46. Demostrar que la función x 7→ |x| es continua R.

Más generalmente, se verifica que:

Proposición 4.2.4 (Suma, resta, producto y cociente de funciones continuas). Si


f y g son funciones continuas en un intervalo I ⊂ R, entonces las funciones f + g
(suma), f − g (resta) y f g (producto) son continuas en I. Además, si f no se anula
en el intervalo I (es decir: si f (x) ̸= 0 para todo x ∈ I), entonces la función f /g
(cociente) también es continua en I.

Demostración. Se sigue inmediatamente de los resultados de la Sección 4.1.4.

En particular, es claro que

Toda función polinomial


n
X
f (x) = ai x i
i=0
con n ∈ N, a0 , . . . , an ∈ R, es continua en R.
Toda fracción racional
p(x)
f (x) =
q(x)
donde p(x) y q(x) son polinomios, es continua en todo intervalo donde el polinomio
q(x) no se anula.
113

Ejercicio de parcial

(Ejercicio 7 - primer parcial segundo semestre 2024) Consideremos la función


f : R → R definida como f (x) = 2x. Sabemos que la función tiene lı́mite en x = 1 y
vale 2, es decir que se cumple que

lı́m f (x) = 2
x→1

1
Si tomamos ϵ = 3
sabemos que

existe δ > 0 tal que para todo x ∈ E ∗ (1, δ) se cumple que f (x) ∈ E(f (1), ϵ)

Indicar el máximo valor de δ que cumple con lo que dice el recuadro.


1 1 2
(A) δ = 6
(C) δ = 4
(E) δ = 3
1 1 1
(B) δ = 3
(D) δ = 5
(F) δ = 2

Solución. Debido a que la función f (x) = 2x es continua en x para todo x ∈ R y en


particular para x = 1, tenemos que se cumple que

lı́m f (x) = f (1) = 2


x→1

Entonces, para todo ϵ > 0, existe δ > 0 tal que

x ∈ E ∗ (1, δ) ⇒ f (x) ∈ E(f (1), ϵ) (∗)

En particular, en este ejercicio fijamos ϵ = 31 y buscamos el máximo valor de δ tal que se


cumple (∗). Es decir, buscamos el máximo valor de δ > 0 tal que
1
|x − 1| < δ ⇒ |f (x) − 2| ≤
3
Tenemos que
1 1
|f (x) − 2| ≤ ⇔ |2x − 2| ≤
3 3
1
⇔ 2|x − 1| ≤
3
1
⇔ |x − 1| ≤
| {z } 6

Entonces el máximo valor que puede tomar δ es 61 .

Proposición 4.2.5 (Composición de funciones continuas). Si f es una función con-


tinua en un intervalo I ⊂ R, y si g es una función continua en un intervalo J ⊂ R tal
que f (I) ⊂ J, entonces la función compuesta g ◦ f es continua en el intervalo I.

Demostración. Se sigue inmediatemente del Corolario 4.1.34.


114

Ejercicio de parcial

(Ejercicio 2 - primer parcial primer semestre( 2024) Sean fa y g dos funciones


x − 5 si x < a
de R en R definidas por g(x) = x2 y fa (x) = . El valor de a que
x + 1 si x ≥ a
hace que la función g ◦ fa sea continua es:

A) 0 B) 1 C) 2 D) 3 E) 4

F) g ◦ fa no es continua para ningún valor de a

Solución. Tenemos que


(
(x − 5)2 si x < a
g ◦ fa (x) =
(x + 1)2 si x ≥ a
(
x2 − 10x + 25 si x < a
=
x2 + 2x + 1 si x ≥ a

Para todo a ∈ R, se tiene que g ◦ fa es continua en x para todo x ∈ (−∞, a) ∪ (a, +∞) ya
que en estos intervalos está dada por polinomios.

Falta ver que g ◦ fa sea continua a y para ello se debe verificar que

lı́m (g ◦ fa )(x) = (g ◦ fa )(a) = a2 + 2a + 1


x→a

El lı́mite lı́mx→a (g ◦ fa )(x) existe si existen y son iguales los lı́mites laterales:

lı́m (g ◦ fa )(x) = lı́m− x2 − 10x + 25 = a2 − 10a + 25


x→a− x→a

y
lı́m (g ◦ fa )(x) = lı́m+ x2 + 2x + 1 = a2 + 2a + 1
x→a+ x→a

Luego,

lı́m (g ◦ fa )(x) existe ⇔ a2 − 10a + 25 = a2 + 2a + 1


x→a
⇔ 24 = 12a
⇔a=2

Finalmente, cuando a = 2, tenemos lı́mx→2 (g ◦ f2 )(x) = 17 y (g ◦ f2 )(2) = 17. Entonces, el


valor de a que hace que la función g ◦ fa sea continua es a = 2.

Notamos que f2 no es continua y, sin embargo, g ◦ f2 lo es.


Ejercicio 47. Dada una función f : I → R definida en un intervalo I ⊂ R, se recuerda que
sus partes positiva y negativa son las funciones f + , f − : I → R definidas por
115

f + (x) = máx{0, f (x)} y f − (x) = máx{0, −f (x)}

para todo x ∈ I.

(1) Demostrar que si f es continua en I, entonces f + y f − son continuas en I.

(2) Deducir de lo anterior que si f y g son funciones continuas en un mismo intervalo


I ⊂ R, entonces las funciones h1 y h2 definidas por

h1 (x) = mı́n{f (x), g(x)} y h2 (x) = máx{f (x), g(x)}

para todo x ∈ I, son continuas en I. (Sugerencia: observar que h1 = f − (f − g)+ y


h2 = f + (g − f )+ .)

4.2.3. Valores intermedios

Intuitivamente, una función f : I → R definida en un intervalo I ⊂ R es continua cuando


su gráfica se puede trazar “sin levantar la mano”. En particular, parece claro que si dicha
función está definida en un intervalo cerrado [a, b], entonces su gráfica tiene que pasar al
menos una vez por cada valor intermedio λ entre f (a) y f (b):

El objetivo de esta sección es transformar esta intuición en un teorema cuya demostración


sólo depende de la definición formal de la noción de continuidad y de las propiedades de los
lı́mites que ya demostramos en las secciones anteriores.

Para ello, necesitaremos el siguiente lema, que expresa que si una función continua es
positiva (resp. negativa) en un punto de su intervalo de definición, entonces es positiva (resp.
negativa) en un entorno de dicho punto:
116

Lema 4.2.6. Sea f : I → R una función continua en un intervalo I ⊂ R. Para todo


punto x0 ∈ I:

(1) Si f (x0 ) > 0, entonces existe δ > 0 tal que f (x) > 0 para todo x ∈ E(x0 , δ) ∩ I.

(1) Si f (x0 ) < 0, entonces existe δ > 0 tal que f (x) < 0 para todo x ∈ E(x0 , δ) ∩ I.

Demostración.

(1) Supongamos que f (x0 ) > 0. Como f es continua en el punto x0 , existe un radio δ > 0
tal que |f (x) − f (x0 )| < f (x0 ) para todo x ∈ E(x0 , δ) ∩ I (considerando el radio
asociado a la precisión ϵ := f (x0 ) > 0). Esto implica que para todo x ∈ E(x0 , δ) ∩ I,
tenemos que f (x) − f (x0 ) > −f (x0 ), es decir: f (x) > 0.

(2) Análogo (ejercicio).

Gracias al lema anterior, se puede demostrar uns primera versión del teorema de los
valores intermedios, que es la siguiente:

Teorema 4.2.7 (Teorema de Bolzano). Sea f : [a, b] → R una función continua en


un intervalo cerrado [a, b] (con a < b). Si f (a) y f (b) son de distinto signo (no nulos),
entonces existe un punto c ∈ [a, b] tal que f (c) = 0.

Observación 4.2.8. Intuitivamente, el teorema de Bolzano expresa que si f (a) < 0 y


f (b) > 0, o si f (a) > 0 y f (b) < 0, entonces la gráfica de f intersecta el eje x en al menos
117

un punto, cuya abcisa c ∈ [a, b] constituye por construcción un cero8 de la función f . (Tal
cero no es necesariamente único, como se puede observar en la figura anterior.)

Demostración del Teorema de Bolzano. Supongamos, por ejemplo, que f (a) < 0 y
f (b) > 0. (La demostración del caso simétrico, donde f (a) > 0 y f (b) < 0 es análoga.) Se
considera el subconjunto A ⊂ [a, b] definido por A := {x ∈ [a, b] : f (x) < 0}. Por construc-
ción, tenemos que a ∈ A y b ∈ / A. Además, el conjunto A ⊂ [a, b] es no vacı́o y acotado,
entonces tiene supremo c := sup(A) ∈ [a, b]. Queremos demostrar que f (c) = 0. Para ello,
se demuestra (por el absurdo) que los dos casos f (c) < 0 y f (c) > 0 son imposibles.

Caso donde f (c) < 0. En este caso tenemos que c < b, pues f (b) > 0. Por el Lema
4.2.6, existe un radio δ > 0 tal que f (x) < 0 para todo x ∈ E(c, δ) ∩ [a, b]- Ahora se
considera el punto x := mı́n(c+ 2δ , b). Por construcción, tenemos que x ∈ E(c, δ)∩[a, b],
entonces f (x) < 0. Luego, tenemos que x ∈ A, entonces x ≤ c = sup(A). Pero esto es
absurdo, pues x > c por construcción. Por lo tanto, el caso f (c) < 0 es imposible.

Caso donde f (c) > 0. En este caso, tenemos que c > a, pues f (a) < 0. Por el lema 4.2.6,
existe un radio δ > 0 tal que f (x) > 0 para todo x ∈ E(c, δ) ∩ [a, b]. Además, como
c = sup(A), existe un punto x ∈ A tal que máx{a, c − δ} < x < c. Por construcción,
tenemos que x ∈ E(c, δ) ∩ [a, b], entonces f (x) > 0. Pero esto también es absurdo, pues
f (x) < 0, ya que x ∈ A. Por lo tanto, el caso f (c) > 0 es imposible.

En conclusión, ambos casos f (c) < 0 y f (c) > 0 son absurdos. Luego: f (c) = 0.

Ahora se puede demostrar el teorema de los valores intermeios en su forma más general:

Corolario 4.2.9 (Teorema de los valores intermedios). Sea f : [a, b] → R una función
continua en el intervalo [a, b] (con a < b). Entonces para todo valor intermedio λ entre
f (a) y f (b) (Es decir: un número λ ∈ R tal que f (a) ≤ λ ≤ f (b) o f (b) ≤ λ ≤ f (a)
según el caso), existe un punto c ∈ [a, b] tal que f (c) = λ.

Demostración. En el caso particular donde λ = f (a) o λ = f (b), basta con tomar c := a


o c := b según el caso. Ahora, se supone que λ ̸= f (a) y λ ̸= f (b), de tal modo que
f (a) < λ < f (b) o f (b) < λ < f (a) según el caso.. Se observa que la función g : [a, b] → R
definida por g(x) = f (x) − λ cumple las hipótesis del teorema de Bolzano. Entonces existe
un punto c ∈ [a, b] tal que g(c) = 0, es decir: tal que f (c) = λ.

Corolario 4.2.10. Si f : I → R es una función continua definida en un intervalo I ⊂


R, entonces la imágen f (I) del intervalo I por la función f también es un intervalo.

Demostración. Se trata de demostrar que el subconjunto f (I) ⊂ R cumple la condición

∀y1 , y2 ∈ f (I), ∀y ∈ R, y1 < y < y2 ⇒ y ∈ f (I)


8
Recordemos que un cero de una función f es cualquier número c ∈ dom(f ) tal que f (c) = 0.
118

Para ello, se consideran elementos y1 , y2 ∈ f (I) e y ∈ R tales que y1 < y < y2 . Como
y1 , y2 ∈ f (I), existen dos números x1 , x2 ∈ I tales que y1 = f (x1 ) y y2 = f (x2 ). Es claro que
x1 ̸= x2 , ya que f (x1 ) ̸= f (x2 ). Se distinguen los siguientes dos casos:

Caso donde x1 < x2 . Por el teorema de los valores intermedios aplicado a la función
f [x1 ,x2 ] : [x1 , x2 ] → R y al valor intermedio λ := y, existe un punto x ∈ [x1 , x2 ] tal que
f (x) = y. Y como x ∈ I, deduce que y = f (x) ∈ f (I).

Caso donde x1 > x2 . El razonamiento es análogo (basta con intercambiar x1 y x2 ).

Observación 4.2.11. El corolario anterior expresa que la imagen de un intervalo de R


por una función continua siempre es un intervalo R. ¡Cuidado! El intervalo imagen no es
necesariamente un intervalo del mismo tipo que el intervalo inicial; por ejemplo, la imagen
de un intervalo abierto (o semiabierto) puede ser cerrado (o abierto, o semiabierto, etc.).
Sin embargo, veremos en la siguiente sección que la imágen de un intervalo cerrado [a, b]
por una función continua f siempre es un intervalo cerrado [c, d] (con c ≤ d).

Ejercicio 48. Sea I = (0, 1). Definir funciones continuas f1 , f2 , f3 , f4 : I → R tales que

f1 (I) = [0, 1], f2 (I) = (0, 1], f1 (I) = [0, +∞), f4 (I) = R

4.2.4. Extremos absolutos

Definición 4.2.12 (Extremos absolutos). Sea f : I → R una función definida en un


intervalo I ⊂ R. Se dice que un punto P = (x0 , f (x0 )) de la gráfica de f es:

un mı́nimo absoluto de f cuando f (x0 ) ≤ f (x) para todo x ∈ I

un máximo absoluto de f cuando f (x0 ) ≥ f (x) para todo x ∈ I

un extremo absoluto de f cuando P es un mı́nimo absoluto o un máximo absoluto


de f .

Además, se dice que la función f tiene un mı́nimo absoluto (resp. un máximo absoluto,
un extremo absoluto) en el punto x0 ∈ I cuando el punto9 (x0 , f (x0 )) es un mı́nimo absoluto
(resp. un máximo absoluto, un extremo absoluto) de la función f .

Observación 4.2.13. (1) Una función f : I → R puede tener cero, uno o múltiples mı́ni-
mos absolutos (resp. máximos absolutos, extremos absolutos). Por ejemplo, en la si-
guiente figura, los puntos (x0 , f (x0 )) y (x2 , f (x2 )) son máximos absolutos de la función
bosquejada, mientras los puntos (x1 , f (x1 )) y (x3 , f (x3 )) son mı́nimos absolutos:
9
¡Cuidado! Aquı́ se usa la palabra punto con dos sentidos distintos: para designar un elemento x0 ∈ I
(punto unidimensional), o para designar un punto (x0 , f (x0 )) de la gráfica de f (punto bidimensional).
119

(2) Más generalmente, se observa que:

una función f : I → R tiene un mı́nimo absoluto en (x0 , f (x0 )) si y sólo si su


conjunto imagen f (I) tiene mı́nimo m := mı́n(f (I)) = f (x0 ) (en el sentido de
los conjuntos)
una función f : I → R tiene un máximo absoluto en (x0 , f (x0 )) si y sólo si su
conjunto imagen f (I) tiene máximo M := máx(f (I)) = f (x0 ) (en el sentido de
los conjuntos)

El objetivo de esta sección es demostrar que toda función continua definida en un inter-
valo cerrado [a, b] (con a < b) tiene (al menos) un mı́nimo absoluto y un máximo absoluto.
Antes de demostrar este resultado importante, se necesita verificar que:

Proposición 4.2.14. Si f : [a, b] → R es una función continua definida en un inter-


valo cerrado [a, b] (con a < b), entonces f está acotada en dicho intervalo.

Demostración. Se considera el conjunto A ⊂ [a, b] definido por

A := {c ∈ [a, b] : f está acotada en [a, b]}


= {c ∈ [a, b] : ∃Mc ≥ 0, ∀x ∈ [a, c], |f (x)| ≤ Mc }

Por construcción, el conjunto A ⊂ [a.b] está acotado y no es vacı́o, pues a ∈ A. (En efecto,
la función f está trivialmente acotada en el intervalo [a, a] = {a}.) Luego A tiene supremo
s := sup(A). Queremos demostrar que s = b ∈ A. Para ello, se observa lo siguiente:

(1) Como la función f es continua en el punto s, f está acotada en un entorno del punto
s (por la Proposición 4.1.21), lo que significa que existen Ms ≥ 0 y δ > 0 tales que
|f (x)| ≤ Ms para todo punto x ∈ E(s, δ) ∩ [a, b].

(2) Además, como s = sup(A), existe un punto c ∈ A tal que s − δ < c ≤ s, y por
definición del conjunto A, sabemos que la función f está acotada en el intervalo [a, c],
lo que significa que existe Mc ≥ 0 tal que |f (x)| ≤ Mc para todo punto x ∈ [a, c].

(3) Sea s′ = mı́n(s + 2δ , b). Por construcción, tenemos que s′ ∈ E(s, δ) ∩ [a, b], y dado que
c ∈ E(s, δ) ∩ [a, b] (pues s − δ < c ≤ s), se deduce que [c, s′ ] ⊂ E(s, δ) ∩ [a, b]. Por (1),
esto implica que |f (x)| ≤ Ms para todo punto x ∈ [c, s′ ].
120

(4) Agregando los resultados obtenidos en los ı́tems (2) y (3), se deduce que

|f (x)| ≤ máx {Mc , Ms }

para todo x ∈ [a, s′ ] = [a, c] ∪ [c, s′ ]. Por lo tanto, f está acotada en el intervalo [a, s′ ],
lo que demuestra que s′ ∈ A.

(5) Como s′ ∈ A, tenemos que s′ ≤ s = sup(A). Por otro lado, tenemos que s + 2δ ≥ s y
b ≥ s, de tal modo que s′ = mı́n s + 2δ , b ≥ s. Luego: s = s′ . Ahora, se observa que
s′ = s < s + 2δ . Entonces s′ ̸= s + 2δ , lo que implica finalmente que s = s′ = b.

En los ı́tems (4) y (5), demostramos que s = s′ = b ∈ A. Por definición del conjunto A, esto
implica que la función f está acotada en el intervalo [a, b].

Observación 4.2.15. La proposición anterior expresa que la imagen f ([a, b]) = {f (x) : x ∈ [a, b]}
de un intervalo [a, b] por una función continua f : [a, b] → R siempre es un conjunto acotado,
lo que implica que dicho conjunto tiene ı́nfimo y supremo:

ı́nf(f, [a, b]) = ı́nf {f (x) : x ∈ [a, b]}

sup(f, [a, b]) = sup {f (x) : x ∈ [a, b]}


Ahora, se trata de demostrar que la función f siempre alcanza ambos números ı́nf(f, [a, b])
y sup(f, [a, b]) en el intervalo [a, b].

Teorema 4.2.16 (Weierstrass). Si f : [a, b] → R es una función continua definida en


un intervalo cerrado [a, b] (con a < b), entonces f tiene mı́nimo y máximo absolutos.
Es decir: existen dos puntos x0 , x1 ∈ [a, b] tales que f (x0 ) ≤ f (x) ≤ f (x1 ) para todo
x ∈ [a, b].
121

Demostración.

(Existencia de un máximo absoluto.) Como la función f está acotada en [a, b] por


la Proposición 4.2.14, se escribe M := sup(f, [a, b]) y se define la función g : [a, b] → R por:

g(x) = sup(f, [a, x])

para todo x ∈ [a, b]. Por construcción es claro que:

(1) La función g es monótona creciente en el intervalo [a, b].


En efecto, dados dos números x, x′ ∈ [a, b] tales que x ≤ x′ , tenemos que [a, x] ⊂ [a, x′ ],
entonces sup(f, [a, x]) ≤ sup(f, [a, x′ ]), es decir: g(x) ≤ g(x′ ).

(2) g(a) = sup(f, [a, a]) = f (a) y g(b) = sup(f, [a, b]) = M .

Ahora se considera el conjunto S ⊂ [a, b] definido por S := {x ∈ [a, b] : g(x) = M }. Como


S ⊆ [a, b] está acotado y no es vacı́o (pues b ∈ S), tiene ı́nfimo x1 := ı́nf(S). Se observa que:

Para todo x ∈ [a, b] tal que x ≤ x1 , tenemos que x ∈


/ S, entonces g(x) < M .

Para todo x ∈ [a, b] tal que x > x1 , existe un elemento x′ ∈ S tal que x1 < x′ < x. Por
la monotonı́a de g, se deduce que g(x) ≥ g(x′ ) = M (pues x′ ∈ S), entonces g(x) = M .

Por lo tanto, el conjunto S es un intervalo de la forma S = (x1 , b] o S = [x1 , b].

Queremos demostrar que f (x1 ) = M . Para ello, se supone (por el absurdo) que f (x1 ) < M .
Sea ϵ := M −f2 (x1 ) > 0. Como la función f es continua en el punto x1 , existe un radio
δ > 0 tal que |f (x) − f (x1 )| < ϵ para todo punto x ∈ E(x1 , δ) ∩ [a, b]. Entonces, para todo
x ∈ E(x1 , δ) ∩ [a, b], tenemos que f (x) − f (x1 ) < ϵ, es decir:

f (x1 ) + M
f (x) < f (x1 ) + ϵ = =M +ϵ
2

pues ϵ = M −f2 (x1 ) . Ahora se definen los números x− δ + δ


 
1 := máx a, x1 − 2 y x1 := mı́n x1 + 2 , b .
122

Por construcción, tenemos que [x− +


1 , x1 ] ⊂ E(x1 , δ) ∩ [a, b], entonces f (x) < M − ϵ para todo
x ∈ [x− + − +
1 , x1 ], lo que implica que sup(f, [x1 , x1 ]) ≤ M − ϵ. Por lo tanto, tenemos que:
− −
g(x+ + +
1 ) = sup(f, [a, x1 ]) = sup(f, [a, x1 ] ∪ [x1 , x1 ])
= máx sup(f, [a, x− − +

1 ]), sup(f, [x1 , x1 ])
= máx g(x1 ), sup(f, [x−
 − +
1 , x1 ])
≤ máx g(x−

1 ), M − ϵ

Se distinguen los siguientes tres casos:

Caso donde a = x1 < b. En este caso, tenemos que a = x− +


1 = x1 < x1 ≤ b, de tal
+ + − +
modo que g(x1 ) = sup(f, [a, x1 ]) = sup(f, [x1 , x1 ]) ≤ M − ϵ. Por otro lado, tenemos
que x+ +
1 > x1 , entonces x1 ∈ S y g(x1 ) = M , lo que es absurdo.

Caso donde a < x1 = b. En este caso, tenemos que a ≤ x− +


1 < x1 = x1 = b, entonces
− − + −
x1 ∈/ S y g(x1 ) < M , de tal modo que g(x1 ) ≤ máx g(x1 ), M − ϵ < M . Por otro
lado, tenemos que x+ +
1 = b, entonces g(x1 ) = g(b) = M , lo que es absurdo

Caso donde a < x1 < b. En este caso, tenemos que a ≤ x− +


1 < x1 < x1 = b, entonces
− − + −
x1 ∈/ S y g(x1 ) < M , de tal modo que g(x1 ) ≤ máx g(x1 ), M − ϵ < M . Por otro
lado, tenemos que x+ + +
1 > x1 , entonces x1 ∈ S y g(x1 ) = M , lo que es absurdo.

En todos los casos, llegamos a una contradicción, lo que demuestra que la hipótesis f (x1 ) <
M es absurda. Por lo tanto, tenemos que f (x1 ) = M .

(Existencia de un mı́nimo absoluto.) Se observa que la función −f también es continua


en el intervalo [a, b]. Por lo anterior, −f tiene un máximo absoluto (x0 , −f (x0 )), lo que
implica inmediatamente que el punto (x0 , f (x0 )) es un mı́nimo absoluto de la función f .

Una consecuencia obvia del teorema de Weirstrass (combinado con el Corolario 4.2.10)
es que la imagen de un intervalo cerrado por una función continua es un intervalo cerrado:

Corolario 4.2.17. Si f : [a, b] → R es una función continua definida en un intervalo


cerrado [a, b] (con a < b), entonces la imagen del intervalo [a, b] por f también es un
intervalo cerrado:
f ([a, b]) = [m, M ]
donde m := mı́n(f, [a, b]) y M := máx(f, [a, b]).
123

4.2.5. Funciones inversas

Se recuerda que una función f : A → R definida en un subconjunto A ⊂ R es:

estrictamente creciente cuando ∀x, x′ ∈ A, x < x′ ⇒ f (x) < f (x′ )

estrictamente decreciente cuando ∀x, x′ ∈ A, x < x′ ⇒ f (x) > f (x′ )

Es claro que toda función estrictamente creciente (resp. estrictamente decreciente) es


monótona creciente (resp. monótona creciente), pero el recı́proco es falso.

Se demuestra el siguiente resultado:

Proposición 4.2.18 (Función inversa de una función estrictamente decreciente o


decreciente). Sea f : A → R una función definida en un subconjunto A ⊂ R. Si f es
estrictamente creciente (resp. estrictamente decreciente) en A, entonces f es inyectiva
y define una biyección entre A y su imagen B := f (A). Además, la función inversa
f −1 : B → A definida por

f −1 (y) = el único x ∈ A tal que f (x) = y

es una función estrictamente creciente (resp. estrictamente decreciente) en B.

Demostración. Se considera sólo el caso donde f es estrictamente creciente; el caso donde


f es estrictamente decreciente es análogo. Se observa que:

f es inyectiva. En efecto, dados x, x′ ∈ A tales que x ̸= x′ :

ˆ o bien tenemos que x < x′ , entonces f (x) < f (x′ ), y luego f (x) ̸= f (x′ )
ˆ o bien tenemos que x > x′ , entonces f (x) > f (x′ ), y luego f (x) ̸= f (x′ )

En todos los casos, x ̸= x′ implica que f (x) ̸= f (x′ ).

f define una biyección entre A y su imágen B := f (A). En efecto, cada elemento


y ∈ f (A) tiene al menos una preimagen por la función f (por definición de la imagen
f (A)), y como f es inyectiva, dicha preimagen es única.

La función inversa f −1 : B → A es estrictamente creciente. Sean y, y ′ ∈ B tales


que y < y ′ . Se escriben x := f −1 (y) y x′ := f −1 (y ′ ); por construcción, tenemos que
y = f (x) e y ′ = f (x′ ). Si tuviéramos que x ≤ x′ , tendrı́amos que f (x) ≥ f (x′ ) (pues f
es monótona creciente), es decir: y ≥ y ′ , lo que es absurdo. Luego, x < x′ .

En el caso particular donde la función considerada es una función continua f : I →


R definida en un intervalo I ⊂ R, sabemos por el Corolario 4.2.10, que su imagen J :=
124

f (I) también es un intervalo. Cuando, además, la función f es estrictamente creciente o


estrictamente decreciente en I, tenemos el siguiente teorema:

Teorema 4.2.19 (Función inversa de una función continua estrictamente creciente


o decreciente). Sea f : I → R una función definida en un intervalo I ⊂ R. Si f es
continua y estrictamente creciente (resp. continua y estrictamente decreciente) en I,
entonces f define una biyección entre el intervalo I y su imagen J := f (I). Además,
la función inversa f −1 : J → I es continua y estrictamente creciente (resp. continua
y estrictamente decreciente) en I.

Demostración. Sólo se considera el caso donde f es estrictamente creciente (el caso donde
f es estrictamente decreciente es análogo). Recordemos que sólo se consideran funciones
definidas en un intervalo cuyo interior no es vacı́o, lo que significa que I ◦ ̸= ∅10 . Por la
proposición 4.2.18, ya sabemos que la función f define una biyección entre el intervalo I y
su imagen J := f (I), y que la función inversa f −1 : J → I es estrictamente creciente. Para
demostrar que f −1 es continua, se considera un punto y0 ∈ I, y se escribe x0 := f −1 (y0 ).
Dada una precisión ϵ > 0, se trata de construir un radio δ > 0 tal que

∀y ∈ J, |y − y0 | < δ ⇒ |f −1 (y) − x0 | < ϵ (∗)

Para ello, se consideran los siguientes tres casos:

Caso donde x0 es un punto interior de I (es decir: x0 ∈ I ◦ ). En este caso, existen dos
puntos x− + − + −
0 , x0 ∈ I tales que x0 − ϵ < x0 < x0 < x0 < x0 + ϵ. Se escriben y0 := f (x0 )
+ + − +
e y0 := f (x0 ). Como f es estrictamente creciente, tenemos que y0 < y0 < y0 . Ahora,
+ +

se considera el radio δ > 0 definido por δ := mı́n y0 − y0 , y0 − y0 > 0. Dado un
punto y ∈ I tal que |y − y0 | < δ, se observa que

y < y0 + δ ≤ y0 + (y0+ − y0 ) = y0+


10
Como la función continua f es estrictamente creciente, se puede demostrar que el intervalo imagen
J := f (I) también cumple la condición J ◦ ̸= ∅ ( es decir: el interior del intervalo J no es vacı́o), De modo
sorprendente, nunca se usará esta información en el razonamiento que sigue.
125

pues δ ≤ y0+ − y0 , e
y > y0 − δ ≥ y0 − (y0 − y0− ) = y0−
pues δ ≤ y0 − y0− de tal modo que y0− < y < y0+ . Como f −1 es estrictamente creciente,
se deduce que
x0 − ϵ < x−
0 = f
−1 −
(y0 ) < f −1 (y) < f −1 (y0+ ) = x+
0 < x0 + ϵ

lo que demuestra que |f −1 (y) − x0 | < ϵ.


Caso donde x0 = mı́n(I) (es decir: x0 es el extremo inferior del intervalo I). En este
caso, existe un punto x+ + + +
0 ∈ I tal que x0 < x0 < x0 +ϵ. Se escribe y0 := f (x0 ) (tenemos
+ +
que y0 = f (x0 ) > f (x0 ) = y0 pues f es estrictamente creciente), y se define el radio
δ > 0 por δ := y0+ − y0 > 0. Dado un punto y ∈ I tal que |y − y0 | < δ, se observa que
y < y0 + δ = y0 + (y0+ − y0 ) = y0+
y, como f −1 es creciente, se deduce que
x0 ≤ f −1 (y) < f −1 (y0+ ) = x+
0 < x0 + ϵ

lo que demuestra que |f −1 (y) − x0 | < ϵ.


Caso donde x0 = máx(I) (es decir: x0 es el extremo superior del intervalo I). Este caso
es simétrico al caso anterior (ejercicio: redactar la demostración correspondiente).

En todos los casos, logramos definir un radio δ > 0 que cumple la condición (∗). Por lo
tanto, la función inversa f − : J → I es continua en el punto y0 ∈ J.
Ejemplo 4.2.20 (Función raı́z n-ésima). (1) Dado un entero n ≥ 1, se considera la fun-
ción f : [0, +∞) → [0, +∞) definida por f (x) = xn . Se verifica fácilmente que:
La función f es continua y estrictamente creciente en [0, +∞).
f (0) = 0 y lı́m f (x) = +∞, lo que implica que la imagen del intervalo [0, +∞)
x→+∞
por la función f es el intervalo [0, +∞).
Por el Teorema 4.2.19, la función f define una biyección entre [0, +∞) y [0, +∞),
y la función inversa f −1 : [0, +∞) → [0, +∞) es continua y estrictamente creciente
en el intervalo
√ [0, +∞). Dicha función inversa se llama la función raı́z n-ésima, y se
escribe x := f −1 (x) para todo x ∈ [0, +∞). Por construcción, tenemos que
n

√ √ n
n
xn = f −1 (f (x)) = x y ( n x) = f (f −1 (x)) = x

para todo x ≥ 0.
(2) En el caso donde el entero n es impar, se puede reemplazar el intervalo [0, +∞) por
R, pues la función f : R → R definida por f (x) = xn es estrictamente creciente en R.
√ biyección entre R y R, lo que permite extender
En este caso, la función f define una
la definición de la raı́z n-ésima n x := f −1 (x) a todos los números reales. Como
anteriormente, la función raı́z n-ésima (extendida a R) es continua y estrictamente
creciente en R.
126

Ejercicio 49 (Propiedades de la raı́z n-ésima). Sean enteros n, m ≥ 1 y p ∈ N.

(1) Demostrar las siguientes igualdades para todos x, y ≥ 0:


√ √ √
(a) n xy = n x n y
√ √ p
(b) n xp = ( n x)
√ √ n
(c) n xn = ( n x) = x
p√ p√ √
(d) n m x = m n x = nm x

(2) Verificar que cuando los enteros n, m ≥ 1 son impares, las igualdades anteriores se
cumplen para todos los números y, y ∈ R

Ejemplo 4.2.21. Vimos que la función log : R+ → R+ es estrictamente creciente y continua


en R+ (Ejercicio 36). Además, vimos en el Ejemplo 4.1.54 y en el Ejercicio 43 que

lı́m log(x) = −∞ y lı́m log(x) = +∞


x→0+ x→+∞

lo que implica que la imagen de R+ por la función logaritmo es el intervalo (−∞, +∞) = R.
Por lo tanto, la función logaritmo define una biyección entre R+ y R, cuya función inversa se
llama la función exponencial y se escribe exp. Por el Teorema 4.2.19, la función exp: R → R+
es continua y estrictamente creciente en R.

Ejercicio 50 (Propiedades de la función exponencial).

(1) Usando la definición de la función exponencial (exp(x) = log−1 (x) para todo x ∈ R) y
la propiedad fundamental del logaritmo (log(xy) = log(x)+log(y) para todos x, y > 0),
demostrar las siguientes igualdades para todos x, y ∈ R;
127

(a) exp(0) = 1
(b) exp(x + y) = exp(x) exp(y)
1
(c) exp(−x) = exp(x)

(2) Se define la constante e por e := exp(1) ≈ 2, 718. Demostrar por inducción completa
que exp(n) = en para todo n ∈ N. Usando la relación exp(−x) = exp(x)1
, demostrar
más generalmente que exp(n) = e para todo n ∈ Z.
n

Observación 4.2.22. Por analogı́a con la igualdad exp(n) = en , se escribre más general-
mente ex := exp(x) para todo número x ∈ R. Con esta notación, las igualdades del Ejercicio
50 se escriben

(a) e0 = 1
(b) ex+y = ex ey
(c) e−x = 1
ex

para todos x, y ∈ R.
Ejercicio 51 (Potencia generalizada). Las funciones logaritmo y exponencial permiten definir
la notación xy para todos los números x > 0 r y ∈ R, escribiendo
xy := ey log(x) = exp(y log(x))

(1) Demostrar que para todos x > 0 y n ∈ N, el número xn definido por xn := en log(x) es
igual a la potencia xn definida del modo usual. (Sugerencia: demostrar por inducción
completa que la propiedad se cumple para todo n ∈ N, y extender la propiedad a todo
n ∈ Z usando la relación e−y = e1y .)
(2) Demostrar las siguientes igualdades para todos x, x′ > 0 e y, y ′ ∈ R:
(a) x0 = 1y = 1
(b) x1 = x
(c) x−1 = 1
x
′ ′
(d) xy+y = xy xy
1 y
(e) x−y = 1

xy
= x
′ ′ ′
(f) (xy )y = (xy ) = xyy y

(g) (xx′ )y = xy (x′ )y


(3) Dado α ∈ R fijado, se considera la función f ; R+ → R+ definida por f (x) = xα =
eα log(x) para todo x > 0. Verificar que la función f es continua, y demostrar que:
f es estrictamente creciente cuando α > 0
f es constante cuando α = 0
f es estrictamente decreciente cuando α < 0
128

4.2.6. Función continua definida por una integral

Recordemos que una función f : I → R definida en un intervalo I ⊂ R es localmente


integrable cuando es integrable en cualquier intervalo cerrado [a, b] ⊂ I (con a < b)11 . En
el capı́tulo sobre integrales, vimos que cada función monótona (creciente o decreciente) es
localmente integrable en su intervalo de definición.

Lema 4.2.23. Si f : I → R es una función localmente integrable en un intervalo I ⊂ R,


entonces para todo punto x0 ∈ I, la función f está acotada en un entorno del punto x0 .

Demostración. Se distinguen los siguientes tres casos:

Caso donde x0 es un punto interior de I (es decir: x0 ∈ I ◦ ). En este caso, existe un


radio δ > 0 tal que [x0 − δ, x0 + δ] ⊂ I. Como la función f es integrable en el intervalo
[x0 − δ, x0 + δ], está acotada en dicho intervalo. Y como

E(x0 , δ) ∩ I = (x0 − δ, x0 + δ) ⊂ [x0 − δ, x0 + δ]

se deduce que la función f está acotada en el entorno de centro x0 y de radio δ.

Caso donde x0 = mı́n(I) (es decir: x0 es el extremo inferior del intervalo I). En este
caso, existe un radio δ > 0 tal que [x0 , x0 + δ] ⊂ I. Como la función f es integrable en
el intervalo [x0 , x0 + δ], está acotada en dicho intervalo. Y como

E(x0 , δ) ∩ I = [x0 , x0 + δ) ⊂ [x0 , x0 + δ]

se deduce que la función f está acotada en el entorno de centro x0 y de radio δ.

Caso donde x0 = máx(I) (es decir: x0 es el extremo superior del intervalo I). Este caso
es análogo al caso anterior.

Proposición 4.2.24. Sea f : I → R una función definida en un intervalo I ⊂ R y


localmente integrable en I. Para todo punto a ∈ I, la función F : I → R definida por
Z x
F (x) = f (t)dt
a

es continua en el intervalo I.

Demostración. Sea x0 ∈ I. Por el lema anterior, sabemos que la función f está acotada
en un entorno del punto x0 , lo que significa que existen un radio δ > 0 y un número M ≥ 0
11
En el caso particular donde el intervalo I ya es de la forma I = [a, b] (con a < b), la función f es
localmente integrable en I = [a, b] si y sólo si es integrable en [a, b].
129

tales que |f (x)| ≤ M para todo x ∈ E(x0 , δ) ∩ I. Entonces, para todo x ∈ E(x0 , δ) ∩ I,
tenemos que
Z x Z x0
|F (x) − F (x0 )| = f (t)dt − f (t)dt
a a
Z x
= f (t)dt
x0
Z máx{x0 ,x}
≤ |f (t)|dt
mı́n{x0 ,x}
Z máx{x0 ,x}
≤ M dt
mı́n{x0 ,x}

= M |x − x0 |

Como lı́m M |x − x0 | = 0, se deduce por el teorema del sándwich que lı́mx→x0 |F (x) −
x→x0
F (x0 )| = 0, es decir: lı́m F (x) = F (x0 ).
x→x0

Observación 4.2.25. Ya vimos un ejemplo de función definida a partir de una integral: la


función logaritmo log : R+ → R, que definimos a partir de la función f (t) = 1/t por
Z x
1
log(x) = dt
1 t

Ası́ la Proposición 4.2.24 nos da una nueva prueba de la conrinuidad de la función log.

Ejercicio 52. Demostrar que si f : I → R es positiva o nula (resp.


R x negativa o nula) en el
intervalo I, entonces la función F : I → R definida por F (x) = a f (t)dt para todo x ∈ I es
monótona creciente (resp. monótona decreciente).
Ejercicio 53. Se considera la función f : R → R definida por
1
f (t) =
1 + t2

(1) Demostrar que la función f es monótona creciente en (−∞, 0] y monótona decreciente


en [0, +∞). Deducir que f es localmente integrable en R.

Ahora, se considera la función F : R → R definida por


Z x Z x
1
F (x) = f (t)dt = 2
dt
0 0 1+t

(2) Demostrar que la función F es continua, impar, y estrictamente creciente en R.

Observación: La función F es la función arcotangente.


130

4.3. Continuidad uniforme

4.3.1. Observaciones y definición

Observación 4.3.1. Vimos que una función f : I → R es continua cuando para todo punto
x0 ∈ I y para toda precisión ϵ > 0, existe un radio δ > 0 tal que

∀x ∈ I, |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ϵ (∗)

Fijando ϵ > 0, el valor posible para el radio δ no es único: en efecto, si un radio δ cumple
la condición anterior, entonces todo radio δ ′ < δ también la cumple. Sin embargo, existe en
general un máximo radio δ que no podemos superar si queremos mantener la condición (∗).
Veamos un ejemplo.

Ejemplo 4.3.2. Sea f : R → R la función definida por f (x) = x2 para todo x ∈ R. Fijados
un punto x0 > 0 y una precisión δ > 0 tal que ϵ < x20 , queremos determinar el máximo radio
δ > 0 tal que la condición (∗) se cumple. Para todo x ≥ 0, se observa que

|x2 − x20 | < ϵ ⇔ x20 − ϵ < x2 < x20 + ϵ


q q
⇔ x0 − ϵ < x < x20 + ϵ
2

p p
Luego, el radio δ > 0 debe cumplir las condiciones δ ≤ x0 − x20 − ϵ y δ ≤ x20 + ϵ − x0 . Se
puede demostrar que la segunda condición
p es más restrictiva. Por lo tanto, el máximo radio
2
que cumple la condición (∗) es δ := x0 + ϵ − x0 .

Observación 4.3.3. El ejemplo anterior muestra que, en general, el radio δ > 0 no sólo
depende de la precisión ϵ > 0 pero que también depende del punto x0 . Para muchas aplica-
ciones (en particular en el cálculo integral), es útil que el radio δ > 0 sólo dependa de la
precisión ϵ > 0. (Vimos que no es el caso en el ejemplo anterior.) Para ello, se necesita
introducir una condición más exigente que la continuidad: la continuidad uniforme.
131

Definición 4.3.4 (Función uniformemente continua). Se dice que una función f :


I → R es uniformemente continua en el intervalo I ⊂ R cuando:

∀ϵ > 0, ∃δ > 0, ∀x, x′ ∈ I, |x − x′ | < δ ⇒ |f (x) − f (x′ )| < ϵ

Por supuesto, la continuidad uniforme implica la continuidad:

Proposición 4.3.5. Toda función uniformemente continua es continua.

Demostracion. Sea f : I → R una función definida en un intervalo I ⊂ R. Tenemos que

f es uniformemente continua en I
⇔ ∀ϵ > 0, ∃δ > 0, ∀x ∈ I, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (1)
⇒ ∀ϵ > 0, ∀x ∈ I, ∃δ > 0, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (2)
⇔ ∀x ∈ I, ∀ϵ > 0, ∃δ > 0, ∀x′ ∈ I, |x − x′ | ⇒ |f (x) − f (x′ )| < ϵ (3)
⇔ f es continua en I

Observación 4.3.6. En el razonamiento anterior, usamos las siguientes dos reglas lógicas,
que rigen la conmutatividad de los cuantificadores:

Para demostrar que (1) ⇒ (2), usamos la regla

∃δ > 0, ∀x ∈ I, . . . ⇒ ∀x ∈ I, ∃δ > 0, . . .

que expresa que un enunciado de tipo “existe, para todo” siempre implica el enunciado
de tipo “para todo, existe” obtenido intercambiando ambos cuantificadores.
¡Cuidado! Sólo se trata de una implicación, pues el recı́proco no se cumple en general12 .

Para demostrar que (2) ⇔ (3), usamos la regla

∀ϵ > 0, ∀x ∈ I, . . . ⇔ ∀x ∈ I, ∀ϵ > 0, . . .

que expresa que siempre se pueden intercambiar dos cuantificadores consecutivos del
mismo tipo (dos “∀” o dos “∃”) sin cambiar el sentido del enunciado considerado. (La
misma regla se cumple para el cuantificador existencial: “∃1 ∃2 ⇔ ∃2 ∃1 ”.)

Por otro lado, la condición de continuidad uniforme es más fuerte que la condición de
continuidad, pues existen funciones continuas que no son uniformemente continuas:

Ejemplo 4.3.7 (Continuación del Ejemplo 4.3.2). Consideremos de nuevo la función f (x) =
x2 . Es claro que f es continua en R. Queremos demostrar que f no es uniformemente
12
En efecto, uando se dice “todos los uruguayos tienen una cédula” (enunciado de tipo ∀∃), esto no implica
que “existe una cédula compartida por todos los uruguayos” (enunciado del tipo ∃∀).
132

continua en R. Para ello, se razona por el absurdo, suponiendo que f es uniformemente


continua en R. Fijado ϵ > 0, esto significa que existe un radio δ > 0 que cumple la condición

∀x, x′ ∈ R, |x − x′ | < δ ⇒ |x2 − (x′ )2 | < ϵ (∗∗)

En particular, fijado x > 0, tenemos que

∀x′ ∈ R, |x′ − x| < δ ⇔ |(x′ )2 − x2 | < ϵ (∗)

Por otro lado,√vimos en el Ejemplo 4.3.213 que el máximo radio que cumple la condición (∗)
es el número x2 + ϵ − x (> 0). Por lo tanto, tenemos que

δ ≤ x2 + ϵ − x

para todo x ∈ R+ . Ahora, se observa que


√ √
√ ( x 2 + ϵ − x)( x2 + ϵ + x)
δ ≤ x2 + ϵ − x = √
x2 + ϵ + x
(x2 + ϵ) − x2 ϵ
= √ =√ −−−→ 0
2
x +ϵ+x 2
x + ϵ + x x→∞
Pasando al lı́mite cuando x tiende a +∞, se deduce que δ ≤ 0, lo que es absurdo, pues
δ > 0. Por lo tanto, la función f (x) = x2 no es uniformemente continua en R.

4.3.2. Teorema de Heine-Cantor

En la sección anterior, introdujimos la noción de continuidad uniforme, y vimos que define


una condición más exigente que la condición usual de continuidad. Sin embargo, existe un
caso particular muy importante donde ambas nociones de continuidad coinciden, a saber:
cuando el intervalo de definición es un intervalo cerrado [a, b] (con a < b). El objetivo de esta
sección es demostrar el teorema de Heine-Cantor, que expresa que toda función continua
definida en un intervalo cerrado [a, b] (con a < b) es uniformemente continua.

Para ello, se necesita demostrar el siguiente lema:

Lema 4.3.8 (Extracción de un cubrimiento finito). Dada una función positiva h :


[a, b] → R+ (cualquiera) definida en un intervalo [a, b] (con a < b), existe una sucesión
finita de puntos x1 , . . . , xn ∈ [a, b] tal que los entornos E(x1 , h(x1 )), . . . , E(xn , h(xn ))
de centros x1 , . . . , xn y de radios respectivos h(x1 ), . . . , h(xn ) cubren el intervalo [a, b],
es decir:
[a, b] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))

Observación 4.3.9. El enunciado del lema se puede entender del modo siguiente. Fijado
un radio r > 0, es claro que siempre se puede cubrir el intervalo [a, b] por una sucesión
13
Aquı́, las variables x y x′ tiene el papel de las variables x0 y x (respectivamente) en el Ejemplo 4.3.2.
133

finita de entornos E(x1 , r), . . . , E(xn , r) del mismo radio r: basta con tomar un entero n
suficientemente grande para que 2nr > b − a, y definir los centros x1 , . . . , xn ∈ [a, b] por

(2i − 1)(b − a)
xi :=
2n
con i = 1, . . . , n, ası́ como lo ilustra la siguiente figura:

Para demostrar el teorema de Heine-Cantor, se necesita considerar una situación mucho más
general donde los entornos que cubren el intervalo [a, b] tienen un radio variable forzado por
una función positiva h : [a, b] → R+ . (Intuitivamente, la función h asocia a cada punto
de [a, b] el “radio autorizado” alrededor de dicho punto.) El lema expresa que, cualquiera
sea la función positiva h : [a, b] → R+ (no se requiere ninguna hipótesis de continuidad
sobre h), siempre se puede hallar una sucesión finita de puntos x1 , . . . , xn ∈ [a, b] tal que los
correspondientes entornos E(x1 , h(x1 )), . . . , E(xn , h(xn )) cubran el intervalo [a, b]:

Demostración Dado un intervalo [c, d] ⊂ [a, b], se llama h-cubrimiento finito del intervalo
[c, d] a toda sucesión finita x1 , . . . , xn ∈ [c, d] tal que

[c, d] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))

Se considera el conjunto A ⊂ [a, b] definido por

A := {c ∈ [a, b] : existe un h − cubrimiento finito del intervalo [a, c]}


= {c ∈ [a, b] : ∃n, ∈ N, ∃x1 , . . . , xn ∈ [a, b], [a, c] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))}

Se trata de demostrar que b ∈ A. Para ello, se observa lo siguiente:

(1) El punto a es un elemento de A. En efecto, la sucesión definida por el única punto a


es un h-cubrimiento finito del intervalo [a, a], pues [a, a] = {a} ⊂ E(a, h(a)).

(2) Además, como A ⊂ [a, b] está acotado, tiene supremo s := sup(A) ∈ [a, b]
134

(3) Como s = sup(A), existe un punto c ∈ A tal que s − h(s) < c ≤ s. Y como c ∈ A,
existe (por definición del conjunto A) un h-cubrimiento finito x1 , . . . , xn del intervalo
[a, c], lo que significa que [a, c] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))
(4) Por otro lado, tenemos que c ∈ E(s, h(s)) (por construcción), entonces [c, s] ⊂ E(s, h(s)):
la sucesión definida por el único punto s es un h-cubrimiento finito del intervalo [c, s].
(5) Pegando los dos h-cubrimientos finitos definidos en (3) y (4), se deduce que
[a, s] ⊂ [a, c] ∪ [c, s] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn )) ∪ E(s, h(s))
Por lo tanto, la sucesión finita x1 , . . . , x : n, s (con n+1 elementos) es un h-cubrimiento
finito del intervalo [a, s], lo que demuestra que s ∈ A.
(6) Ahora, se trata demostrar que s = b. Para ello, se supone (por absurdo) que s < b
y se considera el punto s′ := mı́n(s + h(s)
2
, b). Por construcción, tenemos que s′ > s y
s ∈ E(s, h(s)). Entonces, tenemos que [s, s′ ] ⊂ E(s, h(s)), de tal modo que

[a, s] = [a, s] ∪ [s, s′ ] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn )) ∪ E(s, h(s))


Entonces, la sucesión finita x1 , . . . , xn , s (con n + 1 elementos) también es un h-
cubrimiento finito del intervalo [a, s′ ], luego s′ ∈ A. Pero esto es absurdo, pues s′ >
s = sup(A). Por lo tanto, la hipótesis s < b era absurda, y tenemos que s = b ∈ A.

Ahora se puede demostrar el teorema de Heine-Cantor:

Teorema 4.3.10 (Heine-Cantor). Toda función continua definida en un intervalo


cerrado [a, b] (con a < b) es uniformemente continua en dicho intervalo.

Demostración. Fijada una precisión ϵ > 0, se trata de construir un radio δ > 0 tal que
∀x, x′ ∈ [a, b], |x − x′ | < δ ⇒ |f (x) − f (x′ )| < ϵ (∗)
Como f es continua en [a, b], se puede asociar a cada punto x0 ∈ [a, b] un radio δx0 tal que
∀x ∈ [a, b], |x − x0 | < δx0 ⇒ |f (x) − f (x0 )| < ϵ/2 (∗∗)
Sea h : [a, b] → R+ la función definida por h(x) := δx /2 para todo x ∈ [a, b]. Por el lema
4.3.8, existe una sucesión finita de puntos x1 , . . . , xn ∈ [a, b] tales que
[a, b] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn ))
lo que permite definir el número δ > 0 por δ := mı́n {h(x1 ), . . . , h(xn ))}. Ahora, se trata de
demostrar que el radio δ cumple la condición (∗). Para ello, se consideran puntos x, x′ ∈ [a, b]
tales que |x − x′ | < δ. Como [a, b] ⊂ E(x1 , h(x1 )) ∪ · · · ∪ E(xn , h(xn )), existe un ı́ndice i tal
que x ∈ E(xi , h(xi )). Por construcción, tenemos que |x − xi | < h(xi ) = δxi /2 < δxi , de tal
modo que |f (x) − f (xi )| < ϵ/2 por (∗∗). Por otro lado, tenemos que
|f (x′ ) − f (x)| ≤ |f (x′ ) − f (xi )| + |f (xi ) − f (x)| ≤ ϵ/2 + ϵ/2 = ϵ
lo que acaba de demostrar la condición (∗).
135

Ejemplo 4.3.11 (Continuación del Ejemplo 4.3.2). Vimos en el Ejemplo 4.3.7 la función
f (x) = x2 no es uniformemente continua en R. Sin embargo, el teorema de Heine-Cantor
implica que la misma función es uniformemente continua en todo intervalo [a, b]. Ası́, dada
una precisión ϵ > 0, no existe ningún radio δ > 0 que cumpla la condición

∀x, x′ ∈ R, |x − x′ | < δ ⇒ |x2 − (x′ )2 | < ϵ

(donde las variables x y x′ recorren todo R), pero cuando uno se restringe a un intervalo
cerrado [a, b], siempre puede hallar un radio δa,b > 0 tal que

∀x, x′ ∈ [a, b], |x − x′ | < δa,b ⇒ |x2 − (x′ )2 | < ϵ

(donde las variables x y x′ sólo recorren el intervalo [a, b]).

4.3.3. Más funciones integrables

Una consecuencia muy importante del teorema de Heine-Cantor es la siguiente:

Proposición 4.3.12. Toda función continua en un intervalo cerrado [a, b] (con a < b)
es integrable en [a, b].

Demostración. Sea f : [a, b] → R una función continua (con a < b). Por la Proposición
4.2.14, sabemos que f está acotada en el intervalo [a, b], lo que permite definir sus sumas
inferiores y superiores. Para demostrar que f es integrable en [a, b], se usa el criterio de
integrabilidad a menos de ϵ. Fijada una precisión ϵ > 0, se elige un número η > 0 tal que
η < ϵ/(b − a)14 . Como la función f es continua en [a, b], es uniformemente continua en [a, b]
(por el Teorema 4.3.10), y existe un radio δ > 0 tal que

∀x, x′ ∈ [a, b], |x − x′ | < δ ⇒ |f (x) − f (x′ )| < η (∗)

Ahora se elige una partición P = {a0 , a1 , . . . an } ⊂ [a, b] tal que ∥P ∥ < δ. Dado un subin-
tervalo [ai , ai+1 ] (i = 0, . . . , n − 1), se observa que para todos x, x′ ∈ [ai , ai+1 ], tenemos que
|x − x′ | < δ (pues ai+1 − ai ≤ ∥P ∥ < δ), luego |f (x) − f (x′ )| < η por (∗). Por lo tanto,
tenemos que
f (x) − f (x′ ) ≤ η
para todos x, x′ ∈ [ai , ai+1 ]. Pasando al supremo (para x ∈ [ai , ai+1 ]) y al ı́nfimo (para
x′ in[a, b]) en la desigualdad anterior, se deduce (ejercicio) que

sup(f, [ai , ai+1 ]) − ı́nf(f, [ai , ai+1 ]) ≤ η


14 ϵ
Por ejemplo, se puede tomar η := 2(b−a) .
136

para todo i = 0, . . . , n − 1. Por lo tanto, tenemos que


n−1
X

S (f, P ) − S∗ (f, P ) = (ai+1 − ai ) · (sup(f, [ai , ai+1 ]) − ı́nf(f, [ai , ai+1 ]))
i=0
n−1
X
≤ (ai+1 − ai ) · η
i=0
n−1
X
=η (ai+1 − ai )
i=0
= η(b − a)
ϵ
< · (b − a)
b−a

Ası́ demostramos que para toda precisión ϵ > 0, existe una partición P del intervalo [a, b]
tal que S ∗ (f, P ) − S ∗ (f, P ) < ϵ. Por el criterio de integración a menos de ϵ, se deduce que
la función f es integrable en el intervalo [a, b].

Se sigue inmediatamente de la proposición anterior que:

Corolario 4.3.13. Toda función continua en un intervalo I ⊂ R es localmente integrable


en I.

Definición 4.3.14 (Función seccionalmente continua). Se dice que una función


f : [a, b] → R definida en un intervalo cerrado [a, b] (con a < b) es seccionalmente
continua cuando existe una partición P = {a0 , a1 , . . . , an } ⊂ [a, b] tal que para todo
i = 0, . . . , n − 1:

(1) la función f es continua en el intervalo abierto (ai , ai+1 )

(2) en el intervalo (ai , ai+1 ), la función f tiene lı́mites finitos en el punto ai (por la
derecha) y en el punto ai+1 (por la izquierda).
137

Observación 4.3.15. Cuando se verifica que una función f : [a, b] → R es seccionalmente


continua, es importante no olvidar la condición (2) que asegura que dicha función tiene
lı́mites finitos por la izquierda y por la derecha en todos los puntos del intervalo [a, b], incluso
en los puntos donde f es discontinua. Por ejemplo, la función f : [0, 1] → R definida por
(
0 si x = 0
f (x) = 1
x
si x > 0

es continua en el intervalo abierto (0, 1), pero no es seccionalmente continua en el intervalo


cerrado [0, 1], pues no tiene lı́mite finito en el punto 0 (por la derecha).

Ejercicio 54. Sea un intervalo cerrado [a, b], con a < b.

(1) Verificar que toda función escalonada en [a, b] es seccionalmente continua en [a, b].

(2) Demostrar que toda fucnión seccionalmente continua en [a, b] está acotada en [a, b].

Más generalmente, se demuestra que :

Proposición 4.3.16 (Integrabilidad de las funciones seccionalmente continuas). Toda


función seccionalmente continua en un intervalo [a, b] (con a < b) es integrable en
[a, b].

Demostració[Link] f : [a, b] → R una función seccionalmente continua en [a, b]. Por defini-
ción, existe una partición P = {a0 , a1 , . . . , an } ⊂ [a, b] que cumple las condiciones (1) y (2)
de la Definición 4.3.14. En cada subintervalo [ai , ai+1 ] (i = 0, . . . , n − 1), se observa que la
función fi : [ai , ai+1 ] → R definida por

f (x) si a < x < b


fi (x) = x→a lı́m+ si x = a

 lı́m

si x = b
−x→b

es continua en el intervalo [ai , ai+1 ] (por construcción), luego es integrable en dicho intervalo.
Y como la función f coincide con fi en el intervalo [ai , ai+1 ], salvo (quizá) en los dos puntos
ai y ai+1 , se deduce que la función f es integrable en el intervalo [ai , ai+1 ]15 . Por la propiedad
de aditividad respecto al intervalo, se concluye que la función f es integrable en el intervalo
[a, b] = [a0 , a1 ] ∪ · · · ∪ [an−1 , an ].
15
Veáse el capı́tulo sobre las integrales, Proposición 82 insert ref
138

4.3.4. Aplicación: el teorema del valor medio

Definición 4.3.17 (Valor medio de una función integrable). Sea f : [a, b] → R una
función integrable en un intervalo [a, b] (con a < b). Se llama valor medio de la función
f en el intervalo [a, b] al número µ ∈ R definido por:
Z b
1
µ := f (x)dx
b−a a

Observación 4.3.18. Intuitivamente, el valor medio de la función f en el intervalo [a, b]


representa el “promedio continuo” de los valores tomados por la función f en el intervalo
[a, b]. Gráficamente, se puede interpretar el valor medio µ de los siguientes modos:

Como la altura (algebraica) del rectángulo de ancho b − a que tiene la misma área
algebraica que la región ubicada entre el eje x y la gráfica de la función f :

Como la ordenada de la recta horizontal R que divide la gráfica de la función f de tal


modo que la región por encima de la recta F y la región por debajo de R tengan la
misma área:

Ejemplo 4.3.19. Dado que las anteriores dos figuras representan la gráfica de la función
f (x) = 13 x3 − x + 1 en el intervalo [−1, 2], calcular el correspondiente valor medio µ.
139

Teorema 4.3.20 (Valor medio). Si f : [a, b] → R es una función continua en un


intervalo [a, b] (con a < b), entonces existe un punto c ∈ [a, b] donde la función f
alcanza su valor medio: Z b
1
f (c) = µ = f (x)dx
b−a a

Demostración. Como la función f es continua en el intervalo [a, b], es integrable en [a, b],
Rb 1
Rb
lo que justifica la existencia de la integral a f (x)dx y del valor medio µ = b−a a
f (x)dx.
Por el teorema de Weierstrass (Teorema 4.2.16), existen x0 .x1 ∈ [a, b] tales que f (x0 ) = m
y f (x1 ) = M , donde m representa el mı́nimo y M el máximo de la función en el intervalo
[a, b]. Por lo tanto, tenemos que m ≤ f (x) ≤ M para todo x ∈ [a, b], de tal modo que
Z b
m(b − a) ≤ f (x)dx ≤ M (b − a)
a

Dividiendo las desigualdades anteriores por b − a > 0, se obtiene que


f (x0 ) = m ≤ µ ≤ M = f (x1 )
y, por el teorema de los valored intermedios (Corolario 4.2.9), se deduce que existe un punto
c entre x0 y x1 tal que f (c) = µ.
Observación 4.3.21. ¡Cuidado! El teorema del valor medio requiere que la función f sea
continua en el intervalo [a, b], y no se cumple (en general) cuando f sólo es seccionalmente
continua. Un contraejemplo es dado por la función f (x) = ⌊x⌋ (parte entera de x) en el
intervalo [0, 2].

La función f es seccionalmente continua en el intervalo [0, 2] (es una función escalonada),


y en dicho intervalo, tiene valor medio
1 2
Z
1 1
µ := ⌊x⌋ dx = · 1 =
2 0 2 2
Sin embargo, no existe ningún punto c ∈ [0, 2] tal que f (c) = ⌊c⌋ = 12 .
140
Capı́tulo 5

Derivadas

El concepto de derivada es central en este curso, y evoca inmediatamente la idea fı́sica de


velocidad. Aparece constantemente en las ciencias naturales y sociales, asociado a la idea de
variación o cambio. Sin embargo, la noción de derivada es relativamente reciente en términos
históricos: es debida a Newton y Leibniz, quienes la formularon en el siglo XVII.

¿Por qué la derivada es tan tardı́a? Porque recoge ideas y técnicas que se elaboraron a
lo largo de mucho tiempo y que tienen diversos orı́genes. En el Renacimiento, los europeos
se familiarizaron nuevamente con la matemática de los antiguos griegos –que fueron, ante
todo, grandes geómetras–, y aprendieron el álgebra que se habı́a desarrollado en el mundo
islámico mientras Europa estaba en el medioevo. Estas dos ramas de la matemática –el álge-
bra y la geometrı́a– confluyeron en la década de 1630 en la geometrı́a analı́tica, inventada
independientemente por Pierre de Fermat y René Descartes, que permitió expresar obje-
tos geométricos (tales como curvas, superficies, regiones, trayectorias) mediante ecuaciones
algebraicas. Esto abrió la posibilidad de explorar problemas geométricos mediante cálculo
simbólico.

La derivada fue usada por diversos matemáticos para resolver problemas geométricos
antes de ser bien comprendida, y antes de ser definida como la conocemos hoy. Esto es común
al desarrollo de muchos conceptos matemáticos. Fermat, tratando de encontrar máximos y
mı́nimos de funciones, observó que éstos se dan en puntos en los cuales la tangente a la
gráfica es horizontal. Las ideas de Fermat fueron retomadas por varios matemáticos1 que
querı́an, más generalmente, encontrar la recta tangente a una curva en un punto cualquiera.
Isaac Barrow, maestro de Newton, se dio cuenta de que las tangentes a una curva estaban
relacionadas con el área encerrada por ésta. Este intenso trabajo generó un conjunto de
métodos analı́ticos que permitı́an resolver diversos problemas geométricos.

Newton y Leibniz, en forma independiente, comprendieron que todos estos métodos


tenı́an una idea subyacente común, y ası́ descubrieron la derivada. Además, formularon
1
Entre ellos Johann Hudde, René Descartes, John Wallis, Isaac Barrow, René Sluse y Christian Huygens.

141
142

una nueva teorı́a que englobaba mucha matemática existente bajo dos conceptos centrales:
el de derivada y el de integral. Como ya habı́a intuido Barrow, estos conceptos, lejos de
ser independientes, son en cierto modo “duales”, como dos caras de una misma moneda.
Expresaron esta idea en lo que hoy conocemos como el Teorema Fundamental del Cálculo,
que demostraron con argumentos rigurosos. Es por todo esto que consideramos a Newton y
a Leibniz los creadores del Cálculo Diferencial e Integral.

Ası́, por increı́ble que parezca y en contra de lo que indica el sentido común, la noción
de derivada no fue principalmente motivada por la mecánica clásica. Hasta el siglo XVII
la velocidad habı́a sido ampliamente estudiada por numerosos y destacados fı́sicos desde
tiempos de Aristóteles, y notoriamente por Galileo Galilei. Sin embargo, fue Newton2 quien
unificó las leyes de la mecánica clásica y expresó esta última en términos del cálculo, haciendo
del cálculo diferencial e integral y la mecánica clásica dos disciplinas inseparables. Nuestra
comprensión del cálculo está sin duda muy influida por esta sı́ntesis.

Dedicaremos esta segunda mitad del curso a entender la derivada, y su ı́ntima y fascinante
relación con la integral.

5.1. Definición de la derivada

5.1.1. Velocidad

Pensemos en un movimiento unidimensional. Un movimiento unidimensional es un mo-


vimiento que podemos pensar, a los efectos de modelarlo matemáticamente, que ocurre en
una dimensión.

Un ejemplo es el de un automóvil que circula a lo largo de una carretera recta. Si


designamos el tiempo con la variable t, la posición en la carretera es una función de t, que
llamaremos f (t). La siguiente gráfica mide el tiempo en minutos y la posición en kilómetros,
y nos dice que, por ejemplo, el auto está en el kilómetro 43 a los 25 minutos de haber partido.
2
En su obra Philosophiæ Naturalis Principia Mathematica (Principios Matemáticos de la Filosofı́a Na-
tural), publicada en 1687.
143

¿Es importante que la carretera sea recta? No, para nada. Si la carretera no es recta,
miramos la misma gráfica y constatamos que ésta describe perfectamente el movimiento.
Los kilómetros se miden a lo largo de la carretera, y decir que a los 25 minutos de haber
salido el auto está en el kilómetro 43 tiene perfecto sentido.

Ası́, un movimiento unidimensional puede ser, por ejemplo, el de un auto en una ca-
rretera, el de una corredora en la rambla de Montevideo, el de un carrito en su riel de la
montaña rusa, o el de una manzana que cae verticalmente desde la rama de un árbol. Todos
ellos pueden ser modelados por la función f (t).

Volvamos al auto de la gráfica. ¿Cuál es su velocidad media entre los momentos t y


t + ∆t? Para calcularla, tenemos que dividir la distancia recorrida (f (t + ∆t) − f (t)) entre
el tiempo transcurrido (∆t), es decir,

f (t + ∆t) − f (t)
vm = km/min.
∆t
Observemos en la figura que la velocidad media es la pendiente del segmento rojo.
144

Para calcular la velocidad instantánea en t, tenemos que calcular la velocidad media en


lapsos [t, t + ∆t] cada vez más cortos. En realidad, la velocidad instantánea en el momento
t es un lı́mite:
f (t + ∆t) − f (t)
v(t) = lı́m km/min. (5.1.1)
∆t→0 ∆t

5.1.2. Pendiente de la recta tangente

Sea f : [a, b] → R una función, cuya gráfica se muestra en la figura. Consideremos el


siguiente problema geométrico: dado un punto x0 ∈ [a, b], ¿cuál es la recta tangente al
correspondiente punto de la gráfica (x0 , f (x0 ))?

Para determinar una recta en el plano, alcanza con saber su pendiente y un punto por
el que pasa. En nuestro caso, ya tenemos el punto, (x0 , f (x0 )), y vamos a determinar la
pendiente.

Si tomamos un punto x ∈ [a, b] cercano a x0 , el segmento que une (x, f (x)) y (x0 , f (x0 ))
tiene pendiente3
f (x) − f (x0 )
.
x − x0
Para hallar la pendiente de la recta tangente, tenemos que hacer que x esté cada vez más
cerca de x0 . Es decir, la pendiente de la tangente a la gráfica en el punto (x0 , f (x0 )) es el
lı́mite
f (x) − f (x0 )
lı́m . (5.1.2)
x→x0 x − x0
3
Recordemos que si en una recta tenemos dos puntos p0 = (x0 , y0 ) y p1 = (x1 , y1 ), la pendiente de la
∆y
misma es ∆x = xy11 −y
−x0 .
0
145

Este lı́mite podrı́a no existir, como no existe en el caso de la siguiente figura. Pero, si el
lı́mite existe, es la pendiente de la recta tangente.

Para esta función, no existe la recta tangente a la gráfica en (x0 , f (x0 ))

Haremos un cambio de variable para expresar el lı́mite (5.1.2) de un modo ligeramente


distinto. Escribimos
x = x0 + h,
es decir, llamamos h a la diferencia x − x0 . Entonces, decir que x → x0 equivale a decir que
h → 0. El lı́mite (5.1.2) queda ası́:

f (x0 + h) − f (x0 )
lı́m . (5.1.3)
h→0 h
146

5.1.3. Lı́mite del cociente incremental

Observemos los lı́mites dados por las ecuaciones (5.1.1) y (5.1.3). Las variables que
aparecen en ellos tienen nombres distintos, pero por lo demás, son iguales.

En general, si tenemos un intervalo I ⊂ R y una función f : I → R, decimos que el


cociente incremental de f en un punto x ∈ I es

f (x + h) − f (x)
. (5.1.4)
h

Definición 5.1.5. La derivada de f en el punto x es el lı́mite

f (x + h) − f (x)
f ′ (x) = lı́m .
h→0 h

Cuando este lı́mite existe y es finito, decimos que f es derivable en x. En caso contrario4 ,
decimos que f no es derivable en x.

Decimos que una función f es derivable si es derivable en todos los puntos de su dominio.

Veremos más adelante resultados que nos van a permitir calcular fácilmente las deriva-
das de “funciones dadas por fórmulas”. Por “funciones dadas por fórmulas”nos referimos a
funciones que se pueden obtener haciendo sumas, productos, cocientes y composiciones de
funciones polinómicas, exponenciales, logarı́tmicas y trigonométricas. Sin embargo, siempre
hay que recordar que la derivada es, por definición, el lı́mite del cociente incremental. Esta
definición es aplicable a una clase más grande de funciones, y será usada constantemente en
lo que resta del curso.

Como ya dijimos, la derivada de f en un punto x0 es la pendiente de la tangente a la


gráfica de f en el punto (x0 , f (x0 )). ¿Cómo hallamos la ecuación de esta recta?

Una recta en el plano (a menos que sea vertical) tiene ecuación

y = mx + n,

donde m es la pendiente. Entonces, la tangente a la gráfica de f en (x0 , f (x0 )) será una


recta de ecuación
y = f ′ (x0 )x + n,
para algún n ∈ R que tenemos que determinar. Como esta recta pasa por el punto (x0 , f (x0 )),
debe cumplirse que
f (x0 ) = f ′ (x0 )x0 + n,
4
Es decir, si el lı́mite es infinito o no existe.
147

por lo que despejando n obtenemos


n = f (x0 ) − f ′ (x0 )x0 .

Resumimos estos cálculos en el siguiente recuadro:

Si f es derivable en x0 , la recta tangente a la gráfica de f en el punto (x0 , f (x0 )) es


la recta de ecuación
y = f (x0 ) + f ′ (x0 )(x − x0 ).

5.1.4. Continuidad de las funciones derivables

Terminaremos esta sección con una propiedad importantı́sima de las funciones derivables:
son continuas. Más concretamente, tenemos la siguiente proposición:

Proposición 5.1.6. Sean I un intervalo de R, x un punto interior a I y f : I → R


una función. Entonces, si f es derivable en x, es continua en x.

Demostración: Para probar que f es continua en x, tenemos que ver que


lı́m f (x + h) = f (x),
h→0

o equivalentemente que
lı́m f (x + h) − f (x) = 0.
h→0

Observemos que como f es derivable en x, existe lı́mh→0 f (x+h)−f h


(x)
y por lo tanto la
f (x+h)−f (x)
expresión h
es acotada para h en un entorno reducido de 0.

Entonces
f (x + h) − f (x)
lı́m f (x + h) − f (x) = lı́m h = 0. □
h→0 h→0 h |{z}
| {z } tiende a 0
acotado

Observación 5.1.7. Podrı́a ocurrir que exista


f (x + h) − f (x)
lı́m+ .
h→0 h
Diremos que es la derivada en x por la derecha. Con el mismo argumento que demuestra la
Proposición 5.1.6, si existe la derivada por la derecha de f en x entonces f es continua a
derecha en x. Del mismo modo se define derivada por la izquierda.

Cuando el dominio de f es un intervalo cerrado [a, b], podemos hablar de la derivada en


a por la derecha y de la derivada en b por la izquierda.
148

5.2. Cálculo de derivadas

5.2.1. Primeros ejemplos

Calculemos, a partir de la definición, la derivada de algunas funciones sencillas.


Ejemplo 5.2.1. Derivada de la función constante

Tomemos c ∈ R y la función constante f : R → R dada por f (x) = c. Calcularemos la


derivada en un punto x.

f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
c−c
= lı́m
h→0 h
= lı́m 0 = 0
h→0

Es decir, f ′ (x) = 0 para todo x ∈ R.


Ejemplo 5.2.2. Derivada de la función identidad

Tomemos la función identidad f : R → R, es decir, la función dada por f (x) = x.

Su derivada es
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
x+h−x
= lı́m
h→0 h
h
= lı́m = 1.
h→0 h

Ejemplo 5.2.3. Derivada de la función cuadrática

Tomemos la función f : R → R dada por f (x) = x2 .

Su derivada es
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
(x + h) − x2
2
= lı́m
h→0 h
2xh + h2
= lı́m
h→0 h
= lı́m (2x + h) = 2x.
h→0
149

Ejemplo 5.2.4. Derivada de la función potencia

Tomemos n ∈ N mayor o igual que 1, y la función f : R → R dada por f (x) = xn .


Calcularemos su derivada en un punto x.

Para esto, recordemos antes la fórmula del binomio de Newton, que dice que para dos
números reales a y b
Xn
n
(a + b) = cnk ak bn−k ,
k=0
n!
donde cnk es el número combinatorio cnk = k!(n−k)!
.

Entonces
f (x + h) − f (x)
f ′ (x) = lı́m
h→0 h
(x + h)n − xn
= lı́m
Pn hn k n−k
h→0
c x h − xn
= lı́m k=0 k
h→0 h
Pn−1 n k n−k
c x h
= lı́m k=0 k
h→0 h
n−1
X hn−k
= lı́m cnk xk
h→0
k=0
h
n−1
X
= lı́m cnk xk hn−k−1
h→0
k=0
n−1
X
= cnk xk lı́m hn−k−1
h→0
k=0
= cnn−1 xn−1 = nxn−1 .

Es decir, f ′ (x) = nxn−1 para todo x ∈ R. Esto coincide con lo que nos dio el cálculo para
n = 1 y n = 25 .

Ejemplo 5.2.5. Derivada de la función logaritmo en 1

Sea f : (0, +∞) → R dada por f (x) = log(x). Calcularemos f ′ (1), es decir,
1+h
f (1 + h) − f (1)
Z
′ log(1 + h) 1 1
f (1) = lı́m = lı́m = lı́m dt.
h→0 h h→0 h h→0 h 1 t
5
En realidad, cuando x = 0 y n = 1 la fórmula anterior no es válida, porque no podemos hacer 00 . Sin
embargo, ya vimos directamente que la derivada de f (x) = x en x = 0 da 1.
150

Consideremos primero el caso en que h > 0. Tomando la partición P = {1, 1 + h}, tenemos
R 1+h
que las sumas inferior y superior para la integral 1 1t dt son, respectivamente, S∗ (f, P ) =
h
1+h
y S ∗ (f, P ) = h, por lo que
1 log(1 + h)
≤ ≤ 1.
1+h h
Por el teorema del sandwich, lı́mh→0+ log(1+h)
h
= 1. Haciendo un razonamiento análogo para
log(1+h)
h < 0 se llega a que lı́mh→0− h
= 1, por lo que
log(1 + h)
f ′ (1) = lı́m = 1.
h→0 h
Ejercicio 55. 1. Probar que para todo x > 0 y h ∈ (−x, +∞)6 el cociente incremental
log(x+h)−log(x)
h
está acotado entre x1 y x+h
1
.

2. Probar que para todo x > 0 la función logaritmo es derivable en x y log ′ (x) = x1 .
Ejemplo 5.2.6. Derivada de la función seno en 0

Ahora calcularemos la derivada de la función f : R → R dada por f (x) = sen(x) en


x = 0. Es decir, el lı́mite
f (h) − f (0) sen(h)
f ′ (0) = lı́m = lı́m .
h→0 h h→0 h

Para eso, observemos la siguiente figura, en la que se representa en el cı́rculo trigo-


nométrico a un ángulo h > 0. El punto A es A = (1, 0), el punto B es B = (cos(h), sen(h)),
el punto B ′ es B ′ = (1, tan(h)) y el punto O es O = (0, 0). Si llamamos F1 al triángulo
AOB, F2 al sector angular determinado por los puntos A, O y B y F3 al triángulo AOB ′ ,
es claro que
área(F1 ) ≤ área(F2 ) ≤ área(F3 ). (5.2.7)

6
Es decir, h es tal que x + h > 0.
151

El ángulo h, que hemos tomado positivo, está medido en radianes, y un radián es una
1 h
proporción 2π del ángulo completo. Por lo tanto, el ángulo h es una proporción 2π del ángulo
completo y el área de F2 es
h
área(F2 ) = · π,

pues π es el área del cı́rculo. Por otro lado, área(F1 ) = sen(h)/2 y área(F3 ) = tan(h)/2. Por
lo tanto, la ecuación (5.2.7) dice que

sen(h) h 1 sen(h)
≤ ≤ .
2 2 2 cos(h)
2
Multiplicando por sen(h)
esto queda

h 1
1≤ ≤ .
sen(h) cos(h)

Tomando los inversos,


sen(h)
1≥ ≥ cos(h),
h
y como lı́mh→0 cos(h) = 1, el teorema del sandwich nos dice que lı́mh→0+ sen(h)
h
= 1. Usando
que la función que a cada x asigna el cociente sen(x)/x es par, concluimos que

sen(h)
f ′ (0) = lı́m = 1.
h→0 h
Ejercicio 56. 1. Verificar que la función coseno es derivable en 0 y calcular su derivada
cos′ (0).

2. Usando las igualdades trigonométricas

cos(x + y) = cos(x) cos(y) − sen(x)sen(y)


sen(x + y) = cos(x)sen(y) + sen(x) cos(y)

probar que cos y sen son derivables en R, y que sen′ (x) = cos(x) y cos′ (x) = −sen(x).
152

Un comentario “circular”
1
En el cálculo anterior se dijo que un radián es una proporción de 2π del ángulo
completo. Esta no es la definición habitual de radián. Sin embargo, con esta definición
se puede ver que, si π es el área del cı́rculo*, el área de un sector angular de ángulo h
es h/2, que es lo que hemos usado.
Ası́, lo anterior puede considerarse una demostración de que lı́mh→0 sen(h) h
= 1.
¿Cómo podrı́amos calcular, usando esto, la longitud de la circunferencia? No hemos
definido en este curso la longitud de una curva, pero podemos pensar que la longitud
de la circunferencia es el lı́mite de los perı́metros de los n-ágonos regulares inscriptos
cuando n se hace cada vez más grande. El perı́metro del n-ágono regular se puede
calcular como ejercicio, usando un poco de trigonometrı́a. ¿A qué se aproxima este
perı́metro cuando n crece? ¡Para ver que se aproxima a 2π, tenemos que usar justa-
mente que lı́mh→0 sen(h)
h
= 1! Es decir, usamos este lı́mite para ver que la longitud de
la circunferencia es 2π.
Una vez que sabemos que la longitud de la circunferencia es 2π, podemos ver que el
arco de circunferencia determinado por un radián tiene longitud 1–lo que normalmente
se presenta como la definición de radián.
¡Pero que la longitud de la circunferncia es 2π es algo que sabemos de toda la vida!
¿Cómo lo sabemos? Porque nos lo dijeron en la escuela, pero nunca nos explicaron
realmente por qué es cierto. Si usamos este dato para calcular el lı́mite del Ejemplo
de la derivada de la función seno en 0, y usamos este lı́mite para “demostrar”que la
longitud de la circunferencia es 2π, estamos haciendo un razonamiento circular.
*Estamos tan acostumbrados a trabajar con el número π que, cuando lo vemos, no nos despierta
ninguna suspicacia. Pero, ¿qué es π? Una definición posible, y de las más razonables, es decir que es
el área del cı́rculo de radio 1.

Ejemplo 5.2.8. Una función continua que no es derivable.

La Proposición 5.1.6 nos dice que si una función es derivable en un punto, entonces es
continua en ese punto. ¿Será cierta la afirmación recı́proca? Es decir, ¿será cierto que si una
función es continua en un punto, también es derivable?

No, la vida del estudiante de cálculo no es tan plácida. Para ver esto, consideremos la
función valor absoluto f : R → R dada por f (x) = |x|, cuya gráfica aparece en la figura.
Esta función es continua en todos los puntos de R, y vamos a ver que no es derivable en 0.

Si pensamos en que la derivada se puede interpretar geométricamente como la pendiente


de la recta tangente a la gráfica, parece claro que la gráfica de f en 0 no admite una recta
tangente. Sin embargo, la derivada es, por definición, el lı́mite del cociente incremental. Para
ver que no existe f ′ (0), tenemos que ver que no existe el lı́mite del cociente incremental.

El cociente incremental de f en 0 es
f (h) − f (0) |h|
= .
h h
153

h
Cuando h > 0, esto vale h
= 1, por lo que

f (h) − f (0)
lı́m+ = 1.
h→0 h
−h
Cuando h < 0, esto vale h
= −1, por lo que

f (h) − f (0)
lı́m− = −1.
h→0 h
f (h)−f (0)
Por lo tanto, no existe lı́mh→0 h
, es decir, f no es derivable en 0.

Un comentario sobre funciones continuas no derivables


Hay incluso funciones continuas en todos los puntos que no son derivables en nin-
guno de ellos. El primer ejemplo conocido es la “función de Weierstrass”, y data del
siglo XIX.
Lejos de ser funciones raras, las funciones continuas no derivables en ningún punto
son muy abundantes, y muy útiles en muchas aplicaciones de la matemática. Se usan,
entre otras cosas, para modelar fenómenos tan diversos como el movimiento de las
moléculas en un gas y el precio de activos financieros.

5.2.2. Un ejemplo que desafı́a la intuición

Recordemos la función f : R → R dada por

x sen x1 si x ̸= 0
 
f (x) =
0 si x = 0

Es continua en 0. El cociente incremental de f en 0 es

f (h) − f (0) h sen(1/h) − 0


= = sen(1/h),
h h
que no tiene lı́mite cuando h tiende a 0, por lo que f no es derivable en 0.
154

Observemos la figura. La gráfica de la función f está comprendida entre las de las fun-
ciones |x| y −|x|, dos funciones continuas que valen 0 en 0. Por eso, cerca de 0, hay un
sandwich
−|x| ≤ f (x) ≤ |x|
que nos permite ver la continuidad de f en 0.

Consideremos ahora a una parienta cercana de f , que es la función dada en el siguiente


ejemplo.
Ejemplo 5.2.9.

1
 
x2 sen x
si x ̸= 0
g(x) =
0 si x = 0

Al igual que f , esta función es continua en 0. (¡Verificarlo como ejercicio!) El cociente


incremental de g en 0 es
g(h) − g(0) h2 sen(1/h) − 0
= = h sen(1/h),
h h
155

por lo que
g(h) − g(0)
g ′ (0) = lı́m = lı́m hsen(1/h) = 0.
h→0 h h→0

Observemos la figura. La gráfica de la función g está comprendida entre las de las fun-
ciones x2 y −x2 , es decir,
−x2 ≤ g(x) ≤ x2 .
Tanto −x2 como x2 son funciones derivables en 0, y su derivada vale 0. Dicho de otro modo,
las parábolas y = −x2 e y = x2 tienen recta tangente en el punto (0, 0), que es la recta
horizontal y = 0.

¿Tiene sentido decir que la gráfica de g tiene recta tangente en (0, 0), y que esta es la
recta horizontal y = 0? ¡Quién sabe! Pero sı́ tiene sentido decir que g es derivable en 0 y que
g ′ (0) = 0, porque la derivada es el lı́mite del cociente incremental, y lo acabamos de calcular.

Esta función desafı́a nuestra intuición geométrica de la derivada como pendiente de la


recta tangente. Es un ejemplo elegido para mostrar que la derivada, tal como la definimos,
es un concepto un poco más general. Es por ejemplos como este que usamos dibujos de
funciones sencillas y razonamientos geométricos para entender las ideas y los razonamientos
nuevos, pero siempre nos remitimos a las definciones y a los resultados ya demostrados para
demostrar (es decir, justificar rigurosamente mediante razonamientos lógicos) teoremas.

5.2.3. Álgebra de derivadas

Como la derivada es un lı́mite, las propiedades que conocemos de los lı́mites nos permiten
calcular derivadas.

Proposición 5.2.10. Si f y g son dos funciones definidas en un intervalo I y deri-


̸ 0 en
vables en un punto x, entonces f + g y f g también son derivables en x. Si g =
I, la función f /g también es derivable en x. Estas derivadas valen:

1. (f + g)′ (x) = f ′ (x) + g ′ (x)

2. (f g)′ (x) = f ′ (x)g(x) + f (x)g ′ (x)


 ′
f f ′ (x)g(x) − f (x)g ′ (x)
3. (x) =
g (g(x))2

Esto nos da una familia importante de ejemplos de funciones derivables.


Ejercicio 57. Las funciones polinómicas son derivables, y la derivada de p(x) = a0 + a1 x +
a2 x2 · · · + an xn es p′ (x) = a1 + 2a2 x + 3a3 x2 + · · · + nan xn−1 .
Ejercicio 58. La función tangente tan : (− π2 , π2 ) → R es derivable, y su derivada es
1
tan′ (x) = = 1 + tan2 (x).
cos2 (x)
156

Ejercicio 59. Demostrar que (f + g)′ (x) = f ′ (x) + g ′ (x), usando la linealidad del lı́mite.

Vamos a demostrar la segunda y la tercera afirmación de la Proposición 5.2.10.

Demostración de 2.

El cociente incremental para la función f g es


f (x + h)g(x + h) − f (x)g(x) f (x + h)g(x + h) − f (x)g(x + h) + f (x)g(x + h) − f (x)g(x)
=
h h
f (x + h) − f (x) g(x + h) − g(x)
= g(x + h) + f (x) .
h h

Lo que hemos hecho es, en el numerador del cociente incremental, sumar y restar
f (x)g(x + h). Luego, agrupamos los sumandos convenientemente y aplicamos la propiedad
distributiva.

Tomando lı́mite,
f (x + h)g(x + h) − f (x)g(x)
(f g)′ (x) = lı́m
h→0 h
f (x + h) − f (x) g(x + h) − g(x)
= lı́m lı́m g(x + h) + f (x) lı́m .
h→0 h h→0 h→0 h
Por la Proposición 5.1.6, lı́mh→0 g(x + h) = g(x), y

(f g)′ (x) = f ′ (x)g(x) + f (x)g ′ (x). □

Demostración de 3.

Vamos a calcular la derivada de la función 1/g. Luego podemos usar la fórmula de la


derivada del producto que acabamos de demostrar aplicándola a f /g = f · (1/g).

Observemos que el cociente incremental de 1/g en el punto x es


1 1
g(x+h)
− g(x) g(x) − g(x + h) 1
= ,
h h g(x + h)g(x)
que cuando h → 0 converge a  ′
1 g ′ (x)
(x) = − . (5.2.11)
g (g(x))2
Ejercicio 60. Usando 2 y la ecuación (5.2.11), terminar la demostración de 3.
Observación 5.2.12. El conjunto

V = {φ : I → R / φ es una función derivable en x}


157

es un espacio vectorial.

Según la Proposición 5.2.10, (f + g)′ (x) = f ′ (x) + g ′ (x) y (cf )′ (x) = cf ′ (x) para toda
constante c. Esto nos dice que la función T : V → R dada por T (f ) = f ′ (x) es una
transformación lineal.

5.2.4. Regla de la cadena

Cuando escribimos una función “dada por una fórmula”, como por ejemplo
φ:R → R
φ(x) = sen(log(x2 + 3))
estamos, en general, haciendo sumas, productos, cocientes y composiciones de funciones
más sencillas. Para poder derivar una función ası́, lo que nos falta es saber cómo derivar una
composición de funciones. El resultado que nos dice cómo hacer esto se conoce como Regla
de la Cadena.

Teorema 5.2.13. (Regla de la cadena)


Sean I y J dos intervalos de R, x0 un punto de I y g : I → J y f : J → R dos funciones
tales que g es derivable en x0 y f es derivable en g(x0 ). Entonces, la composición f ◦ g
es derivable en x0 y su derivada es

(f ◦ g)′ (x0 ) = f ′ (g(x0 ))g ′ (x0 ).

Ejemplo 5.2.14. Derivada de ψ(x) = log(x2 + 3).

Esta función es la composición ψ = f ◦ g, donde f : (0, +∞) → R, f (x) = log(x) y


g : R → (0, +∞), g(x) = x2 + 3. Ambas funciones son derivables en todo su dominio, y por
la Regla de la Cadena ψ ′ (x) = f ′ (g(x))g ′ (x). Es decir,
1
ψ ′ (x) = 2x.
x2 +3
Ejemplo 5.2.15. Derivada de φ(x) = sen(log(x2 + 3)).

Esta función es la composición φ = h ◦ ψ, donde h : R → R, h(x) = sen(x) y ψ es la


función del ejemplo anterior. Ambas funciones son derivables en todo su dominio, y por la
Regla de la Cadena φ′ (x) = h′ (ψ(x))ψ ′ (x). Es decir,
2x
φ′ (x) = cos(log(x2 + 3)) .
x2 +3

Daremos primero una idea de la demostración de la Regla de la Cadena, para luego


escribir una demostración rigurosa.
158

Idea de la demostración del Teorema 5.2.13:

El cociente incremental de f ◦ g en el punto x0 es

f (g(x0 + h)) − f (g(x0 ))


.
h
Si lo multiplicamos y dividimos por g(x0 + h) − g(x0 ), obtenemos

f (g(x0 + h)) − f (g(x0 )) f (g(x0 + h)) − f (g(x0 )) g(x0 + h) − g(x0 )


= . (5.2.16)
h g(x0 + h) − g(x0 ) h

El segundo factor es el cociente incremental de g en x0 , que cuando h tiende a cero converge


a g ′ (x0 ).

Por otro lado, como g es derivable en x0 , es también continua en x0 (por la Proposi-


ción 5.1.6). Entonces, cuando h → 0, tenemos que g(x0 + h) → g(x0 ), o sea, g(x0 + h) −
g(x0 ) → 0. Si llamamos k al incremento k = g(x0 + h) − g(x0 )7 , el primer factor de (5.2.16)
nos queda
f (g(x0 ) + k) − g(x0 )
.
k
y k → 0 cuando h → 0. Por lo tanto,

f (g(x0 ) + k) − g(x0 )
lı́m = f ′ (g(x0 )).
h→0 k

Tomando lı́mite del cociente incremental (5.2.16), tenemos que

(f ◦ g)′ (x0 ) = f ′ (g(x0 ))g ′ (x0 ).

El problema con esta idea es que cuando dividimos entre g(x0 + h) − g(x0 ) en la ecuación
(5.2.16), no tuvimos cuidado de no dividir entre cero. Es decir, podrı́a pasar que para valores
de h ̸= 0 la diferencia g(x0 + h) − g(x0 ) fuera igual a 0.

Por este motivo, en la demostración de la Regla de la Cadena tomaremos una función


auxiliar que a primera vista puede parecer un tanto artificial, pero que evitará este problema.

Demostración del Teorema 5.2.13:

Consideremos la función φ definida en un entorno de 0 dada por


 f (g(x0 +h)−f (g(x0 ))
 g(x0 +h)−g(x0 ) si g(x0 + h) ̸= g(x0 )
φ(h) =
 ′
f (g(x0 )) si g(x0 + h) = g(x0 )
7
Hay que tener presente que k depende de h.
159

Ejercicio 61. Verificar que

f (g(x0 + h)) − f (g(x0 )) g(x0 + h) − g(x0 )


= φ(h) (5.2.17)
h h
para todos los valores de h, y que lı́mh→0 φ(h) = f ′ (g(x0 )).

Tomando lı́mite con h → 0 en la ecuación (5.2.17), nos queda que

(f ◦ g)′ (x0 ) = f ′ (g(x0 ))g ′ (x0 ),

que es lo que querı́amos probar. □

5.2.5. Teorema de la función inversa

Recordemos que si una función f : I → J es biyectiva, su inversa es una función g : J → I


tal que f ◦ g y g ◦ f son la función identidad, es decir,

f ◦ g(x) = x ∀x ∈ J (5.2.18)

y
g ◦ f (x) = x ∀x ∈ I. (5.2.19)

En esta sección, I y J serán siempre intervalos en R. Vamos a considerar las preguntas


siguientes:

ˆ Si f es derivable en I, ¿es g derivable en J?

ˆ En caso afirmativo, ¿cómo se calcula la derivada?

Antes de abordar este problema, recordemos algunas particularidades que tienen las
funciones biyectivas entre intervalos de R.

Si I y J son intervalos de R y f : I → J es continua y biyectiva, entonces es estricta-


mente creciente o estrictamente decreciente.

En el capı́tulo de continuidad de las notas, ya se vio (Proposición 4.2.18) que si f es


sobreyectiva y estrictamente monótona (es decir, estrictamente creciente o estrictamente
decreciente), entonces es biyectiva. Lo que aquı́ estamos diciendo es que éstas son las únicas
funciones continuas y biyectivas entre intervalos.
Ejercicio 62. Demostrar la afirmación del recuadro amarillo, con los siguientes pasos como
guı́a:
160

1. Suponer que f no es ni estrictamente creciente ni estrictamente decreciente. Probar


que en este caso existen x, y, z ∈ I tales que x < y < z y

ˆ f (x) < f (y) y f (z) < f (y) o


ˆ f (x) > f (y) y f (z) > f (y).

2. Suponer que para x < y < z se tiene que f (x) < f (y) y f (z) < f (y), ya que el otro
caso es análogo. Probar que existe λ ∈ (f (x), f (y)) ∩ (f (y), f (z)).8

3. Usando el Teorema de los valores intermedios,9 probar que existen w1 ∈ (x, y) y


w2 ∈ (y, z) tales que f (w1 ) = f (w2 ) = λ. Concluir que f no es biyectiva.

En este ejercicio se usaron dos corolarios del Teorema de Bolzano, que es un teorema
fundamental sobre las funciones continuas. Dar un ejemplo de una función biyectiva entre
dos intervalos de R que no sea continua y que no sea estrictamente monótona.

Una función biyectiva f y su inversa g tienen gráficos con la siguiente propiedad geométri-
ca:

Si f : I → J es biyectiva y g : J → I es su inversa, entonces el gráfico de g se obtiene


a partir del de f haciendo una simetrı́a axial que tiene como eje a la recta y = x.

Esto se ve, por ejemplo, en las gráficas de las funciones exponencial exp : R → (0, +∞)
y logaritmo log : (0, +∞) → R.

8
Recordar el Corolario 4.2.10 del capı́tulo Lı́mites y Continuidad, que dice que la imagen por una función
continua de un intervalo es otro intervalo.
9
Corolario 4.2.9 del capı́tulo Lı́mites y Continuidad.
161

Veamos por qué es cierto en general. El gráfico de f es el conjunto

Gr(f ) = {(x, y) ∈ I × J / y = f (x)}.

La simetrı́a axial de eje y = x lleva un punto (x, y) en el punto (y, x), por lo que la imagen
de Gr(f ) por esta simetrı́a es el conjunto

X = {(y, x) ∈ J × I / y = f (x)}.

Como g es la inversa de f , lo podemos escribir como

X = {(y, x) ∈ J × I / g(y) = x},

y esto es exactamente el gráfico de g.

Volvamos a las preguntas que motivaron esta sección.


162

ˆ Si f es derivable en I, ¿es g derivable en J?

ˆ En caso afirmativo, ¿cómo se calcula la derivada?

La respuesta viene dada en el siguiente resultado, que se llama Teorema de la Función


Inversa.

Teorema 5.2.20. (Teorema de la función inversa) Sean I y J intervalos de R, f : I →


J una función continua y biyectiva que es derivable en un punto x0 que es interior a I
y g : J → I la inversa de f . Si f ′ (x0 ) ̸= 0, g es derivable en y0 = f (x0 ) y su derivada
vale
1
g ′ (y0 ) = ′ .
f (g(y0 ))

Antes de demostrarlo, vamos a tratar de entender geométricamente lo que nos dice este
teorema.

Miremos, en la imagen, el punto (x0 , y0 ) = (x0 , f (x0 )) del gráfico de f . La función f


es derivable en x0 si el gráfico tiene recta tangente en el punto (x0 , f (x0 )) y si esta recta
tangente no es vertical.10 En este caso la derivada f ′ (x0 ) es la pendiente de esta tangente.
Llamamos r a esta recta.

En este caso, el punto simétrico (y0 , x0 ) = (y0 , g(y0 )) del gráfico de g tiene recta tangente,
que se obtiene simetrizando r respecto de y = x. Llamamos r′ a esta recta. Entonces r′ es
vertical si y sólo si r es horizontal, es decir, si y sólo si f ′ (x0 ) = 0. Cuando f ′ (x0 ) ̸= 0, la
recta r′ tiene pendiente f ′ (x
1
0)
.

Lo anterior nos indica que si f es derivable en x0 y f ′ (x0 ) ̸= 0, entonces g es derivable


1 1
en y0 = f (x0 ), y su derivada es f ′ (x 0)
= f ′ (g(y 0 ))
, que es exactamente lo que dice el Teorema
de la función inversa.
10
Porque si la tangente es vertical, el lı́mite del cociente incremental es infinito.
163

Demostración del Teorema de la función inversa.

Supongamos que f es estrictamente creciente, ya que el caso en que es estrictamente


decreciente es análogo. En este caso, g también es estrictamente creciente.
Ejercicio 63. Demostrar que si f : I → J es estrictamente creciente, su inversa g : J → I
también lo es.

Vamos a ver en primer lugar que la inversa g de f es continua en y0 = f (x0 ). Tomemos


ε > 0. Como x0 es interior a I, existen x1 ∈ (x0 − ε, x0 ) ∩ I y x2 ∈ (x0 , x0 + ε) ∩ I. Al
ser f estrictamente creciente, f (x1 ) < y0 < f (x2 ). Tomemos δ > 0 tal que (y0 − δ, y0 +
δ) ⊂ (f (x1 ), f (x2 )). Como g es estrictamente creciente, para todo y ∈ (y0 − δ, y0 + δ),
g(y) ∈ (x1 , x2 ) ⊂ (g(y0 ) − ε, g(y0 ) + ε).

Usaremos esto para probar que g es derivable en y0 . La derivada de g en y0 es


g(y) − g(y0 )
lı́m .
y→y0 y − y0

Llamando x a g(y), tenemos que f (x) = y y podemos escribir el cociente incremental


como
x − g(y0 ) x − x0
= .
f (x) − y0 f (x) − f (x0 )
Como g es continua en y0 , lı́my→y0 g(y) = x0 , por lo que la derivada de g en y0 queda
x − x0 1 1
lı́m = ′ = ′ .□
x→x0 f (x) − f (x0 ) f (x0 ) f (g(y0 ))

Lo anterior demuestra que g es derivable en y0 y calcula su derivada. Sabiendo que g es


derivable, hay una forma sencilla de calcular su derivada usando la regla de la cadena, que
es útil para recordarla. La vemos en el siguiente recuadro.

Como f ◦ g(y) = y, derivando de ambos lados tenemos que (f ◦ g)′ (y) = 1.a Por la
regla de la cadena, (f ◦ g)′ (y0 ) = f ′ (g(y0 ))g ′ (y0 ), por lo que
1
g ′ (y0 ) = .
f ′ (g(y 0 ))

a
f ◦ g es la función identidad, que es derivable en todos los puntos de J. Por lo tanto, la igualdad
(f ◦ g)′ (y) = 1 es cierta para y ∈ J aún si f y g fueran sólo derivables en x0 e y0 , respectivamente.

Ejemplo 5.2.21. Derivada de la función exponencial.

Consideremos la función exponencial exp : R → (0, +∞), que es la inversa de log :


(0, +∞) → R. Ya sabemos que log′ (x) = x1 para todo x > 0. Entonces, por el teorema de la
164

función inversa,
1 1
exp′ (y) = ′ = 1 = exp(y).
log (exp(y)) exp(y)

Es decir, la función exponencial (exp(y) = ey ) es igual a su derivada.

Ejercicio de parcial

(Ejercicio 1 - segundo parcial 2020) Calcular f ′ (0) donde

f (x) = (2x + 1)11 ex

A) 12 C) 23 E) 34

B) 13 D) 25 F) 37

Solución. Aplicando la regla del producto:

f ′ (x) = ((2x + 1)11 )′ ex + (2x + 1)11 )(ex )′

Además, por la regla de la cadena:

((2x + 1)11 )′ = 11(2x + 1)10 · 2 = 22(2x + 1)10

Luego, f ′ (x) = 22(2x + 1)10 + (2x + 1)11 ex y, por lo tanto,

f ′ (0) = 22 + 1 = 23

Ejercicio de parcial

(Ejercicio 2 - segundo parcial primer semestre 2020) Sean r la recta de ecuación


2
y = 2x y r′ la recta tangente a la curva de ecuación y = ea(x −1) en el punto x = 1. El
valor de a para el cual r y r′ son paralelas es:

A) −2 C) 0 E) 2

B) −1 D) 1 F) 3

Solución. Comenzamos calculando la ecuación de la recta r′ . Es decir, buscamos la recta


2 2
tangente a f en x = 1 donde f (x) = ea(x −1) . Tenemos que f ′ (x) = ea(x −1) · 2a y, por lo
tanto, f ′ (1) = ea(1−1) · 2a = 2a. Luego, la recta tangente a f en x = 1 es

y = f ′ (1)(x − 1) + f (1) = 2ax + 1 − 2a

Finalmente, buscamos a de forma que las rectas

y = 2x y y = 2ax + 1 − 2a

sean paralelas. Para que esto suceda, ambas rectas deben tener la misma pendiente, es decir

2 = 2a
165

y, por lo tanto, a = 1.

Notar que en este ejercicio se puede trabajar directamente con f ′ (1) que es la pendiente
2
de la recta tangente a la curva y = ea(x −1) sin necesidad de hallar la ecuación de la recta
tangente.

5.2.6. Regla de L’Hôpital

Una aplicación muy útil de las derivadas al cálculo de lı́mites es la Regla de L’Hôpital, que
nos permite calcular muchos lı́mites “indeterminados”. Esto es, cociente de dos infinitésimos
o de dos infinitos. En esta sección sólo la vamos a enunciar, y daremos su demostración más
adelante.

Teorema 5.2.22 (Regla de L’Hôpital I). Sean f y g dos funciones derivables en un


intervalo (a, b) excepto posiblemente en un punto x0 , y tales que lı́mx→x0 f (x) = 0
y lı́mx→x0 g(x) = 0. Si g ′ (x) ̸= 0 en un entorno de x0 y existe lı́mx→x0 f ′ (x)/g ′ (x),
entonces también existe lı́mx→x0 f (x)/g(x) y

f (x) f ′ (x)
lı́m = lı́m ′ .
x→x0 g(x) x→x0 g (x)

Observación 5.2.23. La Regla de L’Hôpital I sigue siendo cierta si en lugar de tomar



lı́mite cuando x → x0 tomamos un lı́mite lateral x → x+
0 o x → x0 , e incluso si tomamos
lı́mite cuando x → ±∞.

Veamos algunos ejemplos.

Ejemplo 5.2.24. Aplicación de la regla de L’Hôpital a un lı́mite indeterminado de la forma


0/0.

Consideremos el lı́mite
e2x − 1
lı́m .
x→0 sen(x)

Es un lı́mite indeterminado de la forma 0/0. Aplicando la regla de L’Hôpital,

2e2x
lı́m = 2.
x→0 cos(x)

Ejemplo 5.2.25. ¡Hay que verificar las hipótesis!

Consideremos el lı́mite
6x − 2
lı́m = 4.
x→1 2x − 1
166

Este lı́mite no es indeterminado. Si no observamos esto, podemos caer en la tentación de


aplicar la regla de L’Hôpital, y llegar a la conclusión errónea de que
6x − 2 6
lı́m = lı́m = 3.
x→1 2x − 1 x→1 2

Ejemplo 5.2.26. La Regla de L’Hôpital no resuelve todos los problemas.

Consideremos el lı́mite 1
e− x
limx→0+ ,
x
que es un lı́mite indeterminado de la forma 0/0. Aplicando la regla de L’Hôpital, tenemos
que
1
−x
1 e 1
e− x 2 e− x
lı́m+ = lı́m+ x = lı́m+ 2 .
x→0 x x→0 1 x→0 x
Esto es correcto, pero no útil. Si seguimos aplicando la regla de L’Hôpital, este lı́mite solo
“empeora”, en el sentido de que el grado del denominador crece.

La regla de L’Hôpital también funciona para indeterminaciones de la forma ∞/∞.

Teorema 5.2.27 (Regla de L’Hôpital II). Sean f y g dos funciones derivables en


un intervalo (a, b) excepto posiblemente en un punto x0 , y tales que lı́mx→x0 f (x) =
±∞ y lı́mx→x0 g(x) = ±∞. Si existe lı́mx→x0 f ′ (x)/g ′ (x), entonces también existe
lı́mx→x0 f (x)/g(x) y
f (x) f ′ (x)
lı́m = lı́m ′ .
x→x0 g(x) x→x0 g (x)

Observación 5.2.28. La Regla de L’Hôpital II sigue siendo cierta si en lugar de tomar



lı́mite cuando x → x0 tomamos un lı́mite lateral x → x+
0 o x → x0 , e incluso si tomamos
lı́mite cuando x → ±∞.

Ejemplo 5.2.29. Aplicación de la regla de L’Hôpital a un lı́mite indeterminado de la forma


∞/∞.

Consideremos el lı́mite
e1/x
lı́m .
x→0+ log(x)

Aquı́, lı́mx→0+ e1/x = +∞ y lı́mx→0+ log(x) = −∞, por lo que este lı́mite es indeterminado.
Por la regla de L’Hôpital,
1 1 1
ex − 12 e x ex
lı́m+ = lı́m+ x1 = − lı́m+ = −∞.
x→0 log(x) x→0 x→0 x
x
167

5.3. Teorema del valor medio

Del mismo modo en que vimos algunos teoremas importantes relativos a funciones con-
tinuas en un intervalo [a, b],11 veremos en esta sección teoremas importantes relativos a
funciones que son derivables en un intervalo. El principal, y que da nombre a la sección, es
el Teorema del valor medio de Lagrange.

5.3.1. Extremos relativos

Sea f : I → R una función con dominio en un intervalo I. Recordemos que f tiene un


máximo absoluto en un punto x0 ∈ I si f (x) ≤ f (x0 ) ∀x ∈ I. La definición de mı́nimo
absoluto es análoga.

Una noción similar, pero local, es la de máximo relativo que damos a continuación.

Definición 5.3.1. La función f : I → R tiene un máximo relativo en x0 ∈ I si existe


un entorno U de x0 tal que f (x) ≤ f (x0 ) ∀x ∈ U ∩ I.
La función f : I → R tiene un mı́nimo relativo en y0 ∈ I si existe un entorno U de y0
tal que f (x) ≥ f (y0 ) ∀x ∈ U ∩ I.

Si f tiene un máximo relativo en x0 o un mı́nimo relativo en x0 , decimos que tiene un


extremo relativo en x0 .

Claramente, si f tiene un máximo absoluto en x0 , en particular tiene un máximo relativo.


En la figura siguiente podemos ver una función que tiene un máximo relativo que no es
absoluto.
11
Integrabilidad de funciones continuas, Teorema de Bolzano, Teorema de Weierstrass.
168

Para funciones derivables, tenemos la proposición siguiente:

Proposición 5.3.2. Sean f : [a, b] → R una función y x0 ∈ (a, b). Si f tiene un


extremo relativo en x0 y es derivable en x0 , entonces f ′ (x0 ) = 0.

Demostración:

Supongamos que f tiene un máximo relativo en x0 , ya que el caso en que tiene un mı́nimo
es análogo. Sea U un entorno de f , contenido en (a, b), tal que

f (x) ≤ f (x0 ) ∀x ∈ U.

Para x ∈ U , x > x0 , el cociente incremental


f (x) − f (x0 )
x − x0
es menor o igual que 0, porque f (x) − f (x0 ) ≤ 0 y x − x0 > 0. Por lo tanto,

f (x) − f (x0 )
lı́m+ ≤ 0. (5.3.3)
x→x0 x − x0
169

En forma análoga, para x ∈ U , x < x0 , el cociente incremental


f (x) − f (x0 )
x − x0
es mayor o igual que 0, por lo que
f (x) − f (x0 )
lı́m− ≥ 0. (5.3.4)
x→x0 x − x0

Como f es derivable en x0 , los lı́mites (5.3.3) y (5.3.4) son iguales y valen f ′ (x0 ). Esto
nos dice que, f ′ (x0 ) ≤ 0 y f ′ (x0 ) ≥ 0, por lo que f ′ (x0 ) = 0. □

Como siempre, es importante tener en cuenta las hipótesis de esta proposición, a saber,
que f es derivable en el punto x0 en que tiene el extremo y que x0 es interior al dominio de
f . Cuando estas hipótesis no se cumplen, la proposición no vale, como se ve en los dibujos.
En uno de ellos hay un extremo en un punto en el que la función no es derivable, y en el
otro hay un extremo en un punto que no es interior al dominio de la función.

El recı́proco de esta proposición no es cierto, como muestra el siguiente ejemplo.


Ejemplo 5.3.5. La derivada puede anularse en un punto donde no hay un extremo.

Sea f : R → R dada por f (x) = x3 . Esta función es derivable en todo su dominio, y es


estrictamente creciente. Su derivada es f ′ (x) = 3x2 , por lo que f ′ (0) = 0. Sin embargo, f no
tiene un extremo relativo en 0.

5.3.2. Teorema de Rolle

Teorema 5.3.6 (Teorema de Rolle). Sea f : [a, b] → R una función continua en [a, b]
y derivable en (a, b) tal que f (a) = f (b). Entonces existe c ∈ (a, b) tal que f ′ (c) = 0.

Este teorema nos dice que para una función derivable, si f (a) = f (b), hay algún punto
de la gráfica donde la tangente es horizontal. Este punto no tiene por qué ser único, como
se ve en la figura.
170

Demostración.

Consideremos primero el caso (muy particular) en que f es constante, es decir, f (x) =


f (a) para todo x ∈ [a, b]. En este caso f ′ (x) = 0 en todos los puntos, por lo que el teorema
vale.

Nos queda en caso en que f no es constante. Como f es continua en [a, b], el Teorema
de Weierstrass nos asegura que tiene máximo y mı́nimo absolutos.

Los extremos absolutos pueden darse en el interior de [a, b] o en el borde de [a, b], pero
como f (a) = f (b), algún extremo absoluto tiene que darse en un punto de (a, b). En efecto,
si el máximo absoluto se da en a también se da en b, y como f no es constante el máximo
y el mı́nimo no coinciden. Esto asegura que el mı́nimo se da en algún punto de (a, b). Lo
mismo pasa si en a y b hay un mı́nimo.

Sea entonces c ∈ (a, b) un punto donde hay un extremo absoluto. Entonces, como f es
derivable en c, f ′ (c) = 0. □

Si f : [0, T ] → R es la posición de un móvil que se mueve en una dimensión, la


condición f (0) = f (T ) significa que la posición inicial es igual a la posición final. El
teorema de Rolle nos dice que, en un movimiento unidimensional, si la posición inicial
y la posición final coinciden, hay un momento intermedio en que la velocidad es igual
a cero.

5.3.3. Teorema del valor medio de Lagrange

El teorema del valor medio de Lagrange se demuestra a partir del de Rolle, y es más
general. Dice lo siguiente:
171

Teorema 5.3.7 (Teorema del valor medio de Lagrange). Sea f : [a, b] → R una
función que es continua en [a, b] y derivable en (a, b). Entonces existe c ∈ (a, b) tal
que
f (b) − f (a)
f ′ (c) = .
b−a

Observemos que el cociente f (b)−f b−a


(a)
es la pendiente del segmento que une los puntos
(a, f (a)) y (b, f (b)) de la gráfica de f . Llamemos s a este segmento. Lo que nos dice este
teorema es que hay un punto c ∈ (a, b) para el cual la tangente a la gráfica de f en (c, f (c))
es paralela al segmento s. Al igual que en el teorema de Rolle, este punto podrı́a no ser
único. (Si f es una función lineal, todos los puntos cumplen esto).

Si f : [0, T ] → R es la posición de un móvil que se mueve en una dimensión, el cociente


v̄ = f (T )−f
T
(0)
es la velocidad media. Lo que nos dice el teorema de Lagrange es que
hay un momento intermedio en que la velocidad instantánea es igual a v̄.
Supongamos, por ejemplo, que un auto que circula por la ruta interbalnearia pasa por
el peaje Pando a las 3 de la tarde y por el peaje Solı́s a las 3:20. La distancia entre
ambos peajes es de 48,6 km, y el auto la recorrió en 20 minutos, es decir, en 1/3 de
hora. La velocidad media es por lo tanto
48, 6km
v̄ = 1 = 145, 8 km/h.
3
h

La velocidad máxima permitida es 110 km/h. ¿Es correcto que al llegar al peaje Solı́s
el auto sea multado? ¡Claro que sı́! El teorema del valor medio de Lagrange nos
asegura que en algún momento entre las 3:00 y las 3:20 la velocidad instantánea fue
de 145, 8 km/h, lo cual supera en mucho la velocidad máxima permitida.

Demostración del Teorema 5.3.7.

La imagen que ilustra el teorema de Lagrange es similar a la que ilustra el teorema de


Rolle, pero “torcida”. La idea de esta demostración consiste en tomar una función auxiliar
“enderece” a f , de modo de poder aplicarle el teorema de Rolle.
172

Observemos, en la figura, la gráfica de f y el segmento s, que une los puntos (a, f (a)) y
(b, f (b)). El segmento s es la gráfica de una función lineal h : [a, b] → R.

La derivada de h es constante e igual a la pendiente de s, es decir, es f (b)−f b−a


(a)
. Además,
la función g : [a, b] → R que es la diferencia g = f − h cumple g(a) = g(b) = 0. Es decir, g
está en las hipótesis del teorema de Rolle. Por lo tanto, existe un punto c ∈ (a, b) tal que
g ′ (c) = 0. Como g ′ (c) = f ′ (c) − h′ (c), esto quiere decir, que f ′ (c) = h′ (c) = f (b)−f
b−a
(a)
.□

Observación 5.3.8. La función h que tomamos está dada por h(x) = f (b)−f
b−a
(a)
(x−a)+f (a).
f (b)−f (a)
Lo único que nos importa de ella es que es una función lineal con derivada b−a , por lo
que con cualquier función ası́ se puede hacer el mismo argumento.12

Observación 5.3.9. El Teorema 5.3.6 es un caso particular del Teorema 5.3.7. En efecto,
cuando f (b) = f (a), el cociente f (b)−f
b−a
(a)
vale 0, y en el punto intermedio c dado por el
teorema de Lagrange se cumple que f ′ (c) = 0.

5.3.4. Demostración de la Regla de L’Hôpital

En esta sección daremos (¡al fin!) una prueba del Teorema 5.2.22, la Regla de L’Hôpital
I.

Lema 5.3.10. Observemos que, bajo las hipótesis del Teorema 5.2.22, existe un entorno
reducido de x0 donde g(x) ̸= 0.

12 f (b)−f (a)
¿Por qué para cualquier función lineal h con derivada b−a se cumple que (f − h)(a) = (f − h)(b)?
173

Demostración.

Sabemos por hipótesis que existe un entorno de x0 donde g ′ (x) ̸= 0. Es decir, existe δ > 0
tal que g ′ (x) ̸= 0 para todo x ∈ E ∗ (x0 , δ).

Supongamos que en todo entorno reducido de x0 hay ceros de la función g. En particular,


existe y0 ∈ E ∗ (x0 , δ) tal que g(y0 ) = 0. Sea δ1 = d(x0 , y0 ), y observemos que δ1 < δ. Existe
y2 ∈ E ∗ (x0 , δ1 ) tal que g(y1 ) = 0.

Si y0 e y1 son ambos mayores que x0 , tenemos que x0 < y1 < y0 < x0 + δ. La función g
es derivable en el intervalo (y1 , y0 ), continua en [y1 , y0 ] y g(y1 ) = g(y0 ) = 0. Por el teorema
de Rolle, existe c ∈ (y1 , y0 ) tal que g ′ (c) = 0. Esto es absurdo porque, por hipótesis, no hay
ceros de g ′ en E ∗ (x0 , δ).

Si y0 e y1 son ambos menores que x0 , haciendo un argumento análogo también llegamos


a una contradicción.

Si (y0 −x0 )(y1 −x0 ) < 0, tomemos δ2 = d(x0 , y1 ). Existe y2 ∈ E ∗ (x0 , δ2 ) tal que g(y2 ) = 0.
De los tres puntos y0 , y1 e y2 , dos deben estar del mismo lado de x0 , y podemos aplicarles
el razonamiento anterior. □

Demostración del Teorema 5.2.22.

Las funciones f y g pueden no estar definidas en x0 , por lo que consideramos las nuevas
funciones con dominio (a, b) dadas por

f (x) si x ̸= x0
F (x) =
0 si x = x0
y 
g(x) si x ̸= x0
G(x) =
0 si x = x0
Son continuas en x0 . Fijemos x ∈ (a, b), x ̸= x0 . Supongamos que x > x0 , ya que el otro
caso es análogo. Sea
h : [x0 , x] → R
la función dada por
h(y) = F (y)G(x) − G(y)F (x).
Entonces h es continua en [x0 , x] y derivable en (x0 , x). Además, h(x) = h(x0 ).13 Por el
teorema de Rolle, existe cx ∈ (x0 , x) tal que h′ (cx ) = 0.

Como h′ (y) = F ′ (y)G(x) − G′ (y)F (x) = f ′ (y)g(x) − g ′ (y)f (x), esto quiere decir que
f ′ (cx ) f (x)

= .
g (cx ) g(x)
13
¡Verificarlo!
174

Cuando x → x+ +
0 , cx → x0 , por lo que tomando lı́mite de ambos lados de esta igualdad
tenemos que
f ′ (cx ) f ′ (x) f (x)
lı́m+ ′ = lı́m+ ′ = lı́m+ .
x→x0 g (cx ) x→x0 g (x) x→x0 g(x)

De forma análoga probamos que

f ′ (cx ) f ′ (x) f (x)


lı́m− ′ = lı́m− ′ = lı́m− ,
x→x0 g (cx ) x→x0 g (x) x→x0 g(x)

y esto concluye la demostración. □

No demostraremos la Regla de L’Hôpital II que sirve para las indeterminaciones de la


forma ∞

. Se demuestra haciendo un cambio de variable (astuto) a partir de la anterior.

5.4. Crecimiento y clasificación de extremos

5.4.1. Crecimiento y signo de la derivada

El Teorema del valor medio de Lagrange tiene muchas consecuencias geométricas impor-
tantes para las funciones derivables. Una de ellas es que nos indica cuándo una tal función
crece, decrece o permanece constante.

Proposición 5.4.1. Si I ⊂ R es un intervalo y f : I → R es una función derivable


tal que f ′ (x) = 0 para todo x ∈ I, entonces f es constante.

Demostración.

Para ver que f es constante, tenemos que demostrar que para cualquier par de puntos
a, b ∈ I, f (a) = f (b). Tomemos entonces a, b ∈ I con a < b. La restricción de f al intervalo
[a, b] está en las hipótesis del Teorema 5.3.7, por lo que existe c ∈ (a, b) tal que

f (b) − f (a) = f ′ (c)(b − a).

Como f ′ (c) = 0, esto nos dice que f (b) = f (a). □

Recordemos que f es creciente en un intervalo I si para todo par de puntos x, y ∈ I


con x < y se cumple que f (x) ≤ f (y). Decimos que es estrictamente creciente si para todo
par de puntos x, y ∈ I con x < y se cumple que f (x) < f (y). La definición de función
estrictamente decreciente es análoga.
175

Teorema 5.4.2. Sean I ⊂ R un intervalo y f : I → R es una función derivable.

1. Si f ′ (x) > 0 para todo x ∈ I, entonces f es estrictamente creciente.

2. Si f ′ (x) < 0 para todo x ∈ I, entonces f es estrictamente decreciente.

Demostración.

Demostraremos lo primero, ya que lo segundo es análogo.

Tomemos a, b ∈ I con a < b. La restricción de f al intervalo [a, b] está en las hipótesis


del Teorema 5.3.7, por lo que existe c ∈ (a, b) tal que

f (b) − f (a) = f ′ (c)(b − a).

Como f ′ (c) > 0, esto nos dice que f (b) > f (a). □

Ejemplo 5.4.3. Estudio del crecimiento a partir del signo de la derivada.

Consideremos la función f : R → R dada por f (x) = x3 − 3x2 − 9x + 5. La derivada de


f es
f ′ (x) = 3x2 − 6x − 9 = 3(x − 3)(x + 1).
Por lo tanto,

ˆ f ′ se anula en −1 y en 3.

ˆ f ′ es positiva en (−∞, −1) ∪ (3, +∞).

ˆ f ′ es negativa en (−1, 3).

De lo anterior podemos concluir que f es estrictamente decreciente en (−1, 3), que es estric-
tamente creciente en (−∞, −1) y que también es estrictamente creciente en (3, +∞).
Ejercicio 64. Sea g : (−∞, −1) ∪ (3, +∞) → R la restricción de la función f del ejemplo
anterior al conjunto (−∞, −1) ∪ (3, +∞). ¿Es g una función creciente?
Ejemplo 5.4.4. La condición dada en el Teorema 5.4.2 para que f sea estrictamente cre-
ciente es suficiente, pero no necesaria.

Para ver esto, consideremos la función f : R → R dada por f (x) = x3 . Es estrictamente


creciente, y f ′ (0) = 0.

En el Teorema 5.4.2 se pide que f ′ sea positiva (o negativa) en un intervalo. Veremos en


el siguiente ejemplo que si f ′ > 0 en un punto, esto no es suficiente para garantizar que f
crece en un entorno de ese punto.
176

Ejemplo 5.4.5. Función con derivada positiva en un punto que no es creciente en un


entorno del punto.

Consideremos la función f : R → R dada por


 1 1

10
x + x2 sen x
si x ̸= 0
f (x) =
0 si x = 0

Esta función es derivable en R −{0} porque se obtiene haciendo sumas, productos, cocien-
tes y composiciones de funciones derivables. También es derivable en 0 (ver el Ejemplo 5.2.9),
y f ′ (0) = 10
1
.

Para x ̸= 0,    
′ 1 1 1
f (x) = + 2xsen − cos .
10 x x

Ejercicio 65. Demostrar que para todo ε > 0, la derivada f ′ toma valores positivos y
negativos en el intervalo (0, ε).

Observemos que en R − {0} la derivada f ′ es continua. Por lo tanto, el Teorema de


conservación del signo nos asegura que si f ′ (x0 ) > 0 en un x0 ̸= 0, entonces hay un entorno
de x0 donde f ′ > 0.

Del ejercicio y de la observación anterior podemos concluir que en (0, ε) hay subintervalos
donde la función f crece y donde la función f decrece. Por lo tanto, a pesar de que f ′ (0) > 0,
no hay ningún entorno de 0 donde f sea creciente.
177

5.4.2. Clasificación de extremos a partir del signo de la derivada

Definición 5.4.6. Sea f una función que es derivable en un punto x0 de su dominio.


Si f ′ (x0 ) = 0, decimos que x0 es un punto crı́tico de f .

Usando esta definición, podemos reescribir la Proposición 5.3.2 diciendo que si f : [a, b] →
R es derivable en x0 ∈ (a, b) y f tiene un extremo relativo en x0 , entonces x0 es un punto
crı́tico de f .14

Hasta ahora, vimos cómo el signo de f ′ nos sirve para estudiar el crecimiento de f en
los intervalos que no contienen puntos crı́ticos. Ahora veremos lo que el signo de f ′ nos dice
sobre los puntos crı́ticos de f . Comenzaremos con un par de ejemplos.

Ejemplo 5.4.7. Clasificación de extremos.

Retomemos la función del Ejemplo 5.4.3, es decir, la función f : R → R dada por


f (x) = x3 − 3x2 − 9x + 5. Ya hemos visto que su derivada se anula cuando x = −1 y cuando
x = 3, y hemos estudiado el crecimiento de f en los intervalos (−∞, −1), (−1, 3) y (3, +∞).

¿Qué podemos decir de los puntos -1 y 3? Como en esos puntos f ′ vale 0, de acuerdo a
la Proposición 5.3.2 podrı́a haber en ellos extremos relativos.

Observemos que para x < −1 la función f crece, y a partir de −1 empieza a decrecer.


Por lo tanto, en el punto x = −1 la función f tiene un máximo relativo. Para −1 < x < 3
la función f decrece, y a partir de 3 empieza a crecer. Por lo tanto, en el punto x = 3 la
función f tiene un mı́nimo relativo.

Ejemplo 5.4.8. Identificación de un punto crı́tico que no es un extremo.

Consideremos ahora la función f : R → R dada por f (x) = x3 − 3x2 + 3x − 1. Su derivada


es f ′ (x) = 3x2 − 6x + 3 = 3(x − 1)2 .

Por lo tanto,

ˆ f ′ se anula únicamente en 1.

ˆ f ′ es positiva en (−∞, 1) ∪ (1, +∞).

De lo anterior podemos concluir que f es estrictamente creciente tanto en (−∞, 1) como en


(1, +∞). ¿Qué pasa en x = 1? La función f crece para x < 1, y también para x > 1. Por lo
tanto, en el punto crı́tico 1 no hay ni un máximo ni un mı́nimo relativo.
14
Atención: es fundamental para que esta proposición sea cierta que x0 ̸= a y x0 ̸= b.
178

5.4.3. Clasificación de extremos con la derivada segunda

Decimos que una función f es dos veces derivable en un intervalo I si es derivable en I


y su derivada, f ′ , es a su vez derivable en I. La derivada de f ′ se denota por f ′′ , y se llama
derivada segunda (o derivada de orden dos) de f .

Como la derivada de f nos habla del crecimiento y decrecimiento de f , la derivada


segunda nos habla del crecimiento y decrecimiento de f ′ . Veremos una primera aplicación
de este fenómeno en la clasificación de los extremos relativos de f .

Teorema 5.4.9. Sea f : [a, b] → R es una función dos veces derivable en (a, b) y tal
que f ′′ es continua. Sea x0 ∈ (a, b) un punto crı́tico de f .

1. Si f ′′ (x0 ) > 0, entonces f tiene un mı́nimo relativo en x0 .

2. Si f ′′ (x0 ) < 0, entonces f tiene un máximo relativo en x0 .

Demostración.

Demostremos el primer inciso, ya que el segundo es análogo.

Como f ′′ (x0 ) > 0 y f ′′ es continua, por el Teorema de conservación del signo existe δ > 0
tal que f ′′ es positiva en (x0 − δ, x0 + δ). El Teorema 5.4.2 nos dice por lo tanto que f ′ es
estrictamente creciente en ese entorno.

Como f ′ (x0 ) = 0, lo anterior implica que f ′ < 0 en (x0 − δ, x0 ) y f ′ > 0 en (x0 , x0 + δ).
Es decir, f decrece a la izquierda de x0 y crece a la derecha de x0 . Concluimos que f tiene
en x0 un mı́nimo relativo. □
Ejemplo 5.4.10. Clasificación de extremo usando la derivada segunda.

Consideremos nuevamente la función f : R → R dada por f (x) = x3 − 3x2 − 9x + 5. La


derivada de f es
f ′ (x) = 3x2 − 6x − 9 = 3(x − 3)(x + 1),
por lo que los puntos crı́ticos de f son -1 y 3. La derivada segunda de f es

f ′′ (x) = 6x − 6,

que por ser una función polinómica es continua. Como f ′′ (−1) = −12 < 0 y f ′′ (3) = 12 > 0,
concluimos que f tiene un máximo relativo en x = −1 y un mı́nimo relativo en x = 3.
Ejemplo 5.4.11. ¿Qué pasa cuando f ′′ (x0 ) = 0?

El criterio anterior no nos dice lo que pasa en un punto crı́tico x0 cuando f ′′ (x0 ) = 0.
En este caso, la derivada segunda no sirve para clasificar el punto crı́tico. Veámoslo en los
siguientes ejemplos.
179

Consideremos las funciones f1 , f2 y f3 definidas en R por


f1 (x) = x3 , f2 (x) = x4 , f3 (x) = −x4 .

Para todas ellas, 0 es un punto crı́tico. Es decir, f1′ (0) = f2′ (0) = f3′ (0) = 0. Además, para
todas ellas, la derivada segunda se anula en 0. Es decir, f1′′ (0) = f2′′ (0) = f3′′ (0) = 0.

Observemos que f2 tiene un máximo relativo en 0, f3 tiene un mı́nimo relativo en 0, y


f3 no tiene extremo relativo en 0.

Resumamos brevemente lo que sabemos sobre la clasificación de extremos, en el siguiente


recuadro.

Si tenemos una función f : [a, b] → R continua, el Teorema de Weierstrass nos asegura


que f tiene máximo y mı́nimo absolutos. Es decir, hay al menos dos puntos de [a, b]
donde f presenta un extremo relativo.

Si además f es derivable en (a, b), los extremos relativos que se den en puntos de (a, b)
deben darse en puntos crı́ticos. Por lo tanto, para encontrar los extremos relativos,
buscamos primero puntos x0 ∈ (a, b) tales que f ′ (x0 ) = 0. Estudiando el signo de f ′
en un entorno de x0 , a veces podemos determinar si en x0 hay un máximo relativo,
un mı́nimo relativo, o si no hay un extremo relativo.

Si además f ′ es derivable en (a, b) y f ′′ es continua, a veces podemos determinar si en


un punto crı́tico x0 tenemos un máximo o un mı́nimo, mirando el signo de f ′′ .

Ejemplo 5.4.12. Búsqueda y clasificación de extremos para una función definida en un


intervalo cerrado.

Consideremos la función f : [0, 3] → R dada por

f (x) = 3x4 − 16x3 + 30x2 − 24x + 3.

Su derivada es
f ′ (x) = 12x3 − 48x2 + 60x − 24 = 12(x − 1)2 (x − 2),
180

por lo que los puntos crı́ticos de f en (0, 3) son x = 1 y x = 2. La derivada segunda de f es

f ′′ (x) = 36x2 − 96x + 60.

Como f ′′ (2) > 0, podemos concluir que f tiene en x = 2 un mı́nimo relativo. Sin embargo,
f ′′ (1) = 0, por lo que la derivada segunda de f no nos sirve para determinar si en x = 1
hay o no un extremo. Sin embargo, si miramos el signo de f ′ , vemos que f ′ < 0 en (0, 1)
y en (1, 2), por lo que f es decreciente en estos intervalos. De esta información sı́ podemos
concluir que f no tiene un extremo en x = 1.

Veamos qué pasa en los puntos 0 y 3, ya que, al ser [0, 3] el dominio de f , podrı́a haber
extremos relativos en esos puntos aunque no se anule la derivada. Como f ′ < 0 en (0, 1),
ahı́ la función f es estrictamente decreciente, por lo que f tiene un máximo relativo en 0.
Análogamente, como f ′ > 0 en (2, 3), ahı́ f es estrictamente creciente, por lo que f tiene un
máximo relativo en 3.

¿Qué pasa con los extremos absolutos? El mı́nimo absoluto de f debe darse en el único
punto en que hay un mı́nimo relativo, es decir, en x = 2. Por lo tanto el mı́nimo absoluto
de f es f (2) = −5. El máximo absoluto puede darse en x = 0 o en x = 3. Como f (0) = 3 y
f (3) = 12, el máximo absoluto es f (3) = 12.
181

Ejercicio de parcial

(Ejercicio 6 - segundo parcial primer semestre 2020) Calcular el valor mı́nimo


alcanzado por la función

f (x) = x log(3x) + (1 − x) log(4(1 − x))

en el intervalo (0, 1).

(A) log(4) − log(5) (C) log(4) − log(3) (E) log(12) − log(7)

(B) log(5) − log(6) (D) log(10) − log(7) (F) log(15) − log(8)

Solución. Notemos que el intervalo (0, 1) donde buscamos el valor mı́nimo alcanzado por
la función es un intervalo abierto. Comenzamos calculando la derivada de f . Por la regla del
producto y la regla de la cadena, tenemos que

f ′ (x) = log(3x) − log(4(1 − x))

Luego, para encontrar el mı́nimo alcanzado por la función, buscamos los valores de x donde
f tiene un extremo relativo, es decir los valores de x tales que f ′ (x) = 0.

f ′ (x) = 0 ⇔ log(3x) − log(4(1 − x)) = 0


⇔ log(3x) = log(4(1 − x))
⇔ 3x = 4(1 − x)
4
⇔x=
7
Para ver si f alcanza un mı́nimo relativo en x = 47 nos interesa conocer el signo de f ′′ ( 74 ).
Tenemos que
1 1
f ′′ (x) = +
x 1+x
por lo que
4 7 7
f ′′ ( ) = + > 0
7 4 3
′′ 4
Dado que f ( 7 ) > 0, concluı́mos que f alcanza un mı́nimo relativo en x = 47 y el valor
mı́nimo alcanzado por la función f en el intervalo (0, 1) es
4 4 4 4 4
f ( ) = log(3 · ) + (1 − ) log(4(1 − )) = log(12) − log(7)
7 7 7 7 7
182

Ejercicio de parcial

(Ejercicio 2 - Segundo parcial primer semestre 2022) Sea f : [0, 2] → R dada


por f (x) = e−x (x2 − x + 1). Si M es el máximo de la función y m es el mı́nimo de la
función, entonces:
1
A) mM = e
3
B) mM = e3
3
C) mM = e2

D) mM = 2e

E) mM = 3e

Solución. Notemos que el intervalo [0, 2] donde buscamos el máximo y el mı́nimo alcanzado
por la función es un intervalo cerrado. En tal sentido comenzaremos buscando extremos
relativos en el intervalo abierto (0, 2) y luego estudiaremos lo que ocurre en los extremos
del intervalo [0, 2], es decir lo que ocurre en 0 y en 2. Para buscar extremos relativos en
el intervalo (0, 2), comenzamos calculando la derivada de f . Por la regla del producto y la
regla de la cadena, obtenemos:

f ′ (x) = e−x (x2 − x + 1) + e−x (2x − 1) = e−x (−x2 + 3x − 2)

Luego, buscamos los valores de x tales que f ′ (x) = 0

f ′ (x) = 0 ⇔ e−x (−x2 + 3x − 2) = 0


⇔ −x2 + 3x − 2 = 0 pues e−x > 0
⇔x=1ox=2

Por lo tanto, f alcanza extremos relativos en x = 1 y z = 2. Para ver su son máximos o


mı́nimos realtivos estudiamos el signo de f ′′ en estos puntos. Tenemos que

f ′ (x) = e−x (x2 − 5x + 5)

por lo tanto
f ′′ (1) = e−1 (1 − 5 + 5) = e−1 > 0
es decir, f alcanza un mı́nimo relativo en x = 1, y

f ′′ (2) = e−2 (22 − 5 · 2 + 5) = −e−1 < 0

es decir, f alcanza un máximo relativo en x = 2.

¡Cuidado! Dado que estamos buscando los extremos absolutos de f en [0, 2] que es un
intervalo cerrado, f podrı́a alcanzar un máximo o un mı́nimo en los extremos del intervalo
[0, 2] sin que estos sean necesariamente puntos donde se anule la derivda de f. Luego, para
encontrar los extemos absolutos de f en [0, 2] comparamos el mı́nimo y el máximo relativos
que encontramos a los valores que toma f en 0 y 2:
183

f (0) = 1, f (1) = e−1 , f (2) = 3e−2

Tenemos que f (2) = 3e−2 es un máximo relativo de f pero f (2) < f (0) por lo que f (2) no
es el máximo de f en [0, 2]. Finalmente,

M = 1 y m = e−1

y, por lo tanto, M m = 1 · e−1 = 1e .

Ejercicio de parcial

(Ejercicio 11 - segundo parcial primer semestre 2020) Queremos construir cinco


corrales idénticos, de acuerdo al plano que se muestra en la figura. Para eso, haremos
una cerca de alambre, que incluye el perı́metro total (o sea el rectángulo ABCD) ası́
como las separaciones entre corrales adyacentes. En otras palabras, la cerca incluye
todas las lı́neas negras en la figura. Queremos que el área total de los cinco corrales
sea de 900m2 . Si queremos minimizar la longitud de la cerca, ¿qué dimensiones debe
tener el rectángulo ABCD?

√ √
A) 12 3m × 25 3m D) 15m × 60m
√ √ √ √
B) 30 3m × 10 3m E) 15 2m × 30 2m
√ √
C) 30m × 30m F) 18 5m × 10 5m

Solución. Le llamamos x a la longitud AB e y a la longitud de BC. Dado que el área


de ABCD es de 900m2 , tenemos que xy = 900 y, por lo tanto, y = 900 x
. Por otro lado, la
longitud total del cerca es 2y + 6x. Entonces, queremos minimizar 2y + 6x bajo la condición
y = 900
x
. Es decir, nos interesa minimizar la función

900
f (x) = 2 · + 6x
x
Comenzamos calculando la derivada de f :
1
f ′ (x) = −1800 · +6
x2
184

y buscamos los valores de x para los cuales f ′ (x) = 0:


1
f ′ (x) = 0 ⇔ −1800 · +6=0
x2
⇔ 6x2 − 1800 = 0
√ √
⇔ x = 10 3 o x = −10 3

Notamos que x no puede vales √ −10 3 ya que x es una distancia. Estudiamos, entonces el
extremos relativo√en x = 10 3. Para ver si es un máximo o un mı́nimo relativo, estudiamos
el signo de f ′′ (10 3). Tenmos que

f ′′ (x) = 1800 · 3x−4


√ √ √
por lo que f ′′ (10 3) = 1800 · 3(10 3)−4 > 0, es decir, f alcanza un mı́nimo en x = 10 3.
Luego, las dimensiones que debe tener el rectángulo ABCD son:
√ 900 √
x = 10 3m, y = √ = 30 3m
10 3
Capı́tulo 6

Teorema fundamental del cálculo y


métodos de integración

El Teorema Fundamental del Cálculo es, como su nombre lo indica, el resultado central
de este curso. Es, además, el motivo por el cual el cálculo diferencial y el cálculo integral se
consideran un único objeto de estudio, e invariablemente se enseñan juntos.

Observemos que, a priori, la integral y la derivada son objetos totalmente diferentes. La


integral es un área, y el problema del cálculo de áreas, y la idea de aproximar las áreas
a calcular por la suma de áreas de figuras conocidas, ya aparecen en la matemática de la
antigua Grecia. Por otra parte, la derivada es históricamente muy posterior. Surgió alrededor
del siglo XVII, como herramienta para hallar extremos y rectas tangentes a curvas, y se
incorporó a la mecánica clásica como tasa de cambio o velocidad.

El Teorema Fundamental del Cálculo nos dice, por lo tanto, algo sorprendente por lo poco
intuitivo: que el problema de derivar y el problema de integrar son esencialmente problemas
inversos.

Para precisar esta idea, daremos la definición siguiente:

Definición 6.0.1. Sea f : I → R una función definida en un intervalo I. Una primitiva


de f es una función derivable g : I → R tal que

g ′ = f.

El Teorema Fundamental del Cálculo nos dice que las funciones continuas siempre tienen
primitivas, y que estas primitivas se calculan integrando.

En este capı́tulo veremos este importante resultado, y una de sus consecuencias más
importantes: podemos usar nuestro conocimiento de derivadas para calcular integrales.

185
186

6.1. Teorema Fundamental del Cálculo

6.1.1. Teorema Fundamental del Cálculo: enunciado y demostra-


ción

Cuando tenemos una función f : [a, b] → R que es integrable, podemos definir una nueva
función F : [a, b] → R por la expresión
Z x
F (x) = f (t) dt.
a

La Proposición 4.2.24 del capı́tulo Lı́mites y continuidad de las notas de este curso nos
dice que la función F es continua.
Ejercicio 66. Observemos que para definir F es necesario que f sea integrable en [a, x], para
todo x ∈ [a, b]. En este ejercicio demostraremos que si f es integrable en [a, b], también es
integrable en [a, x] para todo x ∈ [a, b].

Para esto, fijemos x ∈ [a, b] y definamos una nueva función g : [a, b] → R dada por

f (t) si t < x
g(t) =
0 si t ≥ x

1. Sea P una partición de [a, b] que contiene al punto x. Probar que S ∗ (g, P )−S∗ (g, P ) ≤
S ∗ (f, P ) − S∗ (f, P ).
2. Probar que, dado ε > 0, existe una partición P de [a, b] tal que S ∗ (g, P )−S∗ (g, P ) < ε.
Concluir que g es integrable en [a, b].
187

3. Observar que g es integrable en [x, b], y concluir que es integrable en [a, x].

4. Probar que f es integrable en [a, x].

Ahora veremos que, en los puntos en que f es continua, F es no solo continua sino
derivable.

Teorema 6.1.1 (Teorema Fundamental del Cálculo, o TFC). Sea f : [a, b] → R una
función que es integrable en [a, b], y definamos F : [a, b] → R por
Z x
F (x) = f (t) dt.
a

Si x0 ∈ [a, b] es un punto en el que f es continua, entonces F es derivable en x0 y


F ′ (x0 ) = f (x0 ).

Demostración.

Calcularemos el cociente incremental de F en el punto x0 .

Es
F (x0 + h) − F (x0 )
.
h
En la figura, toda el área pintada es F (x0 + h) y el área pintada de celeste es F (x0 ). La
diferencia F (x0 + h) − F (x0 ) es el área rosada.
188

La derivada es el lı́mite de este cociente incremental, es decir:

F (x0 + h) − F (x0 )
F ′ (x0 ) = lı́m
h→0 h
Z x0 +h Z x0 
1
= lı́m f (t) dt − f (t) dt
h→0 h a a
1 x0 +h
Z
= lı́m f (t) dt
h→0 h x
0

1 x0 +h
Z
= lı́m f (x0 ) + (f (t) − f (x0 )) dt
h→0 h x
0
 Z x0 +h 
1
= lı́m f (x0 )h + (f (t) − f (x0 )) dt
h→0 h x0
1 x0 +h
Z
= f (x0 ) + lı́m (f (t) − f (x0 )) dt
h→0 h x
0

Para ver que F ′ (x0 ) = f (x0 ), sólo nos queda probar que
1 x0 +h
Z
lı́m (f (t) − f (x0 )) dt = 0. (6.1.2)
h→0 h x
0

Como f es continua en x0 , para todo ε > 0 existe δ > 0 tal que |f (x) − f (x0 )| < ε si
|x − x0 | < δ. Entonces, si tomamos h con |h| < δ, tendremos que |f (t) − f (x0 )| es menor
que ε para t entre x0 y x0 + h. Por to tanto, para |h| < δ,
1 x0 +h 1 x0 +h
Z Z
(f (t) − f (x0 )) dt ≤ |f (t) − f (x0 )| dt < ε.
h x0 h x0
Como ε es arbitrario, esto demuestra 6.1.2. □
189

Observación 6.1.3. Supongamos ahora que I es un intervalo cualquiera, no necesariamente


acotado, que a ∈ I y que f : I → R es integrable en [a, x] o en [x, a], según corresponda,
para todo x ∈ I.

Podemos definir F : I → R por


Z x
F (x) = f (t) dt.
a

Ra
Como es usual, cuando x < a, esto simplemente quiere decir que F (x) = − x
f (t) dt.

En este caso, el TFC también nos dice que si x0 ∈ I es un punto de continuidad de f ,


entonces F es derivable en x0 y F ′ (x0 ) = f (x0 ).

Veámoslo.

En efecto, cuando x0 ≥ a podemos tomar b ∈ I tal que a ≤ x0 ≤ b y aplicar el


Teorema 6.1.1 a f en [a, b]. Cuando x0 < a, podemos tomar b ∈ I tal que b ≤ x0 ≤ a
y aplicarR el Teorema 6.1.1 a f en [b, a]. Nos dice que si G : [b, a] → R está dada por
x
G(x) = b f (t) dt, entonces G′ (x0 ) = f (x0 ). Pero
Z a
G(x) = f (t) dt + F (x),
b

f (t) dt ∈ R (es decir, no depende de x), F ′ (x0 ) = G′ (x0 ).


Rb
y como a

Corolario 6.1.4. Sean I un intervalo y f : I → R una función continua. Entonces f tiene


una primitiva en I.
190

El corolario anterior nos dice que las funciones continuas tienen primitiva. Pero... ¿hay
funciones que no tengan primitiva? ¿Podremos conocer alguna?
Tomemos la función f : R → R dada por

0 si x < 0
f (x) =
1 si x ≥ 0

Supongamos que g : R → R es una primitiva de f , es decir, que g es derivable y


g ′ = f . Como g es derivable, es una función continua. Sumándole a g una constante,
no modificamos su derivada y podemos suponer que g(0) = 0.
Si a < 0, podemos aplicar el Teorema del valor medio de Lagrange a g en [a, 0], y
obtenemos c ∈ (a, 0) tal que

g(0) − g(a)
= g ′ (c) = f (c) = 0,
0−a
por lo que g(a) = 0. Es decir, g vale 0 en (−∞, 0).
Si b > 0, podemos aplicar el Teorema del valor medio de Lagrange a g en [0, b], y
obtenemos c ∈ (0, b) tal que

g(b) − g(0)
= g ′ (c) = f (c) = 1,
b−0
por lo que g(b) = b. Es decir, g es la función identidad en (0, +∞).
Es decir, 
0 si x < 0
g(x) =
x si x > 0
Como g es continua en 0, g(0) = lı́mx→0 g(x) = 0 y

0 si x ≤ 0
g(x) =
x si x > 0

¡Pero esta función no puede ser la primitiva de f , porque no es una función derivable!
Esto demuestra que f , en realidad, no tiene primitiva.

6.1.2. Primitivas de una función

Tomemos ahora una función continua f : I → R definida en un intervalo I, que puede


ser un intervalo acotado o no acotado.

El Teorema Fundamental del Cálculo no nos da solo una primitiva de f . En general, nos
da infinitas. Esto es porque si a, a′ ∈ I son dos puntos distintos, las funciones dadas por
Z x Z x
Fa (x) = f (t) dt y Fa′ (x) = f (t) dt
a a′
191

son ambas primitivas de f , y en general no son iguales porque


Z a′
Fa (x) − Fa′ (x) = f (t) dt.
a

Ejemplo 6.1.5. Dos primitivas de la función identidad.

Si f : R → R está dada por f (x) = x, las funciones F0 (x) =


Rx x2
0
t dt = 2
y F1 (x) =
Rx 2
1
t dt = x2 − 21 son dos primitivas diferentes de f .

Cualquier función de la forma g(x) = x2


2
+ k, con k ∈ R, será también una primitiva de
f.

Volvamos a pensar en una función continua cualquiera f definida en un intervalo I. Como


habı́amos dicho, el TFC nos da, para cada a ∈ I, una primitiva Fa . Si elegimos otro punto
a′ , obtenemos otra primitiva que difiere de la anterior en una constante.

Aquı́ surge una pregunta natural: ¿habrá otras primitivas de f, que no se obtengan
sumando una constante a Fa ? Como veremos a continuación, la respuesta es no.

Proposición 6.1.6. Sea f : I → R una función. Si g y h son dos primitivas de f ,


entonces g − h es constante.

Vamos primero a probar un lema, que es en realidad un caso particular de la Proposi-


ción 6.1.6.

Lema 6.1.7. Si g : I → R es una función derivable en un intervalo I tal que g ′ = 0,


entonces g es constante.

Demostración del Lema 6.1.7.

Sean a y b dos puntos de I; tenemos que probar que g(a) = g(b). Sin pérdida de generali-
dad, supongamos que a < b. Aplicando el Teorema del valor medio de Lagrange a la función
g en el intervalo [a, b], tenemos que existe c ∈ (a, b) para el cual

g(b) − g(a) = g ′ (c)(b − a).

Como g ′ (c) = 0, esto nos dice que g(b) − g(a) = 0, es decir, que g(b) = g(a).□
192

Notación
Una notación muy usual es la llamada notación de Leibniz para las primitivas, que
explicaremos en este recuadro.
Cuando se escribe Z
g(x) = f (x) dx

eso quiere decir “la función g es una primitiva de la función f ”.


Por ejemplo, Z
sen(x) = cos(x) dx.

Observemos que esto no es una igualdad de funciones, porque hay muchas primitvas
de f .a
Otra notación usual es Z
f (x) dx = g(x) + C,

y eso se lee “la familia de las primitivas de f es el conjunto de las funciones de la


forma g + C, donde c es una constante”.
Por ejemplo, Z
cos(x) dx = sen(x) + C.

a
La notación de Leibniz, si bien es muy usual, no es muy “correcta” para los estándares de escritura
de la matemática moderna. Normalmente al escribir el signo de igual (=), lo que está a su izquierda
es igual a lo que está a su derecha. Por ejemplo, la expresión “2 + 2 = 4”, que es una igualdad entre
números, dice que el número 2 + 2 es igual al número 4. En particular, si a la izquierda del signo “=”
hay un número, a la derecha tiene que haber también un número. Del mismo modo, si a la izquierda
del signo “=” hay una función, a la derecha tendrı́a que haber también una función. La notación de
Leibniz no debe leerse de este modo.

Demostración de la Proposición 6.1.6:

Como g y h son dos primitivas de f , tenemos que (g − h)′ = g ′ − h′ = f − f = 0. Por lo


tanto, el Lema 6.1.7 nos dice que g − h es constante.□

6.1.3. Derivada de funciones dadas por expresiones integrales

Ejemplo 6.1.8. Aplicación directa del TFC.

Consideremos la función F : R → R dada por


Z x
F (x) = t2 cos(t3 − 1)e−sen(t) dt.
0

La derivada de F es F (x) = x cos(x − 1)e−sen(x) . Ahora consideremos G : R → R dada por


′ 2 3
Z x
G(x) = t2 cos(t3 − 1)e−sen(t) dt.
1
193

Su derivada también es G′ (x) = x2 cos(x3 − 1)e−sen(x) . De hecho, F y G difieren en una


constante, ya que Z 1
F (x) = t2 cos(t3 − 1)e−sen(t) dt + G(x).
0

Ejemplo 6.1.9.

Ahora consideremos la siguiente modificación del ejemplo anterior. Definamos la función


H : R → R por Z 0
H(x) = t2 cos(t3 − 1)e−sen(t) dt.
x

Como H(x) = −F (x), su derivada es H ′ (x) = −F ′ (x) = −x2 cos(x3 − 1)e−sen(x) .

Ejemplo 6.1.10. Función dada por una expresión integral con otros lı́mites de integración.

Ahora definamos J : R → R por


Z x2
J(x) = t2 cos(t3 − 1)e−sen(t) dt.
0

El TFC, por sı́ mismo, no nos dice que esta función sea derivable ni nos da la derivada de
esta función. Sin embargo, observemos que J(x) = F (x2 ). Es decir, J es la composición de
F y la función g : R → R dada por g(x) = x2 . Por la Regla de la Cadena, J es derivable y
su derivada vale
2
J ′ (x) = F ′ (g(x))g ′ (x) = F ′ (x2 )2x = (x4 cos(x6 − 1)e−sen(x ) )2x.

Ejemplo 6.1.11.

Un último ejemplo antes de ver un resultado general. Tomemos K : R → R dada por


Z x2
K(x) = t2 cos(t3 − 1)e−sen(t) dt.
e−x

Escribimos a esta función como


Z x2 Z 0
−sen(t)
K(x) = 2 3
t cos(t − 1)e dt + t2 cos(t3 − 1)e−sen(t) dt
0 e−x
Z x2 Z e−x
−sen(t)
= 2 3
t cos(t − 1)e dt − t2 cos(t3 − 1)e−sen(t) dt.
0 0

Si tomamos las funciones g, h : R → R dadas por g(x) = x2 y h(x) = e−x , la función K nos
queda
K(x) = F ◦ g(x) − F ◦ h(x),
siendo F , como hasta ahora, la función del Ejemplo 6.1.8.
194

La derivada de K es, por la Regla de la Cadena y el TFC,

K ′ (x) = F ′ (g(x))g ′ (x) − F ′ (h(x))h′ (x)


2 −2x )
= (x4 cos(x6 − 1)e−sen(x ) )2x − (e−2x cos(e−3x−1 )e−sen(e )(−e−x ).

Proposición 6.1.12. Sean I y J intervalos, f : I → R una función continua y


g, h : J → I funciones derivables. Consideremos la función K : J → R dada por
Z g(x)
K(x) = f (t) dt.
h(x)

La función F es derivable y su derivada está dada por

K ′ (x) = f (g(x))g ′ (x) − f (h(x))h′ (x).

Ejercicio 67. Demostrar la Proposición 6.1.12 usando el Teorema Fundamental del Cálculo
y la Regla de la Cadena.

Ejercicio de parcial

(Ejercicio 9 - segundo parcial primer semestre 2020) Consideremos F : R → R


R x2
definida por F (x) = 0 (et + 1)dt. Entonces F ′ (2) vale:

A) 4e4 + 4 C) 4e4 + 2 E) e4 + 1

B) 4e2 + 4 D) 4e2 + 2 F) e4 − 1

Solución. Reescribimos la función F (x) como

F (x) = g(h(x))
Rx
donde g(x) = 0
(et + 1)dt y h(x) = x2 . Luego, por la regla de la cadena, tenemos que

F ′ (x) = g ′ (h(x))h′ (x)

Aplicando el Teorema Fundamental del Cálculo, obtenemos que

g ′ (x) = ex + 1

y, por otro lado,


h′ (x) = 2x
Entonces
2
F ′ (x) = (ex + 1) · 2x
y, por lo tanto, F ′ (2) = (e4 + 1) · 4 = 4e4 + 4.
195

6.2. Métodos de integración

6.2.1. Regla de Barrow

Ahora veremos cómo a partir del Teorema Fundamental del Cálculo surgen los llamados
“métodos de integración”. Éstos consisten en usar las propiedades de la derivación para
calcular primitivas e integrales de funciones continuas. Se basan en una consecuencia sencilla
pero importante del TFC, conocida como la Regla de Barrow.

Teorema 6.2.1 (Regla de Barrow). Sean f : I → R una función continua en un


intervalo I, a y b dos puntos de I y g : I → R una primitiva de f . Entonces
Z b
f (t) dt = g(b) − g(a).
a

Demostración de la Regla de Barrow:

Consideremos la función F : I → R dada por F (x) =


Rx
a
f (t) dt. Entonces, por definición,
Rb
a
f (t) dt = F (b). Como F (a) = 0,
Z b
f (t) dt = F (b) − F (a).
a

Las funciones F y g son dos primitivas de f , y de acuerdo a la Proposición 6.1.6, existe k ∈ R


tal que F (x) = g(x) + k, para todo x ∈ I. Entonces F (b) − F (a) = g(b) + k − g(a) − k =
g(b) − g(a), y por lo tanto
Z b
f (t) dt = g(b) − g(a). □
a

Notación
b
g(x) = g(b) − g(a)
a

Ejemplo 6.2.2.

Como la derivada de la función seno es la función coseno, tenemos que


Z π π
2 2 π 
cos(x) dx = sen(x) = sen − sen(0) = 1.
0 0 2
196

6.2.2. Integración por partes

El primer método de integración que veremos es el método de integración por partes.


Viene de una propiedad importante de las derivadas que ya conocemos, la fórmula de la
derivada del producto, que nos dice que

(f g)′ = f ′ g + f g ′ .

Teorema 6.2.3 (Integración por partes). Sean f y g dos funciones definidas en un


intervalo I, derivables y con derivadas continuas. Entonces:
b
Rb Rb
1. a
f ′ (x)g(x) dx = f (x)g(x) − a
f (x)g ′ (x) dt
a

f ′ (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx


R R
2.

Observemos que este teorema nos dice dos cosas: cómo calcular la integral de f ′ g en un
intervalo y cómo calcular una primitiva de la función f ′ g.

R
Observación
R 6.2.4. Recordemos cómo se usa la notación h(x) dx. Cuando escribimos
H(x) = h(x) dx, estamos diciendo que H es una primitiva de h. Equivalentemente, que
H ′ = h.

Demostración del Teorema 6.2.3:

Sabemos que
(f g)′ = f ′ g + f g ′ .
Por lo tanto,
Z b Z b

(f g) (x) dx = (f ′ (x)g(x) + f (x)g ′ (x)) dx
a a
Z b Z b

= f (x)g(x) dx + f (x)g ′ (x)) dx.
a a

b
Rb ′
Usando la Regla de Barrow, sabemos que a
(f g) (x) dx = f (x)g(x) , por lo que
a

b Z b Z b

f (x)g(x) = f (x)g(x) dx + f (x)g ′ (x) dx, (6.2.5)
a a a

que es lo que dice 1.


197

Como esto es cierto para a, b ∈ I cualesquiera, vamos a reescribir la ecuación (6.2.5)


cambiando la notación ligeramente:
Z x Z x

f (x)g(x) − f (a)g(a) = f (t)g(t) dt + f (t)g ′ (t) dt, (6.2.6)
a a

es decir, Z x Z x

f (t)g(t) dt = f (x)g(x) − f (t)g ′ (t) dt − f (a)g(a). (6.2.7)
a a
Rx ′
Por
Rx el TFC, la expresión F (x) = a
f (t)g(t) dt da una primitiva de f ′ g y la expresión G(x) =
a
f (t)g ′ (t) dt da una primitiva de f g ′ . Como f (a)g(a) es una constante, G(x) + f (a)g(a)
también es una primitiva de f g ′ . Por lo tanto, la ecuación 6.2.7 dice que la resta de f g y
una primitiva de f g ′ es una primitiva de f ′ g, es decir,
Z Z
f (x)g(x) dx = f (x)g(x) − f (x)g ′ (x) dx. □

Veamos ahora algunos ejemplos de uso de la integración por partes.


R1
Ejemplo 6.2.8. 0
xex dx.

R1
Para calcular 0 xex dx, aplicaremos el Teorema 6.2.3 a las funciones f y g dadas por
f (x) = ex y g(x) = x. Observemos que f ′ (x)g(x) = ex x. Entonces
Z 1 Z 1
x
xe dx = f ′ (x)g(x) dx
0 0
1 Z 1
= f (x)g(x) − f (x)g ′ (x) dx
0 0
1 Z 1
= xex − ex dx
0 0
1 1
x x
= xe −e = 1.
0 0

Ejemplo 6.2.9. 0
2
cos(x)sen(x) dx.

Tomaremos f (x) = g(x) = sen(x), con lo cual f ′ (x)g(x) = cos(x)sen(x). Tenemos que
Z π π Z π
2 2 2
2
cos(x)sen(x) dx = sen (x) − sen(x) cos(x) dx.
0 0 0

¡Llegamos a la misma integral que al principio! Pero de esta igualdad, podemos despejarla,
y obtenemos π
Z π 2
2
2
2 cos(x)sen(x) dx = sen (x) = 1,
0 0
Rπ 1
por lo que 0
2
cos(x)sen(x) dx = 2
.
198

R
Ejemplo 6.2.10. sen2 (x) dx.

Este ejemplo es similar al anterior, pero en vez de calcular una integral vamos a hallar
una primitiva de la función sen2 (x). Cualquier otra primitiva se puede obtener a partir de
ésta sumando una constante.

Tomaremos f (x) = − cos(x) y g(x) = sen(x).

Z Z
2
sen (x) dx = − cos(x)sen(x) + cos2 (x) dx
Z
= − cos(x)sen(x) + (1 − sen2 (x)) dx
Z
= − cos(x)sen(x) + x − sen2 (x) dx

Nuevamente podemos despejar, obteniendo


x − cos(x)sen(x)
Z
sen2 (x) dx = .
2
R 2π
Ejercicio 68. Hallar una primitiva de cos2 (x), y calcular 0 cos2 (x) dx.
Ejemplo 6.2.11. Primitiva del logaritmo.
Rx
Definimos log(x) = 1 1t dt. Por el TFC, sabemos que la derivada de log(x) es x1 . Ahora
calcularemos una primitiva de log(x). Para esto, aplicaremos el Teorema 6.2.3 a las funciones
f (x) = x y g(x) = log(x).

Z Z
log(x) dx = 1 · log(x) dx
Z
1
= x log(x) − x dx
x
Z
= x log(x) − 1 dx = x(log(x) − 1).

Ejercicio de examen

(Ejercicio 7 - examen diciembre 2023) Calcular


Z π
2
sen(x)e3x dx
0
1 3π 1 3π 1 π
A) 10
(3e 2 + 1) C) 4
(3e 2 + 1) E) 10
(e 2 + 1)
3π 3π π
B) 1
10
(3e− 2 − 1) D) 1
4
(3e− 2 − 1) F) 1
10
(e− 2 − 1)
199

Solución. Usamos el método de integración por partes para encontrar una primitiva de
sen(x)e3x . Tomando f (x) = e3x y g(x) = − cos(x) obtenemos
Z Z
sen(x)e dx = −e cos(x) − −3e3x cos(x)dx
3x 3x

| R
{z }
3 e3x cos(x)dx

R
Aplicamos partes a e3x cos(x)dx tomando f (x) = e3 x y g(x) = sen(x) y obtenemos
Z Z
e cos(x)dx = e sen(x) − 3e3x sen(x)dx
3x 3x

Entonces
Z  Z 
3x 3x 3x 3x
sen(x)e dx = −e cos(x) + 3 e sen(x) − 3 sen(x)e dx
Z
= e (− cos(x) + 3 sen(x)) − 9 sen(x)e3x dx
3x

Por lo tanto, Z
10 sen(x)e3x dx = e3x (− cos(x) + 3 sen(x))

es decir, Z
1 3x
sen(x)e3x dx = e (− cos(x) + 3 sen(x))
10
Finalmente, por la regla de Barrow,
Z π π
2 1 2
3x
sen(x)e dx = e3x (− cos(x) + 3 sen(x))
0 10 0
1 3π π  π  1
= e 2 (− cos +3 sen ) − e0 ((− cos(0) +3 sen(0))
10 | {z 2 } | {z 2 } 10 | {z } | {z }
1 0
0 1
1 3π
= (3e 2 + 1)
10

6.2.3. Integración por sustitución o cambio de variable

El segundo método de integración que veremos es el método de integración por sustitución


o cambio de variable. Viene de una propiedad importante de las derivadas que ya conocemos,
la regla de la cadena, que nos dice que

(f ◦ g)′ (x) = f ′ (g(x))g ′ (x).


200

Teorema 6.2.12 (Cambio de variable). Sean g : [a, b] → R una función continua en


[a, b] y derivable en (a, b), y f una función que es continua en el intervalo cerrado
delimitado por g(a) y g(b).a Entonces
Z g(b) Z b
f (x) dx = (f ◦ g(x))g ′ (x) dx.
g(a) a

a
Es decir, el intervalo [g(a), g(b)] o [g(b), g(a)], según si g(a) ≤ g(b) o g(a) > g(b).

Demostración del Teorema 6.2.12:

Sea I el intervalo cerrado delimitado por g(a) y g(b). Como f es continua en I, tiene una
primitiva que llamaremos F . Entonces, por la regla de Barrow,
Z g(b)
f (x) dx = F (g(b)) − F (g(a)) = F ◦ g(b) − F ◦ g(a).
g(a)

Por otro lado, la regla de la cadena nos dice que

(F ◦ g)′ (x) = F ′ (g(x))g ′ (x) = (f ◦ g(x))g ′ (x)

para x ∈ I. Usando nuevamente la regla de Barrow tenemos que


Z b
(f ◦ g(x))g ′ (x) dx = F ◦ g(b) − F ◦ g(a). □
a

Veamos ahora algunos ejemplos del uso de este resultado.


Ejemplo 6.2.13. 0
2
cos(x)sen(x) dx.

Esta integral ya fue calculada en el Ejemplo 6.2.9 usando el método de integración por
partes, por lo que ya sabemos que vale 12 .

Para aplicar el teorema de cambio de variable, tomemos g : [0, π2 ] → R dada por g(x) =
sen(x), y la función f : R → R dada por f (x) = x. Entonces f ◦ g(x) = g(x) = sen(x). Como
g ′ (x) = cos(x), la función que queremos integrar es (f ◦ g)g ′ . El Teorema 6.2.12 nos dice que

0
2
cos(x)sen(x) dx es igual a
Z g(π/2)
f (x) dx,
g(0)

es decir, a Z 1
1
x dx = .
0 2

cos(x)senn (x) dx, donde n ∈ N, n ≥ 1.



Ejemplo 6.2.14. 0
2
201

Aquı́ nuevamente podemos tomar g(x) = sen(x), cuya derivada es g ′ (x) = cos(x). Como
ahora en el integrando sen(x) aparece elevado a la potencia n, tomaremos f (x) = xn . La
función que queremos integrar es por lo tanto (f ◦ g)g ′ .

Por el teorema de cambio de variable, 0
2
cos(x)senn (x) dx es igual a
Z g(π/2)
f (x) dx,
g(0)

es decir, a Z 1
1
xn dx = .
0 n+1
Ejemplo 6.2.15. Primitiva de h(x) = cos(x)sen3 (x).

Tomemos la función del ejemplo anterior en el caso particular en que n = 3. Si en vez


π
de querer hallar Rsu integral en el intervalo
R x [0, 2 ] queremos hallar una primitiva, podemos
x
calcular F (x) = 0 h(t) dt (o en realidad a h(t) dt para cualquier valor de a).

Eligiendo f (x) = x3 y g(x) = sen(x), tenemos que


Z x Z g(x) Z sen(x)
3 3
F (x) = cos(t)sen (t) dt = t dt = t3 dt.
0 g(0) 0

Es decir,
sen4 (x)
F (x) = .
4
Ejercicio 69. Verificar, derivando, que F efectivamente es una primitiva de la función h.

Ejemplo 6.2.16. 02 cos(x)esen(x) dx.

Para calcular esta integral tomaremos de nuevo g(x) = sen(x), y la función f será

f (x) = ex . La integral que queremos calcular, 02 cos(x)esen(x) dx, queda en este caso igual a
Z 1
ex dx = e − 1.
0
202

Notación
Los ejemplos anteriores tienen en común que en el integrando aparece una expresión
que depende de g(x) = sen(x) (que es sen(x), senn (x) o esen(x) ) multiplicada por
g ′ (x) = cos(x). Sin importar cuál sea la función continua f y cuáles sean los lı́mites
de integración a y b,
Z b Z g(b)
cos(x)f (sen(x)) dx = f (x) dx.
a g(a)

Por este motivo, al aplicar el teorema de cambio de variable suele utilizarse una no-
tación diferente a la presentada en estos ejemplos. Solemos decir que la nueva variable
es u = sen(x), y que du = cos(x) dx. Entonces escribimos
Z b Z g(b)
cos(x)f (sen(x)) dx = f (u) du.
a g(a)

La expresión du = cos(x) dx es solamente una notación, pero es muy útil para recordar
que al hacer el cambio de variable que consiste en cambiar sen(x) por u, no podemos
simplemente cambiar dx por du.

R4 √
e√ x
Ejemplo 6.2.17. 1 x
dx.

Para aplicar el teorema de cambio de variable, busquemos una nueva variable u (corres-
pondiente a u = g(x)) de modo que du (es decir, g ′ (x)dx) aparezca también en el integrando.
√ 1
Si tomáramos u = x, tendrı́amos du = √
2 x
dx. Modifiquemos ligeramente el aspecto de
nuestra integral: √ √
4 4
e x e x
Z Z
√ dx = 2 √ dx.
1 x 1 2 x

Ahora sı́ estamos en condiciones de hacer el cambio de variable u = x. ¡Recordemos que
hay que cambiar los lı́mites de integración! Cuando x = 1, u = 1 y cuando x = 4, u = 2.
Por lo tanto Z 4 √x Z 2
e
2 √ dx = 2 eu du = 2(e2 − e).
1 2 x 1

cos(log(1+x))
Ejemplo 6.2.18. Cálculo de una primitiva de h(x) = 1+x
.

Rx
Calcularemos F (x) = 0 cos(log(1+t))
1+t
dt, que está definida para x ∈ (−1, +∞) y es una
1
primitiva de h. Haremos el cambio de variable u = log(1 + t), para el cual du = 1+t dt. Con
este cambio de variable,
Z log(1+x) log(1+x)
F (x) = cos(u) du = sen(u) = sen(log(1 + x)).
0 0
203


Ejemplo 6.2.19. 0
2
e2x cos(2x) dx.

Para resolver esta integral aplicaremos los dos métodos de integración que hemos visto
hasta el momento: integración por partes y cambio de variable.

Primero haremos el cambio u = 2x. Como du = 2dx, reescribimos la integral que quere-
mos calcular como Z π Z π
2
2x 1 2 2x
e cos(2x) dx = 2e cos(2x) dx,
0 2 0
que tras el cambio de variable queda
1 π u
Z
e cos(u) du.
2 0

Integremos ahora por partes, primitivizando el coseno y derivando la exponencial:

Z π π Z π
u u
e cos(u) du = e sen(u) − eu sen(u) du
0 0 0
Z π
= − eu sen(u) du.
0

Haciendo partes nuevamente, primitivizando el seno y derivando la exponencial, tenemos


que esto es igual a

Z π π Z π
u u
e (−sen(u)) du = e cos(u) − eu cos(u) du
0 0
Z π0
= −eπ − 1 − eu cos(u) du.
0

De las dos ecuaciones anteriores podemos despejar


Z π
1
eu cos(u) du = − (eπ + 1),
0 2
por lo que Z π
1 1
eu cos(u) du = − (eπ + 1).
2 0 4

Hasta ahora hemos visto ejemplos en los que la función u = g(x) aparece explı́citamente
en el integrando. Sin embargo, el teorema de cambio de variable puede ser aplicado, con
cierta astucia, en otros casos.
204

Ejemplo 6.2.20. Área del cı́rculo.

R1 √
Calcularemos −1 1 − x2 dx, que es el área del semicı́rculo de radio 1. ¡Nos deberı́a
dar π2 ! Haremos un pequeño cambio cosmético, que es cambiar el nombre de la variable de
integración de x a u. Entonces, la integral queda:

Z 1 √
1 − u2 du.
−1


Si u fuera sen(x), tendrı́amos que 1 − u2 = cos(x). Intentemos hacer este cambio de
variable. Para ello, debemos tener en cuenta que du = cos(x)dx. Entonces,
Z 1 √ Z bp
1− u2 du = 1 − sen2 (x) cos(x) dx,
−1 a

para lı́mites de integración a y b elegidos apropiadamente. Éstos deben cumplir que sen(a) =
−1 y sen(b) = 1, ası́ que podemos tomar a = − π2 y b = π2 .

La integral que queremos calcular queda


π π
Z 1 √ Z
2 p Z
2
1 − u2 du = 1 − sen2 (x) cos(x) dx = cos2 (x) dx.
−1 − π2 − π2

Ejercicio 70. Calcular esta integral usando el método de integración por partes, verificando
ası́ que efectivamente da π2 .
Ejercicio 71. El coseno hiperbólico y el seno hiperbólico son las funciones definidas por

ex + e−x ex − e−x
cosh(x) = y senh(x) = .
2 2
Probar que:

cosh2 (x) − senh2 (x) = 1.

cosh′ (x) = senh(x).

senh′ (x) = cosh(x).

senh : R → R es biyectiva.

La función inversa de senh se llama arcsenh, que se lee arcosenohiperbólico.



Ejemplo 6.2.21. Primitiva de 1 + x2 .
205


Consideremos la función f : R → R dada por f (x) = 1 + x2 . De acuerdo al TFC, una
primitiva de f está dada por Z x√
F (x) = 1 + t2 dt.
0

Para hallar F , haremos el cambio de variable t = senh(u), con lo que dt = cosh(u)du. Al


hacer este cambio de variable, los lı́mites de integración cambiarán. En vez de ser 0 y x serán
arcsenh(0) = 0 y arcsenh(x). Usaremos en los siguientes cálculos las propiedades de cosh y
senh que constituyen el enunciado del ejercicio anterior.

Entonces
Z x √ Z arcsenh(x) q
1 + t2 dt = 1 + senh2 (u) cosh(u) du
0 0
Z arcsenh(x)
= cosh2 (u) du
0

Integrando por partes, o usando la fórmula de cosh, esta integral es igual a


arcsenh(x)
1
(senh(u) cosh(u) + u) ,
2 0

y tras evaluar obtenemos



x 1 + x2 + arcsenh(x)
F (x) = .
2

Ejercicio de parcial

(Ejercicio 3 - segundo parcial primer semestre 2020) Calcular


Z 1
√ √3
4 xe x dx
0
8e−8 14e−14 15e−15
A) 3
C) 3
E) 4
10e−10 21e−21
B) 3
D) 3e − 3 F) 4

Solución. Comenzamos reescribiendo


Z 1 1
√ √ x3
Z 3
1
4 xe dx = 4x 2 ex 2 dx
0 0
206

3 1
Luego, consideramos el cambio de variable u = x 2 , para el cual du = 32 x 2 , y obtenemos
Z 1 Z 1
1 3
x2 2 3 1 x 32
4x e dx =
2 4· · x 2 e dx
0 0 3 2
8 1
Z
3 1 x 23
= x 2 e dx
3 0 2
8 1 u
Z
= e du cuando x = 1, u = 1 y cuando x = 0, u = 0
3 0
1
8 u
= e
3 0
8
= (e − 1)
3
8e − 8
=
3

6.2.4. Integración de funciones racionales

Una función racional es una función dada por un cociente de funciones polinómicas, es
decir, una función de la forma
p(x)
R(x) = ,
q(x)
donde p y q son polinomios. Hay un método general que permite hallar sus primitivas. Esto
es lo que veremos en esta sección.

Comenzaremos recordando algunas propiedades de los polinomios a coeficientes reales.


Llamaremos R[x] al conjunto de los polinomios a coeficientes reales, es decir, a las expresiones
de la forma
p(x) = a0 + a1 x + · · · + an xx ,
donde n ∈ N y a0 , . . . , an ∈ R. Si an ̸= 0 decimos que p tiene grado n. Los números reales
a0 , . . . , an son los coeficientes de p.

Siempre que hablemos de un polinomio éste tendrá coeficientes reales. Es decir, siempre
estaremos hablando de un elemento de R[x].
207

División de polinomios
Si p y q son polinomios, existen polinomios c y r tales que

p = cq + r,

y el grado de r es menor al grado de q. Al expresar p de este modo, decimos que


dividimos a p entre q. El polinomio p se llama el dividendo, q es el divisor, c es el
cociente y r es el resto.
Observemos que si el grado de p es menor al de q, quedan c = 0 y r = p. Por
lo tanto la división solo resulta interesante si el grado del dividendo es mayor al del
divisor.

Por ejemplo, si p(x) = x5 + x4 + 2x3 − 4x + 1 y q(x) = x3 − x, tenemos que

p(x) = (x2 + x + 3)q(x) + x2 − x + 1.

En este caso c(x) = x2 + x + 3 y r(x) = x2 − x + 1.1

Descomposición de polinomios como producto de polinomios irreducibles


Un polinomio de grado n es irreducible si no puede descomponerse como producto
de polinomios de grado menor. Los polinomios de grado 1 son irreducibles, y hay
polinomios irreducibles de grado 2, como por ejemplo x2 + 1.
En R[x], no hay polinomios irreducibles de grado mayor que 2.
Todo polinomio de grado n ≥ 1, puede descomponerse como producto de polino-
mios irreducibles.

Por ejemplo, el polinomio

p(x) = x4 + x3 − x2 + x − 2

se descompone como
p(x) = (x − 1)(x + 2)(x2 + 1).
El polinomio
q(x) = x5 − 2x3 + 2x2 − 3x + 2
1
Si no recuerdan cómo dividir polinomios, pueden por supuesto recurrir a youtube. Sin embargo, es un
ejercicio provechoso recordar cómo es la división entera y tratar de hacer un razonamiento similar con los
polinomios. Es decir, recordando lo que quiere decir

1538 | 23
20 66

pueden plantear
x5 + x4 + 2x3 − 4x + 1 | x3 − x
e intentar hacer este cálculo guiados por su intuición.
208

es
q(x) = (x − 1)2 (x + 2)(x2 + 1).

Observemos que q tiene los mismos factores irreducibles que p, pero en q el factor x − 1
aparece dos veces.

El objetivo de esta sección es integrar funciones racionales, es decir, funciones que son
cocientes de funciones polinómicas. Antes de integrarlas, es conveniente expresarlas de la
forma más simple posible.

Por ejemplo, la función racional


x5 − 2x3 + 2x2 − 3x + 2
R0 (x) =
x4 + x3 − x2 + x − 2
q(x)
es el cociente p(x) , donde p y q son los polinomios que acabamos de descomponer en factores
irreducibles. Por lo tanto
(x − 1)2 (x + 2)(x2 + 1)
R0 (x) = = x − 1.
(x − 1)(x + 2)(x2 + 1)
p(x)
Si tomamos ahora q(x)
, obtenemos

x4 + x3 − x2 + x − 2 1
R1 (x) = 5 3 2
= .
x − 2x + 2x − 3x + 2 x−1
Ambas son funciones que sabemos integrar, cuando las escribimos en la forma apropiada.
Ejemplo 6.2.22. Función racional con numerador de mayor grado que el denominador.

Si
x5 + x4 + 2x3 − 4x + 1
R(x) = ,
x3 − x
el numerador de R es p(x) = x5 + x4 + 2x3 − 4x + 1 y el denominador es q(x) = x3 − x.
Como el grado de p es mayor que el de q, es conveniente dividir p entre q, lo que nos da
p(x) = (x2 + x + 3)q(x) + x2 − x + 1.
Ahora podemos expresar R como
(x2 + x + 3)(x3 − x) + x2 − x + 1 2 x2 − x + 1
R(x) = = x + x + 3 + ,
x3 − x x3 − x
que es la suma de un polinomio y una función racional de grado más pequeño.

Si además descomponemos q en sus factores irreducibles, vemos que


x2 − x + 1
R(x) = x2 + x + 3 + .
x(x + 1)(x − 1)
Enseguida veremos por qué esto es útil, pero primero registremos esta observación:
209

Observación 6.2.23. Si R(x) = p(x) q(x)


es una función racional y el grado de p es mayor o
igual al grado de q, dividiendo p entre q podemos reescribir R como
r(x)
R(x) = c(x) + ,
q(x)
donde c y r son polinomios y el grado de r es menor que el de q.

Por lo tanto, para integrar funciones racionales es suficiente saber integrar funciones
para las cuales el numerador tiene grado menor que el denominador.

Teorema 6.2.24 (Descomposición en fracciones simples). Sean p y q polinomios de


coeficientes reales tales que el grado de p es menor que el de q. Consideremos la
descomposición de q en factores irreducibles,
u
q(x) = r1 (x)n1 · · · rtnt sm m
1 · · · su ,
1

donde r1 , . . . , rt son los factores irreducibles de grado 1 y s1 , . . . , su son los factores


irreducibles de grado 2. Entonces, la función racional

p(x)
R(x) =
q(x)

se descompone en n1 + · · · + nt + m1 + · · · + mu sumandos, que son de la forma


a
,
ri (x)k

donde a ∈ R y 1 ≤ k ≤ ni , o de la forma
bx + c
,
si (x)k

donde a, b ∈ R y 1 ≤ k ≤ mi .

Veamos qué quiere decir esto en la práctica.

Ejemplo 6.2.25. Denominador q(x) = (x + 2)(x − 1)(x − 5).

El denominador se descompone como producto de polinomios irreducibles de grado 1, y


ningún factor está repetido. En este caso,
p(x) a1 a2 a3
= + + ,
q(x) x + 2 x − 1 (x + 5)
donde a1 , a2 y a3 son números reales que dependen, por supuesto, de quién sea p.
210

Ejemplo 6.2.26. Denominador q(x) = (x + 2)(x − 1)(x − 5)3 .

En este caso, el denominador se descompone como producto de polinomios irreducibles


de grado 1, y el tercer factor aparece tres veces. Esto se verá reflejado en la descomposición
en fracciones simples de la forma siguiente:

p(x) a1 a2 a3 a4 a5
= + + + 2
+ ,
q(x) x + 2 x − 1 (x + 5) (x + 5) (x + 5)3

donde a1 , . . . , a5 son números reales que dependen, por supuesto, de quién sea p.

Ejemplo 6.2.27. Denominador q(x) = (x + 3)(x2 + 1).

En este caso, en la descomposición en fracciones simples hay dos sumandos, uno por
cada factor irreducible de q. Tiene la forma:

p(x) a bx + c
= + 2 .
q(x) x+3 x +1

Ejemplo 6.2.28. Denominador q(x) = (x + 3)2 (x2 + 1)3 .

Este polinomio tiene los mismos factores irreducibles que el del ejemplo anterior, pero
cada uno aparece varias veces. En la descomposición en fracciones simples de p(x)
q(x)
hay ahora
5 sumandos:

p(x) a1 a2 b1 x + c 1 b2 x + c 2 b3 x + c 3
= + + + + .
q(x) x + 3 (x + 3)2 x2 + 1 (x2 + 1)2 (x2 + 1)3

El objetivo de este curso no es aprender a integrar todos los sumandos que pueden apare-
cer en la descomposición en fracciones simples. Esto puede hacerse, y hay métodos generales
que permiten hacerlo en todos los casos. Por lo tanto, si tuviéramos que integrar una fun-
ción racional cualquiera, podrı́amos hacerlo2 , siempre y cuando lográramos descomponer su
denominador como producto de polinomos irreducibles3 .

Volvamos al Ejemplo 6.2.27, donde la descomposición en fracciones simples que se obtiene


nos queda ası́:

a bx + c
+ 2 .
x+3 x +1
2
Es laborioso pero fácil.
3
¡Esto no siempre es fácil!
211

Esta función es
1 x 1
a +b 2 +c 2 ,
x+3 x +1 x +1
donde, recordemos, a, b y c son números reales.

Por lo tanto, para integrarla, alcanza con conocer:

1
Una primitiva de x+3
.
x
Una primitiva de x2 +1
.
1
Una primitiva de x2 +1
.

1
Ejercicio 72. Una primitiva de x+3 es log(x+3). Se obtiene aplicando el teorema
de cambio de variable, tomando como nueva variable u = x + 3.

Una primitiva de x2x+1 es 12 log(x2 +1). Se obtiene aplicando el teorema de cambio


de variable, tomando como nueva variable u = x2 + 1.

Una primitiva de x21+1 es la función arcotangente. Se obtiene a partir del teorema


de la función inversa, aplicándolo a la función tan.

1
Ejemplo 6.2.29. Primitiva de x2 −2x+5
.

El polinomio q(x) = x2 − 2x + 5 es irreducible. Sabemos esto porque, si pudiera ser


descompuesto como (x − a)(x − b), a y b serı́an raı́ces de q, y q no tiene raı́ces reales.

1
¿Cómo podemos calcular una primitiva de q(x) ? Conocemos la primitiva de x21+1 que es
1
arctan(x), y haremos manipulaciones algebraicas sobre la expresión q(x) para llevarla a algo
de este tipo.

Recordemos que, para α ∈ R, (x + α)2 = x2 + 2αx + α2 . Entonces los dos primeros


sumandos de q(x), que son
x2 − 2x,
forman parte de un cuadrado de binomio de este tipo. Es decir,

x2 − 2x + = (x + α)2 ,

si elegimos α y completamos el espacio en blanco adecuadamente. Como 2α debe ser igual


a −2, α = −1, y la igualdad anterior es

x2 − 2x + 1 = (x − 1)2 .

Entonces
q(x) = x2 − 2x + 5 = x2 − 2x + 1 + 4 = (x − 1)2 + 4.
212

1 1
Lo que sabemos integrar es x2 +1
. Lo que queremos integrar es (x−1)2 +4
. Estas expresiones
se empiezan a parecer...

Si además, en q(x), sacamos 4 de factor común, tenemos que


 2 !
x−1
q(x) = 4 +1
2

1
y por lo tanto q(x)
nos queda

1 1 1
= .
2
(x − 1) + 4 4 x−1 2

2
+1
1
Esto ya se parece bastante a x2 +1
, ¿no?

Calculemos Z
1 1
dx.
4 x−1 2

2
+1
x−1 1
Haciendo el cambio de variable u = 2
, tenemos que du = 2
y la primitiva que estamos
calculando es Z
1 1
du,
2 u2 + 1
1
que es 2
arctan(u). No olvidemos deshacer el cambio de variable. Hemos llegado a que
 
x−1
Z
1 1
dx = arctan .
x2 − 2x + 5 2 2

1
¿Será posible hacer esto mismo para una función racional de la forma q(x)
, donde q es
cualquier polinomio irreducible de grado 2? Sı́, por supuesto que sı́.4
4
Nos alcanza con hacerlo para los polinomios mónicos, es decir, cuyo coeficiente principal es 1.
213

Ejercicio 73. Tomemos un polinomio q(x) = x2 + bx + c sin raı́ces reales, es decir, tal
que b2 − 4c < 0.

1. Completar cuadrados: hallar α y β reales tales que

q(x) = (x − α)2 + β.

Verificar que β > 0.a

2. Sacando β de factor común, podemos escribir


 2 !
x−α
q(x) = β √ +1 .
β

1
Hallar una primitiva de q(x)
haciendo un cambio de variable apropiado.
a b
Queda α = 2 y β = c − α2 .

Hasta ahora, hemos visto cómo el teorema de descomposición en fracciones simples nos
permite escribir una función racional como em suma de términos que sabemos integrar y
términos que aprenderı́amos a integrar, si tuviéramos que hacerlo.5 Pero...¿cómo encontra-
mos la descomposición en fracciones simples? Lo veremos en algunos ejemplos.

Ejemplo 6.2.30.
1
R(x) =
(x + 2)(x − 1)

Buscamos números A y B tales que


1 A B
= + . (6.2.31)
(x + 2)(x − 1) x+2 x−1

Hagamos denominador común en la expresión de la derecha. La ecuación (6.2.31) queda

1 A(x − 1) + B(x + 2)
= . (6.2.32)
(x + 2)(x − 1) (x + 2)(x − 1)

Para que se cumpla, como las funciones racionales a la izquierda y a la derecha de (6.2.32)
tienen el mismo denominador, alcanza con que

1 = A(x − 1) + B(x + 2) = (A + B)x + (2B − A). (6.2.33)

Observemos que esta igualdad tiene que cumplirse para todos los x ∈ R, es decir, la función
polinómica dada por (A + B)x + (2B − A) tiene que ser constante igual a 1. Por lo tanto,
5 1
Como por ejemplo, (x2 −2x+5)2 .
214

el término lineal tiene que tener coeficiente 0 y el término independiente tiene que valer 1.
Hallamos A y B resolviendo el sistema lineal de ecuaciones

A+B = 0
−A + 2B = 1,

y obtenemos A = −1/3, B = 1/3. Es decir,


1 −1/3 1/3
= + .
(x + 2)(x − 1) x+2 x−1
Ejemplo 6.2.34.
1
R(x) =
(x + 2)(x − 1)(x − 5)

Buscamos números A, B y C tales que


1 A B C
= + + . (6.2.35)
(x + 2)(x − 1)(x − 5) x+2 x−1 x−5
Hagamos denominador común en la expresión de la derecha. La ecuación (6.2.35) queda
1 A(x − 1)(x − 5) + B(x + 2)(x − 5) + C(x + 2)(x − 1)
= . (6.2.36)
(x + 2)(x − 1)(x − 5) (x + 2)(x − 1)(x − 5)
Al igual que en el ejemplo anterior, para hallar A, B y C igualamos los numeradores, obte-
niendo

1 = (A + B + C)x2 + (−6A − 3B + C)x + (5A − 10B − 2C). (6.2.37)

A, B y C se obtienen como solución del sistema lineal de ecuaciones

A+B+C = 0
−6A − 3B + C = 0
5A − 10B − 2C = 1

Ejemplo 6.2.38.
2x + 3
R(x) =
(x + 2)(x − 1)(x + 5)

Queremos hallar A, B y C tales que


2x + 3 A B C
= + + .
(x + 2)(x − 1)(x − 5) x+2 x−1 x−5
Haciendo denominador común en la expresión de la derecha e igualando los numeradores
que nos quedan, obtenemos

2x + 3 = (A + B + C)x2 + (−6A − 3B + C)x + (5A − 10B − 2C).


215

Por lo tanto, A, B y C se obtienen como solución del sistema lineal de ecuaciones

A+B+C = 0
−6A − 3B + C = 2
5A − 10B − 2C = 3

Método de la tapadita
Hay un “método”para hallar rápidamente los coeficientes que aparecen en la des-
composición en fracciones simples. Para entenderlo, miremos la ecuación (6.2.31), que
es una igualdad de funciones racionales. Si multiplicamos a ambos lados por (x − 1),
obtenemos
1 A(x − 1)
= + B.
x+2 x+2
1
Cuando evaluamos esto en x = 1, nos queda 1+2 = B, es decir B = 1/3. Análogamente,
si multiplicamos la ecuación (6.2.31) por x + 2, obtenemos

1 B(x + 2)
=A+ ,
x−1 x−1
1
y evaluando en x = −2 obtenemos −2−1 = A, es decir, A = −1/3.
Este truco se llama “método de la tapadita”porque se aplica ası́: tomamos
1
,
(x + 2)(x − 1)

que es la función que queremos descomponer en fracciones simples. Tapamos el factor


1
x+2 del denominador, y evaluamos lo que queda (es decir, x−1 ) en la raı́z del factor que
hemos tapado, es decir, en x = −2. Esto nos da −1/3, por lo que en la descomposición
aparece
−1/3
.
x+2
Ahora tapamos el factor x − 1 en el denominador, y evaluamos lo que queda en la raı́z
de x − 1, obteniendo 1/3. En la descomposición aparece

1/3
.
x−1
Como ejercicio, verificar que este “método”también funciona para los otros dos
ejemplos que vimos, y pensar por qué.
¿Es recordar esto más fácil que resolver un sistema lineal de ecuaciones? Probable-
mente no, pero este es un truco muy popular que se incluye en estas notas a pedido
del público.

Ejemplo 6.2.39.
2x + 3
R(x) = .
(x + 2)(x2 + 1)
216

En este ejemplo, buscamos una descomposición de la forma


2x + 3 A Bx + C
2
= + 2 . (6.2.40)
(x + 2)(x + 1) x+2 x +1

Esta ecuación es igual a

2x + 3 (A + B)x2 + (2B + C)x + (A + 2C)


= . (6.2.41)
(x + 2)(x2 + 1) (x + 2)(x2 + 1)

Al igualar los numeradores, nos queda el sistema lineal que debemos resolver para obtener
A, B y C:

A+B = 0
2B + C = 2
A + 2C = 3.

Ejercicio de parcial

(Ejercicio 8 - segundo parcial primer semestre 2022) La integral


Z 1
4x2 + 3x + 3
3 2
dx
0 x +x +x+1

es igual a:

A) log(2) + π
π
B) 3 log(2) + 4
π
C) 2 log(2) − 4

D) log(3) + π
π
E) − log(2) + 4

Observar que −1 es raı́z del denominador.

Solución. A partir de la observación de que −1 es raı́z del denominador, factorizamos


x3 + x2 + x + 1 usando división de polinomios o Ruffini:

x3 + x2 + x + 1 = (x + 1)(x2 + 1)

Luego, aplicamos fracciones simples:

4x2 + 3x + 3 4x2 + 3x + 3
=
x3 + x2 + x + 1 (x + 1)(x2 + 1)
A Bx + C
= + 2
x+1 x +1
217

Para encontrar las incógnitas A, B y C, tomamos denominador común en el término de la


derecha
4x2 + 3x + 3 A(x2 + 1) + (Bx + C)(x + 1)
=
x3 + x2 + x + 1 (x + 1)(x2 + 1)
(A + Bx2 + (B + C)x + (A + C))
=
(x + 1)(x2 + 1)

y, al igualar los numeradores, nos queda el sistema lineal que debemos resolver para obtener
A, B y C:

A+B = 4
B+C = 3
A+C = 3

Resolviendo este sistema obtenemos que A = 2, B = 2 y C = 1. Luego,

4x2 + 3x + 3
Z Z
2 2x + 1
3 2
dx = + 2 dx
x +x +x+1 x+1 x +1
Z
2 2x 1
= + 2 + 2 dx
x+1 x +1 x +1
Z Z Z
1 2x 1
=2 dx + 2
dx + 2
dx
x+1 x +1 x +1
= 2 log(x + 1) + log(x2 + 1) + arctan(x)

Por lo tanto,
1 1
4x2 + 3x + 3
Z
dx = 2 log(x + 1) + log(x2 + 1) + arctan(x)
0 x3 + x2 + x + 1 0
= 2 log(2) + log(2) + arctan(1) −(2 log(1) + log(1) + arctan(0))
| {z } | {z } | {z } | {z }
π 0 0 0
4
π
= 3 log(2) +
4
218
Capı́tulo 7

Polinomio de Taylor

Como sabemos, si f es una función derivable en un punto a, la derivada de f en a se


define como el lı́mite
f (x) − f (a)
f ′ (a) = lı́m .
x→a x−a
La recta tangente al gráfico de a en el punto (a, f (a)) es la recta de ecuación

y = f (a) + f ′ (a)(x − a),

es decir, es la gráfica de la función lineal dada por p(x) = f (a)+f ′ (a)(x−a). Intuitivamente,
esta función es la función lineal “cuya gráfica más se parece a la de f cerca del punto a”.
Exploremos un poco más esta idea.

Observemos que

lı́m (f (x) − p(x)) = lı́m (f (x) − f (a) − f ′ (a)(x − a)) = 0.


x→a x→a

Esto es simplemente porque f , al ser derivable en a, es continua en a. Pero dividiendo esta


expresión por x − a, también tenemos que
f (x) − p(x) f (x) − f (a) − f ′ (a)(x − a)
lı́m = lı́m = 0.
x→a x−a x→a x−a
Es decir, no sólo f (x) − p(x) es pequeño para x cerca de a, sino que es muy pequeño. Es un
infinitésimo de orden mayor que x − a.

En este curso hemos visto que hay funciones no lineales con las cuales es difı́cil trabajar.
Por ejemplo, es difı́cil calcular sus valores. (¿Cuánto vale el seno de 8? ¿Y eπ ?) Es muy natural
la idea de aproximar estas funciones difı́ciles por funciones sencillas, que entendemos mejor
y con las que operamos fácilmente, como las funciones lineales. La derivada nos permite
hacer esto, al menos en el entorno de un punto. Pero no siempre la aproximación lineal de
una función es suficientemente buena.

219
220

A este problema responde el Teorema de Taylor, que nos permite aproximar funciones
por polinomios. Lleva el nombre de Brook Taylor, que lo enunció y demostró en 1715. Es
un teorema asombrosamente potente y útil, dentro de la matemática y en otras ciencias.
Sin embargo, no todos los contemporáneos de Taylor comprendieron su importancia. Se
popularizó recién en 1772, cuando el famoso matemático Joseph-Louis Lagrange lo llamó
“el fundamento principal del cálculo diferencial”.1

A más de trescientos años del artı́culo de Taylor, nuestra herramienta principal de cálculo
es la computadora. Con ella, el Teorema de Taylor no ha hecho sino ganar en importancia,
porque este resultado está en la base de muchos de los algoritmos con los que nuestro software
hace cuentas.

7.1. Definición del polinomio de Taylor

Si f : I → R es una función derivable en un intervalo I, su derivada es otra función


f ′ : I → R. Si f ′ es a su vez derivable, esto nos da f ′′ : I → R. Si f ′′ es a su vez deriva-
ble, obtenemos f ′′′ , y ası́ sucesivamente. Muchas de las funciones con las que trabajamos
habitualmente pueden ser derivadas tantas veces como queramos. Son ejemplo de esto los
polinomios, el seno y el coseno, el logaritmo y la exponencial, y todas las funciones que se
obtienen de éstas haciendo sumas, productos, cocientes y composiciones.

Notación: derivadas de orden superior


Si n es un número natural mayor que uno y f : I → R es una función que es n
veces derivable en I, llamamos f (k) a su derivada de orden k, para k = 1, . . . , n. Por
ejemplo, f ′ = f (1) y f ′′ = f (2) .
A veces nos referiremos a f como la derivada de orden 0, y escribiremos f = f (0) .

Imaginemos que tenemos una función f : R → R tal que

f (0) = 5, f ′ (0) = 8, f ′′ (0) = −3, y f ′′′ (0) = 1.

Claramente hay una única función polinómica p0 de grado 0 tal que p0 (0) = 5, que es,
justamente, la función constante igual a 5. Hay infinitas funciones lineales que en 0 valen 5,
pero hay una sola, p1 , para la cual p1 (0) = 5 y p′1 (0) = 8, a saber, p1 (x) = 5 + 8x. Hay una
única función polinómica de grado 2, p2 , tal que p2 (0) = 5, p′2 (0) = 8 y p′′2 (0) = −3, que está
dada por p2 (x) = 5 + 8x − 23 x2 .

¿Cuál es la única función polinómica de grado 3, p3 , tal que


1
Journal de l’Ecole polytechnique, cuaderno noveno, p.5.
221

p3 (0) = 5
p′3 (0) = 8
p′′3 (0) = −3 y
p′′′
3 (0) = 1?

Podemos hacer esto con las derivadas en 0 hasta cualquier orden, mediante el razona-
miento siguiente.

Consideremos una función polinómica dada por

p(x) = a0 + a1 x + a2 x2 + · · · + an xn ,

y derivémosla k veces, con k ≤ n. Al hacer esto, los primeros sumandos van a desaparecer,
pues la derivada de orden k de a0 + a1 x + · · · + ak−1 xk−1 es 0. Por otro lado, para j > k, la
derivada de aj xj es
aj j(j − 1)(j − 2) · · · (j − k + 1)xj−k .
En esta expresión, x aparece con una potencia mayor o igual que uno. En resumen,

p(k) (x) = ak k! + xq(x),

donde q(x) es un polinomio. Por lo tanto p(k) (0) = ak k!.

Si queremos elegir el polinomio p para que p(k) (0) = f (k) (0), tenemos que tomar ak =
f (k) (0)
k!
. Es decir, el polinomio
n
X f (k) (0) k
p(x) = x
k=0
k!

cumple que p(k) (0) = f (k) (0) para todo k ≤ n, y es el único polinomio de grado menor o
igual que n con esta propiedad.

Hasta aquı́ nos hemos limitado a mirar el valor de las derivadas de una función en 0.
Podemos hacer lo mismo en cualquier punto, como veremos más adelante. Antes, haremos
una observación.

Observación 7.1.1. El polinomio

−2 + 3(x − 1) + (x − 1)2

es igual a
−4 + x + x2 .
Las dos expresiones determinan la misma función, pero presentan un aspecto distinto.
222

La segunda corresponde a como solemos escribir un polinomio, es decir,

a0 + a1 x + · · · + an x n ,

y la segunda está en la forma de un polinomio en x − 1, lo que quiere decir

b0 + b1 (x − 1) + · · · + bn (x − 1)n .

Todo polinomio se puede escribir como polinomio en x − 1, y viceversa.

Nomenclatura
Si a ∈ R y escribimos un polinomio p(x) como

b0 + b1 (x − a) + · · · + bn (x − a)n ,

decimos que lo hemos escrito en la forma de polinomio en x − a.

Proposición 7.1.2. Sean n ∈ N, I un intervalo, a un elemento de I y f : I → R una


función que es n veces derivable en el punto a. Entonces existe un único polinomio p
de grado menor o igual que n tal que

p(k) (a) = f (k) (a)

para todo k = 0, . . . , n.

Ejercicio 74. Consideremos el polinomio


n
X f (k) (a)
p(x) = (x − a)k .
k=0
k!

Para k = 0, . . . , n, calcular p(k) (x). Concluir que p(k) (a) = f (k) (a).

El ejercicio demuestra que el polinomio que se anuncia en la Proposición 7.1.2 efectiva-


mente existe. Para ver que es único, antes probaremos un lema.

Lema 7.1.3. Sea a ∈ R. Si q(x) es un polinomio de grado menor o igual que n tal que
q (k) (a) = 0 para todo k ≤ n, entonces q es el polinomio nulo.

Demostración del Lema 7.1.3.

Haremos una demostración por reducción al absurdo.


223

Supongamos que q(x) = a0 + a1 x + · · · + an xn , y que q no es el polinomio nulo. Esto es,


alguno de sus coeficientes es distinto de 0. Supongamos que
k = máx{j : 0 ≤ j ≤ n y aj ̸= 0}.
Es decir, que q es un polinomio de grado k, por lo que
q(x) = a0 + a1 x + · · · + ak xk
con ak ̸= 0.

La derivada de orden k de q es constante e igual a k!ak . Como q (k) (a) = 0, tenemos que
ak = 0, lo cual es absurdo por cómo hemos definido k. Llegamos a una contradicción que
surgió de suponer que q no era el polinomio nulo, por lo que q es el polinomio nulo.□

Fin de la demostración de la Proposición 7.1.2.


(k)
Supongamos que p0 (x) es otro polinomio de grado menor o igual que n tal que p0 (a) =
f (a). Entonces, si q(x) = p(x) − p0 (x), para todo k ≤ n se cumple que q (k) (a) = 0. Por el
(k)

Lema 7.1.3, q = 0, o sea que p = p0 .□

Definición 7.1.4. Sea f : I → R una función que es n veces derivable en un punto


a ∈ I. El polinomio de Taylor de orden n en el punto a es el polinomio Pn (f, a) de
grado menor o igual que n cuyas derivadas hasta orden n en a son

f (a), f ′ (a), f ′′ (a), . . . , f (n) (a).

Es decir, es el polinomio

f (n) (a)
Pn (f, a)(x) = f (a) + f ′ (a)(x − a) + · · · + (x − a)n .
n!

Ejercicio de examen

(Ejercicio 3 - examen febrero 2020) Calcular p(2) donde p es el polinomio de


Taylor en 0 de grado 2 de la función f (x) = cos(x) log(x2 + 1)

A) 4 C) 9 E) 17

B) 8 D) 15 F) 23

Solución. El polinomio de Taylor en 0 de grado 2 de la función f es


f ′′ (0)
P2 (f, 0)(x) = f (0) + f ′ (0)(x − 0) + (x − 0)2
2!
f ′′ (0) 2
= f (0) + f ′ (0)x + x
2
y se tiene que
224

f (0) = cos(0) log(1) = 0

f ′ (x) = − sen(x) log(x2 + 1) + cos(x) x21+1 · 2x y por lo tanto f ′ (0) = 0


2
f ′′ (x) = − cos(x) log(x2 + 1) − sen(x) x21+1 · 2x − sen(x) x21+1 · 2x + cos(x) 2(x (x
+1)−2x(2x)
2 +1)2

y por lo tanto f ′′ (0) = 2

Entonces
2
P2 (f, 0)(x) = x2 = x2
2
por lo que p(2) = P2 (f, 0)(2) = 4.

7.2. Ejemplos

En esta sección calcularemos los polinomios de Taylor de algunas funciones conocidas.


Cuando esté claro por el contexto cuáles son la función f y el punto a, escribiremos simple-
mente Pn en lugar de Pn (f, a).

Ejemplo 7.2.1. f polinómica.

Si f (x) = a0 + a1 x + · · · + an xn es una función polinómica, Pn (f, a) = f , cualquiera sea


el punto a.

Para k < n, Pk (f, 0) = a0 + a1 x + · · · + ak xk . (¡Verificarlo como ejercicio!)

¿Qué pasa con Pk (f, a) para a ̸= 0? Consideremos por ejemplo, la función dada por

f (x) = −4 + x + x2

y tomemos a = 1 y k = 1. Si escribimos f (x) como un polinomio en x − 1, queda

f (x) = −2 + 3(x − 1) + (x − 1)2 .

El polinomio de Taylor P1 (f, 1) es el polinomio de grado 1 tal que P1 (f, 1)(1) = −2 y


P1 (f, 1)′ (1) = 3. Este es

P1 (f, 1)(1) = −2 + 3(x − 1) = 3x − 3.

Esto no es lo mismo que −4 + x + x2 sin el término de grado 2.

En general, si f es una función polinómica de grado n, obtenemos el polinomio de Taylor


de f de orden k en a escribiendo f como un polinomio en x−a y luego borrando los términos
de grado mayor que k.
225

1
Ejemplo 7.2.2. f (x) = 1+x
, a = 0.

Derivando esta función vemos que2

1 2 (−1)n n!
f ′ (x) = − , f ′′
(x) = , . . . , f (n)
(x) = .
(1 + x)2 (1 + x)3 (1 + x)n+1

Por lo tanto
f (0) = 1, f ′ (0) = −1, f ′′ (0) = 2, . . . , f (n) (0) = (−1)n n!
y el polinomio de Taylor de f de orden n en el punto 0 es

Pn (f, 0)(x) = 1 − x + x2 − x3 + · · · + (−1)n xn .

Ejemplo 7.2.3. g(x) = log(1 + x), a = 0.

Observemos que g(0) = 0, y que g ′ (x) = f (x), donde f es la función del ejemplo anterior.
Por lo tanto, g (k) (0) = f (k−1) (0) para todo k ≥ 1 y el polinomio de Taylor de g de orden n
en el punto 0 es
x2 x3 (−1)n−1 xn
Pn (g, 0)(x) = x − + − ··· + .
2 3 n

Ejemplo 7.2.4. f (x) = ex , a = 0.

Como f (k) (x) = f (x) para todo k ≥ 0, resulta que f (k) (0) = 1 para todo k ≥ 0. El
polinomo de Taylor de f de orden n en el punto 0 es
n
x2 xn X xk
Pn (x) = 1 + x + + ··· + = .
2! n! k=0
k!

Ejemplo 7.2.5. f (x) = sen(x), a = 0.

Como sabemos, f ′ (x) = cos(x), f ′′ (x) = −sen(x), f ′′′ (x) = − cos(x) y f (4) (x) = sen(x) =
f (x). Por lo tanto, a partir de la derivada de orden 4, las derivadas de f empiezan a repetirse.
Por ejemplo, f (23) (x) = f ′′′ (x) = − cos(x), porque 23 = 20 + 3 y 20 es múltiplo de 4, por lo
que derivar f veinte veces dará f nuevamente.

Entonces tenemos que



 0 si k es par
(k)
f (0) = 1 si el resto de dividir k entre 4 es 1
−1 si el resto de dividir k entre 4 es 3

2
Aquellos que cursan Matemática Discreta 1, pueden demostrar esto por inducción completa.
226

Otra manera de escribir esto es



(k) 0 si k es par
f (0) = k−1
(−1) 2 si k es impar

Observemos que, para cualquier n, el polinomio de Taylor Pn (f, 0) no tiene términos de grado
par. Entonces, si n es par, Pn (f, 0) = Pn−1 (f, 0), por lo que alcanza con dar los polinomios
de Taylor cuyo orden es impar.

Para n impar,
n−1
x3 x5 (−1) 2 xn
Pn (f, 0)(x) = x − + − ... + .
3! 5! n!

Ejercicio 75. Para f (x) = cos(x) y a = 0, calcular Pn (f, a).

Ejercicio 76. Probar que si f y g son funciones con derivadas hasta orden n en el
punto a, entonces Pn (f + g, a) = Pn (f, a) + Pn (g, a).

7.3. El teorema de Taylor

Si f : I → R es una función n veces derivable en el punto a, ya definimos su polinomo


de Taylor de orden n en a. Para varias funciones conocidas, lo calculamos. En esta sección
contestaremos la pregunta más importante: ¿para qué hicimos todo esto?

Habı́amos dicho que la función lineal P1 (f, a), cuya gráfica es la recta tangente al gráfico
de f en el punto (a, f (a)), “se parece” a f cerca de a. Las dos funciones valen lo mismo en
el punto a y tienen igual derivada. Tenemos la esperanza de que P2 (f, a), al tener derivadas
hasta orden 2 iguales a las de f en a, se le parezca aun más, y que el parecido de P3 (f, a)
sea aun mayor, etc.

Los dibujos muestran las gráficas de una función f y de sus polinomios de Taylor hasta
orden 4 en a = 1. (Para esta función, f (1) = 0, pero eso no tiene importancia). Para valores
de x lejanos a a la función f y los polinomios son muy diferentes. Sin embargo, cerca de a,
los polinomios parecen aproximar cada vez mejor a f a medida que crece su orden.

Esta es la gráfica de f .
227

Su polinomio de Taylor de orden 1 tiene como gráfica la recta tangente a la gráfica de f


en el punto (a, f (a)).

Su polinomio de Taylor de orden 2 tiene como gráfica una parábola, que cerca de (a, f (a))
se parece aun más a la gráfica de f .

Su polinomio de Taylor de orden 3 tiene como gráfica una cúbica, que se parece aún más.
228

Tenemos que hacer precisa esta noción de aproximación. Cuando decimos que Pn (f, a)
“se parece” a f o que “aproxima” a f (para x cerca de a), lo que estamos diciendo es que
la diferencia f (x) − Pn (f, a)(x) es pequeña (para x cerca de a). El teorema de Taylor nos
habla, justamente, de esta diferencia, que por su importancia tiene un nombre: el resto.

Definición 7.3.1. Si f es n veces derivable en a, el resto de Taylor de orden n de f


en a es la función
Rn (f, a)(x) = f (x) − Pn (f, a)(x).

El resto Rn (f, a) es el error que estarı́amos cometiendo si reemplazáramos la función f


por su polinomio de Taylor Pn (f, a).

Observación 7.3.2. Por como lo hemos definido, Rn (f, a) vale 0 en a, y todas sus derivadas
hasta orden n también valen 0 en a.

Teorema 7.3.3 (Teorema de Taylor.). Sea f : I → R una función que es n veces


derivable en un entorno de a ∈ I y tal que f (n) es continua en a. Entonces

Rn (f, a)(x)
lı́m = 0,
x→a (x − a)n

es decir, el resto Rn (f, a) es un infinitésimo de orden mayor que x − a.

Demostración.
229

Llamaremos Rn a Rn (f, a). Como f es n veces derivable en un entorno de a y Pn es un


(0) (1) (n−1)
polinomio, Rn también es n veces derivable en a y las derivadas Rn , Rn ,. . . ,Rn son
(n) (n)
todas continuas. Por hipótesis, f es continua en a, y por lo tanto también lo es Rn .

Usaremos la Regla de L’Hôpital para demostrar el teorema de Taylor. Recordemos la


(k)
Observación 7.3.2, que nos dice que Rn (a) = 0 para k = 0, . . . , n. Como las derivadas hasta
orden n de Rn son continuas en a,
lı́m Rn(k) (x) = Rn(k) (a) = 0 (7.3.4)
x→a

para k ≤ n.

El lı́mite que debemos calcular, que es


Rn (x)
lı́m ,
x→a (x − a)n

es una indeterminación de la forma 00 , y le podemos aplicar la Regla de L’Hôpital. Al derivar


una vez, dos veces,. . . , n − 1 veces, seguimos teniendo una indeterminación de la forma 00 .
Por lo tanto, podemos aplicar la Regla de L’Hôpital n veces, al cabo de las cuales obtenemos
que
(n)
Rn (x) Rn (x)
lı́m = lı́m .
x→a (x − a)n x→a n!
Usando la ecuación (7.3.4) para k = n, llegamos a que este lı́mite es 0.□

Observación 7.3.5. Observemos que la aproximación que nos da el teorema de Taylor es


local, ya que está dada por un lı́mite. Es decir, este teorema sólo nos habla de cuánto se
parecen la función f y su polinomio de Taylor Pn (f, a) en entornos, que pueden ser pequeños,
del punto a.
Ejemplo 7.3.6. Miremos f : (−1, +∞) → R dada por f (x) = 1+x 1
. Su polinomio de Taylor
de orden n en 0 es Pn (x) = k=0 (−1) x , y define una función en toda la recta R. Sin
Pn k k

embargo, la función f está definida únicamente para x > −1, y lı́mx→−1+ f (x) = +∞, por
lo que
lı́m + Rn (x) = lı́m + (f (x) − Pn (x)) = +∞,
x→−1 x→−1
pues lı́mx→−1+ Pn (x) = Pn (−1) = n.

Es decir, aunque n sea muy grande, la aproximación de f por Pn es muy mala cuando
nos acercamos a x = −1.

Observemos lo que pasa cerca de 1. El polinomio Pn (1) vale 0 o 1 según si n es par o


impar, y f (1) = 12 . Por lo tanto |Rn (1)| = 21 para cualquier n, lo cual muestra que en x = 1
el polinomio Pn tampoco es una buena aproximación de f .

Las imágenes muestran a f y sus polinomios de Taylor hasta orden 4.

Más adelante volveremos a este ejemplo para entender mejor qué pasa con el resto Rn (x)
en el intervalo abierto (−1, 1).
230

La función f f y su polinomio de Taylor


de orden 1

f y su polinomio de Taylor
de orden 2 f y su polinomio de Taylor
de orden 3

f y su polinomio de Taylor
de orden 4

Para terminar esta sección, veremos que no hay otros polinomios que aproximen a f
cerca de a como lo hace el polinomio de Taylor.
231

Proposición 7.3.7. Sea f una función que es n veces derivable en un entorno de a


y tal que f (n) es continua en a. Si Q es un polinomio de grado menor o igual que n
tal que
f (x) − Q(x)
lı́m = 0,
x→a (x − a)n
entonces Q = Pn (f, a).

Para probar esta proposición haremos uso del siguiente lema:

Lema 7.3.8. 1. Si P es un polinomio de grado menor o igual que n tal que

P (x)
lı́m = 0,
x→a (x − a)n

entonces P es el polinomio nulo.

2. Si P y Q son polinomios de grado menor o igual que n tales que

P (x) − Q(x)
lı́m = 0,
x→a (x − a)n

entonces P = Q.

Demostración del Lema 7.3.8.

1. Escribamos a P como en polinomio en x − a. Tenemos que

P (x) = b0 + b1 (x − a) + · · · + bn (x − a)n .

En el cociente
P (x)
(x − a)n
el denominador tiende a 0 cuando x tiende a a. Para que el cociente tienda a cero, el
numerador P (x) también tiene que tender a 0, por lo que b0 = 0. Entonces

P (x) b1 + b2 (x − a) + · · · + bn (x − a)n−1
= .
(x − a)n (x − a)n−1

Repitiendo el razonamiento anterior, tenemos que b1 = 0. Haciendo esto n veces,


P (x)
llegamos a que todos los coeficientes b0 , b1 , . . . , bn−1 son iguales a 0. Entonces (x−a) n =

bn . Como lı́mx→a bn = 0 y bn es una constante, bn = 0.

2. Aplicando el inciso anterior al polinomio P − Q, tenemos que P − Q = 0, es decir, que


P = Q.□
232

Demostración de la Proposición 7.3.7.

Llamemos P al polinomio de Taylor Pn (f, a). Entonces

f (x) − Q(x) f (x) − P (x) P (x) − Q(x)


= + .
(x − a)n (x − a)n (x − a)n

Por hipótesis
f (x) − Q(x)
lı́m = 0,
x→a (x − a)n
y por el Teorema de Taylor
f (x) − P (x)
lı́m = 0,
x→a (x − a)n
lo que nos permite concluir que

P (x) − Q(x)
lı́m = 0.
x→a (x − a)n

Por el lema anterior, esto implica que P = Q.□

Ejercicio de examen

(Ejercicio 9 - examen febrero 2024) Sea f : R → R tal que f (x) = 1 e−t dt.
R x2 2

Indicar cuál de los siguientes polinomios es el que mejor aproxima a f (x) si x está
cerca de 1
1
A) e(10x2 − 18x + 8) D) e
(−6x2 + 14x − 8)
1
B) e(5x2 − 8x + 3) E) e
(−3x2 + 2x)
1
C) e(5x2 + 2x) F) e
(−3x2 + 8x − 5)

Solución. Buscamos el polinomio de Taylor de orden 2 de f en x = 1:

f ′′ (1)
P2 (f, 1)(x) = f (1) + f ′ (1)(x − 1) + (x − 1)2
2
y se tiene que:

R1 2
f (1) = 1
e−t dt = 0

por la regla de la cadena y el Teorema Fundamental del Cálculo


4
f ′ (x) = e−x · 2x

y por lo tanto f ′ (1) = 2e−1 = 1


e
·2
233

por la regla de la cadena


4 4 4
f ′′ (x) = −4xe−x · 2x + 2e−x = e−x (−8x2 + 2)

y por lo tanto f ′′ (1) = e−1 (−8 + 2) = 1


e
· (−6)

Entonces:
f ′′ (1)
P2 (f, 1)(x) = f (1) + f ′ (1)(x − 1) + (x − 1)2
2
1 1
=0+ · 2(x − 1) + (−6)(x2 − 2x + 1)
e e
1
= (−6x2 + 14x − 8)
e

Ejercicio 77. Probar que si f y g son funciones con derivadas hasta orden n continuas
en el punto a, y
N
X
Pn (f, a)(x)Pn (g, a)(x) = ak (x − a)k ,
k=0

entonces n
X
Pn (f g, a) = ak (x − a)k .
k=0

Leamos cuidadosamente lo que pide este ejercicio. Los polinomios Pn (f, a) y Pn (g, a) son
polinomios de grado menor o igual que n, cuyo producto podrı́a tener (y con frecuencia
tiene) grado mayor. Digamos que el grado de Pn (f, a)Pn (g, a) es N , con lo que podemos
escribir
N
X
Pn (f, a)(x)Pn (g, a)(x) = ak (x − a)k .
k=0

Por otro lado Pn (f g, a) es, por definición, un polinomio de grado menor o igual que n. El
ejercicio nos pide probar que éste se obtiene tomando el producto Pn (f, a)(x)Pn (g, a)(x) y
borrando todos los términos de grado mayor que n que aparezcan en él.

1
Por ejemplo, si f (x) = ex y g(x) = 1+x
, entonces

1
P2 (f, 0)(x) = 1 + x + x2 y P2 (g, 0)(x) = 1 − x + x2 .
2
Su producto es 1 + 21 x2 + 12 x3 + 12 x4 . El polinomio de Taylor de orden 2, en 0, de la función
ex
f g(x) = 1+x es
1
P2 (f g, 0)(x) = 1 + x2 .
2

¡El ejercicio del recuadro brinda una excelente oportunidad de usar la Proposición 7.3.7!
234

7.4. Aplicación al cálculo de lı́mites

Observación 7.4.1. Si f está en las hipótesis del Teorema de Taylor y


Pn = Pn (f, a),
 
f (x) Pn (x) Rn (x) Pn (x)
lı́m = lı́m + = lı́m ,
x→a (x − a)n x→a (x − a) n (x − a)n x→a (x − a)n

pues
Rn (x)
lı́m = 0.
x→a (x − a)n

Esta observación permite calcular algunos lı́mites.

Ejemplo 7.4.2.
sen(x) − x
lı́m .
x→0 x3

3
El polinomio de Taylor de orden 3 en 0 de la función seno es x − x6 . Por lo tanto, Si
f (x) = sen(x) − x, el polinomio de Taylor de orden 3 de f en el punto 0 es
−x3
P3 (x) = .
6
Entonces
sen(x) − x P3 (x) 1
lı́m = lı́m = − .
x→0 x3 x→0 x3 6

Ejemplo 7.4.3.
2
ex − 1
lı́m
x→0 x2

2
Tomemos la función f (x) = ex − 1. Su polinomio de Taylor de orden 2 es x2 , por lo que
2
ex − 1 P2 (x)
lı́m = lı́m = 1.
x→0 x2 x→0 x2

Ejemplo 7.4.4.
2
ex − 1
lı́m
x→0 log(1 + x) − x

Podemos escribir
2 2
ex − 1 ex − 1 x2
lı́m = lı́m .
x→0 log(1 + x) − x x→0 x2 log(1 + x) − x
235

Si tomamos f (x) = log(1 + x) − x, vemos que su polinomio de Taylor de orden 2 en 0 es


2
P2 (x) = − x2 . Por lo tanto
log(1 + x) − x P2 (x) 1
lı́m 2
= lı́m 2
=−
x→0 x x→0 x 2
y
x2
lı́m = −2.
x→0 log(1 + x) − x

Juntando esto con lo que sabemos del ejemplo anterior,


2 2
ex − 1 ex − 1 x2
lı́m = lı́m = 1 · (−2) = −2.
x→0 log(1 + x) − x x→0 x2 log(1 + x) − x
Ejemplo 7.4.5.
(x−1)2
arctan(x) − π4 − x−1
2
+ 4
lı́m 3
x→1 (x − 1)

Si calculamos el polinomio de Taylor de orden 3 de la función arctan(x) en el punto 1,


vemos que es igual a
π x − 1 (x − 1)2 (x − 1)3
P3 (arctan, 1)(x) =
+ − + .
4 2 4 12
Por lo tanto, el polinomio de orden 3 en el punto 1 de la función
π x − 1 (x − 1)2
f (x) = arctan(x) − − +
4 2 4
es
(x − 1)3
P2 (f, 1)(x) = .
12
Por lo tanto
(x−1)2
arctan(x) − π4 − x−1
2
+ 4 P3 (f, 1)(x) 1
lı́m = lı́m = .
x→1 (x − 1)3 x→1 (x − 1) 3 12

Ejercicio de parcial

(Ejercicio 5 - segundo parcial primer semestre 2020) Calcular

1 − cos(3x)
lı́m
x→0 xsen(4x)

(A) 1/8 (C) 1/2 (E) 9/8

(B) 1/10 (D) 2/5 (F) 9/10


2
Solución. El polinomio de Taylor de orden 2 de la función coseno en 0 es p(x) = 1 − x2! por
lo que el polinomio de Taylor de orden 2 de la función 1 − cos(3x) en 0 es:
(3x)2
 
9
1 − p(3x) = 1 − 1 − = x2
2! 2
236

Por otro lado, el polinomio de Taylor de orden 2 de la función seno en 0 es q(x) = x por lo
que el polinomio de Taylor de orden 2 de la función x sen(4x) en 0 es

xq(4x) = x · (4x) = 4x2

Por lo tanto
9 2
1 − cos(3x) x
lı́m = lı́m 2 2
x→0 x sen(4x) x→0 4x

9x2
= lı́m
x→0 8x2
9
=
8

Ejercicio de examen

(Ejercicio 9 - examen diciembre 2023) Indicar el valor del siguiente lı́mite


x3
ex − x − 2 + cos(x) − 6
lı́m+
x→0 x4
1 1 1 1
A) − 24 B) − 12 C) 0 D) 24
E) 12
F) +∞

Solución. El polinomio de Taylor de orden 4 de la función ex en 0 es:


x2 x3 x4 x2 x3 x 4
p(x) = 1 + x + + + =1+x+ + +
2! 3! 4! 2 6 24
y el polinomio de Taylor de orden 4 de la función cos(x) en 0 es:
x2 x4 x2 x4
q(x) = 1 − + =1− +
2! 4! 2 24
x3
Entonces el polinomio de Taylor de orden 4 de ex − x − 2 + cos(x) − 6
en 0 es:

x3 x2 x3 x4 x2 x4 x3 x4


p(x) − x − 2 + q(x) − = 1 + 
x+  +  + −
x − 2 + 1 − +  + −  =
6 2 6 24 2 24 6 12
Por lo tanto,
x3 x4
ex − x − 2 + cos(x) − 6

12 1
lı́m = lı́m+ =
x→0+ x4 x→0 x4 12

7.5. Forma del resto de Lagrange y estimación de erro-


res

El Teorema de Taylor nos dice que una función f (x) puede ser aproximada por un
polinomio Pn (f, a)(x) localmente, cerca del punto a. ¿Cuán cerca? No lo sabemos. Como el
237

enunciado del teorema nos da el valor de un lı́mite, no tenemos información relevante sobre
cuánto se parecen f (x) y Pn (f, a)(x) en un punto x ̸= a. Para esto, quisiéramos tener una
acotación de
Rn (f, a)(x)
que sea válida al menos en un entorno de a cuyo tamaño conozcamos. Esto nos permitirı́a
hacer un cálculo aproximado de valores de f (x) aún cuando x ̸= a.

La pregunta importante que queremos responder es:

¿Podemos aproximar f (x) por un polinomio en un intervalo?

Como vimos en el Ejemplo 7.3.6, no siempre podemos esperar que el polinomio de Taylor
Pn (f, a) aproxime a la función f en todo su dominio. Para f : (−1, +∞) → R dada por
1
f (x) = 1+x , el polinomio Pn (f, 0)(x) no se parece a f en x = 1, aunque tomemos n muy,
muy grande. Sin embargo, Pn (f, 0) sı́ parece, al menos en las gráficas que acompañan el
Ejemplo 7.3.6, estarse aproximando a f (x) en (−1, 1) a medida que crece n.

Ahora observemos la figura de abajo. En ella se ve la gráfica de la función f (x) = sen(x),


y sus polinomios de Taylor en 0 hasta orden 7. El dibujo parece sugerir que, al aumentar n, el
polinomio Pn (f, 0)(x) se aproxima a f (x) en un intervalo cada vez más grande. ¿Será cierto
esto? En caso de serlo, ¿nos permitirá, por ejemplo, calcular aproximadamente el número
sen(2)?

Para responder a estas preguntas vamos a ver un resultado que nos dará una expresión
para Rn (f, a)(x).
238

Teorema 7.5.1 (Forma del resto de Lagrange). Sean f : I → R una función n + 1


veces derivable en I y a un punto de I. Entonces, para x ∈ I, existe un punto cx entre a
y x (es decir: cx está en el intervalo (a, x) o en el intervalo (x, a), según corresponda).
tal que
f (n+1) (cx )
Rn (f, a)(x) = (x − a)n+1 .
(n + 1)!

Antes de demostrar este teorema, veremos cómo es útil para acotar el resto Rn (f, a)(x)
para x en un intervalo. Es decir, para ver que Rn (f, a)(x) es, en valor absoluto, menor que
algo que depende de a, n y, por supuesto, de cuál sea la función f . Ası́ al aproximar f por
Pn (f, a), tendremos una estimación del error cometido.

Ejemplo 7.5.2. Aproximación de la función seno.

Tomemos f (x) = sen(x) y a = 0. El Teorema 7.5.1 nos dice que


f (n+1) (cx ) n+1
Rn (x) = x ,
(n + 1)!
por lo que
|f (n+1) (cx )| n+1
|Rn (x)| = |x| .
(n + 1)!
Observemos que f (n+1) es, dependiendo del valor de n, la función sen, cos, −sen, o − cos.
En cualquier caso, y sin importar cuánto vale cx ,
|f (n+1) (cx )| ≤ 1.
Por lo tanto,
|x|n+1
|Rn (x)| = .
(n + 1)!

Digamos que queremos calcular sen(2) con un error menor a 10−3 . En primer lugar,
tenemos que hallar n tal que
2n+1
< 10−3 .
(n + 1)!
El valor n = 9 es el primero que cumple esto. Por lo tanto,
210
|sen(2) − P9 (2)| = |R9 (2)| < < 10−3 .
10!

x3 x5 x7 x9
Como P9 (x) = x − 3!
+ 5!
− 7!
+ 9!
, el valor aproximado de sen(2) que obtenemos es
P9 (2) = 0, 90934744268077601410934744268078.
¡Por supuesto que no todas estas cifras decimales son correctas para sen(2)! Pero este es un
número que aproxima a sen(2) con un error menor a un milésimo.
239

Ejemplo 7.5.3. ¿Cuánto vale e1/2 , aproximadamente?

Tomemos la función f (x) = ex . Es una función positiva estrictamente creciente, que


coincide con todas sus derivadas, por lo cual para todo n ≥ 0
c1 1
f (n+1) (c 1 ) = e 2 < e2 ,
2

si c 1 ∈ (0, 21 ).
2

Si no sabemos cuánto vale e1/2 , ¿de qué nos sirve esta acotación? Sabemos que e < 4,
por lo que e1/2 < 41/2 = 2. Por lo tanto,
c1
f (n+1) (c 1 ) = e 2 < 2,
2

si c 1 ∈ (0, 21 ).
2

Si tomamos el polinomio de Taylor de f en 0, tendremos que

f (n+1) (c 1 ) 1
 
1 2
1
Rn = n+1
< .
2 (n + 1)! 2 (n + 1)!2n

Eligiendo n = 4, 1
(n+1)!2n
= 1
5!24
< 10−3 . Por lo tanto
 
1 1 1 1 1 1 1 1
P4 =1+ + 2 + 3 + 4
2 2 2 2! 2 3! 2 4!

es un número que aproxima e1/2 a menos de un milésimo.

1
Ejercicio 78. Tomemos la función del Ejemplo 7.3.6, es decir, f (x) = 1+x
. Para n ≥ 0, sean
Pn su polinomio de Taylor de orden n en 0, y Rn = f − Pn el resto.

1. Calcular Rn (1) con la forma del resto de Lagrange.

2. Investigar si, para x ∈ (0, 1), el valor de Pn (x) aproxima a f (x) cuando n es suficien-
temente grande.

3. Investigar si, para x ∈ (−1, 0), el valor de Pn (x) aproxima a f (x) cuando n es sufi-
cientemente grande.
240

Expansión decimal

Si calculamos un número α con un error menor a 10−3 , ¿cuántas cifras hemos


calculado en forma correcta? ¡No sabemos! Observemos que

α0 = 1 − 10−4 y α1 = 1 + 10−4

están a distancia menor que 10−3 y difieren en la cifra de las unidades. Efectivamente,
α0 = 0, 9999 y α1 = 1, 0001.
Entonces, si sólo podemos calcular el número π aproximadamente, ¿cómo estamos
seguros de que su segunda cifra después de la coma es un 4?
Recordemos cómo se escribe la expansión decimal. Digamos que α es un número
entre 0 y 1, es decir, es de la forma α = 0, . . .. Dividimos el intervalo [0, 1] en diez
subintervalos iguales:
         
1 1 2 2 3 3 4 4 5
0, , , , , , , , , ,
10 10 10 10 10 10 10 10 10
         
5 6 6 7 7 8 8 9 9
, , , , , , , , y ,1 .
10 10 10 10 10 10 10 10 10
6 7
Si α está, por ejemplo, entre 10
y 10
, su expansión decimal comienza con un 6. Es
decir, α = 0, 6 . . ..
6 7
Para saber la segunda cifra decimal de α, dividimos el intervalo [ 10 , 10 ] en diez
62 63
subintervalos iguales. Si α está, por ejemplo, en el subintervalo [ 100 , 100 ], su segunda
cifra decimal será un 2.
63
¿Qué pasa si α es el número 100
? ¿Es de la forma

0, 62 . . .
62 63
por pertenecer a [ 100 , 100 ], o de la forma

0, 63 . . .
63 64
por pertenecer a [ 100 , 100 ]? ¡Lo podemos escribir de cualquiera de las dos maneras! En
efecto,
63
= 0, 63 = 0, 629999999999999999 . . . ,
100
donde la sucesión de nueves es infinita.
63
Tan cerca como queramos del 100 , habrá otros números cuya segunda cifra decimal
sea 2 y números cuya segunda cifra decimal sea 3.
k
En realidad, todos los números que son de la forma n , donde k ∈ Z y n ∈ N,
10
tienen dos expansiones decimales distintas. Son los números enteros y los números
que, al subdividir un intervalo de extremos enteros [N, N + 1] primero en 10, luego
en 102 , luego en 103 , etc., en algún momento caen en el borde de dos subintervalitos.
Pero todos los demás números tienen una expansión decimal única.
241

Volvamos a la pregunta original, la de si podemos, al calcular aproximadamente un


número, estar seguros de algunas de sus cifras decimales. Supongamos que sabemos
1
que el número π está a una distancia menor de 1000 de 3, 1413. Eso quiere decir
que está entre 3, 1403 y 3, 1423. En particular, está necesariamente en el intervalo
14 15
(3, 14, 3, 15) = (3 + 100 , 3 + 100 ), por lo que estamos seguros de que sus primeras dos
cifras decimales son 1 y 4.

Demostración del Teorema 7.5.1.

f (n+1) (c)
Fijados a, n y x, queremos probar que Rn (f, a)(x) = (n+1)!
(x − a)n+1 para algún valor
de c entre a y x.

Definamos el número R por la ecuación


R
f (x) = Pn (f, a)(x) + (x − a)n+1 ,
(n + 1)!
es decir,
(n + 1)!
R = (f (x) − Pn (f, a)(x)) .
(x − a)n+1

R
Con esta definición, el resto Rn (f, a)(x) es igual a (n+1)! (x − a)n+1 . Por lo tanto, tenemos
que probar que existe un c entre a y x para el cual R = f (n+1) (c).

Consideremos la función definida en el intervalo entre a y x por


n
X f (k) (y) R
F (y) = (x − y)k + (x − y)n+1 .
k=0
k! (n + 1)!

Observemos que F (x) = F (a) = f (x), y que F es una función derivable. Por el Teorema de
Rolle, existe c entre a y x tal que F ′ (c) = 0.

Calculando la derivada de F obtenemos


n  (k+1)
f (k) (y)

′ ′
X f (y) k k−1 R
F (y) = f (y) + (x − y) − (x − y) − (x − y)n
k=1
k! (k − 1)! n!
f (n+1) (y) R
= f ′ (y) + (x − y)n − f ′ (y) − (x − y)n
n! n!
f (n+1) (y) R
= (x − y)n − (x − y)n
n! n!
Observemos que en el cálculo anterior usamos estos dos hechos elementales:

Pn f (k) (y) Pn f (k) (y)


k=0 k!
(x − y)k = f (y) + k=1 k!
(x − y)k
242

P  (k+1) f (k) (y)



f (n+1) (y)
La suma nk=1 f k! (y) (x − y)k − (k−1)!
(x − y)k−1 es telescópica, e igual a n!
(x−
y)n − f ′ (y).

f (n+1) (c)
Que F ′ (c) = 0 quiere decir que R
n!
(x − c)n = n!
(x − c)n , es decir, R = f (n+1) (c).
Esto es lo que querı́amos probar.□

También podría gustarte