0% fanden dieses Dokument nützlich (0 Abstimmungen)
34 Ansichten260 Seiten

XXAN1

Fasda dasda asd

Hochgeladen von

Martin Alchantas
Copyright
© © All Rights Reserved
Wir nehmen die Rechte an Inhalten ernst. Wenn Sie vermuten, dass dies Ihr Inhalt ist, beanspruchen Sie ihn hier.
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen
0% fanden dieses Dokument nützlich (0 Abstimmungen)
34 Ansichten260 Seiten

XXAN1

Fasda dasda asd

Hochgeladen von

Martin Alchantas
Copyright
© © All Rights Reserved
Wir nehmen die Rechte an Inhalten ernst. Wenn Sie vermuten, dass dies Ihr Inhalt ist, beanspruchen Sie ihn hier.
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen

ANALYSIS 1

Wolfgang Soergel

25. April 2024


Inhaltsverzeichnis
1 Grundlegendes 5
1.1 Vollständige Induktion und binomische Formel . . . . . . . . . . 5
1.2 Mengen und Teilmengen . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Mengenoperationen . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.5 Mengen mit Verknüpfung . . . . . . . . . . . . . . . . . . . . . . 29
1.6 Körper im Sinne der Algebra . . . . . . . . . . . . . . . . . . . . 38

2 Die reellen Zahlen 44


2.1 Rationale Wurzeln rationaler Zahlen . . . . . . . . . . . . . . . . 44
2.2 Angeordnete Körper . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3 Maximum und Supremum . . . . . . . . . . . . . . . . . . . . . 49
2.4 Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Rationale und reelle Zahlen im Vergleich . . . . . . . . . . . . . 61

3 Stetigkeit und Grenzwerte 64


3.1 Anschauung für Funktionen . . . . . . . . . . . . . . . . . . . . 64
3.2 Intervalle und Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . 66
3.3 Zwischenwertsatz und Umkehrfunktionen . . . . . . . . . . . . . 74
3.4 Umfang des Einheitskreises . . . . . . . . . . . . . . . . . . . . . 80
3.5 Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.6 Vollständigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . 95
3.7 Algorithmisches Wurzelziehen* . . . . . . . . . . . . . . . . . . 98

4 Exponentialfunktion 101
4.1 Konvergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . . 101
4.2 Wachstum und Zerfall . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3 Logarithmus und allgemeine Potenzen . . . . . . . . . . . . . . . 115
4.4 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.5 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . 127

5 Integration und Ableitung 144


5.1 Stetige Funktionen auf Kompakta . . . . . . . . . . . . . . . . . 144
5.2 Integration stetiger Funktionen . . . . . . . . . . . . . . . . . . . 149
5.3 Ableitung an einer Stelle . . . . . . . . . . . . . . . . . . . . . . 157
5.4 Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.5 Folgerungen aus Eigenschaften der Ableitung . . . . . . . . . . . 165
5.6 Regeln von de l’Hospital . . . . . . . . . . . . . . . . . . . . . . 175
5.7 Zusammenhang zwischen Integral und Ableitung . . . . . . . . . 179

2
5.8 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.9 Hyperbolische trigonometrische Funktionen . . . . . . . . . . . . 191
5.10 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . 196

6 Potenzreihen und höhere Ableitungen 202


6.1 Funktionenfolgen und Potenzreihen . . . . . . . . . . . . . . . . 202
6.2 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.3 Rechnen mit Approximationen . . . . . . . . . . . . . . . . . . . 216
6.4 Der Abel’sche Grenzwertsatz* . . . . . . . . . . . . . . . . . . . 220

7 Raumwertige Funktionen und Schwingungen 222


7.1 Bogenlänge und Geschwindigkeit . . . . . . . . . . . . . . . . . 222
7.2 Systeme von linearen Differentialgleichungen . . . . . . . . . . . 233
7.3 Gedämpfte Schwingungen . . . . . . . . . . . . . . . . . . . . . 237
7.4 Differentialgleichungen höherer Ordnung . . . . . . . . . . . . . 241
7.5 Gekoppelte Schwingungen* . . . . . . . . . . . . . . . . . . . . 243
7.6 Angeregte Schwingungen . . . . . . . . . . . . . . . . . . . . . . 244

8 Danksagung 247

9 Tagebuch WS 22/23 248

Literaturverzeichnis 251

Indexvorwort 252

Index 253

3
Dies ist der erste Teil eines Skriptums zur Analysis. Ich habe mir große Mühe
gegeben, an jeder Stelle nur soviel Begrifflichkeit einzuführen, wie gerade eben
nötig ist, um einerseits einen glatten und transparenten Fluß der Argumentation zu
ermöglichen und andererseits regelmäßig motivierende Anwendungen geben zu
können. Sowohl die Anwendungen als auch der durchsichtige Aufbau der Theorie
erfordern jedoch in meinen Augen eine nach Möglichkeit koordinatenfreie Dar-
stellung und damit den Aufbau der zugehörigen Begrifflichkeit, so daß am Schluß
im Vergleich zu anderen Texten doch eher mehr abstrakte Konzepte eingeführt
werden. Wie Sie noch an verschiedenen Stellen merken werden, will ich Sie eben
am liebsten davon überzeugen, daß das Abstrakte das eigentlich Konkrete ist!

4
1 Grundlegendes
1.1 Vollständige Induktion und binomische Formel
n(n+1)
Satz 1.1.1. Für jede natürliche Zahl n ≥ 1 gilt 1 + 2 + . . . + n = 2
.
Beispiel 1.1.2. Im Fall n = 5 behauptet unser Satz 1 + 2 + 3 + 4 + 5 = 5 × 6/2
und in diesem Fall stimmt das schon mal: Beide Seiten sind 15. Man bemerke, daß
wir beim Rechnen mit Symbolen wie etwa n(n + 1) die Multiplikationssymbole
weggelassen haben, die nur beim Rechnen mit durch Ziffern dargestellten Zahlen
wichtig sind.
Beweis. Bei diesem Beweis sollen Sie gleichzeitig das Beweisprinzip der voll-
ständigen Induktion lernen. Wir bezeichnen mit A(n) die Aussage, daß die For-
mel im Satz für ein gegebenes n gilt, und zeigen:
1(1+1)
Induktionsbasis: Die Aussage A(1) ist richtig. In der Tat gilt 1 = 2
.

Induktionsschritt: Aus der Aussage A(n) folgt die Aussage A(n + 1). In der
Tat, unter der Annahme, daß unsere Formel für ein gegebenes n gilt, der so-
genannten Induktionsannahme oder Induktionsvoraussetzung, rechnen
wir
1 + 2 + . . . + n + (n + 1) = n(n+1)
2
+ 2(n+1)
2
(n+2)(n+1)
= 2
(n+1)((n+1)+1)
= 2
und folgern so, daß die Formel auch für n + 1 gilt.
Es ist damit klar, daß unsere Aussage A(n) richtig ist alias daß unsere Formel gilt
für alle n = 1, 2, 3, . . .
1.1.3. Das Zeichen deutet in diesem Text das Ende eines Beweises an und ist in
der neueren Literatur weit verbreitet. Buchstaben in Formeln werden in der Ma-
thematik üblicherweise kursiv notiert, so wie etwa das n oder auch das A im vor-
hergehenden Beweis. Nur Buchstaben oder Buchstabenkombinationen, die stets
dasselbe bedeuten sollen, schreibt man nicht kursiv, wie etwa sin für den Sinus
oder log für den Logarithmus.
1.1.4. Der vorhergehende Beweis stützt sich auf unser intuitives Verständnis der
natürlichen Zahlen. Man kann das Konzept der natürlichen Zahlen auch formal
einführen und so die natürlichen Zahlen in gewisser Weise „besser“ verstehen.
Das wird in [GR] 1.6.11 und ausführlicher in [LA1] 4.1.6 diskutiert. Das Wort
„Induktion“ meint eigentlich „Hervorrufen“, so wie etwa das Betrachten einer
Wurst die Ausschüttung von Spucke induziert alias uns den Mund wässrig macht.

5
Im Zusammenhang der vollständigen Induktion ist es dahingehend zu verstehen,
daß die Richtigkeit unserer Aussage A(1) die Richtigkeit von A(2) induziert, die
Richtigkeit von A(2) hinwiederum die Richtigkeit von A(3), die Richtigkeit von
A(3) die Richtigkeit von A(4), und immer so weiter.
1.1.5. Es herrscht keine Einigkeit in der Frage, ob man die Null eine natürliche
Zahl nennen soll. In diesem Text ist stets die Null mit gemeint, wenn von natürli-
chen Zahlen die Rede ist. Wollen wir die Null dennoch ausschließen, so sprechen
wir wie oben von einer „natürlichen Zahl n ≥ 1“.
1.1.6. Ich will kurz begründen, warum es mir natürlich scheint, auch die Null eine
natürliche Zahl zu nennen: Hat bildlich gesprochen jedes Kind einer Klasse einen
Korb mit Äpfeln vor sich und soll seine Äpfel zählen, so kann es ja durchaus vor-
kommen, daß in seinem Korb gar kein Apfel liegt, weil es zum Beispiel alle seine
Äpfel bereits gegessen hat. In der Begrifflichkeit der Mengenlehre ausgedrückt,
die wir in 1.2 einführen werden, muß man die leere Menge endlich nennen, wenn
man erreichen will, daß jede Teilmenge einer endlichen Menge wieder endlich ist.
Will man dann zusätzlich erreichen, daß die Kardinalität jeder endlichen Menge
eine natürliche Zahl ist, so darf man die Null nicht aus den natürlichen Zahlen
herauslassen.

Die Gesamtfläche dieses


Treppenquerschnitts ist
offensichtlich 42 /2 + 4/2 = 4 · 5/2

1.1.7. Man kann sich den Satz wie im Bild angedeutet anschaulich klar machen
als eine Formel für die Fläche des Querschnitts durch eine Treppe der Länge n mit
Stufenabstand und Stufenhöhe Eins. In der Tat bedeckt ein derartiger Querschnitt
ja offensichtlich ein halbes Quadrat der Kantenlänge n nebst n halben Quadraten

6
der Kantenlänge Eins. Ein weiterer Beweis geht so:

1 + 2 + 3 + ... + n = 1/2 + 2/2 + 3/2 + . . . + n/2


+ n/2 +(n − 1)/2 +(n − 2)/2 + . . . + 1/2
n+1 n+1 n+1 n+1
= 2
+ 2
+ 2
+... + 2

= n(n + 1)/2

Ich will letzteren Beweis benutzen, um eine neue Notation einzuführen.

Definition 1.1.8. Gegeben a1 , a2 , . . . , an schreiben wir


n
X
ai := a1 + a2 + . . . + an
i=1
P
Das Symbol ist ein großes griechisches S und steht für „Summe“. Das Sym-
bol := deutet an, daß die Bedeutung der Symbole auf der doppelpunktbehafteten
Seite des Gleichheitszeichens durch den Ausdruck auf der anderen Seite unseres
Gleichheitszeichens definiert ist. Im obigen und ähnlichen Zusammenhängen hei-
ßen a1 , . . . , an die Summanden und i der Laufindex, da er eben etwa in unserem
Fall von 1 bis n läuft und anzeigt alias „indiziert“, welcher Summand gemeint ist.

1.1.9 (Zur Sprache in der Mathematik). Das Wort „Definition“ kommt aus dem
Lateinischen und bedeutet „Abgrenzung“. In Definitionen versuchen wir, die Be-
deutung von Symbolen und Begriffen so klar wie möglich festzulegen. Sie werden
merken, daß man in der Mathematik die Angwohnheit hat, in Definitionen Worte
der Umgangssprache wie Menge, Gruppe, Körper, Unterkörper, Abbildung etce-
tera „umzuwidmen“ und ihnen ganz spezielle und meist nur noch entfernt mit der
umgangssprachlichen Bedeutung verwandte neue Bedeutungen zu geben. In ma-
thematischen Texten sind dann überwiegend diese umgewidmeten Bedeutungen
gemeint. In dieser Weise baut die Mathematik also wirklich ihre eigene Sprache
auf, bei der jedoch die Grammatik und auch nicht ganz wenige Wörter doch wie-
der von den uns geläufigen Sprachen übernommen werden. Das muß insbesonde-
re für den Anfänger verwirrend sein, der sich auch bei ganz harmlos daherkom-
menden Wörtern stets wird fragen müssen, ob sie denn nun umgangssprachlich
gemeint sind oder vielmehr bereits durch eine Definition auf eine mehr oder we-
niger andere und viel genauere Bedeutung festgelegt wurden. Um hier zu helfen,
habe ich mir große Mühe mit dem Index gegeben, den Sie ganz am Schluß die-
ses Skriptums finden und in dem alle an verschiedenen Stellen eingeführten oder
umgewidmeten und dort fett gedruckten Begriffe verzeichnet sein sollten. Und
an dieser Stelle muß ich Sie schon bitten, das Wort „Index“ nicht als Laufindex
mißzuverstehen!

7
P
Beispiel 1.1.10. In der -Notation liest sich der in 1.1.7 gegebene Beweis so:
Pn Pn i Pn i
i=1 i = i=1 2 + i=1 2

und
Pn nach
i
Pn n+1−k i = n + 1 − k hinten
Indexwechsel
= i=1 2 + k=1 2

dann
Pn mache
i
Pkn zun+1−i
i in der zweiten Summe
= i=1 2 + i=1 2

und
Pn nach Zusammenfassen beider Summen
n+1
= i=1 2

ergibt sich offensichtlich


= n( n+1
2
)
Beispiel 1.1.11. Einen anderen Beweis derselben Formel liefert die Gleichungs-
kette:
n
X n
X n
X n
X n
X
2 2 2
(n + 1) = (i + 1) − i = 2i + 1 = 2 i+ 1=n+1+2 i
i=0 i=0 i=0 i=0 i=0
P
Definition 1.1.12. In einer
Q ähnlichen Bedeutung wie das Symbol verwendet
man auch das Symbol , ein großes griechisches P , für „Produkt“ und schreibt
n
Y
ai := a1 a2 . . . an
i=1

Die a1 , . . . , an heißen in diesem und ähnlichen Zusammenhängen die Faktoren


des Produkts.
Definition 1.1.13. Für jede natürliche Zahl n ≥ 1 definieren wir die Zahl n!
(sprich: n Fakultät) durch die Formel
n
Y
n! := 1 · 2 · . . . · n = i
i=1

Wir treffen zusätzlich die Vereinbarung 0! := 1 und haben also 0! = 1, 1! = 1,


2! = 2, 3! = 6, 4! = 24 und so weiter.
1.1.14 (Allgemeinere Summen und Produkte). Wir vereinbaren, daß Produk-
ten, bei denen die obere Grenze des Laufindex um Eins kleiner ist Qals seine un-
tere Grenze, der Wert 1 zugewiesen werden soll, also etwa 1 = 0i=1 i = 0!.
Ebenso vereinbaren wir auch, daß Summen, bei denen die obere Grenze des Lau-
findex um Eins kleiner ist als seine untere Grenze, der Wert 0 zugewiesen wer-
den soll, so daß wir in Erweiterung unserer Formel 1.1.1 etwa schreiben könnten

8
0 = 0i=1 i. Der Sinn dieser Erweiterungen zeigt sich darin, daß damit Formeln
P

wie li=k ai = m
P P Pl
i=k a i + i=m+1 ai auch für m = k−1 richtig bleiben. Man mag
sogar noch weiter gehen und die Definition von Summen und Produkten auf be-
liebige untere und obere Grenzen so erweitern, daß diese Formeln richtig bleiben,
zumindest wenn alle Summanden ein Negatives beziehungsweise alle Faktoren
einen Kehrwert haben. In dieser Allgemeinheit
R ist die fragliche Notation jedoch
nur beim kontinuierlichen Analogon des Summenzeichens üblich, wie in 5.2.10
ausgeführt werden wird.

Satz 1.1.15 (Bedeutung der Fakultät). Es gibt genau n! Möglichkeiten, n von-


einander verschiedene Objekte in eine Reihenfolge zu bringen.

Beispiel 1.1.16. Es gibt genau 3! = 6 Möglichkeiten, die drei Buchstaben a, b und


c in eine Reihenfolge zu bringen, nämlich

abc bac cab


acb bca cba

In gewisser Weise stimmt unser Satz sogar für n = 0: In der Terminologie, die
wir in 2.3 einführen, gibt es genau eine Anordnung der leeren Menge.
Beweis. Hat man n voneinander verschiedene Objekte, so hat man n Möglichkei-
ten, ein Erstes auszusuchen, dann (n−1) Möglichkeiten, ein Zweites auszusuchen
und so weiter, bis schließlich nur noch eine Möglichkeit bleibt, ein Letztes auszu-
suchen. Insgesamt haben wir also wie behauptet n! mögliche Reihenfolgen.

Definition 1.1.17. Wir definieren für beliebiges n und jede natürliche Zahl k den
n

Binomialkoeffizienten k (sprich: n über k) durch die Regeln
  k−1
Yn−j  
n n(n − 1) . . . (n − k + 1) n
:= = für k ≥ 1 und := 1.
k k − j k(k − 1) . . . 1 0
j=0

Der Sonderfall k = 0 wird im Übrigen auch durch unsere allgemeine Formel ge-
deckt, wenn wir unsere Konvention 1.1.14 beherzigen.
 Im Lichte des folgenden
n
Satzes schlage ich vor, die Binomialkoeffizienten k statt „n über k“ inhaltsrei-
cher „k aus n“ zu sprechen.

1.1.18. Die Bezeichnung als Binomialkoeffizienten leitet sich von dem Auftreten
dieser Zahlen als Koeffizienten in der „binomischen Formel“ 1.1.23 ab.

Satz 1.1.19 (Bedeutung der Binomialkoeffizienten). Gegeben natürliche Zah-


len n und k gibt es genau nk Möglichkeiten, aus n voneinander verschiedenen
Objekten k Objekte auszuwählen.

9
Beispiel 1.1.20. Es gibt genau 42 = 2·1
4·3

= 6 Möglichkeiten, aus den vier Buch-
staben a, b, c, d zwei auszuwählen, nämlich
a, b b, c c, d
a, c b, d
a, d
Beweis. Wir haben n Möglichkeiten, ein erstes Objekt auszuwählen, dann n − 1
Möglichkeiten, ein zweites Objekt auszuwählen, und so weiter, also insgesamt
n(n − 1) . . . (n − k + 1) Möglichkeiten, k Objekte der Reihe nach auszuwählen.
Auf die Reihenfolge, in der wir ausgewählt haben, kommt es uns aber gar nicht
an, jeweils genau k! von unseren n(n − 1) . . . (n − k + 1) Möglichkeiten führen
nach 1.1.15 also zur Auswahl derselben k Objekte. Man bemerke, daß unser Satz
auch im Extremfall k = 0 noch stimmt, wenn wir ihn geeignet interpretieren: In
der Terminologie, die wir gleich einführen werden, besitzt in der Tat jede Menge
genau eine nullelementige Teilmenge, nämlich die leere Menge.
1.1.21. Offensichtlich gilt für alle natürlichen Zahlen n mit n ≥ k die Formel
   
n n! n
= =
k k!(n − k)! n−k
Das folgt einerseits sofort aus der formalen Definition und ist andererseits auch
klar nach der oben erklärten Bedeutung der Binomialkoeffizienten: Wenn wir aus
n Objekten k Objekte auswählen, so bleiben n−k Objekte übrig. Es gibt demnach
gleichviele Möglichkeiten, k Objekte auszuwählen,  wie  es Möglichkeiten gibt,
n n
n − k Objekte auszuwählen.  haben weiter n = 0 = 1 für jede natürliche
Wir
Zahl n ≥ 0 sowie n1 = n−1 n

= n für jede natürliche Zahl n ≥ 1.

Definition 1.1.22. Wie in der Schule setzen wir ak := ki=1 a und sprechen diesen
Q
usdruck „a hoch k“. In Worten ist also gemeint „das Produkt von k-mal dem
Faktor a“. Im Lichte von 1.1.14 verstehen wir insbesondere a0 := 1.
Satz 1.1.23. Für jede natürliche Zahl n gilt die binomische Formel
n  
n
X n k n−k
(a + b) = a b
k=0
k

1.1.24. Man beachte, wie wichtig unsere Konvention a0 = 1 und insbesondere


auch ihr Spezialfall 00 = 1 für die Gültigkeit dieser Formel ist.
1.1.25. Die Bezeichung „binomische Formel“ leitet sich ab von der Vorsilbe „bi“
für Zwei, wie etwa in englisch „bicycle“ für „Zweirad“ alias „Fahrrad“, und dem
lateinischen Wort „nomen“ für „Namen“. Mit den beiden „Namen“ sind hier a
und b gemeint. Mehr dazu wird in 3.2.37 erklärt.

10
Erster Beweis. Beim Ausmultiplizieren erhalten wir das Monom ak bn−k so oft,
wie es Möglichkeiten gibt, aus unseren n Faktoren (a + b) die k Faktoren auszu-
suchen, „in denen wir beim Ausmultiplizieren das a nehmen“. Dieses Argument
werden wir in 1.2.19 noch besser formulieren.
Zweiter Beweis. Dieser Beweis ist eine ausgezeichnete Übung im Umgang mit
unseren Symbolen und mit der vollständigen Induktion. Er scheint mir jedoch
auch in einer für Beweise durch vollständige Induktion typischen Weise wenig
durchsichtig. Zunächst prüfen wir für beliebiges n und jede natürliche Zahl k ≥ 1
die Formel      
n n n+1
+ =
k−1 k k
durch explizites Nachrechnen. Dann geben wir unserer Formel im Satz den Na-
men A(n) und prüfen die Formel A(0) und zur Sicherheit auch noch A(1) durch
Hinsehen. Schließlich gilt es, den Induktionsschritt durchzuführen, als da heißt,
A(n + 1) aus A(n) zu folgern. Dazu rechnen wir

(a + b)n+1 = (a + b)(a + b)n


und mitP
der Induktionsvoraussetzung
= (a + b) nk=0 nk ak bn−k


und
Pn durch Ausmultiplizieren
Pn
n k+1 n−k n k n−k+1

= k=0 k a b + k=0 k a b

und Indexwechsel k = i − 1 in der


 ersten Summe
Pn+1 n  i n−i+1 Pn n k n−k+1
= i=1 i−1 a b + k=0 k a b
dann mit kPstatt i und Absondern von Summanden
= an+1 b0 + nk=1 k−1 n
ak bn−k+1 +
+ nk=1 nk ak bn−k+1 + a0 bn+1
P 

und nach Zusammenfassen


Pn der mittleren Summen
n+1 k n−k+1
n+1 0

= a b + k=1 k a b + a0 bn+1
und Einbeziehen der abgesonderten Summanden
Pn+1 n+1 k n+1−k
= k=0 k
a b

und folgern so tatsächlich A(n + 1) aus A(n).


n
+ nk = n+1
  
1.1.26. Die Formel k−1 k
für k ≥ 1 kann man zur effektiven Be-
rechnung der Binomialkoeffizienten mit dem sogenannten Pascal’schen Dreieck

11
benutzen: Im Schema
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1

seien die Einsen an den Rändern vorgegeben und eine Zahl in der Mitte berechne
 stehennin der (n + 1)-
sich als die Summe ihrer beiden oberen „Nachbarn“. Dann
n
ten Zeile der Reihe nach die Binomialkoeffizienten 0
= 1, 1 = n, . . ., bis
n n
 
n−1
= n, n = 1. Wir haben also zum Beispiel nach der untersten Zeile in
obigem Ausschnitt des Pascal’schen Dreiecks

(a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4

Übungen
für ni=1 i2 . Hinweis: Man
P
Übung 1.1.27. Man finde und beweise
Pn 3 eine Formel
suche zunächst eine Formel für i=1 i − (i − 1)3 und beachte i3 − (i − 1)3 =
3i2 − 3i + 1.
Ergänzende
Pn kÜbung 1.1.28. Man zeige, daß für jedes k ∈ N eine Formel der Ge-
1
stalt i=1 i = k+1 nk+1 + ak nk + . . . + a1 n + a0 gilt mit aκ ∈ Q.

1.2 Mengen und Teilmengen


1.2.1. Beim Arbeiten mit reellen Zahlen oder räumlichen Gebilden reicht auf der
Schule ein intuitives Verständnis meist aus, und wenn die Intuition in die Irre führt,
ist ein Lehrer zur Stelle. Wenn Sie jedoch selbst unterrichten oder etwas beweisen
wollen, reicht dieses intuitive Verständnis nicht mehr aus. Im folgenden werden
deshalb zunächst der Begriff der reellen Zahlen und der Begriff des Raums zu-
rückgeführt auf Grundbegriffe der Mengenlehre, den Begriff der rationalen Zahlen
und elementare Logik. Bei der Arbeit mit diesen Begriffen führt uns die Intuition
nicht so leicht in die Irre, wir geben uns deshalb mit einem intuitiven Verständnis
zufrieden und verweisen jeden, der es noch genauer wissen will, auf eine Vorle-
sung über Logik. Wir beginnen mit etwas naiver Mengenlehre, wie sie von Georg
Cantor in den Jahren 1874 bis 1897 begründet wurde und von der der berühm-
te Mathematiker David Hilbert einmal sagte: „Aus dem Paradies, das Cantor uns
geschaffen, soll uns niemand vertreiben können“. Natürlich gab es auch vor der
Mengenlehre schon hoch entwickelte Mathematik: Beim Tod von Carl Friedrich
Gauß im Jahre 1855 gab es diese Theorie noch gar nicht und Fourier fand seine

12
„Fourierentwicklung“ sogar bereits zu Beginn des 19.-ten Jahrhunderts. Er be-
hauptete auch gleich in seiner „Théorie analytique de la chaleur“, daß sich jede
beliebige periodische Funktion durch eine Fouriereihe darstellen lasse, aber diese
Behauptung stieß bei anderen berühmten Mathematikern seiner Zeit auf Ableh-
nung und es entstand darüber ein heftiger Disput. Erst in besagtem „Paradies der
Mengenlehre“ konnten die Fourier’s Behauptung zugrundeliegenden Begriffe so-
weit geklärt werden, daß dieser Disput nun endgültig beigelegt ist. Ähnlich verhält
es sich auch mit vielen anderen Fragestellungen. Da die Mengenlehre darüber hin-
aus auch vom didaktischen Standpunkt aus eine äußerst klare und durchsichtige
Darstellung mathematischer Sachverhalte ermöglicht, hat sie sich als Grundlage
der höheren Mathematik und der Ausbildung von Mathematikern an Universitäten
schnell durchgesetzt und ist nun weltweit das „Alphabet der Sprache der Mathe-
matik“. Man wird an Universitäten sogar geradezu dazu erzogen, alle Mathematik
in der Sprache der Mengenlehre zu fassen und geometrischen Argumenten keine
Beweiskraft zuzugestehen. Ich halte das bei der Ausbildung von Mathematikern
auch für angemessen. Bei der Mathematik-Ausbildung im allgemeinen scheint
mir dieses Vorgehen dahingegen nicht zielführend: In diesem Kontext sollte man
meines Erachtens nicht mit demselben Maß messen, auch ohne alle Mengenlehre
geometrisch erklärte Begriffe wie Gerade und Kreis, Ebene und Raum, als wohl-
definierte Objekte der Mathematik zulassen und geometrischen Argumenten Be-
weiskraft zugestehen.
1.2.2. Im Wortlaut der ersten Zeilen des Artikels „Beiträge zur Begründung der
transfiniten Mengenlehre (Erster Aufsatz)“ von Georg Cantor, erschienen im Jahre
1895, hört sich die Definition einer Menge so an:
Unter einer Menge verstehen wir jede Zusammenfassung M von be-
stimmten wohlunterschiedenen Objekten m unserer Anschauung oder
unseres Denkens (welche die Elemente von M genannt werden) zu
einem Ganzen.
Verbinden wir mit einer Menge eine geometrische Vorstellung, so nennen wir ihre
Elemente auch Punkte und die Menge selbst einen Raum. Ein derartiges Herum-
gerede ist natürlich keine formale Definition und birgt durchaus verschiedene Fall-
stricke, vergleiche 1.3.9. Das Ziel dieser Vorlesung ist aber auch nicht eine formale
Begründung der Mengenlehre, wie Sie sie in der Logik kennenlernen können. Sie
sollen vielmehr die Bedeutung dieser Worte intuitiv erfassen wie ein Kleinkind,
das Sprechen lernt: Indem sie mir und anderen Mathematikern zuhören, wie wir
mit diesen Worten sinnvolle Sätze bilden, uns nachahmen, und beobachten, wel-
chen Effekt Sie damit hervorrufen. Unter anderem dazu sind die Übungsgruppen
da.
Ergänzung 1.2.3. Bei der Entwicklung der Mathematik aus der Umgangssprache
durch fortgesetztes Zuspitzen und Umwidmen des Wortschatzes muß ich an den

13
Baron von Münchhausen denken, wie er sich an seinen eigenen Haaren aus dem
Sumpf zieht. Schon verblüffend, daß es klappt. Aber bei Kleinkindern, die Spre-
chen lernen, ist es ja noch viel verblüffender, wie sie die Bedeutung von Worten
erfassen, ohne daß man sie ihnen in Worten erklären kann.
Beispiele 1.2.4. Endliche Mengen kann man durch eine vollständige Liste ihrer
Elemente in geschweiften Klammern angeben, zum Beispiel in der Form

X = {x1 , x2 , . . . , xn }

Diese geschweiften Klammern heißen auch Mengenklammern. Die Elemente


dürfen mehrfach genannt werden und es kommt nicht auf die Reihenfolge an, in
der sie genannt werden. Wir haben also {1, 1, 2} = {2, 1}. Die Aussage „x ist
Element von X“ wird mit x ∈ X abgekürzt, ihre Verneinung „x ist nicht Element
von X“ mit x 6∈ X. Zum Beispiel gilt 1 ∈ {2, 1} und 3 6∈ {2, 1}. Es gibt auch die
sogenannte leere Menge ∅ = { }, die gar kein Element enthält. Andere Beispiele
sind die Mengen

N := {0, 1, 2, . . .} der natürlichen Zahlen,

Z := {0, 1, −1, 2, −2, . . .} der ganzen Zahlen und

Q := {p/q | p, q ∈ Z, q 6= 0} der rationalen Zahlen.

Der Name letzterer Menge kommt von lateinisch „ratio“ für „Verhältnis“, der
Buchstabe Q steht für „Quotient“. Man beachte, daß wir auch hier Elemente mehr-
fach genannt haben, es gilt ja p/q = p0 /q 0 genau dann, wenn pq 0 = p0 q. Auf
Deutsch bezeichnet man die rationalen Zahlen auch als Bruchzahlen, da man
sich etwa ein Viertel eines Kekses als den Anteil denken kann, der entsteht, wenn
man besagten Keks in vier gleiche Teile zerbricht. Einen Leitfaden zu einem for-
maleren Aufbau des Zahlensystems können Sie in [GR] 2.5.1 finden.
Ergänzung 1.2.5 (Herkunft des Gleichheitszeichens). Das Gleichheitszeichen
= scheint auf ein 1557 von Robert Recorde publiziertes Buch zurückzugehen
und soll andeuten, daß das, was auf der linken und rechten Seite dieses Zeichens
steht, so gleich ist wie die beiden Strichlein, die das uns heute so selbstverständli-
che Gleichheitszeichen bilden. Davor schrieb man statt einem Gleichheitszeichen
meist ae für „äquivalent“.
Ergänzung 1.2.6 (Diskussion der Notation). In Texten, in deren Konventionen
die Null keine natürliche Zahl ist, verwendet man meist die abweichenden No-
tationen N für die Menge {1, 2, . . .} und N0 für die Menge {0, 1, 2, . . .}. Die in
diesem Text verwendete Notation N = {0, 1, 2, . . .} stimmt mit der internationa-
len Norm ISO 31-11 überein.

14
1.2.7. Die Bedeutung der Symbole Z und Q ist in der Mathematik weitgehend
einheitlich. Man verwendet diesen Schrifttypus auch sonst gerne für Symbole, die
in ihrer Bedeutung über große Teile der Mathematik hinweg einheitlich verwendet
werden. Bei der Bedeutung von N ist man allerdings nie ganz sicher, ob die Null
mitgemeint ist. In den Konventionen dieses Textes gilt 0 ∈ N.
1.2.8. Eine Menge, die nur endlich viele Elemente hat, nennen wir eine endliche
Menge. Eine präzisere Definition dieses Konzepts wird in [LA1] 4.1.2 gegeben.
Wir vereinbaren bereits hier, daß wir auch die leere Menge endlich nennen. Die
Zahl der Elemente einer endlichen Menge X nennen wir ihre Kardinalität oder
Mächtigkeit und notieren sie
|X|
oder card(X). In der Literatur findet man auch die Notation ]X. Für endliche
Mengen X ist demnach ihre Kardinalität stets eine natürliche Zahl |X| ∈ N und
|X| = 0 ist gleichbedeutend zu X = ∅. Ist X unendlich, so schreiben wir bis auf
weiteres kurzerhand |X| = ∞ und ignorieren in unserer Notation, daß auch un-
endliche Mengen „verschieden groß“ sein können. Für ein Beispiel für „verschie-
den große unendliche Mengen“ siehe 2.5.2 und für eine genauere Diskussion des
Begriffs der Kardinalität vergleiche [AL] 5.3.1.

Definition 1.2.9. Eine Menge Y heißt Teilmenge einer Menge X, wenn jedes
Element von Y auch ein Element von X ist. Man schreibt dafür Y ⊂ X oder
X ⊃Y.

Beispiel 1.2.10. Die leere Menge Teilmenge jeder Menge, in Formeln ∅ ⊂ X.


{x} ⊂ X ist gleichbedeutend zu x ∈ X. Es gilt ∅ ⊂ {2, 1} ⊂ Z ⊂ Q.
1.2.11 (Elemente und Teilmengen). Es ist im Kontext der Mengenlehre wichtig,
bei einer Menge X sorgfältig zu unterscheiden zwischen ihren Elementen und ih-
ren Teilmengen. Gegeben ein Element x ∈ X ist für uns das Element x ∈ X etwas
anderes als die Teilmenge {x} ⊂ X, die nur aus dem einzigen Element x besteht.
Gegeben eine Menge X mit einer Teilmenge Y ⊂ X sage ich auch, X umfaßt
Y . Gegeben ein Element x ∈ X sage ich, x gehört zu X. Andere Sprechweisen
möchte ich ungern auf eine so präzise Bedeutung festlegen. Gegeben eine Teil-
menge Y ⊂ X kann man sagen, „Y sei enthalten in X“ oder „Y liege in X“, und
gegeben ein Element x ∈ X kann man auch sagen, „x sei enthalten in X“ oder „x
liege in X“. Was genau gemeint ist, gilt es dann aus dem Kontext zu erschließen.
1.2.12 (Diskussion der Notation). Gegeben eine Menge X verwenden wir die
Schreibweise Y ( X als Abkürzung für (Y ⊂ X und Y 6= X). Eine von der
ganzen Menge verschiedene Teilmenge Y einer Menge X nennen wir auch eine
echte Teilmenge von X. Bei diesen Notationen folgen wir Cantor und Bourbaki,
die sehr viel später festgelegte internationalen Norm ISO 31-11 weicht jedoch

15
davon ab. In der folgenden Tabelle stellen wir diese beiden Konventionen einander
gegenüber.
Cantor und Bourbaki Norm ISO 31-11 Bedeutung

⊂ ⊆ ist Teilmenge von


( ⊂ ist echte Teilmenge von
Ich ziehe die Konvention von Cantor und Bourbaki vor, weil ich sie gewohnt bin
und weil man sehr oft Teilmengen zu betrachten hat und nur vergleichsweise sel-
ten echte Teilmengen. Ich muß jedoch zugeben, daß die in diesem Text gewählte
Notation ⊂, ( mit den üblichen Notationen ≤, < für Ungleichungen weniger gut
zusammenpaßt als die Konvention nach ISO 31-11.
1.2.13. Oft bildet man neue Mengen als Teilmengen bestehender Mengen. Ge-
bräuchlich ist dazu eine Notation, bei der man zwischen den Mengenklammern
hinter einem senkrechten Strich dazuschreibt, welche zusätzliche Eigenschaft die
Elemente einer Teilmenge haben sollte, so daß man Teilmengen Y einer Menge
X angeben kann in der Form
Y = {x ∈ X | x hat eine zusätzlich noch gewisse Eigenschaft}
Zum Beispiel gilt N = {a ∈ Z | a ≥ 0}, lies „die Menge der natürlichen Zah-
len ist die Teilmenge der Menge der ganzen Zahlen bestehend aus allen ganzen
Zahlen, die ≥ 0 sind“, und {0, 1} = {a ∈ N | a2 = a}.
Definition 1.2.14. Es ist auch erlaubt, die „Menge aller Teilmengen“ einer gege-
benen Menge X zu bilden. Sie heißt die Potenzmenge von X und wird P(X)
oder Pot(X) notiert.
Beispiel 1.2.15. Die Potenzmenge P({1, 2, 3}) kann man als die Menge aller
möglichen Ausgänge einer Versuchsanordnung interpretieren, bei der man drei-
mal eine Münze wirft. Dazu mag man etwa jedem Ausgang die Menge der Wurf-
nummern zuordnet, bei denen Wappen herauskam. So würde etwa dem Ausgang
WZW die Teilmenge {1, 3} zugeordnet.
1.2.16 (Kardinalität der Potenzmenge). Ist X eine endliche Menge, so ist auch
ihre Potenzmenge endlich und es gilt die Formel |P(X)| = 2|X| . Für die drei-ele-
mentige Menge X = {1, 2, 3} besteht ihre Potenzmenge P(X) zum Beispiel aus
8 = 23 Elementen und wir haben genauer

P(X) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}
Die Teilmenge {1} ⊂ {1, 2, 3}, die nur aus dem Element 1 besteht, ist also ein
Element der Potenzmenge {1} ∈ P({1, 2, 3}). Das Element 1 ist dahingegen
kein Element der Potenzmenge, sondern ein Element der ursprünglichen Menge
1 ∈ {1, 2, 3}.

16
Satz 1.2.17 (Bedeutung der Binomialkoeffizienten). Gegeben natürliche Zah-
len n, k ∈ N gibt der Binomialkoeffizient nk die Zahl der k-elementigen Teilmen-


gen einer n-elementigen Menge an. In Formeln ausgedrückt haben wir unter der
Annahme |X| = n also

|{Y ⊂ X | |Y | = k}| = nk


Beweis. Vollständige Induktion über n. Für n = 0 gilt die Aussage, denn eine
nullelementige Menge hat genau eine k-elementige Teilmenge falls k = 0 und
keine k-elementige Teilmenge falls k ≥ 1. Nehmen wir nun an, die Aussage sei
für ein n schon bewiesen. Eine (n + 1)-elementige Menge X schreiben wir als
X = M ∪ {x} mit dem gleich in 1.3.1 formal eingeführten Vereingungszeichen
∪, wo M eine n-elementige Menge ist und x 6∈ M . Ist k = 0, so gibt es genau
eine k-elementige Teilmenge von M ∪{x}, nämlich die  leere Menge. Ist k ≥ 1, so
n
gibt es in M ∪ {x} nach Induktionsannahme genau k k-elementige Teilmengen,
die x nicht enthalten. Die k-elementigen Teilmengen dahingegen, die x enthalten,
ergeben sich durch Hinzunehmenvon x aus den (k − 1)-elementigen Teilmengen
n
von M , von denen es gerade k−1 gibt. Insgesamt hat M ∪ {x} damit also genau
n n n+1
  
k
+ k−1 = k Teilmengen mit genau k Elementen.
1.2.18. Wieder scheint mir dieser Beweis in der für vollständige Induktion typi-
schen Weise undurchsichtig. Ich ziehe deshalb den in 1.1.19 gegebenen weniger
formellen Beweis vor. Man kann auch diesen Beweis formalisieren und verstehen
als Spezialfall der sogenannten „Bahnformel“, vergleiche [LA2] 5.2.3.
1.2.19 (Variante zum Beweis der binomischen Formel). Wir geben nun die ver-
sprochene präzise Formulierung unseres ersten Beweises der binomischen Formel
1.1.23. Wir rechnen dazu
X
(a + b)n = a|Y | bn−|Y |
Y ⊂{1,2,...,n}

Die rechte Seite soll hier in Verallgemeinerung der in 1.1.8 eingeführten Notati-
on bedeuten, daß wir für jede Teilmenge Y von {1, 2, . . . , n} den angegebenen
Ausdruck a|Y | bn−|Y | nehmen und alle diese Ausdrücke aufsummieren. Dann fas-
sen wir gleiche Summanden zusammen und erhalten mit 1.2.17 die binomische
Formel.

Übungen
n

= 2n .
P
Übung 1.2.20. Es gilt k k
n!
Übung 1.2.21. Man zeige (a + b + c)n = i j k
P
i+j+k=n i!j!k! a b c .

17
1.3 Mengenoperationen
Definition 1.3.1. Wir erinnern, daß wir := als Abkürzung für „ist definiert als“
verwenden und daß „oder“ in der Mathematik stets das „nichtausschließende oder“
meint. Gegeben zwei Mengen X, Y können wir unter anderem auf folgende Wei-
sen neue Mengen bilden:

1. Die Vereinigung X ∪ Y := {z | z ∈ X oder z ∈ Y }, zum Beispiel ist


{1, 2} ∪ {2, 3} = {1, 2, 3};

2. Den Schnitt oder auch Durchschnitt X ∩ Y := {z | z ∈ X und z ∈ Y },


zum Beispiel ist {1, 2} ∩ {2, 3} = {2};

3. Die Differenz X\Y := {z ∈ X | z 6∈ Y }, zum Beispiel haben wir


{1, 2}\{2, 3} = {1}. Man schreibt statt X\Y auch X−Y . Ist Y eine Teil-
menge von X, so heißt X\Y das Komplement von Y in X oder ausführli-
cher die Komplementmenge;

Van-de-Ven-Diagramme für Vereinigung, Schnitt und Differenz

4. Das Produkt X × Y := {(x, y) | x ∈ X, y ∈ Y } oder ausführlicher


kartesische Produkt. Es gilt also (x, y) = (x0 , y 0 ) genau dann, wenn gilt
x = x0 und y = y 0 . Zum Beispiel haben wir

{1, 2} × {1, 2, 3} = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3)}

Oft benutzt man für das Produkt X × X einer Menge X mit sich selbst die
Abkürzung X 2 := X × X und nennt das die Menge aller angeordneten
Paare von Elementen von X.

18
Zwei anschauliche Darstellungen des Produkts von zwei Mengen. Links das
Produkt einer Menge mit fünf und einer Menge mit drei Elementen. Rechts das
Produkt zweier Geradensegmente, aufgefaßt als unndliche Mengen. In beiden
Fällen wird ein Paar (x, y) ∈ X × Y dargestellt durch einen Punkt, der über x
und neben y liegt.

1.3.2. Eine gute Anschauung für die ersten drei Operationen liefern die sogenann-
ten van-de-Ven-Diagramme, wie sie die Bilder zeigen. Sie sind allerdings nicht
zu genau zu hinterfragen, denn ob die Punkte auf einem Blatt Papier im Sinne
von Cantor „bestimmte wohlunterschiedene Objekte unserer Anschauung“ sind,
scheint mir nicht ohne weiteres so klar. Wenn man jedoch jedes der schraffierten
Gebiete im Bild als die Menge aller darin liegenden Kreuzungspunkte auf einem
dazugedachten Millimeterpapier auffaßt und keine dieser Kreuzungspunkte auf
den Begrenzungslinien liegen, so können sie wohl schon als eine Menge im Can-
tor’schen Sinne angesehen werden.
1.3.3. Zwei Teilmengen einer gegebenen Menge, die kein gemeinsames Element
haben, heißen disjunkt. Äquivalent dazu ist die Bedingung, daß ihr Schnitt die
leere Menge ist.
1.3.4 (Mehrdeutigkeiten mit dem Komma als Trenner). Die Verwendung des
Kommas als Trenner ist hier problematisch, da (1, 2) nun zweierlei bedeuten kann:
Zum einen ein Element des kartesischen Produkts N × N, zum anderen aber auch
den eingeklammerten Dezimalbruch 1,2. Was im Einzelfall gemeint ist, gilt es
aus dem Kontext zu erschließen. In diesem Text werden Dezimalbrüche nur sel-
ten vorkommen. In deutschen Schulbüchern verwendet man für angeordnete Paare
meist die abweichende Notation (x|y), um auch Paare von Dezimalbrüchen un-
mißverständlich notieren zu können.
1.3.5 (Diskussion der Terminologie). Die Bezeichnung als „Schnitt“ kommt
wohl her von der Vorstellung des Schnitts zweier Geraden, wenn man sie als Teil-
mengen der Ebene denkt und diese hinwiederum als ein Blatt Papier, das man
längs der einen Gerade entzweischneiden kann. Der Punkt, an dem die andere
Gerade entzweigeschnitten wird, ist dann der Schnittpunkt und der Schnitt unse-
rer beiden Geraden besteht genau aus diesem einen Punkt.

19
1.3.6 (Mengenlehre und das Bilden von Begriffen). Wir werden in unserer nai-
ven Mengenlehre die ersten drei Operationen „Vereinigung“, „Schnitt“ und „Dif-
ferenz“ aus 1.3.1 nur auf Teilmengen einer gemeinsamen Obermenge anwenden,
die uns in der einen oder anderen Weise bereits zur Verfügung steht. Die Potenz-
menge und das kartesische Produkt dahingegen benutzen wir, um darüber hinaus
neue Mengen zu erschaffen. Diese Konstruktionen erlauben es, im Rahmen der
Mengenlehre so etwas wie Abstraktionen zu bilden: Wenn wir uns etwa die Menge
T aller an mindestens einem Tag der Weltgeschichte lebenden oder gelebt haben-
den Tiere als eine Menge im Cantor’schen Sinne denken, so würden wir Konzepte
wie „männlich“ oder „Hund“ oder „Fleischfresser“ formal als Teilmengen dieser
Menge alias als Elemente von P(T ) formalisieren. Das Konzept „ist Kind von“
würde dahingegen formalisiert als eine Teilmenge K ⊂ T × T des kartesischen
Produkts unserer Menge T mit sich selbst alias als ein Element K ∈ P(T × T ),
nämlich als die Teilmenge K := {(x, y) ∈ T × T | x ist Kind von y}.
1.3.7. Für das Rechnen mit Mengen überlegt man sich die folgenden Regeln, die
ich gleich mit ihren üblichen Bezeichnungen angebe:
Assoziativgesetze: X ∩ (Y ∩ Z) = (X ∩ Y ) ∩ Z
X ∪ (Y ∪ Z) = (X ∪ Y ) ∪ Z
Distributivgesetze: X ∪ (Y ∩ Z) = (X ∪ Y ) ∩ (X ∪ Z)
X ∩ (Y ∪ Z) = (X ∩ Y ) ∪ (X ∩ Z)
de Morgan’sche Regeln: X\(Y ∪ Z) = (X\Y ) ∩ (X\Z)
X\(Y ∩ Z) = (X\Y ) ∪ (X\Z)
Komplement der Differenzmenge: X\(X\Y ) = X ∩ Y
Eine gute Anschauung für diese Regeln liefern die van-de-Ven-Diagramme, wie
die Bilder zeigen. Das liegt daran, daß alle acht möglichen Lagen in Bezug auf
unsere drei Mengen in diesen Diagrammen als Flächen zu sehen sind.
1.3.8. Ich zeige beispielhaft die Regel X ∪ (Y ∩ Z) = (X ∪ Y ) ∩ (X ∪ Z). Es
reicht, statt der Gleichheit die beiden Inklusionen ⊂ und ⊃ zu zeigen.
Ich beginne mit ⊂. Sicher gilt (Y ∩ Z) ⊂ Y , also auch X ∪ (Y ∩ Z) ⊂ X ∪ Y .
Ebenso zeigt man X ∪ (Y ∩ Z) ⊂ X ∪ Z und damit folgt schon mal ⊂.
Bleibt noch ⊃ zu zeigen. Das will mir nur durch Betrachtung von Elementen
gelingen. Gegeben a ∈ (X ∪ Y ) ∩ (X ∪ Z) gilt entweder a ∈ X oder a 6∈ X. Falls
a ∈ X haben wir eh a ∈ X ∪(Y ∩Z). Falls a 6∈ X folgt aus a ∈ (X ∪Y )∩(X ∪Z)
erst a ∈ (X ∪ Y ) und dann a ∈ Y und weiter erst a ∈ (X ∪ Z) und dann a ∈ Z,
also a ∈ Y ∩ Z ⊂ X ∪ (Y ∩ Z). Wir haben somit gezeigt, daß jedes Element a
von (X ∪ Y ) ∩ (X ∪ Z) auch zu X ∪ (Y ∩ Z) gehört. Damit folgt die behauptete
Inklusion ⊃.

20
X ∩ (Y ∪ Z) = (X ∩ Y ) ∪ (X ∩ Z) X \ (Y ∩ Z) = (X \ Y ) ∪ (X \ Z)

21
Aus X = X1 ∪ X2 und Y = Y1 ∪ Y2 folgt noch lange nicht
X × Y = (X1 × Y1 ) ∪ (X2 × Y2 )

22
Ergänzung 1.3.9 (Das Russell’sche Paradoxon). Ich will nicht verschweigen,
daß der in diesem Abschnitt dargestellte naive Zugang zur Mengenlehre durchaus
begriffliche Schwierigkeiten mit sich bringt: Zum Beispiel darf die Gesamtheit M
aller Mengen nicht als Menge angesehen werden, da wir sonst die „Menge aller
Mengen, die sich nicht selbst als Element enthalten“, gegeben durch die formel-
hafte Beschreibung N = {A ∈ M | A 6∈ A}, bilden könnten. Für diese Menge
kann aber weder N ∈ N noch N 6∈ N gelten. Diese Art von Schwierigkeiten
kann erst ein formalerer Zugang klären und auflösen, bei dem man unsere naiven
Vorstellungen durch Ketten von Zeichen aus einem wohlbestimmten endlichen
Alphabet ersetzt und unsere Vorstellung von Wahrheit durch die Verifizierbarkeit
vermittels rein algebraischer „erlaubter Manipulationen“ solcher Zeichenketten,
die in „Axiomen“ festgelegt werden. Diese Verifikationen kann man dann durch-
aus auch einer Rechenmaschine überlassen, so daß wirklich auf „objektivem“ We-
ge entschieden werden kann, ob ein „Beweis“ für die „Richtigkeit“ einer unserer
Zeichenketten in einem vorgegebenen axiomatischen Rahmen stichhaltig ist. Al-
lerdings kann in derartigen Systemen von einer Zeichenkette algorithmisch nur
entschieden werden, ob sie eine „sinnvolle Aussage“ ist, nicht aber, ob sie „bewie-
sen“ werden kann. Noch viel stärker zeigt der Unvollständigkeitssatz von Gödel,
daß es in einem derartigen axiomatischen Rahmen, sobald er reichhaltig genug
ist für eine Beschreibung des Rechnens mit natürlichen Zahlen, stets sinnvolle
Aussagen gibt derart, daß entweder sowohl die Aussage als auch ihre Verneinung
oder aber weder die Aussage noch ihre Verneinung bewiesen werden können. Mit
diesen und ähnlichen Fragestellungen beschäftigt sich die Logik.
Vorschau 1.3.10 (Weitere Konstruktionen der Mengenlehre). Um mich nicht
dem Vorwurf auszusetzen, während des Spiels die Spielregeln ändern zu wollen,
sei bereits hier erwähnt, was noch hinzukommen soll. Die einzigen grundlegen-
den Konstruktionen, die noch fehlen, sind das Bilden der „disjunkten Vereini-
gung“ und des „kartesischen Produkts“ zu einer „beliebigen Mengenfamilie“ in
[LA2] 7.7.17 und [LA2] 7.7.7. In [AN2] 1.3.3 besprechen wir weiter Schnitt und
Vereinigung einer „beliebigen Familie von Teilmengen einer gegebenen Menge“.
In [LA1] 1.9 werden einige weniger offensichtliche Argumentationen im Zusam-
menhang mit dem sogenannten „Zorn’schen Lemma“ erläutert, die meines Erach-
tens bereits an den Rand dessen gehen, was man in unserem informellen Rahmen
der naiven Mengenlehre als Argumentation noch vertreten kann. In [LA1] 4.1
wird die Konstruktion der natürlichen Zahlen im Rahmen der Mengenlehre disku-
tiert, insbesondere geben wir erst dort eine formale Definition des Begriffs einer
endlichen Menge. Sicher ist es in gewisser Weise unbefriedigend, das Fundament
des Hauses der Mathematik erst fertigzustellen, wenn bereits erste Stockwerke
stehen und bewohnt sind. Andererseits will ich aber auch vermeiden, daß Sie mir
auf einem gewaltigen Fundament, das die ganze Mathematik tragen kann, im ers-

23
ten Winter(semester) jämmerlich erfrieren.
1.3.11 (Der Sinn von Genauigkeit und sorgfältiger Sprache). Ich könnte mir
gut vorstellen, daß verschiedene meiner Leser denken, diese ganze Pedanterie sei
doch eigentlich überflüssig und jetzt sollten wir doch einfach mal fröhlich los-
rechnen wie das in der Schule ja auch sehr gut ging. Ich will hier erklären, warum
Pedanterie in diesem Zusammenhang wichtig ist. Viele von Ihnen werden wissen,
wie man mit einem einfachen Blatt Papier zum Mond kommt: 42-mal Falten und
draufsteigen, das war’s schon. So ähnlich ist es in der Mathematik: Etwas völlig
Banales wie die naive Mengenlehre wird in den etwa dreißig Vorlesungsdoppel-
stunden des Wintersemesters jedes Mal auf’s neue gefaltet und wenn Sie dann
am Ende des Wintersemesters zurückblicken, kann Ihnen schon leicht schwind-
lig werden. Das funktioniert mit wirklichem Papier nur eingeschränkt, aber wenn
man sehr festes und glattes „Gedankenpapier“ nimmt, und solches Gedankenpa-
pier ist eben gerade die Mengenlehre, dann klappt es verblüffend gut. Man muß
dazu aber mit der Herstellung dieses Gedankenpapiers ebenso wie beim Falten
sorgfältig sein bis zur Pedanterie, denn auch die kleinste Ungeschicklichkeit ver-
vielfacht sich bei diesem Vorgehen mit derselben Schnelligkeit wie die gedankli-
che Höhe und bringt, eh man sich’s versieht, alles zum Einsturz.

Übungen
Übung 1.3.12. Sind X und Y endliche Mengen, so gilt für die Kardinalitäten
|X × Y | = |X| · |Y | und |X ∪ Y | = |X| + |Y | − |X ∩ Y |.

1.4 Abbildungen
Definition 1.4.1. Seien X, Y Mengen. Eine Abbildung f : X → Y ist eine
Zuordnung, die jedem Element x ∈ X genau ein Element f (x) ∈ Y zuordnet,
das Bild von x unter f , auch genannt der Wert von f an der Stelle x. Man spricht
dann auch vom Auswerten der Funktion f an der Stelle x oder vom Einsetzen
von x in f und schreibt manchmal abkürzend f (x) = f x.

1.4.2. Wem das zu vage ist, der mag die alternative Definition vorziehen, nach
der eine Abbildung f : X → Y eine Teilmenge f ⊂ X × Y ist derart, daß es
für jedes x ∈ X genau ein y ∈ Y gibt mit (x, y) ∈ f . Dies eindeutig bestimmte
y schreiben wir dann f (x) und sind auf einem etwas formaleren Weg wieder an
demselben Punkt angelangt. In unseren Konventionen nennen wir besagte Teil-
menge den Graphen von f und notieren sie mit dem Symbol Γ (sprich: Gamma),
einem großen griechischen G, und schreiben

Γ(f ) := {(x, f (x)) | x ∈ X} ⊂ X × Y

24
Eine Abbildung einer Menge mit
fünf in eine mit drei Elementen

Der Graph der oben angegebenen


Abbildung, wobei das X oben mit
dem X hier identifiziert wurde
durch „Umkippen nach Rechts“

Definition 1.4.3. Ist f : X → Y eine Abbildung, so nennen wir X ihren Defini-


tionsbereich und Y ihren Wertebereich. Zwei Abbildungen nennen wir gleich,
wenn sie denselben Definitionsbereich X, denselben Wertebereich Y und dieselbe
Abbildungsvorschrift f ⊂ X × Y haben.

1.4.4 (Die Notationen → und 7→). Wir notieren Abbildungen oft in der Form

f: X → Y
x 7→ f (x)

und in verschiedenen Verkürzungen dieser Notation. Zum Beispiel sprechen wir


von „einer Abbildung N → N von der Menge der natürlichen Zahlen in sich
selber“ oder „der Abbildung n 7→ n3 von der Menge der natürlichen Zahlen in
sich selber“. Wir benutzen unsere zwei Arten von Pfeilen → und 7→ auch im
allgemeinen in derselben Weise.
Beispiel 1.4.5. Für jede Menge X haben wir die identische Abbildung oder Iden-
tität
id = idX : X → X
x 7→ x
Ein konkreteres Beispiel für eine Abbildung ist das Quadrieren

q: Z → Z
n 7→ n2

25
Beispiel 1.4.6. Gegeben zwei Mengen X, Y erklärt man die Projektionsabbil-
dungen oder Projektionen prX : X × Y → X beziehungsweise prY : X × Y →
Y durch die Vorschrift (x, y) 7→ x beziehungsweise (x, y) 7→ y. In manchen Zu-
sammenhängen notiert man sie auch abweichend pr1 und pr2 für die „Projektion
auf die erste beziehungsweise zweite Komponente“.
1.4.7 (Konstanten und konstante Abbildungen). Gegeben ein festes c ∈ Y
schreiben wir oft auch kurz c für die konstante Abbildung X → Y gegeben
durch x 7→ c für alle x ∈ X. Damit verbunden ist die Hoffnung, daß aus dem
Kontext klar wird, ob im Einzelfall die Abbildung c : X → Y oder das Element
c ∈ Y gemeint sind.

Definition 1.4.8. Sei f : X → Y eine Abbildung.

1. f heißt injektiv oder eine Injektion, wenn aus x 6= x0 folgt f (x) 6= f (x0 ).
Gleichbedeutend ist die Forderung, daß es für jedes y ∈ Y höchstens ein
x ∈ X gibt mit f (x) = y. Injektionen schreibt man oft ,→.

Eine Injektion

2. f heißt surjektiv oder eine Surjektion, wenn es für jedes y ∈ Y mindestens


ein x ∈ X gibt mit f (x) = y. Surjektionen schreibt man manchmal .

Eine Surjektion

3. f heißt bijektiv oder eine Bijektion, wenn f injektiv und surjektiv ist.
Gleichbedeutend ist die Forderung, daß es für jedes y ∈ Y genau ein x ∈ X

gibt mit f (x) = y. Bijektionen schreibt man oft →.

26
Eine Bijektion

Definition 1.4.9. Sind drei Mengen X, Y, Z gegeben und dazwischen Abbildun-


gen f : X → Y und g : Y → Z, so definieren wir die Verknüpfung unserer
Abbildungen f und g, eine Abbildung g ◦ f : X → Z, durch die Vorschrift
g◦f : X → Z
x 7→ g(f (x))
1.4.10 (Diskussion der Notation). Die Notation g ◦f , sprich „g nach f “, für „erst
f , dann g“ ist gewöhnungsbedürftig, erklärt sich aber durch die offensichtliche
Formel (g ◦ f )(x) = g(f (x)). Ich sage, g ◦ f entstehe aus g durch Vorschalten
von f und aus f durch Nachschalten von g. Oft kürzt man auch g ◦ f mit gf ab.
Mit dieser Abkürzung muß man jedoch sorgsam umgehen, da im Fall von zwei
Abbildungen f, g von derselben Menge in einen Zahlbereich, etwa f, g : X → Q,
der Ausdruck f g vielmehr für die Abbildung x 7→ f (x)g(x) reserviert ist, das
sogenannte „punktweise Produkt“ unserer beiden Funktionen.
Beispiel 1.4.11. Betrachten wir zusätzlich zum Quadrieren q : Z → Z die Abbil-
dung t : Z → Z, x 7→ x + 1, so gilt (q ◦ t)(x) = (x + 1)2 aber (t ◦ q)(x) = x2 + 1.
1.4.12. Ist X ⊂ Y eine Teilmenge, so ist die Einbettung oder Inklusion i :
X → Y , x 7→ x stets injektiv. Ist g : Y → Z eine Abbildung und X ⊂ Y eine
Teilmenge, so nennen wir die Verknüpfung g ◦ i von g mit der Inklusion auch die
Einschränkung von g auf X und notieren sie
g ◦ i = : g|X = g|X : X → Z
Oft bezeichnen wir eine Einschränkung aber auch einfach mit demselben Buchsta-
ben g in der Hoffnung, daß der Leser aus dem Kontext erschließen kann, welche
Abbildung genau gemeint ist. Das ist nicht ganz unproblematisch: So ist etwa un-
sere Abbildung q : Z → Z, n 7→ n2 nicht injektiv, ihre Restriktion q|N zu einer
Abbildung q : N → Z ist aber durchaus injektiv.
Beispiele 1.4.13. Unsere Abbildung q : Z → Z, n 7→ n2 ist weder injektiv noch
surjektiv. Die Identität id : X → X ist stets bijektiv. Sind X und Y endliche
Mengen, so gibt es genau dann eine Bijektion von X nach Y , wenn X und Y
dieselbe Kardinalität haben, in Formeln |X| = |Y |.

27
Satz 1.4.14. Seien f : X → Y und g : Y → Z Abbildungen.

1. Ist g ◦ f injektiv, so ist f injektiv;

2. Sind g und f injektiv, so auch g ◦ f .

Beweis. Übung.

Satz 1.4.15. Seien f : X → Y und g : Y → Z Abbildungen.

1. Ist g ◦ f surjektiv, so ist g surjektiv;

2. Sind g und f surjektiv, so auch g ◦ f .

Beweis. Übung.

1.4.16 (Umkehrabbildung). Ist f : X → Y eine bijektive Abbildung, so ist of-
fensichtlich die Menge {(f (x), x) ∈ Y × X | x ∈ X} im Sinne von 1.4.2 eine
Abbildung oder, vielleicht klarer, der Graph einer Abbildung Y → X. Diese Ab-
bildung in die Gegenrichtung heißt die Umkehrabbildung oder Umkehrfunkti-
on oder auch die inverse Abbildung zu f und wird mit f −1 : Y → X bezeichnet.
Offensichtlich ist mit f auch f −1 eine Bijektion.
1.4.17 (Diskussion der Notation). Mit dem vorhergehenden haben wir schon
eine dritte mögliche Bedeutung für das Symbol f −1 kennengelernt. Was im Ein-
zelfall gemeint ist, gilt es aus dem Kontext zu erschließen.
Beispiel 1.4.18. Die Umkehrabbildung unserer Bijektion t : Z → Z, x 7→ x + 1
ist die Abbildung t−1 : Z → Z, x 7→ x − 1.

Satz 1.4.19 (Bedeutung der Fakultät). Sind X und Y zwei Mengen mit je n

Elementen, so gibt es genau n! bijektive Abbildungen f : X → Y .

Beweis. Sei X = {x1 , . . . , xn }. Wir haben n Möglichkeiten, ein Bild für x1 aus-
zusuchen, dann noch (n − 1) Möglichkeiten, ein Bild für x2 auszusuchen, und so
weiter, bis schließlich nur noch 1 Element von Y als mögliches Bild von xn in
Frage kommt. Insgesamt gibt es also n(n − 1) · · · 1 = n! Möglichkeiten für f . Da
wir 0! = 1 vereinbart hatten, stimmt unser Satz auch für n = 0.

Übungen
Übung 1.4.20. Gegeben eine Bijektion f : X → Y ist g = f −1 die einzige
Abbildung g : Y → X mit f ◦ g = idY . Ebenso ist auch h = f −1 die einzige
Abbildung h : Y → X mit h ◦ f = idX .

28
Ergänzende Übung 1.4.21. Gegeben endliche Mengen X, Y gibt es genau |Y ||X|
Abbildungen von X nach Y und unter diesen Abbildungen sind genau |Y |(|Y | −
1)(|Y | − 2) . . . (|Y | − |X| + 1) Injektionen.
Ergänzende Übung 1.4.22. Sei X eine Menge mit n Elementen und seien natürli-
che Zahlen α1 , . . . , αr ∈ N gegeben mit n = α1 + . . . + αr . Man zeige: Es gibt
genau n!/(α1 ! · · · αr !) Abbildungen f : X → {1, . . . , r}, die jedes i genau αi -mal
als Wert annehmen, in Formeln
n!
= card{f | |f −1 (i)| = αi für i = 1, . . . r}
α1 ! · · · αr !
Ergänzung 1.4.23. Manche Autoren bezeichnen die Zahlen aus der vorherigen
Übung 1.4.22 als Multinomialkoeffizienten und verwenden die Notation
 
n n!
:=
α1 ; . . . ; αr α1 ! · · · αr !
Mich überzeugt diese Notation nicht, da sie im Gegensatz zur Notation für Bino-
mialkoeffizienten nichts kürzer macht.
Ergänzende Übung 1.4.24. Man zeige die Formel
X n!
(x1 + . . . + xr )n = xα1 1 · · · xαr r
α1 +...+αr
α
=n 1
! · · · α r !

Hier ist zu verstehen, daß wir für alle α1 , . . . , αr ∈ N mit α1 + . . . + αr = n den


angegebenen Ausdruck nehmen und alle diese Ausdrücke aufsummieren.
Ergänzende Übung 1.4.25. Sei X eine Menge mit n ≥ 1 Elementen und sei m
n+m−1
P Zahl. Man zeige, daß es genau n−1 Abbildungen f : X → N
eine natürliche
gibt mit x∈X f (x) = m. Hinweis: Man denke sich X = {1, 2, . . . , n} und
veranschauliche sich dann f als eine Folge auf f (1) Punkten gefolgt von einem
Strich gefolgt von f (2) Punkten gefolgt von einem Strich und so weiter, insgesamt
also eine Folge aus n + m − 1 Symbolen, davon m Punkten und n − 1 Strichen.

1.5 Mengen mit Verknüpfung


Definition 1.5.1. Eine Verknüpfung > auf einer Menge X ist eine Abbildung

X ×X → X
(x, y) 7→ x>y

Jedem angeordneten Paar (x, y) mit x, y ∈ X wird also ein Element (x>y) ∈ X
zugeordnet. Eine Menge mit Verknüpfung heißt ein Magma.

29
Eine Abbildung f : {1, 2, . . . , n} → N im Fall n = 6 mit Wertesumme m = 10
und die Veranschaulichung nach der Vorschrift aus Übung 1.4.25 als Folge
bestehend aus m Punkten und n − 1 Strichen.

Man kann Verknüpfungen auf


endlichen Mengen darstellen durch
ihre Verknüpfungstafel. Hier die
Verknüpfungstafel der Verknüpfung
min auf der Menge {0, 1, 2, 3, 4}.
Man muß sich dazu einigen, ob im
Kästchen aus der Spalte m und der
Zeile n nun m>n oder vielmehr
n>m stehen soll. Bei einer
kommutativen Verknüpfung wie
min macht das aber kinen
Unterschied.

30
1.5.2. Das unverfängliche Symbol > benutze ich, um mich an dieser Stelle noch
nicht implizit auf einen der Standardfälle Addition oder Multiplikation festlegen
zu müssen.
Beispiele 1.5.3. 1. Die Addition von ganzen Zahlen ist eine Verknüpfung

Z×Z → Z
(m, n) 7→ m + n

2. Die Multiplikation von ganzen Zahlen ist eine Verknüpfung

Z×Z → Z
(m, n) 7→ m · n

3. Die Zuordnung min, die jedem Paar von natürlichen Zahlen die kleinere
zuordnet, wenn sie verschieden sind, und eben diese Zahl min(n, n) = n,
wenn sie gleich sind, ist eine Verknüpfung

min : N × N → N
(m, n) 7→ min(m, n)

4. Die Subtraktion von ganzen Zahlen ist eine Verknüpfung

Z×Z → Z
(m, n) 7→ m − n

5. Logische Operationen wie „und“, „oder“, „impliziert“ können als Verk-


nüpfungen auf der zweielementigen Menge {Wahr, Falsch} aufgefaßt wer-
den. Die zugehörigen Verknüpfungstabellen heißen Wahrheitstafeln. Bei
einem formalen Zugang werden diese Tafeln, wie sie für „und“ und „oder“
auf der vorhergehenden Seite zu finden sind, zur Definition der jeweiligen
Begriffe.

1.5.4. Eine Verknüpfung > auf einer Menge X heißt assoziativ, wenn gilt

x>(y>z) = (x>y)>z ∀x, y, z ∈ X

Im Fall einer assoziativen Verknüpfung liefern auch ungeklammerte Ausdrücke


der Form x1 >x2 > . . . >xn wohlbestimmte Elemente von X, und zwar ist genauer
das Resultat unabhängig davon, wie wir die Klammern setzen. Wir führen das hier
nicht weiter aus und verweisen stattdessen auf [GR] 2.1.10.

31
Die Wahrheitstafeln für „und“ und „oder“. Gemeint ist hier wie stets in der
Mathematik das „nichtausschließende oder“. Sagen wir, es gelte A oder B, so ist
insbesondere auch erlaubt, daß beides gilt. Bei der Wahrheitstafel für das
„ausschließende oder“ müßte oben links als Verknüpfung von „Wahr“ mit
„Wahr“ ein „Falsch“ stehen.

32
1.5.5. Eine Verknüpfung > auf einer Menge X heißt kommutativ oder abelsch,
wenn gilt
x>y = y>x ∀x, y ∈ X
Die Bezeichnung „abelsch“ ehrt den norwegischen Mathematiker Nils Henrik
Abel.
Beispiele 1.5.6. Die Addition und Multiplikation auf Z sind assoziativ und kom-
mutativ. Für das Minimum in N gilt dasselbe. Die Subtraktion auf Z ist weder
kommutativ noch assoziativ.

Definition 1.5.7. Gegeben eine Menge mit Verknüpfung (X, >) heißt ein Element
e ∈ X ein neutrales Element von (X, >), wenn gilt

e>x = x>e = x ∀x ∈ X

1.5.8 (Eindeutigkeit neutraler Elemente). Gegeben eine Menge mit Verknüp-


fung (X, >) kann es höchstens ein neutrales Element e geben, denn für jedes
weitere Element e0 mit e0 >x = x>e0 = x ∀x ∈ X haben wir e0 = e0 >e =
e. Wir dürfen also den bestimmten Artikel verwenden und in einer Menge mit
Verknüpfung von dem neutralen Element reden und es mit eX bezeichnen.
Beispiele 1.5.9. Das neutrale Element von (Z, +) ist die Null 0 ∈ Z. Das neutrale
Element von (Z, ·) ist die Eins 1 ∈ Z.

Definition 1.5.10. Ein Monoid ist eine Menge mit einer assoziativen Verknüp-
fung, in der es ein neutrales Element gibt.

1.5.11. Das Wort „Monoid“ ist wohl von griechisch „µoνoς“ für „allein“ abgelei-
tet: Ein Monoid besitzt nur eine einzige Verknüpfung.
1.5.12 (Gebräuchliche Notationsschemata für Monoide). (1) Notiert man in
einem Monoid M die Verknüpfung mit dem Symbol +, so notiert man das neu-
trale Element meist 0M oder abkürzend 0 und nennt es das Null-Element oder
abkürzend die Null und spricht von einem additiv notierten Monoid. Nur kom-
mutative Monoide werden additiv notiert.
(2) Notiert man in einem Monoid M die Verknüpfung mit einem eher runden
Symbol wie · oder ◦ oder ∗ oder auch einfach durch Hintereinanderschreiben, so
notiert man das neutrale Element oft 1M oder abkürzend 1 und nennt es das Eins-
Element oder abkürzend die Eins und spricht von einem multiplikativ notierten
Monoid.
Beispiele 1.5.13. Die natürlichen Zahlen bilden mit der Addition ein Monoid
(N, +) mit neutralem Element 0. Sie bilden mit der Multiplikation ein Monoid
(N, ·) mit neutralem Element 1.

33
1.5.14 (Iterierte Verknüpfungen). Sei (A, >) ein Monoid. Ist n ∈ N eine na-
türliche Zahl und a ∈ A, so schreiben wir
n> a := a>a>
| {z. . . >a}
n-mal

für n ≥ 1 und setzen ergänzend 0> a := eA . Dann gelten offensichtlich für alle
m, n ∈ N und a, b ∈ A mit a>b = b>a die Regeln
1. (n + m)> a = (n> a)>(m> a)
2. (nm)> a = n> (m> a)
3. n> (a>b) = (n> a)>(n> b)
Beispiel 1.5.15 (Iterieren in additiv notierten Monoiden). Im Fall additiv no-
tierter Monoide schreibt man statt n> a meist na. Unsere drei Regeln werden dann
(n + m)a = (na) + (ma), (nm)a = n(ma) und n(a + b) = (na) + (nb) und
unsere Konvention 0> a = eM nimmt die Gestalt 0a = 0M an. Wenn ich es genau
nehmen will, schreibe ich in diesem Fall n+ a statt na.
Beispiel 1.5.16 (Iterieren in multiplikativ notierten Monoiden). Im Fall mul-
tiplikativ notierter Monoide schreibt man statt n> a meist an . Unsere drei Regeln
werden dann an+m = (an )(am ), anm = (an )m und (ab)n = (an )(bn ) falls ab = ba
und unsere Konvention 0> a = eM nimmt die Gestalt a0 = 1M an.
1.5.17. Die natürlichen, ja die ganzen Zahlen, ja sogar die rationalen Zahlen mit
Multiplikation und Addition nehmen wir hier als gegeben hin ebenso wie die Tat-
sache, daß in diesem Fall die n-fach iterierte Addition gerade die Multiplikation
ist. Den Aufbau dieser Strukturen aus der Mengenlehre diskutieren wir erst in
[LA1] 4.1.
Definition 1.5.18. 1. Ist (M, >) ein Monoid und a ∈ M ein Element, so nen-
nen wir ein weiteres Element ā ∈ M invers zu a, wenn gilt a>ā = e =
ā>a für e ∈ M das neutrale Element unseres Monoids. Ein Element eines
Monoids, das ein Inverses besitzt, heißt invertierbar;
2. Eine Gruppe ist ein Monoid, in dem jedes Element ein Inverses besitzt;
3. Eine kommutative Gruppe oder abelsche Gruppe ist eine Gruppe, deren
Verknüpfung kommutativ ist.
Beispiele 1.5.19. Von unseren Beispielen 1.5.3 für Mengen mit Verknüpfung oben
ist nur (Z, +) eine Gruppe, und diese Gruppe ist kommutativ. Ein anderes Beispiel
für eine kommutative Gruppe ist die Menge Q der rationalen Zahlen mit der Addi-
tion als Verknüpfung, ein weiteres die Menge Q\{0} der von Null verschiedenen
rationalen Zahlen mit der Multiplikation als Verknüpfung. Auch jedes einelemen-
tige Monoid ist eine Gruppe.

34
1.5.20. Der Begriff einer „Gruppe“ wurde von Évariste Galois (1811-1832) in
die Mathematik eingeführt. Er verwendet den Begriff „Gruppe von Transforma-
tionen“ sowohl in der Bedeutung einer „Menge von bijektiven Selbstabbildungen
einer gegebenen Menge“ als auch in der Bedeutung einer „Menge von bijekti-
ven Selbstabbildungen einer gegebenen Menge, die abgeschlossen ist unter Ver-
knüpfung und Inversenbildung“, und die damit in der Tat ein Beispiel für eine
Gruppe im Sinne der obigen Definition bildet. Unsere obige Definition 1.5.18
geht auf eine Arbeit von Arthur Cayley aus dem Jahre 1854 mit dem Titel „On
the theory of groups as depending on the symbolic equation θn = 1“ zurück und
wurde damit formuliert, bevor Cantor die Sprache der Mengenlehre entwickelte.
Die Terminologie „abelsche Gruppe“ wurde zu Ehren des norwegischen Mathe-
matikers Niels Hendrik Abel eingeführt.
Lemma 1.5.21. Jedes Element eines Monoids besitzt höchstens ein Inverses.
Beweis. Aus a>ā = e und b>a = e folgt durch Anwenden von b> auf die erste
Gleichung mit dem Assoziativgesetz sofort ā = b.
1.5.22. Wir dürfen also den bestimmten Artikel benutzen und von nun an von
dem Inversen eines Elements eines Monoids und insbesondere auch einer Gruppe
reden.
Beispiel 1.5.23 (Invertieren in additiv notierten Monoiden). Im Fall additiv
notierter Monoide schreibt man statt ā meist −a und nennt dieses „additive In-
verse“ das Negative von a. Üblich ist in diesem Kontext auch die Abkürzung
a − b := a + (−b).
Beispiel 1.5.24 (Invertieren in multiplikativ notierten Monoiden). Im Fall mul-
tiplikativ notierter Monoide bleiben wir vorerst bei unserer Notation ā.
1.5.25 (Zweimaliges Invertieren). Gegeben ein invertierbares Element ist offen-
sichtlich auch sein Inverses invertierbar und das Inverse des Inversen ist wieder
das ursprüngliche Element, in Formeln ❠= a. In additiver Notation liest sich das
−(−a) = a.
Lemma 1.5.26. Sind a und b invertierbare Elemente eines Monoids, so ist auch
a>b invertierbar mit Inversem (a>b) = b̄>ā.
Beweis. In der Tat rechnen wir schnell (a>b)>(b̄>ā) = e = (b̄>ā)>(a>b).
Diese Formel ist auch aus dem täglichen Leben vertraut: Wenn man sich morgends
zuerst die Strümpfe anzieht und dann die Schuhe, so muß man abends zuerst die
Schuhe ausziehen und dann die Strümpfe.
1.5.27. In additiver Notation liest sich das −(a + b) = (−b) + (−a) oder, da
additiv notierte Monoide stets als abelsch angenommen werden, gleichbedeutend
−(a + b) = (−a) + (−b).

35
1.5.28 (Gruppe der invertierbaren Elemente eines Monoids). Die invertier-
baren Elemente eines Monoids bilden offensichtlich stets eine Gruppe. Für die
Gruppe der invertierbaren Elemente eines multiplikativ notierten Monoids M ver-
wenden wir die Notation M × .
1.5.29 (Negativ iterierte Verknüpfung invertierbarer Elemente). Ist (A, >) ein
Monoid und a ∈ A invertierbar, so erweitern wir unsere Notation n> a aus 1.5.14
weiter auf alle ganzen Zahlen n ∈ Z, indem wir für n negativ setzen n> a :=
(−n)> ā. Dann gelten offensichtlich sogar für alle m, n ∈ Z und a, b ∈ A× mit
a>b = b>a die für m, n ∈ N bereits aus 1.5.14 bekannten Regeln
1. (n + m)> a = (n> a)>(m> a)
2. (nm)> a = n> (m> a)
3. n> (a>b) = (n> a)>(n> b)
1.5.30 (Negativ iterierte Verknüpfung in additiver Notation). Im Fall additiv
notierter Monoide erweitern wir unsere Notation na := n> a für Elemente a mit
Negativem auf alle n ∈ Z und finden für jedes Element a mit Negativem insbeson-
dere (−1)a = −a sowie die Regeln (n + m)a = (na) + (ma), (nm)a = n(ma)
und n(a + b) = (na) + (nb) für alle n, m ∈ Z und alle Elemente a, b mit Negati-
vem. Wenn ich es genau nehmen will, schreibe ich auch hier n+ a.
1.5.31 (Negativ iterierte Verknüpfung in multiplikativer Notation). Im Fall
multiplikativ notierter Monoide erweitern wir unsere Notation an := n> a für
invertierbare Elemente a auf alle n ∈ Z und finden für jedes invertierbare Ele-
ment a insbesondere a−1 = ā. Das nehmen wir hinfort als unsere übliche No-
tation für multiplikative Inverse. Unsere drei Regeln erhalten dann die Gestalt
an+m = (an )(am ), anm = (an )m und (ab)n = (an )(bn ) für alle n, m ∈ Z und a, b
invertierbar mit ab = ba.
Definition 1.5.32. Seien (A, >) und (B, ⊥) Magmas. Ein Homomorphismus
von Magmas ist eine Abbildung ϕ : A → B mit

ϕ(x>y) = ϕ(x) ⊥ ϕ(y) ∀x, y ∈ A

Definition 1.5.33. Seien (A, >) und (B, ⊥) Monoide. Ein Homomorphismus
von Monoiden ist ein Magmahomomorphismus ϕ : A → B, der das neutrale
Element auf das neutrale Element abbildet.
Definition 1.5.34. Seien (A, >) und (B, ⊥) Gruppen. Ein Homomorphismus
von Gruppen ist ein Monoidhomomorphismus ϕ : A → B.
Beispiele 1.5.35. 1. Die Multiplikation mit einer festen Zahl a ∈ Z ist ein
Gruppenhomomorphismus (a·) : (Z, +) → (Z, +).

36
2. Das Potenzieren n 7→ q n ist für alle q ∈ Q ein Monoidhomomorphis-
mus (N, +) → (Q, ·) und für q 6= 0 sogar ein Gruppenhomomorphismus
(Z, +) → (Q, ·).

3. Allgemeiner ist für jedes Element q eines Monoids (M, >) das Iterieren
n 7→ n> q ein Monoidhomomorphismus (N, +) → (M, >), ja der einige
Monoidhomomorphismus mit 1 7→ q, und für invertierbares q sogar ein
Monoidhomomorphismus (Z, +) → (M, >), wieder der einzige mit 1 7→ q.
1.5.36. Ein Isomorphismus bezeichnet einen bijektiven Homomorphismus, des-
sen Umkehrabbildung auch ein Homomorphismus für die jeweiligen Strukturen
ist. Im Fall von Magmas oder Monoiden ist jeder bijektive Homomorphismus ein
Isomorphismus. Ein erstes Beispiel für einen bijektiven Homomorphismus, der
kein Isomorphismus ist, lernen wir in 2.2.4 im Zusammenhang mit teilgeordneten
Mengen kennen.

Übungen
Übung 1.5.37. In einer Gruppe (G, >) ist das neutrale Element e ∈ G das einzige
Element x ∈ G mit x>x = x. Jeder Magmahomomorpismus von einem Monoid
in eine Gruppe ist bereits ein Monoidhomomorphismus.
Übung 1.5.38. Sei Z eine Menge. Das Schneiden von Teilmengen ist eine Verk-
nüpfung
∩ : P(Z) × P(Z) → P(Z)
(A, B) 7→ A ∩ B
auf der Potenzmenge. Dasselbe gilt für die Vereinigung und das Bilden der Diffe-
renzmenge. Welche dieser Verknüpfungen sind kommutativ oder assoziativ? Wel-
che besitzen neutrale Elemente?
Ergänzende Übung 1.5.39. Man gebe die Wahrheitstafeln für ⇒ und ⇔ an. Be-
zeichne weiter ¬ : {Wahr, Falsch} → {Wahr, Falsch} die „Verneinung“. Man
zeige, daß die Formel

(A ⇒ B) ⇔ ((¬B) ⇒ (¬A))

beim Einsetzen beliebiger Wahrheitswerte aus {Wahr, Falsch} für A und B stets
den Wert Wahr ausgibt.
Übung 1.5.40. Ein Element a eines Monoids M ist invertierbar genau dann, wenn
es b, c ∈ M gibt mit b>a = e = a>c für e das neutrale Element.
Übung 1.5.41 (Kürzen). Sind a, b, c Elemente eines Monoids und ist a invertier-
bar, so folgt aus a>b = a>c bereits b = c. Ebenso folgt aus b>a = c>a bereits
b = c.

37
Übung 1.5.42. Gegeben eine Menge Z ist das Bilden des Komplements ein Mo-
noidhomomorphismus (P(Z), ∩) → (P(Z), ∪).
Übung 1.5.43. Jeder Monoidhomomorphismus M → N bildet invertierbare Ele-
mente auf invertierbare Elemente ab und induziert so einen Gruppenhomomor-
phismus M × → N × .
Übung 1.5.44. Jeder Monoidhomomorphismus ϕ : (M, >) → (N, ⊥) kommu-
tiert mit dem Iterieren, in Formeln ϕ(n> x) = n⊥ (ϕ(x)) für alle n ∈ N, x ∈ M
und ebenso für alle n ∈ Z, x ∈ M × .

1.6 Körper im Sinne der Algebra


1.6.1. Die algebraische Struktur eines Körpers wird den Hauptbestandteil unse-
res Axiomensystems für die reellen Zahlen in 2.4 bilden. Gleichzeitig ist sie die
Grundlage für die Modellierung des Raums unserer Anschauung in der linearen
Algebra.

Definition 1.6.2. Ein Ring (R, +, ·) ist eine Menge R mit zwei Verknüpfungen,
genannt die Addition + und die Multiplikation · des Rings, derart daß die fol-
genden drei Bedingungen erfüllt sind:

1. (R, +) ist eine abelsche Gruppe;

2. (R, ·) ist ein Monoid;

3. Es gelten die beiden Distributivgesetze

a · (b + c) = (a · b) + (a · c) ∀a, b, c ∈ R
(b + c) · a = (b · a) + (c · a) ∀a, b, c ∈ R

Ein Ring, dessen Multiplikation kommutativ ist, heißt ein kommutativer Ring
und bei uns kürzer auch Kring. Die Gruppe (R, +) heißt die additive Gruppe
des Rings.

Beispiel 1.6.3. Die ganzen Zahlen (Z, +, ·) bilden einen kommutativen Ring. Die
einelementige Menge ist mit der einzig möglichen Verknüpfung als Addition und
Multiplikation ein Ring, der Nullring.

Definition 1.6.4. Ein Körper (K, +, ·) ist ein kommutativer Ring, dessen multi-
plikativ invertierbare Elemente genau alle vom neutralen Element 0K von (K, +)
verschiedenen Elemente sind, in Formeln

(K, ·)× = K\{0K }

38
1.6.5. Das neutrale Element jedes Monoids ist invertierbar, folglich muß nach un-
seren Annahmen in einem Körper K das neutrale Element 1K des multiplikativen
Monoids (K, ·) von 0K verschieden sein, in Formeln
1K 6= 0K
Die Gruppe invertierbaren Elemente von K × = (K, ·)× eines Körpers K heißt
die multiplikative Gruppe des Körpers.
Beispiele 1.6.6. Ein erstes Beispiel ist der Körper der rationalen Zahlen (Q, +, ·).
Ein anderes Beispiel ist der zweielementige Körper mit den durch die Axiome er-
zwungenen Rechenregeln, der fundamental ist in der Informatik. Die ganzen Zah-
len (Z, +, ·) bilden keinen Körper, da (Z\{0}, ·) keine Gruppe ist, da es nämlich
in Z\{0} nur für 1 und −1 ein multiplikatives Inverses gibt.
Ergänzung 1.6.7 (Ursprung der Terminologie). Der Begriff „Körper“ ist in die-
sem Zusammenhang wohl zu verstehen als „besonders gut unter den verschiedens-
ten Rechenoperationen abgeschlossener Zahlbereich“, in Analogie zu geometri-
schen Körpern wie Kugeln oder Zylindern, die man entsprechend als „besonders
gut in sich geschlossene Bereiche des Raums“ ansehen könnte. Die Bezeichnung
als „Distributivgesetz“ rührt daher, daß uns dieses Gesetz erlaubt, beim Multipli-
zieren eines Elements mit einer Summe den „Faktor auf die Summanden zu vertei-
len“. Das Wort „distribution“ für Verteilung von Nahrungsmitteln und dergleichen
auf Französisch und Englisch kommt von demselben lateinischen Wortstamm, auf
die auch unsere Bezeichnung „Distributivgesetz“ zurückgeht.
1.6.8 (Weglassen von Multiplikationssymbolen). Beim Rechnen mit Buchsta-
ben werden wir meist ab := a · b abkürzen. Das wäre beim Rechnen mit durch Zif-
fernfolgen dargestellten Zahlen wenig sinnvoll, da man dann nicht wissen könnte,
ob 72 nun als „Zweiundsiebzig“ oder vielmehr als „Sieben mal Zwei“ zu verste-
hen sein soll. Beim Einsetzen von Zahlen für die Buchstaben müssen also wieder
Multiplikationssymbole eingefügt werden.
Ergänzung 1.6.9 (Weglassen von Additionssymbolen). In der Schule und au-
ßerhalb der Mathematik ist es üblich, 1 + 21 mit 1 12 abzukürzen und „Andert-
halb Stunden“ zu sagen oder „Dreieinviertel Pfund“. In diesem Fall wird also
ein Additionssymbol weggelassen. Das ist jedoch in der höheren Mathematik
nicht üblich. In der gesprochenen Sprache ist es noch viel merkwürdiger. Neun-
zehnhundertvierundachzig versteht jeder, in Symbolen geschrieben sieht 9 10 100
4 + 80 dahingegen ziemlich sinnlos aus, und statt der üblichen Interpretation
((9+10)100)+4+80 wären durchaus auch andere Interpretationen denkbar. In der
gesprochenen Sprache scheint eher eine Konvention befolgt zu werden, nach der
die Operationen der Reihe nach auszuführen sind wie bei einem Taschenrechner,
wobei eine Multiplikation gemeint ist, wenn die zuerst genannte Zahl die Klei-
nere ist, und eine Addition, wenn sie die Größere ist. Nur die Zahlen von 13 bis

39
19 scheinen dieser Regel nicht zu gehorchen. Kein Wunder, daß es Erstklässlern
schwer fällt, sich den Zahlenraum zu erschließen, wenn sie zuvor dieses Dickicht
von Konventionen durchdringen müssen.
1.6.10 (Punkt vor Strich). Wir vereinbaren zur Vermeidung von Klammern die
Regel „Punkt vor Strich“, so daß also zum Beispiel unter zusätzlicher Beachtung
unserer Konvention des Weglassens von Multiplikationssymbolen, in diesem Fall
das Weglassen des Punktes, das Distributivgesetz kürzer in der Form a(b + c) =
ab + ac geschrieben werden kann.
1.6.11 (Brüche). Gegeben ein Körper K und Elemente a, b ∈ K mit b 6= 0K
vereinbaren wir die Notation
a
:= ab−1
b
Sie werden zur Übung zeigen, daß die üblichen Regeln der Bruchrechnung auch
in dieser Allgemeinheit gelten.

Lemma 1.6.12 (Folgerungen aus den Ringaxiomen). In jedem Ring R gelten


die folgenden Aussagen und Formeln:

1. a · 0R = 0R = 0R · a ∀a ∈ R

2. (−1R ) · a = −a = a · (−1R ) ∀a ∈ R

3. (−1R )(−1R ) = 1R

4. (−a)(−b) = ab ∀a, b ∈ R

5. m+ (ab) = (m+ a)b für alle m ∈ Z und a, b ∈ R.

Beweis. 1. 0R + 0R = 0R ⇒ (0R + 0R ) · a = 0R · a ⇒ (0R · a) + (0R · a) =


0R · a ⇒ 0R · a = 0R durch Addieren von −(0R · a) auf beiden Seiten.

2. a + (−1R )a = 1R a + (−1R )a = (1R + (−1R ))a = 0R a = 0R und −a


ist ja gerade definiert als das eindeutig bestimmte Element von R mit der
Eigenschaft a + (−a) = 0R .

3. (−1R )(−1R ) = −(−1R ) = 1R als Negatives des Negativen nach 1.5.25.

4. Um das nachzuweisen ersetzen wir −a = a(−1R ) und −b = (−1R )b und


verwenden (−1R )(−1R ) = 1R .

5. Das folgt durch wiederholtes Anwenden des Distributivgesetzes. Die Fälle


m > 0, m = 0 und m < 0 behandelt man am einfachsten separat. Alter-
nativ mag man bemerken, daß nach dem Distributivgsetz für festes a die

40
Abbildung (·b) : a 7→ ab ein Monoidhomomorphismus (R, +) → (R, +)
ist und folglich nach Übung 1.5.44 gilt

n+ (ab) = n+ ((·b)(a)) = (·b)(n+ a) = (n+ a)b

1.6.13 (Binomische Formel). Für alle a, b in einem Ring R mit ab = ba und alle
n ∈ N gilt die binomische Formel
n  
n
X n ν n−ν
(a + b) = a b
ν=0
ν

Um das einzusehen prüft man, daß wir bei der Herleitung nach 1.1.23 nur Ring-
axiome und die Eigenschaft ab = ba verwandt haben. Man beachte hierbei unsere
Konvention 00R = 1R aus 1.5.16, angewandt auf das Monoid (R, ·). Die Multipli-
kation mit den Binomialkoeffizienten in dieser Formel ist zu verstehen als wie-
derholte Addition im Sinne der Bezeichnungskonvention na = n+ a aus 1.5.15,
angewandt auf den Spezialfall der additiven Gruppe unseres Rings.
1.6.14 (Minus mal Minus gibt Plus). Die Frage, wie das Produkt zweier nega-
tiver Zahlen zu bilden sei, war lange umstritten. Mir scheint der vorhergehende
Beweis das überzeugendste Argument für „Minus mal Minus gibt Plus“ : Es sagt
salopp gesprochen, daß man diese Regel vereinbaren muß, wenn man beim Rech-
nen das Ausklammern ohne alle Einschränkungen erlauben will.
1.6.15. Den Begriff eines Homomorphismus verwendet man bei Mengen mit
mehr als einer Verknüpfung analog. Zum Beispiel ist ein Ringhomomorphismus
ϕ von einem Ring R in einen Ring S definiert als eine Abbildung ϕ : R → S
derart, daß gilt ϕ(a + b) = ϕ(a) + ϕ(b) und ϕ(ab) = ϕ(a)ϕ(b) für alle a, b ∈ R
sowie ϕ(0R ) = 0S und ϕ(1R ) = 1S . Die Bedingung ϕ(0R ) = 0S ist nach 1.5.37
an dieser Stelle sogar überflüssig. In anderen Worten mag man einen Ringhomo-
morphismus auch definieren als eine Abbildung, die sowohl für die Addition als
auch für die Multiplikation ein Monoidhomomorphismus ist. Einen Ringhomo-
morphismus zwischen Körpern nennt man einen Körperhomomorphismus.
1.6.16. Gegeben ein bijektiver Ringhomomorphismus ist auch seine Umkehrab-
bildung ein Ringhommorphismus und wir dürfen einen bijektiven Ringhomo-
morpismus deshalb einen Ringisomorphismus und im Fall von Körpern einen
Körperisomorphismus nennen.
Satz 1.6.17 (Ganze Zahlen und allgemeine Ringe). Für jeden Ring R gibt es
genau einen Ringhomomorphismus ϕ : Z → R. Er wird gegeben durch die Vor-
schrift ϕ(n) = n+ 1R .
Beweis. Um den Überblick zu behalten, verwende ich hier die Notation n+ a statt
na für die iterierte Verknüpfung im Sinne von 1.5.29, also n+ a = a + a + . . . + a

41
mit n Summanden im Fall n ≥ 1. Wir wissen aus 1.5.35, daß n 7→ n+ a für alle
a ∈ R der einzige Gruppenhomomorphismus (Z, +) → (R, +) ist mit 1 7→ a.
Für einen Ringhomomorphismus muß aber gelten ϕ(1) = 1R , also muß er durch
die Formel ϕ(n) = n+ 1R gegeben sein. Es bleibt zu zeigen, daß diese Abbildung
ϕ mit der Multiplikation verträglich ist, in Formeln ϕ(nm) = ϕ(n)ϕ(m). Dazu
rechnen wir
ϕ(nm) = (nm)+ 1R per definitionem,
= n+ (m+ 1R ) nach der zweiten Iterationsregel 1.5.29,
= n+ (1R (m+ 1R )) weil 1R neutral ist in (R, ·),
= (n+ 1R )(m+ 1R ) nach der letzten Regel in 1.6.12,
= ϕ(n)ϕ(m) per definitionem.

1.6.18. Gegeben ein Ring R und n ∈ Z verwenden wir oft die Abkürzungen
n+ 1R = nR = n. Unser Satz zeigt, daß es meist nicht so genau darauf ankommt,
ob n nun eine ganze Zahl oder das Element nR eines abstrakten Rings bedeutet.
Insbesondere kürzt man eigentlich immer 0R ab durch 0 und 1R durch 1. Man
beachte jedoch, daß für verschiedene ganze Zahlen n 6= m durchaus nR = mR
gelten kann: Ist etwa R = K ein Körper mit zwei Elementen, so gilt nK = 0K für
gerades n und nK = 1K für ungerades n. Vom höheren Standpunkt wird das alles
in [LA1] 5.1.11 nocheinmal ausführlich diskutiert werden.

Lemma 1.6.19 (Folgerungen aus den Körperaxiomen). In jedem Körper K gel-


ten zusätzlich zu den bereits für Ringe bewiesenen Aussagen die folgenden Aussa-
gen und Formeln:

1. ab = 0K ⇒ (a = 0K oder b = 0K )

2. ac
bd
= ac
bd
für alle a, c ∈ K und b, d ∈ K ×

3. ac
bc
= a
b
für alle a ∈ K und b, c ∈ K ×

4. a
b
+ c
d
= ad+bc
bd
für alle a, c ∈ K und b, d ∈ K ×

Beweis. 1. In der Tat folgt aus (a 6= 0K und b 6= 0K ) schon (ab 6= 0K ) nach


den Körperaxiomen.

2. Das ist klar.

3. Das ist klar.

4. Das wird bewiesen, indem man die Brüche auf einen Hauptnenner bringt
und das Distributivgesetz anwendet.

42
Übungen
Übung 1.6.20. Jeder Ring R mit 0R = 1R hat nur ein einziges Element.
Übung 1.6.21. Ist K ein Körper derart, daß es kein x ∈ K gibt mit x2 = −1,
so kann man die Menge K × K = K 2 zu einem Körper machen, indem man die
Addition und Multiplikation definiert durch

(a, b) + (c, d) := (a + c, b + d)
(a, b) · (c, d) := (ac − bd, ad + bc)

Die Abbildung K → K 2 , a 7→ (a, 0) ist dann ein Körperhomomorphismus.


Kürzen wir (a, 0) mit a ab und setzen (0, 1) = i, so gilt i2 = −1 und (a, b) = a+b i

und die Abbildung a + b i 7→ a − b i ist ein Körperisomorphismus K 2 → K 2 .
1.6.22. Auf die in der vorhergehenden Übung 1.6.21 erklärte Weise können wir
etwa aus dem Körper K = R der „reellen Zahlen“, sobald wir ihn kennengelernt
haben, direkt den Körper C der komplexen Zahlen konstruieren. Unser Körper-
isomorphismus gegeben durch die Vorschrift a + b i 7→ a − b i heißt in diesem
Fall die komplexe Konjugation und wird auch z 7→ z̄ notiert. Man beachte,
wie mühelos das alles in der Sprache der Mengenlehre zu machen ist. Als die
komplexen Zahlen erfunden wurden, gab es noch keine Mengenlehre und beim
Rechnen beschränkte man sich auf das Rechnen mit „reellen“ Zahlen, ja selbst
das Multiplizieren zweier negativer Zahlen wurde als eine fragwürdige Operation
angesehen, und das Ziehen einer Quadratwurzel aus einer negativen Zahl als eine
rein imaginäre Operation. In gewisser Weise ist es das ja auch geblieben, aber die
Mengenlehre liefert eben unserer Imagination eine wunderbar präzise Sprache, in
der wir uns auch über imaginierte Dinge unmißverständlich austauschen können.
Man kann dieselbe Konstruktion auch allgemeiner durchführen, wenn man statt
−1 irgendein anderes Element eines Körpers K betrachtet, das kein Quadrat ist.
Noch allgemeinere Konstruktionen zur „Adjunktion höherer Wurzeln“ oder sogar
der „Adjunktion von Nullstellen polynomialer Gleichungen“ können Sie in der
Algebra kennenlernen, vergleiche etwa [AL] 3.7.6. In [LA1] 2.7 diskutieren wir
die komplexen Zahlen ausführlicher.
Ergänzende Übung 1.6.23. Ein Körperhomomorphismus ist stets injektiv.

43
2 Die reellen Zahlen
2.1 Rationale Wurzeln rationaler Zahlen
Satz 2.1.1. Es gibt keine rationale Zahl x ∈ Q mit x2 = 2.

Die Diagonal im Einheitsquadrat hat


eine irrational Länge.

2.1.2. Dieser Satz erklärt, warum wir uns mit den rationalen Zahlen nicht zu-
frieden geben. In der Tat suchen wir nach einem Zahlbereich, in dem jeder „an-
schaulichen Länge“, wie zum Beispiel der Länge der Diagonale eines Quadrats
der Kantenlänge Eins, auch tatsächlich eine Zahl entspricht. Wir zeigen in 3.3.14,
daß im Zahlbereich der reellen Zahlen immerhin aus allen nichtnegativen Zahlen
Quadratwurzeln gezogen werden können, und diskutieren in 3.4.1, wie sich sogar
unsere anschauliche Vorstellung von der Länge des Einheitskreises zur Definition
einer reellen Zahl präzisieren läßt.
Erster Beweis. Setzen wir die in [LA1] 4.4.8 bewiesene Eindeutigkeit der Prim-
faktorzerlegung als bekannt voraus, so folgt unmittelbar, daß das Quadrat eines
unkürzbaren Bruches mit Nenner 6= ±1 wieder ein unkürzbarer Bruch mit Nen-
ner 6= ±1 sein muß. Für eine rationale Zahl x ∈ Q folgt aus x 6∈ Z also x2 6∈ Z.
Gäbe es mithin eine rationale Zahl x ∈ Q mit x2 = 2, so müßte x bereits selbst
eine ganze Zahl sein. Offensichtlich gibt es jedoch keine ganze Zahl x ∈ Z mit
x2 = 2.
Zweiter Beweis. Ohne die Eindeutigkeit der Primfaktorzerlegung als bekannt vor-
auszusetzen können wir in unserer speziellen Situation auch elementarer mit dem
Primfaktor 2 durch Widerspruch argumentieren: Nehmen wir an, wir fänden gan-
ze Zahlen p, q ∈ Z mit q 6= 0 derart, daß x = p/q ein unkürzbarer Bruch wäre mit
x2 = 2. Es folgte p2 = 2q 2 , also p2 gerade, also p gerade, also p2 durch 4 teilbar,
also q 2 gerade, also q gerade. Dann wäre unser Bruch aber doch kürzbar gewesen,
nämlich durch 2.

44
2.2 Angeordnete Körper
Definition 2.2.1. Eine Relation T auf einer Menge X ist eine Teilmenge T ⊂
X × X des kartesischen Produkts von X mit sich selbst, also eine Menge von
Paaren von Elementen von X. Statt (x, y) ∈ T schreiben wir in diesem Zusam-
menhang meist xT y.
Definition 2.2.2. Eine Relation T auf einer Menge X heißt eine Ordnungsrelati-
on oder eine Teilordnung oder eine partielle Ordnung, wenn für alle x, y, z ∈ X
gilt:
1. Transitivität: (xT y und yT z) ⇒ xT z;

2. Antisymmetrie: (xT y und yT x) ⇒ x = y;

3. Reflexivität: xT x für alle x ∈ X.


Eine Teilordnung heißt eine Ordnung oder Anordnung, wenn wir zusätzlich ha-
ben
4. Totalität: Für alle x, y ∈ X gilt xT y oder yT x.
2.2.3 (Diskussion der Terminologie). In der Literatur heißt eine Teilordnung
auch eine Halbordnung oder kurz eine „Ordnung“. Wir verstehen jedoch unter
einer Ordnung stets eine Ordnungsrelation, die auch die Eigenschaft der Totalität
besitzt. Auf Englisch benutzt man für eine teilgeordnete Menge alias „partially
ordered set“ gerne die Abkürzung poset. Eine Ordnung in unserem Sinne heißt in
der Literatur auch eine totale Ordnung oder eine lineare Ordnung.
2.2.4. Gegeben teilgeordnete Mengen (X, ≤) und (Y, ≤) versteht man unter ei-
nem Ordnungshomomorphismus eine Abbildung ϕ : X → Y mit a ≤ b ⇒
ϕ(a) ≤ ϕ(b). In dieser Situation muß ein bjektiver Homomorphismus keineswegs
ein Isomorphismus sein, als da heißt, seine Umkehrabbildung muß keineswegs
wieder ein Ordnungshomomorphismus sein.
Vorschau 2.2.5. Allgemeiner versteht man unter einer Relation T zwischen einer
Menge X und einer Menge Y eine Teilmenge T ⊂ X × Y . In diesem Sinne
sind dann auch unsere Abbildungen aus 1.4.2 spezielle Relationen. In Teilen der
Literatur heißen derartige Relationen auch „Korrespondenzen“. Noch allgemeiner
betrachtet man auch für n ≥ 0 und Mengen X1 , . . . , Xn Teilmengen T ⊂ X1 ×
. . . × Xn und nennt sie n-stellige Relationen, aber das ist für uns vorerst noch
nicht relevant.
2.2.6 (Notationen zu teilgeordneten Mengen). Bei einer Ordnungsrelation T
schreiben wir stets x ≤ y statt xT y und statt x ≤ y schreiben wir dann oft auch
y ≥ x. Weiter kürzt man (x ≤ y und x 6= y) ab mit x < y und ebenso (x ≥ y und

45
x 6= y) mit x > y. Auf jeder angeordneten Menge definieren wir Verknüpfungen
max und min in offensichtlicher Verallgemeinerung von 1.5.3.

Definition 2.2.7. Ein angeordneter Kring ist ein Kring (R, +, ·) mit einer An-
ordnung ≤ derart, daß für beliebige Elemente x, y, z ∈ R gilt:

1. x ≥ y ⇒ x + z ≥ y + z;

2. (x ≥ 0 und y ≥ 0) ⇒ xy ≥ 0.

Eine Anordnung eines Krings mit diesen Eigenschaften nennen wir eine Kring-
anordnung. Die Elemente x ∈ R mit x > 0 beziehungsweise x < 0 nennen
wir positiv beziehungsweise negativ. Die Elemente mit x ≥ 0 beziehungsweise
x ≤ 0 nennen wir nichtnegativ beziehungsweise nichtpositiv. Ein angeordneter
Körper ist ein Körper mit einer Kringanordnung.

Beispiel 2.2.8. Der Ring Z der ganzen Zahlen ist mit seiner üblichen Anordnung
ein angeordneter Kring. Der Körper Q der rationalen Zahlen ist mit seiner übli-
chen Anordnung ein angeordneter Körper. Dasselbe wird auch für den Körper R
der „reellen Zahlen“ gelten, den wir demnächst einführen.
2.2.9 (Eigenschaften angeordneter Kringe). Wir listen einige Tatsachen auf, die
in beliebigen angeordneten Kringen R gelten.

1. (x ≤ y und a ≤ b) ⇒ (x + a ≤ y + b)
In der Tat folgt aus den Annahmen x + a ≤ y + a ≤ y + b.

2. (x ≤ y und a ≥ 0) ⇒ (ax ≤ ay)


In der Tat folgt 0 ≤ y − x, also 0 ≤ a(y − x) = ay − ax und damit dann
ax ≤ ay.

3. (0 ≤ x ≤ y und 0 ≤ a ≤ b) ⇒ (0 ≤ xa ≤ yb)
In der Tat erhalten wir 0 ≤ xa ≤ ya ≤ yb.

4. (x ≤ y) ⇒ (−y ≤ −x)
Das folgt durch Addition von (−y − x) auf beiden Seiten.

5. (x ≥ y und a ≤ 0) ⇒ (ax ≤ ay)


In der Tat folgern wir x ≥ y ⇒ (−a)x ≥ (−a)y ⇒ ax ≤ ay.

6. x2 ≥ 0
In der Tat ist x2 = (−x)2 und wir haben x ≥ 0 ⇔ (−x) ≤ 0.

46
7. 1 ≥ 0
In der Tat gilt 1 = 12 .

8. (x ≥ 0 und x invertierbar) ⇒ (x−1 ≥ 0)


Das folgt durch Multiplikation mit (x−1 )2 .

9. (0 ≤ x ≤ y und x, y invertierbar) ⇒ (0 ≤ y −1 ≤ x−1 )


Das folgt durch Multiplikation mit y −1 x−1 .

2.2.10 (Einbettung von Z in angeordnete Kringe). Schreiben wir zur besonde-


ren Betonung wieder 0R und 1R , so gelten nach dem vorhergehenden in jedem
angeordneten Kring R mit 0R 6= 1R die Ungleichungen

. . . < (−1R ) + (−1R ) < (−1R ) < 0R < 1R < 1R + 1R < . . .

Insbesondere folgt aus m1R = n1R für m, n ∈ Z schon m = n. Unser eindeutig


bestimmter Ringhomomorphismus Z → R, m 7→ m1R ist in diesem Fall mithin
eine Injektion
Z ,→ R
und diese Injektion ist zusätzlich auch ein Ordnungshomomorphismus. Das Bild
dieser Injektion könnte einen eigenen Namen kriegen, zum Beispiel ZR , aber
wir kürzen unsere Notation ab, bezeichnen dieses Bild auch mit Z und schreiben
kürzer m statt m1R .
2.2.11 (Einbettung von Q in angeordnete Körper). Ist K ein angeordneter
Körper, so erhalten wir einen Körperhomomorphismus Q → K durch die Vor-
schrift m/n 7→ m1K /n1K . Es ist leicht zu sehen, daß er der einzige Körperho-
momorphismus Q → K ist. Wie jeder Körperhomomorphismus ist auch er eine
Injektion
Q ,→ K
und man prüft leicht, daß auch diese Injektion ein Ordnungshomomorphismus
ist. Wir könnten diese Injektion zum Beispiel q 7→ qK notieren, sind aber etwas
nachlässig, bezeichnen das Bild unserer Injektion Q → K meist kurzerhand mit
demselben Buchstaben Q statt genauer QK und hängen auch den Elementen von
Q meist keinen Index an, wenn wir eigentlich ihr Bild in K meinen.

Definition 2.2.12. Für jeden angeordneten Kring R definieren wir eine Abbildung
R → R, x 7→ |x|, genannt der Absolutbetrag oder kürzer Betrag, durch die
Vorschrift 
x falls x ≥ 0;
|x| :=
−x falls x < 0.

47
2.2.13 (Eigenschaften des Absolutbetrags). Wir listen einige Eigenschaften des
Absolutbetrags auf. Der Beweis der ersten fünf sei dem Leser überlassen.

1. x ≤ |x|

2. |x| = 0 ⇔ x = 0

3. |−x| = |x|

4. |xy| = |x||y|

5. |x−1 | = |x|−1 für x invertierbar.

6. Es gilt die sogenannte Dreiecksungleichung

|x + y| ≤ |x| + |y| ∀x, y ∈ R

In Worten ist also der Betrag einer Summe stets kleinergleich der Summe
der Beträge der Summanden. In der Tat gilt ja x + y ≤ |x| + |y| und ebenso
auch −(x + y) ≤ |x| + |y|. Unsere Ungleichung heißt deshalb Dreiecks-
ungleichung, weil sie in einem allgemeineren Kontext sagt, daß in einem
Dreieck zwei Seiten zusammen stets länger sind als die Dritte.

7. ||a| − |b|| ≤ |a + b| ∀a, b ∈ R.


In der Tat folgt aus der Dreiecksungleichung |a| = |(a + b) + (−b)| ≤
|a + b| + | − b| = |a + b| + |b|, also |a| − |b| ≤ |a + b|. Ebenso folgert man
aber auch |b| − |a| ≤ |a + b|.

Ergänzung 2.2.14. Unter einer angeordneten abelschen Gruppe versteht man


eine abelsche Gruppe (A, +) mit einer Anordnung ≤ derart, daß für beliebige
Elemente x, y, z ∈ A gilt

x≥y ⇒ x+z ≥y+z

Alle in diesem Abchnitt für angeordnete Kringe bewiesenen Aussagen, in denen


die multiplikative Struktur keine Rolle spielt, gelten genauso für angeordnete abel-
sche Gruppen.

Übungen
Übung 2.2.15. In jedem angeordneten Körper gilt:

1. Aus |x − a| ≤ η und |y − b| ≤ η folgt |(x + y) − (a + b)| ≤ 2η;

2. Aus |x − a| ≤ η ≤ 1 und |y − b| ≤ η ≤ 1 folgt |xy − ab| ≤ η(|b| + 1 + |a|);

48
3. Aus |y − b| ≤ η ≤ |b|/2 und b 6= 0 folgt y 6= 0 und |1/y − 1/b| ≤ 2η/|b|2 .
Ergänzende Übung 2.2.16. In jedem angeordneten Ring gilt für x ≥ −1 und
n ∈ N die sogenannte Bernoulli-Ungleichung (1 + x)n ≥ 1 + nx. Hinweis:
Vollständige Induktion.
Übung 2.2.17. Seien K ein angeordneter Körper und I ⊂ K ein Intervall, in
Formeln (x < y < z und x, z ∈ I) ⇒ y ∈ I. Wir nennen eine Funktion φ :
I → K konvex, wenn „ihr Graph unter jeder seiner Sekanten liegt“, wenn also in
Formeln für alle x < y < z aus I gilt
φ(x) − φ(y) φ(y) − φ(z)

x−y y−z
Man zeige in dieser SituationP für beliebige x1 , . . . , xn ∈ I und beliebige nichtne-
gative µ1 , . . . , µn ∈ K≥0 mit ni=1 µi = 1 die Jensen’sche Ungleichung
n
! n
X X
φ µ i xi ≤ µi φ(xi )
i=1 i=1

In Worten ist also „der Funktionswert beim gewichteten Mittel der xi beschränkt
durch das gewichtete Mittel der Funktionswerte“. Hinweis: Die Voraussetzung
läßt sich als der Fall n = 2 verstehen. Davon ausgehend führt Induktion ans Ziel.

2.3 Maximum und Supremum


Definition 2.3.1. Sei (Y, ≤) eine teilgeordnete Menge.
1. Ein Element g ∈ Y heißt ein größtes Element, wenn gilt g ≥ y ∀y ∈ Y .
Ein Element g ∈ Y heißt ein maximales Element, wenn es kein y ∈ Y gibt
mit y > g.
2. Ein Element k ∈ Y heißt ein kleinstes Element, wenn gilt k ≤ y ∀y ∈ Y .
Ein Element k ∈ Y heißt ein minimales Element, wenn es kein y ∈ Y gibt
mit y < k.
2.3.2. Jede teilgeordnete Menge besitzt höchstens ein größtes und höchstens ein
kleinstes Element. Wir dürfen deshalb den bestimmten Artikel verwenden und von
dem größten beziehungsweise kleinsten Element reden. Besitzt eine teilgeordne-
te Menge ein größtes beziehungsweise ein kleinstes Element, so ist dies auch ihr
einziges maximales beziehungsweise minimales Element. Im allgemeinen kann
es jedoch maximale beziehungsweise minimale Elemente in großer Zahl geben,
zumindest dann, wenn unsere Teilordnung keine Anordnung ist. Es kann auch
durchaus passieren, daß es überhaupt kein minimales oder maximales Element
gibt, und zwar selbst dann, wenn unsere teilgeordnete Menge nicht die leere Men-
ge ist.

49
Eine teilgeordnete Menge mit zwei minimalen und einem
maximalen Element, die weder ein kleinstes noch ein größtes
Element besitzt. Die Darstellung ist in der Weise zu verstehen,
daß die fetten Punkte die Elemente unserer Menge bedeuten und
daß ein Element größer ist als ein anderers genau dann, wenn es
von diesem „durch einen aufsteigenden Weg erreicht werden
kann“.

50
Definition 2.3.3. Seien (X, ≤) eine teilgeordnete Menge und Y ⊂ X eine Teil-
menge.

1. Ein Element o ∈ X heißt eine obere Schranke von Y in X, wenn gilt


o ≥ y ∀y ∈ Y .

2. Ein Element u ∈ X heißt eine untere Schranke von Y in X, wenn gilt


u ≤ y ∀y ∈ Y .

Definition 2.3.4. Seien (X, ≤) eine teilgeordnete Menge und Y ⊂ X eine Teil-
menge.

1. Ein Element s ∈ X heißt die kleinste obere Schranke oder lateinischer


das Supremum von Y in X, wenn s das kleinste Element ist in der Menge
{o ∈ X | o ist obere Schranke von Y }. Wir schreiben dann s = sup Y =
supX Y .

2. Ein Element i ∈ X heißt die größte untere Schranke oder lateinischer das
Infimum von Y in X, wenn i das größte Element ist in der Menge {u ∈
X | u ist untere Schranke von Y }. Wir schreiben dann i = inf Y = inf X Y .

Beispiel 2.3.5. Die Teilmenge Y = {q ∈ Q | q < 1} ⊂ Q hat kein größtes


Element, besitzt jedoch in Q eine kleinste obere Schranke, nämlich sup Y = 1.
Die Teilmenge Z = {q ∈ Q | q ≤ 1} ⊂ Q hat ein größtes Element, nämlich
die 1, und das ist dann natürlich auch gleichzeitig ihre kleinste obere Schranke in
Q, also haben wir auch sup Z = 1. Die Teilmenge Y = {q ∈ Q | q < 1} ⊂ Q
hat in Q keine untere Schranke und dann natürlich erst recht keine größte untere
Schranke.
Ergänzendes Beispiel 2.3.6. Auf der Potenzmenge einer beliebigen Menge ist die
Inklusionsrelation eine Teilordnung. Bezüglich dieser Teilordnung ist die Verei-
nigungsmenge im Sinne von [LA1] 1.5.13 eines Mengensystems sein Supremum
und die Schnittmenge sein Infimum.

Übungen
Übung 2.3.7. Die Menge {x ∈ Q | x2 ≤ 2} besitzt in Q keine größte untere
Schranke.
Übung 2.3.8. Sei X eine teilgeordnete Menge. Besitzt eine Teilmenge Y ⊂ X
ein größtes Element g ∈ Y , so gilt g = sup Y . Besitzt eine Teilmenge Y ⊂ X
ein kleinstes Element k ∈ Y , so gilt k = inf Y . Sind Teilmengen Z ⊂ Y ⊂ X
gegeben und besitzen Z und Y ein Supremum in X, so gilt sup Z ≤ sup Y .

51
Die Menge Y = {1/n | n ∈ N≥1 } besitzt in Q eine größte untere Schranke,
nämlich die Null, in Formeln inf Y = 0. Sie besitzt in Q auch eine kleinste obere
Schranke, nämlich die Eins, in Formeln sup Y = 1.

52
Ergänzende Übung 2.3.9 (Teilordnungen und Verbandsstrukturen). Erklären
wir auf einer teilgeordneten Menge B, in der jede zweielementige Teilmenge ein
Supremum und ein Infimum hat, die beiden Verknüpfungen ∨ und ∧ durch a∨b :=
sup{a, b} und a ∧ b := inf{a, b}, so erhalten wir einen Verband im Sinne von
[GR] 2.6.3. Erklären wir umgekehrt auf einem Verband (B, ∨, ∧) eine Relation
R durch aRb genau dann, wenn a ∨ b = b oder gleichbedeutend a = a ∧ b,
so ist R ein Teilordnung und jede zweielementige Teilmenge hat ein Supremum
und ein Infimum. Schließlich sind diese beiden Konstruktionen zueinander inverse
Bijektionen zwischen Verbandsstrukturen und Teilordnungen mit der fraglichen
Eigenschaft auf jeder festen Menge B.

2.4 Reelle Zahlen


2.4.1 (Geometrische und algorithmische Zahlbegriffe). Der folgende Satz 2.4.3
enthält die Charakterisierung eines gewissen angeordneten Körpers von „reellen
Zahlen“, auf der wir die Analysis aufbauen werden. Dieser Körper bildet einen
wesentlichen Teil des Begriffsgebäudes, das es uns ermöglicht, unsere geometri-
schen Vorstellungen in der heute gebräuchlichen aus den Symbolen der Mengen-
lehre aufgebauten Sprache der höheren Mathematik wiederzufinden. Bereits im
vierten Jahrhundert vor Christus erklärte der griechische Mathematiker Eudoxos
eine „Zahl“ als das „Verhältnis zweier Längen“ und gab damit eine geometrische
Beschreibung dessen, was wir heute „positive reelle Zahlen“ nennen würden. Die
logischen Feinheiten der Beziehung dieses „geometrischen“ Zahlbegriffs zum „al-
gorithmischen“ Zahlbegriff, der vom Prozeß des Zählens herkommt, wurden erst
nach und nach verstanden. Den folgenden Satz 2.4.3 und seinen Beweis mag man
als den Schlußpunkt dieser Entwicklung ansehen. Der Zwischenwertsatz 3.3.8
und stärker der Satz über die Gruppenwege in der Kreisgruppe 4.5.8 und seine
Beziehung zu Winkelmaßen [LA2] 1.8.1 illustrieren, wie gut die bei diesem Be-
weis im Reich der abstrakten Logik und Mengenlehre konstruierten reellen Zahlen
unsere geometrische Anschauung modellieren.
2.4.2. Der Beweis der Existenz eines angordneten Körpers mit den im folgenden
Satz 2.4.3 präzisierten Eigenschaften ist für das weitere Verständnis der Vorle-
sung belanglos. Ich gebe hier nur eine Beweisskizze, als da heißt einen Beweis
für höhere Semester, um Sie zu überzeugen, daß wir nicht während des nächsten
halben Jahres Folgerungen ziehen aus Grundannahmen, die überhaupt nie erfüllt
sind. Ich rate dazu, bei der ersten Lektüre auf das genauere Studium des Existenz-
beweises zu verzichten, der sich bis 2.4.17 hinzieht.

Satz 2.4.3 (Charakterisierung der reellen Zahlen). 1. Es gibt angeordnete


Körper (R, +, ·, ≤) derart, daß in der angeordneten Menge R jede nichtlee-
re Teilmenge mit einer unteren Schranke auch eine größte untere Schranke

53
besitzt;

2. Solch ein angeordneter Körper ist im wesentlichen eindeutig bestimmt. Ist


genauer (R0 , +, ·, ≤) ein weiterer derartiger angeordneter Körper, so gibt

es genau einen Körperisomorphismus ϕ : R → R0 und für diesen Körper-
isomorphismus gilt zusätzlich α ≤ β ⇔ ϕ(α) ≤ ϕ(β).

2.4.4. Durch Multiplikation mit (−1) sehen wir, daß die im Satz formulierte „In-
fimumseigenschaft“ im Fall eines angeordneten Körpers gleichbedeutend ist zur
Supremumseigenschaft, daß jede nichtleere Teilmenge mit einer oberen Schran-
ke auch eine kleinste obere Schranke besitzt.
2.4.5. Die im Satz gegebene Charakterisierung trifft auf den angeordneten Körper
der rationalen Zahlen nicht zu. Zum Beispiel wissen wir nach 2.3.7, daß die Men-
ge {x ∈ Q | x2 ≤ 2} in Q keine größte untere Schranke besitzt. Sie ist jedoch
nicht leer und besitzt in Q durchaus untere Schranken, nur eben keine größte.
Beweis von [Link]. Wir konstruieren einen derartigen Körper R = RD als eine
Menge R ⊂ P(Q) von Teilmengen der Menge Q aller rationalen Zahlen,
 

 α ist nicht leer, 

α hat eine untere Schranke,
 
R := α⊂Q

 α hat kein kleinstes Element, 

α enthält mit x auch jedes y > x.
 

Man nennt solch ein α einen Dedekind’schen Schnitt und bezeichnet die so kon-
struierte Menge R als das „Dedekind’sche Modell der reellen Zahlen“. Auf un-
serer Menge R von Teilmengen von Q ist die Inklusionsrelation eine Anordnung
und wir schreiben α ≤ β statt α ⊃ β. Ist Y ⊂ R eine nichtleere Teilmenge mit
unterer Schranke, so liegt offensichtlich auch die Vereinigung
[
α = {q ∈ Q | Es gibt α ∈ Y mit q ∈ α}
α∈Y

aller Teilmengen aus Y in R und ist das Infimum von Y . Damit haben wir bereits
eine angeordnete Menge mit der geforderten Eigenschaft konstruiert. Wir müssen
darauf nur noch eine Addition und eine Multiplikation erklären derart, daß unsere
Struktur zu einem angeordneten Körper wird. Die Addition ist unproblematisch:
Wir setzen
α + β := {x + y | x ∈ α, y ∈ β}
und prüfen mühelos, daß aus α, β ∈ R schon folgt α + β ∈ R, daß R so zu einer
kommutativen Gruppe wird mit neutralem Element 0R = {x ∈ Q | x > 0}, und
daß gilt α ≤ β ⇒ α + γ ≤ β + γ für alle α, β, γ ∈ R. Das Negative zu α

54
Zum Infimum in R

55
kann man etwa erhalten, indem man die Menge {y ∈ Q | y + x > 0 ∀x ∈ α}
betrachtet und ihr für den Fall, daß sie ein kleinstes Element haben sollte, das
noch wegnimmt. Wir erlauben uns nun die Abkürzung 0R = 0. Die Multiplikation
positiver Elemente ist ebenfalls unproblematisch: Für α, β ∈ R mit α > 0, β > 0
setzen wir
αβ := {xy | x ∈ α, y ∈ β}
und prüfen mühelos, daß aus α, β ∈ R>0 schon folgt αβ ∈ R>0 und daß R>0 so
zu einer kommutativen Gruppe mit neutralem Element 1R = {x ∈ Q | x > 1}
wird. Das Distributivgesetz in Q impliziert mit diesen Definitionen auch sofort
die Regel
α(β + γ) = αβ + αγ
für alle α, β, γ ∈ R>0 . Um unsere Multiplikation so auf ganz R auszudehnen, daß
R ein angeordneter Körper wird, verwenden wir das anschließende technische
Lemma 2.4.6. Eine Beweisskizze für die in Teil 2 behauptete Eindeutigkeit geben
wir zu Ende dieses Abschnitts.

Lemma 2.4.6. Sei (R, +) eine kommutative Gruppe mit einer Anordnung ≤ der-
art, daß gilt α ≤ β ⇒ α + γ ≤ β + γ ∀α, β, γ ∈ R. Sei auf R>0 eine Verknüpfung
(α, β) 7→ αβ gegeben, die R>0 zu einem kommutativen Monoid macht. Es gelte
außerdem die Regel

α(β + γ) = αβ + αγ ∀α, β, γ ∈ R>0

So gibt es genau eine Fortsetzung unserer Verknüpfung (α, β) 7→ αβ zu einer


Verknüpfung auf ganz R derart, daß (R, +, ·) ein kommutativer Ring wird, und
für diesen Ring ist ≤ eine Ringanordnung. War R>0 eine Gruppe, ist unser Ring
R sogar ein Körper.

Beweis. Wenn die Fortsetzung unserer Multiplikation auf ganz R das Distributiv-
gesetz erfüllen soll, müssen wir notwendig setzen


 0 α = 0 oder β = 0;
−((−α)β) α < 0, β > 0;

αβ :=

 −(α(−β)) α > 0, β < 0;
(−α)(−β) α < 0, β < 0.

Es gilt nun, für diese Multiplikation Kommutativität und die Ringaxiome nachzu-
weisen. Unsere Multiplikation auf R ist offensichtlich kommutativ und assoziativ
und macht R\{0} zu einem Monoid. Wir müssen also nur noch das Distributiv-
gesetz
α(β + γ) = αβ + αγ ∀α, β, γ ∈ R

56
nachweisen. Ohne Beschränkung der Allgemeinheit dürfen wir hierbei α > 0 und
β + γ > 0 annehmen. Die einzigen nicht offensichtlichen Fälle sind dann β > 0,
γ < 0 beziehungsweise β < 0, γ > 0. Sei ohne Beschränkung der Allgemeinheit
β > 0, γ < 0. Nach unseren Annahmen gilt ja die Regel

αβ = α((β + γ) + (−γ)) = α(β + γ) + α(−γ)

und daraus folgt sofort α(β + γ) = αβ + αγ auch in diesem letzten Fall.


Definition 2.4.7. Wir wählen für den weiteren Verlauf der Vorlesung einen festen
angeordneten Körper (R, +, ·, ≤), der die Supremumseigenschaft hat, erlauben
uns wegen der in [Link] formulierten „Eindeutigkeit bis auf eindeutigen Isomor-
phismus“ den bestimmten Artikel, und nennen ihn den Körper R der reellen
Zahlen.
2.4.8. Ein angeordneter Körper heißt archimedisch angeordnet, wenn es zu je-
dem Element x des Körpers eine natürliche Zahl n ∈ N gibt mit n > x.
Satz 2.4.9 (Archimedizität der reellen Zahlen). Die natürlichen Zahlen besitzen
keine obere Schranke in den reellen Zahlen, als da heißt, für alle x ∈ R gibt es
ein n ∈ N mit n > x.
Beweis. Wir argumentieren durch Widerspruch. Hätte die Teilmenge N ⊂ R eine
obere Schranke, so hätte sie nach 2.4.4 auch eine kleinste obere Schranke a. Dann
wäre aber a − 1 < a keine obere Schranke von N, also gäbe es n ∈ N mit
n > (a−1). Es folgte (n+1) > a, und bereits a selbst wäre keine obere Schranke
von N gewesen.
Korollar 2.4.10. 1. Die ganzen Zahlen besitzen keine untere Schranke in den
reellen Zahlen;

2. Für jede positive reelle Zahl ε > 0 gibt es eine positive natürliche Zahl
n ≥ 1 mit 0 < n1 < ε;

3. Es gilt 0 = inf R n1 | n ∈ N≥1 ;




4. Zwischen zwei verschiedenen reellen Zahlen liegt stets noch eine rationale
Zahl, in Formeln: Gegeben x < y in R gibt es r ∈ Q mit x < r < y.
2.4.11. Dies Korollar gilt mit demselben Beweis für jeden archimedisch angeord-
neten Körper.
Beweis. Die erste Aussage folgt aus 2.4.9. Um die Zweite zu zeigen, suche man
n > 1/ε. Die dritte Aussage folgt unmittelbar aus der zweiten. Um die vierte
Aussage zu zeigen, suchen wir zunächst n ∈ N, n ≥ 1 mit 0 < n1 < y − x, also

57
1 < ny − nx, das heißt 1 + nx < ny. Nun gibt es a, b ∈ Z mit a < ny < b, also
gibt es eine größte ganze Zahl m mit m < ny und folglich ny ≤ m + 1, woraus
hinwiederum folgt nx < m und dann x < m n
< y.
Definition 2.4.12. Mit einem endlichen Dezimalausdruck wie 3,141 bezeichnet
man wie auf der Schule die rationale Zahl 3141/1000. Die durch einen unend-
lichen Dezimalausdruck wie 3,1415 . . . dargestellte reelle Zahl erklären wir als
das Supremum der Menge ihrer endlichen Teilausdrücke beziehungsweise das In-
fimum, wenn ein Minus davorsteht. Wir setzen also zum Beispiel
 

 3 

3,1

 


 

3,14
 
3,1415 . . . := sup

 3,141  
3,1415

 


 

...
 

Die Elemente der Menge aller endlichen Teilausdrücke haben wir hier nur der
Übersichtlichkeit halber untereinander geschrieben, statt sie durch Kommata zu
trennen, und rationale Zahlen haben wir stillschweigend mit ihren Bildern in R
identifiziert.
Beispiel 2.4.13. Ich zeige 1 = 0, 99999 . . . Nach unserer Konvention 2.4.12 gilt
es zu zeigen 1 = sup{1 − 10−n | n ∈ N≥1 }. Eine evidente Rechnung zeigt, daß
es äquivalent ist, 0 = inf{10−n | n ∈ N≥1 } zu zeigen, und das folgt unmittelbar
aus Korollar 2.4.10, in dem wir 0 = inf{1/k | k ∈ N≥1 } gezeigt hatten.
Proposition 2.4.14. 1. Jede reelle Zahl läßt sich durch einen unendlichen De-
zimalausdruck darstellen;
2. Genau dann stellen zwei verschiedene unendliche Dezimalausdrücke die-
selbe reelle Zahl dar, wenn es eine Stelle vor oder nach dem Komma gibt
und eine von Neun verschiedene Ziffer z derart, daß die beiden Dezimal-
ausdrücke bis zu dieser Stelle übereinstimmen, ab dieser Stelle jedoch der
eine die Form z99999 . . . hat und der andere die Form (z + 1)00000 . . .
Beweis. Für den ersten Teil reicht es zu zeigen, daß sich jede nichtnegative reelle
Zahl y ≥ 0 als ein unendlicher Dezimalausdruck darstellen läßt. Nehmen wir zu
jedem s ∈ N die größte reelle Zahl rs ≤ y unter y mit höchstens s Stellen nach
dem Komma, so gilt
y = sup{r0 , r1 , r2 , . . .}
In der Tat ist y eine obere Schranke dieser Menge, aber jede reelle Zahl x < y
ist keine obere Schranke dieser Menge: Nach 2.4.10 oder, genauer, seinem Be-
weis gibt es nämlich für jedes x ∈ R mit x < y ein s ∈ N und ein m ∈ Z mit

58
x < m · 10−s < y, als da heißt, es gibt ein s mit x < rs . Um den zweiten Teil
zu zeigen, dürfen wir uns weiter auf nichtnegative Zahlen beschränken. Wir se-
hen wie in 2.4.13, daß jeder Dezimalausdruck mit einer Neunerperiode dieselbe
reelle Zahl darstellt wie ein geeigneter anderer Dezimalausdruck ohne Neunerpe-
riode. Betrachten wir nun zwei verschiedene Dezimalausdrücke ohne Neunerperi-
ode und zeigen, daß sie verschiedene reelle Zahlen darstellen. Ohne Beschränkung
der Allgemeinheit seien sie gleich vor dem Komma, aber verschieden in der ersten
Nachkommastelle. Ohne Beschränkung der Allgemeinheit mögen sie sogar beide
nur eine Null vor dem Komma haben. Nach dem Komma habe der Dezimalaus-
druck a die Ziffern a1 , a2 , . . . und der Dezimalausdruck b die Ziffern b1 , b2 , . . . und
ohne Beschränkung der Allgemeinheit gelte a1 > b1 . Wir finden nach Annahme
ein r ≥ 1 mit br 6= 9. Bezeichne α, β ∈ R die durch unsere beiden Dezimalaus-
drücke dargestellten reellen Zahlen. Dann gilt offensichtlich
a1 a1 1
α≥ > − r ≥β
10 10 10
Beweisskizze für [Link]. Wir gehen von der Bijektion zwischen einem beliebi-
gen angeordneten Körper R mit der Supremumseigenschaft und der Menge al-
ler „Dezimalausdrücken ohne Neunerperiode“ aus 2.4.14 aus. verwendet zusam-
men mit der in den Übungen 2.4.18, 2.4.19 und 2.4.20 gegebenen Beschreibung
von Addition und Multiplikation von Dezimalausdrücken. Dieser Beweis ist zwar
vom höheren Standpunkt aus nicht besonders geschickt oder natürlich, aber da-
für vielleicht vom Schulstoff aus besser zugänglich. Ein Zugang „vom höheren
Standpunkt“ wird in Übung 2.4.21 skizziert. Daß jeder Körperhomomorphismus
zwischen zwei Körpern R, R0 mit der Supremumseigenschaft die Anordnung er-
halten muß, wird in 3.3.14 klar werden, wo wir zeigen, daß für jeden angeordneten
Körper R mit der Supremumseigenschaft die nichtnegativen Elemente genau alle
Quadrate sind, in Formeln R≥0 = {x2 | x ∈ R}.
Ergänzung 2.4.15. Es ist durchaus möglich, die Menge D aller „Dezimalaus-
drücke“ ohne jegliche Identifizierungen zu betrachten. Wenn wir diese Menge D
mit der Struktur einer angeordneten Menge zu versehen, ist auch durchaus die Su-
premumseigenschaft erfüllt. Es ist jedoch nicht möglich, diese angeordnete Men-
ge zu einem angeordneten Körper zu machen. Der naive Ansatz scheitert daran,
daß nicht klar ist, wie man mit den eventuell unendlich vielen Überträgen bei
der Addition und Multiplikation umgehen soll. Daß überhaupt jeder Ansatz zum
Scheitern verurteilt ist, erkennt man etwa daran, daß es in D Elemente gibt mit
d = supD X ⇒ d ∈ X für Teilmengen X ⊂ D, wie etwa d := 1, 0000 . . .,
und andere Elemente wie etwa d = 0, 99999 . . ., für die diese Implikation nicht
gilt. Für jeden angeordneten Körper K muß jedoch die Addition eines beliebigen

Elements k ∈ K ein Ordnungsisomorphismus (k+) : K → K sein.

59
Übungen
Übung 2.4.16. Man zeige, daß es für je zwei nichtleere Teilmengen M, N ⊂ R
mit x ≤ y für alle x ∈ M und y ∈ N stets ein a ∈ R gibt mit x ≤ a ≤ y für alle
x ∈ M und y ∈ N . Man zeige weiter, daß diese Bedingung an eine angeordnete
Menge sogar gleichbedeutend ist zur Forderung, jede nichtleere Teilmenge mit
einer unteren Schranke möge auch eine größte untere Schranke besitzen.
Übung 2.4.17. Bezeichne R = RD das Dedekind’sche Modell der reellen Zahlen.
Man zeige, daß die durch die Struktur eines angeordneten Körpers auf R nach
2.2.10 definierte Injektion Q ,→ R auch beschrieben werden kann durch die Vor-
schrift p 7→ pR := {q ∈ Q | q > p}.
Übung 2.4.18 (Summe nichtnegativer Zahlen in Dezimaldarstellung). Seien
X und Y nichtleere nach oben beschränkte Teilmengen von R. Mit der Notation
X + Y ⊂ R für die Menge {x + y | x ∈ X, y ∈ Y } zeige man sup(X + Y ) =
sup X + sup Y . Damit ist klar, wie man zu zwei durch Dezimalausdrücke dar-
gestellten nichtnegativen reellen Zahlen einen Dezimalausdruck für ihre Summe
bestimmen kann: Man betrachtet die Menge S aller Summen endlicher Teilaus-
drücke und nimmt den lexikographisch größten Dezimalausdruck, dessen sämtli-
che Anfangsstücke mit Anfangsstücken von Dezimalausdrücken aus unserer Men-
ge S übereinstimmen. Da der Übertrag beim Addieren jeweils höchstens Eins sein
kann, ist an jeder Stelle, an der nicht zwei Neuner übereinanderstehen, schon klar,
welche Ziffer in unserem Dezimalausdruck für die Summe an der Stelle davor
stehen muß.
Übung 2.4.19 (Differenz nichtnegativer Zahlen in Dezimaldarstellung). Man
überlegt sich, daß man sich mit 2.4.18 darauf zurückziehen kann zu erklären, wie
man für jede durch einen Dezimalausdruck a mit einer Null vor dem Komma
gegebene reelle Zahl α einen Dezimalausdruck für β := 1−α bestimmt. Sind aber
a1 , a2 , . . . die Nachkommastellen unseres Dezimalausdrucks a, so sind die Ziffern
bi gegeben durch ai + bi = 9 nach 2.4.18 offensichtlich Nachkommastellen, die
zusammen mit einer Null vor dem Komma einen Dezimalausdruck für β bilden.
Übung 2.4.20 (Produkt in Dezimaldarstellung). Seien X und Y nichtleere nach
oben beschränkte Teilmengen von R>0 . Mit der Notation XY ⊂ R für die Menge
{xy | x ∈ X, y ∈ Y } zeige man sup(XY ) = (sup X)(sup Y ). Damit ist ähn-
lich wie in 2.4.18 klar, wie man zu je zwei durch Dezimalausdrücke dargestellten
reellen Zahlen einen Dezimalausdruck für ihr Produkt bestimmen kann.
Ergänzende Übung 2.4.21 (Für höhere Semester). Man zeige die in [Link] be-
hauptete Eindeutigkeit der reellen Zahlen bis auf eindeutigen Isomorphismus.
Hinweis: Die gesuchte Bijektion ϕ kann zum Beispiel konstruiert werden durch
die Vorschrift ϕ(α) = inf{qR0 | q ∈ Q, qR > α}. Man zeige allgemeiner auch,
daß jeder Körperhomomorphismus R → R die Identität ist. Hinweis: Nach 3.3.14

60
sind die nichtnegativen reellen Zahlen genau die Quadrate, jeder Körperhomo-
morphismus R → R erhält also die Anordnung. Andererseits aber muß er auf Q
die Identität sein.
Ergänzende Übung 2.4.22 (Für höhere Semester). Gegeben ein archimedisch an-
geordneter Körper k gibt es genau einen ordnungserhaltenden Körperhomomor-
phismus k → R. Hinweis: Ähnlich wie 2.4.21, das man umgekehrt aus diesem
Resultat ableiten kann, sobald man weiß, daß es zu jeder positiven reellen Zahl
eine Quadratwurzel gibt.

2.5 Rationale und reelle Zahlen im Vergleich


Definition 2.5.1. Eine Menge heißt abzählbar, wenn es eine Bijektion unserer
Menge mit einer Teilmenge der Menge N aller natürlichen Zahlen gibt. Gleich-
bedeutend können wir auch fordern, daß unsere Menge entweder leer ist oder es
eine Surjektion von N darauf gibt. Eine Menge heißt abzählbar unendlich, wenn
sie abzählbar aber nicht endlich ist. Eine Menge heißt überabzählbar, wenn sie
nicht abzählbar ist.

Satz 2.5.2. 1. Es gibt eine Bijektion N → Q, in Worten: Die Menge der ratio-
nalen Zahlen ist abzählbar unendlich;

2. Es gibt keine Surjektion N  R, in Worten: Die Menge der reellen Zahlen


ist überabzählbar.

Beweis. 1. Für jede natürliche Zahl N gibt es nur endlich viele Brüche p/q ∈ Q
mit p, q ∈ Z, q 6= 0 und |p| ≤ N , |q| ≤ N . Wir beginnen unser Abzählen von Q
mit den Brüchen für N = 1, dann nehmen wir die Brüche hinzu mit N = 2, und
indem wir so weitermachen zählen wir ganz Q ab.
2. Hierzu verwenden wir das Cantor’sche Diagonalverfahren. Man beachte zu-
nächst, daß ein unendlicher Dezimalbruch, in dem die Ziffern Null und Neun nicht
vorkommen, nur dann dieselbe reelle Zahl darstellt wie ein beliebiger anderer un-
endlicher Dezimalbruch, wenn die beiden in jeder Stelle übereinstimmen. Wir
betrachten nun eine beliebige Abbildung N≥1 → R, i 7→ ri , und zeigen, daß sie
keine Surjektion sein kann. Wir schreiben dazu jedes ri als unendlichen Dezimal-
bruch. Dann finden wir einen unendlichen Dezimalbruch r, bei dem die Ziffern
Null und Neun nicht vorkommen und so, daß r für an der i-ten Stelle nach dem
Komma verschieden ist von ri . Dies r ist dann verschieden von allen ri und unsere
Abbildung i 7→ ri kann keine Surjektion gewesen sein.
Bemerkung 2.5.3. Man kann sich fragen, ob jede Teilmenge der reellen Zahlen
entweder abzählbar ist oder in Bijektion zu den reellen Zahlen selber. Die schon

61
N × N ist abzählbar und damit auch allgemeiner das Produkt von je zwei und
dann auch von endlich vielen abzählbaren Mengen.

Illustration zum Cantor’schen Diagonalverfahren. Ähnlich zeigt man, daß die


Menge Ens(N, E) aller Abbildungen von N in eine Menge E mit mindestens
zwei Elementen nicht abzählbar ist.

62
auf Cantor zurückgehende Vermutung, das könnte gelten, ist bekannt als die Kon-
tinuumshypothese. Sie wurde 1963 von Paul Cohen in sehr merkwürdiger Weise
geklärt: Er zeigte, daß unsere Frage in dem axiomatischen Rahmen, in dem man
die Mengenlehre üblicherweise formalisiert, nicht entscheidbar ist. Cohen wur-
de für diese Leistung auf dem internationalen Mathematikerkongress 1966 mit
der Fields-Medaille ausgezeichnet. Die Kontinuumshypothese ist übrigends die
erste Frage einer berühmten Liste von 23 Fragestellungen, den sogenannten Hil-
bert’schen Problemen, die David Hilbert in seiner Ansprache auf dem interna-
tionalen Mathematikerkongress 1900 in Paris vorstellte in seinem Bemühen, „aus
verschiedenen mathematischen Disziplinen einzelne bestimmte Probleme zu nen-
nen, von deren Behandlung eine Förderung der Wissenschaft sich erwarten läßt“.

63
3 Stetigkeit und Grenzwerte
3.1 Anschauung für Funktionen
3.1.1. Abbildungen mit Werten in irgendeiner Art von Zahlen nennen wir Funk-
tionen. Wir erlauben hier auch Werte in R̄. Wollen wir besonders betonen, daß
nur reelle Zahlen als Werte angenommen werden, so sprechen wir von reellwer-
tigen Funktionen. Reellwertige Funktionen auf der reellen Zahlengeraden mag
man sich auf viele verschiedene Arten vorstellen. Gleichzeitig diskutiere ich An-
schauungen für Abbildungen Rm → Rn .

1. In der Schule ist es üblich, eine Funktion f : R → R durch ihren Graphen


Γ(f ) = {(x, y) ∈ R2 | y = f (x)} zu veranschaulichen, also durch eine
Teilmenge der Ebene R2 .

2. In der Physik ist es üblich, sich eine Abbildung f : R → X, t 7→ f (t) von


R in irgendeine Menge X vorzustellen als ein Teilchen, das sich im Raum
X bewegt und sich zur Zeit t für lateinisch „tempus“ am Punkt f (t) befin-
det. Im Fall X = R hätten wir uns also ein Teilchen vorzustellen, das sich
auf der Zahlengerade bewegt. Im Fall X = R2 beziehungsweise X = R3
können wir uns ein Teilchen vorzustellen, das sich auf der Koordinatenebe-
ne beziehungsweise im dreidimensionalen Raum bewegt.

3. Eine reellwertige Funktion X → R auf einer beliebigen Menge kann man


sich als eine Temperaturverteilung auf besagter Menge vorstellen, im Fall
X = R also als eine Temperaturverteilung auf der reellen Zahlengeraden,
im Fall X = R2 beziehungsweise X = R3 als Temperaturverteilung auf der
Ebene beziehungsweise im Raum.

4. In der Mathematik ist es auch nützlich, sich eine Funktion f : R → R


wirklich als Abbildung der Zahlengerade auf sich selber vorzustellen. Als
Beispiel betrachten wir den Absolutbetrag, der als Abbildung aufgefaßt den
negativen Teil der Zahlengerade auf den positiven Teil herüberklappt. Eben-
so mag man sich eine Abbildung f : R2 → R3 vorstellen als eine Beschrei-
bung für das Aufspannen eines Gummituchs im Raum.

5. Im Fall m + n ≤ 3 kann man sich eine Abbildung Rm → Rn auch noch


durch ihren Graphen vorstellen. Im Fall m = 2 wäre der Graph eine hüge-
lige Landschaft, jedem Punkt der Ebene wird die dortige Höhe zugeordnet.
Im Fall m = 1 wäre der Graph eher eine Art Draht im Raum, zum Beispiel
ist der Graph von t 7→ (sin t, cos t) ein Draht, der als Spirale um die t-Achse
liegt.

64
Vier verschiedene Anschauungen für eine reellwertige Funktion einer reellen
Veränderlichen am Beispiel des Absolutbetrags x 7→ |x|

65
3.1.2. Bereits beliebige Abbildungen R → R können „wild aussehen“. Man den-
ke etwa an die Abbildung, die jeder rationalen Zahl den Betrag ihres Nenners nach
vollständigem Kürzen zuordnet und jeder irrationalen Zahl ihre fünfte Nachkom-
mastelle. Wir führen nun die „stetigen Funktionen“ ein und zeigen insbesondere,
daß für stetige auf einem Intervall definierte und injektive Funktionen auch ihr
Bild ein Intervall ist und die Umkehrfunktion stetig. Das liefert uns viele Funk-
tionen als Umkehrfunktionen bereits bekannter Funktionen. In der schmutzigen
Anschauung ist eine reellwertige Funktion auf einem reellen Intervall stetig, wenn
man „ihren Graphen zeichnen kann ohne den Stift abzusetzen“. Diese Anschau-
ung werden wir im Folgenden präzisieren.
3.1.3. Die mit dieser Materie bereits Vertrauten seien vorgewarnt, daß ich im fol-
genden bei der Behandlung von Grenzwerten und Stetigkeit einen eher ungewöhn-
lichen Ansatz verfolge. Am Anfang steht der Begriff einer Intervallumgebung ei-
nes Punktes in den erweiterten reellen Zahlen R̄ := R t {∞, −∞} und allgemei-
ner eines Quaders um einen Punkt in R̄n . Danach erklären wir, wann eine Abbil-
dung von einer Teilmenge D ⊂ R̄m nach R̄n stetig ist bei einem Punkt p ∈ D und
besprechen die Stetigkeit der Verknüpfung stetiger Abbildungen. Die Betrachtung
mehrerer Variablen scheint mir didaktisch vorteilhaft, weil sie ausdrucksstärkere
graphische Illustrationen erlaubt und darin Aussagen wie die Stetigkeit der Addi-
tion und Multiplikation R2 → R formuliert und bewiesen werden können. Danach
erst erklären wir den Grenzwert einer Funktion als den „Funktionswert der ein-
deutigen stetigen Fortsetzung“ und den Grenzwert einer Folge als den Spezialfall
des Grenzwerts einer auf N definierten Funktion. Dieses Vorgehen steht im Kon-
trast zu der übliche Vorgehensweise, bei der man mit Grenzwerten von Folgen
beginnt, bevor man von dort ausgehend zur Stetigkeit von Funktionen und ihren
Grenzwerten kommt.

3.2 Intervalle und Stetigkeit


Definition 3.2.1. Eine Teilmenge einer teilgeordneten Menge heißt ein Intervall,
wenn mit zwei beliebigen Punkten auch jeder Punkt dazwischen zu unserer Teil-
menge gehört. Ist in Formeln (X, ≤) eine teilgeordnete Menge, so heißt demnach
eine Teilmenge I ⊂ X ein Intervall oder noch präziser ein Intervall in X, wenn
für x, y, z ∈ X mit x < y < z aus x, z ∈ I folgt y ∈ I.
Definition 3.2.2. Wir erweitern die reellen Zahlen durch zwei zusätzliche Punkte
−∞ und ∞ zu der in offensichtlicher Weise angeordneten Menge der erweiterten
reellen Zahlen
R̄ := R ∪ {−∞, ∞}
3.2.3 (Reelle Intervalle). Jede Teilmenge von R̄ besitzt in R̄ ein Supremum und
ein Infimum. Wir kürzen im folgenden meist supR̄ = sup und inf R̄ = inf ab. Für

66
ein Intervall I ⊂ R̄ mit Supremum a = sup I und Infimum b = inf I gibt es die
Alternativen a ∈ I oder a 6∈ I und b ∈ I oder b 6∈ I. Es gibt damit vier Typen von
Intervallen in R̄, für die die beiden folgenden Notationen gebräuchlich sind:
[a, b] = [a, b] = {x ∈ R̄ | a ≤ x ≤ b}
]a, b[ = (a, b) = {x ∈ R̄ | a < x < b}
[a, b[ = [a, b) = {x ∈ R̄ | a ≤ x < b}
]a, b] = (a, b] = {x ∈ R̄ | a < x ≤ b}
Wählen wir hier a, b ∈ R̄ beliebig mit a < b, so erhalten wir genau alle Intervalle
in R̄ mit mehr als einem Element, die mehrpunktigen Intervalle. Wir benutzen
die eben erklärten Notationen jedoch auch im Fall a ≥ b, sie bezeichnen dann
manchmal eine einpunktige Menge und meist die leere Menge. Ein Intervall in R
nennen wir ein reelles Intervall.
3.2.4 (Diskussion der Notation). Ich hoffe, daß der Leser aus dem Kontext er-
schließen kann, wann mit (a, b) ein Intervall gemeint ist und wann ein Paar aus
R2 . Sind a und b konkrete Zahlen, etwa a = 1 und b = 27, so wäre zu allem
Überfluß auch noch eine dritte Lesart von (1, 27) als die in Klammern notierte
Dezimalzahl 1,27 denkbar. Ich hoffe, daß der Leser aus dem Kontext erschließen
kann, was jeweils gemeint ist. Wenn man genau hinguckt, sollte auch im letzteren
Fall der Abstand nach dem Komma etwas kleiner sein.
3.2.5. Ein Intervall in R̄ heißt kompakt, wenn es eines unserer Intervalle [a, b]
ist. Der Begriff „kompakt“ wird in 5.1.1 auf beliebige Teilmengen von R̄ verall-
gemeinert.
3.2.6. Ein reelles Intervall heißt offen, wenn es eines unserer Intervalle (a, b) ist.
Der Begriff „offen“ wird in 5.5.1 auf beliebige Teilmengen von R verallgemeinert.
Definition 3.2.7. Gegeben ein Punkt p ∈ R̄ verstehen wir unter einer Intervall-
umgebung von p ein Intervall I ⊂ R̄ mit p ∈ I, das auch einen Punkt β > p
enthält, falls es einen solchen Punkt in R̄ gibt, sowie einen Punkt α < p, falls es
einen solchen Punkt in R̄ gibt.
Beispiel 3.2.8. Intervallumgebungen von p ∈ R sind alle Intervalle der Gestalt
[a, b], (a, b], [a, b), (a, b) mit a < p < b und a, b ∈ R̄.
Beispiel 3.2.9. Intervallumgebungen von ∞ sind alle Intervalle der Gestalt [a, ∞]
oder (a, ∞] mit a ∈ R̄ und a < ∞.
Beispiel 3.2.10. Intervallumgebungen von −∞ sind alle Intervalle der Gestalt
[−∞, b] oder [−∞, b) mit b ∈ R̄ und −∞ < b.
Definition 3.2.11. Gegeben ein Punkt p = (p1 , . . . , pn ) ∈ R̄n verstehen wir unter
einer Quaderumgebung von p oder kurz einem Quader um p eine Teilmenge
Q ⊂ R̄n der Gestalt Q = I1 × . . . × In mit Iν jeweils einer Intervallumgebung
von pν .

67
Definition 3.2.12. Eine Abbildung f : R̄m → R̄n heißt stetig an einer Stelle
p ∈ R̄m , wenn es für jeden Quader Q um f (p) einen Quader Q0 um p gibt mit
f (Q0 ) ⊂ Q.
3.2.13. Ein Datum bestehend aus einer Menge X, einer Teilmenge D ⊂ X und
einer Abbildung f : D → Y in eine weitere Menge Y notieren wir im folgenden
abkürzend
f :X⊃D→Y
Definition 3.2.14. Eine Abbildung f : R̄m ⊃ D → R̄n heißt stetig an einer Stel-
le p ∈ D, wenn es für jeden Quader Q um f (p) einen Quader Q0 um p gibt mit
f (Q0 ∩ D) ⊂ Q. Eine Abbildung, die stetig ist an jeder Stelle ihres Definitionsbe-
reichs, heißt stetig.
3.2.15. Auf Englisch sagt man für stetig continuous, auf Französisch continue.
Beispiel 3.2.16 (Aufschneiden der Ebene). Die Abbildung f : R2 → R2 gege-
ben durch (x, y) 7→ (x, y) für x < 0 und (x, y) 7→ (x + 1, y) für x ≥ 0 bedeutet
anschaulich, daß wir die Ebene längs der y-Achse aufschneiden und den rechten
Teil, dem wir auch die y-Achse selbst zuschlagen, um Eins nach rechts schieben.
Sie ist nicht stetig an allen Punkten der y-Achse, ist jedoch stetig an allen Punk-
ten außerhalb der y-Achse. An dieser Stelle möge als Argumentation ein Bild
genügen.
Beispiel 3.2.17 (Stetigkeit konstanter Funktionen). Konstante Abbildungen c :
R̄m ⊃ D → R̄n sind stetig. In diesem Fall gilt für jeden Quader Q um c(p) und
jeden beliebigen Quader Q0 um p bereits c(Q0 ∩ D) ⊂ Q.
Beispiel 3.2.18 (Stetigkeit von Einbettungen). Eine beliebige Einbettungsabbil-
dung i : R̄m ⊃ D → R̄m gegeben durch x 7→ x ist stetig. In diesem Fall ist
für jeden Quader Q um p = i(p) bereits Q0 := Q selbst ein Quader um p mit
i(Q0 ∩ D) ⊂ Q.
3.2.19. Gegeben x = (x1 , . . . , xn ) ∈ Rn erklären wir |x| := max{|x1 |, . . . , |xn |}
als das Maximum der Absolutbeträge der Koordinaten von x. Gegeben p ∈ Rn
und ε > 0 erklären wir den ε-Quader um p durch die Vorschrift
B(p; ε) := {x ∈ Rn | |p − x| < ε}
Die Notation B für unseren Quader bedeutet „Ball“ und ist die übliche Bezeich-
nung für dieses Konzept im Kontext allgemeiner „metrischer Räume“.
3.2.20. Offensichtlich sind für p ∈ Rn die ε-Quader um p auch Quader um p.
Offensichtlich umfäßt weiter jeder Quader um p ∈ Rn für hinreichend kleines
ε > 0 den ε-Quader um p. Wenn „nirgends ±∞ vorkommt“, können wir die
Stetigkeit auch mit diesen speziellen Quadern charakterisieren, wie im folgenden
Lemma ausgeführt wird.

68
Lemma 3.2.21 (ε-δ-Kriterium für Stetigkeit). Seien f : Rm ⊃ D → Rn eine
Abbildung und p ∈ D ein Punkt. Genau dann ist f stetig bei p, wenn es für jedes
ε > 0 ein δ = δ(ε) > 0 gibt derart, daß für alle x ∈ D mit |x − p| < δ gilt
|f (x) − f (p)| < ε.

Beweis. Ist f stetig bei p, so gibt es insbesondere für jedes ε > 0 und den Quader
Q := B(f (p), ε) um f (p) einen Quader Q0 um p mit f (Q0 ∩ D) ⊂ Q. Für diesen
Quader Q0 hinwiederum gibt es δ > 0 mit B(p, δ) ⊂ Q0 und dann gilt a forteriori
f (B(p, δ) ∩ D) ⊂ B(f (p), ε) = Q alias

(|x − p| < δ) ⇒ (|f (x) − f (p)| < ε)

Ist umgekehrt das ε-δ-Kriterium erfüllt und ist Q ein Quader um f (p), so wählen
wir ein ε > 0 mit B(f (p), ε) ⊂ Q und finden dazu ein δ > 0 mit f (B(p, δ)∩D) ⊂
B(f (p), ε) und dann ist Q0 := B(p, δ) ein Quader um p mit f (Q0 ∩ D) ⊂ Q und
f ist stetig bei p.
3.2.22 (Konventionen zu ε). Wenn Sie in der Analysis die Formulierung „für
alle ε > 0 gilt was auch immer“ antreffen, so dürfen Sie erwarten, daß dieses
„was auch immer“, wenn es denn für ein gegebenes ε > 0 gilt, für alle größe-
ren ε > 0 erst recht gilt. Salopp gesprochen besteht also die unausgesprochene
Übereinkunft, durch die Verwendung des Buchstabens ε das anzudeuten, was man
umgangsprachlich vielleicht mit „für jedes auch noch so kleine ε > 0“ ausdrücken
würde. Sie müssen nur einmal versuchen, beim Vorrechnen einer Übungsaufga-
be statt ε den Buchstaben M zu verwenden: Auch wenn formal alles richtig sein
sollte, wird Ihr Tutor deutlich länger darüber nachdenken müssen, ob Ihre For-
mulierung auch wirklich stimmt. „Sei ε < 0“ schließlich ist ein mathematischer
Witz.
3.2.23. Wenn wir den Beweis des ε-δ-Kriteriums nocheinmal durchgehen, stellen
wir fest, daß dabei nur zwei Eigenschaften unserer ε-Quader B(p, ε) eine Rolle
spielen: Zum ersten, daß jeder ε-Quader B(p, ε) um p einen Quader um p umfaßt,
etwa sich selber, und zum zweiten, daß jeder Quader Q um p ∈ Rn einen ε-
Quader B(p, ε) um p umfaßt, für geeignetes ε > 0. Gegeben p ∈ R̄n nennt man
allgemeiner U ⊂ R̄n eine Umgebung von p, wenn es einen Quader Q um p gibt
mit p ∈ Q ⊂ U , und erhält in derselben Weise ein weiteres Stetigkeitskriterium,
das weniger eckig daherkommt.

Lemma 3.2.24 (Umgebungskriterium für Stetigkeit). Seien f : R̄m ⊃ D → R̄n


eine Abbildung und p ∈ D ein Punkt. Genau dann ist f stetig bei p, wenn es für
jede Umgebung U von f (p) eine Umgebung U 0 von p gibt mit f (U 0 ∩ D) ⊂ U .

Beweis. Analog zum Beweis von 3.2.21 und dem Leser überlassen.

69
Beispiel 3.2.25 (Stetigkeit des Absolutbetrags). Der Absolutbetrag abs : R →
R, x 7→ |x| ist stetig. In der Tat gilt in diesem Fall an jeder Stelle p das ε-δ-
Kriterium mit δ = ε, denn aus |x − p| < ε folgt ||x| − |p|| < ε. Sogar die
Fortsetzung des Absolutbetrags zu abs : R̄ → R̄ durch |−∞| = |∞| = ∞ ist
stetig, wie der Leser zur Übung selbst zeigen mag.
3.2.26. Ich will versuchen, an der Tafel einem Farbencode zu folgen, nach dem
vorgegebene Umgebungen von Grenzwerten und dergleichen in gelber Farbe dar-
gestellt werden, dazu zu findende N und dergleichen dahingegen in blauer Farbe.
Rote Farbe ist an grünen Tafeln für nicht wenige Menschen schwer zu lesen.
Beispiel 3.2.27 (Stetigkeit der Addition). Die Addition ist eine stetige Abbildung
add : R2 → R, (x, y) 7→ x + y. Um das zu sehen, müssen wir zeigen, daß sie
stetig ist an jedem Punkt p := (a, b) ∈ R2 . Für alle ε > 0 gilt aber offensichtlich

add(B(p; ε/2)) ⊂ B(add(p); ε)

Also ist an jeder Stelle p = (a, b) das ε-δ-Kriterium erfüllt mit δ = ε/2.
Beispiel 3.2.28 (Stetigkeit der Multiplikation). Die Multiplikation ist eine ste-
tige Abbildung mult : R2 → R, (x, y) 7→ xy. Um das zu sehen, müssen wir
zeigen, daß sie stetig ist an jedem Punkt p := (a, b) ∈ R2 . Wir überlegen uns dazu
zunächst die Abschätzung

|xy − ab| = |(x − a)y + a(y − b)|


≤ |x − aky| + |aky − b|

Aus den beiden Ungleichungen |x − a| < η und |y − b| < η folgt zunächst


|y| < |b| + η und dann

|xy − ab| ≤ η(|b| + η + |a|)

Für jedes ε > 0 gibt es also ein δ > 0, nämlich δ = ε/(|b| + 1 + |a|), mit

mult(B(p; δ)) ⊂ B(mult(p); ε)

Mithin ist das ε-δ-Kriterium erfüllt an jeder Stelle p = (a, b). Man beachte, daß
im Gegensatz zur Addition unser δ hier nicht nur von ε abhängt, sondern auch von
der auf Stetigkeit untersuchten Stelle p.
Beispiel 3.2.29 (Stetigkeit von Projektionen). Die Projektionen prν : R̄n → R̄
gegeben durch x = (x1 , . . . , xn ) 7→ xν sind stetig. Der Einfachkeit der Notation
halber zeigen wir das nur für ν = 1. Ist aber Q ein Quader um p1 = pr1 (p)
alias eine Intervallumgebung von p1 , so ist Q0 := Q × R̄n−1 ein Quader um p mit
pr1 (Q0 ) ⊂ Q.

70
Satz 3.2.30 (Stetigkeit der Verknüpfung stetiger Abbildungen). Seien Abbil-
dungen f : R̄m ⊃ D → R̄n und g : R̄n ⊃ E → R̄l gegeben und es gel-
te f (D) ⊂ E. Ist f stetig bei p ∈ D und g stetig bei f (p) ∈ E, so ist auch
g ◦ f : R̄m ⊃ D → R̄l , x 7→ g(f (x)) stetig bei p.

3.2.31. Genau genommen ist die Notation g ◦ f in der Formulierung von Satz
3.2.30 im Sinne von 1.4.9 nicht ganz korrekt: Wir müßten eigentlich erst eine
Abbildung f˜ : D → E definieren durch f˜(x) = f (x) für alle x ∈ D und dann
die Abbildung g ◦ f˜ betrachten. Das scheint mir jedoch ein Fall, in dem größere
Präzision nicht zu größerer Verständlichkeit führt.
Beweis. Da g stetig ist bei f (p), finden wir für jeden Quader Q um g(f (p)) einen
Quader Q0 um f (p) mit g(Q0 ∩ E) ⊂ Q. Da f stetig ist bei p, finden wir für
diesen Quader Q0 von f (p) einen Quader Q00 um p mit f (Q00 ∩ D) ⊂ Q0 . Damit
finden wir in der Tat für jeden Quader Q um (g ◦ f )(p) einen Quader Q00 um p mit
(g ◦ f )(Q00 ∩ D) ⊂ Q.
Variante zum Beweis. Idem mit Umgebungen statt Quadern und dem Umgebungs-
kriterium für Stetigkeit 3.2.24.
3.2.32 (Schnitte von Umgebungen). Offensichtlich ist der Schnitt von zwei Inter-
vallumgebungen von p ∈ R̄ wieder eine Intervallumgebung von p. Offensichtlich
ist allgemeiner der Schnitt von zwei Quadern um p ∈ R̄n wieder ein Quader um p.
Offensichtlich ist folglich der Schnitt von zwei Umgebungen von p ∈ R̄n wieder
eine Umgebung von p.

Satz 3.2.33 (Stetigkeit als komponentenweise Stetigkeit). Eine vorgegebene


Abbildung f : R̄m ⊃ D → R̄n ist stetig bei p genau dann, wenn alle ihre Kompo-
nenten fν := prν ◦f : R̄m ⊃ D → R̄ stetig sind bei p für 1 ≤ ν ≤ n.

Beweis. Ist die Abbildung f stetig bei p, so auch alle prν ◦f als die Verküpfung
der bei p stetigen Funktion f mit der nach 3.2.29 überall stetigen Projektion prν .
Seien umgekehrt alle fν stetig bei p und sei Q ein Quader um f (p). Per definitio-
nem finden wir Intervallumgebungen Iν von fν (p) mit I1 ×. . .×In = Q. Da wir fν
stetig bei p annehmen, gibt es jeweils einen Quader Q0ν um p mit fν (Q0ν ∩D) ⊂ Iν .
Dann ist Q0 := Q01 ∩ . . . ∩ Q0n nach 3.2.32 wieder ein Quader um p und offensicht-
lich gilt f (Q0 ) ⊂ Q.

Korollar 3.2.34 (Summe und Produkt stetiger Funktionen sind stetig). Seien
Funktionen f, g : R̄m ⊃ D → R stetig bei p ∈ D. So sind auch die Funktionen
f + g : x 7→ f (x) + g(x) und f g : x 7→ f (x)g(x) stetig bei p.

71
Beweis. Wir schreiben f + g = add ◦(f, g) und f g = mult ◦(f, g) für (f, g) :
R̄m ⊃ D → R2 gegeben durch (f, g) : x 7→ (f (x), g(x)). Nun ist (f, g) stetig
bei p nach 3.2.33, denn seine Komponenten f, g sind stetig bei p nach Annah-
me. Weiter sind Addition und Multiplikation stetig nach 3.2.27, 3.2.28. Also sind
auch f + g = add ◦(f, g) und f g = mult ◦(f, g) stetig bei p nach 3.2.30 als
Verknüpfungen stetiger Abbildungen.
Beispiel 3.2.35 (Stetigkeit von Polynomfunktionen). Eine Abbildung f : R →
R, die gegeben wird durch eine Abbildungsvorschrift der Gestalt x 7→ an xn +
. . . + a1 x + a0 mit konstanten aν ∈ R, heißt eine Polynomfunktion. Jede Po-
lynomfunktion ist stetig, denn konstante Funktionen sind stetig nach 3.2.17, die
identische Funktion x 7→ x ist stetig nach 3.2.18 und Produkte sowie Summen
stetiger Funktionen sind stetig nach 3.2.34.
Vorschau 3.2.36. Jede Familie reeller Zahlen (an )n∈N , in der höchstens endlich
n
P
viele an von Null verschieden sind, liefert eine Polynomfunktion an x . Nach
Übung 3.5.53 oder allgemeiner [LA1] 5.4.3 liefern verschiedene Familien auch
stets verschiedene Funktionen. Im Licht dieser Tatsache werden wir unsere Po-
lynomfunktionen meist kürzer Polynome nennen, obwohl eigentlich der Begriff
Polynom eher den formalen Ausdruck meint. Diese Unterscheidung ist aber erst
in der Algebra wirklich von Belang. Wenn man nämlich mit endlichen Körpern ar-
beitet, so können verschiedene formale Ausdrücke an xn + . . . + a1 x + a0 durchaus
dieselbe Funktion liefern, vergleiche [LA1] 5.3.2.
3.2.37 (Diskussion der Terminologie). Das Wort „Polynom“ kommt von der
griechischen Vorsilbe „poly“ für „viele“ und dem lateinischen Wort „nomen“ für
„Namen“. Allgemeiner betrachtet man auch Polynome in mehreren Veränderli-
chen und meint damit Ausdrücke wie etwa xyz + 7x2 y 4 − 12z + 1. Dieses Poly-
nom ist die Summe der vier Monome xyz, 7x2 y 4 , −12z und 1, wobei das Wort
„Monom“ diesmal mit der griechischen Vorsilbe „mono“ für „allein“ gebildet ist.
Einen Ausdruck wie xyz + 7x2 y 4 würde man als Binom bezeichnen, diesmal mit
der griechischen Vorsilbe „bi“ für „Zwei“. Ein anderes Binom wäre der Ausdruck
(x + y), dessen Potenzen die „binomische“ Formel [EIN] 1.1.23 explizit angibt.
Es sollte klar sein, wie man aus unserer binomischen Formel auch Formeln für die
Potenzen eines beliebigen Binoms erhält.
Beispiel 3.2.38 (Stetigkeit von Einschränkungen). Ist f : R̄m ⊃ E → R̄n stetig
bei p ∈ E und D ⊂ E eine Teilmenge mit p ∈ D, so ist auch die Einschränkung
f |D : D → R̄n stetig bei p. Das folgt sofort aus der Definition oder alternativ
daraus, daß Einbettungen stetig sind nach 3.2.18 und die Verknüpfung stetiger
Abbildungen stetig nach 3.2.30.
Satz 3.2.39 (Stetigkeit ist eine lokale Eigenschaft). Seien f : R̄m ⊃ D → R̄n
eine Abbildung und p ∈ D ein Punkt. Gibt es eine Umgebung V von p derart, daß

72
die Einschränkung f : V ∩ D → R̄n stetig ist bei p, so ist auch f : D → R̄n
bereits stetig bei p.

Beweis. Gegeben ein Quader Q um f (p) finden wegen der Stetigkeit der Ein-
schränkung einen Quader Q01 um p mit f (Q01 ∩ V ∩ D) ⊂ Q. Da V eine Umge-
bung von p ist, finden wir weiter einen Quader Q02 um p mit Q02 ⊂ V . Ihr Schnitt
Q0 := Q01 ∩ Q02 ist dann der gesuchte Quader um p mit f (Q0 ∩ D) ⊂ Q.
Variante zum Beweis. Statt der Definition verwenden wir das Umgebungskriteri-
um für Stetigkeit 3.2.24. Gegeben eine Umgebung U von f (p) finden wegen der
Stetigkeit der Einschränkung eine Umgebung U 0 von p mit f (U 0 ∩ (V ∩ D)) ⊂ Q.
Dann ist U 0 ∩ V die gesuchte Umgebung von p mit f ((U 0 ∩ V ) ∩ D) ⊂ Q.
3.2.40 (Partiell stetig impliziert nicht stetig). Es gibt Funktionen f : R2 → R
derart, daß sowohl x 7→ f (x, b) als auch y 7→ f (a, y) stetig sind für alle b be-
ziehungsweise alle a, daß aber dennoch die Funktion f selbst nicht stetig ist. Als
Beispiel betrachte man die Funktion mit (x, y) 7→ xy/(x2 + y 2 ) für (x, y) 6= (0, 0)
und (0, 0) 7→ 0. Sie ist nicht stetig am Nullpunkt nach dem anschließenden Satz
3.2.30, da nämlich ihre Verknüpfung mit R → R2 , t 7→ (t, t) nicht stetig ist bei
t = 0. Die Stetigkeit von t 7→ (t, t) hinwiederum mag man aus der Komponen-
tenregel 3.2.33 folgern. Der Anschauung mag die Erkenntnis helfen, daß unsere
merkwürdige Funktion, wenn man vom Ursprung selbst einmal absieht, auf allen
Geraden durch den Ursprung konstant ist. Auf den beiden Koordinatenachsen ist
unsere Funktion konstant Null, auf allen anderen Geraden durch den Ursprung je-
doch nimmt sie nur am Ursprung den Wert Null an und sonst konstant einen von
Null verschiedenen Wert.

Übungen
Übung 3.2.41. In einer teilgeordneten Menge ist jeder Schnitt von Intervallen wie-
der ein Intervall.
Ergänzende Übung 3.2.42. Jede Teilmenge Y einer angeordneten Menge X ist
die disjunkte Vereinigung aller maximalen in Y enthaltenen nichtleeren Intervalle
von X. Hinweis: Hat ein System von Intervallen von X nichtleeren Schnitt, so ist
auch seine Vereinigung wieder ein Intervall von X.
Übung 3.2.43 (Eine nur im Ursprung stetige Funktion). Die Funktion f : R →
R mit f (x) = x für x ∈ Q und f (x) = 0 für x 6∈ Q ist nur an der Stelle p = 0
stetig.
Übung 3.2.44 (Addition und Multiplikation im Unendlichen). Addition und
Multiplikation lassen sich auf genau eine Weise fortsetzen zu stetigen Abbildun-

73
gen
add : R̄2 \{(∞, −∞), (−∞, ∞)} → R̄
mult : R̄2 \{(±∞, 0), (0, ±∞)} → R̄
und zwar durch
a+∞=∞+a=∞ falls a 6= −∞;
a + (−∞) = (−∞) + a = −∞ falls a 6= ∞;
a·∞=∞·a=∞ falls a > 0;
a · ∞ = ∞ · a = −∞ falls a < 0;
a · (−∞) = (−∞) · a = −∞ falls a > 0;
a · (−∞) = (−∞) · a = ∞ falls a < 0.
Sie lassen sich nicht weiter stetig fortsetzen auf die oben ausgeschlossenen Punkte
(∞, −∞), (−∞, ∞) für die Addition beziehungsweise (±∞, 0), (0, ±∞) für die
Multiplikation.
Übung 3.2.45. Gegeben f : R̄ ⊃ D → R̄ stetig bei p ∈ D und g : R̄ ⊃ E → R̄
stetig bei q ∈ E ist f × g : D × E → R̄2 stetig bei (p, q).
Übung 3.2.46 (Stetigkeit durch Einquetschen). Gegeben f, g, h : R̄m ⊃ D → R̄
mit f (x) ≤ g(x) ≤ h(x) ∀x ∈ D und f, h stetig bei p ∈ D mit f (p) = h(p) ist
auch g stetig bei p.
Übung 3.2.47 (Stetigkeit durch Verkleben). Seien I, J ⊂ R̄ Intervalle mit nicht-
leerem Schnitt I ∩ J 6= ∅ und sei f : (I ∪ J) → R̄ eine Funktion. Man zeige: Sind
die Einschränkungen f |I und f |J stetig, so ist auch f selbst stetig. Im übrigen
wird sich der „schwierige“ Fall dieser Übung als Spezialfall von [AN2] 1.5.12
erweisen.
Übung 3.2.48. Man zeige, daß auf einem offenen reellen Intervall I jede konvexe
reelle Funktion stetig ist. Hinweis: Die graphische Darstellung zum Beweis von
5.5.15 mag helfen. Eine Funktion heißt konvex, wenn für alle x, z ∈ I gilt
f (tx + (1 − t)z) ≤ tf (x) + (1 − t)f (z) ∀t ∈ [0, 1]
Anschaulich bedeutet das, daß unsere Funktion „unter jeder ihrer Sekanten liegt“.
Die Stetigkeit durch Einquetschen 3.2.46 mag helfen.

3.3 Zwischenwertsatz und Umkehrfunktionen


Definition 3.3.1. Eine Abbildung f zwischen teilgeordneten Mengen heißt
monoton wachsend, wenn gilt x≤y ⇒ f (x) ≤ f (y)
streng monoton wachsend, wenn gilt x<y ⇒ f (x) < f (y)
monoton fallend, wenn gilt x≤y ⇒ f (x) ≥ f (y)
streng monoton fallend, wenn gilt x<y ⇒ f (x) > f (y)

74
Illustration zum Zwischenwertsatz. Im vorliegenden Fall wir der gegebene
Zwischenwert z sogar dreimal als Funktionswert angenommen. Unser erster
Beweis führt stets zum hier eingezeichneten größten p ∈ [a, b], an dem z als
Funktionswert angenommen wird.

75
Eine Abbildung heißt monoton, wenn sie monoton wachsend oder fallend ist.
Eine Abbildung heißt streng monoton, wenn sie streng monoton wachsend oder
fallend ist.
Proposition 3.3.2 (Stetigkeit monotoner Surjektionen auf Intervalle). Es sei
f : R̄ ⊃ D → R̄ eine monotone Abbildung. Ist ihr Bild f (D) ein Intervall in R̄,
so ist f stetig.
Beweis. Sei ohne Beschränkung der Allgemeinheit f monoton wachsend. Gege-
ben p ∈ D gilt es, für jeden Quader Q um f (p) einen Quader Q0 um p zu finden
mit f (Q0 ∩ D) ⊂ Q. Wir setzen I := f (D) und unterscheiden vier Fälle.
1. Ist f (p) ∈ I weder das größte noch das kleinste Element von I, so umfaßt
jeder Quader Q um f (p) ein Intervall der Gestalt [α, β] mit α < f (p) < β
und α, β ∈ I, also α = f (a) und β = f (b) mit a, b ∈ D und a < p < b.
Dann können wir Q0 = [a, b] nehmen;

2. Ist f (p) ∈ I das größte aber nicht das kleinste Element von I, so umfaßt
jeder Quader Q um f (p) ein Intervall der Gestalt [α, f (p)] mit α < f (p) und
α ∈ I, also α = f (a) mit a ∈ D und a < p. Dann können wir Q0 = [a, ∞]
nehmen;

3. Ist f (p) ∈ I das kleinste aber nicht das größte Element von I, so argumen-
tieren wir analog;

4. Ist f (p) ∈ I das kleinste und das größte alias das einzige Element von I, so
ist f konstant und wir können Q0 = [−∞, ∞] nehmen.
Beispiel 3.3.3 (Stetigkeit des Invertierens). Die Funktion R× → R, x 7→ x1
ist stetig. In der Tat reicht es aufgrund der Lokalität der Stetigkeit 3.2.39 zu zei-
gen, daß ihre Einschränkung auf R>0 und auf R<0 jeweils stetig ist. Diese Ein-
schränkungen sind jedoch beide monoton und haben als Bildmenge jeweils ein
Intervall.
Beispiel 3.3.4 (Stetigkeit des erweiterten nichtnegativen Invertierens). Die Ab-
bildung
inv+ : [0, ∞] → [0, ∞]
gegeben durch x 7→ x1 für x ∈ (0, ∞) sowie 0 7→ ∞ und ∞ 7→ 0 ist stetig. In der
Tat ist diese Abbildung monoton und ihr Bild ist ein Intervall und die Behauptung
folgt aus der Stetigkeit monotoner Surjektionen auf Intervalle 3.3.2.
Korollar 3.3.5 (Quotienten stetiger Funktionen sind stetig). Gegeben stetige
Funktionen f, g : R̄m ⊃ D → R mit g(x) 6= 0 ∀x ∈ D ist auch die Funktion
f /g : D → R, x 7→ f (x)/g(x) stetig.

76
Beweis. Bezeichne i : R× → R die Funktion x 7→ 1/x. Sie ist stetig nach 3.3.3.
Also ist auch i ◦ g : D → R, x 7→ 1/g(x) stetig und dann auch das Produkt dieser
Funktion mit der stetigen Funktion f .
Beispiel 3.3.6. Die Funktion

x4 − 2x2 + 1
x 7→
x3 − 1
ist stetig auf D := R\1. Sie kann sogar zu einer stetigen Funktion auf ganz R
fortgesetzt werden, die gegeben wird durch die Abbildungsvorschrift

x3 + x2 − x − 1
x 7→
x2 + x + 1
3.3.7. Eine Funktion, die sich als der Quotient eines Polynoms durch ein von Null
verschiedenes Polynom darstellen läßt, heißt eine rationale Funktion. So eine
Funktion ist a priori natürlich nur da definiert, wo der Nenner nicht verschwindet,
und ist nach dem vorhergehenden Korollar auf dem Komplement der Nullstellen-
menge ihres Nenners stetig. Betrachten wir unsere rationale Funktion jedoch nicht
als Abbildung, sondern als formalen Ausdruck, so verstehen wir unter ihrem De-
finitionsbereich die etwas größere Menge, auf der „nach maximalem Kürzen“ der
Nenner keine Nullstellen hat, vergleiche [LA1] 5.5.7. Man beachte, daß die hier
gegebene etwas unscharfe Formulierung „nach maximalem Kürzen“ eigentlich
erst in [AL] 2.4.19 gerechtfertigt wird, wo wir die Eindeutigkeit der „Primfaktor-
zerlegung“ in Polynomringen diskutieren. Bleibt auch nach maximalem Kürzen
noch ein nichtkonstantes Polynom im Nenner stehen, so spricht man von einer
gebrochenrationalen Funktion.

Satz 3.3.8 (Zwischenwertsatz). Für a ≤ b aus R̄ nimmt eine stetige Funktion


f : [a, b] → R̄ jeden Wert zwischen f (a) und f (b) an.

3.3.9 (Die schmutzige Anschauung). Wenn man sich eine stetige reellwertige
Funktion auf einem reellen Intervall vorstellt als eine Funktion, deren Graphen
man zeichnen kann ohne den Bleistift abzusetzen, so ist auch der Zwischenwert-
satz anschaulich klar: Wenn unser Graph unter einer horizontalen Linie anfängt
und oberhalb aufhört oder umgekehrt, so muß er an irgendeiner Stelle unsere ho-
rizontale Linie kreuzen.
Beweis. Wir dürfen ohne Beschränkung der Allgemeinheit f (a) ≤ f (b) anneh-
men. Gegeben z ∈ [f (a), f (b)] suchen wir p ∈ [a, b] mit f (p) = z. Wir betrachten
dazu
p := sup{x ∈ [a, b] | f (x) ≤ z}

77
und behaupten f (p) = z. Um das zu zeigen führen wir die Annahmen f (p) < z
und z < f (p) beide zum Widerspruch. Aus f (p) < z folgte zunächst p < b,
und dann gäbe es aufgrund der Stetigkeit ein q mit p < q < b und f (q) ≤ z
und p wäre gar keine obere Schranke unserer Menge gewesen. Aus z < f (p)
dahingegen folgte zunächst a < p, und dann gäbe es aufgrund der Stetigkeit ein
r mit a < r < p und z < f (x) für alle x ∈ [r, p]. Also wäre auch r schon eine
obere Schranke unserer Menge und p könnte nicht ihre kleinste obere Schranke
gewesen sein.
Korollar 3.3.10 (Abstrakter Zwischenwertsatz). Das Bild eines Intervalls unter
einer stetigen Funktion ist ein Intervall. Ist also in Formeln I ⊂ R̄ ein Intervall
und f : I → R̄ stetig, so ist auch f (I) ein Intervall.
Beweis. Das ist nur eine Umformulierung des Zwischenwertsatzes 3.3.8.

Satz 3.3.11 (über die Umkehrfunktion). Ist I ⊂ R̄ ein Intervall und f : I → R̄


streng monoton und stetig, so ist auch f (I) ⊂ R̄ ein Intervall und die Umkehr-
funktion f −1 : f (I) → R̄ ist streng monoton und stetig.
3.3.12. Hier ist unsere Notation wieder nicht ganz korrekt: Wir müßten genau
genommen eigentlich die Bijektion f˜ : I → f (I), x 7→ f (x) betrachten, dazu die

inverse Abbildung f˜−1 : f (I) → I nehmen, und unser f −1 : f (I) → R̄ definieren


als die Verknüpfung von f˜−1 mit der Einbettung I ,→ R̄.


Beweis. Die Umkehrfunktion g := f −1 ist offensichtlich monoton und ihr Bild ist
ein Intervall, nämlich das Intervall I, also ist sie nach 3.3.2 stetig. Daß f (I) ein
Intervall ist, war die Aussage des abstrakten Zwischenwertsatzes 3.3.10.
3.3.13 (Diskussion der Notation). Die Umkehrfunktion f −1 darf nicht verwech-
selt werden mit der Funktion x 7→ 1/f (x) : Ist zum Beispiel q : (0, ∞) → R
gegeben durch q(x) = x2 , so haben wir 1/q(x) = x−2 , aber die Umkehrabbil-

dung ist gegeben durch die Funktion q −1 (y) = y, die Sie aus der Schule kennen
und die wir im Anschluß auf ganz [0, ∞) einführen. Die Notation ist hier leider
nicht ganz eindeutig. Oft muß man aus dem Kontext erschließen, ob mit f −1 die
Umkehrfunktion von f oder vielmehr die „Kehrwertfunktion“ x 7→ 1/f (x) ge-
meint ist.
3.3.14 (Potenz- und Wurzelfunktionen). Gegeben n ∈ N≥1 ist die n-te Potenz-
funktion x 7→ xn auf [0, ∞) nach 3.2.35 stetig und nach [Link] streng monoton
wachsend. Ihr Bild ist nach dem Zwischenwertsatz 3.3.10 ein Intervall und da für
a ≥ 1 gilt an ≥ a und andererseits 0n = 0 muß dies Intervall wieder [0, ∞) sein.
Wir definieren die n-te Wurzel
√n : [0, ∞) → R

78
Illustration zur Stetigkeit in mehreren Veränderlichen. Dargestellt ist ein
Geradenstück D in der Ebene nebst einer Abbildung f : D → R2 , die es in die
Ebene abbildet und es dabei an einer Stelle p ∈ D zerreißt. Dargestellt ist weiter
eine Umgebung U von f (p), für die es keine Umgebung U 0 von p gibt mit
f (U 0 ) ⊂ U , so daß in der Tat f an dieser Aufreißstelle p nicht stetig ist.

79
als die Umkehrfunktion zur n-ten Potenzfunktion
√ x 7→ xn . Nach dem Satz über
die Umkehrfunktion
√ √ 3.3.11 ist x 7→ x stetig. Im Fall n = 2 verwendet man die
n

Abkürzung x := x. 2

3.3.15 (Potenz- und Wurzelfunktionen im Unendlichen). Immer noch für n ∈


N≥1 ist auch die Fortsetzung der n-ten Potenz durch ∞ 7→ ∞ zu einer Abbildung
potn : [0, ∞] → [0, ∞] stetig, da sie monoton und surjektiv ist. Die n-te Wurzel
besitzt mithin auch eine stetige streng monotone Fortsetzung durch ∞ 7→ ∞ zu
wurzn : [0, ∞] → [0, ∞].

Beispiel 3.3.16. Die Abbildungsvorschrift x 7→ x4 + 5 liefert eine stetige Ab-
bildung R → R.
Ergänzung 3.3.17. Alle Definitionen und Ergebnisse dieses Abschnitts, die nicht
Summen oder Produkte verwenden, bleiben gültig und sinnvoll, wenn wir R̄ durch
eine allgemeinere angeordnete Menge ersetzen derart, daß zwischen je zwei ver-
schiedenen Punkten stets noch ein weiterer Punkt liegt und daß jede nach oben
beziehungsweise unten beschränkte Teilmenge in unserer Menge ein Supremum
und beziehungsweise Infimum besitzt.

Übungen
Übung 3.3.18. Man zeige, daß die Funktion {(x, y) ∈ R2 | y 6= 0} → R gegeben
durch (x, y) 7→ x/y stetig ist.
Übung 3.3.19. Man zeige, daß die Funktion R2 → R gegeben durch (x, y) 7→
(x2 y + xy 3 )/(x2 + y 2 + 1) stetig ist.
Ergänzende Übung 3.3.20. Seien a ≤ b aus R̄ gegeben und sei f : [a, b] → R
stetig mit f (b) = 0. Man zeige, daß dann f eine kleinste Nullstelle in [a, b] hat.
Übung 3.3.21. Jede Polynomfunktion x 7→ an xn + . . . + a0 mit an 6= 0 und n
ungerade besitzt mindestens eine reelle Nullstelle. Ist an > 0 und a0 > 0, so
besitzt sie sogar mindestens eine negative Nullstelle.
Übung 3.3.22. Gegeben ein Intervall I ⊂ R̄ ist jede injektive stetige Funktion
I → R̄ streng monoton.

3.4 Umfang des Einheitskreises


3.4.1. Bekanntlich bezeichnet π, ein kleines griechisches P für „Perimeter“, das
Verhältnis zwischen Umfang und Durchmesser eines Kreises. Um diese Anschau-
ung zu formalisieren zur Definition einer reellen Zahl im Sinne von 2.4.7 gehen
wir aus von der anschaulichen Bedeutung von π als Länge des Halbkreises H mit
Radius Eins
H := {(a, b) ∈ R2 | a2 + b2 = 1, b ≥ 0}

80
Seien x, y : R2 → R die beiden Abbildungen, die jedem Punkt der Ebene seine
erste beziehungsweise zweite Koordinate zuordnen, also v = (x(v), y(v)) ∀v ∈
R2 . Die Distanz d(v, w) ∈ R zwischen zwei Punkten v, w ∈ R2 der Ebene er-
klären wir in Erinnerung an den Satz des Pythagoras durch die Formel
p
d(v, w) := (x(v) − x(w))2 + (y(v) − y(w))2

Die Kreiszahl π ∈ R definieren wir dann als das Supremum über die „Längen
aller in unseren Halbkreis H einbeschriebenen Polygonzüge“, in Formeln
( n 
X n ∈ N, v0 , v1 , . . . , vn ∈ H,
π := sup d(vi−1 , vi )
x(v0 ) < x(v1 ) < . . . < x(vn )
i=1

Mithilfe der einfachen Abschätzung a2 + b2 ≤ |a| + |b| erkennt man, daß die
Zahl 4 eine obere Schranke ist für unsere Menge von Längen von Polygonzügen,
mithin haben wir hier in der Tat eine reelle Zahl π ∈ R definiert. Wir werden in
6.1.31 sehen, wie man diese Zahl im Prinzip bis zu einer beliebig vorgegebenen
Stelle nach dem Komma berechnen kann. Die Definition selbst ist elementar. Ich
habe sie nur deshalb nicht gleich im Zusammenhang mit der Definition der reellen
Zahlen gegeben, weil sie die Existenz reeller Quadratwurzeln von nichtnegativen
reellen Zahlen benötigt, die erst in 3.3.14 gezeigt wurde.
Ergänzung 3.4.2. Die Zahl π ist nicht rational, in Formeln π 6∈ Q, wie Lambert
bereits 1761 zeigen konnte. Anders ausgedrückt läßt sich π nicht durch einen peri-
odischen Dezimalbruch darstellen. Wir beweisen diese Tatsache in 5.8.12. Unsere
Kreiszahl π ist noch nicht einmal algebraisch, als da heißt Nullstelle eines nicht-
trivialen Polynoms mit rationalen Koeffizienten. Es gilt in anderen Worten keine
Gleichung der Gestalt

π n + qn−1 π n−1 + . . . + q1 π + q0 = 0 mit qn−1 , . . . , q0 ∈ Q und n ≥ 1.

Reelle Zahlen, die nicht algebraisch sind, heißen transzendent, lateinisch für
„überschreitend“, da ihre Behandlung „die Grenzen der Algebra überschreitet“.
Die Transzendenz von π wurde 1882 von Lindemann in Freiburg bewiesen. Sei-
ne Büste steht im vierten Stock des Mathematischen Instituts. Er war übrigends
Hilbert’s Doktorvater. Johann Heinrich Lambert alias Jean-Henri Lambert wur-
de 1728 als Sproß einer hugenottischen Familie in Mulhouse geboren, das zu der
Zeit mit den umgebenden Landstrichen als unabhängige Republik Mitglied der
Eidgenossenschaft war. Er veröffentlichte seine Arbeit zur Irrationalität von π auf
französisch in der „Histoire de l’Academie Royale des Sciences et Belles-Lettres“
in Berlin, wo er 1763 eine Anstellung an der preußischen Akademie der Wissen-
schaften erhielt.

81
Ein einbeschriebener Polygonzug

Diese Abbildung soll veranschaulichen, warum 4 eine obere Schranke für die
Längen einbeschriebener Polygonzüge ist: Die horizontalen Stücke und die
vertikalen Stücke haben jeweils zusammengenommen eine Gesamtlänge ≤ 2.

82
3.5 Grenzwerte
Definition 3.5.1. Seien C, D ⊂ R̄n Teilmengen.

1. Ein Punkt p ∈ D heiße ein Häufungspunkt von D, wenn jede Umgebung


von p in R̄n mindestens einen von p verschiedenen Punkt mit D gemeinsam
hat;

2. Ein Punkt p ∈ D heiße ein isolierter Punkt von D, wenn er kein Häufungs-
punkt von D ist. Gleichbedeutend ist die Bedingung, daß es eine Umgebung
V von p in R̄n gibt mit V ∩ D = {p}.

3. Ein Punkt p ∈ R̄n heiße ein Häufungspunkt zu C, wenn er ein Häufungs-


punkt von C ∪ {p} ist;

3.5.2. Ich verwende hier die Bezeichnungen p, C, D in der Weise, daß a priori
p ein Häufungspunkt von D und ein Häufungspunkt zu C ist, salopp gesprochen
D = C ∪{p}, so daß also p in D liegen muß und in C liegen darf. Je nach Kontext
ist die eine oder die andere Konvention geschickter.
3.5.3 (Diskussion der Terminologie). Die im vorhergehenden eingeführte Ter-
minologie der „Häufungspunkte von und zu“ ist ein Versuch, die sprachlichen
Schwierigkeiten zu vermeiden, die in der üblichen Terminologie dadurch ent-
stehen, daß ein Häufungspunkt einer Menge kein Punkt besagter Menge zu sein
braucht.
Beispiele 3.5.4. Die Menge Z der ganzen Zahlen besteht aus isolierten Punkten.
Die Menge Q der rationalen Zahlen besteht aus Häufungspunkten. Die Menge
N ∪ {∞} hat als einzigen Häufungspunkt den Punkt ∞. Daß dieser Punkt in der
Tat ein Häufungspunkt ist, folgt aus der Archimedizität des angeordneten Körpers
R der reellen Zahlen 2.4.9.
3.5.5 (Notation für Komplemente einpunktiger Teilmengen). Wir vereinbaren
für die Differenz einer Menge X und einer einpunktigen Menge {p} die abkürzen-
de Schreibweise X\p := X\{p}. Der Punkt p muß dabei nicht zu X gehören,
dann haben wir eben X\p = X.

Satz 3.5.6 (Eindeutigkeit stetiger Fortsetzungen in Häufungspunkten). Seien


D ⊂ R̄m eine Teilmenge, p ∈ D ein Häufungspunkt von D und f : D\p → R̄n
eine Abbildung. So gibt es höchstens eine Fortsetzung von f zu einer Abbildung
f : D → R̄n , die stetig ist bei p.

Beweis. Wären sonst f1 , f2 zwei stetige Fortsetzungen mit f1 (p) 6= f2 (p), so


fänden wir disjunkte Umgebungen U1 und U2 der beiden Punkte f1 (p) und f2 (p)

83
Der Grenzwert oder Limes einer Funktion mit einer „Fehlstelle“ in ihrem
Definitionsbereich ist, wenn er existiert, der Wert an der fraglichen Fehlstelle der
einzig möglichen dort stetigen Fortsetzung.

84
sowie Umgebungen U10 und U20 von p mit f1 (U10 ∩ D) ⊂ U1 und f2 (U20 ∩ D) ⊂ U2 .
Daraus folgte aber

f (U10 ∩ U20 ∩ D\p) ⊂ U1 ∩ U2 = ∅

im Widerspruch dazu, daß U10 ∩ U20 ∩ D nicht nur aus unserem Häufungspunkt p
bestehen kann, weil ja nach 3.2.32 auch U10 ∩ U20 eine Umgebung von p ist.

Definition 3.5.7. Seien C ⊂ R̄m eine Teilmenge, p ∈ R̄m ein Häufungspunkt zu


C und f : C\p → R̄n eine Funktion. Sei b ein weiterer Punkt aus R̄n . Wir sagen,
f (x) strebt gegen b für x → p und schreiben

lim f (x) = lim f (x) = b


C3x→p x→p

als Abkürzung für die Aussage, daß die Fortsetzung unserer Funktion f zu einer
Funktion f : C ∪{p} → R̄n durch f (p) := b stetig ist bei p. In diesem Fall nennen
wir b den Grenzwert oder lateinisierend Limes der Funktion f für x → p.

3.5.8 (Eindeutigkeit des Grenzwerts). Nach der Eindeutigkeit 3.5.6 stetiger Fort-
setzungen in Häufungspunkten folgt aus limx→p f (x) = a und limx→p f (x) = b
bereits a = b.
3.5.9. Salopp gesprochen verhält es sich demnach so, daß eine Funktion mit einer
einpunktigen Definitionslücke an einem Häufungspunkt ihres Definitionsbereichs
auf höchstens eine Weise stetig in diese Definitionslücke hinein fortgesetzt wer-
den kann. Der Wert dieser an besagter Stelle stetigen Fortsetzung ist dann per
definitionem der Grenzwert unserer Funktion an besagter Stelle.
Beispiel 3.5.10. Wir haben

x2 − 1 (x + 1)(x − 1)
lim = lim = lim x + 1 = 2
x→1 x − 1 x→1 x−1 x→1

Beispiel 3.5.11. Wir haben limx→∞ 1/x = 0 und lim(0,1)3x→0 1/x = ∞, denn
unser erweitertes nichtnegatives Invertieren inv+ : [0, ∞] → [0, ∞] ist stetig nach
3.3.4 mit inv+ (∞) = 0 und inv+ (0) = ∞.
3.5.12 (ε-δ-Kriterium für Grenzwerte). Seien D ⊂ Rm eine Teilmenge, p ∈ D
ein Häufungspunkt von D und f : D\p → Rn eine Funktion. Sei weiter b ∈ Rn
gegeben. Genau dann gilt limx→p f (x) = b, wenn es für jedes ε > 0 ein δ > 0
gibt mit
|x − p| < δ ⇒ |f (x) − b| < ε
Das ist eine direkte Konsequenz des ε-δ-Kriteriums für Stetigkeit 3.2.21.

85
Lemma 3.5.13 (Grenzwerte für x → ∞). Sei f : R ⊃ C → Rn eine Funktion
und sei ∞ ein Häufungspunkt zu C. Sei weiter b ∈ Rn gegeben. Genau dann gilt
limx→∞ f (x) = b, wenn es für jedes ε > 0 ein N = Nε ∈ R gibt mit
x > N ⇒ |f (x) − b| < ε
Beweis. Wir wenden das Umgebungskriterium für Stetigkeit 3.2.24 an und setzen
D := C ∪ {∞}. Ist die Fortsetzung von f zu f : D → Rn durch f (∞) := b
stetig bei ∞, so gibt es für die Umgebung U = B(b; ε) von b = f (∞) eine
Umgebung U 0 von ∞ mit f (U 0 ∩ D) ⊂ B(b; ε). Diese Umgebung U 0 von ∞
umfaßt aber per definitionem eine Teilmenge der Gestalt (N, ∞] mit N ∈ R. Wir
sehen so, daß es zu jedem ε > 0 ein N ∈ R gibt mit x > N ⇒ |f (x) − b| < ε.
Sei umgekehrt diese Bedingung erfüllt. Es gilt zu folgern, daß unsere Fortsetzung
f : D → Rd stetig ist bei p := ∞. Gegeben eine Umgebung U von b = f (∞)
finden wir ε > 0 mit B(b; ε) ⊂ U . Zu diesem ε finden wir dann ein N ∈ R mit
f ((N, ∞) ∩ C) ⊂ B(b; ε). Somit ist U 0 := (N, ∞] die gesuchte Umgebung von
∞ mit f (U 0 ∩ D) ⊂ U .
Beispiel 3.5.14 (Grenzwerte konstanter Funktionen). Wir haben limx→p c = c
für jede konstante Funktion c, denn konstante Funktionen sind stetig.
Beispiel 3.5.15 (Grenzwert der Identitätsfunktion). Wir haben limx→p x = p,
denn die Identität id ist stetig.
3.5.16. Gegeben Mengen A und I bezeichnet man eine Abbildung I → A ganz
allgemein auch als eine durch I indizierte Familie von Elementen von A und
benutzt die Notation
(ai )i∈I
Diese Sprechweise und Notation für Abbildungen verwendet man insbesondere
dann, wenn man der Menge I eine untergeordnete Rolle zugedacht hat. Im Fall
I = ∅ spricht man von der leeren Familie von Elementen von A.
Definition 3.5.17. Eine Abbildung N → X, n 7→ an von den natürlichen Zahlen
in eine Menge X nennen wir eine Folge in X. Wir schreiben eine Folge meist
(an )n∈N oder a0 , a1 , a2 , . . . oder auch einfach nur (an ). Die Elemente an heißen
die Folgenglieder. Manchmal nennen wir auch Abbildungen Folgen, die erst ab
n = 1 definiert sind.

3.5.18 (Folgenkonvergenz). Eine Folge (an ) in R̄d ist dasselbe wie eine Funktion
f : R̄ ⊃ N → R̄d , nämlich die Funktion f (n) := an . Der Punkt ∞ ist ein
Häufungspunkt zu N in R̄, wie wir bereits in 3.5.4 bemerkt hatten. Gegeben b ∈
R̄d sagen wir, die Folge an konvergiere gegen a, wenn im Sinne des allgemeinen
Grenzwertbegriffs 3.5.7 gilt
lim an = a
N3n→∞

86
Graphische Darstellung der Folge an = 33−n − (−2)4−n , die gegen Null
konvergiert, wie Sie bald werden zeigen können. Die Folgenglieder sind die
kleinen Kreuzchen auf der reellen Achse, ihre Indizes tragen sie an
unterschiedlich langen gestrichelt eingezeichneten Stangen.

87
In diesem Fall nennen wir a den Grenzwert oder lateinisierend Limes der Folge.
3.5.19. Sagen wir, eine Aussage gelte für fast alle Elemente einer Menge, so soll
das bedeuten, daß sie gilt für alle Elemente bis auf höchstens endlich viele Aus-
nahmen. Sagen wir, eine Aussage gelte für fast alle Glieder einer Folge, so soll
das bedeuten, daß für fast alle Indizes n unsere Aussage für das n-te Folgenglied
gilt.
3.5.20 (ε-N -Kriterium für Folgenkonvergenz). Gegeben eine Folge (an ) in Rd
und a ∈ Rd ist limn→∞ an = a nach 3.5.13 gleichbedeutend dazu, daß es für jedes
ε > 0 ein N = Nε ∈ R gibt mit n > N ⇒ |an − a| < ε.
Lemma 3.5.21 (Charakterisierung der Folgenkonvergenz). Gegeben eine Fol-
ge (an ) in R̄d ist limn→∞ an = a gleichbedeutend dazu, daß jede Umgebung von
a fast alle Glieder unserer Folge enthält.
Beweis. Wir setzen D := N ∪ {∞}. Bezeichne ā : D → R̄d die Fortsetzung von
n 7→ an durch ∞ 7→ a. Per definitionem ist limn→∞ an = a gleichbedeutend dazu,
daß ā stetig ist bei ∞. Das ist gleichbedeutend dazu, daß es für jede Umgebung
U von a = ā(∞) eine Umgebung U 0 von ∞ gibt mit ā(U 0 ∩ D) ⊂ U . Das
hinwiederum ist gleichbedeutend dazu, daß es für jede Umgebung U von a ein
N ∈ R gibt mit ā((N, ∞] ∩ D) ⊂ U oder, wegen ā(∞) = a ∈ U immer noch
gleichbedeutend, mit ā((N, ∞] ∩ N) ⊂ U .
3.5.22. Eine Nullfolge ist eine Folge, die gegen Null konvergiert. Zum Beispiel
folgt aus Korollar 2.4.10 zur Archimedizität der reellen Zahlen sofort, daß die
Folge n 7→ 1/n gegeben für n ≥ 1 eine Nullfolge ist, in Formeln
lim 1/n = 0
n→∞

Alternativ folgt das auch durch Einschränken der Erkenntnis limx→∞ 1/x = 0 aus
3.5.11 auf positive natürliche Zahlen. Bei dieser Argumentation versteckt sich die
Archimedizität der reellen Zahlen in der implizit verwendeten Eigenschaft, daß
∞ ein Häufungspunkt zu N in R̄ ist.
3.5.23 (Diskussion der Terminologie). Mit unserer Konvention für die „Konver-
genz gegen ±∞“ bewegen wir uns zwar im Rahmen des allgemeinen Begriffs der
„Konvergenz in topologischen Räumen“ [AN2] 1.4.5, aber außerhalb der in der
einführenden Literatur zur Analysis üblichen Konventionen. Üblicherweise wird
stattdessen die Terminologie bestimmte Divergenz gegen ±∞ verwendet. Übli-
cherweise bleibt in anderen Worten der Begriff der konvergenten Folge reserviert
für Folgen, die gegen eine reelle Zahl konvergieren. Wir nennen solche Folgen
reell konvergent. Falls eine Folge nicht konvergiert, auch nicht gegen ∞ oder
−∞, so nennt man sie unbestimmt divergent. Wir verlieren mit unserer Termi-
nologie zwar etwas an terminologischer Kohärenz, da wir im weiteren „Reihen“

88
aus wieder anderen Gründen nur dann konvergent nennen werden, wenn die Fol-
ge ihrer Partialsummen reell konvergent ist. Das schien mir jedoch ein kleineres
Übel, als es eine unnötig einschränkende oder in Fälle aufspaltende Formulierung
von Aussagen wie 3.5.32 wäre.
3.5.24 (Lokalität des Grenzwerts). Der Grenzwert einer Funktion für x → p
hängt nur von ihrem Verhalten in einer Umgebung von p ab. Ist genauer p ∈ D
Häufungspunkt einer Teilmenge D ⊂ R̄m und f : D\p → R̄n eine Funk-
tion und V eine Umgebung von p, so existiert limx→p f (x) genau dann, wenn
limx→p (f |V ∩D\p )(x) existiert, und unter diesen Umständen gilt

lim f (x) = lim f (x)


(V ∩D)3x→p D3x→p

Beispiel 3.5.25 (Grenzwerte von Einschränkungen). Gegeben C ⊂ E ⊂ R̄m


und p ∈ R̄m ein Häufungspunkt zu C und f : E\p → R̄n haben wir

lim f (x) = lim f (x)


C3x→p E3x→p

wenn der rechte Grenzwert existiert, denn Einschränkungen stetiger Funktionen


sind stetig.
3.5.26. Man beachte den Unterschied zur Lokalität des Grenzwerts 3.5.24, der
ein Kriterium für die Existenz eines Grenzwerts angibt, wohingegen die Aussage
3.5.25 über Grenzwerte von Einschränkungen nur Eigenschaften von Grenzwer-
ten behauptet, deren Existenz bereits bekannt ist.
3.5.27 (Grenzwerte von Verknüpfungen). Die Definition des Grenzwerts 3.5.7
als Wert der eindeutigen stetigen Fortsetzung zusammen mit der Stetigkeit der
Verknüpfung stetiger Funktionen 3.2.30 liefern für den Grenzwert einer Verk-
nüpfung die folgenden drei Implikationen. Die Terminologie „Limites“ meint hier
das „Bilden von Grenzwerten“ und soll zum Ausdruck bringen, daß eben nicht der
Grenzwert selbst die fraglichen Eigenschaften hat, sondern vielmehr das Bilden
von Grenzwerten.

Limites vertauschen mit dem Nachschalten stetiger Funktionen:


 
lim f (x) = q und g stetig bei q ⇒ lim g(f (x)) = g(q)
x→p x→p

Limites bleiben gleich beim Vorschalten stetiger Funktionen:


 
f stetig bei p und lim g(y) = c ⇒ lim g(f (x)) = c
y→f (p) x→p

89
Limites lassen sich iterieren:
 
lim f (x) = q und lim g(y) = c ⇒ lim g(f (x)) = c
x→p y→q x→p

Im folgenden führen wir das genauer aus.


3.5.28 (Limites vertauschen mit dem Nachschalten stetiger Funktionen). Wir
schreiben die erste Eigenschaft nach 3.5.27 nocheinmal mit allen Voraussetzungen
und den entsprechenden Notationen aus. Seien gegeben C ⊂ R̄m und p ∈ R̄m ein
Häufungspunkt zu C und f : C\p → R̄n eine Funktion mit Bild in E ⊂ R̄n . Gilt
limx→p f (x) = q und q ∈ E und ist g : E → R̄l stetig bei q, so folgt

lim g(f (x)) = g(q)


x→p

Beispiel 3.5.29 (Folgenkonvergenz und Nachschalten stetiger Funktionen).


Gegeben eine Funktion g : R̄k ⊃ E → R̄l , die stetig ist bei einer Stelle a ∈ E,
und eine Folge (an ) in E mit limn→∞ an = a gilt

lim g(an ) = g(a)


n→∞

Das zeigen wir, indem wir unsere Erkenntnisse aus 3.5.28 zum Vertauschen von
Limites mit dem Nachschalten stetiger Funktionen anwenden auf C := N und den
Häufungspunkt p := ∞ und an statt f (x) schreiben.
Beispiel 3.5.30. Wenden wir unsere Erkenntnisse 3.5.29 zur Vertauschung von
Folgenkonvergenz und stetigen Funktionen nach einer geschickten Umformung
2
auf die Funktion f (x) := 5+x
3+x
und die Folge an := 1/n an, so erhalten wir

5n3 + n 5 + (1/n)2 5
lim = lim =
n→∞ 3n3 + n2 n→∞ 3 + (1/n) 3

Definition 3.5.31. Sei b0 , b1 , b2 , . . . eine Folge. Ist 0 ≤ n0 < n1 < n2 < . . . eine
streng monoton wachsende Folge natürlicher Zahlen, so nennen wir die Folge
(bnk )k∈N mit Gliedern
bn0 , bn1 , bn2 , . . .
eine Teilfolge der Folge bn . Schreiben wir eine Folge in X als eine Abbildung
b : N → X, n 7→ b(n) = bn , so ist eine Teilfolge von b demnach eine Abbildung
der Gestalt b ◦ a für eine streng monoton wachsende Folge a : N → N gegeben
durch a(k) := nk .

3.5.32 (Konvergenz von Teilfolgen). Jede Teilfolge einer konvergenten Folge


konvergiert, und zwar gegen denselben Grenzwert wie die ursprüngliche Folge.

90
In der Tat liegen in jeder Umgebung des Grenzwerts fast alle Glieder unserer
Folge und a forteriori auch fast alle Glieder jeder Teilfolge. Alternativ ist es auch
eine formale Konsequenz aus der Regel für iterierte Limites nach 3.5.27, die wir
spezialisieren können zu
(limk→∞ nk = ∞ und limn→∞ bn = b) ⇒ limk→∞ bnk = b
Nach unseren Annahmen ist hier limk→∞ nk = ∞ offensichtlich. Formal folgt es
auch aus der Regel für den Grenzwert durch Einquetschen 3.5.36.
3.5.33 (Grenzwert als komponentenweiser Grenzwert). Sei C ⊂ R̄m und p ∈
R̄m ein Häufungspunkt zu C und f = (f1 , . . . , fn ) : C\p → R̄n eine Abbildung
und b = (b1 , . . . , bn ) ∈ R̄n ein Punkt. So gilt
lim f (x) = b ⇔ lim fν (x) = bν ∀ν
x→p x→p

In der Tat folgt das unmittelbar aus unserer Erkenntnis 3.5.33, daß Stetigkeit
gleichbedeutend ist zu komponentenweiser Stetigkeit.
3.5.34 (Grenzwert von Summe, Produkt und Quotient). Seien C ⊂ R̄m eine
Teilmenge und p ∈ R̄m ein Häufungspunkt zu C und seien f, g : C\p → R reell-
wertige Funktionen mit reellen Grenzwerten limx→p f (x) = b und limx→p g(x) =
c. So folgt aus der Stetigkeit von Summe und Produkt stetiger Funktionen 3.2.34
unmittelbar limx→p (f + g)(x) = b + c und limx→p (f g)(x) = bc. Ebenso folgt aus
der Stetigkeit des Quotienten 3.3.5 unter der zusätzlichen Annahme, daß g keine
Nullstelle hat und der Grenzwert c nicht Null ist, auch limx→p f (x)/g(x) = b/c.
3.5.35 (Grenzwert durch Einquetschen). Seien C ⊂ R̄m eine Teilmenge und
p ∈ R̄m ein Häufungspunkt zu C und f, g, h : C\p → R̄ Funktionen mit
f (x) ≤ g(x) ≤ h(x) für alle x ∈ C\p.
So folgt aus limx→p f (x) = b = limx→p h(x) schon limx→p g(x) = b. In der Tat
gibt es unter diesen Annahmen für jede Intervallumgebung I von b Umgebungen
U, W von p mit f (U ∩C\p) ⊂ I und h(W ∩C\p) ⊂ I. Dann aber ist V := U ∩W
offensichtlich eine Umgebung von p mit g(V ∩ C\p) ⊂ I. Alternativ folgt das
auch sofort aus unserer Übung zur Stetigkeit durch Einquetschen 3.2.46.
Beispiel 3.5.36. Aus limx→p f (x) = ∞ und f (x) ≤ g(x) ∀x folgt durch Einquet-
schen limx→p g(x) = ∞. In diesem Fall können wir als „obere Quetschfunktion“
h die konstante Funktion h(x) = ∞ ∀x wählen.
Lemma 3.5.37 (Erhaltung schwacher Ungleichungen im Grenzwert). Seien
C ⊂ R̄m eine Teilmenge und p ein Häufungspunkt zu C und f, g : C\p → R̄
Funktionen mit f (x) ≤ g(x) für alle x ∈ C\p. Existieren die Grenzwerte von f
und g für x → p, so gilt
lim f (x) ≤ lim g(x)
x→p x→p

91
3.5.38. Man beachte den Unterschied zum Grenzwert durch Einquetschen 3.5.35.
Er gibt ein hinreichendes Kriterium für die Existenz eines Grenzwerts, wohin-
gegen Lemma 3.5.37 über die Erhaltung von Ungleichungen im Grenzwert nur
Eigenschaften von Grenzwerten behauptet, deren Existenz bereits bekannt ist.
Beweis. Durch Widerspruch. Sei a der Grenzwert von f und b der Grenzwert von
g. Hätten wir a > b alias b < a, so fänden wir k mit b < k < a. Dann wäre
[−∞, k) eine Umgebung von b und (k, ∞] eine Umgebung von a. Es gäbe also
Umgebungen U und V von p mit f (U ∩ C\p) ⊂ (k, ∞] und g(V ∩ C\p) ⊂
[−∞, k). Da p Häufungspunkt zu C ist, wäre U ∩ V ∩ C\p nicht leer. Für jeden
Punkt x aus dieser Menge gälte aber f (x) > g(x) im Widerspruch zu unserer
Annahme.

Proposition 3.5.39. Die folgende Tabelle beschreibt das Konvergenzverhalten der


Folge (xn )n∈N der Potenzen von x in Abhängigkeit von x:

x>1 limn→∞ xn = ∞;
x=1 limn→∞ xn = 1;
|x| < 1 limn→∞ xn = 0;
x ≤ −1 Die Folge xn divergiert unbestimmt.

Beweis. Im Fall x > 1 schreiben wir x = 1 + y mit y > 0 und erhalten mit der
binomischen Formel
xn = (1 + y)n ≥ 1 + ny
Die Folge n 7→ 1 + ny strebt aber gegen ∞ und nach 3.5.36 strebt dann die Folge
xn auch gegen ∞. Im Fall x = 1 ist die Folge konstant 1 und es ist nichts zu
zeigen. Falls 0 < x < 1 gilt nach dem Vorhergehenden limn→∞ 1/xn = ∞ und
daraus folgt limn→∞ xn = 0 durch Anwenden der stetig von (0, ∞) auf [0, ∞]
fortgesetzten Funktion t 7→ 1/t aus 3.3.4. Für −1 < x ≤ 0 folgt die Behaup-
tung dann wegen −|x|n ≤ xn ≤ |x|n durch Einquetschen. Im Fall x ≤ −1 gilt
|xn − xn+1 | ≥ 2 für alle n. Also kann die Folge nicht gegen eine reelle Zahl a
konvergieren, denn dann müßte gelten |a − xn | < 1 für fast alle n und dann nach
der Dreiecksungleichung |xn −xn+1 | < 2 für fast alle n. Die Folge kann in diesem
Fall aber auch nicht gegen ∞ oder −∞ konvergieren, da die Folgenglieder immer
abwechselnd positiv und negativ sind.

Satz 3.5.40 (Gruppenwege in R). Die stetigen Gruppenhomomorphismen R →


R der additiven Gruppe der reellen Zahlen in sich selber sind genau die Abbil-
dungen x 7→ λx für beliebiges aber festes λ ∈ R.

Beweis. Sei f : R → R ein stetiger Gruppenhomomorphismus, als da heißt eine


stetige Abbildung mit f (x + y) = f (x) + f (y) ∀x, y ∈ R. Es reicht zu zeigen,

92
daß f die Gleichung f (x) = xf (1) erfüllt. Auch ohne die Stetigkeit von f zu
benutzen, folgern wir f (q) = qf (1) zunächst für alle q ∈ N, dann für alle q ∈ Z,
dann für alle q ∈ Q. Um unsere Gleichung f (x) = xf (1) sogar für alle x ∈
R zu zeigen, nutzen wir die Erkenntnis, daß nach 2.4.10 jede reelle Zahl x ein
Häufungspunkt zu Q ist. Für alle x ∈ R gilt also
f (x) = lim f (q) = lim qf (1) = xf (1)
Q3q→x Q3q→x

und so folgt wie gewünscht f (x) = λx für λ := f (1).


3.5.41. Gegeben eine Teilmenge C ⊂ R̄ und ein Punkt p ∈ R̄, der Häufungspunkt
sowohl zu D ∩ R̄<p als auch zu D ∩ R̄>p ist, sprechen wir vom linksseitigen
beziehungsweise rechtsseitigen Grenzwert einer Funktion f : C\p → R̄, wenn
wir den Grenzwert ihrer Einschränkung auf diese beiden Teilmengen untersuchen
wollen, und notieren diese Grenzwerte
lim f (x) := lim f |C∩R̄<p und lim f (x) := lim f |C∩R̄>p
x%p x→p x&p x→p

Ofensichtlich existiert in dieser Situation der Grenzwert bei p genau dann, wenn
der linkseitige Grenzwert und der rechtseitige Grenzwert existieren und überein-
stimmen.
Beispiel 3.5.42. Es gilt limx&0 1/x = ∞ und limx%0 1/x = −∞.
Satz 3.5.43 (Stetigkeit als Folgenstetigkeit). Seien f : R̄m ⊃ D → R̄n eine
Funktion und a ∈ D ein Punkt. So sind gleichbedeutend:
1. f ist stetig bei a;
2. Für jede Folge a0 , a1 , . . . von Punkten aus D mit limi→∞ ai = a gilt bereits
limi→∞ f (ai ) = f (a).
3.5.44. Dieser Satz ist für uns bis auf weiteres nicht relevant. Soweit ich sehen
kann, benötigen wir ihn im hier verfolgten Aufbau der Theorie erst in Analysis 3,
um zu zeigen, daß die Fouriertransformierte einer integrierbaren Funktion stetig
ist. Allerdings kann es leicht passieren, daß Sie in einer Prüfung nach diesem Satz
gefragt werden.
Beweis. 1 ⇒ 2 haben wir schon in 3.5.29 erledigt. Wir konzentrieren uns deshalb
auf 2 ⇒ 1. Das zeigen wir durch Widerspruch. Für unser a ∈ R̄n finden wir nach
Übung 3.5.46 eine absteigende Folge von Umgebungen V0 ⊃ V1 ⊃ V2 ⊃ . . .
derart, daß jede Umgebung V von a fast alle Vi umfaßt. Ist f nicht stetig bei a, so
gibt es eine Umgebung U von f (a) derart, daß für kein i gilt f (Vi ∩ D) ⊂ U . Für
jedes i finden wir also ai ∈ Vi ∩ D mit f (ai ) 6∈ U . Die ai bilden dann eine Folge
in D mit limi→∞ ai = a, für die nicht gilt limi→∞ f (ai ) = f (a).

93
Übungen
Übung 3.5.45. Sei C ⊂ R eine Teilmenge derart, daß ∞ ein Häufungspunkt
zu C ist, und sei f : C → R̄ eine Funktion. Man zeige, daß genau dann gilt
limx→∞ f (x) = −∞, wenn es für jedes M ∈ R ein N = NM ∈ R gibt mit
x > N ⇒ f (x) < M
Übung 3.5.46. Für jedes a ∈ R̄n gibt es eine absteigende Folge von Umgebungen
V0 ⊃ V1 ⊃ V2 ⊃ . . . derart, daß jede Umgebung von a fast alle der Vi umfaßt.
Übung 3.5.47. Ist A ⊂ R̄ eine nichtleere Teilmenge, so ist sup A das größte Ele-
ment in der Menge G aller Punkte aus den erweiterten reellen Zahlen, die Grenz-
werte von Folgen aus A sind. Diese Übung wird verwendet für die Herleitung des
Satzes über Extrema auf Kompakta.
Übung 3.5.48. Sei C ⊂ R̄ eine Teilmenge. Genau dann ist p ∈ R̄ Häufungspunkt
zu C, wenn es eine Folge reeller Zahlen xn in C\p gibt mit limn→∞ xn = p.
Übung 3.5.49. Aus limn→∞ an = a folgt limn→∞ |an | = |a|. Umgekehrt folgt aus
limn→∞ |an | = 0 bereits limn→∞ an = 0.
Übung 3.5.50. Ist (an ) eine Folge reeller Zahlen, die gegen eine reelle Zahl kon-
vergiert, so gilt limn→∞ (an+1 − an ) = 0.
Übung 3.5.51 (Folgenkriterium für Grenzwerte von Funktionen). Sei C ⊂ R̄
eine Teilmenge, p ein Häufungspunkt zu C und f : C\p → R̄ eine Funktion. So
gilt limx→p f (x) = b genau dann, wenn für jede Folge xn in C\p mit xn → p gilt
f (xn ) → b.
Übung 3.5.52. Sei C ⊂ R̄m eine Teilmenge, p ein Häufungspunkt zu C, f :
C\p → R eine Funktion und b ∈ R. So gilt
lim f (x) = b ⇔ lim |f (x) − b| = 0
x→p x→p

Übung 3.5.53 (Polynomiale Funktionen als formale Ausdrücke). Man zeige:


Gilt für eine durch ein Polynom vom Grad ≤ n gegebene Funktion f (x) = an xn +
. . . + a1 x + a0 und ein p ∈ R die Formel limx→p f (x)/(x − p)n = 0, so folgt a0 =
a1 = . . . = an = 0. Insbesondere liefert ein Polynom mit reellen Koeffizienten
nur dann die Nullfunktion, wenn alle seine Koeffizienten Null sind. Wir nennen es
dann das Nullpolynom. Hinweis: Durch Verschieben kann man sich auf den Fall
p = 0 zurückziehen.
Übung 3.5.54 (Rationale Funktionen als formale Ausdrücke). Seien Polyno-
me mit reellen Koeffizienten P1 , P2 , Q1 , Q2 gegeben und seien Q1 , Q2 nicht das
Nullpolynom. Man zeige: Gilt für alle x ∈ R mit Q1 (x) 6= 0 6= Q2 (x) die Gleich-
heit von reellen Zahlen P1 (x)/Q1 (x) = P2 (x)/Q2 (x), so folgt die Gleichheit von
Polynomen P1 Q2 = P2 Q1 . Hinweis: Übung 3.5.53.

94
Übung 3.5.55. Man zeige: Die Regeln zum Vertauschen von Grenzwertbildung
mit Addition und Multiplikation gelten auch noch, wenn wir a, b ∈ R̄ zulassen
und a + b beziehungsweise ab sinnvoll definiert sind im Sinne von Übung 3.2.44.
Ergänzende Übung 3.5.56. Sei L ⊂ R eine Untergruppe der additiven Gruppe der
reellen Zahlen, die keine Häufungspunkte in R hat. So gibt es α ∈ R mit L = Zα.

3.6 Vollständigkeit der reellen Zahlen


Definition 3.6.1. Eine Menge von reellen Zahlen heißt beschränkt, wenn sie in R
eine obere und eine untere Schranke besitzt. Eine Folge von reellen Zahlen heißt
beschränkt, wenn die Menge der Folgenglieder beschränkt ist. Allgemeiner heißt
eine reellwertige Funktion beschränkt, wenn die Menge ihrer Funktionswerte
beschränkt ist.
Lemma 3.6.2. Jede reell konvergente Folge von reellen Zahlen ist beschränkt.
Beweis. Ist x ∈ R der Grenzwert unserer Folge, so liegen fast alle Folgenglieder
in [x−1, x+1]. Die endlich vielen Ausnahmen können wir durch eine hinreichend
große obere und untere Schranke auch noch einfangen.
Satz 3.6.3 (Konvergenz monotoner reeller Folgen). Jede monoton wachsende
Folge in R̄ konvergiert gegen das Supremum der Menge ihrer Folgenglieder. Je-
de monoton fallende Folge in R̄ konvergiert gegen das Infimum der Menge ihrer
Folgenglieder. Jede monotone beschränkte Folge von reellen Zahlen konvergiert
gegen eine reelle Zahl.
Beweis. Wir zeigen nur die erste Aussage, die Zweite zeigt man analog und die
Dritte ist eine offensichtliche Konsequenz. Sei s das Supremum alias die kleinste
obere Schranke der Menge aller Folgenglieder. Kein p mit p < s ist dann eine
obere Schranke der Menge aller Folgenglieder, folglich liegen für jedes p < s
ein und damit wegen der Monotonie fast alle xn in (p, s]. Damit liegen in jeder
Umgebung von s fast alle Folgenglieder.
Lemma 3.6.4. Jede Folge in einer angeordneten Menge besitzt eine monotone
Teilfolge.

3.6.5. Hier mögen Sie sich an unsere Sprachregelung [GR] 1.7.3 erinnern. Ge-
meint ist demnach: Jede Folge in einer angeordneten Menge besitzt mindestens
eine monotone Teilfolge.
Beweis. Wir nennen ein Folgenglied xn oder präziser seinen Index n einen „Aus-
sichtspunkt“ der Folge, wenn alle späteren Folgenglieder kleiner sind, in Formeln
xn > xm für alle m > n. Besitzt unsere Folge unendlich viele Aussichtspunkte,

95
Bei der Folge (−1)n 6/n ist jedes zweite Folgenglied ein Ausichtspunkt im Sinne
des Beweises von Lemma 3.6.4.

96
so bilden diese eine streng monoton fallende Teilfolge. Sonst gibt es einen letzten
Aussichtspunkt xn . Dann finden wir aber eine monoton wachsende Teilfolge, die
mit xn+1 beginnt, denn ab dem Index n + 1 kommt dann nach jedem Folgenglied
noch ein anderes, das mindestens ebenso groß ist.

Satz 3.6.6 (Bolzano-Weierstraß). Jede Folge in R̄ besitzt eine in R̄ konvergente


Teilfolge. Jede beschränkte Folge von reellen Zahlen besitzt eine reell konvergente
Teilfolge.

Beweis. Jede Folge in R̄ besitzt nach 3.6.4 eine monotone Teilfolge, und diese ist
nach 3.6.3 konvergent in R̄. Ist unsere Folge beschränkt, so ist auch jede solche
Teilfolge beschränkt und konvergiert folglich gegen eine reelle Zahl.

Definition 3.6.7. Eine Folge (xn )n∈N in einem angeordneten Körper heißt eine
Cauchy-Folge, wenn es für jedes ε > 0 ein N = Nε ∈ N gibt derart, daß gilt
|xn − xm | < ε falls n, m ≥ N .

Satz 3.6.8. Eine Folge reeller Zahlen konvergiert gegen eine reelle Zahl genau
dann, wenn sie eine Cauchy-Folge ist.

Beweis. Daß jede reell konvergente Folge Cauchy sein muß, ist leicht zu sehen:
Aus limn→∞ xn = x folgt, daß es für alle ε > 0 ein N ∈ N gibt mit |xn −x| < ε/2
für n ≥ N . Daraus folgt dann |xn − xm | < ε für n, m ≥ N . Wir zeigen nun
umgekehrt, daß auch jede Cauchy-Folge gegen eine reelle Zahl konvergiert. Eine
Cauchy-Folge xn ist sicher beschränkt, denn wählen wir für ε = 1 ein N = Nε ,
so liegen fast alle Folgenglieder im Intervall (xN − 1, xN + 1), und die endlich
vielen Ausnahmen können wir durch eine hinreichend große Schranke auch noch
einfangen. Unsere Cauchy-Folge besitzt daher nach 3.6.6 eine reell konvergente
Teilfolge xnk , sagen wir limk→∞ xnk = x. Wir behaupten, daß dann auch die
Folge xn selbst gegen x konvergiert. In der Tat gibt es für alle ε > 0 ein Nε mit
n, m ≥ Nε ⇒ |xn −xm | < ε. Aus n ≥ Nε folgt damit insbesondere |xn −xnk | < ε
für fast alle k und dann im Grenzwert |xn − x| ≤ ε , da ja die Ungleichungen
−ε ≤ xn − xnk ≤ ε bestehen bleiben beim Grenzübergang k → ∞.
3.6.9. Ein angeordneter Körper, in dem jede Cauchy-Folge konvergiert, heißt voll-
ständig. Dieser Begriff ist Teil einer alternativen Charakterisierung der reellen
Zahlen, die wir im folgenden als Übung formulieren.

Übungen
Übung 3.6.10. Gegeben ein angeordneter Körper sind gleichbedeutend: (1) Je-
de nichtleere Teilmenge mit einer unteren Schranke besitzt eine größte untere
Schranke; (2) Der Körper ist archimedisch angeordnet und vollständig.

97
Übung 3.6.11 (Intervallschachtelungsprinzip). Gegeben eine absteigende Folge
von nichtleeren
T kompakten reellen Intervallen R ⊃ I0 ⊃ I1 ⊃ I2 . . . ist auch ihr
Schnitt ν∈N Iν nicht leer.
Übung 3.6.12 (Cauchy-Kriterium für Grenzwerte von Funktionen). Sei C ⊂
R̄ eine Teilmenge, p ein Häufungspunkt zu C und f : C\p → R eine reell-
wertige Funktion. Genau dann existiert der Grenzwert limx→p f (x) und ist eine
reelle Zahl, wenn es für alle ε > 0 eine Umgebung U = Uε von p gibt mit
(a, b ∈ U ∩ C\p) ⇒ |f (a) − f (b)| < ε.
Übung 3.6.13. Ich erinnere an die Fibonacci-Folge und den goldenen Schnitt aus
[EIN] 1.2.2. Man zeige, daß der Quotient zweier aufeinanderfolgender Glieder
der Fibonacci-Folge gegen den goldenen Schnitt strebt, daß also in Formeln gilt

xi+1 1+ 5
lim =
i→∞ xi 2
für unsere Fibonacci-Folge x0 , x1 , x2 , . . . aus [EIN] 1.2.2.
Übung 3.6.14. Gegeben zwei reelle Zahlen a, b ∈ R definiert man ihr arithme-
tisches Mittel als die Zahl (a + b)/2. Gegeben zwei nichtnegative
√ reelle Zahlen
a, b ∈ R≥0 definiert man ihr geometrisches Mittel als die Zahl ab. Anschaulich
ist das die Kantenlänge eines Quadrats, das dieselbe Fläche hat wie das Rechteck
mit den Seitenlängen a und b, und daher kommt vermutlich auch√die Terminolo-
gie. Man zeige für je zwei positive reelle Zahlen die Ungleichung ab ≤ (a+b)/2
zwischen geometrischem und arithmetischen Mittel und zeige, daß Gleichheit nur
gilt im Fall a = b = 0.

3.7 Algorithmisches Wurzelziehen*


3.7.1. Gegeben eine reelle Zahl a ≥ 0 geben wir ein Verfahren zur Berechnung
der nichtnegativen Quadratwurzel von a an. Wir konstruieren dazu eine Folge und
beginnen mit x0 := max(1, a). Dann gilt sicherlich schon einmal x20 ≥ a. Ge-
geben xn > 0 mit x2n ≥ a machen wir den Ansatz (xn − ε)2 = a und erhalten
ε = (x2n + ε2 − a)/2xn . Nun vernachlässigen wir ε2 /2xn , vergessen unseren An-
satz und setzen
x2 − a x2 + a
xn+1 = xn − n = n
2xn 2xn
Man sieht sofort, daß aus xn ≥ a und xn > 0 folgt x2n+1 ≥ a und xn ≥ xn+1 > 0.
2

Da die Folge der xn monoton fällt und durch Null nach unten beschränkt ist,
besitzt sie einen Grenzwert x ≥ 0. Aus der Gleichung
2xn xn+1 = x2n + a
folgt dann x2 = a durch Übergang zum Grenzwert für n → ∞ auf beiden Seiten.

98
induktiven Formel für die Glieder der Folge xn
Graphische Darstellung unserer√
mit Grenzwert a aus dem Beweis von 3.3.14

99

3.7.2. Die Ungleichungen a/xn ≤ a < xn erlauben uns sogar abzuschätzen,
wie gut unsere Approximation
√ xn mindestens sein muß. Machen wir für den Feh-
ler den Ansatz xn = a(1 + fn ), so ergibt sich mit etwas Rechnen

fn2
fn+1 =
2(1 + fn )

und indem wir im Nenner die 1 beziehungsweise fn verkleinern zu Null √ erhalten


1 2
wir die Abschätzung fn+1 ≤ 2 min(fn , fn ). Wenn also xn so nah bei a ist, daß
gilt fn < 1, so „verdoppelt sich die Anzahl der richtigen Stellen beim Übergang
von xn zu xn+1 “. Man spricht unter diesen Umständen auch von quadratischer
Konvergenz. Anschaulich erhält man xn+1 , indem man von xn senkrecht hoch-
geht zum Graph der Funktion y = x2 − a und dann auf der Tangente an diesen
Graphen wieder herunter auf die x-Achse. Es ist damit auch anschaulich klar, daß
unser Verfahren sehr schnell konvergieren sollte. Dieses Verfahren kann auch zur
Bestimmung der Nullstellen allgemeinerer Funktionen anwenden. Es heißt das
Newton-Verfahren.
3.7.3 (Intervallhalbierungsverfahren). Sei f : [a, b] → R eine stetige Funktion.
Der Einfachkeit halber nehmen wir zusätzlich f (a) ≤ f (b) an. Gegeben z ∈
[f (a), f (b)] suchen wir p ∈ [a, b] mit f (p) = z. Dazu nehmen wir den Mittelpunkt
m0 unseres Intervalls her und werten unsere Funktion dort aus. Gilt f (m0 ) ≥ z,
so setzen wir a1 = a und b1 = m0 . Sonst setzen wir a1 = m0 und b1 = b. In
jedem Fall gilt f (a1 ) ≤ z ≤ f (b1 ). Anschließend nehmen wir den Mittelpunkt
m1 des nur noch halb so großen Intervalls [a1 , b1 ] her und verfahren genauso. Auf
diese Weise erhalten wir eine monoton wachsende Folge a = a0 , a1 , . . . und eine
monoton fallende Folge b = b0 , b1 , . . . mit bn − an = 2−n (b − a) und f (an ) ≤ z ≤
f (bn ) und für alle n. Unsere beiden Folgen müssen also konvergieren, und zwar
gegen denselben Grenzwert p ∈ [a, b]. Aus der Stetigkeit von f und der Erhaltung
von Ungleichungen im Grenzwert nach 3.5.28 folgt dann

f (p) = lim f (an ) ≤ z ≤ lim f (bn ) = f (p)


n→∞ n→∞

und damit z = f (p).

100
4 Exponentialfunktion
4.1 Konvergenz von Reihen
Definition 4.1.1. Sei (ak )k∈N eine Folge reeller Zahlen. Der Ausdruck

X
ak
k=0

bezeichnet sowohl die Folge (sn ) der Partialsummen sn := nk=0 ak als auch,
P

P∞ konvergiert, ihren Grenzwert s = limn→∞ sn .


falls die Folge der Partialsummen
Wir sagen dann, die Reihe k=0 ak konvergiere gegen s. Nennen wir eine Reihe
konvergent, so meinen wir stets, daß unsere Reihe gegen eine reelle Zahl konver-
giert und nicht etwa gegen ±∞. Die ak heißen die Reihenglieder.
4.1.2 (Ändern endlich vieler Reihenglieder). Es spielt für das Konvergenzver-
halten einer Reihe offensichtlich keine Rolle, wenn wir endlich viele ihrer Glieder
abändern. Das beeinflußt nur den Grenzwert und ändert ihn eben um die Summe
unserer endlich vielen Änderungen.
4.1.3 (Diskussion der Terminologie). Es wäre terminologisch kohärenter gewe-
sen, wie bei Folgen auch bei Reihen von „reell konvergenten Reihen“ zu sprechen.
Das schien mir jedoch ungeschickt, da man den Begriff dann nicht als Verb ver-
wenden kann: „Die Reihe reell-konvergiert“ klingt einfach zu holprig, und Sprech-
weisen wie „die Reihe konvergiert absolut“ sind oft praktisch.
Beispiel 4.1.4. Dies Beispiel illustriert den oft nützlichen Teleskopsummentrick.
P∞ 1
Pn 1 1
k=1 k(k+1) = limn→∞ k=1 ( k − k+1 )
1
= limn→∞ (1 − n+1
)
= 1

Satz 4.1.5 (Geometrische Reihe). Sei |x| < 1. So gilt



X 1
xk =
k=0
1−x

Beweis. Sicher gilt (1 − x)(1 + x + . . . + xn ) = 1 − xn+1 , die Partialsummen


unserer Reihe ergeben sich also zu
1 − xn+1
n
1 + x + ... + x =
1−x
1
und streben für n → ∞ wie gewünscht gegen 1−x
.

101
4.1.6 (Herkunft der Terminologie). Die Folgen der Gestalt axn heißen geome-
trische Folgen, da bei ihnen zumindest im Fall a > 0, x > 0 jedes Folgenglied
nach dem ersten das geometrische Mittel im Sinne von 3.6.14 seines Vorgängers
und seines Nachfolgers ist. Die geometrische Reihe hinwiederum erbt ihren Na-
men von der geometrischen Folge.
Beispiel 4.1.7. Es gilt 1 + 21 + 41 + 18 + . . . = 2 und

9 X 1
0,999 . . . = =1
10 k=0 10k
P P
Satz 4.1.8.
P Sind ak und
P bk konvergente Reihen, so konvergieren auch die
Reihen (ak + bk ) und λak und es gilt:
P P P
(akP
+ bk ) = P ak + b k
λak = λ ak

Beweis. Das folgt, indem man die Vertauschbarkeit 3.5.34 von Summen und Pro-
dukten mit Grenzwerten auf die Folgen der Partialsummen anwendet.
4.1.9. Eine Reihe kann nur dann konvergieren, wenn die Folge der Reihenglieder
gegen Null strebt. In der Tat folgt das sofort, wenn wir Übung 3.5.50 auf die
Folge der Partialsummen anwenden. Diese Übung besagte, nur zur Erinnerung,
daß die Differenzen aufeinanderfolgender Glieder einer reell konvergenten Folge
stets eine Nullfolge bilden.
Lemma 4.1.10 (Konvergenz beschränkter nichtnegativer Reihen). Eine Reihe,
die aus nichtnegativen Gliedern besteht, konvergiert genau dann, wenn die Folge
ihrer Partialsummen beschränkt ist.
Beweis. Ist kein Reihenglied negativ, so wächst die Folge der Partialsummen mo-
noton. Ist diese Folge auch noch beschränkt, so muß die Folge der Partialsummen
nach 3.6.3 reell konvergent sein. Die Umkehrung ist eh klar.
Beispiel 4.1.11. Die harmonische Reihe ∞ 1
P
k=1 k konvergiert nicht, da ja gilt

1 1
2
≥ 2
1 1 1
3
+ 4
≥ 2
1
5
+ 16 + +
1
7
1
8
≥ 1
2

und so weiter.

Jedoch konvergieren die Reihen ∞ 1


P
k=1 ks für s = 2, 3, 4, . . .,P
da für jede dieser
Reihen die Folge der Partialsummen beschränkt ist durch 1 + ∞ 1
k=2 k(k−1) = 2.

102
Die Divergenz der harmonischen Reihe 4.1.11 zeigt, daß man mit hinreichend
vielen identischen Bauklötzen einen beliebig weit neben seinem Grundklotz
endenden Turm bauen kann. Obiges Bild zeigt etwa, wie weit man mit vier
Klötzen so gerade eben mal kommen kann.

103
Vorschau 4.1.12. In der Funktionentheorie können Sie lernen, daß diese Reihen
sogar eine außerordentlich interessante Funktion ζ(s) definieren, die sogenannte
Riemann’sche ζ-Funktion. Wir werden in [FT1] 6.2.9 zeigen, daß zum Beispiel
2 4 π6
gilt ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945 und nach [FT1] 6.2.7 haben wir sogar ganz
allgemein ζ(2n) ∈ Qπ 2n für beliebige natürliche Zahlen n ≥ 1. Alle diese For-
meln sind berühmte Resultate des 1707 in Basel geborenen Mathematikers Leon-
hard Euler. Als Übung 5.5.28 werden Sie im übrigen zeigen, daß auch die Reihe
der Kehrwerte aller Primzahlen bereits divergiert. Für diejenigen unter Ihnen, die
die komplexen Zahlen bereits kennen, sei erwähnt, daß es mit etwas größerem
Aufwand sogar gelingt, ζ(s) zu definieren für jede komplexe Zahl s 6= 1, ver-
gleiche etwa [FT1] 7.1.7. Die vielleicht berühmteste Vermutung der Mathematik,
die Riemann’sche Vermutung, besagt, daß alle Nullstellen der Riemann’schen
ζ-Funktion, die nicht auf der reellen Achse liegen, Realteil 1/2 haben müssen.
Ein Beweis dieser Vermutung hätte weitreichende Konsequenzen für unser Ver-
ständnis der Verteilung der Primzahlen, wie der Beweis des Primzahlsatzes [FT1]
7.1.1 illustriert. Die Riemann’sche Vermutung ist übrigends der Kern des achten
Hilbert’schen Problems.
Definition 4.1.13. Wir sagen, eine Reihe ∞
P
k=0 ak konvergiere absolut, wenn die
ReiheP∞der Absolutbeträge der Reihenglieder konvergiert, wenn also in Formeln
gilt k=0 |ak | < ∞.
Beispiel 4.1.14. Die sogenannte alternierende harmonische Reihe

X 1 1 1 1
(−1)k+1 = 1 − + − + ...
k=1
k 2 3 4

konvergiert, aber nicht absolut. Daß die Reihe nicht absolut konvergiert, hatten wir
schon in 4.1.11 gesehen. Um zu zeigen, daß unsere Reihe dennoch konvergiert,
beachten wir, daß für die Folge sn der Partialsummen gilt

s2 ≤ s4 ≤ s6 ≤ . . . s5 ≤ s3 ≤ s1

Folglich existiert S = sup{s2 , s4 , . . .}. Da aber gilt s2k ≤ S ≤ s2k+1 für alle
k erhalten wir |S − sn | ≤ n1 und folglich limn→∞ sn = S. Wir werden in 6.4.1
sehen, daß genauer gilt 1 − 12 + 13 − 41 + . . . = log 2.
Satz 4.1.15. Jede absolut konvergente Reihe konvergiert.
Beweis. Sei ∞
P
k=0 ak unsere absolut konvergente Reihe. Seien

n
X n
X
sn = ak , Sn = |ak |
k=0 k=0

104
die Partialsummen der Reihe selbst und der Reihe der Absolutbeträge. Nach An-
nahme konvergiert die Folge der PnSn in R und istPalso
n
eine Cauchy-Folge. Da aber
für n > m gilt |sn − sm | = | k=m+1 ak | ≤ k=m+1 |ak | = Sn − Sm , ist dann
auch sn eine Cauchy-Folge und konvergiert in R nach 3.6.8.
P
Proposition 4.1.16 (Majorantenkriterium). Sei ak eine Reihe. Gibt es für
unsere
P Reihe eine konvergente Majorante, als da heißt eine P
konvergente Reihe
bk mit |ak | ≤ bk für fast alle k, so konvergiert unsere Reihe ak absolut.

Beweis. Indem wir endlich viele Glieder abändern, dürfen wir ohne Beschränkung
P
der Allgemeinheit annehmen, daß |ak | ≤ bk sogar für alle k gilt. Die Reihe |ak |
besteht nun aus nichtnegativen
P Gliedern und die Folge ihrer Partialsummen ist
beschränkt durch bk . Aus der KonvergenzPbeschränkter nichtnegativer Reihen
4.1.10 folgt damit die Konvergenz der Reihe |ak |.

Korollar 4.1.17 (Quotientenkriterium). Sei (ak ) einePFolge. Gibt es θ < 1 mit


|ak+1 | ≤ θ|ak | für fast alle k, so konvergiert die Reihe ak absolut.

4.1.18. Gilt ak 6= 0, so kann man die Bedingung zu |ak+1 /ak | ≤ θ umschreiben,


deshalb die Bezeichnung als Quotientenkriterium.
4.1.19. Bei diesem Kriterium ist wesentlich, daß θ nicht von k abhängt. Die Un-
gleichungen |ak+1 /ak | < 1 gelten
P ja1 auch für die divergente harmonische Reihe.
Es gibt jedoch auch Reihen wie k2
, die absolut konvergieren, obwohl sie unser
Kriterium nicht dazu zwingt.
Beweis. Indem wir endlich viele Glieder abändern, dürfen wir ohne Beschränkung
der Allgemeinheit annehmen, daß |ak+1 | ≤ θ|ak | sogar für alle k gilt. Daraus folgt
| ≤ |a0 |θk für alle k. Mithin ist die nach 4.1.5 konvergente geometri-
induktiv |akP
sche Reihe |a0 |θk eine Majorante unserer Reihe und wir können das Majoran-
tenkriterium 4.1.16 anwenden.
P
Korollar 4.1.20. Sei ak eine Reihe mit nichtverschwindenden
P Gliedern. Gilt
limk→∞ |ak+1 /ak | < 1, so konvergiert die Reihe ak absolut.

Beweis. Klar nach dem Quotientenkriterium 4.1.17.


P∞
Satz 4.1.21 (Umordnungssatz). Ist P k=0 ak eine absolut konvergente Reihe und
u : N → N eine Bijektion, so ist auch ∞ k=0 au(k) eine absolut konvergente Reihe
und es gilt
X∞ X∞
au(k) = ak
k=0 k=0

105
P
Beweis.
P∞ Da |ak | konvergiert, finden wir schon mal für jedes ε > 0 ein N mit
k=N +1 |a k | ≤ ε. Ist M so groß, daß gilt u({1, . . . , M }) ⊃ {1, . . . , N }, so er-
halten wir daraus für alle n ≥ N die Abschätzung
M
X n
X
au(k) − ak ≤ ε
k=0 k=0

Diese Abschätzung gilt nach der Erhaltung 3.5.37 von Ungleichungen im Grenz-
wert und der Vertauschbarkeit 3.5.28 von stetigen Funktionen und insbesondere
der Betragsfunktion mit Grenzwerten dann auch im Grenzwert n → ∞ und zeigt,
daß die Folge der Partialsummen der umgeordneten Reihe konvergiert und den-
selben Grenzwert hat wie die Folge der Partialsummen der ursprünglichen Reihe.
Wenden wir diese Erkenntnis auf die Reihe der Absolutbeträge an, so folgt auch
die absolute Konvergenz der umgeordneten Reihe.
4.1.22
P (Problematik der Umordnung nicht absolut konvergenter Reihen). Ist
ak eine konvergente Reihe reeller Zahlen, die nicht P
absolut konvergiert, so gibt
es für jedes x ∈ R̄ eine Umordnung u : N → N mit ∞

k=0 au(k) = x. In der Tat
divergieren in diesem Fall die Reihen ihrer positiven und ihrer negativen Terme
jeweils für sich genommen. Die Strategie im Fall x ∈ R ist nun, erst nur positi-
ve Reihenglieder zu nehmen, bis man oberhalb von x ist, dann nur negative, bis
man wieder drunterrutscht, und immer so weiter. Für x = ±∞ muß man diese
Strategie noch etwas verfeinern.

Definition* 4.1.23. Gegeben eine Familie von reellen Zahlen (ai )i∈I und s ∈ R̄
schreiben wir X
ai = s
i∈I

als Abkürzung für die Aussage, daß es für jede Umgebung U von s eine endli-
che Teilmenge P IU ⊂ I gibt derart, daß für jede endliche Teilmenge J ⊂ I mit
IU ⊂ J gilt i∈J ai ∈ U . Es ist klar, daß hier s eindeutig bestimmt ist, wenn es
existiert. Ist zusätzlich s reell, so nennen wir unsere Familie von reellen Zahlen
summierbar.

4.1.24. Mir gefällt am Konzept der Summierbarkeit, daß darin von einer Reihen-
folge der Summanden erst gar nicht die Rede ist. Später, wenn wir auch in „nor-
mierten“ Vektorräumen unendlicher Dimension summieren, sind Summierbarkeit
und absolute Konvergenz nicht mehr gleichbedeutend, und dann erweist sich das
Analogon der Summierbarkeit 4.1.23 als der nützlichere Begriff.

Satz* 4.1.25 (Summierbarkeit und absolute Konvergenz). Eine Familie (ai )i∈I
von reellen Zahlen ist genau dann summierbar, wenn entweder I endlich ist oder

106
P∞
es eine Injektion z : N ,→ I gibt mit (ai 6= 0 ⇒ i ∈ z(N)) derart, daß k=0 az(k)
absolut konvergiert. In diesem Fall gilt dann
X ∞
X
ai = az(k)
i∈I k=0

Beweis. Bei einer summierbaren Familie kann es offensichtlich für alle n ∈ N≥1
höchstens endlich viele Indizes i geben mit ai ≥ 1/n und ebenso höchstens end-
lich viele Indizes i mit ai ≤ −1/n. Ist I unendlich, so finden wir demnach eine In-
jektion z : N ,→ I mit (ai 6= 0 ⇒ i ∈ z(N)). Weiter müssen bei einer summierba-
ren Familie die Werte endlicher Teilsummen offensichtlich eine beschränkte Men-
ge von reellen Zahlen bilden. Das gilt insbesondere für alle endlichen Teilsummen
aus positiven ai ebenso wie für Palle endlichen Teilsummen aus negativen P∞ ai und

zeigt die absolute Konvergenz k=0 |az(k) | < ∞. Setzen wir nun s := k=0 az(k)
und ist U eine Umgebung von s, so finden wir ε > 0 P mit (s − ε, s + ε) ⊂ U und
wegen der absoluten Konvergenz weiter N gibt mit ∞ k=N |az(k) | < ε. Nehmen
wir alsoPIU := z({0, 1, . . . , N − 1}), so folgt für endliches J ⊂ I aus J ⊃ IU
bereits i∈J ai ∈ U und damit

X ∞
X
ai = s = az(k)
i∈I k=0

Daß umgekehrt aus absoluter Konvergenz die Summierbarkeit folgt wie im Satz
behauptet, zeigt dieses Argument gleich mit.

Übungen
Übung 4.1.26. Genau dann läßt sich eine reelle Zahl durch einen periodischen
Dezimalausdruck darstellen, wenn sie rational ist.
Übung 4.1.27. Man zeige das Leibniz’sche Konvergenzkriterium:
P∞ Ist ak eine
k
monoton fallende Nullfolge, so konvergiert die Reihe k=0 (−1) ak .
P
Ergänzende Übung 4.1.28. Ist ak eine konvergente Reihe reeller Zahlen und

u : N → N eine Umordnung mit der Eigenschaft,P daß |u(k) − k| beschränkt ist,
so konvergiert auch die umgeordnete Reihe au(k) und zwar gegen denselben
Grenzwert. Für derartige Umordnungen erhält man also die Aussage des Umord-
nungssatzes auch ohne absolute Konvergenz.
Ergänzende Übung 4.1.29. Gegeben eine summierbare Familie von reellen Zah-
len (ai )i∈I zeige man, daß auch für eine beliebige Teilmenge J ⊂FI die Familie
(ai )i∈J summierbar ist und daß für eine beliebige Zerlegung I = k∈K I(k) von

107
I in eine Vereinigung von paarweise disjunkten Teilmengen I(k) gilt
 
X X X
ai =  ai 
i∈I k∈K i∈I(k)

Weiter zeige man für jede aufsteigende


P P Teilmengen I0 ⊂ I1 ⊂ . . . mit
Folge von
Vereinigung I die Formel i∈I ai = limn→∞ i∈In ai . Diese Aussagen werden
sich im übrigen als Speziallfälle des Satzes von Fubini [AN3] 1.7.16 und des
Satzes über dominierte Konvergenz [AN3] 1.6.10 aus der Theorie des Lebesgue-
Integrals erweisen.

4.2 Wachstum und Zerfall


Definition 4.2.1. Für alle reellen Zahlen x ∈ R setzen wir

X xk x2 x3
exp(x) := =1+x+ + + ...
k=0
k! 2 6
und erhalten so eine Abbildung exp : R → R, die Exponentialfunktion.
4.2.2. Die fragliche Reihe konvergiert für alle x ∈ R nach dem Quotientenkri-
terium oder noch besser seinem Korollar 4.1.20, und sie konvergiert sogar au-
ßerordentlich schnell. Von einem formalen Standpunkt aus betrachtet ist unsere
Definition also völlig unproblematisch und von einem rechentechnischen Stand-
punkt aus betrachtet ist sie sogar ziemlich geschickt. Sie hat nur den Nachteil, daß
aus der Definition heraus weder klar wird, warum gerade diese Funktion den Na-
men Exponentialfunktion verdienen sollte, noch warum sie überhaupt von Belang
ist. Ich erläutere das in den gleich anschließenden Bemerkungen 4.2.6 und 4.2.5.
Proposition 4.2.3 (Exponentialfunktion als Grenzwert von Potenzen). Es gilt
 x n
exp(x) = lim 1 +
n→∞ n
Beweis. Mit der binomischen Formel 1.1.23 ergibt sich
n   ∞
 x n X n  x k X xk n(n − 1) . . . (n − k + 1)
1+ = =
n k=0
k n k=0
k! n · n · ... · n
Für beliebige M, n ∈ N mit n ≥ 1 gilt also
n xk
exp(x) − 1 + nx ≤ exp(x) − M
P
k=0 k!

xk xk n(n−1)...(n−k+1)
PM PM
+ k=0 k! − k=0 k! n · n · ... · n

P∞ xk n(n−1)...(n−k+1)
+ k=M +1 k! n · n · ... · n

108
Da die Exponentialreihe für vorgegebenes x absolut konvergiert, gibt es für jedes
ε > 0 ein M = Mε derart, daß für jedes n der erste und der letzte Term rechts
beschränkt sind durch ε. Für dies feste M geht der mittlere Term bei n → ∞
gegen Null, es gibt also N = Nε derart, daß
n er für dies feste M kleiner wird als ε
falls n ≥ N . Damit gilt exp(x) − 1 + nx ≤ 3ε falls n ≥ N .
4.2.4. Aus unserer Proposition 4.2.3 folgt unmittelbar für alle k ∈ N≥1 die Formel
exp(kx) = (exp x)k vermittels der Rechnung
 n  kn
kx kx  x nk
exp(kx) = lim 1 + = lim 1 + = lim 1 + = (exp x)k
n→∞ n n→∞ kn n→∞ n

Mit der Notation e := exp(1) erhalten wir insbesondere


√ exp(k) = ek und dann
auch e = exp(k/k) = (exp(1/k))k alias
√ exp(1/k) = k e und zusammen für alle
p
p, q ∈ N≥1 die Formel exp(p/q) = ( e) . Alternativ folgt das alles auch aus der
q

Funktionalgleichung 4.2.10.
4.2.5 (Exponentialfunktion und Wachstum). Die Darstellung der Exponenti-
alfunktion als Grenzwert von Potenzen 4.2.3 kann man dahingehend interpretie-
ren, daß exp(x) das Kapital ist, das in x Jahren aus einem Euro entsteht bei ei-
ner „kontinuierlichen Verzinsung mit einem Zinssatz von 100%“. Legen wir das
Geld zum Beispiel für ein Jahr an, so haben wir bei jährlicher Verzinsung am
Ende des Jahres zwei Euro auf dem Konto. Bei monatlicher Verzinsung ergeben
1 12
sich mit Zinseszinsen schon (1 + 12 ) Euro, und bei kontinuierlicher Verzinsung
e := exp(1) = 2,781 . . . Euro. Man nennt e die Euler’sche Zahl. In der Schule
haben Sie möglicherweise ex statt exp(x) geschrieben, aber wir erlauben uns das
erst ab 4.3.5, wo wir für beliebiges a > 0 die Abbildung Z → R, n 7→ an zu
einer Abbildung R → R, b 7→ ab fortsetzen und zwar nach 4.3.21 auf die einzig
mögliche Weise, bei der die Funktion b 7→ ab monoton ist und die „Funktional-
gleichung“ ab+c = ab ac erfüllt.

4.2.6. In einem Ausdruck der Gestalt ab nennt man für gewöhnlich a die Basis und
b den Exponenten, weil er eben exponiert oben an die Basis geschrieben wird.
Daher rührt auch die Bezeichnung als „Exponentialfunktion“. Ich würde unsere
Funktion viel lieber ihrer Natur nach die „Funktion des natürlichen Wachstums“
oder die „Wachstumsfunktion“ nennen, aber die aus der Schreibweise abgeleitete
Bezeichnung hat sich nun einmal durchgesetzt, mag sie auch aus historischen Zu-
fällen entstanden sein: Hätte sich für die Bezeichnung des Quadrats einer Zahl a
statt der Notation a2 die Notation a2 eingebürgert, so würde in Anbetracht dieses
Schemas der Begriffsbildung unsere Exponentialfunktion heute vielleicht „Pedes-
talfunktion“ heißen. . .

109
Der Graph der Exponentialfunktion in zwei Maßstäben. Man erkennt unschwer,
daß ein konstantes Wirtschaftswachstum über längere Zeiträume in einer
Katastrophe enden muß. In derselben Weise entwickelt sich im Übrigen auch die
Geschwindigkeit einer Vorlesung unter der Annahme, daß die Stoffmenge, die in
einer Stunde vermittelt werden kann, proportional ist zur Menge des Stoffes, den
die Zuhörer bereits kennen. . .

110
4.2.7 (Didaktische Gedanken zur Einführung der Exponentialfunktion). Eine
infinitesimale Formulierung der in 4.2.5 erläuterten Bedeutung der Exponential-
funktion gibt Korollar 5.5.9, in dem die Exponentialfunktion charakterisiert wird
als die eindeutig bestimmte differenzierbare Funktion von den reellen Zahlen in
sich selber, die mit ihrer eigenen Ableitung übereinstimmt und bei Null den Wert
Eins annimmt. Gehen wir von dieser Charakterisierung aus, so führt uns der For-
malismus der Taylorreihen 6.2.2 ganz natürlich zu der Reihe, die wir in 4.2.1
haben vom Himmel fallen lassen. Ein Randerer Zugang zur Exponentialfunktion
x
besteht darin, von der Funktion x 7→ 1 (1/t) dt auszugehen, von der man un-

schwer zeigt, daß sie einen stetigen Gruppenisomorphismus R× → R liefert, und
dann die Exponentialfunktion als deren Umkehrfunktion zu erhalten. Das bedeu-
tet jedoch, daß man mit der Einführung der Exponentialfunktion die Konstruktion
des Integrals abwarten muß. Eigentlich will ich es ja nach Möglichkeit vermei-
den, Formeln vom Himmel fallen zu lassen. In diesem Fall schienen mir aber die
didaktischen Vorteile der dadurch ermöglichten frühzeitigen Einführung dieser
außerordentlich wichtigen Funktion zu überwiegen.
4.2.8. Die Exponentialfunktion wächst ungeheuer schnell. Eine gewisse Vorstel-
lung davon mag die Erkenntnis 7.1.16 geben, nach der der Graph der Funktion
(exp(x)+exp(−x))/2, in einem jeweils der speziellen Situation angepaßten Maß-
stab auf die Wand gemalt, genau die Gestalt einer zwischen zwei Nägeln durch-
hängenden Kette hat. Ist die Kette zwanzigmal so lang ist wie der Abstand der
beiden Nägel, so stellt sie unsere Funktion in etwa auf dem Intervall von −2,3 bis
2,3 dar. Ist die Kette zweihundertmal so lang wie der Abstand der beiden Nägel,
so erhalten wir unsere Funktion in etwa auf dem Intervall von −4,6 bis 4,6. Und
eine Zwei-Meter-Kette hängt zwischen zwei im Abstand von einem knappen Zen-
timeter eingeschlagenen Nägeln schon recht steil!
4.2.9. In 1.3.11 habe ich erklärt, wie man mit einem Blatt Papier auf den Mond
kommt und wie auch der Fortgang dieser Vorlesung exponentiellen Charakter hat.
In der Wirtschaft ist es nicht anders. Ein jährliches Wirtschaftswachstum von 3%
bedeutet wegen (1, 03)25 > 2 etwas mehr als eine Verdopplung der Wirtschafts-
leistung in 25 Jahren und muß auf die Dauer unweigerlich in einer Katastrophe
enden.
Satz 4.2.10 (Funktionalgleichung der Exponentialfunktion). Die Exponential-
funktion ist ein Monoidhomomorphismus von der additiven Gruppe der reellen
Zahlen in das multiplikative Monoid der reellen Zahlen. In Formeln ausgedrückt
gilt also exp(0) = 1 und
exp(x + y) = exp(x) exp(y) ∀x, y ∈ R
4.2.11. Unsere Formel exp(kx) = (exp x)k aus 4.2.4 können wir auch unschwer
mit Induktion über k aus der Funktionalgleichung herleiten.

111
4.2.12. Stellen wir uns exp(x) vor als das Vermögen, daß in x Jahren aus einem
Euro entsteht bei kontinuierlicher Verzinsung mit 100%, so erhalten wir offen-
sichtlich gleichviel, ob wir unser Vermögen exp(x) nach x Jahren gleich wieder
für y Jahre anlegen, oder ob wir unseren Euro gleich von Anfang an x + y Jah-
re arbeiten lassen. Das ist die Bedeutung der Funktionalgleichung. Nach 1.5.43
induziert jeder Monoidhomomorphismus (R, +) → (R, ·) einen Gruppenhomo-
morphismus R → R× . In 4.3.21 werden Sie zeigen, daß die Gruppenhomomor-
phismen ϕ : R → R× mit der Eigenschaft x < y ⇒ ϕ(x) < ϕ(y) genau die
Abbildungen ϕ(x) = exp(ax) sind mit a > 0. In 4.3.2 werden wir zeigen, daß die
Exponentialfunktion sogar einen Isomorphismus zwischen der additiven Gruppe
der reellen Zahlen und der multiplikativen Gruppe der positiven reellen Zahlen
liefert.
Ergänzung 4.2.13. Der gleich folgende Beweis der Funktionalgleichung gefällt
mir nicht besonders. Ein anderer aber in seiner Weise auch etwas verwickelter
Beweis wird in 4.2.22 vorgestellt. Ein mehr konzeptueller Zugang zur Exponen-
tialfunktion und ihrer Funktionalgleichung wird in 5.8.11 und 5.8.22 skizziert. Er
benötigt jedoch Hilfsmittel, die uns hier noch nicht zur Verfügung stehen. Er läßt
auch nicht so einfach auf den Fall von komplexen Zahlen verallgemeinern, der
für uns bei der Diskussion von Sinus und Cosinus eine wesentliche Rolle spie-
len wird. Aus diesen Gründen gebe ich für die Funktionalgleichung zunächst den
algebraisch-formalen Beweis. Wir schicken dem eigentlichen Beweis einige all-
gemeine Betrachtungen voraus.

Satz 4.2.14 (Produkt von Reihen). Sind ∞


P P∞
i=0 a i und j=0 bj absolut konver-

gente Reihen, so konvergiert auch für jede Bijektion (u, v) : N → N × N die
Summe der Produkte au(k) bv(k) absolut und es gilt
∞ ∞
! ∞ !
X X X
au(k) bv(k) = ai bj
k=0 i=0 j=0

Beweis. Natürlich haben wir



n
! ∞
!
X X X
|au(k) bv(k) | ≤ |ai | |bj |
k=0 i=0 j=0

und das zeigt bereits die absolute Konvergenz der Reihe ∞


P
k=0 au(k) bv(k) . Nach
dem Umordnungssatz 4.1.21 ist ihr Grenzwert also unabhängig von der Wahl der

Bijektion (u, v) : N → N × N. Nun können wir diese Bijektion sicher so wählen,
daß sie Bijektionen

{0, . . . , N 2 − 1} → {0, . . . , N − 1} × {0, . . . , N − 1}

112
induziert. Dann gilt offensichtlich
N 2 −1 N −1
! N −1
!
X X X
au(k) bv(k) = ai bj
k=0 i=0 j=0

Im Limes für N → ∞ und unter Verwendung der Erkenntnisse, daß jede absolut
konvergene Reihe konvergent ist und daß jede Teilfolge einer konvergenten Folge
gegen denselben Genzwert konvergiert, folgt die Behauptung.
Beweis der Funktionalgleichung 4.2.10. Wir rechnen
P∞ 1
exp(x + y) = (x + y)k
Pk=0

k! 
1
P k! i j

= k=0 k! i+j=k i!j! x y
P∞ P xi xj

= k=0 i+j=k i! j!

Hier verwenden wir im zweiten Schritt die binomische Formel und der Index i +
j = k an einer Summe bedeutet, daß wir über alle Paare (i, j) ∈ N × N mit
i+j = k summieren. Andererseits erhalten wir mit unserem Satz über das Produkt

von Reihen 4.2.14 bei einer geeigneten Wahl der Bijektion (u, v) : N → N × N
und nach Übergang zu einer Teilfolge der Folge der Partialsummen auch
P  P 
∞ xi ∞ yj
exp(x) exp(y) = i=0 i! j=0 j !

P∞ P xi y j

= k=0 i+j=k i! j!

Die Identität exp(0) = 1 ist offensichtlich.

Lemma 4.2.15. Die Exponentialfunktion exp : R → R ist stetig.

Vorschau 4.2.16. Die Stetigkeit der Exponentialfunktion können wir später auch
aus dem allgemeinen Satz 6.1.4 folgern, der besagt, daß Potenzreihen auf ihrem
Konvergenzbereich immer stetige Funktionen darstellen.
Beweis. Wir wenden das ε-δ-Kriterium 3.2.21 an. Mit der Funktionalgleichung
finden wir

| exp(x) − exp(p)| = | exp(p)| · | exp(x − p) − exp(0)|

Nun beachten wir, daß für |y| ≤ 1 gilt


∞ ∞
X y i−1 X |y|i−1
| exp(y) − exp(0)| = |y| · ≤ |y| · ≤ |y| exp(1)
i=1
i! i=1
(i − 1)!

113
wo wir im zweiten Schritt die Dreiecksungleichung sowie die Erhaltung von Un-
gleichungen im Grenzwert verwenden und die Nenner verkleinern. Aus |x − p| ≤
1 folgt also | exp(x) − exp(p)| ≤ exp(p)|x − p| e und für gegebenes ε > 0 können
wir mithin δ = inf{1, ε/(exp(p) e)} nehmen.

Korollar* 4.2.17 (Produkt summierbarer Familien). Sind (ai )i∈I und (bj )j∈J
summierbare Familien reeller Zahlen, so bilden auch ihre Produkte eine summier-
bare Familie (ai bj )(i,j)∈I×J und es gilt
! !
X X X
ai b j = ai bj
(i,j)∈I×J i∈I j∈J

Beweis. Wir wissen aus 4.1.25, daß die Summierbarkeit einer Familie reeller Zah-
len im wesentlichen gleichbedeutend ist zu absoluter Konvergenz. Damit erweist
sich das Korollar als eine Umformulierung des vorhergehenden Satzes.

Übungen
Übung 4.2.18. Man folgere aus der Funktionalgleichung der Exponentialfunktion
4.2.10 die Formeln exp(−x) = exp(x)−1 , exp(x)p > 0 ∀x ∈ R, exp(n) = en ,
exp(nx) = (exp x)n ∀n ∈ Z sowie exp(x/2) = exp(x).
Ergänzende Übung 4.2.19. Der Übersichtlichkeit halber kürzen wir hier im Vor-
griff auf 4.3.5 schon exp(x) = ex ab. Man zeige, daß für alle i, N ∈ N gilt
  i  N n−i
N i e−N

nN 1 1
lim 1− =
n→∞ i n n i!

Dieses Resultat ist in der Stochastik wichtig, wie ich im folgenden ausführen will.
Gegeben λ ∈ R heißt die Funktion i 7→ λi e−λ /i! ganz allgemein die Poisson-
Verteilung mit Parameter λ. Sie hat die folgende Bedeutung: Knetet man in einen
großen Teig genau nN Rosinen ein und teilt ihn dann in n Rosinenbrötchen, so
i N n−i
ist n1 1 − n1 die Wahrscheinlichkeit, daß i vorgegebene Rosinen in ei-
nem fest gewählten Brötchen landen und die restlichen Rosinen in den anderen
 1 i 1 N n−i
Brötchen. Mithin ist nN

i n
1 − n
die Wahrscheinlichkeit, daß in ei-
nem fest gewählten Brötchen genau i Rosinen landen. Ist unser Brötchen klein
im Vergleich zum ganzen Teig, so liegt diese Wahrscheinlichkeit also nahe bei
N i e−N /i! oder allgemeiner bei λi e−λ /i! mit λ der durchschnittlichen Zahl von
Rosinen in dem Teigvolumen, das man für ein Brötchen braucht. Genau genom-
men stimmt das allerdings nur für punktförmige Rosinen, denn sonst liefert die
Größe des Brötchens eine obere Schranke für die möglichen Anzahlen der darin
verbackenen Rosinen.

114
Ergänzende Übung 4.2.20. Man berechne die Euler’sche Zahl e bis auf 5 sichere
Stellen hinter dem Komma.
Ergänzende Übung 4.2.21. Die Euler’sche Zahl e ist nicht rational. Man zeige
dies, indem man von ihrer Darstellung als Reihe ausgeht und durch geeignete
Abschätzungen nachweist, daß q!e für q ∈ N mit q ≥ 2 nie eine ganze Zahl sein
kann.
Ergänzende Übung 4.2.22. In dieser Übung sollen Sie einen anderen Zugang zur
Funktionalgleichung der Exponentialfunktion ausarbeiten, den ich in einer Arbeit
von Martin Kneser kennengelernt habe: Man zeige, indem man den Beweis von
 für jede Folge reeller Zahlen xn ∈ R aus limn→∞ xn =
4.2.3 verallgemeinert, daß
xn n
x folgt limn→∞ 1 + n = exp(x). Mithilfe der Identität
 
 x  y x + y + (xy/n)
1+ 1+ = 1+
n n n
folgere man dann die Funktionalgleichung.

4.3 Logarithmus und allgemeine Potenzen


4.3.1 (Monotonie der Exponentialfunktion). Die Exponentiafunktion wächst
streng monoton. In der Tat erhalten wir (0 ≤ x < y) ⇒ (1 ≤ exp(x) < exp(y))
direkt aus der Definition und (z < w ≤ 0) ⇒ (exp(z) < exp(w) ≤ 1) folgt mit
der Identität exp(−x) = exp(x)−1 .
Definition 4.3.2. Aus dem Zwischenwertsatz folgt exp(R) = (0, ∞), denn wir
haben offensichtlich limn→∞ exp(n) = ∞ und damit limn→−∞ exp(n) = 0 nach
3.3.4. Wir können also den natürlichen Logarithmus oder kurz Logarithmus
einführen als die Umkehrfunktion

log : (0, ∞) → R

der Exponentialfunktion, log(exp(x)) = x, und erhalten aus Satz 3.3.11 die Ste-
tigkeit des Logarithmus. In der französischen Literatur bezeichnet man diese Funk-
tion auch als logarithme népérien in Erinnerung an den schottischen Mathema-
tiker John Napier, der die ersten Logarithmentafeln aufstellte.
4.3.3. Die Exponentialfunktion liefert nach 4.2.10 und 4.3.2 einen Isomomorphis-
mus zwischen der additiven Gruppe der reellen Zahlen und der multiplikativen
Gruppe aller positiven reellen Zahlen. Daraus folgt sofort

log(xy) = log x + log y und log(e) = 1.

Die erste Formel mag man die Funktionalgleichung des Logarithmus nennen.

115
Die Graphen von Logarithmus und Exponentialfunktion gehen wie immer bei
Umkehrfunktionen durch Spiegelung an der Hauptdiagonalen x = y auseinander
hervor.

116
4.3.4 (Diskussion der Terminologie). Die Notation „log“ ist leider nicht univer-
sell. Auf vielen Taschenrechnern und auch in älteren Büchern wird unsere Funk-
tion „log“ notiert als „ln“ für „logarithmus naturalis“ oder „logarithme néperien“
und das Kürzel „log“ steht für den „Logarithmus zur Basis 10“, den wir in 4.3.9
einführen und mit log10 bezeichnen werden. Der Logarithmus zur Basis 10 wird
in manchen Quellen auch der „Brigg’sche Logarithmus“ genannt und mit „lg“
bezeichnet. Die Norm ISO 31-11 empfiehlt die Notationen „ln“ und „lg“. Wir
verwenden jedoch log statt ln, weil das in der reinen Mathematik so üblich ist
und wir damit der Konvention folgen, spezielle Funktionen nach Möglichkeit mit
Kürzeln aus drei Buchstaben zu notieren. „Logarithmus“ ist das griechische Wort
für „Rechnung“, und für das Rechnen waren die Logarithmentafeln, in denen die
Werte des Logarithmus zur Basis Zehn aufgelistet wurden, auch außerordentlich
praktisch: Mit ihrer Hilfe konnte man nämlich Divisionen in Subtraktionen ver-
wandeln und Wurzelziehen in Divisionen, wie wir gleich näher ausführen. Die
Entdeckung der Logarithmen und die ersten Logarithmentafeln von Napier be-
deuteten für die damalige Wissenschaft eine ungeheure Arbeitserleichterung und
wurden begeistert begrüßt.

Definition 4.3.5 (Allgemeine Potenzen). Gegeben a, x ∈ R mit a > 0 setzen wir

ax := exp(x log a)

Im Fall x > 0 vereinbart man zusätzlich 0x = 0. Das führt dazu, daß für x > 0 die
Funktion a 7→ ax sogar stetig ist auf [0, ∞). Es führt allerdings auch dazu, daß die
Funktion x 7→ 0x mit unserer Konvention 00 = 1 zwar auf [0, ∞) definiert aber
bei x = 0 nicht stetig ist. Damit müssen wir nun weiterleben.

4.3.6 (Eigenschaften der allgemeinen Potenzen). Man prüft ohne Schwierigkei-


ten die Formeln a0 = 1, a1 = a und ax+y = ax ay und folgert insbesondere, daß
im Fall a > 0 und n ∈ Z oder a ≥ 0 und n ∈ Z≥1 das hier definierte an über-
einstimmt mit unserem an aus 1.5.16. Für beliebige a, b > 0 und x, y ∈ R prüft
man leicht die Rechenregeln axy = (ax )y , (ab)x = ax bx und log(ax ) = x log a.
Ist speziell a = e die Euler’sche Zahl, so gilt log e = 1 und folglich exp(x) = ex .
Für beliebige a, b ≥ 0, x, y ∈ R>0 und q ∈ N, √q ≥ 1 prüft man ebensoleicht die
Rechenregeln axy = (ax )y , (ab)x = ax bx und q a = a1/q .
4.3.7 (Einige Grenzwerte mit Exponentialfunktion und Logarithmus). Aus
dem Quetschlemma 3.5.35 und der Darstellung von ex durch die Exponentialreihe
folgt limx→∞ ex = ∞. Aus 3.5.7 und 3.3.2 folgt dann limy→∞ log y = ∞. Das
Quetschlemma mit der Darstellung von ex duch die Exponentialreihe liefert auch
limx→∞ (x/ ex ) = 0 und durch Substitution x = log y und 3.5.7 und 3.2.30 folgt
dann limy→∞ (log y)/y = 0.

117
Dieses Bild stellt den unangenehm verzwickelten Bereich aller (x, a) ∈ R2 dar,
für die ax definiert ist: Bei x ∈ N sind das jeweils alle a ∈ R, bei x ∈ Z<0 nur
alle a ∈ R× , bei reellem nichtganzen x > 0 alle a ≥ 0, bei reellem nichtganzen
x < 0 alle a > 0. Besonders schlimm ist die Unstetigkeitsstelle am Ursprung, auf
der senkrechten Koordinatenachse ist ja unsere Funktion konstant Eins und auf
der positiven waagerechten Koordinatenachse konstant Null. Diese
Unstetigkeitsstelle ist aber auch die Einzige.

118
Satz 4.3.8 (Gruppenwege in R× ). Die stetigen Gruppenhomomorphismen R →
R× von der additiven Gruppe der reellen Zahlen in die multiplikative Gruppe der
von Null verschiedenen reellen Zahlen sind genau die Abbildungen x 7→ ax für
beliebiges aber festes a ∈ R>0 .

Beweis. Ist G : R → R× ein stetiger Gruppenhomomorphismus, so bildet G not-


wendig das neutrale Element auf das neutrale Element ab, in Formeln G(0) = 1.
Mit dem Zwischenwertsatz folgt G(x) > 0 ∀x ∈ R. Damit können wir den Grup-
penhomomorphismus F = log ◦G : R → R bilden und aus 3.5.40 folgt sofort
F (x) = xF (1), also G(x) = exp(F (x)) = exp(xF (1)) = exp(x log G(1)).

Definition 4.3.9. Gegeben a > 1 nennt man die Umkehrabbildung der streng
monoton wachsenden Abbildung x 7→ ax auch den Logarithmus zur Basis a

loga : (0, ∞) → R

4.3.10. Der natürliche Logarithmus ist also der Logarithmus mit der Euler’schen
Zahl e als Basis, in Formeln log = loge . Der Logarithmus zur Basis a läßt sich
durch den natürlichen Logarithmus ausdrücken vermittels der Formel loga x =
log x
log a
. Man kommt deshalb meist mit dem natürlichen Logarithmus aus. Die No-
tation loga ist konform mit der Norm ISO 31-11, in der zusätzlich auch noch die
Abkürzung log2 = lb für den binären Logarithmus empfohlen wird. In Loga-
rithmentafeln wird üblicherweise der Logarithmus zur Basis 10 tabelliert, weil ja
gilt log10 (10 · x) = 1 + log10 (x) und man sich so auf Dezimalausdrücke x mit
einer Null vor dem Komma und keiner Null nach dem Komma beschränken kann.
Beispiel 4.3.11. Für alle a > 0 folgt aus der Stetigkeit der Exponentialfunktion
und indem man für ein logisch vollständiges Argument die folgende Gleichungs-
kette von hinten nach vorne liest

limn→∞ n a = limn→∞ exp n1 log a


= exp limn→∞ n1 log a




= exp(0)
= 1

Beispiel 4.3.12. Aus dem Quetschlemma 3.5.35 und der Darstellung von ex durch
die Exponentialreihe folgt limx→∞ ex = ∞. Aus 3.5.7 und 3.3.2 folgt dann weiter
limy→∞ log y = ∞. Das Quetschlemma mit der Darstellung von ex duch die Ex-
ponentialreihe liefert auch limx→∞ (x/ ex ) = 0 und durch Substitution x = log y
und 3.5.7 sowie 3.2.30 folgt limy→∞ (log y)/y = 0.

119
Übungen
P
Ergänzende Übungp4.3.13. Sei ak eine Reihe. Man zeige
P das Wurzelkriteri-
um: Gilt limk→∞ |ak | < 1, so konvergiert die Reihe
k
ak absolut. Hinweis:
Analog zum Beweis des Quotientenkriteriums. Meiner Erfahrung nach ist dies
Kriterium in der Praxis selten von Nutzen, da es meist auf schwer zu bestimmen-
de Grenzwerte führt.
Übung 4.3.14. Man folgere aus der Funktionalgleichung 4.3.3 des Logarithmus

die Formeln log(1) = 0, log(x−1 ) = − log(x), log(xn ) = n log(x) und log( q x) =
1
q
log(x).

Übung 4.3.15. Man zeige für a > 0 die Identität limn→∞ n(1 − n a) = log a.
Übung 4.3.16. Man zeige limx→∞ (xa /bx ) = 0 für alle a ∈ R und
√ b > 1. Man
c
zeige limx→∞ (log x/x ) = 0 für alle c > 0. Man zeige limn→∞ n = 1. Man
n

zeige s
(5n)!
lim n
= 55
n→∞ (n!)5
Beispiel 4.3.17. Bei einem radiokativen Material wird nach einem Tag nur noch
90% der Strahlungsaktivität gemessen. Wie lange dauert es, bis die Aktivität auf
die Hälfte abgeklungen ist? Nun, halten wir einen Referenzzeitpunkt beliebig fest,
so wird die Aktivität nach Vergehen einer Zeitspanne τ gemäß Überlegungen wie
in 4.2.5 gegeben durch eine Formel der Gestalt M ecτ mit unbekannten M und
c. Wir kürzen die Zeiteinheit „Stunde“ ab mit dem Buchstaben h für lateinisch
„hora“. Formal ist h eine Basis des in [EIN] 1.2.6 angedachten eindimensiona-
len reellen Vektorraums „aller Zeitspannen“, und formal ist auch M ein Element
eines gedachten eindimensionalen reellen Vektorraums „aller Strahlungsaktivi-
täten“ und c liegt im Raum der Linearformen auf dem Raum aller Zeitspannen, in
dem wir mit h−1 dasjenige Element bezeichnen werden, das auf h den Wert Eins
annimmt. So formal will ich hier aber eigentlich gar nicht werden und schreibe
das Auswerten solch einer Linearform auf einer Zeitspanne schlicht als Produkt.
90
Für τ = 24 h wissen wir nun nach unserer Messung M ec·24 h = 100 M und damit
−1
c = ((log 9/10)/24) h . Bezeichnet t die Zeitspanne, nach der die Aktivität auf
die Hälfte abgeklungen ist, so haben wir also M ect = M/2 alias ct = − log 2 und
damit
log 2 − log(2) · 24
t=− = h
c log(9/10)
Ergänzende Übung 4.3.18. Das eingestrichene A liegt bei 440 Herz. Bei wie-
viel Herz etwa liegt das eingestrichene F? Hinweis: Die Lösung dieser Aufgabe
benötigt zusätzlich zu mathematischen Kenntnissen auch physikalische und mu-
sikalische Vorkenntnisse.

120
Ergänzung 4.3.19. Versteht man eine positive reelle Zahl als das Verhältnis zweier
gleichartiger Größen, so sagt man für den Zehnerlogarithmus besagter Zahl auch,
er „drücke das Verhältnis in Bel aus“. Diese Sprechweise ehrt Alexander Graham
Bell, der das Telephon einführte. So könnte man etwa sagen, das Verhältnis von
Gramm zu Kilo betrage 3 Bel, statt von einem Verhältnis von Eins zu Tausend
alias 1 zu 103 zu reden. Das Verhältnis von Kilo zu Tonne beträgt natürlich auch
3 Bel, und das Verhältnis von Gramm zu Tonne folglich 6 Bel. Häufig redet man
auch von Dezibel alias „zehntel Bel“. Das ist jedoch „multiplikativ“√zu verstehen,
10
ein Verhältnis von 1 Dezibel meint also ein Verhältnis von Eins zu 10 ≈ 1,26.
Ergänzung 4.3.20. Physikalisch beschreibt man eine Lautstärke durch die Leis-
tung, die sie etwa an einer Membran verrichtet. Gibt man eine Lautstärke in De-
zibel an, so ist allerdings das Verhältnis des Quadrats dieser Leistung zum Qua-
drat der Leistung einer Standardlautstärke gemeint. Diese Standardlautstärke ist
so vereinbart, daß sie etwa bei der Hörschwelle eines menschliches Ohrs liegt.
Eine Lautstärke von Null Dezibel bedeutet also, daß ein gesunder Mensch das
Geräusch so gerade noch hören kann, und jede Erhöhung einer Lautstärke um
zwanzig Dezibel bedeutet, daß das Ohr zehnmal soviel Leistung
√ aufnehmen wird.
Bei einer Erhöhung um zehn Dezibel wird das Ohr also 10 ≈ 3 mal soviel
Leistung aufnehmen.
Ergänzende Übung 4.3.21. Die monotonen Gruppenhomomorphismen R → R×
von der additiven Gruppe der reellen Zahlen in die multiplikative Gruppe der von
Null verschiedenen reellen Zahlen sind genau die stetigen Gruppenhomomorphis-
men, also genau die Abbildungen x 7→ ax für festes a ∈ R>0 .
Ergänzende Übung 4.3.22. Man finde alle stetigen Funktionen G : R× → R mit
G(xy) = G(x) + G(y) ∀x, y ∈ R× , also alle stetigen Gruppenhomomorphismen
von der multiplikativen Gruppe der von Null verschiedenen reellen Zahlen in die
additive Gruppe aller reellen Zahlen.
Ergänzende Übung 4.3.23. Man zeige, daß die Aussage der vorhergehenden Sätze
3.5.40 und 4.3.8 sogar folgt, wenn wir von unseren Gruppenhomomorphismen nur
die Stetigkeit bei Null fordern.

4.4 Komplexe Zahlen


4.4.1. Viele mathematische Zusammenhänge werden bei einer Behandlung im
Rahmen der sogenannten „komplexen Zahlen“ besonders transparent. Ich den-
ke hier etwa an die Integration rationaler Funktionen 5.10 oder die Lösung der
Schwingungsgleichung 7.3.1. Die abschreckenden Bezeichnungen „komplexe Zah-
len“ oder auch „imaginäre Zahlen“ für diesen ebenso einfachen wie konkreten
Körper haben historische Gründe: Als Mathematiker in Italien bemerkten, daß
man polynomiale Gleichungen der Grade Drei und Vier lösen kann, wenn man so

121
Anschauung für das Quadrieren komplexer Zahlen in ihrer anschaulichen
Interpretation als Punkte der komplexen Zahlenebene

122
tut, als ob man aus (−1) eine Quadratwurzel ziehen könnte, gab es noch keine
Mengenlehre und erst recht nicht den abstrakten Begriff eines Körpers 1.6.4. Das
Rechnen mit Zahlen, die keine konkreten Interpretationen als Länge oder Gutha-
ben oder zumindest als Schulden haben, schien eine „imaginäre“ Angelegenheit,
ein bloßer Trick, um zu reellen Lösungen reeller Gleichungen zu kommen.
4.4.2. Der Körper der komplexen Zahlen (C, +, ·) ist die Menge C := R2 mit
Addition und Multiplikation definiert durch

(a, b) + (c, d) := (a + c, b + d)
(a, b) · (c, d) := (ac − bd, ad + bc)

Diese Struktur ist nach Übung 1.6.21 ein Körper und die Abbildung κ : R → C,
a 7→ (a, 0) ist ein Körperhomomorphismus. Kürzen wir κ(a) zu a ab und setzen
i := (0, 1), so gilt i2 = −1 und (a, b) = a + b i. Wenn wir die Vorstellung von C
als die Menge aller Punkte der Koordinatenebene evozieren wollen, sprechen wir
von der komplexen Zahlenebene.
4.4.3. Ich hoffe, Sie werden schnell merken, daß sich viele Fragestellungen bei
Verwendung dieser sogenannt komplexen Zahlen sehr viel leichter lösen lassen
und daß die komplexen Zahlen auch der Anschauung ebenso zugänglich sind wie
die reellen Zahlen. Früher schrieb man „complex“, deshalb die Bezeichnung C.
Unser i ist eine „Wurzel aus (−1)“, und weil es so eine Wurzel in den reellen
Zahlen nicht geben kann, notiert man sie i wie „imaginär“.

4.4.4. Für w ∈ C bedeutet die Additionsabbildung (w+) : C → C, z 7→ w + z


anschaulich die Verschiebung um den Vektor w. Die Multiplikationsabbildung
(w·) : C → C, z 7→ wz dahingegen bedeutet anschaulich diejenige Drehstre-
ckung der komplexen Zahlenebene, die (1, 0) in w überführt.
4.4.5. Gegeben eine komplexe Zahl z = x+y i nennt man x ihren Realteil Re z :=
x und y ihren Imaginärteil Im z := y. Wir haben damit zwei Funktionen

Re, Im : C → R

definiert und es gilt z = Re z + i Im z für alle z ∈ C. Man definiert weiter die


Norm |z| einer komplexen Zahl z = x + y i ∈ C durch
p
|z| := x2 + y 2 ∈ R≥0

Im Fall einer reellen Zahl x ∈ R ist diese Norm genau unser Absolutbetrag aus
2.2.12, in Formeln |x| = |x|. In der Anschauung der komplexen Zahlenebene
bedeutet die Norm einer komplexen Zahl ihren Abstand vom Ursprung.

123
Dies Bild soll zusätzliche Anschauung für die Abbildung z 7→ z 2 der komplexen
Zahlenebene auf sich selbst vermitteln. Es stellt diese Abbildung dar als die
Komposition einer Abbildung der Einheitskreisscheibe auf eine räumliche sich
selbst durchdringende Fläche, gegeben in etwa durch eine Formel der Gestalt
z 7→ (z 2 , ε(Im z)) in C × R ∼= R3 für geeignetes monotones und in einer
Umgebung von Null streng monotones ε, gefolgt von einer senkrechten
Projektion auf die ersten beiden Koordinaten. Das hat den Vorteil, daß im ersten
Schritt nur Punkte der reellen Achse identifiziert werden, was man sich leicht
wegdenken kann, und daß der zweite Schritt eine sehr anschauliche Bedeutung
hat, eben die senkrechte Projektion.

124
4.4.6 (Verschiedene Bedeutungen von |z|). Hier ist unsere Notation nicht voll-
y) ∈ R2 bereits |(x, y)| = max(|x|, |y|) verein-
ständig konsistent, da wir für (x, p
bart hatten und nun |x + iy| = x2 + y 2 setzen. Für Stetigkeitsbetrachtungen
spielt diese Verwirrung keine Rolle, da stets gilt
p √
|(x, y)| ≤ x2 + y 2 ≤ 2 |(x, y)|
Bei der Betrachtung komplexer Zahlen hat bei uns |z| a priori die eben in 4.4.5
eingeführte Bedeutung als „komplexe Norm“.
4.4.7 (Diskussion der Terminologie). Bei rechtem Lichte besehen scheint mir
an dieser Terminologie absonderlich, daß der Imaginärteil einer komplexen Zahl
darin eine reelle Zahl ist, aber so hat es sich nun einmal eingebürgert.
4.4.8. Stellen wir uns |z| vor als den Streckfaktor der Drehstreckung (z·), so wird
anschaulich klar, daß für alle z, w ∈ C gelten muß
|zw| = |z||w|
Besonders bequem rechnet man diese Formel nach, indem man zunächst für z =
x + y i ∈ C die konjugierte komplexe Zahl z̄ = x − y i ∈ C einführt. Im
Bild der komplexen Zahlenebene bedeutet das komplexe Konjugieren anschaulich
die Spiegelung an der reellen Achse. Nun prüft man durch explizite Rechnung
unschwer die Formeln
z + w = z̄ + w̄
z · w = z̄ · w̄
|z|2 = z z̄
Dann rechnet man einfach
|zw|2 = zwzw = z z̄ww̄ = |z|2 |w|2
Nach dem vorhergehenden ist z 7→ z̄ ein Körperisomorphismus C → C, die
komplexe Konjugation. Offensichtlich gilt auch z̄¯ = z und ebenso offensichtlich
gilt |z| = |z̄|.
4.4.10. Für unsere Norm komplexer Zahlen aus 4.4.5 gilt offensichtlich
|z| = 0 ⇔ z = 0
Da in einem Dreieck eine einzelne Seite nicht länger sein kann als die beiden
anderen zusammengenommen, erwarten wir weiter die Dreiecksungleichung
|z + w| ≤ |z| + |w|
Formal mag man sie prüfen, indem man beide Seiten quadriert, wodurch die äqui-
valente Behauptung (z + w)(z̄ + w̄) ≤ z z̄ + 2|z||w| + ww̄ entsteht, und dann
vereinfacht zu immer noch äquivalenten Behauptung 2 Re(z w̄) ≤ 2|z w̄|. Die Ab-
schätzungen Re(u) ≤ |u| und Im(u) ≤ |u| sind aber für jede komplexe Zahl u
auch formal offensichtlich.

125
Anschauung für das Invertieren komplexer Zahlen
4.4.9. Wir können den Realteil und den Imaginärteil von z ∈ C mithilfe der
konjugierten komplexen Zahl ausdrücken als
z + z̄ z − z̄
Re z = Im z =
2 2i
Weiter gilt offensichtlich z = z ⇔ z ∈ R und für komplexe Zahlen z der
Norm |z| = 1 ist die konjugierte komplexe Zahl genau das Inverse, in For-
meln |z| = 1 ⇒ z̄ = z −1 . Im Bild der komplexen Zahlenebene kann man
das Bilden des Inversen einer von Null verschiedenen komplexen Zahl anschau-
lich interpretieren als die „Spiegelung“ oder präziser Inversion am Einheitskreis
z 7→ z/|z|2 gefolgt von der Spiegelung an der reellen Achse z 7→ z̄. Der Ein-
heitskreis S 1 := {z ∈ C× | |z| = 1} 126ist insbesondere eine Untergruppe der
multiplikativen Gruppe des Körpers der komplexen Zahlen und die Multiplika-

tion liefert einen Gruppenisomorphismus R>0 × S 1 → C× . Wir nennen S 1 die
Kreisgruppe.
Übungen
Übung 4.4.11. Gegeben eine komplexe Zahl z 6= −1 vom Betrag |z| = 1 zeige
man, daß sie genau eine Wurzel w mit positivem Realteil hat und daß diese gege-
ben wird durch w = (1+z)/|1+z|. Können Sie auch die geometrische Bedeutung
dieser Formel erklären? Man folgere, daß für beliebiges a < 1 jedes Element von
S 1 eine Potenz eines Elements z mit Realteil Re(z) > a ist.

4.5 Trigonometrische Funktionen


P
Definition 4.5.1. Eine Reihe k∈N ak komplexer Zahlen heißt P absolut konver-
gent, wenn die Reihe der Absolutbeträge konvergiert, in Formeln k∈N |ak | < ∞.

Lemma 4.5.2. Jede absolut konvergente Reihe komplexer Zahlen konvergiert, als
da heißt, die Folge ihrer Partialsummen konvergiert gegen eine komplexe Zahl.
P∞ P∞
Beweis.
P∞ Sei k=0 a k unsere Reihe. Aus k=0 |ak | < ∞ folgt
P∞ zunächst einmal
k=0 | Re a k | < ∞ und nach 4.1.15 konvergiert dann auch Re ak . Eben-
k=0P
so sehen wir, daß k=0 Im ak konvergiert, und damit konvergiert ∞
P∞
k=0 ak nach
unserer Beschreibung des Grenzwerts als komponentenweiser Grenzwert 3.5.33,
nur eben gegen eine komplexe Zahl.
4.5.3. Der Umordnungssatz 4.1.21 gilt analog für absolut konvergente Reihen
komplexer Zahlen. Das folgt, indem wir den reellen Umordnungssatz 4.1.21 auf
Real- und Imaginärteil anwenden.

Definition 4.5.4. Für jede komplexe Zahl z ∈ C erklären wir eine weitere kom-
plexe Zahl exp(z) ∈ C durch die Vorschrift

X 1 k
exp(z) := z
k=0
k!

Diese Reihe konvergiert für alle z ∈ C nach 4.5.2, da sie absolut konvergiert. Wir
erhalten so eine Abbildung exp : C → C, die komplexe Exponentialfunktion.

4.5.5 (Funktionalgleichung der komplexen Exponentialfunktion). Man prüft


genau wie in 4.2.10 im Reellen auch im Komplexen die Funktionalgleichung

exp(z + w) = (exp z)(exp w)

Dazu gehen wir den Beweis im reellen Fall nochmal durch und müssen insbeson-
dere prüfen, daß der Satz 4.2.14 über das Produkt absolut konvergenter Reihen

127
Auch für komplexes z zeigt man wie in 4.2.3 die Formel
 z n
exp(z) = lim 1 +
n→∞ n
Das obige Bild stellt unter anderem den vierten Term dieser Folge im Fall z = i
dar. Ich finde, man kann recht gut erkennen, wie diese Folge bei wachsendem n
gegen den Punkt auf der Kreislinie konvergiert, für den das Segment der
Kreislinie, das von ihm zur reellen Achse herunterläuft, die Länge Eins hat.

128
auch im Komplexen gilt. In der Tat funktioniert derselbe Beweis auch in die-
sem Fall. Offensichtlich gilt immer noch exp(0) = 1. In der Sprache der Alge-
bra ausgedrückt ist die Exponentialabbildung also ein Monoidhomomorphismus
exp : (C, +) → (C, ·) und induziert damit nach 1.5.43 einen Gruppenhomomor-
phismus von der additiven Gruppe der komplexen Zahlen in die multiplikative
Gruppe der von Null verschiedenen komplexen Zahlen. Man erhält insbesondere
exp(−z) = (exp z)−1 . Wie im Reellen 4.2.15 zeigt man auch die Stetigkeit von
exp : C → C zunächst im Nullpunkt über die Reihenentwicklung und dann an
jeder Stelle z ∈ C mithilfe der Funktionalgleichung.
4.5.6 (Komplexe Exponentialfunktion und Konjugation). Aus der Stetigkeit
der komplexen Konjugation und ihrer Vertauschbarkeit mit Summe und Produkt
folgern wir
exp(z̄) = exp z ∀z ∈ C
Für den Betrag von exp z erhalten wir dann
| exp z|2 = (exp z)(exp z)
= exp(z) exp(z̄)
= exp(z + z̄)
= exp(2 Re z)
Folglich gilt | exp z| = exp(Re z) und speziell | exp(i t)| = 1 für alle t ∈ R.
4.5.7. Ich nenne u : R → S 1 , t 7→ exp(it) die Umlaufabbildung. Sie beschreibt
salopp gesprochen einen Punkt, der „mit konstanter Geschwindigkeit Eins im Ge-
genuhrzeigersinn auf dem Einheitkreis S 1 umläuft und sich zum Zeitpunkt t = 0
an der Stelle u(0) = 1 befindet“. In den folgenden Sätzen 4.5.8 und 4.5.10 will ich
diese Anschauung rechtfertigen. Aus der Funktionalgleichung 4.5.5 folgt unmit-
telbar, daß unsere Umlaufabbildung ein Gruppenhomomorphismus von der Zah-
lengeraden zur Kreisgruppe ist. Aus der Abschätzung

X (i(t − s))k
| exp(it) − exp(is)| = | exp(i(t − s)) − 1| = ≤ exp(|s − t|) − 1
k=1
k!
oder auch direkt aus der Stetigkeit der komplexen Exponentialfunktion folgt, daß
die Umlaufabbildung u stetig ist.
Satz 4.5.8 (Gruppenwege in der Kreisgruppe). Die stetigen Gruppenhomomor-
phismen R → S 1 von der additiven Gruppe der reellen Zahlen in die Kreisgruppe
sind genau alle Abbildungen der Gestalt t 7→ exp(ait) mit a ∈ R.
Beweis. Unsere Umlaufabbildung u ist nicht konstant, aus der Reihenentwicklung
folgt genauer die Abschätzung Im(exp(t i)) > 0 für t ∈ (0, 1]. Aufgrund der
Stetigkeit gibt es folglich c > 0 mit Re u(c) < 1 und
(t ∈ [−c, c] ⇒ Re u(t) > 0)

129
Ist γ : R → S 1 ein weiterer Gruppenhomomorphismus mit stetigem Realteil,
so gibt es auch b > 0 mit (t ∈ [−b, b] ⇒ Re γ(t) ≥ Re u(c)). Es folgt, daß wir
g ∈ [−c, c] finden mit Re γ(b) = Re u(g). Indem wir notfalls g durch −g ersetzen,
dürfen wir zusätzlich annehmen, daß auch gilt Im γ(b) = Im u(g) und damit

γ(b) = u(g) und (|s| ≤ b ⇒ Re γ(s) > 0) sowie (|t| ≤ g ⇒ Re u(t) > 0).

Daraus aber folgt γ(b/2) = u(g/2), denn beide Seiten sind die eindeutig be-
stimmte Quadratwurzel aus γ(b) = u(g) mit positivem Realteil. Induktiv folgt
erst γ(b/2n ) = u(g/2n ) für alle n ∈ N und dann γ(mb/2n ) = u(mg/2n ) für alle
m ∈ Z und dann aufgrund der Stetigkeit γ(tb) = u(tg) für alle t ∈ R.
4.5.9. Ich erinnere daran, daß in der Algebra der Kern ker γ eines Gruppenho-
momorphismus γ : G → H erklärt wird als die Menge ker γ := γ −1 (eH ) aller
Elemente von G, die auf das neutrale Element von H abgebildet werden.
Satz 4.5.10 (Komplexe Exponentialfunktion und Kreiszahl). Die Umlaufab-
bildung u : t 7→ exp(it) ist ein surjektiver Gruppenhomomorphismus u : R  S 1
mit Kern ker(u) = 2πZ für unsere Kreiszahl π aus 3.4.1.
Vorschau 4.5.11. Wir überlegen uns in 4.5.22, daß der Gruppenhomomorphismus
C → C× gegeben durch dieselbe Formel z 7→ exp(iz) immer noch denselben
Kern hat, so daß gilt ker(exp(C → C× )) = 2πiZ.
Beweis. Beim Beweis von 4.5.8 haben wir bereits gesehen, daß es a < 1 gibt
derart, daß alle Elemente der Kreislinie mit Realteil > a im Bild von u liegen
müssen. Nach Übung 4.4.11 sind aber alle Elemente von S 1 Potenzen derartiger
Elemente. Folglich ist u eine Surjektion. Mit

κ := inf{t > 0 | u(t) = −1}

gilt offensichtlich u(κ) = u(−κ) = −1, aber u nimmt auf dem offenen Intervall
(−κ, κ) den Wert (−1) nicht an. So folgt (ker u) ∩ (0, 2κ) = ∅ und 2κZ ⊂ ker u.
Hätten wir in ker u noch Elemente außerhalb von 2κZ, so müßten wir darin auch
Elemente aus (0, 2κ) finden und erhielten einen Widerspruch. So folgt ker u =
2κZ und es bleibt nur noch zu zeigen

κ=π

für unsere Kreiszahl π aus 3.4.1. Dieser Teil des Beweises wird sich in 7.1.15 als
ein Spezialfall unserer Sätze über die sogenannte „Bogenlänge“ erweisen, aber
hier argumentieren wir noch „zu Fuß“. Sicher gilt u(0) = 1 und u induziert eine

Bijektion u : (−κ, κ] → S 1 , denn das Bild ist dasselbe wie das Bild von R =
(−κ, κ] + 2κZ und aus u(t) = u(s) folgt t − s ∈ 2κZ. Der Imaginärteil von u

130
hat auf diesem Intervall also nur die beiden Nullstellen 0 und κ. Wir wissen schon
vom Beginn des vorhergehenden Beweises, daß gilt Im(u(t)) > 0 für t ∈ (0, 1].
Also induziert u eine Bijektion

u : [0, κ] → {z ∈ S 1 | Im(z) ≥ 0}
und Re u muß auf diesem Intervall nach Übung 3.3.22 streng monoton fallen. Die-
se Erkenntnis liefert für unsere Kreiszahl π aus 3.4.1 die alternative Beschreibung
( n )
X
π = sup |u(ti ) − u(ti−1 )| 0 ≤ t0 < t1 < . . . < tn ≤ κ
i=1

Im Anschluß leiten wir für t ≥ 0 die Abschätzungen t − t2 ≤ |u(t) − 1| ≤ t her.


Für t > s folgt aus der oberen Abschätzung |u(t) − u(s)| ≤ t − s und damit sofort
π ≤ κ. Verwenden wir andererseits für n ≥ 1 die äquidistante Unterteilung mit
0 = t0 und tn = κ, so folgt aus der unteren Abschätzung
n
X
π≥ |u(ti ) − u(ti−1 )| ≥ κ − n(κ/n)2
i=1

und im Grenzwert n → ∞ erhalten wir auch umgekehrt π ≥ κ, also zusammen


π=κ
Es bleibt, für t ≥ 0 unsere Abschätzungen t − t2 ≤ |u(t) − 1| ≤ t herzuleiten.
Nun erhalten wir für |t| ≤ 2 leicht die Abschätzung
|u(t) − 1|2 = 2 − 2 Re u(t) = t2 − 2t4 /4! + 2t6 /6! − . . . ≤ t2
und in der Wurzel unsere obere Abschätzung, da ja |u(t) − 1| ≤ 2 eh klar ist für
alle t. Andererseits zeigt die Reihenentwicklung auch

X
2
u(t) − 1 = it − t (it)ν−2 /ν!
ν=2

und soP∞ die untere Abschätzung


P∞ |u(t) − 1| ≥ t − t2 , erst für t ∈ [0, 1] wegen
ν−1
1 = ν=2 1/2 ≥ ν=2 1/ν!, dann aber aus offensichtlichen Gründen sogar
für alle t.
Definition 4.5.12. Wir nennen den Real- beziehungsweise Imaginärteil der Um-
laufabbildung u : t 7→ exp(it) den Cosinus beziehungsweise den Sinus cos, sin :
R → R. In Formeln werden die Funktionen Sinus und Cosinus bei uns also defi-
niert durch die sogenannte Euler’sche Gleichung
exp(it) = cos t + i sin t

131
Sinus und Cosinus am Einheitskreis

Die Graphen vom Sinus als durchgezogene Linie und vom Cosinus als
gestrichelte Linie.

132
4.5.13. Das Wort Trigonometrie bedeutet so etwas wie „Dreiwinkelmessung“.
Die Wurzel „gon“ taucht auch im deutschen Wort „Knie“ auf und bedeutet im
Griechischen sowohl „Knie“ als auch im übertragenen Sinne „Winkel“. In der Li-
nearen Algebra [LA2] 1.7.5 führe ich die „abstrakte Winkelgruppe“ W ein sowie
in [LA2] 1.7.9 den „Standardisomorphismus“

kw : W → S 1

der Winkelgruppe mit der Kreisgruppe S 1 ⊂ C× . Ich schlage vor, zu unterschei-


den zwischen einerseits dem geometrischen Cosinus, den ich in [LA2] 1.7.11
einführe als die Abbildung

cosg := Re ◦ kw : W → R

der „Winkelgruppe“ in die reellen Zahlen, die durch die Regel „Ankathete durch
Hypothenuse“ beschrieben wird, und andererseits dem hier erklärten analytischen
Cosinus cos = cosa : R → R, der sich daraus ergibt durch das Vorschalten der
Umlaufabbildung u : R → S 1 gefolgt vom invertierten Standardisomorphismus
als
cos = cosa = cosg ◦ kw−1 ◦u = Re ◦u
Analog mag man für die anderen Winkelfunktionen vorgehen.
4.5.14 (Bezug zum Bogenmaß). Dieselbe Argumentation wie beim vorhergehen-
den Beweis zeigt für alle t ≥ 0 die Formel
( n )
X
t = sup |u(ti ) − u(ti−1 )| 0 ≤ t0 < t1 < . . . < tn ≤ t
i=1

Anschaulich bedeutet mithin t die Länge des Kreisbogens von 1 bis exp(it). Auf
Taschenrechnern muß man, um die hier definierten Funktionen sin und cos zu er-
halten, meist noch spezifizieren, daß die Eingabe im Bogenmaß, auf englisch „Ra-
dians“ oder abgekürzt „rad“, zu verstehen sein soll. Auf lateinisch bedeutet Sinus
übrigends „Bodenwelle“ und „Busen“, wortverwandt ist französisch „le sein“.
4.5.15 (Eigenschaften von Sinus und Cosinus). Aus der Definition 4.5.12 von
Sinus und Cosinus folgen unmittelbar eine ganze Reihe von Eigenschaften.

1. Aus den Definitionen folgt sofort die Identität sin2 + cos2 = 1. Diese For-
mel wird oft nach Pythagoras benannt. Hier haben wir (sin t)2 = sin2 t und
(cos t)2 = cos2 t abgekürzt. Diese Abkürzungen sind auch üblich für alle
anderen Potenzen und alle anderen trigonometrischen beziehungsweise hy-
perbolischen trigonometrischen Funktionen, denn das spart Klammern und
die alternativ möglichen Bedeutungen sin2 t = sin(sin t) und dergleichen

133
kommen nie vor. Für die Umkehrfunktionen vereinbaren wir bald die Nota-
tion arcsin sowie arccos und verwenden auch für negative obere Indizes die
Notationen sin−1 (x) := 1/ sin(x) sowie cos−1 (x) := 1/ cos(x). Man findet
für diese Funktionen auch die Bezeichnung als Secans sec(x) := 1/ cos(x)
beziehungsweise Cosecans cosec(x) := 1/ sin(x).

2. Die Symmetrie-Eigenschaften sin(−t) = − sin t und cos(−t) = cos t


folgen aus exp(z̄) = exp z.

3. Für alle a, b ∈ R folgen die Additionsformeln

cos(a + b) = cos a cos b − sin a sin b


sin(a + b) = cos a sin b + sin a cos b

aus der Funktionalgleichung exp(i(a + b)) = exp(ia) exp(ib).

4. Die Periodizitäten sin(t) = sin(t + 2π) und cos(t) = cos(t + 2π) folgen
unmittelbar aus der Beschreibung des Kerns von t 7→ exp(it) in 4.5.10.

5. Daß der Cosinus eine streng monoton fallende Bijektion cos : [0, π] →
[−1, 1] ist, wissen wir bereits aus dem Beweis von 4.5.10. Die Formel des
Pythagoras zeigt dann, daß π die kleinste positive Nullstelle von sin ist.
Zusammen mit sin(0) = 0 und der Periodizität folgt, daß die Nullstellen
des Sinus genau die ganzzahligen Vielfachen von π sind.

6. Mit den Additionsformeln erhalten wir sin(t + π) = − sin t und ebenso


cos(t + π) = − cos t und damit cos(π/2) = 0 und cos t = sin(t + π/2) und
sin t = − cos(t + π/2). Die Nullstellen des Cosinus sind folglich genau
die Elemente von 2πZ + π/2.

7. Unsere Funktionen cos und sin werden, wie sofort aus 4.5.12 folgt, darge-
stellt durch die absolut konvergenten Reihen
P∞ k t2k t2 t4
cos t = k=0 (−1) (2k)! = 1− 2!
+ 4!
− ...
P∞ k t2k+1 t3 t5
sin t = k=0 (−1) (2k+1)! = t− 3!
+ 5!
− ...

4.5.16. Wir wissen bereits aus dem Beweis von 4.5.10, daß der Cosinus eine ste-

tige streng monoton fallende Bijektion cos : [0, π] → [−1, 1] ist. Deren Umkehr-
abbildung ist nach 3.3.11 auch stetig. Sie heißt der Arcuscosinus und wird notiert
als

arccos : [−1, 1] → [0, π]

134
4.5.17. Der Sinus wächst wegen 4.5.16 und der zuvor gezeigten Identität sin t =
− cos(t + π/2) streng monoton auf [−π/2, π/2] und definiert folglich eine Bijek-

tion sin : [−π/2, π/2] → [−1, 1]. Deren Umkehrabbildung ist nach 3.3.11 auch
stetig. Sie heißt der Arcussinus und wird notiert als

arcsin : [−1, 1] → [−π/2, π/2]

4.5.18. Die Bezeichnungen „arcussinus“ und „arcuscosinus“ kommen von latei-


nisch „arcus“ für „Bogen“. In der Tat bedeutet arcsin√b für b ∈ [0, 1] die Länge
des Kreisbogens, der vom Punkt (1, 0) bis zum Punkt ( 1 − b2 , b) der Höhe b auf
dem Einheitskreis reicht, wie der Leser zur Übung nachrechnen mag.
Definition 4.5.19. Für alle x ∈ R mit cos x 6= 0 definieren wir den Tangens von
x durch
sin x
tan x :=
cos x
4.5.20. Anschaulich bedeutet tan(x) für x ∈ (0, π/2) die Höhe, in der der Strahl
durch den Nullpunkt und den Punkt des Einheitskreises, der mit dem Punkt (1, 0)
ein Kreissegment der Länge x begrenzt, die Tangente an unseren Einheitskreis im
Punkt (1, 0) trifft. Man benutzt auch den Cotangens
cos x
cot(x) :=
sin x
4.5.21. Der Tangens wächst streng monoton auf dem Intervall (−π/2, π/2). We-
gen tan(−t) = − tan(t) reicht es, das auf [0, π/2) zu prüfen, und dort sind Sinus
und Cosinus nichtnegativ und der Sinus wächst streng monoton, wohingegen der
Cosinus streng monoton fällt. Da der Tangens an den Grenzen sogar gegen ±∞
strebt, liefert der Tangens eine Bijektion tan : (−π/2, π/2) → R. Die Umkehr-
funktion heißt der Arcustangens

arctan : R → (−π/2, π/2)

In derselben Weise erklärt man den Arcuscotangens arccot : R → (0, π) als die

Umkehrfunktion des Kotangens cot : (0, π) → R.
4.5.22 (Kern und Bild der komplexen Exponentialfunktion). Nach 4.5.10 in-
duziert die Exponentialfunktion eine Surjektion der imaginären Geraden iR auf
den Einheitskreis S 1 = {z ∈ C | |z| = 1}. Daß die Exponentialfunktion ei-

ne Bijektion R → R>0 induziert, wissen wir bereits aus 4.3.2. Da sich nun
jede von Null verschiedene komplexe Zahl w schreiben läßt als Produkt w =
(w/|w|)|w| mit w/|w| auf dem Einheitskreis und |w| positiv, ist die Exponenti-
alfunktion nach der Funktionalgleichung sogar ein surjektiver Gruppenhomomor-
phismus exp : C  C× . Der Kern dieses Gruppenhomomorphismus, als da heißt

135
Der Arcussinus

136
Der Tangens

137
Die Bilder ausgewählter Teile der komplexen Zahlenebene unter der komple-
xen Exponentialfunktion. Die Vertikalen werden zu Kreislinien aufgewickelt,
die Horizontalen in vom Nullpunkt ausgehende Strahlen transformiert. Anschau-
lich mag man sich die komplexe Exponentialfunktion denken als Abbildung,
bei der die komplexe Zahlenebene zunächst in horizontaler Richtung verzerrt
und ganz auf die Halbebene mit positivem Realteil herübergeschoben wird mit
x + iy 7→ exp(x) + iy, gefolgt von einer Aufwicklung dieser Halbebene zu einer
Wendeltreppe a + iy 7→ (a cos y, a sin y, y) in den Raum gefolgt von einer senk-
rechten Projektion dieser Wendeltreppe auf die Ebene alias dem Weglassen der
letzten Koordinate.

138
das Urbild des neutralen Elements 1 ∈ C× , besteht aufgrund unserer Gleichung
| exp z| = exp(Re z) aus allen ganzzahligen Vielfachen von 2πi, in Formeln

ker(exp) = 2πiZ

4.5.23. Wir bestimmen mit dieser Erkenntnis die n-ten Einheitswurzeln, als da
heißt die komplexen Lösungen der Gleichung z n = 1. Nach 4.5.22 hat jede
Lösung die Gestalt z = eb für geeignetes b ∈ C und so ein z löst unsere Glei-
chung genau dann, wenn gilt z n = enb = 1 alias nb ∈ 2πiZ. Wir erhalten so die
Lösungen exp(2πiν/n) für ν = 0, 1, . . . , n − 1 und erkennen auch, daß sie paar-
weise verschieden sind und es keine anderen Lösungen geben kann. In der kom-
plexen Zahlenebene kann man sich die n-ten Einheitswurzeln veranschaulichen
als die Ecken desjenigen in den Einheitskreis einbeschriebenen regelmäßigen n-
Ecks, das als eine Ecke die 1 hat.
Ergänzung 4.5.24. Der Satz von Hermite-Lindemann besagt, daß für eine von
Null verschiedene im Sinne von 3.4.2 algebraische komplexe Zahl α der Wert der
Exponentialfunktion exp(α) stets transzendent ist. Daraus folgt sowohl, daß die
Euler’sche Zahl e = exp(1) transzendent ist, als auch, daß 2πi und damit natürlich
auch π transzendent sind, da nämlich exp(2πi) = 1 nicht transzendent ist. In etwas
allgemeinerer Form sagt der Satz, daß gegeben komplexe algebraische Zahlen
α1 , . . . , αn , die linear unabhängig sind über Q, die Werte der Exponentialfunktion
exp(α1 ), . . . , exp(αn ) algebraisch unabhängig sind über Q im Sinne von [KAG]
5.6.2. Mehr dazu findet man etwa in [Lor96]. Schanuels Vermutung, wie das zu
verallgemeinern sein sollte, findet man in [KAG] 5.6.17.
4.5.25 (Potenzen mit komplexen Exponenten). Für eine reelle Zahl a > 0 und
z ∈ C setzen wir wieder
az := exp(z log a)
und schreiben insbesondere auch exp z = ez für z ∈ C. Mit dieser Notation liest
sich die Euler’sche Formel dann als eit = cos t + i sin t. Insbesondere erfüllen
unsere Hauptdarsteller die bemerkenswerte Identität eiπ = −1. Aus exp(−it) =
exp(it) folgern wir umgekehrt für alle t ∈ R die Formeln

eit + e−it eit − e−it


cos t = und sin t =
2 2i
Diese Formeln verwenden wir, um den Sinus und Cosinus zu Funktionen C → C
auszudehnen.
Vorschau 4.5.26 (Potenzen komplexer Zahlen mit komplexen Exponenten).
Die Frage, inwieweit auch Ausdrücke wie ii sinnvoll als komplexe Zahlen inter-
pretiert werden können, stellen wir zurück bis zu ersten Anwendungen in 5.10.15.

139
Übungen
Übung 4.5.27. Sei n ∈ N. Für jede komplexe Zahl a 6= 0 besitzt die Gleichung
z n = a genau n Lösungen z ∈ C.
Übung 4.5.28. Man zeige: Jeder Gruppenhomomorphismus R → C× mit stetigem
Real- und Imaginärteil hat die Gestalt t 7→ exp(at) für genau eine komplexe Zahl
a ∈ C. Hinweis: Man wiederhole den Beweis von 4.5.8 und beachte 4.5.22.
Übung 4.5.29 (Unmöglichkeit globaler stetiger komplexer Wurzelfunktionen).
Gäbe es eine stetige Funktion w : C → C mit w(z)2 = z für alle z, so folgte
w(z 2 ) = ±z für alle z und damit wäre ε : z 7→ w(z 2 )/z eine stetige Funkti-
on ε : C× → {1, −1} mit ε(−z) = −ε(z). Man führe das zum Widerspruch.
Hinweis: Zwischenwertsatz.
Ergänzende Übung 4.5.30 (Der goldene Schnitt im regelmäßigen Fünfeck). In
einem regelmäßigen Fünfeck stehen die Längen der Diagonalen zu den Längen
der Seiten im Verhältnis des goldenen Schnitts. Man prüfe diese elementargeome-
trisch leicht einzusehende Behauptung durch algebraische Rechnung. Hinweis:
Der goldene Schnitt ist die positive Lösung der Gleichung a/1 = (1 + a)/a alias
a2 − a − 1 = 0, seine geometrische Bedeutung wurde in [EIN] 1.2.2 erklärt. Es
gilt zu zeigen, daß für ζ = e2πi/5 der Ausdruck a = |1 − ζ 2 |/|1 − ζ| = |1 + ζ| die
fragliche Gleichung löst. Man verwende ζ 4 = ζ̄.
Ergänzende Übung 4.5.31. In einem regelmäßigen Siebeneck sei a der Abstand
von einer Ecke zur nächsten Ecke, b der Abstand zur übernächsten Ecke, und c
der Abstand zur überübernächsten Ecke. Man zeige
1 1 1
= +
a b c
In Formeln zeige man für ζ = e2πi/7 die Identität |1−ζ|−1 = |1−ζ 2 |−1 +|1−ζ 3 |−1 .

Ergänzende Übung 4.5.32. Die Nullstellen des komplexen Sinus liegen alle auf
der reellen Achse.
Ergänzende Übung 4.5.33. Man leite einige Formeln der nachstehenden Tabelle
her.

140
Die Überlagerung zweier Sinuswellen mit nahe beieinanderliegender Periode.
Rechnerisch finden wir etwa die Identität

ei ω1 t + ei ω2 t = ei(ω1 −ω2 )t/2 (ei(ω1 +ω2 )t/2 + e− i(ω1 +ω2 )t/2 )

und durch Betrachtung der Imaginärteile beider Seiten

sin(ω1 t) + sin(ω2 t) = 2 sin((ω1 − ω2 )t/2) cos((ω1 + ω2 )t/2)

Liegen hier ω1 und ω2 nah beieinander, so ergibt sich für diesen Ausdruck als
Funktion von t das obige Bild, in dem sich anschaulich gesprochen immer
abwechselnd beide Sinuswellen einmal gegenseitig auslöschen und dann wieder
addieren. Man kann das auch mit eigenen Ohren erfahren, wenn man sich von
zwei Kommilitonen zwei nahe beieinanderliegende Töne vorsingen läßt: Es ist
dann so eine Art Wummern zu hören, das eben mit der Frequenz ω1 − ω2
geschieht.

141
sin cos

π 0 −1
π/2 1 0

π/3 3/2 1/2
√ √
π/4 1/ 2 1/ 2
p √ √ √
π/5 5 − 5/2 2 ( 5 + 1)/4

π/6 1/2 3/2
π/7 ? ?
q
1
√ q
1

π/8 2
− 2 2
+ 2
π/9 ? ?
√ p √ √
π/10 ( 5 − 1)/4 5 + 5/2 2
π/11 ? ?

Man bemerkt, daß sich für cos(π/5) gerade die Hälfte unseres „goldenen Schnitts“
aus 4.5.30 ergibt. Bei der Bestimmung der Werte für π/5 und π/10 mag man
von nebenstehendem Bild ausgehen, das insbesondere bei der Bestimmung von
sin(π/10) helfen sollte. Wir zeigen in [AL] 4.8.9, warum es unmöglich ist, For-
meln derselben Bauart auch für sin(π/7) oder sin(π/9) oder sin(π/11) anzuge-
ben.

Ergänzende Übung 4.5.34. Man zeige mit der Euler’schen Gleichung 4.5.12 die
Identität sin3 ϑ = 43 sin ϑ − 41 sin(3ϑ).
Ergänzende Übung 4.5.35. Man zeige, daß der Sinus keine Polynomfunktion ist.

142
Illustration zur Berechnung von sin(π/10)

143
5 Integration und Ableitung
5.1 Stetige Funktionen auf Kompakta
Definition 5.1.1. Man nennt eine Teilmenge K ⊂ R̄n kompakt oder ein Kom-
paktum, wenn jede Folge in K eine Teilfolge besitzt, die gegen einen Punkt aus
K konvergiert.

Beispiel 5.1.2 (Kompakte Intervalle). Der Satz von Bolzano-Weierstraß 3.6.6


zeigt, daß die kompakten Intervalle in R̄ genau die Intervalle der Gestalt [a, b]
sind mit a, b ∈ R̄.
Beispiel 5.1.3 (Kompakte Rechtecke). Gegeben a, b, c, d ∈ R̄ ist das Rechteck
[a, b] × [c, a] kompakt. In der Tat besitzt jede Folge in diesem Rechteck nach 5.1.2
eine Teilfolge, bei der die ersten Koordinaten der Folgenglieder eine konvergente
Folge bilden, und diese hat hinwiederum eine Teilfolge, bei der auch die zweiten
Koordinaten der Folgenglieder eine konvergente Folge bilden.
Vorschau 5.1.4. Der Begriff der „Kompaktheit“ ist für weite Teile der Mathematik
grundlegend. Sie werden in [AN2] 5.1.3 folgende sehen, wie er im Fall allgemei-
ner „topologischer Räume“ in die beiden Begriffe „folgenkompakt“ und „überde-
ckungskompakt“ aufspaltet. Sie werden auch sehen, daß es letzterer Begriff ist,
der weiter trägt und zu „kompakt“ abgekürzt wird, obwohl ersterer Begriff die
natürlichere Verallgemeinerung unserer obigen Definition zu sein scheint. Aber
alles zu seiner Zeit!

Satz 5.1.5 (Extremwerte auf Kompakta). Jede stetige Funktion f : K → R̄


auf einem nichtleeren Kompaktum K nimmt das Supremum und das Infimum der
Menge ihrer Funktionswerte als Funktionswert an.

5.1.6. Ist in Formeln K 6= ∅ kompakt und f : K → R̄ stetig, so gibt es demnach


p, q ∈ K mit f (p) ≤ f (x) ≤ f (q) ∀x ∈ K. Ist die Funktion f reellwertig, so ist
insbesondere ihr Bild beschränkt. Salopp gesprochen kann also eine stetige reell-
wertige Funktion auf einem Kompaktum nicht nach Unendlich streben. Man be-
achte, eine wie wichtige Rolle im Falle eines kompakten Intervalls die Endpunkte
hier spielen: Eine stetige reellwertige Funktion auf einem offenen Intervall kann
ja durchaus nach Unendlich streben, wie etwa die Funktion x 7→ (1/x) auf dem
Intervall (0, 1).
Beweis. Da wir K 6= ∅ angenommen hatten, finden wir nach Übung 3.5.47 eine
Folge xn in K mit limn→∞ f (xn ) = sup f (K). Diese Folge besitzt nun nach
Annahme eine Teilfolge, die gegen einen Punkt q aus K konvergiert. Indem wir
zu dieser Teilfolge übergehen, dürfen wir sogar annehmen, unsere Folge sei selbst

144
schon konvergent mit limn→∞ xn = q. Durch Vertauschen der stetigen Funktion
f mit Folgenkonvergenz nach 3.5.29 folgt dann

f (q) = lim f (xn ) = sup f (K)


n→∞

Die Existenz von p ∈ K mit f (p) = inf f (K) zeigt man analog.
Satz 5.1.7 (Fundamentalsatz der Algebra). Jedes nicht konstante komplexe Po-
lynom besitzt mindestens eine komplexe Nullstelle.
5.1.8. Der im folgenden wiedergegebene Beweis von Jean-Robert Argand hat den
Vorteil, mit besonders wenigen technischen Hilfsmitteln auszukommen. Einen
Überblick über die gängigsten alternativen Beweise mit ihren Stärken und Schwä-
chen gebe ich in [LA1] 5.3.25. Alle Beweise benutzen wesentlich analytische
Methoden und das muß auch so sein, da ja R und C Objekte der Analysis sind.
Merkwürdig ist eher die Bezeichnung als „Fundamentalsatz der Algebra“ für ein
Resultat der Analysis.
Vorschau 5.1.9. Aus dem Fundamentalsatz der Algebra folgert man unschwer,
daß das Aufmultiplizieren eine Bijektion
   
Endliche Multimengen ∼ Komplexe Polynome

von komplexen Zahlen mit Leitkoeffizient Eins
µ {λ1 , . . . , λr } 7→ (X − λ1 ) . . . (X − λr )
liefert. Das vorgestellte µ aus der linken Seite ist ein „Multimengenanzeiger“, mit
dem wir es uns erlauben, Elemente mit Vielfachheiten zu betrachten und anzu-
geben. Den Beweis überlassen wir der Algebra. Man muß dazu im wesentlichen
nur wissen, daß man für jede Nullstelle einen Linearfaktor abspalten kann. Das
hinwiederum folgt aus dem Teilen mit Rest in Polynomringen.
Beweis. Sei P ∈ C[X] unser Polynom. Wir zeigen zunächst, daß es eine Stelle
p ∈ C gibt, an der die Funktion C → R, z 7→ |P (z)| ihr Minimum annimmt, in
Formeln |P (z)| ≥ |P (p)| ∀z ∈ C. Sei dazu P (X) = an X n +an−1 X n−1 +. . .+a0 .
Aus |z| > 0 folgt
|P (z)| ≥ |an z n | − |an−1 z n−1 + . . . + a0 |
≥ |an ||z|n − |an−1 ||z|n−1 − . . . − |a0 | 
≥ |z|n |an | − |an−1 |/|z| − . . . − |a0 |/|z|n
Nun finden wir sicher R > 0 mit |an−1 |/R + . . . + |a0 |/Rn ≤ |an |/2. Aus |z| > R
folgt dann |P (z)| ≥ |z|n (|an |/2). Nehmen wir also irgendein u ∈ C her, so gibt
es R ∈ R derart, daß aus |z| ≥ R folgt

|P (z)| ≥ |z|n (|an |/2) ≥ |P (u)|

145
Als stetige Funktion nimmt aber die Funktion z 7→ |P (z)| auf einem beliebigen
kompakten Rechteck K ⊂ C, das die Kreisscheibe {z | |z| ≤ R} umfaßt, ein
Minimum an, sagen wir an der Stelle p ∈ K. Das muß dann auch das Minimum
von |P (z)| auf ganz C sein. Wir zeigen nun P (p) = 0 durch Widerspruch und
zeigen dazu: Ist p ∈ C gegeben und P eine nichtkonstante Polynomfunktion mit
P (p) 6= 0, so nimmt die Funktion z 7→ |P (z)| bei p nicht ihr Minimum an. Es
reicht, das für p = 0 zu zeigen. Wir dürfen auch ohne Beschränkung der Allge-
meinheit zusätzlich P (0) = 1 annehmen. Dann hat unser Polynom die Gestalt
P (X) = 1 + bX m + X m+1 Q(X)
mit b 6= 0 und m ≥ 1 und einem weiteren Polynom Q(X) und wir müssen zeigen,
daß |P (z)| nicht minimal ist bei z = 0. Dafür müssen wir nur eine Richtung
w ∈ C finden derart, daß |(P (z)| kleiner wird, wenn wir uns in dieser Richtung w
vom Ursprung entfernen, in Formeln |P (tw)| < 1 für hinreichend kleines t > 0.
Nach 4.5.27 gibt es jedoch w ∈ C mit wm b = −1 und für solch ein w finden wir
P (tw) = 1 − tm + tm+1 wm+1 Q(tw)
Für t ∈ [0, 1] und C > 0 eine positive obere Schranke für die stetige Funktion
[0, 1] → R, t 7→ |wm+1 Q(tw)| folgt nach der Dreiecksungleichung
|P (tw)| ≤ 1 − tm + tm+1 C
Gilt zusätzlich 0 < t < C −1 , so ist das sicher kleiner als Eins.
Definition 5.1.10. Eine Funktion f : Rm ⊃ D → Rn heißt gleichmäßig stetig,
wenn es für beliebiges ε > 0 ein δ > 0 gibt derart, daß für alle x, y ∈ D mit
|x − y| < δ gilt |f (x) − f (y)| < ε.
5.1.11. Bei der Definition der gleichmäßigen Stetigkeit kommt es wesentlich auf
den Definitionsbereich D an. Da wir Funktionen vielfach angeben, ohne ihren De-
finitionsbereich explizit festzulegen, ist es in diesem Zusammenhang oft sinnvoll,
den jeweils gemeinten Definitionsbereich zu präzisieren. Dazu benutzen wir die
Sprechweise f ist gleichmäßig stetig auf D.
5.1.12. Im Gegensatz zur Stetigkeit ist die gleichmäßige Stetigkeit kein sinnvoller
Begriff für Funktionen f : R̄m ⊃ D → R̄n .
5.1.13 (Unterschied zwischen Stetigkeit und gleichmäßiger Stetigkeit). Ich
will nun den Unterschied zwischen Stetigkeit und gleichmäßiger Stetigkeit dis-
kutieren. Eine Funktion f : Rm ⊃ D → Rn ist ja nach dem ε-δ-Kriterium 3.2.21
stetig bei p ∈ D genau dann, wenn es für jedes ε > 0 ein δ = δ(ε, p) > 0 gibt
derart, daß für alle x ∈ D mit |x − p| < δ(ε, p) gilt |f (x) − f (p)| < ε. Des
weiteren heißt sie stetig, wenn sie an jeder Stelle p ∈ D stetig ist. Gleichmäßige
Stetigkeit bedeutet nun, daß für jedes ε > 0 ein δ = δ(ε) gewählt werden kann,
das es als δ(ε) = δ(ε, p) für alle p ∈ D gleichzeitig tut.

146
Gleichmäßige Stetigkeit für stetige Funktionen auf Intervallen kann man sich
anschaulich wie folgt denken: Für eine beliebig für ein Rechteck vorgegebene
Höhe 2ε > 0 findet man bei gleichmäßiger Stetigkeit immer eine Breite 2δ > 0
derart, daß an welchen Punkt des Graphen meiner Funktion ich das Zentrum
meines Rechtecks auch verschiebe, der Graph das Rechteck nie durch die Ober-
oder Unterkante verläßt. So ist etwa die Wurzelfunktion gleichmäßig stetig auf
R≥0 , die Quadratfunktion jedoch nicht.
147
5.1.14 (Eine nicht gleichmäßig stetige Funktion). Die Funktion f : R → R,
x 7→ x2 ist nicht gleichmäßig stetig auf R, denn |x2 − y 2 | = |x − ykx + y| kann
auch für sehr kleines |x − y| noch groß sein, wenn nur |x + y| hinreichend groß
ist. Die Einschränkung dieser Funktion auf ein beliebiges reelles Kompaktum ist
aber daselbst gleichmäßig stetig nach dem anschließenden Satz.

Satz 5.1.15 (Gleichmäßige Stetigkeit auf Kompakta). Jede stetige Funktion f :


Rm ⊃ K → Rd auf einem Kompaktum K ⊂ Rm ist auf besagtem Kompaktum
gleichmäßig stetig.

Beweis. Wir argumentieren durch Widerspruch und zeigen, daß eine Funktion auf
einem Kompaktum, die nicht gleichmäßig stetig ist, auch nicht stetig sein kann.
Wäre f nicht gleichmäßig stetig, so gäbe es ein ε > 0, für das wir kein δ > 0
finden könnten: Wir probieren alle δ = 1/n aus und finden immer wieder Punkte
xn , yn ∈ K mit |xn − yn | < 1/n, für die dennoch gilt |f (xn ) − f (yn )| ≥ ε. Gehen
wir zu einer Teilfolge über, so dürfen wir ohne Beschränkung der Allgemeinheit
annehmen, daß die Folge der xn gegen einen Punkt von K konvergiert, in Formeln
limn→∞ xn = x mit x ∈ K. Damit folgt natürlich auch limn→∞ yn = x. Wäre
nun f stetig bei x, so folgte

lim f (xn ) = f (x) = lim f (yn )


n→∞ n→∞

und damit lägen notwendig fast alle f (xn ) und desgleichen fast alle f (yn ) im
Quader B(f (x); ε/2). Das steht jedoch im Widerspruch dazu, daß ja nach Kon-
struktion gilt |f (xn ) − f (yn )| ≥ ε für alle n. Wir haben also gezeigt, daß eine
Funktion auf einem reellen Kompaktum, die nicht gleichmäßig stetig ist, auch
nicht stetig sein kann.

Übungen
Übung 5.1.16. Jeder Quader der Gestalt [a1 , b1 ] × . . . × [an , bn ] ⊂ R̄n ist kompakt.
Übung 5.1.17. Jede endliche Vereinigung von Kompakta Ki ⊂ R̄n ist kompakt.
Übung 5.1.18. Das Bild eines Kompaktums K ⊂ R̄n unter einer stetigen Abbil-
dung K → R̄m ist stets kompakt.
Übung 5.1.19. Man zeige, daß jede beschränkte, monotone und stetige Funktion
f : R → R gleichmäßig stetig ist.
Übung 5.1.20. Sind K ⊂ R̄m und L ⊂ R̄n kompakt, so ist auch K × L ⊂ R̄m+n
kompakt.

148
5.2 Integration stetiger Funktionen
Definition 5.2.1. Gegeben f : R ⊃ [a, b] → R eine stetige reellwertige Funktion
auf einem nichtleeren kompakten reellen Intervall erklären wir die Menge T(f ) ⊂
R aller „naiven Integrale zu Treppen, die unter f liegen“ durch
 
 Alle möglichen Wahlen von n ∈ N 
 n−1 
und von Stellen a = a0 ≤ a1 ≤ . . . ≤ an = b
X 
T(f ) := ci (ai+1 − ai )
 und von Werten c0 , . . . , cn−1 ∈ R derart, 
 i=0
 
daß gilt f (x) ≥ ci für alle x ∈ [ai , ai+1 ]

Da f stetig ist, hat es nach 5.1.5 einen beschränkten Wertebereich, als da heißt, es
gibt m, M ∈ R mit m ≤ f (x) ≤ M ∀x ∈ [a, b]. Daraus folgt, daß m(b − a) zu
T(f ) gehört und daß M (b − a) eine obere Schranke von T(f ) ist. Als nichtleere
nach oben beschränkte Teilmenge von R hat T(f ) nach 2.4.4 ein Supremum in
R. Wir nennen dies Supremum das Integral der Funktion f über das Intervall
[a, b] und schreiben
Z b Z b Z
sup T(f ) := f (x) dx = f= f
a a [a,b]

Auf die Bedeutung der Notationen für das Integral gehen wir in 5.2.6 ein.

5.2.2. Anschaulich mißt das Integral von f die Fläche zwischen dem Graphen
von f und der x-Achse, wobei Flächenstücke unterhalb der x-Achse negativ zu
rechnen sind. Das Wort ist aus dem Lateinischen abgeleitet und bedeutet so etwas
wie „Zusammenfassung“. Der folgende Satz listet einige Eigenschaften unseres
Integrals auf. Man kann leicht zeigen, daß unser Integral sogar durch diese Eigen-
schaften charakterisiert wird.

Satz 5.2.3 (Integrationsregeln). Sei [a, b] ⊂ R ein nichtleeres kompaktes Inter-


vall.
Rb
1. Für die konstante Funktion mit dem Wert 1 gilt a 1 = b − a;
Rb Rz Rb
2. Für f : [a, b] → R stetig und z ∈ [a, b] gilt a f = a f + z f ;

3. Seien f, g : [a, b] → R stetig. Gilt f (x) ≤ g(x) ∀x ∈ [a, b], in Kurzschreib-


Rb Rb
weise f ≤ g, so folgt a f ≤ a g;
Rb Rb Rb
4. Für f, g : [a, b] → R stetig gilt a (f + g) = a f + a g;
Rb Rb
5. Für f : [a, b] → R stetig und λ ∈ R gilt a λf = λ a f .

149
Die schraffierte Fläche stellt ein Element von T(f ) dar für die durch den
geschwungenen Graphen dargestellte Funktion f .

150
5.2.4. Die beiden letzten Punkte bedeuten in der Sprache der linearen Algebra,
daß das Integral eine Linearform auf dem reellen Vektorraum aller stetigen re-
ellwertigen Funktionen auf unserem kompakten Intervall ist, als da heißt, eine
lineare Abbildung in den Körper der reellen Zahlen.
Beweis. 1. Wir wissen ja schon, daß aus m = 1 ≤ f (x) ≤ 1 = M folgt b − a ≤
Rb
a
f ≤ b − a.
2. Für Teilmengen A, B ⊂ R definiert man eine neue Teilmenge A + B ⊂ R
durch die Vorschrift A + B = {x + y | x ∈ A, y ∈ B}. Offensichtlich gilt

T(f ) = T(f |[a,z] ) + T(f |[z,b] )

Für beliebige nichtleere nach oben beschränkte Teilmengen A, B ⊂ R haben wir


aber sup(A + B) = sup A + sup B nach Übung 2.4.18.
3. Aus f ≤ g folgt offensichtlich T(f ) ⊂ T(g).
4 & 5. Um die letzten beiden Aussagen zu zeigen, müssen wir etwas weiter aus-
holen. Für unsere stetige Funktion f : [a, b] → R und beliebiges r ∈ N, r ≥ 1
unterteilen wir unser Intervall äquidistant, lateinisierend für „mit gleichen Ab-
ständen“, durch
a = t0 ≤ t1 ≤ t2 ≤ . . . ≤ tr = b
Es gilt also ti = a + i(b − a)/r. Wir definieren nun die r-te Riemann-Summe
S r (f ) ∈ R durch die Vorschrift
r−1
X r−1
X
S r (f ) := f (ti )(ti+1 − ti ) = f (ti )( b−a
r
)
i=0 i=0

In der anschließenden Proposition 5.2.5 werden wir


Z b
f = lim S r (f )
a r→∞

zeigen. Damit erhalten wir dann sofort


Rb
a
(f + g) = lim S r (f + g)
r→∞
= lim (S r (f ) + S r (g))
r→∞
= lim S r f + lim S r g
Rr→∞
b R b r→∞
= a
f
+ ag
Rb Rb
und ähnlich folgt a
λf = λ a
f.

151
Die schraffierte Fläche stellt die fünfte Riemannsumme der durch den
geschwungenen Graphen beschriebenen Funktion dar.

152
Rb
Proposition 5.2.5. Für a ≤ b und f : [a, b] → R stetig gilt a
f = lim S r (f ).
r→∞
Rb
Ergänzung 5.2.6. In der Notation a f (x) dx, die auf den Philosophen
R und Mathe-
matiker Leibniz zurückgeht, bedeutet das Integralzeichen ein S wie „Summe“
und dx meint die „Differenz im x-Wert“. Manchmal verwendet man auch allge-
meiner für eine weitere Funktion g : [a, b] → R mit guten Eigenschaften, R etwa
für g die Differenz zweier monoton wachsender Funktionen, die Notation f dg,
und meint damit den Grenzwert der Summen r−1
P
i=0 f (ti )(g(ti+1 ) − g(ti )), dessen
Existenz in [AN2] 8.4.2 folgende in großer Allgemeinheit diskutiert wird.
5.2.7. Man mag versucht sein, die in Proposition 5.2.5 enthaltene Beschreibung
gleich als Definition des Integrals zu nehmen. Ich rate davon jedoch ab, da die
Existenz des fraglichen Grenzwerts nicht so leicht zu zeigen ist, und da auch die
Zweite unserer Integrationsregeln 5.2.3 aus dieser Definition nicht so direkt folgt.
Nun kommt das natürlich eigentlich nicht darauf an, wenn unsere Definitionen
äquivalent sind. Aber man legt eben auch in Deutschland ein zentrales Ausliefe-
rungslager besser nach Frankfurt als nach Freiburg!
Beweis. Wir definieren zusätzlich zur r-ten Riemann-Summe die r-ten Unter-
summen und Obersummen durch
r−1 r−1
r
X r X
S (f ) := (inf f [ti , ti+1 ])( b−a
r
) und S (f ) := (sup f [ti , ti+1 ])( b−a
r
)
i=0 i=0

und behaupten die Ungleichungen


r
S r (f ) ≤ S r (f ) ≤ S (f )
Rb r
S r (f ) ≤ a
f ≤ S (f )
Die erste Zeile ist offensichtlich. Die zweite Zeile erhalten wir zum Beispiel, in-
dem wir aus den bereits bewiesenen Teilen 1 und 3 des Satzes die Ungleichungen
Z ti+1
b−a
(inf f [ti , ti+1 ])( r ) ≤ f ≤ (sup f [ti , ti+1 ])( b−a
r
)
ti

folgern, diese Ungleichungen aufsummieren,


Rb und die Mitte mit dem auch bereits
bewiesenen Teil 2 des Satzes zu a f zusammenfassen. Damit sind beide Zeilen
von Ungleichungen bewiesen. Nun ist f auf [a, b] gleichmäßig stetig nach 5.1.15,
für beliebiges ε > 0 existiert also δ = δε > 0 mit |x − y| < δ ⇒ |f (x) −
f (y)| < ε. Wählen wir N mit ( b−a
N
) < δ und nehmen dann r ≥ N , so schwankt
unsere Funktion f auf jedem Teilintervall [ti , ti+1 ] höchstens um ε, mithin gilt
r Rb
0 ≤ S (f ) − S r (f ) ≤ ε(b − a) und damit |S r (f ) − a f | ≤ ε(b − a). Die
Proposition ist gezeigt.

153
Rb
In der Notation a f (x) dx, die auf den Philosophen
R und Mathematiker Leibniz
zurückgeht, bedeutet das Integralzeichen ein S wie „Summe“ und dx meint die
„Differenz im x-Wert“.

Die schraffierte Fläche stellt die vierte Obersumme der durch den
geschwungenen Graphen beschriebenen Funktion dar, der kreuzweise
schraffierte Teil ihre Untersumme.

154
Beispiel 5.2.8 (Fläche eines rechtwinkligen Dreiecks als Integral). Für b ∈ R≥0
finden wir
Rb  
0 b 2b (r−1)b b
0
x dx = lim r→∞ r
+ r
+ r
+ · · · r r
r(r−1) b2
= limr→∞ 2
· r2
nach 1.1.1
b2
= 2

Lemma 5.2.9 (Standardabschätzung für Integrale). Gegeben a ≤ b reelle Zah-


len und f : [a, b] → R stetig gilt die Abschätzung
Z b Z b
f ≤ |f |
a a
R R R
Beweis. Aus −|f | ≤ f ≤ |f | folgt − |f | ≤ f ≤ |f |.
5.2.10 (Integrale mit vertauschten Grenzen). Ist f : R ⊃ I → R eine stetige
R b Intervall ein Intervall I und sind a, b ∈ I gegeben mit a > b,
Funktion auf einem
so erklären wir a f (x) dx durch die Vorschrift
Z b Z a
f (x) dx := − f (x) dx
a b

Mit dieser Konvention gilt dann für beliebige a, b, c ∈ I die Formel


Z c Z b Z c
f (x) dx = f (x) dx + f (x) dx
a a b

Übungen
Übung 5.2.11. Diese Übung wird verwendet bei der Diskussion der Bogenlänge.
Sei a = a0 ≤ a1 ≤ a2 ≤ . . . ≤ an = b eine Unterteilung des kompakten
reellen Intervalls [a, b]. Gegeben eine Funktion f : [a, b] → R bezeichnet man die
Summen
Xn−1
f (ζi )(ai+1 − ai )
i=0

mit beliebigen ζi ∈ [ai , ai+1 ] als die Riemann-Summen von f zur vorgegebenen
Unterteilung. Die maximale Länge sup{ai −ai−1 | 1 ≤ i ≤ n} eines Teilintervalls
heißt die Feinheit der Unterteilung. Man zeige: Ist f : [a, b] → R stetig, so
gibt es zu jedem ε > 0 ein δ > 0 derart, daß R alle Riemannsummen von f zu
Unterteilungen der Feinheit ≤ δ vom Integral f einen Abstand ≤ ε haben.

155
Darstellung einer Riemannsumme im Sinne von 5.2.11.

156
Ergänzung 5.2.12. Allgemeiner heißt eine nicht notwendig stetige Funktion auf
einem kompakten
R reellen Intervall f : [a, b] → R Riemann-integrierbar mit
Integral f , wenn die Bedingung vom Ende der vorhergehenden Übung erfüllt
ist, daß es nämlich zu jedem ε > 0 ein δ > 0 gibt derart, R daß alle Riemann-
Summen von f zu Unterteilungen der Feinheit ≤ δ von f einen Abstand ≤
ε haben. Wir werden in diesem Text den Begriff der Riemann-Integrierbarkeit
vermeiden: Später wird eh das sehr viel stärkere Lebesgue-Integral eingeführt,
und bis dahin reicht unser Integrationsbegriff für stetige Funktionen aus. Für ein
vertieftes Studium der Analysis ist jedoch auch der Begriff der Riemann-Integrier-
barkeit relevant.
Ergänzende Übung 5.2.13. Man zeige den Mittelwertsatz der Integralrechnung:
R kompaktes Intervall [a, b] ⊂ R und f : [a, b] → R stetig
Gegeben ein nichtleeres
gibt es ξ ∈ [a, b] mit f = (b − a)f (ξ). Gegeben
R eine Rweitere stetige Funktion
g : [a, b] → R≥0 gibt es sogar ξ ∈ [a, b] mit f g = f (ξ) g.

5.3 Ableitung an einer Stelle


Definition 5.3.1. Wir nennen eine Teilmenge D ⊂ R halboffen, wenn sie mit
jedem Punkt auch mehrpunktiges Intervall umfaßt, das besagten Punkt enthält.

Definition 5.3.2. Eine Funktion f : R ⊃ D → R mit halboffenem Definitionsbe-


reich D heißt differenzierbar bei p ∈ D mit Ableitung b ∈ R, wenn gilt

f (x) − f (p)
lim =b
x→p x−p

Wir kürzen diese Aussage ab durch f 0 (p) = b oder df


dx
(p) = b oder, wenn die
Funktion x 7→ f (x) durch einen größeren Ausdruck in x gegeben ist, durch

d
f (x) = b
dx x=p

5.3.3. Jede nicht vertikale alias nicht zur y-Achse parallele Gerade in der Ebene
ist die Lösungsmenge genau einer Gleichung der Gestalt y = a + bx. Die reelle
Zahl b heißt in diesem Fall die Steigung unserer Gerade. Anschaulich bedeutet
der Differenzenquotient
f (x) − f (p)
x−p
die Steigung der Gerade durch die Punkte (p, f (p)) und (x, f (x)). Diese Gerade
heißt auch eine Sekante, lateinisch für „Schneidende“, da sie eben den Graphen
unserer Funktion in den beiden besagten Punkten schneidet. Der Grenzwert f 0 (p)

157
Eine Sekantensteigung und die Tangentensteigung der durch den gezahnten
Graphen dargestellten Funktion

158
der Sekantensteigungen bedeutet anschaulich die Steigung der Tangente, latei-
nisch für „Berührende“, an den Graphen von f im Punkt (p, f (p)). Die Umkeh-
rung dieser Anschauung liefert auch eine präzise Definition besagter Tangente als
der Gerade durch den Punkt (p, f (p)) mit der Steigung f 0 (p).
5.3.4 (Differenzierbarkeit, Umformulierungen der Definition). Wir geben noch
zwei Umformulierungen der Definition der Differenzierbarkeit. Ist D ⊂ R ei-
ne halboffene Teilmenge, so ist nach 3.5.7 eine Funktion f : D → R diffe-
renzierbar bei p mit Ableitung f 0 (p) = b genau dann, wenn es eine Funktion
ϕ = ϕp : D → R gibt, die stetig ist bei p mit Funktionswert ϕ(p) = b alias
limx→p ϕ(x) = ϕ(p) = b derart, daß für alle x ∈ D gilt

f (x) = f (p) + (x − p)ϕ(x)

Das bedeutet, daß die Sekantensteigungsfunktion ϕ(x) := (f (x)−f (p))/(x−p)


durch die Vorschrift ϕ(p) = b stetig an die Stelle p fortgesetzt werden kann. In
nochmals anderen Formeln ist unsere Funktion f : D → R differenzierbar bei p
mit Ableitung f 0 (p) = b genau dann, wenn gilt

f (p + h) = f (p) + bh + ε(h)h

für eine Funktion ε, die stetig ist bei Null und die dort den Wert ε(0) = 0 annimmt,
in Formeln limh→0 ε(h) = ε(0) = 0. Hierbei ist zu verstehen, daß die Funktion
ε definiert sein soll auf der Menge aller h mit h + p ∈ D. Diese Formulierung
des Ableitungsbegriffs hat den Vorteil, besonders gut zum Ausdruck zu bringen,
inwiefern für festes p und kleines h der Ausdruck f (p) + bh eine besonders gute
Approximation von f (p + h) ist.
Beispiele 5.3.5. Eine konstante Funktion R → R ist an jeder Stelle differenzierbar
mit Ableitung Null. Die Funktion id : R → R, x 7→ x hat bei jedem Punkt p die
Ableitung id0 (p) = dx
dx
(p) = 1.

Lemma 5.3.6. Die Funktion x 7→ x1 ist differenzierbar bei jedem Punkt von R×
und ihre Ableitung bei einer Stelle p ∈ R× ist − p12 .
1
− p1 −1
Beweis. Wir rechnen limx→p x
x−p
= limx→p xp
= − p12 nach 3.5.9.

Lemma 5.3.7. Ist eine Funktion f : R ⊃ D → R mit halboffenem Definitionsbe-


reich D differenzierbar bei p ∈ D, so ist f stetig bei p.

Beweis. Das folgt aus der Darstellung f (x) = f (p) + (x − p)ϕ(x) mit ϕ stetig
bei p aus 5.3.4.

159
5.3.8. Ist f : (a, b) → R definiert auf einem offenen Intervall um einen Punkt
p ∈ (a, b) und existieren die Grenzwerte
f (x) − f (p) f (x) − f (p)
lim beziehungsweise lim
x%p x−p x&p x−p
im Sinne von 3.5.41, so nennen wir sie die linksseitige beziehungsweise die
rechtsseitige Ableitung von f an der Stelle p. Nach der Charakterisierung 3.5.41
eines Grenzwerts als übereinstimmender rechts- und linksseitiger Grenzwert ist f
differenzierbar bei p genau dann, wenn dort die linksseitige und die rechtsseiti-
ge Ableitung existieren und übereinstimmen. Man erkennt so zum Beispiel, daß
der Absolutbetrag abs : R → R, x 7→ |x| nicht differenzierbar ist bei p = 0,
da dort die linksseitige und die rechtsseitige Ableitung zwar existieren, aber nicht
übereinstimmen.

5.4 Ableitungsregeln
Proposition 5.4.1. Seien Funktionen f, g : R ⊃ D → R für D halboffen differen-
zierbar bei p ∈ D. So sind auch die Funktionen f + g und f g differenzierbar bei
p und es gilt

(f + g)0 (p) = f 0 (p) + g 0 (p) und (f g)0 (p) = f 0 (p)g(p) + f (p)g 0 (p)

Beweis. Wir schreiben wie in 5.3.4


f (p + h) = f (p) + f 0 (p)h + ε(h)h
g(p + h) = g(p) + g 0 (p)h + ε̂(h)h
für Funktionen ε, ε̂, die stetig sind bei Null und die dort verschwinden. Lassen wir
der Übersichtlichkeit halber alle (p) weg, so liest sich das

f (p + h) = f + f 0 h + ε(h)h
g(p + h) = g + g 0 h + ε̂(h)h
Durch Addieren beziehungsweise Multiplizieren dieser Gleichungen erhalten wir
dann
(f + g)(p + h) = (f + g)(p) + [f 0 + g 0 ] h + ε(h) + ε̂(h) h


(f g)(p + h) = (f g)(p) + [f 0 g + f g 0 ] h
+ ε(h)g + f ε̂(h) + (f 0 + ε(h))(g 0 + ε̂(h))h h


Nach unseren Kenntnissen über stetige Funktionen steht aber in der letzten ecki-
gen Klammer auf der rechten Seite jeder dieser Gleichungen eine Funktion, die
stetig ist bei h = 0 und die dort den Wert Null annimmt.

160
Definition 5.4.2. Ist eine Funktion f : R ⊃ D → R mit D halboffen differenzier-
bar an jedem Punkt von D, so nennen wir f differenzierbar auf D und nennen
die Funktion f 0 : D → R, p 7→ f 0 (p) ihre Ableitung.
Beispiel 5.4.3. Die Funktion x 7→ 1/x ist differenzierbar auf R× mit Ableitung
−1/x2 . Sind f und g differenzierbar, so auch f + g und f g und für ihre Ableitun-
gen gelten die Summenregel und die Produktregel oder Leibniz-Regel

(f + g)0 = f 0 + g 0 und (f g)0 = f 0 g + f g 0

Korollar 5.4.4 (Ableiten ganzzahliger Potenzen). Für alle n ∈ Z und unter der
Voraussetzung x 6= 0 im Fall n ≤ 0 ist die Ableitung der Funktion x 7→ xn die
Funktion x 7→ nxn−1 .
5.4.5. Im Fall n = 0 ist die Ableitung der konstanten Funktion x0 = 1 natürlich
überall definiert und Null, kann aber nur für x 6= 0 in der Form 0x−1 geschrieben
werden.
Beweis. Man zeigt das durch vollständige Induktion über n separat für n ≥ 0 und
n ≤ −1.
Satz 5.4.6 (Kettenregel). Seien D, E ⊂ R halboffene Teilmengen und f : D → R
sowie g : E → R Funktionen und es gelte f (D) ⊂ E. Sei f differenzierbar bei
p ∈ D und g differenzierbar bei f (p). So ist g ◦ f : D → R differenzierbar bei p
mit Ableitung
(g ◦ f )0 (p) = g 0 (f (p)) · f 0 (p)
Beweis. Der besseren Übersichtlichkeit halber benutzen wir hier Großbuchstaben
für die Ableitungen und setzen f 0 (p) = L und g 0 (f (p)) = M . Wir haben

f (p + h) = f (p) + Lh + ε(h)h
g(f (p) + k) = g(f (p)) + M k + ε̂(k)k

für Funktionen ε und ε̂, die stetig sind bei Null und die dort verschwinden. Wir
erhalten durch Einsetzen von Lh + ε(h)h für k sofort

g(f (p + h)) = g f (p) + Lh + ε(h)h
= g(f (p)) + M Lh + M ε(h)h + ε̂(Lh + ε(h)h)(L + ε(h))h

Es ist nun aber offensichtlich, daß sich hier die Summe der Terme ab dem dritten
Summanden einschließlich in der Gestalt η(h)h schreiben läßt für eine Funktion
η, die stetig ist bei Null und die dort verschwindet, und wir erhalten

(g ◦ f )(p + h) = (g ◦ f )(p) + M Lh + η(h)h

161
Proposition 5.4.7 (Quotientenregel). Sei f : R ⊃ D → R eine Funktion ohne
Nullstelle und D ⊂ R halboffen.

1. Ist f differenzierbar bei p ∈ D, so ist auch 1/f : D → R, x 7→ 1/f (x)


differenzierbar bei p und hat dort die Ableitung −f 0 (p)/f (p)2 ;

2. Ist zusätzlich g : D → R differenzierbar bei p, so ist auch g/f differenzier-


bar bei p mit Ableitung
 0
g g 0 (p)f (p) − g(p)f 0 (p)
(p) =
f f (p)2

Beweis. Teil 1 folgt sofort aus der Formel 5.3.6 für die Ableitung de Funktion
x 7→ 1/x mit der Kettenregel. Teil 2 folgt aus Teil 1 mit der Produktregel.
5.4.8. Seien D ⊂ R halboffen und g, f : R ⊃ D → R differenzierbar. Hat f
keine Nullstelle auf D, so ist auch g/f differenzierbar auf D mit der Ableitung
 0
g g 0 f − gf 0
=
f f2

Lemma 5.4.9 (Ableitung der Exponentialfunktion). Die Exponentialfunktion


ist ihre eigene Ableitung, in Formeln exp0 (p) = exp(p) ∀p ∈ R.

Beweis. In 6.1.16 werden wir lernen, daß man „Potenzreihen gliedweise differen-
zieren darf“. Da wir das aber bis jetzt noch nicht wissen, müssen wir etwas mehr
arbeiten. Wir bestimmen zunächst die Ableitung der Exponentialfunktion an der
Stelle p = 0 und erhalten
exp(x)−exp(0)
exp0 (0) = limx→0 x−0
P∞ xi−1
= limx→0 i=1 i!
 P∞ 
xi−2
= limx→0 1 + x i=2 i!

= 1

nach unseren Erkenntnissen zum Grenzwert durch


P∞ Einquetschen 3.5.35 und Grenz-
xi−2
wert von Summe und Produkt 3.5.34, da ja | i=2 i! | für |x| ≤ 1 beschränkt ist
durch die Euler’sche Zahl e. Um exp0 (p) für beliebiges p zu bestimmen, rechnen
wir
exp0 (p) = limh→0 exp(p+h)−exp(p)
h
exp(h) − 1
= limh→0 h
exp(p)
= exp(p)

162
Hier verwenden wir im letzten Schritt den schon behandelten Fall p = 0 und
formal im ersten Schritt eine der Verknüpfungsregeln für Grenzwerte aus 3.5.27,
um den Grenzwert x → p in einen Grenzwert h → 0 umzuformen.
5.4.10 (Ableitung der trigonometrischen Funktionen). Ganz genau wie im vor-
hergehenden Beweis zeigt man, daß Sinus und Cosinus bei Null differenzierbar
sind mit der Ableitung sin0 (0) = 1 und cos0 (0) = 0. Mit der Additionsformel
sin(t + h) = sin(t) cos(h) + cos(t) sin(h) folgt sin0 = cos und mit der anderen
Additionsformel cos0 = − sin.

Satz 5.4.11 (Ableitung von Umkehrfunktionen). Seien I ⊂ R ein mehrpunkti-


ges Intervall sowie f : I → R streng monoton, stetig auf I und differenzierbar
bei p ∈ I mit Ableitung f 0 (p) 6= 0. So ist die Umkehrfunktion f −1 : f (I) → R
differenzierbar bei q = f (p) mit Ableitung

(f −1 )0 (q) = 1/f 0 (f −1 (q))

Beweis. Nach unseren Annahmen gibt es eine stetige Funktion ohne Nullstelle
ϕ : I → R mit f (x) − f (p) = (x − p)ϕ(x) und ϕ(p) = f 0 (p). Setzen wir hier
x = f −1 (y), so ist ψ = 1/(ϕ ◦ f −1 ) : f (I) → R eine stetige Funktion mit
(y − q)ψ(y) = f −1 (y) − f −1 (q) und ψ(q) = 1/f 0 (p).
Beispiel 5.4.12. Die Ableitung des Logarithmus ist mithin
1 1
log0 (q) = =
exp(log q) q

Damit ergibt sich für alle a ∈ R die Ableitung der allgemeinen Potenzen, also
der Funktionen (0, ∞) → R, x 7→ xa , zu x 7→ axa−1 . In der Tat, nach Definition
gilt ja xa = exp(a log x), die Ableitung wird also a x1 exp(a log x) = axa−1 .
Beispiel 5.4.13. Der Arcussinus ist nach 5.4.11 differenzierbar auf (−1, 1) und
seine Ableitung ergibt sich mit unserer Regel für die Ableitung einer Umkehr-
funktion zu
arcsin0 (x) = 1/(cos(arcsin
p x))
2
= 1/√ 1 − sin (arcsin x)
= 1/ 1 − x2
Beispiel 5.4.14. Die Ableitung des Tangens ergibt sich mit der Quotientenregel zu
2 x+sin2 x
tan0 (x) = cos cos2x = 1 + tan2 (x). Die Ableitung von arctan ergibt sich mit
der Regel 5.4.11 über die Ableitung der Umkehrfunktion zu
1
arctan0 (t) =
1 + t2

163
Veranschaulichung der Formel 5.4.11 für die Ableitung von Umkehrfunktionen

164
Lemma 5.4.15. Die Funktion f : R → R gegeben durch
 −1/x
e x>0
f (x) =
0 x≤0
ist beliebig oft differenzierbar.
Beweis. Wir betrachten allgemeiner für alle n ∈ N die Funktion fn : R → R,
 −n −1/x
x e x>0
fn (x) =
0 x≤0

und zeigen, daß sie differenzierbar ist mit Ableitung fn0 = −nfn+1 + fn+2 . Damit
sind wir dann natürlich fertig. Das einzige Problem ist die Ableitung an der Stelle
p = 0, wo wir nachweisen müssen, daß die Sekantensteigungen „von rechts“ auch
gegen Null streben, daß also für alle n ∈ N gilt

lim x−n−1 e−1/x = 0


x&0

Nun wissen wir aber nach der Definition von exp, daß für jedes m ∈ N und
x > 0 gilt exp(x) > xm /m!. Für jedes n ∈ N und x > 0 gilt also exp(1/x) >
x−n−2 /(n + 2)! und wir folgern 0 < x−n−1 e−1/x < (n + 2)! x für x > 0.

Übungen
Übung 5.4.16 (Eine differenzierbare Funktion mit unstetiger Ableitung). Die
Funktion f : R → R gegeben durch f (x) = x2 sin(x−1 ) für x 6= 0 und f (0) = 0
ist differenzierbar auf R, aber ihre Ableitung ist nicht stetig beim Nullpunkt.

5.5 Folgerungen aus Eigenschaften der Ableitung


Definition 5.5.1. Eine Teilmenge der reellen Zahlen heißt offen, wenn sie für
jeden ihrer Punkte eine Umgebung ist. In Formeln ist demnach eine Teilmenge
U ⊂ R offen genau dann, wenn es für jeden Punkt p ∈ U ein ε > 0 gibt mit
(p − ε, p + ε) ⊂ U .
Satz 5.5.2 (Notwendige Bedingung für ein Extremum). Nimmt eine reellwer-
tige Funktion, die auf einer offenen Teilmenge der reellen Zahlen definiert ist, an
einem Punkt dieser offenen Teilmenge ihr Maximum oder ihr Minimum an, und ist
sie dort differenzierbar, so verschwindet an diesem Punkt ihre Ableitung.
5.5.3. In Formeln haben wir also

◦ U → R diffbar bei p ∈ U mit f (x) ≥ f (p) ∀x ∈ U ⇒ f 0 (p) = 0.



f :R⊃

165
Illustration zu 5.4.16. Der Graph der Funktion ist zwischen zwei parabolischen
Backen eingezwängt und hat deshalb am Ursprung Null Grenzwert der
Sekantensteigungen, hat aber beliebig nah am Ursprung immer wieder Stellen
mit Steigung Eins. Die entsprechend durch x2 sin(x−2 ) gegebene Funktion wird
sogar beliebig nah am Ursprung beliebig steil.

166
5.5.4. Die Bedingung, unsere Teilmenge sei offen, ist an dieser Stelle wesentlich:
Gegeben reelle Zahlen a < b nimmt etwa die Funktion x 7→ x auf dem Intervall
[a, b] ihr Minimum bei a und ihr Maximum bei b an, aber die Ableitung unserer
Funktion verschwindet weder bei a noch bei b. Für Minima oder Maxima einer
Funktion f : [a, b] → R, die auf (a, b) differenzierbar ist, kommen ganz allgemein
nach unserem Satz nur in Frage: Einerseits Endpunkte des Intervalls, und ande-
rerseits die Punkte im Innern des Intervalls, an denen die Ableitung verschwindet.
Mit etwas Glück können wir unter diesen Punkten dann durch Ausprobieren her-
auskriegen, wo das Minimum und das Maximum wirklich angenommen werden.

Beweis. Bezeichne U ⊂ R unsere offene Teilmenge und f : U → R unsere Funk-


tion. Nimmt f ein Maximum an bei p ∈ U , so gilt für die Sekantensteigungsfunk-
tion ϕ(x) = f (x)−f
x−p
(p)
offensichtlich ϕ(x) ≥ 0 für x < p und ϕ(x) ≤ 0 für x > p.
Wenn der Grenzwert der Sekantensteigungen existiert, so folgt aus der Erhaltung
3.5.37 von Ungleichungen im Grenzwert 0 ≤ limx%p ϕ(x) = limx→p ϕ(x) =
limx&p ϕ(x) ≤ 0 und damit ist dann dieser Grenzwert Null. Nimmt f ein Mini-
mum an bei p, so argumentiert man analog.
Beispiel 5.5.5. Das Brechungsgesetz behauptet, daß das Verhältnis vom Sinus des
Eintrittswinkels zum Sinus des Austrittswinkels eines Lichtstrahls beim Übergang
zwischen zwei Medien, sagen wir Luft und Wasser, konstant ist. Wir leiten es nun
ab aus dem sogenannten Fresnel’schen Prinzip, nach dem ein Lichtstrahl „stets
den schnellsten Weg nimmt“. Ist sagen wir die Lichtgeschwindigkeit in Wasser
das γ-fache der Lichtgeschwindigkeit in Luft, so sollte nach diesem Prinzip der
Lichtstrahl mit den Bezeichnungen aus nebenstehendem Bild bei dem x in das
Wasser eintauchen, für das der Ausdruck
√ p
a2 + x2 + γ b2 + (L − x)2

minimal wird. Ableiten liefert dafür die notwendige Bedingung


2x −2(L − x)
√ +γ p =0
2 a2 + x 2 2 b2 + (L − x)2

und damit steht das Brechnungsgesetz sin ϕ = γ sin ϕ0 auch schon da.
Satz 5.5.6 (von Rolle). Seien a < b aus R̄ gegeben und sei f : [a, b] → R stetig
auf dem kompakten Intervall [a, b] und differenzierbar auf dem offenen Intervall
(a, b). Gilt dann f (a) = f (b), so gibt es p ∈ (a, b) mit f 0 (p) = 0.
Beweis. Nach 5.1.5 gibt es Punkte p, q ∈ [a, b], an denen f sein Maximum und
sein Minimum annimmt. Liegt einer dieser Punkte im Innern (a, b) unseres In-
tervalls, so verschwindet dort die Ableitung nach dem vorhergehenden Satz und

167
Veranschaulichung der notwendigen Bedingung für ein Maximum 5.5.2

Zum Brechungsgesetz

168
wir sind fertig. Nimmt f sein Maximum und sein Minimum auf dem Rand des
Intervalls an, so ist die Funktion f wegen unserer Annahme f (a) = f (b) konstant
und wir sind auch fertig.
Korollar 5.5.7 (Mittelwertsatz). Seien a, b ∈ R gegeben mit a < b und sei
f : [a, b] → R stetig auf dem ganzen kompakten Intervall [a, b] und differenzierbar
auf dem offenen Intervall (a, b). So gibt es p ∈ (a, b) mit
f (b) − f (a)
f 0 (p) =
b−a

Beweis. Man wende den vorhergehenden Satz von Rolle 5.5.6 an auf die Funktion
g : [a, b] → R, g(x) = f (x) − f (a) − (x − a) f (b)−f
b−a
(a)
, die aus f entsteht durch
„Subtraktion der globalen Sekanten“.
Satz 5.5.8 (Erste Ableitung und Monotonie). Seien I ⊂ R ein mehrpunktiges
Intervall und f : I → R eine differenzierbare Funktion. So gilt
f0 >0 ⇒ f wächst streng monoton
f0 ≥0 ⇔ f wächst monoton
f0 <0 ⇒ f fällt streng monoton
f0 ≤0 ⇔ f fällt monoton
f0 =0 ⇔ f ist konstant
Beweis. Es reicht, die beiden ersten Aussagen zu zeigen. Wächst f nicht streng
monoton, so gibt es a < b mit f (a) ≥ f (b) und nach dem Mittelwertsatz finden
wir p ∈ (a, b) mit
f (a) − f (b)
f 0 (p) = ≤0
a−b
Wächst f nicht monoton, so finden wir in derselben Weise p ∈ I mit f 0 (p) < 0.
Das zeigt schon mal ⇒. Umgekehrt folgt aus f monoton wachsend, daß alle Se-
kantensteigungen nichtnegativ sind, und damit auch alle Grenzwerte von Sekan-
tensteigungen.
Korollar 5.5.9 (Funktionen, die ihre eigene Ableitung sind). Sei I ⊂ R ein
mehrpunktiges Intervall. Genau dann stimmt eine differenzierbare Funktion f :
I → R überein mit ihrer eigenen Ableitung, wenn sie ein Vielfaches der Exponen-
tialfunktion ist, in Formeln
f 0 = f ⇔ ∃c ∈ R mit f (x) = c exp(x)
5.5.10. Eine differenzierbare Funktion f : R× → R mit f 0 = f muß keineswegs
ein Vielfaches der Exponentialfunktion sein. Zum Beispiel wäre die Funktion f
mit f (x) = 0 für x < 0 und f (x) = 5 exp(x) für x > 0 auch eine Möglichkeit.
Aber gut, R× ist ja auch kein Intervall.

169
Veranschaulichung des Mittelwertsatzes 5.5.7

170
Beweis. Bezeichne I ⊂ R unser mehrpunktiges Intervall und f : I → R un-
sere differenzierbare Funktion mit f = f 0 . Die Ableitung der Funktion f (x) e−x
ergibt sich mit der Produktregel zu f 0 (x) e−x −f (x) e−x = 0, mithin ist die Funk-
tion f (x) e−x konstant, sagen wir mit einzigem Funktionswert c, und wir folgern
f (x) = c ex ∀x ∈ I.
5.5.11 (Terminologisches zu Intervallen). Ein reelles Intervall ist halboffen im
Sinne unserer Definition 5.3.1 genau dann, wenn es nicht aus einem einzigen
Punkt besteht. In der Literatur wird der Begriff „halboffen“ meist abweichend ver-
wendet für Intervalle, die weder offen noch kompakt sind, also für reelle Intervalle
der Gestalt (a, b] oder [a, b). Bei uns heißen jedoch auch Intervalle der Gestalt [a, b]
mit a < b halboffen, da sie eben halboffen sind als Teilmengen von R im Sinne
der obigen Definition. Da aber der Begriff eines „halboffenen Intervalls“ schon so
fest besetzt ist und da auch der Terminus „unendliches Intervall“ vermutlich eher
als „Intervall unendlicher Länge“ verstanden wird, will ich stattdessen lieber von
„nicht einpunktigen Intervallen“ oder im Fall, daß sie auch nicht leer sind, wie
bisher von „mehrpunktigen reellen Intervallen“ reden. So richtig gefällt mir das
auch nicht, es hört sich so diskret an. Mir ist aber nichts Besseres eingefallen, und
das Konzept wird uns so oft begegnen, daß es eine griffige Bezeichnung braucht.

Satz 5.5.12 (Hinreichende Bedingung für ein lokales Extremum). Seien I ⊂ R


ein mehrpunktiges reelles Intervall, f : I → R differenzierbar und p ∈ I ein
Punkt mit f 0 (p) = 0. Sei zusätzlich die Ableitung f 0 von f differenzierbar bei p.

1. Gilt f 00 (p) > 0, so besitzt f ein isoliertes lokales Minimum bei p, als
da heißt, es gibt r > 0 derart, daß gilt f (q) > f (p) für alle q ∈ I mit
0 < |q − p| < r;

2. Gilt f 00 (p) < 0, so besitzt f ein isoliertes lokales Maximum bei p.

Beweis. Wir schreiben


f 0 (x) = f 0 (p) + (x − p)ϕ(x)
= (x − p)ϕ(x)

mit ϕ stetig in p und ϕ(p) = f 00 (p) > 0. So gibt also r > 0 mit ϕ(q) > 0 für
q ∈ I ∩ (p − r, p + r), und wir folgern f 0 (q) < 0 für q ∈ I ∩ (p − r, p) und
f 0 (q) > 0 für q ∈ I ∩ (p, p + r). Unseren Funktion f fällt also streng monoton
auf I ∩ (p − r, p) und wächst streng monoton auf I ∩ (p, p + r). Der andere Fall
f 00 (p) < 0 wird analog behandelt.

Definition 5.5.13. Wir nennen eine Funktion f : I → R auf einem reellen Inter-
vall I konvex beziehungsweise konkav, wenn ihr Graph unter beziehungsweise

171
über jeder seiner Sekanten liegt, wenn also in Formeln für alle x < y < z aus I
gilt
f (x) − f (y) f (y) − f (z)

x−y y−z
beziehungsweise ≥ für konkave Funktionen.

5.5.14. Man zeigt leicht, daß die Bedingung der Konvexität gleichbedeutend ist
zu
f (tx + sz) ≤ tf (x) + sf (z) ∀s, t ∈ [0, 1] mit s + t = 1.

Satz 5.5.15 (Zweite Ableitung und Konvexität). Sei I ⊂ R ein mehrpunktiges


Intervall und sei f : I → R eine zweimal differenzierbare Funktion. So gilt

f ist konvex ⇔ f 00 (x) ≥ 0 ∀x ∈ I


f ist konkav ⇔ f 00 (x) ≤ 0 ∀x ∈ I

Beweis. Wir zeigen nur die erste Aussage. Ist f nicht konvex, so gibt es x, y, z
mit x < y < z aber
f (x) − f (y) f (y) − f (z)
>
x−y y−z
Nach dem Mittelwertsatz finden wir dann aber ξ < ζ mit f 0 (ξ) > f 0 (ζ) und
bei nochmaligem Anwenden η mit f 00 (η) < 0. Ist umgekehrt f konvex, so reicht
es nach 5.5.8 zu zeigen, daß f 0 monoton wächst. Kürzen wir die Steigung der
Sekante durch (x, f (x)) und (y, f (y)) ab mit sxy := f (x)−f
x−y
(y)
, so impliziert die
Konvexität die Ungleichungskette

sxy ≤ sxz ≤ syz

Hier ist sxy ≤ syz eine direkte Konsequenz der Konvexität, und da sicher gilt
(x − y)sxy + (y − z)syz = (x − z)sxz , liegt sxz als ein „gewichtetes Mittel“
zwischen sxy und syz . Unsere Ungleichungskette schreiben wir aus zu

f (x) − f (y) f (x) − f (z) f (y) − f (z)


≤ ≤
x−y x−z y−z

Die Sekantensteigungsfunktionen y 7→ f (x)−f


x−y
(y)
und y 7→ f (y)−f
y−z
(z)
wachsen ins-
besondere monoton auf (x, z] beziehungsweise [x, z) und im Grenzwert folgt

f (x) − f (z)
f 0 (x) ≤ ≤ f 0 (z)
x−z

172
Links der Graph einer konvexen, rechts der einer konkaven Funktion

Veranschaulichung unserer Ungleichungskette für die Sekantensteigungen bei


konvexen Funktionen aus dem Beweis von 5.5.15

173
Definition 5.5.16. Wir nennen eine Funktion f : I → R auf einem reellen In-
tervall I streng konvex beziehungsweise streng konkav, wenn ihr Graph echt
unter beziehungsweise echt über jeder Sekante liegt, wenn also in Formeln für
alle x < y < z aus I gilt

f (x) − f (y) f (y) − f (z)


<
x−y y−z
beziehungsweise > für streng konkave Funktionen.

Satz 5.5.17. Seien I ⊂ R ein mehrpunktiges Intervall und f : I → R zweimal


differenzierbar. So gilt

f ist streng konvex ⇐ f 00 (x) > 0 ∀x ∈ I


f ist streng konkav ⇐ f 00 (x) < 0 ∀x ∈ I

Beweis. Übung.

Übungen
Übung 5.5.18. An welchen Stellen nimmt die Funktion [−1, 2] 7→ R gegeben
durch x 7→ |2 − x2 | ihr Minimum und Maximum an?
Ergänzende Übung 5.5.19. Bei welchem Verhältnis zwischen Durchmesser und
Höhe umfaßt eine Konservendose mit fest vorgegebener Oberfläche das größt-
mögliche Volumen?
Übung 5.5.20. Eine differenzierbare Funktion auf einem mehrpunktigen Intervall,
deren Ableitung beschränkt ist, ist gleichmäßig stetig.
Ergänzende Übung 5.5.21. Gegeben eine differenzierbare Funktion auf einem
mehrpunktigen Intervall ist das Bild des fraglichen Intervalls unter der Ableitung
unserer Funktion wieder ein Intervall. Hinweis: Mittelwertsatz. Man beachte, daß
die Stetigkeit der Ableitung nicht vorausgesetzt wird.
Übung 5.5.22. Sei a ∈ R gegeben. Ist f : R → R differenzierbar und löst die
Differentialgleichung f 0 = af , so gilt f (x) = f (0) eax für alle x ∈ R.
Übung 5.5.23 (Funktionen, die mindestens ihre eigene Ableitung sind). Ist eine
Funktion f : [0, b) → R differenzierbar mit f 0 (t) ≤ f (t) für alle t ∈ [0, b), so folgt
f (t) ≤ f (0)et für alle t ∈ [0, b). Ist allgemeiner f : [0, b) → R differenzierbar und
α ∈ R derart, daß gilt f 0 (t) ≤ αf (t) für alle t ∈ [0, b), so folgt f (t) ≤ f (0)eαt
für alle t ∈ [0, b).
Übung 5.5.24. Seien I ⊂ R ein mehrpunktiges Intervall und f : I → R differen-
zierbar mit der Eigenschaft f (x) = 0 ⇒ f 0 (x) < 0. Man zeige, daß dann f in

174
I höchstens eine Nullstelle haben kann, und daß f links von dieser Nullstelle po-
sitiv und rechts davon negativ sein muß. Hinweis: Zwischen zwei verschiedenen
Nullstellen muß es nach Voraussetzung eine Nichtnullstelle geben und dann eine
kleinste Nullstelle oberhalb und eine größte Nullstelle unterhalb dieser Nichtnull-
stelle. Von da aus finde man einen Widerspruch zu den Annahmen. Die Übung
wird bei der Diskussion differentieller Ungleichungen helfen.

Ergänzende Übung 5.5.25. Man zeige, daß ein Punkt (x, y) ∈ (0, 1)2 genau dann
auf einem Geradensegment der Länge Eins mit einem Ende auf der x-Achse und
dem anderen Ende auf der y-Achse liegt, wenn gilt y 2/3 + x2/3 ≤ 1. Hinweis: Man
halte x fest und berechne für alle a ∈ [x, 1] die Höhe hx (a) an der Stelle x eines
Brettes der Länge 1, das bei a auf der x-Achse steht und an die y-Achse angelehnt
ist. Man bestimme das Maximum dieser Höhen bei festem x und variablem a.
Übung 5.5.26. Gegeben reelle Zahlen a, b ≥ 0 und p, q > 1 mit p1 + 1q = 1 zeige
man die Young’sche Ungleichung ab ≤ p−1 ap + q −1 bq . Hinweis: Man gehe von
der Konvexität der Exponentialfunktion aus.
Übung 5.5.27. Gegeben reelle Zahlen a, b ≥ 0 und p ≥ 1 zeige man die Un-
gleichung (a + b)p ≤ 2p−1 (ap + bp ). Hinweis: Man gehe von der Konvexität der
Funktion [0, ∞) → R, x 7→ xp aus.
Ergänzende Übung 5.5.28. Für P ⊂ N die Menge aller Primzahlen gilt
X1
=∞
p∈P
p

In der Tat folgt aus ∞


P
k=1 1/k = ∞ und der Eindeutigkeit der Primfaktorzerle-
gung und der Entwicklung (1 − 1/p)−1 = (1 + p−1 + p−2 . . .) in eine geome-
trische Reihe, daß die Menge der partiellen Produkte des unendlichen Produkts
−1
Q
p∈P (1 − 1/p) nicht beschränkt sein kann. Nun wende man den Logarithmus
an und schätze ab.

5.6 Regeln von de l’Hospital


Satz 5.6.1 (Regeln von de l’Hospital). Seien I ⊂ R ein mehrpunktiges reelles
Intervall und p ein Häufungspunkt zu I in R̄. Seien f, g : I → R differenzierbare
Funktionen derart, daß gilt

lim f (x) = lim g(x) = 0 oder lim |g(x)| = ∞.


x→p x→p x→p

Haben g und g 0 keine Nullstelle auf I\p und existiert der Grenzwert des Quotien-
ten der Ableitungen limx→p (f 0 (x)/g 0 (x)) in R̄, so existiert auch der Grenzwert des

175
Illustration zu Übung 5.5.25.

176
Quotienten der Funktionen limx→p (f (x)/g(x)) in R̄ und diese beiden Grenzwerte
stimmen überein, in Formeln
   0 
f (x) f (x)
lim = lim
x→p g(x) x→p g 0 (x)

Beweis. Wir beginnen den Beweis mit folgendem


Lemma 5.6.2 (Verallgemeinerter Mittelwertsatz). Seien a < b in R̄ gegeben
und seien f, g stetige reellwertige Funktionen auf dem kompakten Intervall [a, b],
die differenzierbar sind auf dem offenen Intervall (a, b). So gibt es ξ ∈ (a, b) mit

f 0 (ξ)(g(a) − g(b)) = g 0 (ξ)(f (a) − f (b))

Vorschau 5.6.3. Um dieses Lemma anschaulich zu verstehen, mag man den Weg
γ : [a, b] → R2 betrachten, der durch γ(t) = (f (t), g(t)) gegeben wird. Es sagt
dann, daß der Vektor γ(a) − γ(b) und der Geschwindigkeitsvektor γ 0 (t) nicht für
alle t ∈ (a, b) voneinander linear unabhängig sein können. Das ist eh klar, wenn
γ(a) − γ(b) Null ist oder γ 0 (t) irgendwo den Wert Null annimmt, und scheint mir
andernfalls zumindest anschaulich offensichtlich.
5.6.4. Verschwindet g 0 nirgends auf (a, b), so gilt g(a) 6= g(b) nach dem Satz von
Rolle 5.5.6 und wir können unsere Gleichung schreiben in der Form
f (a) − f (b) f 0 (ξ)
= 0
g(a) − g(b) g (ξ)
Ist g(x) = x, so erhalten wir unseren Mittelwertsatz 5.5.7 als Spezialfall. Der
verallgemeinerte Mittelwertsatz wird in dieser Vorlesung ebenso wie die Regeln
von de l’Hospital bei der Diskussion von Restgliedern in der Taylorentwicklung
noch eine Rolle spielen.
Beweis. Man wende den Satz von Rolle 5.5.6 an auf die Funktion
 
F (x) := f (x) g(a)) − g(b) − g(x) f (a) − f (b)

Jetzt zeigen wir die Regeln von de l’Hospital. Wir dürfen ohne Beschränkung der
Allgemeinheit p 6∈ I annehmen, indem wir sonst I an der Stelle p in zwei Teile
zerschneiden und den rechtsseitigen und linksseitigen Grenzwert bei p getrennt
betrachten. Für jede Umgebung W des Grenzwerts

q := lim f 0 (x)/g 0 (x)


x→p

finden wir per definitionem eine Intervallumgebung V von p mit der Eigenschaft
ξ ∈ I ∩ V ⇒ f 0 (ξ)/g 0 (ξ) ∈ W . Für beliebige a, b ∈ I ∩ V mit a 6= b gilt weiter

177
Veranschaulichung der Regel von de l’Hospital 5.6.1 im Fall p ∈ R unter der
Annahme, daß beide Funktionen bei p nach Null streben. Es scheint mir
anschaulich klar, daß der Grenzwert des Quotienten sich nicht ändert, wenn wir
beide Funktionen durch ihre beste lineare Approximation bei p ersetzen, und das
ist auch genau die anschauliche Bedeutung der Regel von de l’Hospital.

178
g(a) 6= g(b), da nach Annahme die Ableitung von g keine Nullstelle auf I\p hat.
Aus dem verallgemeinerten Mittelwertsatz 5.6.2 folgt dann
f (a) − f (b)
∈W für alle a, b ∈ I ∩ V mit a 6= b.
g(a) − g(b)
Von nun an müssen wir die beiden Fälle im Satz getrennt weiterbehandeln. Als
erstes behandeln wir den Fall limx→p f (x) = limx→p g(x) = 0. Ist W ein kom-
paktes Intervall, so folgt f (a)/g(a) ∈ W sofort, indem wir a festhalten, b ge-
gen p streben lassen und uns an die Erhaltung von schwachen Ungleichungen im
Grenzwert 3.5.37 erinnern. Die Behauptung im ersten Fall folgt dann, da für je-
den Punkt q ∈ R̄ jede Umgebung von q eine kompakte Intervallumgebung von q
umfaßt. Jetzt behandeln wir noch den Fall limx→p |g(x)| = ∞. Dafür schreiben
wir unseren Quotienten um zu
f (a) − f (b) f (b)/g(b) − f (a)/g(b)
=
g(a) − g(b) 1 − g(a)/g(b)
und folgern unmittelbar
f (b) 
∈ 1 − g(a)/g(b) W + f (a)/g(b) für alle a, b ∈ I ∩ V mit a 6= b.
g(b)
Ist nun a ∈ I ∩ V fest gewählt, so finden wir für jedes ε ∈ (0, 1) eine Umgebung
Uε von p derart, daß gilt b ∈ Uε ∩ I ⇒ |f (a)/g(b)| < ε, |g(a)/g(b)| < ε und
insbesondere a 6= b. Damit sehen wir, daß wir für jede Umgebung W von q und
jedes ε ∈ (0, 1) eine Umgebung Uε von p finden können mit
f (b)
b ∈ Uε ∩ I ⇒ ∈ (1 − ε, 1 + ε)W + (−ε, ε)
g(b)
Die Behauptung folgt im zweiten Fall, da es für jede Umgebung W 0 von q eine
Umgebung W von q und ε ∈ (0, 1) gibt mit (1 − ε, 1 + ε)W + (−ε, ε) ⊂ W 0 .
Beispiel 5.6.5. Für λ > 0 gilt

limx→∞ (log x)/xλ = limx→∞ (1/x)/λxλ−1


= limx→∞ 1/λxλ
= 0

5.7 Zusammenhang zwischen Integral und Ableitung


Satz 5.7.1 (Hauptsatz der Differential- und Integralrechnung). Gegeben eine
stetige Funktion f : R ⊃ I → R auf einem mehrpunktigen reellen Intervall I und

179
ein Punkt a ∈ I ist die Funktion
F : I → RRx
x 7→ a f (t) dt

die einzige differenzierbare Funktion F : I → R mit F 0 = f und F (a) = 0.

R x Im Fall x < aRist


5.7.2.
a
dies Integral unter Verwendung unserer Konvention 5.2.10
als a f (t) dt = − x f (t) dt zu interpretieren.
Beweis. Für p ∈ I rechnen wir
x
F (x) − F (p)
Z
1
lim = lim f (t) dt
x→p x−p x→p x−p p

Da f stetig ist, finden wir für jedes ε > 0 ein δ > 0 derart, daß aus |t − p| ≤ δ
folgt f (p) − ε ≤ f (t) ≤ f (p) + ε. Aus 0 < x − p ≤ δ folgen also durch Bilden
des Integrals und Teilen durch (x − p) die Ungleichungen
Z x
1
f (p) − ε ≤ f (t) dt ≤ f (p) + ε
x−p p

und aus −δ ≤ x − p < 0 folgen mit zweimaligem Umdrehen der Ungleichungen


beim Integrieren und beim Teilen durch (x − p) dieselben Ungleichungen. Damit
zeigt das ε-δ-Kriterium für Grenzwerte 3.5.12, daß der Ausdruck in der Mitte
für x → p gegen f (p) konvergiert. Es folgt F 0 (p) = f (p) für alle p ∈ I. Ist
G : I → R auch differenzierbar mit G0 = f , so verschwindet die Ableitung
der Differenz G − F . Nach 5.5.8 ist diese Differenz also konstant. Haben wir
zusätzlich G(a) = 0, so ist sie konstant Null und wir folgern F = G.

Korollar 5.7.3 (Integrieren mit Stammfunktionen). Seien I ⊂ R ein mehr-


punktiges Intervall und f : I → R eine stetige Funktion. Ist G : I → R eine
Stammfunktion von f , als da heißt eine differenzierbare Funktion mit Ableitung
G0 = f , so gilt für alle a, b ∈ I die Formel
Z b
f (t) dt = G(b) − G(a)
a

Beweis. Wir betrachten F : I → R wie im Hauptsatz 5.7.1 und folgern aus der
Eindeutigkeitsaussage von dort F (x) = G(x) − G(a) für alle x ∈ [a, b].
5.7.4. Ist G ein komplizierterer Ausdruck, so ist es bequem und üblich, die Dif-
ferenz G(b) − G(a) mit G(x)|ba abzukürzen. Man spricht einen solchen Ausdruck

180
Veranschaulichung des Hauptsatzes der Differential- und Integralrechnung 5.7.1.
Die kreuzweise schraffierte Fläche stellt F (p) dar, die irgendwie schraffierte
F (x), die einfach schraffierte F (x) − F (p). Ich hoffe, man sieht, daß die Fläche
unter der Kurve beim Verschieben der oberen Grenze um so stärker wächst, je
größer dort der Wert unserer Funktion ist. Das ist qualitativ ausgedrückt die
anschauliche Bedeutung des Hauptsatzes.

181
„G, ausgewertet zwischen den Grenzen a und b“. Für a, b positiv ergibt sich zum
Beispiel Z b
1
dx = log x|ba = log b − log a
a x
Die Ableitung von R× → R, x 7→ log |x| ist im übrigen x 7→ 1/x, als da heißt,
für a, b negativ würden wir log |b| − log |a| erhalten. Über den Nullpunkt hinweg
dürfen wir die Funktion 1/x aber trotzdem nicht in dieser Weise integrieren. Unser
Korollar erlaubt das auch nicht, es trifft vielmehr nur Aussagen über die Integra-
tion von auf einem mehrpunktigen Intervall definierten stetigen Funktionen.

Übungen
Rt
Übung 5.7.5. Gegeben α ∈ R zeige man, daß limt→∞ 1 xα dx existiert in R̄ und
daß dieser Grenzwert endlich
R1 ist genau dann, wenn gilt α < −1. Des weiteren
zeige man, daß limε→0 ε xα dx existiert in R̄ und daß dieser Grenzwert endlich
ist genau dann, wenn gilt α > −1. Anschaulich gesprochen ist also die Hyperbel
x 7→ (1/x) gerade der Grenzfall, in dem sowohl die Fläche zwischen Kurve und
x-Achse ab jedem x-Wert als auch symmetrisch die Fläche zwischen Kurve und
y-Achse ab jedem y-Wert unendlich groß sind.
Ergänzende Übung 5.7.6. Der Integral-Logarithmus Li : (1, ∞) → R wird
erklärt durch die Vorschrift
Z x
dt
Li(x) :=
2 log t

Man zeige limx→∞ (log(x) Li(x)/x) = 1.


Übung 5.7.7. Eine zweimal differenzierbare Funktion f : R → R erfülle √ die
Eigenschaften |f (x)| ≤ 1 und |f 00 (x)| ≤ 1 für alle x. Man zeige |f 0 (x)| ≤ 2 für
alle x.

5.8 Integrationsregeln
Satz 5.8.1 (Integration durch Substitution). Gegeben reelle Zahlen a < b und
g : [a, b] → R stetig differenzierbar und f : g([a, b]) → R stetig gilt
Z b Z g(b)
0
f (g(x))g (x) dx = f (y) dy
a g(a)

Im Fall g(b) < g(a) ist das Integral rechts dabei der Konvention 5.2.10 gemäß als
das Negative des Integrals über das Intervall [g(b), g(a)] zu verstehen.

182
Illustration zu Übung 5.7.5.

183
5.8.2. Es gibt durchaus differenzierbare Abbildungen, deren Ableitung nicht stetig
ist, vergleiche 5.4.16. Das Wort „Substitution“ bedeutet ebenso wie „Prostitution“
auf lateinisch „Ersetzen“.
Beweis. Ist g konstant, so verschwinden beide Seiten und die Formel gilt. Ist sonst
F eine Stammfunktion von f , in Formeln F 0 = f , so ist F ◦ g nach der Ketten-
regel 5.4.6 eine Stammfunktion von t 7→ f (g(t))g 0 (t). Berechnen wir beide Inte-
grale mithilfe dieser Stammfunktionen, so ergibt sich auf beiden Seiten der Wert
F (g(b)) − F (g(a)).
5.8.3 (Anschauung für die Substitutionsregel). Wächst g streng monoton, so
kann man einen anschaulicheren Beweis geben, indem man a = a0 < a1 <
. . . < ar = b äquidistant unterteilt und nach dem Mittelwertsatz ξi ∈ (ai−1 , ai )
findet mit g(ai ) − g(ai−1 ) = g 0 (ξi )(ai − ai−1 ). Damit gilt ja die Gleichheit von
Riemannsummen
r
X r
X
0
f (g(ξi ))g (ξi )(ai − ai−1 ) = f (g(ξi ))(g(ai ) − g(ai−1 ))
i=1 i=1

Mithilfe der Beschreibung 5.2.11 des Integrals durch Riemann-Summen zeigt


man dann, daß diese Gleichheit im Grenzübergang r → ∞ gerade die Substi-
tutionsregel liefert.
5.8.4. Als Gedächtnisstütze, die in [AN2] 8.4 auch echte Bedeutung erhält, kann
man sich merken, daß beim Substituieren von y durch g(x) nicht nur f (y) durch
f (g(x)) ersetzt werden muß, sondern auch dy durch g 0 (x) dx, wie es die Notation
dy
g 0 (x) = dx suggeriert.
Beispiel 5.8.5. Indem wir uns das Integral etwas zurechtlegen, erhalten wir durch
die Substitution g(x) = x2 = y, g 0 (x) = 2x dx = dy leicht
Z b Z b Z b2 √
x dx 1 2x dx 1 dy p 2
√ = √ = √ = 1 + y |ba2 = 1 + x2 |ba
a 1 + x2 2 a 1 + x2 2 a2 1+y
und als
√ eine Stammfunktion des ursprünglichen Integranden ergibt sich die Funk-
tion 1 + x2 .
5.8.6. Beim Anwenden der Substitutionsregel wird man oft mit einer umkehrba-
ren Abbildung g arbeiten und die Regel in der Form
Z β Z g−1 (β)
f (y) dy = f (g(x))g 0 (x) dx
α g −1 (α)

verwenden. Auch wenn g nicht umkehrbar ist, kann man in dieser Weise vorgehen
und statt g −1 (α) und g −1 (β) eben irgendwelche a, b wählen derart, daß g auf ganz

184
Anschauliche Bedeutung der Substitutionsregel nach 5.8.3 im Fall g(x) = x2 .
Die schraffierte Fläche stellt in diesem Spezialfall für r = 4 und das Intervall
[a, b] = [0, 4] die Summe
r−1
X r−1
X
f (g(ξi ))g 0 (ξi )(ai+1 − ai ) = f (g(ξi ))(g(ai+1 ) − g(ai ))
i=0 i=0

dar. Die ξi sind mit dem Mittelwertsatz gerade so gewählt, daß gilt
g(ai+1 ) − g(ai ) = g 0 (ξi )(ai+1 − ai ). Ich finde, man sieht sehr gut, daß diese
R g(b) R 16
Summen gegen g(a) f (y) dy = 0 f (y) dy konvergieren.

185
[a, b] stetig differenzierbar ist mit α = g(a) und β = g(b). Meist arbeiten wir
sogar ohne explizite Erwähnung der Grenzen: Suchen wir nur eine Stammfunk-
tion, so kommt es auf die untere Grenze eh nicht an und die obere Grenze wird
mitgedacht und nach gelungener Integration wieder „zurücksubstituiert“, wie es
unsere Formel fordert.

Beispiel 5.8.7. Wir√ bestimmen eine Stammfunktion von f (y) = y 1 − y durch
die Substitution 1 − y = x, y = 1 − x2 = g(x), dy = −2x dx zu
R √ R
y 1 − y dy = (1 − x2 )x(−2x) dx
R
= (2x4 − 2x2 ) dx
2 5
= 5
x − 32 x3
2
√ √
= 5
(1 − y)2 1 − y − 23 (1 − y) 1 − y
R1 √
Beispiel 5.8.8 (Fläche des Einheitskreises). Es gilt π/2 = −1 1 − t2 dt. In
der schmutzigen Anschauung ist also π die Fläche des Einheitskreises. Um das zu
prüfen, substituieren wir t = sin x, dt = cos x dx und erhalten
Z 1√ Z π/2
2
1 − t dt = cos2 x dx
−1 −π/2

Mithilfe der Formel cos2 x = 12 + 12 cos 2x, die ihrerseits aus den Additionsformel
folgt, ergibt sich unser Integral mühelos zu
π/2
1 1 π
x + sin 2x =
2 4 −π/2 2

Satz 5.8.9 (Partielle Integration). Gegeben reelle Zahlen a < b und zwei stetig
differenzierbare Funktionen f, g : [a, b] → R gilt
Z b Z b
0 b
f g = f g|a − f 0g
a a

Beweis. Nach der Produktregel gilt f g 0 = (f g)0 − f 0 g auf [a, b], folglich stimmen
auch die Integrale dieser Funktionen überein.
R 2 x R
Beispiele 5.8.10. x e dx = x2 ex − 2x ex dx
R
= x2 ex −2x ex + 2 ex dx
= (x2 − 2x + 2) ex

log x dx = x log x − x x1 dx
R R

= x log x − x

186
Eine anschauliche Begründung dafür, daß die Fläche einer Kreisscheibe das
Produkt aus Radius und halbem Umfang sein sollte. Der erste geschlängelte Pfeil
deutet dabei ein Zerschneiden und Neu-Zusammenfügen an, die anderen einen
Grenzübergang.

187
5.8.11 (Alternativer Zugang zur Exponentialfunktion). Ich erkläre nun noch
einen alternativen Zugang zur Exponentialfunktion, der unsere Definition über ei-
ne a priori unmotivierte Reihe vermeidet. Suchen wir eine stetig differenzierbare
Funktion g : R → R>0 mit g 0 = g und g(0) = 1, so haben wir nach der Substitu-
tionsregel
Z x Z x 0 Z g(x)
g (t) 1
x= dt = dt = du
0 0 g(t) 1 u
Man definiert also
R y notgedrungen eine Funktion log : R>0 → R durch die Vor-
1
schrift log(y) = 1 u du und die gesuchte Funktion g muß deren Umkehrfunktion
sein.
Satz* 5.8.12. Die Kreiszahl π ist nicht rational, in Formeln π 6∈ Q.
5.8.13. Das wurde bereits 1766 von Johann Heinrich Lambert gezeigt. Der Beweis
der Transzendenz von π ist schwieriger, mir gefällt die Darstellung in [Lor96]. Der
hier gegebene Beweis der Irrationalität wirkt auf mich wie Zauberei. Ich folge der
Darstellung von Stewart [Ste89].
Beweis. Man betrachte für reelles α 6= 0 und natürliches n ∈ N das Integral
Z 1
In = In (α) = (1 − x2 )n cos(αx) dx
−1

Partielles Integrieren liefert α2 In (α) = 2n(2n−1)In−1 −4n(n−1)In−2 für n ≥ 2.


Vollständige Induktion zeigt dann

α2n+1 In = n!(Pn (α) sin α + Qn (α) cos α)

für Pn , Qn ∈ Z[X] Polynome vom Grad ≤ 2n. Wäre nun π = a/b mit a, b ∈ Z
und setzen wir oben α = π ein, so ergäbe sich, daß
a2n+1
In (π)
n!
für alle n ∈ N eine von Null verschiedene ganze Zahl sein muß. Das steht im
Widerspruch dazu, daß dieser Ausdruck für n → ∞ gegen Null strebt. Dasselbe
Argument zeigt: Gegeben α ∈ Q× können nicht sin α und cos α beide rational
sein.

Übungen
Übung 5.8.14. Eine Funktion f : R → R heißt gerade, wenn gilt f (−x) = f (x)
für alle x, und ungerade, wenn gilt f (−x) = −f (x) für alleR r x. Man zeige für
jede ungerade stetige Funktion und alle reellen r die Formel −r f = 0.

188
Übung 5.8.15. Man finde Stammfunktionen zu den Kehrwerten quadratischer Po-
lynome, also zu Funktionen der Gestalt x 7→ (x2 + ax + b)−1 . Hinweis: Hat das
fragliche quadratische Polynom zwei verschiedene reelle Nullstellen λ 6= µ, so
kann man unsere Funktion in der Gestalt α/(x − λ) + β/(x − µ) schreiben. Sonst
bringe man sie in die Form ((x + a/2)2 + d)−1 mit d ≥ 0 und erinnere sich an
arctan0 (t) = 1/(1 + t2 ).

Übung 5.8.16. Man finde eine Stammfunktion von 1 − t2 . Hinweis: Bei der
Berechnung 5.8.8 der Fläche des Einheitskreises haben wir das schon fast erreicht.
Übung 5.8.17. Man finde eine Stammfunktion für den Arcustangens. Hinweis:
Man wende auf das Produkt 1 · arctan partielle Integration an.
Ergänzende Übung 5.8.18. Man führe die partiellen Integrationen des Beweises
von 5.8.12 aus und prüfe die Induktionsbasis, als da heißt die Fälle n = 0, 1.
Rx 1
Übung 5.8.19. Man zeige limx→∞ −x 1+t 2 dt = π.

Übung 5.8.20. Sei S 1 = {(x, y) ∈ R2 | x2 + y 2 = 1} der Einheitskreis. Wir



konstruieren eine Bijektion γ : R → S 1 \ (−1, 0), indem wir jedem Punkt t ∈ R
den Schnittpunkt der Gerade durch (−1, 0) und (0, t) mit S 1 \ (−1, 0) zuordnen.
Man prüfe, daß diese Abbildung gegeben wird durch
1 − t2 2t
 
γ(t) = ,
1 + t2 1 + t2

Man prüfe kγ 0 (t)k = 2/(1 + t2 ) und interpretiere die vorstehende bemerkens-


werte Formel aus 5.8.19. Der Punkt (cos τ, sin τ ) für τ ∈ (−π, π) wird hierbei
übrigends parametrisiert durch t = tan(τ /2), wie man durch Rechnung oder ele-
mentargeometrische Überlegungen prüft. Man beachte auch die Ähnlichkeit zur
Parametrisierung der Hyperbel 5.9.6.
Ergänzung 5.8.21. Die Abbildung γ aus der vorstehenden Übung liefert im Übri-
gen auch eine Bijektion von Q auf die Punkte von S 1 \(−1, 0) mit rationalen Ko-
ordinaten. Diese Bijektion ist äußerst hilfreich bei der Bestimmung aller pythago-
reischen Zahlentripel, als da heißt, aller Tripel a, b, c von natürlichen Zahlen mit
a2 + b2 = c2 . Die Abbildung γ aus der vorstehenden Übung liefert allgemeiner
sogar für jeden Körper k einer von Zwei verschiedenen Charakteristik eine Bi-
jektion von k auf das Komplement des Punktes (−1, 0) in der Lösungsmenge der
Gleichung x2 + y 2 = 1 in der Ebene k 2 = k × k. In der algebraischen Geometrie
können Sie dann lernen, wie man das zu einer Bijektion von P1 k mit der Quadrik
Q ⊂ P2 k erweitert, die durch die homogenisierte Gleichung x2 +y 2 = z 2 definiert
wird.
Ergänzende Übung 5.8.22. Wie könnte ein Autor, der den Zugang 5.8.11 zur Ex-
ponentialfunktion gewählt hat, die Funktionalgleichung 4.2.10 beweisen?

189
Die Abbildung γ aus 5.8.20

190
Ergänzende Übung 5.8.23. Man zeige durchP Vergleich mit dem Integral der Funk-
tion x−α , daß für jedes α > 1 die Reihe ∞
k=1 k −α
konvergiert.

5.9 Hyperbolische trigonometrische Funktionen


Definition 5.9.1. Der Sinus hyperbolicus und Cosinus hyperbolicus sind die
Abbildungen sinh, cosh : R → R, die gegeben werden durch die Formeln
ex − e−x ex + e−x
sinh x = und cosh x =
2 2
5.9.2. Den Graphen des Cosinus hyperbolicus nennt man auch die Kettenlinie,
weil er dieselbe Gestalt hat wie eine hängende Kette. Wir zeigen das in 7.1.16 im
Anschluß an die Diskussion der Bogenlänge.
5.9.3. Offensichtlich gilt sinh(0) = 0, cosh(0) = 1, sinh(−x) = − sinh(x), und
cosh(−x) = cosh(x), die Ableitungen unserer Funktionen sind

sinh0 = cosh, cosh0 = sinh

es gelten cosh2 − sinh2 = 1 und die Additionstheoreme

sinh(a + b) = sinh(a) cosh(b) + cosh(a) sinh(b)


cosh(a + b) = cosh(a) cosh(b) + sinh(a) sinh(b)

Die Funktion cosh nimmt bei x = 0 ihr Minimum an und sinh ist eine Bijektion
sinh : R → R. Die inverse Abbildung nennt man Area Sinus hyperbolicus und
√ : R → R. Sie läßt sich auch elementar ausdrücken als
bezeichnet sie mit arsinh
arsinh(x) = log(x + x2 + 1) und für die Ableitung von arsinh erhalten wir
1
arsinh0 (y) = p
1 + y2
q
In der Tat gilt sinh0 (x) = cosh(x) = 1 − sinh2 (x), sinh0 (arsinh y) = 1 + y 2 .
p

Ähnlich liefert cosh eine Bijektion cosh : [0, ∞) → [1, ∞), die inverse Abbildung
Area Cosinus hyperbolicus √arcosh : [1, ∞) → [0, ∞) kann geschrieben werden
als arcosh(x) = log(x + x2 − 1) und ist differenzierbar auf (1, ∞) mit der
Ableitung
1
arcosh0 (y) = p
2
y −1
Sehr viel seltener benutzt man den Secans hyperbolicus x 7→ 1/ cosh(x), den
Cosecans hyperbolicus x 7→ 1/ sinh(x) und den Tangens hyperbolicus tanh :

x 7→ sinh(x)/ cosh(x) sowie seine Umkehrung artanh : (−1, 1) → R.

191
Die Graphen von Sinus und Cosinus hyperbolicus

192
Die geometrische Bedeutung von Sinus und Cosinus hyperbolicus

193
5.9.4 (Diskussion der Terminologie). Die Namen unserer Funktionen haben den
folgenden geometrischen Hintergrund: Für t ∈ R durchläuft der Punkt mit Koor-
dinaten (cosh t, sinh t) den Hyperbelast
{(x, y) ∈ R2 | (x + y)(x − y) = 1, x > 0}
Hierbei ist |t/2| gerade die Fläche oder lateinisch „area“, die von x-Achse, Hy-
perbel und dem Geradensegment von (0, 0) nach (cosh t, sinh t) eingeschlossen
wird. Es ist eine ausgezeichnete Übung, diese Behauptung nachzurechnen. Man
sieht so die Verwandschaft zu den üblichen trigonometrischen Funktionen, bei de-
nen man nur die Hyperbel x2 − y 2 = 1 zu ersetzen hat durch den Einheitskreis
x2 + y 2 = 1. Dehnen wir die hyperbolischen trigonometrischen Funktionen in
der offensichtlichen Weise zu Funktionen C → C aus, so können wir die formale
Analogie mit den gewöhnlichen trigonometrischen Funktionen präzisieren zu den
Formeln cos z = cosh(iz) und sin z = −i sinh(iz) für alle z ∈ C.
5.9.5. Die Lösungsmengen in der Ebene R2 von Gleichungen der Gestalt ax2 +
bxy + cy 2 = d mit (a, b, c) 6= (0, 0, 0) heißen ebene Quadriken oder auch Ke-
gelschnitte, da man sie erhalten kann als Schnitte räumlicher Ebenen mit dem
Kegel {(x, y, z) ∈ R3 | x2 + y 2 = z 2 } bei geeigneter orthonormaler Identifikation
unserer räumlichen Ebenen mit dem R2 . Jeder Kegelschnitt ist bis auf Drehung
und Verschiebung eine Ellipse αx2 + βy 2 = 1 mit α, β > 0, eine Hyperbel
xy = γ mit γ > 0, eine Parabel x2 = δy mit δ > 0, ein Geradenkreuz, eine
Gerade, ein Punkt oder die leere Menge. Die Bezeichnung „Parabel“ kommt hier
vom griechischen Wort für „Werfen“. In der Tat beschreibt ein Wurfgeschoss unter
Vernachlässigung des Luftwiderstands stets eine „parabolische“ Bahn, vergleiche
[AN2] 10.1.10.

Übungen
Ergänzende Übung 5.9.6. Sei H := {(x, y) ∈ R2 | x2 − y 2 = 1} die Hyperbel.

Wir konstruieren eine Bijektion ϕ : R\{±1} → H\(1, 0), indem wir jedem Punkt
t ∈ R\{±1} den Schnittpunkt der Geraden durch (0, t) und (1, 0) mit H\(1, 0)
zuordnen. Man prüfe, daß diese Abbildung gegeben wird durch
 2 
t + 1 2t
ϕ(t) = 2 ,
t − 1 t2 − 1
Eine eng verwandte Parametrisierung des Einheitskreises wurde in 5.8.20 bespro-
chen.

Übung 5.9.7. Man finde eine Stammfunktion von 1 + t2 . Hinweis: Bei der Be-
rechnung
√ 5.8.8 der Fläche des Einheitskreises haben wir fast eine Stammfunktion
von 1 − t2 bestimmt. Man gehe ähnlich vor mit der Substitution t = sinh x.

194
Die geometrische Bedeutung der Abbildung ϕ aus 5.9.6

195
5.10 Integration rationaler Funktionen
5.10.1 (Das Prinzip der Integration durch Partialbruchzerlegung). Zur Inte-
gration rationaler Funktionen erinnern wir zunächst die Partialbruchzerlegung aus
[LA1] 5.5.12. Danach bilden die Potenzen (X n )n≥0 mitsamt den Potenzen der
Inversen der Linearfaktoren ((X − µ)−n )n≥1, µ∈C eine C-Basis des Körpers der
komplexen rationalen Funktionen C(X). Wenn wir vergessen, daß wir uns dabei
in die komplexe Zahlenebene vorgewagt haben, so wird das Integrieren rationaler
Funktionen sehr einfach. Es reicht damit nämlich, Stammfunktionen für die Funk-
tionen x 7→ (x − µ)m mit m ∈ Z anzugeben, und derartige Stammfunktionen sind
1
für µ ∈ R bekanntlich m+1 (x − µ)m+1 im Fall m 6= −1 sowie log |x − µ| im
Fall m = −1. Im folgenden soll ausgeführt werden, inwiefern diese Formeln für
µ ∈ C im wesentlichen genauso gelten, wenn wir sie nur richtig interpretieren.
5.10.2. Es gibt auch eine Partialbruchzerlegung für reelle rationale Funktionen
und man kann auch mit ihrer Hilfe reelle rationale Funktionen integrieren. So
kann man die komplexen Zahlen weitgehend vermeiden, erhält aber komplizier-
tere Formeln gewinnt weniger konzeptuelle Klarheit.
Beispiel 5.10.3. Wir bestimmen eine Stammfunktion zu 1/(x2 − 1). Die Nullstel-
len des Nenners sind ±1 und der Grad des Zählers ist echt kleiner als der Grad
des Nenners. Wir dürfen den Ansatz
1 a b
= +
x2 −1 x+1 x−1
machen und finden sofort (a + b)x − a + b = 1, also a + b = 0 und b − a = 1 und
folglich a = −1/2 und b = 1/2. Eine Stammfunktion ist mithin
1 1
log |x − 1| − log |x + 1|
2 2
Man beachte, daß unsere Funktion zwei Definitionslücken hat und wir mit unse-
rer Stammfunktion nur die Integrale über Intervalle [a, b] bestimmen können, die
keine der beiden Definitionslücken enthalten.
Beispiel 5.10.4. Wir bestimmen zu (x4 + 2x2 )/(x2 + 2x + 1) eine Stammfunktion.
Die Partialbruchzerlegung haben wir bereits in [LA1] 5.5.17 durchgeführt und
erhielten
x4 + 2x2 8 3
2
= x2 − 2x + 5 − +
x + 2x + 1 x + 1 (x + 1)2
Als Stammfunktion finden wir damit sofort
x3 3
− x2 + 5x − 8 log |x + 1| −
3 (x + 1)

196
Beispiel 5.10.5. Wir bestimmen eine Stammfunktion zu 1/(x2 + 1). Wir wissen
zwar bereits aus 5.4.14, daß der Arcustangens arctan(x) so eine Stammfunktion
ist, aber diesmal geht es uns um das allgemeine Prinzip. Die Nullstellen des Nen-
ners sind ± i und der Grad des Zählers ist echt kleiner als der Grad des Nenners.
Wir dürfen deshalb den Ansatz
1 a b
2
= +
1+x x+i x−i
machen und finden sofort (a + b)x − i a + i b = 1, also a + b = 0 und a − b = i und
folglich a = i /2 und b = − i /2. Wir dürfen folglich die Hoffnung haben, daß
i i
log(x + i) − log(x − i)
2 2
eine Stammfunktion ist, wenn wir diesen Ausdruck richtig interpretieren. Dazu
lege ich eine Pause ein und diskutiere den komplexen Logarithmus.
5.10.6. Aus unseren Erkenntnissen 4.5.22 über die komplexe Exponentialfunktion
folgt, daß sie eine Bijektion
exp : R + (−π, π] i → C×

liefert. Die Umkehrfunktion


log : C× → R + (−π, π] i

wird auf der positiven reellen Achse gegeben durch unseren üblichen Logarithmus
u 7→ log u, auf der negativen reellen Achse durch u 7→ log(−u) + i π/2 und auf
der oberen beziehungsweise unteren komplexen Halbebene durch die Vorschrift
√ π u
log(u + i v) = log u2 + v 2 ± i − i arctan für ± v > 0
2 v
Diese Funktion log heißt der Hauptzweig des komplexen Logarithmus. Man
beachte, daß er nicht stetig ist längs der negativen reellen Achse, obwohl seine
Einschränkung auf die negative reelle Achse durchaus stetig ist: Wir haben für
u < 0 genauer
lim log(u + i v) = log(u) = lim log(u + i v) + 2π i
v&0 v%0

Beispiel 5.10.7. Wir arbeiten weiter an unserer Stammfunktion zu 1/(x2 + 1).


Interpretieren wir in unserer obigen Hoffnung log als den Hauptzweig des kom-
plexen Logarithmus, so können wir unsere Hoffnung 2i log(x + i) − 2i log(x − i)
auf eine Stammfunktion zu 1/(x2 + 1) umschreiben zu
i √ i √ π π 1 1
log x2 + 1 − log x2 + 1 − − + arctan(x) − arctan(−x)
2 2 4 4 2 2
197
und erhalten als Stammfunktion arctan(x)−π/2 in Übereinstimmung mit unserer
Berechnung der Ableitung des Arcustangens aus 5.4.14. Unsere Hoffnung war
also berechtigt.
5.10.8. Um zu erklären, warum dieses Verfahren auch im allgemeinen funktio-
niert, diskutiere ich im folgenden einige Grundlagen der komplexen Ableitung.
Definition 5.10.9. Eine Teilmenge U ⊂ C heißt offen, wenn sie für jeden ih-
rer Punkte eine Umgebung ist, wenn sie also anschaulich gesprochen mit jedem
Punkt ein ganzes Rechteck um diesen Punkt umfaßt. Wir schreiben U ⊂ ◦ C als
Abkürzung für die Aussage, daß U eine offene Teilmenge von C sein soll.
Definition 5.10.10. Eine komplexwertige Funktion f : C ⊃
◦ U → C auf einer
offenen Teilmenge der komplexen Zahlenebene heißt komplex differenzierbar
bei p ∈ U , wenn es b ∈ C gibt mit
f (z) − f (p)
lim =b
U 3z→p z−p
Wir kürzen diese Aussage auch in dieser Situation ab durch f 0 (p) = b. Unse-
re Funktion heißt komplex differenzierbar oder gleichbedeutend holomorph,
wenn sie bei jeder Stelle p ∈ U komplex differenzierbar ist.
5.10.11 (Regeln für die komplexe Ableitung). Genau wie für die reelle Diffe-
renzierbarkeit zeigt man auch für komplexe Differenzierbarkeit die Summenregel,
Produktregel und Kettenregel. Genau wie im Reellen zeigt man weiter, daß die
Ableitung jeder konstanten Funktion die Nullfunktion ist und daß die Ableitung
der Funktion f (z) = 1/z gegeben wird durch f 0 (z) = −1/z 2 . Genau wie im Re-
ellen folgt, daß (z − µ)n die Ableitung n(z − µ)n−1 hat für alle n ∈ Z. Genau wie
im Reellen zeigt man auch, daß die komplexe Exponentialfunktion ihre eigene
komplexe Ableitung ist, in Formeln exp0 = exp. Genau wie im Reellen zeigt man
schließlich, daß wenn f : C ⊃ ◦ U → C komplex differenzierbar und injektiv ist
mit offenem Bild V := f (U ) ⊂ ◦ C und nirgends verschwindender Ableitung und
wenn zusätzlich die Umkehrfunktion g = f −1 : V → U stetig ist, daß dann auch
die Umkehrfunktion g komplex differenzierbar ist mit der Ableitung
1
g 0 (z) =
f 0 (g(z))
Daraus folgt, daß unser geeignet eingeschränkter Hauptzweig des Logarithmus
log : C\R≤0 → C komplex differenzierbar ist mit der Ableitung
1
log0 (z) =
z
Nach der Kettenregel hat somit log(z − µ) auf C\(µ + R≤0 ) die komplexe Ablei-
tung (z − µ)−1 .

198
Vorschau 5.10.12. Die Theorie holomorpher Funktionen heißt die „Funktionen-
theorie“ und ist der Gegenstand einer eigenen Vorlesung. Man zeigt dort zum
Beispiel, daß jede injektive holomorphe Funktion bereits offenes Bild und eine
holomorphe Umkehrfunktion hat.
5.10.13. Eine komplexwertige Funktion f : R ⊃ D → C auf D ⊂ R halboffen
heißt differenzierbar oder genauer reell-komplex differenzierbar bei p ∈ D,
wenn es b ∈ C gibt mit
f (x) − f (p)
lim =b
x→p x−p
Wir kürzen diese Aussage auch in dieser Situation ab durch f 0 (p) = b. Nimmt
hier f nur reelle Werte an, ist das unsere ganz gewöhnliche Ableitung. Nach un-
seren Regeln für komponentenweise Grenzwerte 3.5.33 ist f in dieser Situation
allgemeiner genau dann reell-komplex differenzierbar, wenn Re f und Im f reell
differenzierbar sind, und dann gilt
f 0 (p) = (Re f )0 (p) + i(Im f )0 (p)
Schränken wir anderseits eine komplex differenzierbare Funktion h : C ⊃ ◦U →C
ein auf die reelle Achse zu h : R ⊃
◦ D → C mit D := R ∩ U , so gilt für alle p ∈ D
offensichtlich die Beziehung
h0 (p) = h0 (p)
zwischen der komplexen Ableitung und der reell-komplexen Ableitung der Ein-
schränkung auf die reelle Achse. Eine Funktion F : R ⊃ D → C mit F 0 = f
im Sinne der reell-komplexen Ableitung nennen wir wieder eine Stammfunktion
von f oder ausführlicher eine Stammfunktion im Sinne der reell-komplexen
Ableitung. Dann ist Re(F ) eine Stammfunkton von Re f im ursprünglichen Sin-
ne.
5.10.14 (Stammfunktion durch komplexe Partialbruchzerlegung). Wir erin-
nern, daß die Potenzen (X n )n≥0 mitsamt den Potenzen der Inversen der Linear-
faktoren ((X − µ)−n )n≥1, µ∈C eine C-Basis des Körpers der komplexen rationalen
Funktionen C(X) bilden. Um eine Stammfunktion im Sinne der reell-komplexen
Ableitung einer komplexen rationalen Funktion P (x)/Q(x) anzugeben, reicht es
aus, ihre Partialbruchzerlegung zu bestimmen und Stammfunktionen aller (xn )n≥0
und aller ((x − µ)−n )n≥1, µ∈C anzugeben. Nach unseren Vorüberlegungen sind
solche Stammfunktionen xn+1 /(n + 1) beziehungsweise (x − µ)−n+1 /(−n + 1)
falls n > 1 beziehungsweise log(x − µ) falls n = 1, jeweils mit log unserem
Hauptzweig des Logarithmus. Damit ist unsere Integrationsaufgabe zurückgeführt
auf die Bestimmung der Partialbruchzerlegung. Dieses Problem hinwiederum läßt
sich algorithmisch lösen, wenn man die Nullstellen des Nennerpolynoms kennt.
Für die Bestimmung dieser Nullstellen jedoch gibt es nur algebraische Verfahren,
wenn unser Polynom höchstens den Grad vier hat.

199
5.10.15 (Die Problematik komplexer Potenzen). Setzt man für a ∈ C× und
b ∈ C ähnlich wie im Reellen ab := exp(b log a) mit log dem eben definier-
ten Hauptzweig des komplexen Logarithmus, so ergibt sich ii = exp(−π/2).
Insbesondere ist in diesem Sinne also ii reell. Allerdings ist dann a 7→ ab für
b ∈ C\Z unstetig längs der negativen reellen Achse und wir haben im allgemei-
nen abc 6= (ab )c .

5.10.16 (Integrale rationaler Ausdrücke R(et ), R( n t)). Gegeben eine rationale
Funktion R = P/Q betrachten wir die Funktion D → R, t 7→ R(et ) mit dem De-
finitionsbereich D = {t ∈ R | Q(et ) 6= 0}. Das Integral eines solchen rationalen
Ausdrucks in et kann man auf das Integral einer rationalen Funktion zurückführen
durch die Substitution x = et , dx = et dt = x dt. Zum Beispiel berechnen wir
Z Z Z
dt 2 dt 2 dx
= 1 = = 2 arctan x = 2 arctan(et )
cosh t t
e + et x2 + 1

Das Integral eines rationalen Ausdrucks √in n t für eine natürliche Zahl n ≥ 1
kann man ähnlich durch die Substitution n t = x, dt = nxn−1 dx auf das Integral
einer rationalen Funktion in x zurückführen.
5.10.17 (Integrale rationaler Ausdrücke R(sin, cos)). Das Integral eines ratio-
nalen Ausdrucks im Funktionenpaar (sin, cos) wie zum Beispiel

sin3 (τ ) + cos(τ )
cos(τ ) + cos2 (τ )

kann man auffassen als Kurvenintegral im Sinne von 7.1.23 einer rationalen Funk-
tion in zwei Veränderlichen, in unserem Beispiel das Integral der Funktion

y3 + x
R(x, y) =
x + x2
über ein Stück des Einheitskreises. Mit der Umparametrisierung 5.8.20, also mit-
hilfe der Substitution t = tan(τ /2) und folglich sin(τ ) = 2t/(1 + t2 ), cos(τ ) =
(1 − t2 )/(1 + t2 ), dτ = (2/(1 + t2 )) dt läßt es sich dann umwandeln in ein Integral
einer rationalen Funktion einer Veränderlichen.

5.10.18 (Integrale rationaler Ausdrücke √ R( 1 − x2 , x)). Integrale über ratio-
2
nale Ausdrücke im Funktionenpaar ( 1 − x , x) kann man in ähnlicher Wei-
se√als Kurvenintegral auffassen und lösen, im Gegensatz zu eben hat nur x 7→
( 1 − x2 , x) nicht konstante √ absolute Geschwindigkeit 1, sondern vielmehr die
absolute Geschwindigkeit 1/ 1 − x2 . Formal mag man auch x = sin t, dx =
cos t dt substituieren und sich so auf den bereits behandelten Fall eines rationalen
Ausdrucks im Funktionenpaar (sin, cos) zurückziehen.

200

2
5.10.19 (Integrale rationaler Ausdrücke R( √ x ± 1, x)). Integrale
√ von ratio-
nalen Ausdrücken in den Funktionenpaaren ( x + 1, x) oder ( x2 − 1, x) kann
2

man auf die bereits in 5.10.16 behandelten Integrale rationaler Funktionen in et


zurückführen durch die Substitution x = sinh t, dx = cosh t dt beziehungsweise
x = cosh t, dx = sinh t dt.
Ergänzung 5.10.20. Ein geometrischer Zugang zu all diesen Integralen wird in
[AN2] 8.4.20 diskutiert.

Übungen
Übung 5.10.21. Man zeige für die reell-komplexe Ableitung differenzierbarer
komplexwertiger Funktionen f, g : R ⊃ D → C einer reellen Veränderlichen
auf einer halboffenen Teilmenge D ⊂ R die Summenregel (f + g)0 = f 0 + g 0 , die
Produktregel (f g)0 = f 0 g + f g 0 und die Regel für die Ableitung des Kehrwerts
(1/f )0 = −f 0 /f 2 .
Ergänzende Übung 5.10.22. Man finde eine Stammfunktion zu 1/(1 + x4 ).
Übung 5.10.23. Für alle λ ∈ C hat die Abbildung C → C, z 7→ eλz die komplexe
Ableitung z 7→ λ eλz .

201
6 Potenzreihen und höhere Ableitungen
6.1 Funktionenfolgen und Potenzreihen
P∞(aν )ν∈Nν eine Folge reeller Zahlen.P
Satz 6.1.1. Sei Konvergiert für eine reelle Zahl
z die Reihe ν=0 aν z , so konvergiert die Reihe ∞ ν
ν=0 aν x absolut für alle reel-
len Zahlen x mit |x| < |z| .
Vorschau 6.1.2. Dieser Satz gilt ganz genauso und mit demselben Beweis, wenn
wir darin überall „reell“ durch „komplex“ ersetzen. Wir konzentrieren uns hier
auf den Fall reeller Potenzreihen.
Beweis. Die Glieder einer konvergenten Reihe sind beschränkt, unter unseren An-
nahmen gibt es also eine endliche Schranke B mit |aν z ν | ≤ B für alle ν. Aus
|x| < |z| folgt mithilfe der Konvergenz der geometrischen Reihe 4.1.5 dann

X ∞
X ∞
X
ν
ν
|aν x | ≤ ν
|aν z | |x/z| ≤ B |x/z|ν < ∞
ν=0 ν=0 ν=0
P∞
6.1.3. Ein Ausdruck der Gestalt ν=0 aν xν heißt eine Potenzreihe. Eine Potenz-
reihe anzugeben bedeutet also nichts anderes, als die Folge (aν )ν∈N ihrerP
Koeffi-
zienten anzugeben. Der Konvergenzradius r ∈ [0, ∞] einer Potenzreihe aν xν
ist per definitionem das Supremum
r := sup{ |z| | aν z ν konvergiert}
P

Die Bezeichnung als „Radius“ kommt vom Kontext komplexer Potenzreihen her.
Potenzreihe mit Konvergenzradius r vermittels der Ab-
Nach 6.1.1 definiert jedeP
bildungsvorschrift x 7→ ∞ ν
ν=0 aν x eine reellwertige Funktion auf dem Intervall
(−r, r) sowie eine komplexwertige Funktion auf der Kreisscheibe |z| < r.
Satz 6.1.4 (Stetigkeit
P∞ und gliedweises Ableiten von Potenzreihen). Die durch
ν
eine Potenzreihe ν=0 aν x mit positivem Konvergenzradius r > 0 gegebene
Funktion s : (−r, r) → R ist stetig, ja sogar differenzierbar, und ihre Ableitung
wird an jeder Stelle x ∈ (−r, r) gegeben durch die Potenzreihe

X
s0 (x) = νaν xν−1
ν=1

Beispiel 6.1.5. Dieser Satz liefert einen zweiten Beweis für die bereits in 5.4.9
bewiesene Tatsache, daß die Exponentialfunktion ihre eigene Ableitung ist.
Vorschau 6.1.6. Obiger Satz gilt auch für komplexe Potenzreihen und die komple-
xe Ableitung. Er braucht dann aber einen anderen Beweis, den Sie in der Funk-
tionentheorie kennenlernen können.

202
6.1.7. Der Beweis dieses Satzes wird den größten Teil dieses Abschnitts einneh-
men. Wir zeigen in 6.1.13, daß jede durch eine Potenzreihe definierte Funktion
stetig ist, und zeigen die weitergehenden Aussagen in 6.1.16. Zunächst jedoch
müssen wir einige technische Hilfsmittel bereitstellen.
Definition 6.1.8. Seien D eine Menge, (fn )n∈N eine Folge von auf D definierten
Funktionen fn : D → R und f : D → R eine weitere Funktion.
1. Wir sagen, die Folge fn konvergiert punktweise gegen die Funktion f ,
wenn für alle x ∈ D gilt limn→∞ fn (x) = f (x);
2. Wir sagen, die Folge fn konvergiert gleichmäßig gegen die Funktion f und
schreiben limn→∞ fn = f , wenn es für beliebiges ε > 0 ein N = Nε ∈ N
gibt derart, daß für alle n ≥ N und alle x ∈ D gilt |fn (x) − f (x)| < ε.

6.1.9. Aus gleichmäßiger Konvergenz folgt sicher punktweise Konvergenz. Das


Umgekehrte gilt nicht: Die Funktionenfolge fn : [0, 1] → R, fn (x) = xn konver-
giert punktweise aber nicht gleichmäßig gegen die Grenzfunktion f : [0, 1] → R
mit f (x) = 0 für x 6= 1 und f (1) = 1.
Satz 6.1.10 (Stetigkeit bleibt erhalten unter gleichmäßiger Konvergenz). Kon-
vergiert eine Folge von stetigen reellwertigen Funktionen gleichmäßig gegen eine
Grenzfunktion, so ist auch diese Grenzfunktion stetig.
Beweis. Sei D ⊂ R der gemeinsame Definitionsbereich und seien fn : D → R
die Funktionen unserer gleichmäßig konvergenten Folge und f : D → R ihre
Grenzfunktion. Es gilt, die Stetigkeit von f in jedem Punkt p ∈ D zu zeigen. Sei
also ε > 0 vorgegeben. Sicher finden wir ein n derart, daß für alle x ∈ D gilt
ε
|fn (x) − f (x)| <
3
Da fn stetig ist in p, finden wir weiter δ > 0 derart, daß für alle x ∈ D mit
|x − p| < δ gilt
ε
|fn (x) − fn (p)| <
3
Es folgt für alle x ∈ D mit |x − p| < δ unmittelbar
|f (x) − f (p)| ≤ |f (x) − fn (x)|
+|fn (x) − fn (p)|
+|fn (p) − f (p)| < ε
aν x ν
P
Proposition 6.1.11 (Gleichmäßige Konvergenz bei Potenzreihen). Ist
eine Potenzreihe mit
PnKonvergenzradius r, so konvergiert die Folge ihrer Partial-
ν
summen sn (x) = ν=0 aν x für alle ρ ∈ [0, r) gleichmäßig auf dem Kompaktum
D = [−ρ, ρ].

203
Bei gleichmäßiger Konvergenz müssen für jedes ε > 0 fast alle fn auf dem
ganzen Definitionsbereich D im „ε-Schlauch um f “ bleiben.

Die punktweise aber nicht gleichmäßig konvergente Funktionenfolge der


Funktionen x 7→ xn aus 6.1.9

204
6.1.12. Eine Potenzreihe mit Konvergenzradius r konvergiert im allgemeinen kei-
neswegs gleichmäßig auf dem ganzen Intervall (−r, r). Ein Gegenbeispiel wäre
etwa die Exponentialfunktion, ein anderes die geometrische Reihe.
Beweis. Für alle x ∈ [−ρ, ρ] gilt |aν xν | ≤ |aν ρν | und folglich

X
|sn (x) − s(x)| ≤ |aν ρν |
ν=n+1
P∞
Da ν=0 |aν ρν | konvergiert, gibt es für jedes ε > 0 ein N ∈ N mit

X
|aν ρν | < ε
ν=N +1

Für n ≥ N und beliebiges x ∈ [−ρ, ρ] gilt dann |sn (x) − s(x)| < ε.

Korollar 6.1.13 (Stetigkeit von Potenzreihen). Die durch eine Potenzreihe mit
positivem Konvergenzradius r > 0 auf (−r, r) definierte Funktion ist stetig.

Beweis. Nach Proposition 6.1.11 und Satz 6.1.10 ist unsere Funktion für alle ρ ∈
[0, r) stetig auf [−ρ, ρ] als gleichmäßiger Grenzwert stetiger Funktionen. Da Ste-
tigkeit eine lokale Eigenschaft ist, muß sie damit stetig sein auf ganz (−r, r).

Satz 6.1.14 (Vertauschen von Integral und Grenzübergang). Ist eine Funktion
f : [a, b] → R gleichmäßiger Grenzwert einer Folge von stetigen Funktionen
fn : [a, b] → R, so gilt
Z b Z b
f = lim fn
a n→∞ a

Vorschau 6.1.15. Sehr viel stärkere Sätze in dieser Richtung werden wir im Rah-
men der Integrationstheorie von Lebesgue als Satz über monotone Konvergenz
[AN3] 1.5.12 und Satz über dominierte Konvergenz [AN3] 1.6.10 kennenlernen.
Beweis. Für alle ε > 0 gibt es N ∈ N derart, daß gilt |f (x) − fn (x)| < ε für alle
n ≥ N und alle x ∈ [a, b]. Es folgt
Z b Z b Z b Z b
f− fn = (f − fn ) ≤ |f − fn | ≤ (b − a)ε
a a a a

für alle n ≥ N .

205
Einige Glieder einer Funktionenfolge, die punktweise gegen die Nullfunktion
konvergiert, deren Integrale jedoch nicht gegen das Integral der Nullfunktion
konvergieren. Später mögen Sie lernen, daß unsere Funktionenfolge im Raum
der „verallgemeinerten Funktionen“ gegen die „Dirac’sche δ-Funktion bei Null“
konvergiert.

Einige Glieder einer Funktionenfolge vom Typ fn = n1 sin(nx), die gleichmäßig


gegen die Nullfunktion konvergiert, deren Ableitungen jedoch nicht gleichmäßig
gegen die Ableitung der Nullfunktion konvergieren.

206
Satz 6.1.16 (Integration und Ableiten von Potenzreihen). 1. P
Ist eine Funk-
tion f : (−r, r) → R gegeben durch die Potenzreihe f (x) = ∞ ν
ν=0 aν x , so
konvergiert auch die Potenzreihe

X
1
a xν+1
ν+1 ν
ν=0

auf (−r, r), und zwar gegen eine Stammfunktion von f ;


Ist eine Funktion g : (−r, r) → R gegeben durch die Potenzreihe g(x) =
2. P
∞ ν
ν=0 bν x , so ist g differenzierbar und die Potenzreihe

X
νbν xν−1
ν=1

konvergiert auf (−r, r) gegen die Ableitung g 0 unserer Funktion g.


Beweis.
Pn 1. Man wende den vorhergehenden Satz 6.1.14 auf die Folge fn (x) =
ν
ν=0 aν x der Partialsummen an.

2. Wir zeigen zunächst, daß die Potenzreihe ∞ ν−1


P
ν=1 νbν x auch auf (−r, r) kon-
vergiert.
P∞ Nach dem Quotientenkriterium 4.1.17 konvergiert schon mal die Reihe
ν−1
ν=1 νz für |z| < 1. Für |x| < r wählen wir nun ein ρ mit |x| < ρ < r und
dazu eine Schranke B mit |bν ρν−1 | ≤ B für alle ν. Dann können wir abschätzen
|νbν xν−1 | = νbν ρν−1 (x/ρ)ν−1 ≤ νBz ν−1
für z =P|x/ρ| < 1. Nach dem Majorantenkriterium 4.1.16 konvergiert also die
∞ ν−1
Reihe P ν=1 νbν x . Dann wissen wir
P aber nach Teil 1, daß für die Funktion
f (x) = ν=1 νbν xν−1 unser g(x) = ∞

b
ν=0 ν x ν
eine Stammfunktion ist.
Definition 6.1.17. Die n-te Ableitung einer Funktion f bezeichnen wir, falls sie
existiert, mit f (n) . Es ist also f (0) = f , f (1) = f 0 , f (2) = f 00 und allgemein
f (n+1) = (f (n) )0 .
6.1.18 (Koeffizienten konvergenter Potenzreihen und höhere Ableitungen).
Ist eine Funktion f : (−r, r)
P∞ → R gegeben durch die für x ∈ (−r, r) konver-
ν
gente Potenzreihe f (x) = ν=0 aν x , so folgt mit gliedweisem Ableiten nach
6.1.16 sofort
f (n) (0) = n! an
Wenn also in anderen Worten eine Funktion f in einer Umgebung des Nullpunkts
durch eine Potenzreihe dargestellt werden kann, so muß unsere Funktion dort be-
liebig oft differenzierbar sein und die fragliche Potenzreihe ist notwendig

X f (ν) (0)

ν=0
ν!

207
Diese Potenzreihe hinwiederum kann man ganz allgemein für jede in einer Umge-
bung des Nullpunkts beliebig oft differenzierbare Funktion betrachten. Sie heißt
dann die Taylorreihe besagter Funktion oder genauer ihre Taylorreihe am Null-
punkt, muß aber keineswegs positiven Konvergenzradius haben und muß, selbst
wenn sie positiven Konvergenzradius haben sollte, keineswegs gegen besagte Funk-
tion konvergieren. Zum Beispiel hat nach 5.4.15 die Funktion
 −1/x
e x > 0,
f (x) =
0 x ≤ 0;

im Nullpunkt die Ableitungen f (ν) (0) = 0 ∀ν ≥ 0, aber dennoch gilt f (x) > 0 für
x > 0. Inwiefern die Taylorreihe dennoch unsere Funktion recht gut approximiert,
diskutieren wir in 6.2.
Beispiel 6.1.19. Die Darstellung

x2 x3
log(1 + x) = x − + − ... ∀x ∈ (−1, 1)
2 3
ergibt sich, indem wir die geometrische Reihe (1 + x)−1 = 1 − x + x2 − x3 . . .
gliedweise integrieren.
Beispiel 6.1.20. Mit unserer Formel arctan0 (t) = 1/(1 + t2 ) für die Ableitung des
Arcustangens aus 5.4.14 erhalten wir durch gliedweises Integrieren der geometri-
schen Reihe 4.1.5 für den Arcustangens für |t| < 1 die Reihenentwicklung

t3 t5 t7
arctan(t) = t − + − ...
3 5 7
und mit dem Abel’schen Grenzwertsatz 6.4.2 ergibt sich
π 1 1 1
= 1 − + − ...
4 3 5 7
Es scheint, daß diese Formel bereits in dem 1530 erschienenen Analysis-Buch
„Ganita Yuktibhasa“ des Autors Jyesthadeva zu finden ist, eines Mathematikers
aus Kerala in Indien, und daß sie auf den indischen Mathematiker Madhava zu-
rückgeht.
2
Beispiel 6.1.21. Um die fünfte Ableitung bei x = 0 von (ex sinh x) bestimmen,
rechnen wir
2 x4 x6
ex = 1 + x2 + 2
+ 3!
+ ...
x3 x5
sinh x = x + 3!
+ 5!
+ ...
2
ex sinh x = x + x3 ( 3!1 + 1) + x5 1 1 1

5!
+ 3!
+ 2
+ ...

208
Hier haben wir einmal unsere Erkenntnisse über das Produkt absolut konvergenter
Reihen verwendet. Die gesuchte fünfte Ableitung bei x = 0 ergibt sich mit 6.1.18
zu  
1 1 1
5! + + = 1 + 20 + 60 = 81
5! 3! 2
Definition 6.1.22 (Verallgemeinerte Binomialkoeffizienten). Für α ∈ R und
k ∈ N setzen wir
   
α α(α − 1) . . . (α − k + 1) α
:= falls k ≥ 1 und := 1.
k k(k − 1) . . . 1 0

Proposition 6.1.23 (Binomische Reihe). Für |x| < 1 und α ∈ R gilt


∞  
α
X α k
(1 + x) = x
k=0
k

Vorschau 6.1.24. Die Proposition gilt mit demselben Beweis auch für x, α ∈ C,
vergleiche [FT1] 4.2.15. Aus unseren Überlegungen in 6.1.18 zu den Koeffizien-
ten konvergenter Potenzreihen folgt auch unmittelbar, daß die Koeffizienten einer
Potenzreihenentwicklung von (1 + x)α , wenn es sie denn gibt, notwendig die
verallgemeinerten Binomialkoeffizienten sein müssen. Daß es aber eine derartige
Entwicklung auch wirklich gibt, muß noch gezeigt werden. Also an die Arbeit!
Beweis. Für α ∈ Z≥−1 kennen wir diese Formel schon: Im Fall α ∈ N gilt
α

k
= 0 falls k > α und wir erhalten einen Spezialfall der binomischen For-
mel 1.6.13. Im Fall α = −1 gilt αk = (−1)k und wir erhalten die geometrische


Reihe 4.1.5 für −x. Unter der Annahme α 6∈ N sagt uns das Quotientenkriterium,
daß die Potenzreihe rechts für |x| < 1 konvergiert, sagen wir gegen die Funktion
f : (−1, 1) → R. Ich behaupte (1 + x)f 0 (x) = αf (x). Das prüft man durch
gliedweises Differenzieren der binomischen Reihe mithilfe der Beziehung
     
α−1 α−1 α
+ =
k k−1 k
Diese Beziehung kann durch eine kurze Rechnung gezeigt werden. Rechenfaule
können sie auch als eine Gleichheit von Polynomen in α verstehen, von der wir be-
reits wissen, daß sie nach Einsetzen von α ∈ N≥1 gilt, und die folglich als Gleich-
heit von Polynomen gelten muß, da ja Polynome nur endlich viele Nullstellen ha-
ben. Aus (1 + x)f 0 (x) = αf (x) und f (0) = 1 folgt aber schon f (x) = (1 + x)α ,
denn setzt man ϕ(x) = f (x)/(1 + x)α , so gilt ϕ(0) = 1 und

f 0 (x)(1 + x)α − α(1 + x)α−1 f (x)


ϕ0 (x) = =0
(1 + x)2α

209

Beispiel 6.1.25. Aus unserer Formel arcsin0 (x) = 1/ 1 − x2 nach 5.4.13 ergibt
sich die Reihenentwicklung
1 · x3 1 · 3 · x5
arcsin(x) = x + + + ... ∀x ∈ (−1, 1)
2·3 2·4·5
Rx
In der Tat gilt arcsin(x) = 0 (1 − t2 )−1/2 dt, und nach der binomischen Reihe
6.1.23 haben wir
∞  
2 −(1/2)
X −1/2 1 1·3 4
(1 − t ) = (−t2 )k = 1 + t2 + t + ...
k=0
k 2 2·4

Ähnlich ergibt sich die Entwicklung von arsinh(x) in eine Potenzreihe, indem wir
in der binomischen Reihe für (1 + y)−1/2 überall y durch x2 ersetzen und die so
entstehende Potenzreihe für (1 + x2 )−1/2 gliedweise integrieren.
6.1.26. Die Formel für die binomische Reihe kann umgeschrieben werden zur nun
für alle y ∈ (0, 2) gültigen Darstellung
∞  
α
X α
y = (y − 1)k
k=0
k

Gehört allgemeiner ein Punkt p zum Definitionsbereich einer Funktion f , so be-


zeichnen wir eine Darstellung von f der Gestalt

X ∞
X
f (p + h) = aν hν alias f (y) = aν (y − p)ν
ν=0 ν=0

als eine Entwicklung von f in eine Potenzreihe um den Punkt p. Mit denselben
Argumenten wie zuvor gilt dann aν = f (ν) (p)/ν!. Ist allgemeiner f beliebig oft
differenzierbar bei p, so erklären wir die Taylorreihe von f zum Entwicklungs-
punkt p als die Potenzreihe

X f (ν) (p) ν
h
ν=0
ν!
Auch wenn die Partialsummen dieser Reihe nicht gegen f (p + h) konvergieren
müssen, liefern sie doch die „bestmöglichen“ Approximationen von f (p + h)
durch Polynome in h von einem vorgegebenen maximalen Grad, wie wir im fol-
genden Abschnitt 6.2 ausführen werden.

Übungen
Übung 6.1.27. Ist (aν )ν∈N eine Folge von von Null verschiedenen reellen Zahlen
und existiert der Grenzwert limν→∞ |aP ν /aν+1 | in [0, ∞], so ist dieser Grenzwert
der Konvergenzradius der Potenzreihe ∞ ν
ν=0 aν x .

210
Ergänzende Übung 6.1.28. Eine Funktion, die für jeden Punkt ihres Definitions-
bereichs in einer Umgebung besagten Punktes durch eine Potenzreihe dargestellt
werden kann, heißt analytisch. Wir werden erst in [FT1] 4.2.8 im Rahmen der
Funktionentheorie zeigen, daß Potenzreihen analytische Funktionen liefern: Dort
geht es mit den Tricks der Funktionentheorie sehr elegant, wir könnten es aber et-
was weniger elegant auch hier schon zeigen. Man zeige: Stimmen zwei auf dem-
selbem reellen Intervall definierte analytische Funktionen auf der Umgebung eines
Punktes aus unserem Intervall überein, so sind sie gleich. Hinweis: Man betrach-
te das Supremum der Menge aller Punkte, an denen unsere beiden Funktionen
übereinstimmen.
Ergänzende Übung 6.1.29.
√ Wie lauten die ersten vier Koeffizienten der Potenz-
reihenentwicklung von 1 +√x ? Wie lauten die ersten vier Koeffizienten der Po-
tenzreihenentwicklung von 2 + x ? Gemeint ist jeweils die Entwicklung um
x = 0.
Ergänzende Übung 6.1.30. Wir würfeln mit einem Würfel eine unendlich lan-
ge Zahlenreihe. Anschaulich ist klar, daß der durchschnittliche Abstand zwischen
zwei aufeinanderfolgenden Einsen gerade Sechs sein muß. Betrachtet man nun die
Wahrscheinlichkeiten, daß die nächste Eins beim nächsten Wurf, beim übernächs-
ten Wurf etc. kommt, multipliziert sie jeweils mit Eins, Zwei etc. und summiert
diese Produkte auf, so sollte sich auch dieser dieser durchschnittliche Abstand
ergeben. Die Aufgabe ist nun, zu beweisen, daß die Reihe
∞  n−1
X 5 1
n
n=1
6 6

auch tatsächlich gegen 6 konvergiert.


Ergänzende Übung 6.1.31. Mithilfe der Relation tan(π/6) = 1/2 berechne man
π auf drei sichere Stellen hinter dem Komma. Es gibt im übrigen wesentlich effi-
zientere Verfahren zur Berechnung von π, vergleiche [Cou71].
Übung 6.1.32 (Vertauschen von Ableitung und Grenzübergang). Ist eine Funk-
tion f : [a, b] → R gleichmäßiger Grenzwert einer Folge stetig differenzierbarer
Funktionen fn : [a, b] → R und konvergieren deren Ableitungen fn0 : [a, b] → R
gleichmäßig gegen eine Funktion g, so ist f differenzierbar auf [a, b] mit Ablei-
tung f 0 = g. Hinweis: 6.1.14.

6.2 Taylorentwicklung
6.2.1. Um im folgenden auch den Fall n = 0 zulassen zu dürfen, vereinbaren wir,
daß „0-mal differenzierbar bei p“ zu verstehen sein soll als „stetig bei p“.

211
Satz 6.2.2 (Taylorentwicklung). Seien I ⊂ R ein mehrpunktiges Intervall und
f : I → R eine Funktion, deren (n − 1)-te Ableitung f (n−1) auf ganz I existiert
und deren n-te Ableitung f (n) (p) an einer Stelle p ∈ I existiert. So gilt:

1. Es gibt genau ein Polynom Q vom Grad ≤ n mit der Eigenschaft

f (x) = Q(x) + (x − p)n ε(x − p)

für eine Funktion ε mit limh→0 ε(h) = ε(0) = 0, die also in Worten stetig
ist bei Null mit Funktionswert Null;

2. Dieses Polynom ist das eindeutig bestimmte Polynom Q vom Grad ≤ n mit
Q(ν) (p) = f (ν) (p) für 0 ≤ ν ≤ n, dessen Funktionswert und Ableitungen
bei p also bis zur n-ten Ableitung einschließlich mit den entsprechenden
Ableitungen bei p unserer Funktion f übereinstimmen.

6.2.3. Wir nennen Q das Approximationspolynom bis zur Ordnung n an die


Funktion f bei der Stelle p.

1. Der Graph des Approximationspolynoms bis zur nullten Ordnung ist die
Parallele zur x-Achse durch (p, f (p));

2. Der Graph des Approximationspolynoms bis zur ersten Ordnung heißt die
Tangente an den Graphen von f im Punkt (p, f (p));

3. Der Graph des Approximationspolynoms bis zur zweiten Ordnung heißt die
Schmiegeparabel an den Graphen von f im Punkt (p, f (p)).

Beweis. Sicher gibt es genau ein Polynom Q, das die Bedingung aus Teil 2 erfüllt,
nämlich das Polynom

f (2) (p) f (n) (p)


Q(x) = f (p) + f 0 (p)(x − p) + (x − p)2 + . . . + (x − p)n
2! n!
Es besteht genau aus den ersten n + 1 Termen der Taylorreihe von f zum Ent-
wicklungspunkt p. Betrachten wir für dieses Polynom Q die Differenz r = f − Q,
so verschwinden der Funktionswert und die ersten n Ableitungen von r bei x = p
und wir erhalten durch wiederholte Anwendung der Regeln von de l’Hospital
5.6.1 und mit der Definition von r(n) (p) im letzten Schritt in der Tat

r(x) r(n−1) (x) r(n) (p)


lim = . . . = lim = =0
x→p (x − p)n x→p n! (x − p) n!

212
Eine unvollkommene Darstellung der Tangente y = x + 1 und Schmiegeparabel
y = x2 /2 + x + 1 an den Graph der Exponentialfunktion im Punkt (0, 1).

213
Damit bleibt nur noch zu zeigen, daß kein anderes Polynom Q̂ die Bedingung aus
Teil 1 erfüllen kann. In der Tat folgt aber für zwei Polynome vom Grad ≤ n aus

Q̂(x) − Q(x)
lim =0
x→p (x − p)n

nach Übung 3.5.53 bereits Q̂(x) = Q(x).


6.2.4. Wir können die Aussage des Satzes dahingehend umformulieren, daß für
jede auf einem mehrpunktigen Intervall I definierte (n − 1)-mal differenzierbare
Funktion f und jeden Punkt p ∈ I, an dem sie sogar n-mal differenzierbar ist, gilt

f (2) (p) 2 f (n) (p) n


f (p + h) = f (p) + f 0 (p)h + h + ... + h + hn ε(h)
2! n!
für eine Funktion ε mit limh→0 ε(h) = ε(0) = 0. Schärfere Abschätzungen für das
Restglied unter stärkeren Annahmen an die zu approximierende Funktion liefert
die gleich folgende Proposition.

Proposition 6.2.5 (Restglieddarstellungen zur Taylorentwicklung). Gegeben


I ⊂ R ein mehrpunktiges Intervall, f : I → R eine n-mal differenzierbare Funk-
tion und p ∈ I ein Punkt gilt:

Umformulierung der Taylorentwicklung: Ist f bei p sogar (n + 1)-mal diffe-


renzierbar, so gibt es eine Funktion ε mit limh→0 ε(h) = ε(0) = 0 und
n
f (ν) (p) f (n+1) (p)
X  
ν
f (x) = (x − p) + + ε(x − p) (x − p)n+1
ν=0
ν! (n + 1)!

Lagrange’sche Form des Restglieds: Ist f sogar (n+1)-mal differenzierbar auf


dem ganzen Intervall I, so gibt es für alle x ∈ I ein ξ zwischen p und x mit
n
X f (ν) (p) f (n+1) (ξ)
f (x) = (x − p)ν + (x − p)n+1
ν=0
ν! (n + 1)!

Das gilt zusätzlich für jeden reellen Punkt x im Abschluß von I, auf den die
Funktion f stetig fortgesetzt werden kann.

Integraldarstellung des Restglieds: Ist f (n+1) zusätzlich auch noch stetig auf
ganz I, so gilt für alle x ∈ I die Formel
n x
f (ν) (p)
Z
X
ν 1
f (x) = (x − p) + (x − t)n f (n+1) (t) dt
ν=0
ν! n! p

214
Beweis. Nur die zweite und dritte DarstellungP des Restglieds sind noch zu zei-
gen. Wir kürzen die Summe wie zuvor mit = Q(x) ab. Für den Rest r(x) =
f (x) − Q(x) verschwinden, wie wir bereits wissen, die ersten n Ableitungen bei
x = p, und unter unseren zusätzlichen Voraussetzungen ist r sogar (n + 1)-mal
differenzierbar auf ganz I mit r(n+1) = f (n+1) . Um daraus die beiden Darstellun-
gen des Restglieds zu erhalten, brauchen wir zwei Rechnungen.
2. Mit dem verallgemeinerten Mittelwertsatz 5.6.2 und der Erkenntnis, daß Nen-
ner und Zähler bei x = p verschwinden, erhalten wir unter der Annahme p 6= x
sofort
r(x) r0 (ξ1 ) r00 (ξ2 ) r(n+1) (ξ)
= = = ... =
(x − p)n+1 (n + 1)(ξ1 − p)n n(n + 1)(ξ2 − p)n−1 (n + 1)!
mit ξ1 , . . . , ξ im offenen Intervall zwischen p und x.
3. Durch wiederholtes partielles Integrieren erhalten wir
Rx Rx Rx
r(x) = p r0 (t) dt = p (x − t)r00 (t) dt = 12 p (x − t)2 r000 (t) dt
= . . .R
x
= n!1 p (x − t)n r(n+1) (t) dt

6.2.6. Diese Abschätzungen liefern umgekehrt auch alternative Beweise für den
Satz 6.2.2 über die Taylorentwicklung, aber eben nur unter stärkeren Vorausset-
zungen an die zu entwickelnde Funktion.

Übungen
Übung 6.2.7 (Hinreichende Kriterien für lokale Extrema). Seien I ⊂ R ein
mehrpunktiges Intervall und f : I → R eine n-mal differenzierbare Funktion
und sei p ∈ I gegeben mit f (1) (p) = . . . = f (n) (p) = 0. Sei weiter und f (n)
differenzierbar an der Stelle p. Man zeige: Ist n ungerade und f (n+1) (p) > 0
beziehungsweise f (n+1) (p) < 0, so hat f ein isoliertes lokales Minimum bezie-
hungsweise Maximum bei p. Ist I offen und n gerade und f (n+1) (p) 6= 0, so hat f
weder ein isoliertes lokales Minimum noch ein isoliertes lokales Maximum bei p.
Hinweis: Taylorentwicklung.
Übung 6.2.8. Gegeben eine differenzierbare Funktion f auf einem offenen reellen
Intervall I ⊂
◦ R, deren Ableitung bei p ∈ I differenzierbar ist, zeige man
f (p + h) + f (p − h) − 2f (p)
f 00 (p) = lim
h→0 h2

P 6.2.9 (Spezielles
Übung zu Potenzreihen mit nichtnegativen Koeffizienten).
Sei ∞ a
k=0 k x k
eine Potenzreihe mit nichtnegativen Koeffizienten ak ≥ 0 und

215
sei r ∈ R≥0 echt kleiner als ihr Konvergenzradius. Hat die Taylorreihe um den
Entwickungspunkt r der durch unsere ursprüngliche Reihe gegebenen Funktion f
den Konvergenzradius ρ, so hat unsere ursprüngliche Reihe mindestens den Kon-
+ ρ. Hinweis: Man drücke f (ν) (r) durch die ursprüngliche Reihe
vergenzradius r P
aus und folgere ak (r + ε)k < ∞ für 0 ≤ ε < ρ.

6.3 Rechnen mit Approximationen


Definition 6.3.1. Seien f, g : R ⊃ D → R Funktionen und p ∈ D ein Punkt und
n ∈ N eine natürliche Zahl. Wir sagen, f und g stimmen bei p überein bis zur
Ordnung n und schreiben

f ∼np g oder genauer f (x) ∼nx=p g(x)

wenn gilt f (p + h) = g(p + h) + hn ε(h) für eine Funktion ε, die stetig ist bei
Null mit Funktionswert ε(0) = 0 und die definiert ist auf der Menge aller h mit
p + h ∈ D.
6.3.2. Die Notation f ∼np g scheint mir bequem und suggestiv, sie ist aber nicht
üblich. Häufig nennt man eine Funktion, die bei x = 0 mit der Nullfunktion über-
einstimmt bis zur Ordnung n, auch ein kleines o von xn und bezeichnet so ei-
ne Funktion mit o(xn ). In dieser Notation würde man statt f ∼np g schreiben
f (x) = g(x) + o((x − p)n ).
6.3.3. Natürlich folgt aus f ∼np g und g ∼np h schon f ∼np h. Sind P und Q
Polynome vom Grad ≤ n und ist p ein Häufungspunkt von D, so folgt aus P ∼np
Q schon P = Q. Der Satz über die Taylorentwicklung 6.2.2 liefert uns für eine n-
mal stetig differenzierbare Funktion f auf einem mehrpunktigen Intervall D das
eindeutig bestimmte Polynom Q vom Grad ≤ n, das bei p mit f übereinstimmt bis
zur Ordnung n. Genauer besagt dieser Satz, daß dieses Polynom Q charakterisiert
werden kann durch die Bedingungen Q(ν) (p) = f (ν) (p) für 0 ≤ ν ≤ n.
Satz 6.3.4. 1. (Höhere Summen- und Produktregel). Seien f, g : D → R
zwei auf einer Teilmenge D ⊂ R definierte Funktionen. Sei p ∈ D ein
Punkt und seien P, Q Polynome mit f ∼np P und g ∼np Q. So folgt

f + g ∼np P + Q und f g ∼np P Q

2. (Höhere Kettenregel). Seien f : D → R und g : E → R auf Teilmengen


D, E ⊂ R definierte Funktionen mit f (D) ⊂ E. Sei p ∈ D ein Punkt und
seien P, Q Polynome mit f ∼np P und g ∼nf(p) Q. So folgt

g ◦ f ∼np Q ◦ P

216
6.3.5. Im Fall n = 0 spezialisiert dieser Satz zur Stetigkeit von Summen und
Produkten 3.2.34 sowie Verknüpfungen 3.2.30. Im Fall n = 1 spezialisiert er zur
Summenregel 5.4.1, Produktregel 5.4.1 und Kettenregel 5.4.6.
Vorschau 6.3.6. Alle Aussagen dieses Satzes werden sich als Konsequenzen des
Approximationssatzes in mehreren Veränderlichen [AN2] 3.3.6 erweisen.
Beweis. 1. Das bleibt dem Leser überlassen. Im Fall der Summe gilt das sogar
für beliebige Funktionen P und Q. Im Fall des Produkts reicht anstelle der Po-
lynomialität die schwächere Annahme, daß P und Q in einer Umgebung von p
beschränkt sind.
2. Wir zeigen zunächst g ◦f ∼np Q◦f und dann Q◦f ∼np Q◦P . Zum Beweis der
ersten Aussage schreiben wir g(y) = Q(y) + (y − f (p))n ε(y − f (p)) für ε stetig
bei Null mit Funktionswert Null. Durch Einsetzen von y = f (x) und Erweitern
des letzten Terms mit (x − p)n erhalten wir
 n 
n f (x) − f (p)
(g ◦ f )(x) = (Q ◦ f )(x) + (x − p) ε(f (x) − f (p))
x−p

für alle x 6= p. Im Fall n ≥ 1 stimmt f bei p bis mindestens zur Ordnung 1


überein mit dem Polynom P , folglich ist f differenzierbar bei p und der Ausdruck
in eckigen Klammern strebt für x → p gegen Null. Im Fall n = 0 stimmt f bei
p bis zur Ordnung 0 überein mit dem Polynom P , also ist f zumindest stetig in p
und der Ausdruck in eckigen Klammern strebt für x → p wieder gegen Null. Wir
müssen also nur noch für jedes Polynom Q zeigen

Q ◦ f ∼np Q ◦ P

Das hinwiederum folgt sofort aus Teil 1.


Beispiel 6.3.7. Beim konkreten Rechnen wird man sich nach Möglichkeit die
Funktionen so zurechtlegen, daß wir nur Approximationen an der Stelle Null zu
betrachten haben. Um etwa die sechste Ableitung bei x = 0 von 1/ cosh(x) zu be-
rechnen, schreiben wir das als g ◦ f mit f (x) = cosh(x) − 1 und g(y) = (1 + y)−1 ,
da dann gilt f (0) = 0. Nun erinnern wir uns an
x2 x4 x6
cosh(x) − 1 = 2
+ 4!
+ 6!
+ ...
(1 + y)−1 = 1 − y + y 2 − y 3 + y 4 − y 5 + y 6 . . .

wo wir Gleichheitszeichen und Pünktchen geschrieben haben statt ∼6 mit ent-


sprechenden Spezifikationen. Mit unserer „höheren Kettenregel“ 6.3.4 erhalten

217
wir wegen f (0) = 0 dann sofort
2 x4 x6
1/ cosh(x) = 1 − ( x2 + 4!
+ 6!
)
2 x4 x6 2
+( x2 + 4!
+ 6!
)
2 x4 x6 3
−( x2 + 4!
+ 6!
) + ...

Als Koeffizient von x6 ergibt sich


1 1 1 1 61
− + − = (−1 + 30 − 90) = −
6! 4! 8 6! 6!
Die fragliche sechste Ableitung bei x = 0 ist mithin −61. Eine andere Möglich-
keit wäre, das Approximationspolynom sechsten Grades an 1/ cosh(x) in x = 0
als a0 + a1 x + . . . + a6 x6 anzusetzen und aus der „höheren Produktregel“ die
Gleichung

x2 x4 x6
 
a0 + a1 x + . . . + a6 x6 = 1 + bx8 + . . .

1+ + +
2 4! 6!

zu folgern, die es uns hinwiederum erlaubt, induktiv die aν zu bestimmen. Die-


se Rechnung kann im vorliegenden Fall zusätzlich vereinfacht werden durch die
Erkenntnis, daß eh gilt 0 = a1 = a3 = a5 = . . ., da unsere Funktion gerade ist.
Ergänzung 6.3.8 (Geschlossene Formel für die Catalan-Zahlen). Wir zeigen
nun die in [GR] 2.1.13 versprochene Formel
 
1 2n
Cn =
n+1 n

für die ebendort eingeführten Catalan-Zahlen Cn , die die Zahl der möglichen Ver-
klammerungen eines Wortes in (n + 1) Symbolen angeben. Diese Zahlen erfüllen
offensichtlich die Rekursion
n
X
Cn+1 = Ck Cn−k
k=0

Die erzeugende
P Funktion der Folge der Catalan-Zahlen alias die formale Potenz-
reihe P = n≥0 Cn xn erfüllt demnach im Ring der formalen Laurentreihen aus
[LA1] 5.3.43 die Formel xP 2 = P −1 alias P 2 − x1 P + x1 = 0. Damit folgt, immer
im Ring der formalen Laurentreihen, eine Identität der Form
r √
1 1 1 1 ± 1 − 4x
P = ± − =
2x 4x2 x 2x

218
falls die fragliche Wurzel im Ring der formalen Laurentreihen existieren sollte,
wobei das Vorzeichen noch zu bestimmen ist. Nach 6.3.9 existiert diese Wurzel
jedoch in der Tat und kann beschrieben werden durch die binomische Reihe
∞ 


X 1/2
1 − 4x = (−4x)n
n
n=0

Deren konstanter Term ist Eins, so daß für unser Vorzeichen nur das Minus in
Frage kommt. Damit muß notwendig gelten

1 − 1 − 4x
P =
2x
Die Koeffizienten unserer binomischen Reihe lassen sich vereinfachen zu
       
1/2 n n 1 1 −1 −3 −2n + 3
(−1) 4 = ... (−1)n 4n
n n! 2 2 2 2
1
= − (1 · 3 . . . (2n − 3))2n
n!
−2(2(n − 1))!
=
(n − 1)!(n − 1)!
Die letzte Identität stimmt dabei nur für n ≥ 1. Setzen wir alles zusammen, so
ergibt sich wie gewünscht  
1 2n
Cn =
n+1 n

Übungen
Übung 6.3.9. Gegeben zwei beliebig oft differenzierbare Funktionen auf einem
Intervall ist die Taylorreihe ihrer Summe die Summe der Taylorreihen und die
Taylorreihe des Produkts das Produkt der Taylorreihen. Hier verstehen wir Pro-
dukt und Summe von Potenzreihen im formalen Sinn, vergleiche [LA1] 5.3.42.
Ergänzende Übung 6.3.10. Man zeige, daß die Identitäten exp(log(x+1)) = x+1
und log((ex −1) + 1) = x auch als formale Identitäten von Potenzreihen gelten,
daß also etwa im ersten Fall für k ≥ 2 gilt

1 −(−1)j(1) −(−1)j(i)
X    
... =0
i! j(1) j(i)
j(1)+...+j(i)=k

wo die Summe über alle i ≥ 1 und alle Abbildungen j : {1, . . . , i} → N≥1


läuft, bei denen k die Summe der Werte ist, wohingegen dieselbe Summe für

219
k = 1 gerade den Wert Eins ergibt. Allgemeiner führe man aus, inwiefern die
Taylorreihe der Verknüpfung zweier unendlich oft differenzierbarer Funktionen
gerade die Verknüpfung ihrer Taylorreihen ist.
Ergänzende Übung 6.3.11. Gegeben ein Kring k, für den ein Ringhomomorphis-
mus Q → k existiert, liefert das formale Einsetzen in formale Potenzreihen eine

Bijektion exp : tkJtK → 1 + tkJtK mit der Inversen log gegeben durch die Potenz-
reihe von log(1 + x). Diese Bijektion ist ein Gruppenisomorphismus zwischen der
additiven Gruppe tkJtK und der multiplikativen Gruppe 1 + tkJtK.

6.4 Der Abel’sche Grenzwertsatz*


6.4.1. In diesem Abschnitt will ich mein Versprechen einlösen und die Formel
1 1 1
1− + − + . . . = log 2
2 3 4
zeigen. Wenn wir x = 1 in die Reihenentwicklung von log(1 + x) einsetzen
dürften, so folgte das sofort. Die Schwierigkeit liegt darin, daß wir bisher nur für
|x| < 1 nachgewiesen haben, daß unsere Potenzreihe aus 6.1.19 gegen log(1 + x)
konvergiert. Der folgende Satz hilft uns, diese Schwierigkeit zu überwinden, und
wird auch in 5.4.14 bei der Herleitung der wunderbaren Formel
1 1 1 π
1− + − ... =
3 5 7 4
benötigt. In beiden Formeln sehe aber eher schöne Blüten als zentrale Inhalte.
Davon abgesehen spielt der abelsche Grenzwertsatz im weiteren Verlauf dieser
Vorlesung keine Rolle.

Satz 6.4.2 (Abel’scher Grenzwertsatz). Konvergiert eine reelle Potenzreihe auch


noch auf einem Randpunkt ihres Konvergenzbereichs, so stellt sie bis in diesen
Randpunkt hinein eine stetige Funktion dar.

Vorschau 6.4.3. Für diejenigen Leser, die bereits mit komplexen Potenzreihen ver-
traut sind, sei bemerkt, daß die entsprechende Aussage im Komplexen in dieser
Form nicht mehr gilt. Mehr dazu finden Sie etwa in [FT1] 4.2.2.
Beweis. Wir dürfen ohne Beschränkung der Allgemeinheit annehmen,
P∞ daß x = 1
der besagte Randpunkt des Konvergenzbereichs ist. Sei also k=0 ak eine P∞konver-k
gente Reihe reeller Zahlen. Wir müssen zeigen, daß die Reihe f (x) = k=0 ak x
für x ∈ [0, 1] eine stetige Funktion darstellt. Dazu schreiben wir die Differenzen

220
der Partialsummen in der Form
Pm k
k=n ak x = (xn − xn+1 ) (an )
+ (xn+1 − xn+2 ) (an + an+1 )
+ (xn+2 − xn+3 ) (an + an+1 + an+2 )
... ...
m−1
+ (x − xm ) (an + . . . . . . . . . + am−1 )
+ xm (an + . . . . . . . . . + am−1 + am )

Für alle ε > 0 finden wir nun wegen der Konvergenz unserer Reihe ein N derart,
daß für alle n, m mit N ≤ n ≤ m gilt |an + . . . + am | ≤ ε. Für alle n, m mit
N ≤ n ≤ m und alle x ∈ [0, 1] folgt daraus die Abschätzung
Pm k
k=n ak x ≤ (xn − xm ) ε + xm ε ≤ ε

Diese Abschätzung zeigt die gleichmäßige Konvergenz der Folge der Partialsum-
men auf [0, 1] und damit die Stetigkeit der Grenzfunktion.
Vorschau 6.4.4. Läßt sich die durch eine Potenzreihe im Inneren des Konver-
genzintervalls definierte Funktion stetig auf einen Randpunkt fortsetzen, so muß
die Potenzreihe an besagtem Randpunkt keineswegs konvergieren. Nehmen wir
P (−1, 1) ist und der fragli-
der Einfachkeit halber an, daß das Konvergenzintervall
che Randpunkt die 1, so folgtPdie Konvergenz von an jedoch aus der stetigen
n
Fortsetzbarkeit der Funktion an x von x ∈ [0, 1) auf [0, 1] zusammen mit der
Tauber-Bedingung, daß die Folge nan betragsmäßig beschränkt sein möge. Un-
ter der stärkeren Annahme limn→∞ nan = 0 wurde das bereits von Tauber gezeigt.

221
7 Raumwertige Funktionen und Schwingungen
7.1 Bogenlänge und Geschwindigkeit
7.1.1. Gegeben v = (v1 , . . . , vn ) ∈ Rn setzen wir
q
kvk := v12 + . . . + vn2

und nennen diese Zahl die Skalarproduktnorm oder kurz Länge von v. Offen-
sichtlich haben wir kλvk = |λ|kvk für alle λ ∈ R. Auf der Schule und in der
Linearen Algebra lernen Sie, inwieweit kvk dem entspricht, was wir anschaulich
die „Länge des Vektors v“ nennen würden, und daß für alle v, w ∈ Rn die Drei-
ecksungleichung kv + wk ≤ kvk + kwk gilt.

Definition 7.1.2. Gegeben ein Intervall I ⊂ R und eine Abbildung γ : I → Rn


erklären wir die Länge L(γ) ∈ R̄ von γ als das Supremum über „die Längen aller
einbeschriebenen Polygonzüge“, in Formeln
( r−1 )
X
L(γ) := sup kγ(ti ) − γ(ti+1 )k t0 , . . . , tr ∈ I, t0 ≤ . . . ≤ tr
i=0

Man spricht in diesem Zusammenhang meist von der Bogenlänge und nennt eine
stetige Abbildung γ : I → Rn wie oben einen Weg in Rn .

7.1.3. Offensichtlich ist unsere Bogenlänge „invariant unter Reparametrisierung“.


In Formeln haben wir stärker sogar für jede monotone Surjektion ψ : J → I of-
fensichtlich L(γ ◦ψ) = L(γ). Unsere Definition der Kreiszahl π aus
√ 3.4.1 bedeutet
in dieser Terminologie π = L(γ) für γ : [−1, 1] → R2 , x 7→ (x, 1 − x2 ).
7.1.4. Seien γ : R ⊃ D → Rn eine Abbildung von einer halboffenen Teilmenge
D ⊂ R nach Rn und sei p ∈ D ein Punkt. Wir nennen γ differenzierbar bei p,
wenn es einen Vektor v ∈ Rn gibt mit

γ(p + t) − γ(p)
v = lim
t→0 t
Dann schreiben wir γ 0 (p) := v und nennen γ 0 (p) die Ableitung von γ bei p
oder, wenn wir uns t als Zeit denken, den Geschwindigkeitsvektor. Die Länge
kγ 0 (p)k des Geschwindigkeitsvektors nennen wir die absolute Geschwindigkeit.
Ist γ differenzierbar an allen Stellen p ∈ D, so nennen wir γ differenzierbar oder
genauer differenzierbar auf D.

222
Eine Approximation eines Weges durch einen Polygonzug

Eine bessere Approximation desselben Weges durch einen Polygonzug

223
Denken wir uns t als Zeit, so mag man γ 0 (p) auch den „Geschwindigkeitsvektor“
nennen. Er ist stets tangential an die Bahnkurve. Seine Länge hängt jedoch von
der Anzeige des Tachometers ab, wenn wir uns hier mal ein Auto denken, das auf
einem Fußballfeld herumkurvt. Dieser Aspekt ist in einem Bild leider schwer
darzustellen.

224
7.1.5. Seien γ : R ⊃ D → Rn eine Abbildung von einer halboffenen Teilmenge
D ⊂ R nach Rn und sei p ∈ D ein Punkt. Nach unseren Regeln über komponen-
tenweise Grenzwerte ist γ = (γ1 , . . . , γn ) differenzierbar bei p genau dann, wenn
alle γi : D → R differenzierbar sind bei p, und dann haben wir

γ 0 (p) = (γ10 (p), . . . , γn0 (p))

Beispiel 7.1.6. Für Abbildungen γ : R ⊃ D → C stimmt unsere hier erklärte Ab-


leitung überein mit der reell-komplexen Ableitung komplexwertiger Funktionen
aus 5.10.13.
Vorschau 7.1.7 (Lamento über das Arbeiten ohne Einheiten). Eigentlich sollte
man sich mehr Mühe geben, um guten Gewissens von Länge und Geschwindig-
keit reden zu können. Ich würde gerne einen „euklidischen Raum“ einführen als
einen endlichdimensionalen reellen affinen Raum E mit einer ausgezeichneten
R>0 -Bahn von Skalarprodukten auf dem zugehörigen Richtungsraum E ~ und dazu
~
einen orientierten eindimensionalen Vektorraum L = L(E) konstruieren, seine
„Längengerade“. Dann konstruiert man die „Länge“ als eine Abbildung
~ →L
kk:E

Danach postuliert man einen orientierten eindimensionalen affinen Raum T der


„Zeitpunkte“, diskutiert differenzierbare Abbildungen γ : T ⊃ D → E und er-
hält als Geschwindigkeitsvektor bei p ∈ D ein Element γ̇(p) ∈ HomR (T, ~ E).
~
Die absolute Geschwindigkeit schließlich wird eine orientierungserhaltende li-
neare Abbildung kγ̇(p)k ∈ HomR (T, ~ L). Das wäre aussagekräftiger als, wie wir
hier, E = E ~ = Rn und T = T ~ = L = R zu identifizieren. Dazu müßte ich
aber auf entsprechender Vorarbeit aus der Linearen Algebra aufbauen, und selbst
wenn ich das dürfte, wäre es zu viel Begrifflichkeit für einen Abschluß des ersten
Semesters.
7.1.8. Wie in [LA1] 3.5.2 heißt eine Teilmenge des Rn konvex, wenn sie mit
je zwei Punkten auch das ganze die beiden Punkte verbindende Geradensegment
enthält. Eine Teilmenge des Rn heißt offen, wenn sie eine Umgebung eines jeden
ihrer Punkte ist.
Beispiel 7.1.9. Für alle ε > 0 und p ∈ Rn ist sowohl der in 3.2.19 eingeführ-
te Quader B(p; ε) := {x ∈ Rn | |p − x| < ε} als auch der euklidische Ball
B2 (p; ε) := {x ∈ Rn | kp − xk < ε} offen und konvex.
Satz 7.1.10 (Schrankensatz). Seien a < b reelle Zahlen und γ : [a, b] → Rn
differenzierbar. Ist C ⊂ Rn eine offene konvexe Teilmenge und gilt γ 0 (t) ∈ C für
alle t ∈ [a, b], so folgt
γ(b) − γ(a) ∈ (b − a)C

225
Eine nicht konvexe Teilmenge der Ebene

226
Vorschau 7.1.11. Der Satz gilt genauso für C konvex und „abgeschlossen“, da
T ein C schreiben können als den Schnitt der offenen konvexen Mengen
wir so
C = η>0 (C + B(0; η)).
Beispiel 7.1.12 (Anschauung für den Schrankensatz). Anschaulich können wir
den Inhalt des Satzes interpretieren wie folgt: Sei C eine Kreisscheibe im Rich-
tungsraum der Anschauungsebene mit Radius 20 km/h. Fahren wir mit einem Ge-
ländewagen um 14:00 Uhr an einem Parkplatz los und kurven durch die Gegend
und der Tacho zeigt nie mehr als 20 km/h an, so sind wir um 17:00 Uhr höchstens
60 km von unserem ursprünglichen Parkplatz entfernt. Besteht C dahingegen aus
einem einzigen Punkt, der sagen wir die Geschwindigkeit von 20 km/h in einer
festen Richtung bedeutet, so besagt unser Satz: Fahren wir konstant mit 20 km/h
in diese Richtung, so haben wir um 17:00 Uhr genau 60 km in besagte Richtung
zurückgelegt. Für dieses Beispiel wählen wir implizit einen Isomorphismus der
Zeitachse T mit der reellen Zahlengeraden R derart, daß jeder Stunde ein Inter-
vall der Länge Eins entspricht. Das bedeutet insbesondere, daß wir implizit auch
vektorielle Geschwindigkeiten mit Richtungsvektoren identifizieren. Im übrigen
wird in [AN2] 2.3.11 erklärt, wie man auch mit „echten“ Geschwindigkeiten for-
mal korrekt arbeiten kann.
7.1.13 (Beziehung zwischen Schrankensatz und Mittelwertsatz). Der Satz folgt
im Fall Rn = R leicht aus unserem bisherigen Mittelwertsatz 5.5.7 und er spielt
auch im allgemeinen eine ähnliche Rolle, indem er es erlaubt, „den von einem
Teilchen in einem Zeitintervall [a, b] gewonnenen Abstand von seinem Ausgangs-
punkt aus der Kenntnis seiner lokalen Geschwindigkeiten abzuschätzen“. Jedoch
kann man im allgemeinen Fall des Rn im allgemeinen keinen Zeitpunkt mehr fin-
den, zu dem das Teilchen „mittlere Geschwindigkeit“ hätte. Es gibt in anderen
Worten im allgemeinen keinen Punkt ξ ∈ [a, b] mit γ(b) − γ(a) = (b − a)γ 0 (ξ).
Man stelle sich etwa vor, daß unser Geländewagen ein Rundtour fährt, bei der er
zu keiner Zeit die Geschwindigkeit Null hat. Mich befriedigt deshalb die in der
älteren Literatur übliche Bezeichnung als „Mittelwertsatz in mehreren Veränder-
lichen“ nicht vollständig.
Beweis. Offensichtlich gilt für eine konvexe Teilmenge C ⊂ Rn und beliebige
reelle s, t ≥ 0 stets sC + tC = (s + t)C. Das zeigt, daß in unserem Satz die
Aussage für das ganze Intervall folgt, wenn wir sie für alle Stücke einer Zerlegung
in endlich viele Teilintervalle zeigen können. Kürzen wir genauer für p, q ∈ [a, b]
mit S(p, q) die Aussage γ(q) − γ(p) ∈ (q − p)C ab, so gilt für a ≤ p ≤ q ≤ r ≤ b
in Formeln ausgedrückt

S(p, q) und S(q, r) ⇒ S(p, r)

Da wir C offen angenommen hatten, besitzt jeder Punkt p ∈ [a, b] eine Umgebung

227
Up mit
γ(q) − γ(p)
q ∈ [a, b] ∩ Up \p ⇒ ∈C
q−p
oder umgeschrieben eine Umgebung Up mit (q ∈ [a, b] ∩ Up ) ⇒ S(p, q). Nun
setzen wir
s := sup{c ∈ [a, b] | Es gilt S(a, x) ∀x ∈ [a, c]}
Dann gilt S(a, s), denn im Fall a = s ist das eh klar und sonst gibt es x ∈ [a, s)
mit S(x, s) wahr und S(a, x) gilt nach Annahme eh für alle x ∈ [a, s). Hätten wir
nun nicht s = b, so fänden wir q ∈ (s, b] mit S(s, x) wahr für alle x ∈ [s, q] und
damit S(a, x) wahr für alle x ∈ [a, q] im Widerspruch zur Wahl von s.
Satz 7.1.14 (Bogenlänge als Integral). Die Länge eines stetig differenzierbaren
Weges γ : [a, b] → Rn stimmt überein mit dem Integral über seine absolute Ge-
schwindigkeit, in Formeln
Z b
L(γ) = kγ 0 (t)k dt
a
0
Beweis. Sei ε > 0 beliebig. Da γ nach 5.1.15 gleichmäßig stetig ist auf [a, b],
finden wir ein δ > 0 mit kγ 0 (x) − γ 0 (y)k < ε falls |x − y| ≤ δ. Gegeben eine
Unterteilung a = a0 ≤ a1 ≤ . . . ≤ ar = b einer Feinheit ≤ δ folgern wir aus dem
Schrankensatz 7.1.10 dann
γ(ai+1 ) − γ(ai ) ∈ (ai+1 − ai ) B(γ 0 (ai ); ε)
und insbesondere kγ(ai+1 ) − γ(ai )k ∈ (ai+1 − ai ) kγ 0 (ai )k + [−ε, ε] . Durch


Aufsummieren folgt
r−1
X r−1
X
kγ(ai+1 ) − γ(ai )k − kγ 0 (ai )k(ai+1 − ai ) ≤ (b − a)ε
i=0 i=0

für jede Unterteilung der Feinheit ≤ δ. Das zeigt schon mal L(γ) < ∞, da kγ 0 (t)k
beschränkt sein muß auf dem kompakten Intervall [a, b]. Nach Übung 5.2.11 zum
Riemannintegral können wir δ zusätzlich so klein wählen, daß für jede Untertei-
lung der Feinheit ≤ δ auch noch gilt
r−1
X Z
kγ (ai )k(ai+1 − ai ) − kγ 0 k ≤ ε
0

i=0

Da aber die Länge approximierender Polygonzüge beim Hinzufügen von Zwi-


schenpunkten nur größer werden kann, finden wir eine Unterteilung dieser Fein-
heit mit
Xr−1
L(γ) − kγ(ai+1 ) − γ(ai )k ≤ ε
i=0

228
Zusammen erhalten wir
Z
L(γ) − kγ 0 k ≤ (b − a)ε + 2ε

kγ 0 k wie gewünscht.
R
Da das für alle ε > 0 gilt, folgt L(γ) =
Beispiel 7.1.15 (Kreislänge). Unsere Definition der Kreiszahl π aus 3.4.1 be-
deutet wie bereits ewähnt in√der hier eingeführten Terminologie π = L(γ) für
γ : [−1, 1] → R2 , x 7→ (x, 1 − x2 ). Bezeichne andererseits κ > 0 die kleins-
te positive Zahl mit u(κ) = −1 für unsere Umlaufabbildung u(t) := eit . Es gilt
zu zeigen κ = π. Wir wissen sin(t) > 0 für t ∈ (0, κ), folglich fällt cos streng

monoton auf [0, κ] und induziert eine Bijektion cos : [0, κ] → [−1, 1]. Unter der
Umparametrisierung mit dem Cosinus erhalten wir γ(cos t) = (cos t, sin t). Weil
die Länge sich bei monotoner Umparametrisierung nicht ändert, folgern wir
Z κ Z κ
0
π = L(γ) = L(γ ◦ cos) = k(γ ◦ cos) (t)k dt = 1 dt = κ
0 0

Ergänzung 7.1.16 (Gestalt einer hängenden Kette). Wir gehen davon aus, daß
die Gestalt einer hängenden Kette durch den Graphen einer stetig differenzierba-
ren Funktion f : R → R beschrieben wird, und zeigen, daß diese Funktion bei
Wahl einer geeigneten Längeneinheit und eines passenden Urspungs der Cosinus
hyperbolicus sein muß. Auf das Kettensegment über einem kompakten Intervall
[a, b] wirken die Zugkraft in der Kette von beiden Seiten sowie die Schwerkraft.
Bezeichnet Lba die Länge des besagten Kettensegments und vx = (1, f 0 (x)) den
Tangentenvektor an unsere Kurve bei (x, f (x)) mit 1 als erster Komponente, so
impliziert das Kräftegleichgewicht die vektorielle Gleichung

0 = −ca va + cb vb − D(0, Lba )

für geeignete positive Zahlen ca , cb und eine positive Konstante D, die von den
physikalischen Konstanten unseres Problems abhängen. Die Positivität von ca , cb
und D wird dabei auch nur anschaulich motiviert und nicht mathematisch herge-
leitet. Mathematisch wäre auch durchaus die an der y-Achse gespiegelte „stehende
Kette“ eine mögliche Lösung, aber eben mit negativen ca , cb . Durch Betrachtung
der ersten Komponenten liefert unsere vektorielle Gleichung für das Kräftegleich-
gewicht erst einmal ca = cb = c. Insbesondere ist der horizontale Anteil der
Zugspannung in der Kette also an jeder Stelle derselbe. Durch Betrachtung der
zweiten Komponenten folgt weiter
Z bp
0 0 b
cf (a) − cf (b) = −DLa = −D 1 + f 0 (x)2 dx
a

229
Illustration zur hängenden Kette

230
Folglich erfüllt unsere Funktion eine Differentialgleichung der Gestalt
Z bp
0 0
f (a) − f (b) = −k 1 + f 0 (x)2 dx
a
p
für positives k := D/c, mithin gilt f 00 (x) = k 1 + f 0 (x)2 . Daraus folgern wir
Z b
f 00 (x) dx
p =b−a
a k 1 + f 0 (x)2
und mit der Substitution f 0 (x) = y, f 00 (x) dx = dy weiter
Z f 0 (b)
dy
p =b−a
f 0 (a) k 1 + y2
Dies Integral lösen wir durch die Substitution y = sinh t, dy = cosh t dt und
erhalten als Stammfunktion für den Integranden k −1 arsinh y. Damit ergibt sich
k −1 arsinh f 0 (b) = b + m für eine Konstante m und f 0 (b) = sinh(k(b + m)) und
schließlich
f (b) = k −1 cosh(k(b + m)) + h
für geeignete Konstanten k, m und h. Hier beschreibt k, wie „steil“ die Kette
hängt, m ist das Negative der x-Koordinate der Stelle kleinster Höhe, und h be-
schreibt, wie hoch unsere Kette hängt. In Worten bedeutet das, daß es für eine
vorgegebene hängende Kette stets ein orthogonales Koordinatensystem und ins-
besondere eine Längeneinheit gibt, für die sie genau entlang des Graphen des
Cosinus hyperbolicus hängt.
Vorschau 7.1.17. In [TM] 4.6.10 skizziere ich einen Beweis dafür, daß sogar ein
„Weg gegebener Länge kleinster potentieller Energie“ zwischen vorgegebenen
Aufhängepunkten existiert und eindeutig bestimmt ist und unsere Kettenlinie sein
muß.

Übungen
Übung 7.1.18. Seien D ⊂ R eine halboffene Teilmenge und A : D → Mat(n ×
m; R) sowie B : D → Mat(m×k; R) differenzierbare matrixwertige Funktionen.
So ist auch das Produkt AB : t 7→ A(t)B(t) differenzierbar und die Geschwin-
digkeit (AB)0 der Produktfunktion AB : D → Mat(n×k; R) wird gegeben durch
die Formel
(AB)0 = A0 B + AB 0
Übung 7.1.19. Gegeben s ∈ R bezeichne (s·) : Rn → Rn die Multiplikation
mit s. Sei γ : I → Rn eine Abbildung von einem Intervall nach Rn . Man zeige
L((s·) ◦ γ) = |s|L(γ) für s 6= 0.

231
Übung 7.1.20. Für jede Abbildung γ : [a, b] → Rn gilt L(γ) ≥ kγ(a) − γ(b)k.
Ist γ zusätzlich stetig, so haben wir Gleichheit genau dann, wenn γ aus dem Weg
φ : [0, 1] → Rn , t → tγ(a) + (1 − t)γ(b) entsteht durch monotone Umparametri-
sierung.
Übung 7.1.21. Eine Abbildung von einem reellen Intervall I nach Rn heiße nach
der Bogenlänge parametrisierend, wenn ihre Einschränkung auf jedes nicht-
leere kompakte Teilintervall dieselbe Länge hat wie das Teilintervall selber. Man
zeige, daß sich eine stetige Abbildung von einem reellen Intervall nach Rn , die
auf keinem mehrpunktigen Teilintervall konstant ist und deren Einschränkung auf
jedes kompakte Teilintervall endliche Länge hat, stets „nach der Bogenlänge pa-
rametrisieren“ läßt, daß es also genauer für solch eine Abbildung γ : I → Rn

stets eine stetige Bijektion ψ : J → I von einem weiteren reellen Intervall J nach
I gibt derart, daß γ ◦ ψ nach der Bogenlänge parametrisierend ist.
Übung 7.1.22. Man zeige, daß eine stetig differenzierbare Abbildung von einem
mehrpunktigen reellen Intervall in den Rn genau dann nach der Bogenlänge pa-
rametrisierend ist, wenn die zugehörige absolute Geschwindigkeit konstant Eins
ist.
Übung 7.1.23. Gegeben ein stetig differenzierbarer Weg γ : [a, b] → Rn und eine
stetige Funktion f : γ([a, b]) → R erklärt man das Kurvenintegral von f längs
γ als die reelle Zahl Z Z b
f= f (γ(t)) kγ 0 (t)k dt
γ a

Man zeige, daß dies Kurvenintegral unabhängig ist von der Parametrisierung und
daß es mit denselben Notationen wie oben geschrieben werden kann als der Grenz-
wert der Riemannsummen
r−1
X
Sγr (f ) = f (γ(ai )) kγ(ai+1 ) − γ(ai )k
i=0

7.1.24 (Anschauung zum Kurvenintegral). Die Länge eines stetig differenzier-


baren Weges ist in dieser Terminologie das Kurvenintegral der konstanten Funk-
tion Eins längs unseres Weges. Der „Schwerpunkt“ eines durch eine Abbildung
γ : [a, b] → R3 beschriebenen homogenen gebogenen Drahtes müßte mathema-
tisch dadurch definiert werden, daß seine Koordinaten die Kurvenintegrale der
Koordinatenfunktionen x, y, z längs γ dividiert durch die Länge unseres Weges
sind. Stellen wir uns allgemeiner eine Erdwärmeanlage vor, bei der kaltes Was-
ser in einem Rohr durch heißes Gestein gepumpt wird, um am Ende immer noch
vergleichsweise kalt aber doch etwas wärmer herauszukommen, und beschreibt γ
unser Rohr und f die Wärme der Erde an den jeweiligen Stellen, so würde unser
Kurvenintegral nach Einfügen der entsprechenden physikalischen Konstanten die

232
Temperaturdifferenz zwischen eintretendem und austretendem Wasser beschrei-
ben.
7.1.25 (Diskussion der Terminologie). Das hier definierte Kurvenintegral wird
oft auch als „Wegintegral“ bezeichnet. Ich will den Begriff des Wegintegrals je-
doch für eine andere Konstruktion reservieren, die in [AN2] 8.4 besprochen wer-
den wird.
Übung 7.1.26 (Länge des Graphen einer Funktion). Gegeben eine stetig diffe-
renzierbare Funktion f : [a, b] → R wird die Länge ihres Graphen, als da heißt
die Länge des Weges γ : [a, b] → R2 , t 7→ (t, f (t)), gegeben durch das Integral
Rbp
L(γ) = a 1 + f 0 (t)2 dt.

7.2 Systeme von linearen Differentialgleichungen


7.2.1. Wir bestimmen für eine gegebene quadratische Matrix A ∈ Mat(n; R) alle
differenzierbaren Abbildungen γ : R → Rn mit

γ 0 (t) = Aγ(t) ∀t ∈ R

Bei dieser Schreibweise fassen wir implizit die Elemente des Rn als Spaltenvekto-
ren auf, also γ = (γ1 , . . . , γn )> , wo der obere Index > unsere Zeilenmatrix in eine
Spaltenmatrix transponiert. Man nennt so eine Gleichung ein homogenes System
von linearen Differentialgleichungen mit konstanten Koeffizienten. Die Spe-
zifikation „mit konstanten Koeffizienten“ grenzt unsere Gleichung ab von dem
noch allgemeineren Fall, bei dem auch die Matrix A noch von t abhängen darf,
also A = A(t), und der noch außerhalb unserer Reichweite ist. Die Spezifikati-
on „homogen“ grenzt es ab vom allgemeineren Fall einer Gleichung der Gestalt
γ 0 (t) = Aγ(t) + f (t) für eine zusätzlich gegebene vektorwertige Funktion f ,
den wir in 7.6.1 diskutieren. Anschaulich gesprochen geben wir uns auf dem Rn
das sehr spezielle Vektorfeld x 7→ Ax vor und interessieren uns für die Bahnen
solcher Teilchen, die bei x ∈ Rn jeweils die Geschwindigkeit Ax haben.
Beispiel 7.2.2. Im Fall n = 1 hat A genau einen Eintrag a ∈ R und wir hatten
schon in 5.5.9 im Fall a = 1 und in Übung 5.5.22 für allgemeines a gesehen,
daß alle Lösungen der Differentialgleichung γ 0 = aγ die Form γ(t) = c exp(at)
haben.
7.2.3. Im Allgemeinen erklären wir die Exponentialfunktion auf Matrizen durch
die Vorschrift
exp : Mat(n; R) → Mat(n; R)
P∞ 1 k 1 2 1 3
A 7→ k=0 k! A = I +A + 2 A + 6 A + . . .

233
    
x 0 −1 x
Das ebene Vektorfeld 7→
y 1 0 y

234
Hier bedeutet A0 = I nach unserer Konvention 1.5.16 die Einheitsmatrix und
unsere unendliche Reihe ist zu verstehen als der Grenzwert der Folge ihrer Par-
tialsummen. Wir zeigen, daß diese Grenzwerte existieren. Bezeichnen wir dazu
für eine quadratische Matrix A ∈ Mat(n; R) mit |A| das Maximum der Abso-
lutbeträge ihrer Einträge, so gilt offensichtlich |AB| ≤ n|A||B| für jede weitere
Matrix B ∈ Mat(n; R). Daraus folgt |Ak | ≤ (n|A|)k und dann zeigt die Kon-
vergenz der Exponentialreihe zu n|A| die absolute Konvergenz aller Reihen von
Matrixeinträgen in der Exponentialreihe zu A.
Lemma 7.2.4 (Funktionalgleichung für das Exponential von Matrizen). Die
Exponentialabbildung wirft die Null auf die Identität, in Formeln exp(0) = I. Sind
A, B zwei kommutierende quadratische Matrizen AB = BA, so gilt
exp(A + B) = (exp A)(exp B)
7.2.5. Insbesondere folgt exp(−A) = (exp A)−1 . Die Exponentialabbildung ist
mithin eine Abbildung von der Menge aller quadratischen Matrizen in die Menge
aller invertierbaren quadratischen Matrizen
exp : Mat(n; R) → GL(n; R)
Beweis. Aus 7.2.3 wissen wir für A ∈ Mat(n; R) um die absolute Konvergenz

X 1 k
(exp A)pq = (A )pq
k=0
k!
der Exponentialreihe in jedem Matrixeintrag. Aus unseren Erkenntnissen über
Umordnung und Produkt absolut konvergenter Reihen folgt dann
 Pn
(exp A)(exp B) pr = q=1 (exp A)pq (exp B)qr
Pn P 1 i j
= q=1 (i,j)∈N×N i!j! (A )pq (B )qr
1 i j
P
= (i,j)∈N×N i!j! (A B )pr
P∞ 1 k

= k=0 k! (A + B) pr

= exp(A + B) pr
k!
Die Annahme AB = BA brauchen wir, um (A + B)k = i+j=k i!j! Ai B j ver-
P
wenden zu dürfen.
Satz 7.2.6 (Erste lineare Differentialgleichungen). Ist A ∈ Mat(n; R) eine
quadratische Matrix und c ∈ Rn ein Spaltenvektor, so gibt es genau eine diffe-
renzierbare Abbildung γ : R → Rn mit Anfangswert γ(0) = c derart, daß gilt
γ 0 (t) = Aγ(t) für alle t ∈ R, und diese Abbildung wird gegeben durch die Vor-
schrift
γ(t) = exp(tA)c

235
7.2.7. Es ist durchaus möglich, mithilfe dieses Satzes auch ganz konkrete Dif-
ferentialgleichungen ganz konkret zu lösen. Wir gehen darauf in den weiteren
Abschnitten näher ein.
Beweis. Wir behaupten zunächst, daß die Abbildung g : R → Mat(n; R), t 7→
exp(tA) differenzierbar ist mit der Ableitung g 0 (t) = A exp(tA). In der Tat wissen
wir nach 6.1.16, daß man Potenzreihen gliedweise differenzieren darf, und unsere
Formel ergibt sich, wenn wir diese Erkenntnis anwenden auf alle Einträge unserer
Matrix. Nach der matrixwertigen Produktregel 7.1.18 ist nun auch die Abbildung
γ : R → Rn , t 7→ exp(tA)c differenzierbar mit Ableitung γ 0 (t) = A exp(tA)c =
Aγ(t) und die Bedingung γ(0) = c ist offensichtlich. Unsere Funktion ist damit
eine Lösung der Differentialgleichung mit dem vorgegebenen Anfangswert. Ist
umgekehrt γ(t) eine beliebige Lösung unserer Differentialgleichung γ 0 = Aγ, so
berechnen wir die Ableitung der Funktion t 7→ h(t) = exp(−tA)γ(t) mithilfe der
matrixwertigen Produktregel 7.1.18 und erhalten

h0 (t) = −A exp(−tA)γ(t) + exp(−tA)γ 0 (t) = 0

Die Funktion h(t) = exp(−tA)γ(t) ist also konstant mit Wert γ(0) und mit der
matrixwertigen Funktionalgleichung 7.2.4 folgt γ(t) = exp(tA)γ(0).

Satz 7.2.8 (Erste lineare Differentialgleichungen, Variante). Ist A ∈ Mat(n; R)


eine quadratische Matrix und c ∈ Rn ein Spaltenvektor, und I ⊂ R ein mehr-
punktiges Intervall und t0 ∈ I ein Punkt, so gibt es genau eine differenzierbare
Abbildung γ : I → Rn mit Anfangswert γ(t0 ) = c derart, daß gilt γ 0 (t) = Aγ(t)
für alle t ∈ R, und diese Abbildung wird gegeben durch die Vorschrift

γ(t) = exp((t − t0 )A)c

Beweis. Der Beweis ist im wesentlichen derselbe wie der Beweis von 7.2.6.
7.2.9. Ist A ∈ Mat(n; R) eine quadratische Matrix und I ⊂ R ein mehrpunktiges
Intervall, so bildet die Menge aller differenzierbaren Abbildungen γ : I → Rn mit
γ 0 (t) = Aγ(t) für alle t ∈ I einen Untervektorraum L im Vektorraum Ens(I, Rn )
aller Abbildungen I → Rn , den Lösungsraum unserer Differentialgleichung, und
das Auswerten an einer beliebigen Stelle t0 ∈ I liefert einen Vektorraumisomor-

phismus L → Rn , γ 7→ γ(t0 ), den Anfangswertisomorphismus. All das folgt
unmittelbar aus dem vorhergehenden Satz 7.2.8.

Übungen
Übung 7.2.10. Gegeben eine Diagonalmatrix A = diag(a1 , . . . , an ) haben wir
exp(A) = diag(ea1 , . . . , ean ). Analoges gilt für blockdiagonale Matrizen.

236
7.3 Gedämpfte Schwingungen
7.3.1. Wir interessieren uns für die Bewegung eines Massepunktes, der an einer
Feder aufgehängt ist und dessen Bewegung durch eine zur Geschwindigkeit pro-
portionale Reibung gedämpft wird. Mißt die Funktion x : R → R, t 7→ x(t) seine
Auslenkung von der Gleichgewichtslage zum Zeitpunkt t, so muß unsere Funk-
tion aus physikalischen Gründen eine Differentialgleichung zweiten Grades der
Gestalt
x0 = −ax0 − bx
erfüllen, wobei die Konstanten a und b die Stärke der Feder und der Dämpfung
ausdrücken und in physikalisch relevanten Fällen nichtnegativ sind. Wir lösen die-
se Differentialgleichung hier erst einmal ad hoc und erheben danach in 7.4.2 die-
sen Zugang zur Methode.
Lemma 7.3.2 (Lösung einiger Schwingungsgleichungen). Seien reelle Zahlen
a, b ∈ R gegeben.
1. Die Menge aller zweimal differenzierbaren Funktionen x : R → R mit
x00 +ax0 +bx = 0 bildet einen Untervektorraum des Raums Ens(R, R) aller
Abbildungen R → R, den Lösungsraum L unserer Differentialgleichung;

2. Die Abbildung x 7→ (x(0), x0 (0)) liefert einen Isomorphismus L → R2
dieses Lösungsraums mit dem R2 , den Anfangswertisomorphismus;

3. Hat das Polynom X 2 + aX + b zwei verschiedene reelle Nullstellen λ und


µ, so bilden die beiden Funktionen x1 (t) = eλt und x2 (t) = eµt eine Basis
des Lösungsraums. Hat es dahingegen eine doppelte reelle Nullstelle λ, so
bilden die beiden Funktionen x1 (t) = eλt und x2 (t) = t eλt eine Basis des
Lösungsraums.
Vorschau 7.3.3. Um den Fall, daß unser Polynom keine reelle Nullstelle hat, wer-
den wir uns gleich noch gesondert kümmern.
Beweis. Teil 1 scheint mir offensichtlich. Um Teil 2 zu zeigen beachten wir, daß
die Vorschrift x 7→ (x, x0 ) offensichtlich einen Isomorphismus zwischen unserem
Lösungsraum L und dem Lösungsraum des Systems γ10 = γ2 , γ20 = −bγ1 − aγ2
induziert, das in Matrixschreibweise die Gestalt γ 0 = Aγ annimmt mit der Matrix
 
0 1
A=
−b −a

Teil 2 folgt damit aus 7.2.9. Für Teil 3 müssen wir folglich nur prüfen, daß die
beiden angegebenen Funktionen in der Tat linear unabhängige Lösungen sind.
Das kann dem Leser überlassen bleiben.

237
Ergänzung 7.3.4 (Lösung mithilfe des Exponentials von Matrizen). Statt beim
Beweis von Teil 3 des vorhergehenden Satzes mögliche Lösungen einfach zu er-
raten, hätten wir uns auch daran erinnern können, daß ja nach 7.2.8 jede Lösung
von der Form
x(t) = γ1 (t) = pr1 (exp(tA)c)
sein muß für c = (x(0), x0 (0)). Jetzt brauchen wir weitergehende Kenntnisse in
linearer Algebra. Das charakteristische Polynom unserer Matrix A ergibt sich zu
X 2 + aX + b. Hat es zwei verschiedene reelle Nullstellen λ, µ und bilden wir eine
Matrix P mit Eigenvektoren zu λ und µ als Spalten, so gilt A = P diag(λ, µ)P −1
und exp(tA) = P diag(eλt , eµt )P −1 und wir erkennen auf Anhieb, daß jede Lösung
eine Linearkombination der Gestalt x(t) = α eλt +β eµt sein muß. Im Fall einer
doppelten reellen Nullstelle finden wir ähnlich ein P mit
 
λ 1
A=P P −1
0 λ

und die Funktionalgleichung für das Exponential von Matrizen 7.2.4 liefert
       u    u 
u t u 0 0 t e 0 1 t e t eu
exp = exp exp = =
0 u 0 u 0 0 0 eu 0 1 0 eu

Die allgemeine Lösung ergibt sich so als eine Linearkombination der Gestalt
α eλt +βt eλt .
7.3.5. Im Fall der gedämpften Schwingung hat unser Polynom X 2 + aX + b die
beiden Nullstellen r
a a2
− ± −b
2 4
Bei hinreichend großer Dämpfung a2 /4 ≥ b erhalten wir reelle nichtpositive
Lösungen und unser Massepunkt kehrt mit höchstens einmaligem Überschwingen
zum Ruhezustand zurück. Im Fall kleiner Dämpfung a2 /4 < b hat unser Polynom
dahingegen keine reellen Nullstellenpmehr und stattdessen die beiden komplexen
Nullstellen ± i ω − a/2 mit ω = b − a2 /4 > 0. Um hier weiterzukommen
verallgemeinern wir zunächst einmal alles bisher Gesagte ins Komplexe.

Proposition 7.3.6 (Lösung der Schwingungsgleichung im Komplexen). Seien


komplexe Zahlen a, b ∈ C gegeben.

1. Die Menge aller zweimal differenzierbaren Funktionen x : R → C mit


x00 + ax0 + bx = 0 bildet einen komplexen Untervektorraum des Raums
Ens(R, C) aller Abbildungen R → C, den Lösungsraum L unserer Diffe-
rentialgleichung;

238
2. Die Abbildung x 7→ (x(0), x0 (0)) liefert einen Vektorraumisomorphismus

L → C2 , den Anfangswertisomorphismus;

3. Hat das Polynom X 2 + aX + b zwei verschiedene Nullstellen λ und µ, so


bilden die beiden Funktionen x1 (t) = eλt und x2 (t) = eµt eine Basis des
Lösungsraums L. Hat es eine doppelte Nullstelle λ, so bilden die beiden
Funktionen x1 (t) = eλt und x2 (t) = t eλt eine Basis des Lösungsraums.
Beweis. Der Beweis ist identisch zum Beweis im Reellen 7.3.2, sobald man die
dazu benötigten Hilfsmittel ins Komplexe verallgemeinert hat. Das gelingt oh-
ne weitere Schwierigkeiten und ich fasse es nur kurz zusammen. Man erklärt
zunächst die Exponentialabbildung auf komplexen quadratischen Matrizen durch
die Vorschrift
exp : Mat(n; C) → Mat(n;
P∞ 1 C)k
A 7→ k=0 k! A

und zeigt, daß g : R → Mat(n; C), g(t) = exp(tA) differenzierbar ist mit der
Ableitung g 0 (t) = A exp(tA). Dann zeigt man die Produktregel für Abbildungen
der Zahlengerade in Räume komplexer Matrizen und folgert, daß die Abbildung
γ(t) = exp(tA)c eine differenzierbare Abbildung γ : R → Cn ist mit Anfangs-
wert γ(0) = c und
γ 0 (t) = Aγ(t)
für alle t ∈ R. Schließlich prüft man wieder mit der matrixwertigen Produktregel,
daß für jede Lösung γ dieser Differentialgleichung die Abbildung exp(−tA)γ(t)
die Ableitung Null hat und folglich konstant ist. Daraus folgt der Anfangswertiso-
morphismus und die Erkenntnis, daß die Lösungsmenge der Differentialgleichung
γ 0 (t) = Aγ(t) ein n-dimensionaler komplexer Untervektorraum des Abbildungs-
raums Ens(R, Cn ) ist. Indem wir von unserer Differentialgleichung zweiter Ord-
nun zu einem System von Differentialgleichungen erster Ordnung übergehen, er-
geben sich die beiden ersten Aussagen der Proposition. Durch explizites Rechnen
folgt dann leicht der dritte Teil.
7.3.7 (Beziehung zwischen reellen und komplexen Lösungen). Sind in der Si-
tuation aus 7.3.6 die Koeffizienten a, b beide reell, so bilden die reellwertigen
Lösungen unseres Systems nach 7.3.2 einen zweidimensionalen reellen Unter-
vektorraum LR ⊂ Ens(R, R). Seine komplexwertigen Lösungen bilden dahin-
gegen nach 7.3.6 einen zweidimensionalen komplexen Untervektorraum LC ⊂
Ens(R, C), der stabil ist unter dem Übergang zu den komplex konjugierten Funk-
tionen, in Formeln
f ∈ LC ⇔ f¯ ∈ LC
Per definitionem gilt weiter LR = LC ∩ Ens(R, R). Haben wir nun Erzeuger
f1 , . . . , fr für den C-Vektorraum der komplexwertigen Lösungen gefunden, so

239
erzeugen deren Realteile und Imaginärteile den R-Vektorraum der reellwertigen
Lösungen. In der Tat schreibt sich jede Lösung f als f = c1 f1 + . . . + cr fr mit
cν ∈ C, und ist f reellwertig und schreiben wir cν = aν + ibν mit aν , bν ∈ R und
nehmen auf beiden Seiten den Realteil, so ergibt sich für f die Darstellung

f = a1 Re(f1 ) − b1 Im(f1 ) + . . . + ar Re(fr ) − br Im(fr )

7.3.8 (Gedämpfte Schwingungen mit kleiner Dämpfung). Im Fall der gedämpf-


ten Schwingungen 7.3.1 mit kleiner Dämpfung und folglich komplexen Nullstel-
len ± i ω − a/2 erhalten wir die komplexen Lösungen x± (t) = e−at/2 e± i ωt und
die Eulerformel liefert, daß die Funktionen

x1 (t) = e−at/2 cos ωt und x2 (t) = e−at/2 sin ωt

den Raum der reellwertigen Lösungen aufspannen. Die Größe ω heißt in diesem
Zusammenhang auch die Winkelgeschwindigkeit. Die Additionstheoreme zei-
gen, daß sich jede reelle Linearkombination α sin(ωt) + β cos(ωt) der Funktionen
cos(ωt) und sin(ωt) als Sinuswelle mit Amplitude k und Phase φ in der Form

α sin(ωt) + β cos(ωt) = k sin(ωt + φ)


p
schreiben läßt, für k = α2 + β 2 und φ einer Lösung des Gleichungssystems
k cos φ = α, k sin φ = β. Im Fall kleiner Dämpfung kann die allgemeine Lösung
also geschrieben werden als x(t) = k e−at/2 sin(ωt + φ) und beschreibt eine
Schwingung, deren Amplitude bei positiver Dämpfung a > 0 exponentiell ab-
fällt.
Vorschau 7.3.9. Gegeben A, P ∈ Mat(n; C) mit P invertierbar zeigt man leicht
die Regel exp(P AP −1 ) = P (exp A)P −1 . Die Berechnung des Exponentials einer
beliebigen quadratischen Matrix wird Ihnen auf dieser Grundlage leicht gelingen,
sobald sie in der linearen Algebra die Theorie der „Jordan’schen Normalform“
[LA2] 3.4.5 kennengelernt haben.

Übungen
Übung 7.3.10. Ist A ∈ Mat(n; R) eine reelle Matrix und γ : R → Cn eine
komplexe Lösung der Differentialgleichung γ 0 (t) = Aγ(t), so sind ihr koordina-
tenweise gebildeter Real- und Imaginärteil Re γ und Im γ reelle Lösungen. Er-
zeugt eine Menge Cn -wertiger Funktionen den C-Vektorraum der Cn -wertigen
Lösungen unserer Differentialgleichung, so erzeugen ihre Real- und Imaginärtei-
le zusammen den R-Vektorraum der Rn -wertigen Lösungen.

240
7.4 Differentialgleichungen höherer Ordnung
7.4.1. Die Erfahrungen, die wir bei der Behandlung gedämpfter Schwingungen
gemacht haben, fassen wir nun noch allgemeiner.

Satz 7.4.2. Seien komplexe Zahlen a0 , . . . , an−1 ∈ C gegeben.

1. Die komplexwertigen n-mal differenzierbaren Funktionen f : R → C mit


f (n) +an−1 f (n−1) +. . .+a0 f = 0 bilden einen Untervektorraum im Raum al-
ler Funktionen R → C, den Lösungsraum unserer Differentialgleichung;

2. Die Abbildung f 7→ (f (0), f 0 (0), . . . , f (n−1) (0)) ist ein Isomorphismus die-
ses Lösungsraums mit dem Cn , der Anfangswertisomorphismus;

3. Ist λ ∈ C eine Nullstelle des Polynoms X n + an−1 X n−1 + . . . + a0 der Viel-


fachheit r, so sind die Funktionen eλt , teλt , . . . , tr−1 eλt Lösungen unserer
Differentialgleichung, und durchläuft λ alle Nullstellen unseres Polynoms,
so bilden diese Lösungen eine Basis des Lösungsraums.

Ergänzung 7.4.3. Der Satz bleibt gültig, wenn wir darin R durch ein beliebiges
mehrpunktiges Intervall I ⊂ R ersetzen.
Beweis. Teil 1 ist offensichtlich. Um die in Teil 2 behauptete Existenz und Ein-
deutigkeit zu zeigen beachten wir zunächst, daß unsere Überlegungen aus 7.2.6
ohne Änderungen auch im Komplexen gültig sind. Für eine quadratische Ma-
trix A ∈ Mat(n; C) mit komplexen Einträgen haben also die differenzierbaren
Funktionen g : R → Cn , die die Differentialgleichung g 0 = Ag lösen, die Form
g(t) = (exp tA)g(0) wo wir den Anfangswert g(0) ∈ Cn frei wählen dürfen. Ins-
besondere definiert die Abbildung g 7→ g(0) einen Isomorphismus vom Lösungs-
raum der Differentialgleichung g 0 = Ag mit dem Cn . Jetzt beachten wir, daß die
Vorschrift f 7→ g = (f, f 0 , f 00 , . . . , f (n−1) )> eine Bijektion induziert zwischen
der Menge aller n-mal differenzierbaren Funktionen f : R → C, die die Dif-
ferentialgleichung aus dem Satz erfüllen, und der Menge aller differenzierbaren
Funktionen g : R → Cn , die das System von Differentialgleichungen

g00 = g1
g10 = g2
..
.
0
gn−1 = an−1 gn−1 + . . . a1 g1 + a0 g0

lösen, wo wir etwas ungewöhnlich g = (g0 , . . . , gn−1 ) indiziert haben der besse-
ren Übersichtlichkeit halber. Damit folgt Teil 2 aus 7.2.6.
3. Motiviert durch unsere Erkenntnisse bei der Lösung von 7.3.6 beginnen wir

241
mit dem Ansatz f (t) = eλt für λ ∈ C. Mögliche λ sind dann offensichtlich ge-
nau die Nullstellen des Polynoms X n + an−1 X n−1 + . . . + a1 X + a0 . Ist λ eine
Nullstelle der Vielfachheit r, so sind sogar, wieder in Verallgemeinerung unserer
Erkenntnisse bei der Lösung von 7.3.6, auch teλt , . . . , tr−1 eλt noch Lösungen un-
serer Gleichung. Um das einzusehen, betrachten wir den Vektorraum C ∞ (R) aller
beliebig oft differenzierbaren Funktionen R → C und fassen das Ableiten auf als
eine lineare Abbildung
D : C ∞ (R) → C ∞ (R)
Zerfällt unser Polynom in Linearfaktoren

X n + an−1 X n−1 + . . . + a0 = (X − λ1 )n1 . . . (X − λr )nr

so können wir den Operator Dn + an−1 Dn−1 + . . . + a0 : C ∞ (R) → C ∞ (R)


auch schreiben als Verknüpfung der Operatoren (D − λi )ni , und es reicht folglich
(D − λ)r tr−1 eλt = 0 nachzuweisen. Nun gilt aber offensichtlich

(D − λ)tm eλt = mtm−1 eλt

und die Behauptung folgt per Induktion. Um zu zeigen, daß die tj etλi für 0 ≤ j <
ni eine Basis des Lösungsraums bilden, reicht es deren lineare Unabhängigkeit
nachzuweisen. Beherrscht man die zugehörige lineare Algebra, so erkennt man
leicht, daß die tm eλt jeweils zum Hauptraum Hau(D; λ) gehören und muß we-
gen [LA2] 3.2.7 nur noch die lineare Unabhängigkeit der tm eλt für festes λ und
variables m zeigen, die hinwiederum sofort aus der linearen Unabhängigkeit der
Funktionen tm folgt. Man vergleiche hierzu auch [LA2] 3.2.9.
Beherrscht man die zugehörige lineare Algebra noch Pnicht, so muß man mehr ar-
beiten. Man setzt dann etwa eine Linearkombination cji tj eλi t = 0 an und muß
zeigen, daß alle cji verschwinden. Sonst könnten wir aber nach eventueller Um-
nummerierung der Nullstellen ein k finden mit ck1 6= 0 aber cj1 = 0 für j > k.
Wenden wir dann auf unsere Summe den Differentialoperator

(D − λ1 )k (D − λ2 )N . . . (D − λr )N

an für hinreichend grosses N, so ergibt sich ck1 etλ1 = 0 im Widerspruch zu unse-


rer Annahme ck1 6= 0.

Übungen
Ergänzende Übung 7.4.4. Man bestimme eine Basis des komplexen sowie des
reellen Lösungsraums der Differentialgleichung f 000 = f .

242
7.5 Gekoppelte Schwingungen*
7.5.1. In diesem Abschnitt wird mehr lineare Algebra benötigt, als ich im derzei-
tigen Studienplan voraussetzen kann.
Beispiel 7.5.2. An gegenüberliegenden Wänden eines Zimmers ist jeweils ein
Wägelchen mit einer Feder befestigt und die beiden Wägelchen sind auch un-
tereinander durch eine Feder verbunden. Bezeichnen x(t) beziehungsweise y(t)
die Position des ersten beziehungsweise zweiten Wägelchens auf einer Skala, auf
der x = y = 0 den Gleichgewichtszustand bedeuten und größere x beziehungs-
weise y einen größeren Abstand eines Wägelchens von „seiner“ Wand, so genügt
unser System einer Differentialgleichung

x00 = −ax − b(x + y)


y 00 = −cy − d(y + x)

für Konstanten a, b, c, d > 0, in die die Stärke der Federn und die Massen der
Wägelchen eingehen. Erklären wir v : R → R2 , t 7→ v(t) = (x(t), y(t)) und
betrachten die Matrix
 
−(a + b) −b
A=
−d −(c + d)

so können wir unser System schreiben als

v 00 (t) = Av(t)

Der Leser mag als Übung zeigen, daß der Lösungsraum vierdimensional sein muß.
Unsere Matrix A hat, wie man dem charakteristischen Polynom ansieht, negative
reelle Eigenwerte λ1 , λ2 . Also hat bereits der R2 eine Basis v1 , v2 aus Eigenvek-
toren von A. Dann sind die vier Funktionen
p
t 7→ exp((± λi )t)vi mit i = 1, 2

offensichtlich Lösungen, und ähnliche Argumente wie im vorhergehenden Bei-


√ zeigen, daß sie sogar eine Basis Lösungsraums bilden. Setzen wir ωi =
spiel
−λi , so erhalten wir eine alternative Basis des Lösungsraums durch die vier
Funktionen
cos(tωi )vi und sin(tωi )vi mit i = 1, 2.
Ist noch spezieller unsere Situation symmetrisch unter der Vertauschung der bei-
den Wägelchen, haben sie also dieselbe Masse und sind durch dieselben Federn
mit den Wänden verbunden, so folgt b = d und a = c und wir erhalten v1 = (1, 1)
mit λ1 = −a − 2b sowie v2 = (1, −1) mit λ2 = −a. Diese Eigenvektoren entspre-
chen den zwei Eigenschwingungen des Systems, bei denen beide Wägelchen zu

243
allen Zeiten in derselben beziehungsweise in entgegengesetzten Richtungen fah-
ren. Die Bewegung der einzelnen Wägelchen x(t) = x+ (t) und y(t) = x− (t) wird
dann beschrieben durch

Re c1 ei ω1 t ± c2 ei ω2 t = Re ei(ω1 −ω2 )t/2 c1 ei(ω1 +ω2 )t/2 ± c2 e− i(ω1 +ω2 )t/2


 

mit komplexen ci . Nimmt man hier zum Beispiel c1 = c2 = 1, so ergibt sich die
Lösung
x(t) = 2 cos((ω1 − ω2 )t/2) cos((ω1 + ω2 )t/2)
y(t) = 2 sin((ω1 − ω2 )t/2) sin((ω1 + ω2 )t/2)
Ist die verbindende Feder schwach im Verhältnis zu den Federn gegen die Wände,
in Formeln a  b, so liegen die beiden Eigenwerte λ1 , λ2 und damit auch die Win-
kelgeschwindigkeiten ω1 , ω2 verhältnismäßig nah beieinander. Im Versuch kann
man in diesem Fall schön sehen, wie die beiden Wägelchen mit der Winkelge-
schwindigkeit (ω1 − ω2 )/2 ihre Energie untereinander austauschen.
7.5.3. Im Übrigen ist es auch a priori klar, daß in der symmetrischen Situation
die zweielementige Symmetriegruppe unserer Gleichung, die der Vertauschung
der beiden Wägelchen entspricht, auf dem Lösungsraum operieren muß, daß wir
also uns schon von Anfang an hätten darauf beschränken dürfen, nur die symme-
trischen und die antisymmetrischen Lösungen zu bestimmen und die allgemeine
Lösung als Linearkombination solcher speziellen Lösungen zu erhalten.

7.6 Angeregte Schwingungen


7.6.1. Ist A eine komplexe (n × n)-Matrix und ist zusätzlich eine stetige Funktion
f : R → Cn vorgegeben und man sucht alle differenzierbaren γ : R → Cn , die
das „inhomogene“ System von Differentialgleichungen

γ 0 (t) = Aγ(t) + f (t)

lösen, so rät einem die Methode der Variation der Konstanten zum Ansatz

γ(t) = exp(tA)g(t)

Man erkennt leicht, daß dieser Ansatz eine Lösung liefert, wenn g : R → Cn
differenzierbar ist und die Gleichung f (t) = exp(tA)g 0 (t) erfüllt, als da heißt für
Z t
g(t) = exp(−τ A)f (τ ) dτ

Hier ist g(t) als unbestimmes Integral nur bis auf eine additive Konstante aus dem
Cn wohldefiniert. Daß wir mit diesem Verfahren tatsächlich auch alle Lösungen

244
γ(t) unseres inhomogenen Systems von Differentialgleichungen erhalten ergibt
sich daraus, daß ja ganz offensichtlich die Differenz von je zwei Lösungen unserer
inhomogenen Gleichung eine Lösung der homogenen Gleichung γ 0 = Aγ(t) sein
muß. In der Sprache der linearen Algebra bilden die Lösungen der inhomogenen
Gleichung also einen affinen Teilraum des Raums aller Funktionen, dessen Raum
von Richtungsvektoren der Lösungsraum der homogenen Gleichung ist.
Beispiel 7.6.2 (Angeregte Schwingungen). Eine Lampe ist mit einer Feder an
einer vibrierenden Decke aufgehängt. Sei h(t) die Auslenkung der Decke zur Zeit
t und x(t) die Höhe der Lampe zur Zeit t, beide gemessen auf einer gegen den
Boden festen Skala, auf der h = x = 0 einen Zustand beschreibt, in dem sich die
Federkraft, die die Lampe zur Decke zieht, und die Schwerkraft der Lampe die
Waage halten. So genügt x(t) einer Differentialgleichung der Gestalt

x00 (t) = −a(x(t) − h(t))

Hierbei ist a positiv und hängt von der Masse der Lampe und der Federkonstante
ab. Wir schreiben das um zu einem System erster Ordnung

γ00 = γ1
γ10 = −aγ0 + ah

oder in Matrixschreibweise
   
0 0 1 0
γ = γ+
−a 0 ah

Das charakteristische Polynom√unserer Matrix A ist X 2 + a, die Eigenwerte er-


geben sich zu ± i η für η = a und als zugehörige Eigenvektoren finden wir
(1, ± i η)> . Wir nehmen diese Eigenvektoren als Spalten einer Matrix
 
1 1
P :=
−iη iη

So haben wir offensichtlich AP = P B alias P −1 AP = B mit B = diag(− i η, i η)


einer Diagonalmatrix und ϕ := P −1 γ erfüllt die Differentialgleichung ϕ0 (t) =
Bϕ(t) + f (t) mit
      
−1 0 1 i η −1 0 ah(t) −1
f (t) = P = =
ah(t) 2iη iη 1 ah(t) 2iη 1

Ich betrachte von nun an diese Differentialgleichung, da es mir übersichtlicher


scheint, mit exp tB anstelle von exp tA = P (exp tB)P −1 zu hantieren. Nach

245
unseren Überlegungen 7.6.1 lautet die allgemeine Lösung dieser Differentialglei-
chung Z t
ϕ(t) = exp(tB)g(t) mit g(t) = exp(−τ B)f (τ ) dτ

Nehmen wir zum Beispiel an, unsere Decke vibriere mit h(t) = k sin(ωt) für
ω > 0, so ergibt sich die erste Komponente g1 (t) von g(t) zu
Rt  i τω − i τω 
g1 (t) = − 2kai η ei τ η e −e 2i

R t i τ (η+ω) R t i τ (η−ω)
= ka4η
e dτ − ka 4η
e dτ
ka
(
4 i η(η−ω)
ei t(η−ω) falls η 6= ω;
ka i t(η+ω)
= konst + 4 i η(η+ω) e − ka

t falls η = ω.

Ähnlich berechnen wir g2 (t) und erkennen, daß in dem Fall, daß die Eigenfre-
quenz der Lampe nahe an der Frequenz der Decke ist, also für |η − ω| klein, die
Schwingung sehr groß werden kann und im Fall η = ω die Auslenkung even-
tuell sogar gegen Unendlich strebt. In der Physik spricht man in diesen Fällen
von Resonanz beziehungsweise von einer Resonanzkatastrophe. Seien nun die
Eigenschwingung unseres Systems t 7→ ei tη und die Anregung t 7→ h(t) oder
gleichbedeutend t 7→ f (t) periodisch mit derselben Periode. Nehmen wir der
Einfachkeit halber p = 2π an, so finden wir η ∈ Z, undR entwickeln wir f in
t
eine „Fourierreihe“, so zeigt unsere obige Formel g(t) = exp(−τ B)f (τ ) dτ,
± i tη
daß nur die Summanden c±η e für die Resonanz verantwortlich sind in dem
Sinne, daß alle anderen Summanden der Fourierreihe nur periodische Beiträge
zu g(t) liefern. Später in [AN3] 3.1.2 folgende werden Sie lernen, daß g1 (t) im
allgemeinen bis auf eine Konstante auch interpretiert werden kann als der „Wert
bei −η der Fouriertransformierten des Produkts von f1 mit der charakteristischen
Funktion des Intervalls [0, t]“.

246
8 Danksagung
Dieser Text hat sich über lange Jahre aus meiner Auseinandersetzung mit der
Lehrbuchliteratur im Rahmen meiner Vorlesungstätigkeit entwickelt. Besonders
prägend waren die Einflüsse von Forster [For92], Königsberger [Kön97], Lang
[Lan68], Rudin [Rud76], Bröcker [Brö95], Courant [Cou71] und Dieudonné [Die03].
Für Korrekturen und Verbesserungen danke ich Christina Pflanz, Olaf Schnürer,
...

247
9 Tagebuch WS 22/23
Es handelte sich um eine vierstündige Vorlesung Analysis 1, also 4×45 Minuten
Vorlesung, mit 2 Stunden Übungen.

18.10 Vollständige Induktion und bimonische Formel 1.1.1. Mengen 1.2. Leere
Menge noch nicht eingeführt.

19.10 Kardinalität. Leere Menge. Teilmengen 1.2.9. Potenzmenge. Mengenopera-


tionen 1.3. Abbildungen 1.4. Identität, Konstanten und konstante Abbildun-
gen.

25.10 Injektiv, surjektiv, bijektiv. Verknüpfung von Abbildungen 1.4.9. Umkehr-


abbildung. Mengen mit Verknüpfung 1.5. Assoziativ, kommutativ, neutrales
Element, Monoid. Iterierte Verknüpfung, Regeln. Invertierbare Elemente,
Gruppe, negativ iterierte Verknüpfung, Regeln.

26.10 Homomorphismen. Körper im Sinne der Algebra 1.6. Morphismus (Z, +, ·)


zu jedem Körper. Das noch fertig diskutieren. Noch nicht: Homomorphis-
men oder Isomorphismen von Körpern.

2.11 Homomorphismen von Körpern und Ringen. Der eindeutige Ringhomo-


morphismus von Z in einen beliebigen Ring. Rationale Wurzeln 2.1.1. Ord-
nungen und Teilordnungen 2.3, angeordnete Ringe und Körper, Supremum
und Infimum, Charakterisierung der reelen Zahlen. Noch nicht Isomorphis-
men von Körpern oder Ringen. Noch nicht Intervall.

8.11 Die reellen Zahlen 2.4, Konstruktion und Eindeutigkeit. Noch nicht: Ratio-
nale und reelle Zahlen im Vergleich 2.5.

9.11 Kurze Diskussion der Eindeutigkeit von R. Rationale und reelle Zahlen im
Vergleich 2.5. Intervalle und Umgebungen 3.2. Beginn der Diskussion der
Stetigkeit 3.1. Stetigkeit der Addition bisher nur graphisch.

15.11 Stetigkeit der Addition nochmal formal. Konstante Funktionen sind stetig,
Einbettungen sind stetig. Stetig meint stetig bei jedem Punkt. Stetigkeit von
Multiplikation, Verknüpfung. Komponentenweise Stetigkeit. Zwischendrin
Anschauung für Abbildungen Rm → Rn . Folgerungen. Im wesentlichen
Abschnitt 3.1. Epsilon-Delta-Charakterisierung der Stetigkeit.

16.11 Lokalität der Stetigkeit. Zwischenwertsatz 3.3.8. Stetigkeit monotoner Sur-


jektionen auf Intervalle 3.3.2. Umkehrfunktionen, Wurzeln. Kreiszahl 3.4.1.

248
22.11 Grenzwerte 3.5. Häufungspunkte, Eindeutigkeit sttiger Fortsetzung, Defini-
tion des Grenzwerts, Charakterisierung für Folgenkonvergenz, auch ε-N -
Kriterium. Lokalität, Vertauschen mit Anwenden stetiger Funktionen, spe-
ziell auch für Folgen. Konvergenz von Teilfolgen.

23.11 Grenzwert als komponentenweiser Grenzwert, Grenzwerte fertig 3.5. Bis


Bolzano-Weierstraß 3.6.6.

29.11 Konvergenz von Reihen 4.1. Absolute Konvergenz. Cauchy-Folgen und de-
ren Konvergenz. Majorantenkriterium, Quotientenkriterium, Konvergenz der
Exponentialreihe. Umordnungssatz.

30.11 Wachstum und Zerfall 4.2. Logarithmus und allgemeine Potenzen 4.3.

6.12 Komplexe Zahlen 4.4 und komplexe Exponentialfunktion 4.5.

7.12 Stetige Gruppenwege in der Kreisgruppe. Trigonometrische Funktionen 4.5.

13.12 Nocheinmal Grenzwerte und Stetigkeit wiederholen. Quader 3.2.19 ein-


führen. Epsilon-Delta-Kriterium 3.2.21 beweisen. Folgenkonvergenzkrite-
rium 3.5.13 beweisen. Zeit lassen. Stetige Funktionen auf Kompakta 5.1.
Fundamentalsatz der Algebra.

14.12 Gleichmäßige Stetigkeit auf Kompakta. Integration stetiger Funktionen 5.2.

20.12 Ableitung 5.3. Ableitungsregeln 5.4. Lemma 5.4.15 weggelassen, das die
Existenz einer beliebig differenzierbaren zeigt, die Null ist für x ≤ 0 und
positiv für x > 0. Ableitung des Arcussinus besprochen, Ableitung des
Arcustangens weggelassen.

21.12 Differenzierbarkeit von Umkehrfunktion 5.4.11 bewiesen. Folgerungen aus


Eigenschaften der Ableitung 5.5. Brechungsgesetz weggelassen.

10.1 Hospital 5.6.1. Hauptsatz der Differential- und Integralrechnung 5.7.1. Sub-
stitutionsregel, erste Beispiele.

R √der Irrationalität von π weggelassen. Hy-


11.1 Partielle Integration 5.8. Beweis
perbolischeR Funktionen 5.9. 1 + t2 . Integration rationaler Funktionen
R
begonnen. 1/(1 − t2 ). Integral 1/(1 + t2 ) noch unfertig.

17.1 Integration rationaler Funktionen 5.10, Zugang über komplexe Partialbruch-


entwicklung. Integration rationaler Ausdrücke in anderen Funktionenpaaren
weggelassen. Potenzreihen und Konvergenzradius. Punktweise und gleich-
mäßige Konvergenz. Gleichmäßige Konvergenz bei Potenzreihen noch nicht
fertig diskutiert 6.1.

249
18.1 Gleichmäßige Konvergenz bei Potenzreihen fertig diskutiert. Gliedweise
Ableitung und Integration von Potenzreihen 6.1. Binomische Reihe. Bei-
spiele. Noch nicht Beispiel mit Berechnung höherer Ableitungen.

24.1 Beispiel mit Berechnung höherer Ableitungen. Taylorreihe 6.2 und ihre
Restglieder.

25.1 Rechnen mit Approximationen 6.3. Abelscher Grenzwertsatz 6.4. Bogen-


länge und Geschwindigkeit 7.1.2 begonnen. Geschwindigkeitsvektor einge-
führt. Bogenlänge eingeführt. Bogenlänge als Integral der Geschwindigkeit.
Noch nicht Unabhängigkeit der Bogenlänge von der Parametrisierung.

31.1 Schrankensatz. Bogenlänge als Integral der Geschwindigkeit mit Beweis.


Hängende Kette.

1.2 Systeme von linearen Differentialgleichungen. Schwingungsgleichung und


ihr Lösung. Noch nicht der Fall einer mehrfachen Nullstelle.

7.2 Differentialgleichungen höherer Ordnung 7.4.2. Methode der Variation der


Konstanten 7.6.1. Resonanzkatastrophe.

8.2 Axiomatik der euklidischen Ebene, fasteuklidische Ebenen, hyperbolische


Ebene [EL] 1.1.1 folgende. Nicht prüfungsrelevant. Kontrastiert die „klassi-
sche Axiomatik“ des Euklid, in der die Ebene durch geometrisch sinnvolle
Axiome modelliert wird, mit der „modernen Axiomatik“, in der die Zahlen-
gerade durch algebraisch sinnvolle Axiome modelliert wird.

250
Literatur
[AL] Skriptum Algebra und Zahlentheorie. Wolfgang Soergel.

[AN2] Skriptum Analysis 2. Wolfgang Soergel.

[AN3] Skriptum Analysis 3. Wolfgang Soergel.

[Brö95] Theodor Bröcker. Analysis 1 und 2. Spektrum, 1995.

[Cou71] Richard Courant. Vorlesungen über Differential- und Integralrechnung.


Springer, 1971.

[Die03] Jean Dieudonné. Éléments d’Analyse. Jacques Gabay, 2003.

[EIN] Skriptum Einstimmung. Wolfgang Soergel.

[EL] Skriptum Elementargeometrie. Wolfgang Soergel.

[For92] Otto Forster. Analysis 1-3. Aufbaukurs Mathematik. Vieweg, 1992.

[FT1] Skriptum Funktionentheorie 1. Wolfgang Soergel.

[GR] Skriptum Grundlagen. Wolfgang Soergel.

[KAG] Skriptum Kommutative Algebra und Geometrie. Wolfgang Soergel.

[Kön97] Königsberger. Analysis 1 und 2. Springer, 1997.

[LA1] Skriptum Lineare Algebra 1. Wolfgang Soergel.

[LA2] Skriptum Lineare Algebra 2. Wolfgang Soergel.

[Lan68] Serge Lang. Analysis 1. Addison-Wesley, 1968.

[Lor96] Falko Lorenz. Einführung in die Algebra I. Spektrum, 1996.

[Rud76] Walter Rudin. Principles of Mathematical Analysis. McGraw-Hill,


1976.

[Ste89] Ian Steward. Galois Theory. Chapman and Hall, second edition, 1989.

[TM] Skriptum Topologie und kompakte Gruppen. Wolfgang Soergel.

251
Indexvorwort
Hier werden die Konventionen zum Index erläutert. Kursive Einträge bedeuten,
daß ich die fragliche Terminologie oder Notation in der Literatur gefunden habe,
sie aber selbst nicht verwende. Bei den Symbolen habe ich versucht, sie am An-
fang des Index mehr oder weniger sinnvoll gruppiert aufzulisten. Wenn sie von
ihrer Gestalt her einem Buchstaben ähneln, wie etwa das ∪ dem Buchstaben u
oder das ⊂ dem c, so liste ich sie zusätzlich auch noch unter diesem Buchstaben
auf. Griechische Buchstaben führe ich unter den ihnen am ehesten entsprechenden
deutschen Buchstaben auf, etwa ζ unter z und ω unter o.

252
Index
f : X ⊃ D → Y , 68 von Abbildungen, 27
0 neutrales Element für +, 33 − Differenz von Mengen, 18
0M im Fall von (M, +), 33 ak Potenz, 10
natürliche Zahl, 33 ax allgemeine Potenz, 117
1 neutrales Element für ·, 33 ≥,
Q >, ≤, < bei Ordnungsrelation, 45
1M im Fall von (M, ·), 33 Produkt
natürliche Zahl, 33 P von Zahlen, 8
| Notation bei Teilmengen, 16 Summe
¬ Verneinung, 37 von Zahlen, 7
Beweisende, 5 ∩ Schnitt, 18
]√Kardinalität, 15 ⊂ Teilmenge, 19
x Wurzel, 80 ∪ Vereinigung, 18
n! Fakultät, 8 ×
f 0 Ableitung, 157 kartesisches Produkt, 18
∅ leere Menge, 14 (x|y) Notation für Paare, 19
∈ Element von, 14 G(x)|ba := G(b) − G(a), 180
6∈ nicht Element von, 14 f |X Einschränkung auf X, 27
X\Y Differenz von Mengen, 18 f |X Einschränkung auf X, 27
X\p Komplement des Punktes p, 83
,→ Injektion, 26 Abbildung, 24
7→ wird abgebildet auf, 25 identische, 25
→ Abbildung, 24 inverse, 28

→ Bijektion, 26 Umkehrabbildung, 28
 Surjektion, 26 Abel’scher Grenzwertsatz, 220
{ } Mengenklammern, 14 abelsch
| | Absolutbetrag, 47 Gruppe, 34
| | Kardinalität, 15 Verknüpfung, 33
(x|y) Ableitung
n
 Notation für Paare, 19 n-te Ableitung, 207
k
Binomialkoeffizient, 9
f 0 Ableitung, 157 allgemeiner Potenzen, 163
X 2 = X × X, 18 als Funktion, 161
z̄ komplexe Konjugation, 43 bei fester Stelle, 157
f −1 Kehrwertfunktion, 78 Exponentialfunktion, 162
f −1 Umkehrabbildung, 28 linksseitige, rechtsseitige, 160
= Gleichheitszeichen, 14 Logarithmus, 163
= : wird definiert als, 7 vektorwertige, 222
:= ist definiert durch, 7 von Brüchen, reell, 162
◦ Verknüpfung von Umkehrfunktion

253
reell, 163 beschränkt
absolut konvergente Reihe, 104 Menge reeller Zahlen, 95
Absolutbetrag, 47 bestimmte Divergenz, 88
abzählbar, 61 Betrag, 47
abzählbar unendlich, 61 Bijektion, 26
Additionsformeln bijektiv
für sin und cos, 134 Abbildung, 26
äquidistante Unterteilung, 151 Bild, 24
algebraisch binärer Logarithmus, 119
reelle Zahl, 81 Binom, 72
allgemeine Potenzen, 117 Binomialkoeffizienten, 9
alternierende harmonische Reihe, 104 binomische Formel, 10
Amplitude, 240 Binomische Reihe, 209
analytisch Bogenlänge, 222
auf R, 211 parametrisiert nach, 232
Anfangswertisomorphismus, 236, 241 Bolzano-Weierstraß, 97
bei reeller Schwingungsgleichung, Brechungsgesetz, 167
237 Bruchzahlen, 14
bei Schwingungsgleichung, 239
angeordnet Cantor’sches Diagonalverfahren, 61
Ring, 46 card, 15
Anordnung, 45 Catalan-Zahlen
antisymmetrisch Herleitung der Formel, 218
Relation, 45 Cauchy-Folge, 97
Approximationspolynom, 212 continue, 68
arccot Arcuscotangens, 135 continuous, 68
archimedisch cos Cosinus
angeordnet, 57 komplexer, 139
arctan Arcustangens, 135 Cosecans, 134
Arcuscosinus, 134 Cosecans hyperbolicus, 191
Arcuscotangens, 135 cosh Cosinus hyperbolicus, 191
Arcussinus, 135 Cosinus, 131
Arcustangens, 135 Cosinus hyperbolicus, 191
Area Cosinus hyperbolicus, 191 Cotangens, 135
Area Sinus hyperbolicus, 191 de Morgan’sche Regeln, 20
arithmetisches Mittel, 98 Dedekind’scher Schnitt, 54
assoziativ, 31 Definition, 7
Auswerten, 24 Definitionsbereich, 25
Bel, 121 Dezibel, 121
Bernoulli-Ungleichung, 49 Differenz

254
von Mengen, 18 Fakultät, 8
differenzierbar Familie, 86
in einer Veränderlichen, 157 fast alle
reell-komplex, 199 Menge, 88
vektorwertige Funktion, 222 Folge, 86
disjunkt, 19 geometrische, 102
Distributivgesetz Fresnel’sches Prinzip, 167
bei Ring, 38 Fundamentalsatz der Algebra, 145
Dreiecksungleichung Funktion, 64
für Absolutbetrag eines angeord- gebrochenrationale, 77
neten Körpers, 48 rationale, 77
für komplexen Absolutbetrag, 125 Umkehrfunktion, 28
Durchschnitt Funktionalgleichung
zweier Mengen, 18 des Logarithmus, 115

ebene Quadriken, 194 Γ(f ) Graph von f , 24


echt ganze Zahlen, 14
Teilmenge, 15 Gedämpfte Schwingungen, 237
Eigenschwingungen, 243 geometrische Folge, 102
Einbettung Geometrische Reihe, 101
einer Teilmenge, 27 geometrisches Mittel, 98
Einheitswurzel gerade
in C, 139 Funktion, 188
Eins-Element, 33 Geschwindigkeit
Einschränkung, 27 absolute, 222
Einsetzen, 24 gleichmäßig stetig
Element, 13 reelle Funktion einer Variablen, 146
Ellipse, 194 Graph
endlich einer Abbildung, 24
Menge, 15 Grenzwert
erweiterte reelle Zahlen, 66 linksseitiger Grenzwert, 93
erzeugende Funktion rechtsseitiger Grenzwert, 93
der Catalan-Zahlen, 218 von Folge, 88
Euler, 104 von Funktion, 85
Euler’sche Gleichung, 131 größtes Element, 49
Euler’sche Zahl, 109 Gruppe, 34
Exponentialfunktion, 108 Gruppenhommorphismus, 36
Extrema Gruppenweg
bei einer Veränderlichen, 171 in R, 92
in R× , 119
Faktoren, 8
Häufungspunkt, 83

255
halboffen in Monoid, 34
Teilmenge von R, 157 Inversion, 126
Halbordnung, 45 invertierbar, 34
harmonische Reihe, 102 isolierter Punkt, 83
Hauptzweig des Logarithmus, 197 isoliertes lokales Maximum, 171
Hermite-Lindemann, 139 isoliertes lokales Minimum, 171
Hilbert’sche Probleme, 63
Nummer 1, 63 Jensen’sche Ungleichung
Nummer 8, 104 diskrete, 49
holomorph, 198 Kardinalität, 15
Hospital, Regeln von, 175 kartesisch
Hyperbel, 194 Produkt
id, 25 von zwei Mengen, 18
Identität, 25 Kegel
Imaginärteil im R3 , 194
bei komplexen Zahlen, 123 Kegelschnitt, 194
Induktion, vollständige, 5 Kettenlinie, 191
Induktionsannahme, 5 Kettenregel
Induktionsbasis, 5 höhere, 216
Induktionsschritt, 5 in einer Veränderlichen
Induktionsvoraussetzung, 5 reell, 161
inf, Infimum, 51 kleines o von xn , 216
Infimum, 51 kleinstes
Injektion, 26 Element, 49
injektiv Körper, 38
Abbildung, 26 kommutativ
Inklusion, 27 Verknüpfung, 33
Integral kompakt
stetige reelle Funktion Intervall in R̄, 67
über kompaktes Intervall, 149 Teilmenge von R̄n , 144
Integrallogarithmus, 182 Kompaktum, 144
Integration Komplement, 18
partielle, 186 Komplementmenge, 18
integrierbar komplexe Exponentialfunktion, 127
Riemann-integrierbar, 157 komplexe Konjugation, 43
Intervall, 66 komplexe Zahlen, 43
mehrpunktiges, 67 konjugierte komplexe Zahl, 125
Intervallschachtelungsprinzip, 98 konkave Funktion, 171
Intervallumgebung, 67 konstante Abbildung, 26
invers Kontinuumshypothese, 63

256
konvergent von Folge, 88
reelle Reihe, 101 von Funktion, 85
Konvergenz ln logarithmus naturalis, 117
gleichmäßige Lösungsraum
reeller Funktionen, 203 einer linearen Diferentialgleichung,
punktweise 241
reeller Funktionen, 203 einer Schwingungsgleichung, 237,
von Folgen 238
in R̄d , 86 lineare Differentialgleichung
von reellen Reihen, 101 konstante Koeffizienten, 236
Konvergenzradius log Logarithmus, 115
im Reellen, 202 logarithme népérien, 115
konvex Logarithmus
Funktion, 49, 74, 171 binärer, 119
in Rn , 225 Hauptzweig des komplexen, 197
Korrespondenz, 45 natürlicher, 115
Kreisgruppe, 126
Kring Mächtigkeit, 15
angeordneter, 46 Magma, 29
Kringanordnung, 46 Magmahommorphismus, 36
Kurvenintegral, 232 Majorante, 105
Majorantenkriterium, 105
L(γ) Länge eines Weges, 222 max, 46
Länge, 222 maximal
eines Weges, 222 Element, 49
Laufindex, 7 Maximum, 171
lb, 119 mehrpunktiges Intervall, 67
leer Menge, 13
Familie, 86 leere Menge, 14
Menge, 14 Potenzmenge, 16
Leibniz’sches Konvergenzkriterium, 107 Teilmenge, 15
Leibniz-Regel Mengenklammern, 14
für reelle Funktionen, 161 min, 31
lg = log10 , 117 min, 46
limn→∞ Grenzwert von Folge minimales
in R̄d , 88 Element, 49
limx%p linksseitiger Grenzwert, 93 Minimum, 171
limx&p rechtsseitiger Grenzwert, 93 Mittelwertsatz, 169
limx→p Grenzwert von Abbildung der Integralrechnung, 157
von Teilmengen von R̄n , 85 in mehreren Veränderlichen, 227
Limes verallgemeinerter, 177

257
Monoid, 33 angeordnetes, 18
additiv notiertes, 33 Parabel, 194
multiplikativ notiertes, 33 Partialsumme, 101
Monoidhommorphismus, 36 partiell
Monom, 72 Integration, 186
monoton, 74 Ordnung, 45
Multinomialkoeffizient, 29 Pascal’sches Dreieck, 11
Phase, 240
N natürliche Zahlen, 14 phytagoreische Zahlentripel, 189
N0 , 14 Poisson-Verteilung, 114
népérien, logarithme, 115 Polynomfunktion, 72
Nachschalten von Abbildung, 27 poset, 45
natürliche Zahlen, 14 positiv, 46
negativ, 46 Pot(X) Potenzmenge, 16
Negatives, 35 Potenzmenge, 16
neutrales Element, 33 Potenzreihe, 202
Newton-Verfahren, 100 prX
nichtnegativ, 46 Projektion, 26
nichtpositiv, 46 Produkt
Norm von Reihen, 112, 114
einer komplexen Zahl, 123 Produktregel
Null-Element, 33 für reelle Funktionen, 161
Nullfolge, 88 Projektion
Obersumme, 153 bei zwei Mengen, 26
offen Punkt, 13
in R, 165 Q rationale Zahlen, 14
in Rn , 225 Quaderumgebung
in der komplexen Zahlenebene, 198 in R̄n , 67
reelles Intervall, 67 Quotientenkriterium, 105
Ordnung, 45 Quotientenregel, 162
für Teilordnung, 45
lineare, 45 R reelle Zahlen, 57
partielle, 45 rad
totale, 45 Radian, 133
Ordnungsrelation, 45 rationale Zahlen, 14
Raum, 13
π Kreiszahl, 80 Realteil
P(X)
Q Potenzmenge, 16 bei komplexen Zahlen, 123
Produkt reell konvergent, 88
von Zahlen, 8 reelle Zahl, 57
Paar

258
reflexiv sin Sinus
Relation, 45 komplexer, 139
Regeln von de l’Hospital, 175 sinh Sinus hyperbolicus, 191
Reihenglieder, 101 Sinus, 131
Relation Sinus hyperbolicus, 191
auf einer Menge, 45 Skalarproduktnorm, 222
mehrstellige, 45 Stammfunktion, 180
zwischen zwei Mengen, 45 Steigung, 157
Resonanz, 246 stetig
Resonanzkatastrophe, 246 gleichmäßig
Restglied reelle Funktion, 146
Integraldarstellung, 214 stimmen überein bis zur Ordnung, 216
Lagrange’sche Form, 214 Substitutionsregel, 182
Riemann Summanden, 7
ζ-Funktion, 104 Summenregel, 161
Riemann’sche Vermutung, 104 summierbar
Riemann-integrierbar, 157 Familie reeller Zahlen, 106
Riemannsumme sup, Supremum, 51
für reelle Funktion, 151, 155 Supremum, 51
Ring, 38 Surjektion, 26
Ringhomomorphismus, 41 surjektiv
Rolle, 167 Abbildung, 26
Russell’sches Paradoxon, 23
Tangens, 135
1
RS Einheitskreis, 126 Tangens hyperbolicus, 191
PIntegral, 149 Tangente, 159, 212
P Reihe, 101 Tauber-Bedingung, 221
Summe Taylorentwicklung
von Zahlen, 7 in einer Veränderlichen, 212
Schmiegeparabel, 212 Taylorreihe
Schnitt in einer Veränderlichen, 208, 210
zweier Mengen, 18 Teilfolge, 90
Schranke Teilmenge, 15
größte untere, 51 echte, 15
kleinste obere, 51 Teilordnung, 45
obere, 51 Teleskopsumme, 101
untere, 51 Totalität
Schrankensatz, 225 für Relation, 45
Secans, 134 transitiv
Secans hyperbolicus, 191 Relation, 45
Sekante, 157 transzendent

259
reelle Zahl, 81 ganze, 14
Trigonometrie, 133 natürliche, 14
rationale, 14
überabzählbar, 61 reelle, 57
Umgebung Zwischenwertsatz, 77
eines Punktes von R̄n , 69
Umkehrfunktion, 28
Umordnungssatz, 105
unbestimmt divergent, 88
unendlicher Dezimalausdruck, 58
ungerade
Funktion, 188
Untersumme, 153
Unterteilung
von Intervall, 155

van-de-Ven-Diagramm, 19
Variation der Konstanten, 244
verallgemeinerter Mittelwertsatz, 177
Vereinigung, 18
Verknüpfung
auf einer Menge, 29
von Abbildungen, 27
Verknüpfungstafel, 30
vollständig
angeordneter Körper, 97
Vorschalten von Abbildung, 27

Wahrheitstafel, 31
Wert, 24
Wertebereich, 25
Winkelgeschwindigkeit, 240
Wurzel
n-te Wurzel, 78
Wurzelkriterium, 120

Young’sche Ungleichung, 175

Z ganze Zahlen, 14
ζ-Funktion
Riemann’sche, 104
Zahl

260

Das könnte Ihnen auch gefallen