XXAN1
XXAN1
Wolfgang Soergel
4 Exponentialfunktion 101
4.1 Konvergenz von Reihen . . . . . . . . . . . . . . . . . . . . . . . 101
4.2 Wachstum und Zerfall . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3 Logarithmus und allgemeine Potenzen . . . . . . . . . . . . . . . 115
4.4 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.5 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . 127
2
5.8 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.9 Hyperbolische trigonometrische Funktionen . . . . . . . . . . . . 191
5.10 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . 196
8 Danksagung 247
Literaturverzeichnis 251
Indexvorwort 252
Index 253
3
Dies ist der erste Teil eines Skriptums zur Analysis. Ich habe mir große Mühe
gegeben, an jeder Stelle nur soviel Begrifflichkeit einzuführen, wie gerade eben
nötig ist, um einerseits einen glatten und transparenten Fluß der Argumentation zu
ermöglichen und andererseits regelmäßig motivierende Anwendungen geben zu
können. Sowohl die Anwendungen als auch der durchsichtige Aufbau der Theorie
erfordern jedoch in meinen Augen eine nach Möglichkeit koordinatenfreie Dar-
stellung und damit den Aufbau der zugehörigen Begrifflichkeit, so daß am Schluß
im Vergleich zu anderen Texten doch eher mehr abstrakte Konzepte eingeführt
werden. Wie Sie noch an verschiedenen Stellen merken werden, will ich Sie eben
am liebsten davon überzeugen, daß das Abstrakte das eigentlich Konkrete ist!
4
1 Grundlegendes
1.1 Vollständige Induktion und binomische Formel
n(n+1)
Satz 1.1.1. Für jede natürliche Zahl n ≥ 1 gilt 1 + 2 + . . . + n = 2
.
Beispiel 1.1.2. Im Fall n = 5 behauptet unser Satz 1 + 2 + 3 + 4 + 5 = 5 × 6/2
und in diesem Fall stimmt das schon mal: Beide Seiten sind 15. Man bemerke, daß
wir beim Rechnen mit Symbolen wie etwa n(n + 1) die Multiplikationssymbole
weggelassen haben, die nur beim Rechnen mit durch Ziffern dargestellten Zahlen
wichtig sind.
Beweis. Bei diesem Beweis sollen Sie gleichzeitig das Beweisprinzip der voll-
ständigen Induktion lernen. Wir bezeichnen mit A(n) die Aussage, daß die For-
mel im Satz für ein gegebenes n gilt, und zeigen:
1(1+1)
Induktionsbasis: Die Aussage A(1) ist richtig. In der Tat gilt 1 = 2
.
Induktionsschritt: Aus der Aussage A(n) folgt die Aussage A(n + 1). In der
Tat, unter der Annahme, daß unsere Formel für ein gegebenes n gilt, der so-
genannten Induktionsannahme oder Induktionsvoraussetzung, rechnen
wir
1 + 2 + . . . + n + (n + 1) = n(n+1)
2
+ 2(n+1)
2
(n+2)(n+1)
= 2
(n+1)((n+1)+1)
= 2
und folgern so, daß die Formel auch für n + 1 gilt.
Es ist damit klar, daß unsere Aussage A(n) richtig ist alias daß unsere Formel gilt
für alle n = 1, 2, 3, . . .
1.1.3. Das Zeichen deutet in diesem Text das Ende eines Beweises an und ist in
der neueren Literatur weit verbreitet. Buchstaben in Formeln werden in der Ma-
thematik üblicherweise kursiv notiert, so wie etwa das n oder auch das A im vor-
hergehenden Beweis. Nur Buchstaben oder Buchstabenkombinationen, die stets
dasselbe bedeuten sollen, schreibt man nicht kursiv, wie etwa sin für den Sinus
oder log für den Logarithmus.
1.1.4. Der vorhergehende Beweis stützt sich auf unser intuitives Verständnis der
natürlichen Zahlen. Man kann das Konzept der natürlichen Zahlen auch formal
einführen und so die natürlichen Zahlen in gewisser Weise „besser“ verstehen.
Das wird in [GR] 1.6.11 und ausführlicher in [LA1] 4.1.6 diskutiert. Das Wort
„Induktion“ meint eigentlich „Hervorrufen“, so wie etwa das Betrachten einer
Wurst die Ausschüttung von Spucke induziert alias uns den Mund wässrig macht.
5
Im Zusammenhang der vollständigen Induktion ist es dahingehend zu verstehen,
daß die Richtigkeit unserer Aussage A(1) die Richtigkeit von A(2) induziert, die
Richtigkeit von A(2) hinwiederum die Richtigkeit von A(3), die Richtigkeit von
A(3) die Richtigkeit von A(4), und immer so weiter.
1.1.5. Es herrscht keine Einigkeit in der Frage, ob man die Null eine natürliche
Zahl nennen soll. In diesem Text ist stets die Null mit gemeint, wenn von natürli-
chen Zahlen die Rede ist. Wollen wir die Null dennoch ausschließen, so sprechen
wir wie oben von einer „natürlichen Zahl n ≥ 1“.
1.1.6. Ich will kurz begründen, warum es mir natürlich scheint, auch die Null eine
natürliche Zahl zu nennen: Hat bildlich gesprochen jedes Kind einer Klasse einen
Korb mit Äpfeln vor sich und soll seine Äpfel zählen, so kann es ja durchaus vor-
kommen, daß in seinem Korb gar kein Apfel liegt, weil es zum Beispiel alle seine
Äpfel bereits gegessen hat. In der Begrifflichkeit der Mengenlehre ausgedrückt,
die wir in 1.2 einführen werden, muß man die leere Menge endlich nennen, wenn
man erreichen will, daß jede Teilmenge einer endlichen Menge wieder endlich ist.
Will man dann zusätzlich erreichen, daß die Kardinalität jeder endlichen Menge
eine natürliche Zahl ist, so darf man die Null nicht aus den natürlichen Zahlen
herauslassen.
1.1.7. Man kann sich den Satz wie im Bild angedeutet anschaulich klar machen
als eine Formel für die Fläche des Querschnitts durch eine Treppe der Länge n mit
Stufenabstand und Stufenhöhe Eins. In der Tat bedeckt ein derartiger Querschnitt
ja offensichtlich ein halbes Quadrat der Kantenlänge n nebst n halben Quadraten
6
der Kantenlänge Eins. Ein weiterer Beweis geht so:
= n(n + 1)/2
1.1.9 (Zur Sprache in der Mathematik). Das Wort „Definition“ kommt aus dem
Lateinischen und bedeutet „Abgrenzung“. In Definitionen versuchen wir, die Be-
deutung von Symbolen und Begriffen so klar wie möglich festzulegen. Sie werden
merken, daß man in der Mathematik die Angwohnheit hat, in Definitionen Worte
der Umgangssprache wie Menge, Gruppe, Körper, Unterkörper, Abbildung etce-
tera „umzuwidmen“ und ihnen ganz spezielle und meist nur noch entfernt mit der
umgangssprachlichen Bedeutung verwandte neue Bedeutungen zu geben. In ma-
thematischen Texten sind dann überwiegend diese umgewidmeten Bedeutungen
gemeint. In dieser Weise baut die Mathematik also wirklich ihre eigene Sprache
auf, bei der jedoch die Grammatik und auch nicht ganz wenige Wörter doch wie-
der von den uns geläufigen Sprachen übernommen werden. Das muß insbesonde-
re für den Anfänger verwirrend sein, der sich auch bei ganz harmlos daherkom-
menden Wörtern stets wird fragen müssen, ob sie denn nun umgangssprachlich
gemeint sind oder vielmehr bereits durch eine Definition auf eine mehr oder we-
niger andere und viel genauere Bedeutung festgelegt wurden. Um hier zu helfen,
habe ich mir große Mühe mit dem Index gegeben, den Sie ganz am Schluß die-
ses Skriptums finden und in dem alle an verschiedenen Stellen eingeführten oder
umgewidmeten und dort fett gedruckten Begriffe verzeichnet sein sollten. Und
an dieser Stelle muß ich Sie schon bitten, das Wort „Index“ nicht als Laufindex
mißzuverstehen!
7
P
Beispiel 1.1.10. In der -Notation liest sich der in 1.1.7 gegebene Beweis so:
Pn Pn i Pn i
i=1 i = i=1 2 + i=1 2
und
Pn nach
i
Pn n+1−k i = n + 1 − k hinten
Indexwechsel
= i=1 2 + k=1 2
dann
Pn mache
i
Pkn zun+1−i
i in der zweiten Summe
= i=1 2 + i=1 2
und
Pn nach Zusammenfassen beider Summen
n+1
= i=1 2
8
0 = 0i=1 i. Der Sinn dieser Erweiterungen zeigt sich darin, daß damit Formeln
P
wie li=k ai = m
P P Pl
i=k a i + i=m+1 ai auch für m = k−1 richtig bleiben. Man mag
sogar noch weiter gehen und die Definition von Summen und Produkten auf be-
liebige untere und obere Grenzen so erweitern, daß diese Formeln richtig bleiben,
zumindest wenn alle Summanden ein Negatives beziehungsweise alle Faktoren
einen Kehrwert haben. In dieser Allgemeinheit
R ist die fragliche Notation jedoch
nur beim kontinuierlichen Analogon des Summenzeichens üblich, wie in 5.2.10
ausgeführt werden wird.
In gewisser Weise stimmt unser Satz sogar für n = 0: In der Terminologie, die
wir in 2.3 einführen, gibt es genau eine Anordnung der leeren Menge.
Beweis. Hat man n voneinander verschiedene Objekte, so hat man n Möglichkei-
ten, ein Erstes auszusuchen, dann (n−1) Möglichkeiten, ein Zweites auszusuchen
und so weiter, bis schließlich nur noch eine Möglichkeit bleibt, ein Letztes auszu-
suchen. Insgesamt haben wir also wie behauptet n! mögliche Reihenfolgen.
Definition 1.1.17. Wir definieren für beliebiges n und jede natürliche Zahl k den
n
Binomialkoeffizienten k (sprich: n über k) durch die Regeln
k−1
Yn−j
n n(n − 1) . . . (n − k + 1) n
:= = für k ≥ 1 und := 1.
k k − j k(k − 1) . . . 1 0
j=0
Der Sonderfall k = 0 wird im Übrigen auch durch unsere allgemeine Formel ge-
deckt, wenn wir unsere Konvention 1.1.14 beherzigen.
Im Lichte des folgenden
n
Satzes schlage ich vor, die Binomialkoeffizienten k statt „n über k“ inhaltsrei-
cher „k aus n“ zu sprechen.
1.1.18. Die Bezeichnung als Binomialkoeffizienten leitet sich von dem Auftreten
dieser Zahlen als Koeffizienten in der „binomischen Formel“ 1.1.23 ab.
9
Beispiel 1.1.20. Es gibt genau 42 = 2·1
4·3
= 6 Möglichkeiten, aus den vier Buch-
staben a, b, c, d zwei auszuwählen, nämlich
a, b b, c c, d
a, c b, d
a, d
Beweis. Wir haben n Möglichkeiten, ein erstes Objekt auszuwählen, dann n − 1
Möglichkeiten, ein zweites Objekt auszuwählen, und so weiter, also insgesamt
n(n − 1) . . . (n − k + 1) Möglichkeiten, k Objekte der Reihe nach auszuwählen.
Auf die Reihenfolge, in der wir ausgewählt haben, kommt es uns aber gar nicht
an, jeweils genau k! von unseren n(n − 1) . . . (n − k + 1) Möglichkeiten führen
nach 1.1.15 also zur Auswahl derselben k Objekte. Man bemerke, daß unser Satz
auch im Extremfall k = 0 noch stimmt, wenn wir ihn geeignet interpretieren: In
der Terminologie, die wir gleich einführen werden, besitzt in der Tat jede Menge
genau eine nullelementige Teilmenge, nämlich die leere Menge.
1.1.21. Offensichtlich gilt für alle natürlichen Zahlen n mit n ≥ k die Formel
n n! n
= =
k k!(n − k)! n−k
Das folgt einerseits sofort aus der formalen Definition und ist andererseits auch
klar nach der oben erklärten Bedeutung der Binomialkoeffizienten: Wenn wir aus
n Objekten k Objekte auswählen, so bleiben n−k Objekte übrig. Es gibt demnach
gleichviele Möglichkeiten, k Objekte auszuwählen, wie es Möglichkeiten gibt,
n n
n − k Objekte auszuwählen. haben weiter n = 0 = 1 für jede natürliche
Wir
Zahl n ≥ 0 sowie n1 = n−1 n
= n für jede natürliche Zahl n ≥ 1.
Definition 1.1.22. Wie in der Schule setzen wir ak := ki=1 a und sprechen diesen
Q
usdruck „a hoch k“. In Worten ist also gemeint „das Produkt von k-mal dem
Faktor a“. Im Lichte von 1.1.14 verstehen wir insbesondere a0 := 1.
Satz 1.1.23. Für jede natürliche Zahl n gilt die binomische Formel
n
n
X n k n−k
(a + b) = a b
k=0
k
10
Erster Beweis. Beim Ausmultiplizieren erhalten wir das Monom ak bn−k so oft,
wie es Möglichkeiten gibt, aus unseren n Faktoren (a + b) die k Faktoren auszu-
suchen, „in denen wir beim Ausmultiplizieren das a nehmen“. Dieses Argument
werden wir in 1.2.19 noch besser formulieren.
Zweiter Beweis. Dieser Beweis ist eine ausgezeichnete Übung im Umgang mit
unseren Symbolen und mit der vollständigen Induktion. Er scheint mir jedoch
auch in einer für Beweise durch vollständige Induktion typischen Weise wenig
durchsichtig. Zunächst prüfen wir für beliebiges n und jede natürliche Zahl k ≥ 1
die Formel
n n n+1
+ =
k−1 k k
durch explizites Nachrechnen. Dann geben wir unserer Formel im Satz den Na-
men A(n) und prüfen die Formel A(0) und zur Sicherheit auch noch A(1) durch
Hinsehen. Schließlich gilt es, den Induktionsschritt durchzuführen, als da heißt,
A(n + 1) aus A(n) zu folgern. Dazu rechnen wir
und
Pn durch Ausmultiplizieren
Pn
n k+1 n−k n k n−k+1
= k=0 k a b + k=0 k a b
11
benutzen: Im Schema
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
seien die Einsen an den Rändern vorgegeben und eine Zahl in der Mitte berechne
stehennin der (n + 1)-
sich als die Summe ihrer beiden oberen „Nachbarn“. Dann
n
ten Zeile der Reihe nach die Binomialkoeffizienten 0
= 1, 1 = n, . . ., bis
n n
n−1
= n, n = 1. Wir haben also zum Beispiel nach der untersten Zeile in
obigem Ausschnitt des Pascal’schen Dreiecks
Übungen
für ni=1 i2 . Hinweis: Man
P
Übung 1.1.27. Man finde und beweise
Pn 3 eine Formel
suche zunächst eine Formel für i=1 i − (i − 1)3 und beachte i3 − (i − 1)3 =
3i2 − 3i + 1.
Ergänzende
Pn kÜbung 1.1.28. Man zeige, daß für jedes k ∈ N eine Formel der Ge-
1
stalt i=1 i = k+1 nk+1 + ak nk + . . . + a1 n + a0 gilt mit aκ ∈ Q.
12
„Fourierentwicklung“ sogar bereits zu Beginn des 19.-ten Jahrhunderts. Er be-
hauptete auch gleich in seiner „Théorie analytique de la chaleur“, daß sich jede
beliebige periodische Funktion durch eine Fouriereihe darstellen lasse, aber diese
Behauptung stieß bei anderen berühmten Mathematikern seiner Zeit auf Ableh-
nung und es entstand darüber ein heftiger Disput. Erst in besagtem „Paradies der
Mengenlehre“ konnten die Fourier’s Behauptung zugrundeliegenden Begriffe so-
weit geklärt werden, daß dieser Disput nun endgültig beigelegt ist. Ähnlich verhält
es sich auch mit vielen anderen Fragestellungen. Da die Mengenlehre darüber hin-
aus auch vom didaktischen Standpunkt aus eine äußerst klare und durchsichtige
Darstellung mathematischer Sachverhalte ermöglicht, hat sie sich als Grundlage
der höheren Mathematik und der Ausbildung von Mathematikern an Universitäten
schnell durchgesetzt und ist nun weltweit das „Alphabet der Sprache der Mathe-
matik“. Man wird an Universitäten sogar geradezu dazu erzogen, alle Mathematik
in der Sprache der Mengenlehre zu fassen und geometrischen Argumenten keine
Beweiskraft zuzugestehen. Ich halte das bei der Ausbildung von Mathematikern
auch für angemessen. Bei der Mathematik-Ausbildung im allgemeinen scheint
mir dieses Vorgehen dahingegen nicht zielführend: In diesem Kontext sollte man
meines Erachtens nicht mit demselben Maß messen, auch ohne alle Mengenlehre
geometrisch erklärte Begriffe wie Gerade und Kreis, Ebene und Raum, als wohl-
definierte Objekte der Mathematik zulassen und geometrischen Argumenten Be-
weiskraft zugestehen.
1.2.2. Im Wortlaut der ersten Zeilen des Artikels „Beiträge zur Begründung der
transfiniten Mengenlehre (Erster Aufsatz)“ von Georg Cantor, erschienen im Jahre
1895, hört sich die Definition einer Menge so an:
Unter einer Menge verstehen wir jede Zusammenfassung M von be-
stimmten wohlunterschiedenen Objekten m unserer Anschauung oder
unseres Denkens (welche die Elemente von M genannt werden) zu
einem Ganzen.
Verbinden wir mit einer Menge eine geometrische Vorstellung, so nennen wir ihre
Elemente auch Punkte und die Menge selbst einen Raum. Ein derartiges Herum-
gerede ist natürlich keine formale Definition und birgt durchaus verschiedene Fall-
stricke, vergleiche 1.3.9. Das Ziel dieser Vorlesung ist aber auch nicht eine formale
Begründung der Mengenlehre, wie Sie sie in der Logik kennenlernen können. Sie
sollen vielmehr die Bedeutung dieser Worte intuitiv erfassen wie ein Kleinkind,
das Sprechen lernt: Indem sie mir und anderen Mathematikern zuhören, wie wir
mit diesen Worten sinnvolle Sätze bilden, uns nachahmen, und beobachten, wel-
chen Effekt Sie damit hervorrufen. Unter anderem dazu sind die Übungsgruppen
da.
Ergänzung 1.2.3. Bei der Entwicklung der Mathematik aus der Umgangssprache
durch fortgesetztes Zuspitzen und Umwidmen des Wortschatzes muß ich an den
13
Baron von Münchhausen denken, wie er sich an seinen eigenen Haaren aus dem
Sumpf zieht. Schon verblüffend, daß es klappt. Aber bei Kleinkindern, die Spre-
chen lernen, ist es ja noch viel verblüffender, wie sie die Bedeutung von Worten
erfassen, ohne daß man sie ihnen in Worten erklären kann.
Beispiele 1.2.4. Endliche Mengen kann man durch eine vollständige Liste ihrer
Elemente in geschweiften Klammern angeben, zum Beispiel in der Form
X = {x1 , x2 , . . . , xn }
Der Name letzterer Menge kommt von lateinisch „ratio“ für „Verhältnis“, der
Buchstabe Q steht für „Quotient“. Man beachte, daß wir auch hier Elemente mehr-
fach genannt haben, es gilt ja p/q = p0 /q 0 genau dann, wenn pq 0 = p0 q. Auf
Deutsch bezeichnet man die rationalen Zahlen auch als Bruchzahlen, da man
sich etwa ein Viertel eines Kekses als den Anteil denken kann, der entsteht, wenn
man besagten Keks in vier gleiche Teile zerbricht. Einen Leitfaden zu einem for-
maleren Aufbau des Zahlensystems können Sie in [GR] 2.5.1 finden.
Ergänzung 1.2.5 (Herkunft des Gleichheitszeichens). Das Gleichheitszeichen
= scheint auf ein 1557 von Robert Recorde publiziertes Buch zurückzugehen
und soll andeuten, daß das, was auf der linken und rechten Seite dieses Zeichens
steht, so gleich ist wie die beiden Strichlein, die das uns heute so selbstverständli-
che Gleichheitszeichen bilden. Davor schrieb man statt einem Gleichheitszeichen
meist ae für „äquivalent“.
Ergänzung 1.2.6 (Diskussion der Notation). In Texten, in deren Konventionen
die Null keine natürliche Zahl ist, verwendet man meist die abweichenden No-
tationen N für die Menge {1, 2, . . .} und N0 für die Menge {0, 1, 2, . . .}. Die in
diesem Text verwendete Notation N = {0, 1, 2, . . .} stimmt mit der internationa-
len Norm ISO 31-11 überein.
14
1.2.7. Die Bedeutung der Symbole Z und Q ist in der Mathematik weitgehend
einheitlich. Man verwendet diesen Schrifttypus auch sonst gerne für Symbole, die
in ihrer Bedeutung über große Teile der Mathematik hinweg einheitlich verwendet
werden. Bei der Bedeutung von N ist man allerdings nie ganz sicher, ob die Null
mitgemeint ist. In den Konventionen dieses Textes gilt 0 ∈ N.
1.2.8. Eine Menge, die nur endlich viele Elemente hat, nennen wir eine endliche
Menge. Eine präzisere Definition dieses Konzepts wird in [LA1] 4.1.2 gegeben.
Wir vereinbaren bereits hier, daß wir auch die leere Menge endlich nennen. Die
Zahl der Elemente einer endlichen Menge X nennen wir ihre Kardinalität oder
Mächtigkeit und notieren sie
|X|
oder card(X). In der Literatur findet man auch die Notation ]X. Für endliche
Mengen X ist demnach ihre Kardinalität stets eine natürliche Zahl |X| ∈ N und
|X| = 0 ist gleichbedeutend zu X = ∅. Ist X unendlich, so schreiben wir bis auf
weiteres kurzerhand |X| = ∞ und ignorieren in unserer Notation, daß auch un-
endliche Mengen „verschieden groß“ sein können. Für ein Beispiel für „verschie-
den große unendliche Mengen“ siehe 2.5.2 und für eine genauere Diskussion des
Begriffs der Kardinalität vergleiche [AL] 5.3.1.
Definition 1.2.9. Eine Menge Y heißt Teilmenge einer Menge X, wenn jedes
Element von Y auch ein Element von X ist. Man schreibt dafür Y ⊂ X oder
X ⊃Y.
15
davon ab. In der folgenden Tabelle stellen wir diese beiden Konventionen einander
gegenüber.
Cantor und Bourbaki Norm ISO 31-11 Bedeutung
16
Satz 1.2.17 (Bedeutung der Binomialkoeffizienten). Gegeben natürliche Zah-
len n, k ∈ N gibt der Binomialkoeffizient nk die Zahl der k-elementigen Teilmen-
gen einer n-elementigen Menge an. In Formeln ausgedrückt haben wir unter der
Annahme |X| = n also
|{Y ⊂ X | |Y | = k}| = nk
Beweis. Vollständige Induktion über n. Für n = 0 gilt die Aussage, denn eine
nullelementige Menge hat genau eine k-elementige Teilmenge falls k = 0 und
keine k-elementige Teilmenge falls k ≥ 1. Nehmen wir nun an, die Aussage sei
für ein n schon bewiesen. Eine (n + 1)-elementige Menge X schreiben wir als
X = M ∪ {x} mit dem gleich in 1.3.1 formal eingeführten Vereingungszeichen
∪, wo M eine n-elementige Menge ist und x 6∈ M . Ist k = 0, so gibt es genau
eine k-elementige Teilmenge von M ∪{x}, nämlich die leere Menge. Ist k ≥ 1, so
n
gibt es in M ∪ {x} nach Induktionsannahme genau k k-elementige Teilmengen,
die x nicht enthalten. Die k-elementigen Teilmengen dahingegen, die x enthalten,
ergeben sich durch Hinzunehmenvon x aus den (k − 1)-elementigen Teilmengen
n
von M , von denen es gerade k−1 gibt. Insgesamt hat M ∪ {x} damit also genau
n n n+1
k
+ k−1 = k Teilmengen mit genau k Elementen.
1.2.18. Wieder scheint mir dieser Beweis in der für vollständige Induktion typi-
schen Weise undurchsichtig. Ich ziehe deshalb den in 1.1.19 gegebenen weniger
formellen Beweis vor. Man kann auch diesen Beweis formalisieren und verstehen
als Spezialfall der sogenannten „Bahnformel“, vergleiche [LA2] 5.2.3.
1.2.19 (Variante zum Beweis der binomischen Formel). Wir geben nun die ver-
sprochene präzise Formulierung unseres ersten Beweises der binomischen Formel
1.1.23. Wir rechnen dazu
X
(a + b)n = a|Y | bn−|Y |
Y ⊂{1,2,...,n}
Die rechte Seite soll hier in Verallgemeinerung der in 1.1.8 eingeführten Notati-
on bedeuten, daß wir für jede Teilmenge Y von {1, 2, . . . , n} den angegebenen
Ausdruck a|Y | bn−|Y | nehmen und alle diese Ausdrücke aufsummieren. Dann fas-
sen wir gleiche Summanden zusammen und erhalten mit 1.2.17 die binomische
Formel.
Übungen
n
= 2n .
P
Übung 1.2.20. Es gilt k k
n!
Übung 1.2.21. Man zeige (a + b + c)n = i j k
P
i+j+k=n i!j!k! a b c .
17
1.3 Mengenoperationen
Definition 1.3.1. Wir erinnern, daß wir := als Abkürzung für „ist definiert als“
verwenden und daß „oder“ in der Mathematik stets das „nichtausschließende oder“
meint. Gegeben zwei Mengen X, Y können wir unter anderem auf folgende Wei-
sen neue Mengen bilden:
{1, 2} × {1, 2, 3} = {(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3)}
Oft benutzt man für das Produkt X × X einer Menge X mit sich selbst die
Abkürzung X 2 := X × X und nennt das die Menge aller angeordneten
Paare von Elementen von X.
18
Zwei anschauliche Darstellungen des Produkts von zwei Mengen. Links das
Produkt einer Menge mit fünf und einer Menge mit drei Elementen. Rechts das
Produkt zweier Geradensegmente, aufgefaßt als unndliche Mengen. In beiden
Fällen wird ein Paar (x, y) ∈ X × Y dargestellt durch einen Punkt, der über x
und neben y liegt.
1.3.2. Eine gute Anschauung für die ersten drei Operationen liefern die sogenann-
ten van-de-Ven-Diagramme, wie sie die Bilder zeigen. Sie sind allerdings nicht
zu genau zu hinterfragen, denn ob die Punkte auf einem Blatt Papier im Sinne
von Cantor „bestimmte wohlunterschiedene Objekte unserer Anschauung“ sind,
scheint mir nicht ohne weiteres so klar. Wenn man jedoch jedes der schraffierten
Gebiete im Bild als die Menge aller darin liegenden Kreuzungspunkte auf einem
dazugedachten Millimeterpapier auffaßt und keine dieser Kreuzungspunkte auf
den Begrenzungslinien liegen, so können sie wohl schon als eine Menge im Can-
tor’schen Sinne angesehen werden.
1.3.3. Zwei Teilmengen einer gegebenen Menge, die kein gemeinsames Element
haben, heißen disjunkt. Äquivalent dazu ist die Bedingung, daß ihr Schnitt die
leere Menge ist.
1.3.4 (Mehrdeutigkeiten mit dem Komma als Trenner). Die Verwendung des
Kommas als Trenner ist hier problematisch, da (1, 2) nun zweierlei bedeuten kann:
Zum einen ein Element des kartesischen Produkts N × N, zum anderen aber auch
den eingeklammerten Dezimalbruch 1,2. Was im Einzelfall gemeint ist, gilt es
aus dem Kontext zu erschließen. In diesem Text werden Dezimalbrüche nur sel-
ten vorkommen. In deutschen Schulbüchern verwendet man für angeordnete Paare
meist die abweichende Notation (x|y), um auch Paare von Dezimalbrüchen un-
mißverständlich notieren zu können.
1.3.5 (Diskussion der Terminologie). Die Bezeichnung als „Schnitt“ kommt
wohl her von der Vorstellung des Schnitts zweier Geraden, wenn man sie als Teil-
mengen der Ebene denkt und diese hinwiederum als ein Blatt Papier, das man
längs der einen Gerade entzweischneiden kann. Der Punkt, an dem die andere
Gerade entzweigeschnitten wird, ist dann der Schnittpunkt und der Schnitt unse-
rer beiden Geraden besteht genau aus diesem einen Punkt.
19
1.3.6 (Mengenlehre und das Bilden von Begriffen). Wir werden in unserer nai-
ven Mengenlehre die ersten drei Operationen „Vereinigung“, „Schnitt“ und „Dif-
ferenz“ aus 1.3.1 nur auf Teilmengen einer gemeinsamen Obermenge anwenden,
die uns in der einen oder anderen Weise bereits zur Verfügung steht. Die Potenz-
menge und das kartesische Produkt dahingegen benutzen wir, um darüber hinaus
neue Mengen zu erschaffen. Diese Konstruktionen erlauben es, im Rahmen der
Mengenlehre so etwas wie Abstraktionen zu bilden: Wenn wir uns etwa die Menge
T aller an mindestens einem Tag der Weltgeschichte lebenden oder gelebt haben-
den Tiere als eine Menge im Cantor’schen Sinne denken, so würden wir Konzepte
wie „männlich“ oder „Hund“ oder „Fleischfresser“ formal als Teilmengen dieser
Menge alias als Elemente von P(T ) formalisieren. Das Konzept „ist Kind von“
würde dahingegen formalisiert als eine Teilmenge K ⊂ T × T des kartesischen
Produkts unserer Menge T mit sich selbst alias als ein Element K ∈ P(T × T ),
nämlich als die Teilmenge K := {(x, y) ∈ T × T | x ist Kind von y}.
1.3.7. Für das Rechnen mit Mengen überlegt man sich die folgenden Regeln, die
ich gleich mit ihren üblichen Bezeichnungen angebe:
Assoziativgesetze: X ∩ (Y ∩ Z) = (X ∩ Y ) ∩ Z
X ∪ (Y ∪ Z) = (X ∪ Y ) ∪ Z
Distributivgesetze: X ∪ (Y ∩ Z) = (X ∪ Y ) ∩ (X ∪ Z)
X ∩ (Y ∪ Z) = (X ∩ Y ) ∪ (X ∩ Z)
de Morgan’sche Regeln: X\(Y ∪ Z) = (X\Y ) ∩ (X\Z)
X\(Y ∩ Z) = (X\Y ) ∪ (X\Z)
Komplement der Differenzmenge: X\(X\Y ) = X ∩ Y
Eine gute Anschauung für diese Regeln liefern die van-de-Ven-Diagramme, wie
die Bilder zeigen. Das liegt daran, daß alle acht möglichen Lagen in Bezug auf
unsere drei Mengen in diesen Diagrammen als Flächen zu sehen sind.
1.3.8. Ich zeige beispielhaft die Regel X ∪ (Y ∩ Z) = (X ∪ Y ) ∩ (X ∪ Z). Es
reicht, statt der Gleichheit die beiden Inklusionen ⊂ und ⊃ zu zeigen.
Ich beginne mit ⊂. Sicher gilt (Y ∩ Z) ⊂ Y , also auch X ∪ (Y ∩ Z) ⊂ X ∪ Y .
Ebenso zeigt man X ∪ (Y ∩ Z) ⊂ X ∪ Z und damit folgt schon mal ⊂.
Bleibt noch ⊃ zu zeigen. Das will mir nur durch Betrachtung von Elementen
gelingen. Gegeben a ∈ (X ∪ Y ) ∩ (X ∪ Z) gilt entweder a ∈ X oder a 6∈ X. Falls
a ∈ X haben wir eh a ∈ X ∪(Y ∩Z). Falls a 6∈ X folgt aus a ∈ (X ∪Y )∩(X ∪Z)
erst a ∈ (X ∪ Y ) und dann a ∈ Y und weiter erst a ∈ (X ∪ Z) und dann a ∈ Z,
also a ∈ Y ∩ Z ⊂ X ∪ (Y ∩ Z). Wir haben somit gezeigt, daß jedes Element a
von (X ∪ Y ) ∩ (X ∪ Z) auch zu X ∪ (Y ∩ Z) gehört. Damit folgt die behauptete
Inklusion ⊃.
20
X ∩ (Y ∪ Z) = (X ∩ Y ) ∪ (X ∩ Z) X \ (Y ∩ Z) = (X \ Y ) ∪ (X \ Z)
21
Aus X = X1 ∪ X2 und Y = Y1 ∪ Y2 folgt noch lange nicht
X × Y = (X1 × Y1 ) ∪ (X2 × Y2 )
22
Ergänzung 1.3.9 (Das Russell’sche Paradoxon). Ich will nicht verschweigen,
daß der in diesem Abschnitt dargestellte naive Zugang zur Mengenlehre durchaus
begriffliche Schwierigkeiten mit sich bringt: Zum Beispiel darf die Gesamtheit M
aller Mengen nicht als Menge angesehen werden, da wir sonst die „Menge aller
Mengen, die sich nicht selbst als Element enthalten“, gegeben durch die formel-
hafte Beschreibung N = {A ∈ M | A 6∈ A}, bilden könnten. Für diese Menge
kann aber weder N ∈ N noch N 6∈ N gelten. Diese Art von Schwierigkeiten
kann erst ein formalerer Zugang klären und auflösen, bei dem man unsere naiven
Vorstellungen durch Ketten von Zeichen aus einem wohlbestimmten endlichen
Alphabet ersetzt und unsere Vorstellung von Wahrheit durch die Verifizierbarkeit
vermittels rein algebraischer „erlaubter Manipulationen“ solcher Zeichenketten,
die in „Axiomen“ festgelegt werden. Diese Verifikationen kann man dann durch-
aus auch einer Rechenmaschine überlassen, so daß wirklich auf „objektivem“ We-
ge entschieden werden kann, ob ein „Beweis“ für die „Richtigkeit“ einer unserer
Zeichenketten in einem vorgegebenen axiomatischen Rahmen stichhaltig ist. Al-
lerdings kann in derartigen Systemen von einer Zeichenkette algorithmisch nur
entschieden werden, ob sie eine „sinnvolle Aussage“ ist, nicht aber, ob sie „bewie-
sen“ werden kann. Noch viel stärker zeigt der Unvollständigkeitssatz von Gödel,
daß es in einem derartigen axiomatischen Rahmen, sobald er reichhaltig genug
ist für eine Beschreibung des Rechnens mit natürlichen Zahlen, stets sinnvolle
Aussagen gibt derart, daß entweder sowohl die Aussage als auch ihre Verneinung
oder aber weder die Aussage noch ihre Verneinung bewiesen werden können. Mit
diesen und ähnlichen Fragestellungen beschäftigt sich die Logik.
Vorschau 1.3.10 (Weitere Konstruktionen der Mengenlehre). Um mich nicht
dem Vorwurf auszusetzen, während des Spiels die Spielregeln ändern zu wollen,
sei bereits hier erwähnt, was noch hinzukommen soll. Die einzigen grundlegen-
den Konstruktionen, die noch fehlen, sind das Bilden der „disjunkten Vereini-
gung“ und des „kartesischen Produkts“ zu einer „beliebigen Mengenfamilie“ in
[LA2] 7.7.17 und [LA2] 7.7.7. In [AN2] 1.3.3 besprechen wir weiter Schnitt und
Vereinigung einer „beliebigen Familie von Teilmengen einer gegebenen Menge“.
In [LA1] 1.9 werden einige weniger offensichtliche Argumentationen im Zusam-
menhang mit dem sogenannten „Zorn’schen Lemma“ erläutert, die meines Erach-
tens bereits an den Rand dessen gehen, was man in unserem informellen Rahmen
der naiven Mengenlehre als Argumentation noch vertreten kann. In [LA1] 4.1
wird die Konstruktion der natürlichen Zahlen im Rahmen der Mengenlehre disku-
tiert, insbesondere geben wir erst dort eine formale Definition des Begriffs einer
endlichen Menge. Sicher ist es in gewisser Weise unbefriedigend, das Fundament
des Hauses der Mathematik erst fertigzustellen, wenn bereits erste Stockwerke
stehen und bewohnt sind. Andererseits will ich aber auch vermeiden, daß Sie mir
auf einem gewaltigen Fundament, das die ganze Mathematik tragen kann, im ers-
23
ten Winter(semester) jämmerlich erfrieren.
1.3.11 (Der Sinn von Genauigkeit und sorgfältiger Sprache). Ich könnte mir
gut vorstellen, daß verschiedene meiner Leser denken, diese ganze Pedanterie sei
doch eigentlich überflüssig und jetzt sollten wir doch einfach mal fröhlich los-
rechnen wie das in der Schule ja auch sehr gut ging. Ich will hier erklären, warum
Pedanterie in diesem Zusammenhang wichtig ist. Viele von Ihnen werden wissen,
wie man mit einem einfachen Blatt Papier zum Mond kommt: 42-mal Falten und
draufsteigen, das war’s schon. So ähnlich ist es in der Mathematik: Etwas völlig
Banales wie die naive Mengenlehre wird in den etwa dreißig Vorlesungsdoppel-
stunden des Wintersemesters jedes Mal auf’s neue gefaltet und wenn Sie dann
am Ende des Wintersemesters zurückblicken, kann Ihnen schon leicht schwind-
lig werden. Das funktioniert mit wirklichem Papier nur eingeschränkt, aber wenn
man sehr festes und glattes „Gedankenpapier“ nimmt, und solches Gedankenpa-
pier ist eben gerade die Mengenlehre, dann klappt es verblüffend gut. Man muß
dazu aber mit der Herstellung dieses Gedankenpapiers ebenso wie beim Falten
sorgfältig sein bis zur Pedanterie, denn auch die kleinste Ungeschicklichkeit ver-
vielfacht sich bei diesem Vorgehen mit derselben Schnelligkeit wie die gedankli-
che Höhe und bringt, eh man sich’s versieht, alles zum Einsturz.
Übungen
Übung 1.3.12. Sind X und Y endliche Mengen, so gilt für die Kardinalitäten
|X × Y | = |X| · |Y | und |X ∪ Y | = |X| + |Y | − |X ∩ Y |.
1.4 Abbildungen
Definition 1.4.1. Seien X, Y Mengen. Eine Abbildung f : X → Y ist eine
Zuordnung, die jedem Element x ∈ X genau ein Element f (x) ∈ Y zuordnet,
das Bild von x unter f , auch genannt der Wert von f an der Stelle x. Man spricht
dann auch vom Auswerten der Funktion f an der Stelle x oder vom Einsetzen
von x in f und schreibt manchmal abkürzend f (x) = f x.
1.4.2. Wem das zu vage ist, der mag die alternative Definition vorziehen, nach
der eine Abbildung f : X → Y eine Teilmenge f ⊂ X × Y ist derart, daß es
für jedes x ∈ X genau ein y ∈ Y gibt mit (x, y) ∈ f . Dies eindeutig bestimmte
y schreiben wir dann f (x) und sind auf einem etwas formaleren Weg wieder an
demselben Punkt angelangt. In unseren Konventionen nennen wir besagte Teil-
menge den Graphen von f und notieren sie mit dem Symbol Γ (sprich: Gamma),
einem großen griechischen G, und schreiben
24
Eine Abbildung einer Menge mit
fünf in eine mit drei Elementen
1.4.4 (Die Notationen → und 7→). Wir notieren Abbildungen oft in der Form
f: X → Y
x 7→ f (x)
q: Z → Z
n 7→ n2
25
Beispiel 1.4.6. Gegeben zwei Mengen X, Y erklärt man die Projektionsabbil-
dungen oder Projektionen prX : X × Y → X beziehungsweise prY : X × Y →
Y durch die Vorschrift (x, y) 7→ x beziehungsweise (x, y) 7→ y. In manchen Zu-
sammenhängen notiert man sie auch abweichend pr1 und pr2 für die „Projektion
auf die erste beziehungsweise zweite Komponente“.
1.4.7 (Konstanten und konstante Abbildungen). Gegeben ein festes c ∈ Y
schreiben wir oft auch kurz c für die konstante Abbildung X → Y gegeben
durch x 7→ c für alle x ∈ X. Damit verbunden ist die Hoffnung, daß aus dem
Kontext klar wird, ob im Einzelfall die Abbildung c : X → Y oder das Element
c ∈ Y gemeint sind.
1. f heißt injektiv oder eine Injektion, wenn aus x 6= x0 folgt f (x) 6= f (x0 ).
Gleichbedeutend ist die Forderung, daß es für jedes y ∈ Y höchstens ein
x ∈ X gibt mit f (x) = y. Injektionen schreibt man oft ,→.
Eine Injektion
Eine Surjektion
3. f heißt bijektiv oder eine Bijektion, wenn f injektiv und surjektiv ist.
Gleichbedeutend ist die Forderung, daß es für jedes y ∈ Y genau ein x ∈ X
∼
gibt mit f (x) = y. Bijektionen schreibt man oft →.
26
Eine Bijektion
27
Satz 1.4.14. Seien f : X → Y und g : Y → Z Abbildungen.
Beweis. Übung.
Beweis. Übung.
∼
1.4.16 (Umkehrabbildung). Ist f : X → Y eine bijektive Abbildung, so ist of-
fensichtlich die Menge {(f (x), x) ∈ Y × X | x ∈ X} im Sinne von 1.4.2 eine
Abbildung oder, vielleicht klarer, der Graph einer Abbildung Y → X. Diese Ab-
bildung in die Gegenrichtung heißt die Umkehrabbildung oder Umkehrfunkti-
on oder auch die inverse Abbildung zu f und wird mit f −1 : Y → X bezeichnet.
Offensichtlich ist mit f auch f −1 eine Bijektion.
1.4.17 (Diskussion der Notation). Mit dem vorhergehenden haben wir schon
eine dritte mögliche Bedeutung für das Symbol f −1 kennengelernt. Was im Ein-
zelfall gemeint ist, gilt es aus dem Kontext zu erschließen.
Beispiel 1.4.18. Die Umkehrabbildung unserer Bijektion t : Z → Z, x 7→ x + 1
ist die Abbildung t−1 : Z → Z, x 7→ x − 1.
Satz 1.4.19 (Bedeutung der Fakultät). Sind X und Y zwei Mengen mit je n
∼
Elementen, so gibt es genau n! bijektive Abbildungen f : X → Y .
Beweis. Sei X = {x1 , . . . , xn }. Wir haben n Möglichkeiten, ein Bild für x1 aus-
zusuchen, dann noch (n − 1) Möglichkeiten, ein Bild für x2 auszusuchen, und so
weiter, bis schließlich nur noch 1 Element von Y als mögliches Bild von xn in
Frage kommt. Insgesamt gibt es also n(n − 1) · · · 1 = n! Möglichkeiten für f . Da
wir 0! = 1 vereinbart hatten, stimmt unser Satz auch für n = 0.
Übungen
Übung 1.4.20. Gegeben eine Bijektion f : X → Y ist g = f −1 die einzige
Abbildung g : Y → X mit f ◦ g = idY . Ebenso ist auch h = f −1 die einzige
Abbildung h : Y → X mit h ◦ f = idX .
28
Ergänzende Übung 1.4.21. Gegeben endliche Mengen X, Y gibt es genau |Y ||X|
Abbildungen von X nach Y und unter diesen Abbildungen sind genau |Y |(|Y | −
1)(|Y | − 2) . . . (|Y | − |X| + 1) Injektionen.
Ergänzende Übung 1.4.22. Sei X eine Menge mit n Elementen und seien natürli-
che Zahlen α1 , . . . , αr ∈ N gegeben mit n = α1 + . . . + αr . Man zeige: Es gibt
genau n!/(α1 ! · · · αr !) Abbildungen f : X → {1, . . . , r}, die jedes i genau αi -mal
als Wert annehmen, in Formeln
n!
= card{f | |f −1 (i)| = αi für i = 1, . . . r}
α1 ! · · · αr !
Ergänzung 1.4.23. Manche Autoren bezeichnen die Zahlen aus der vorherigen
Übung 1.4.22 als Multinomialkoeffizienten und verwenden die Notation
n n!
:=
α1 ; . . . ; αr α1 ! · · · αr !
Mich überzeugt diese Notation nicht, da sie im Gegensatz zur Notation für Bino-
mialkoeffizienten nichts kürzer macht.
Ergänzende Übung 1.4.24. Man zeige die Formel
X n!
(x1 + . . . + xr )n = xα1 1 · · · xαr r
α1 +...+αr
α
=n 1
! · · · α r !
X ×X → X
(x, y) 7→ x>y
Jedem angeordneten Paar (x, y) mit x, y ∈ X wird also ein Element (x>y) ∈ X
zugeordnet. Eine Menge mit Verknüpfung heißt ein Magma.
29
Eine Abbildung f : {1, 2, . . . , n} → N im Fall n = 6 mit Wertesumme m = 10
und die Veranschaulichung nach der Vorschrift aus Übung 1.4.25 als Folge
bestehend aus m Punkten und n − 1 Strichen.
30
1.5.2. Das unverfängliche Symbol > benutze ich, um mich an dieser Stelle noch
nicht implizit auf einen der Standardfälle Addition oder Multiplikation festlegen
zu müssen.
Beispiele 1.5.3. 1. Die Addition von ganzen Zahlen ist eine Verknüpfung
Z×Z → Z
(m, n) 7→ m + n
Z×Z → Z
(m, n) 7→ m · n
3. Die Zuordnung min, die jedem Paar von natürlichen Zahlen die kleinere
zuordnet, wenn sie verschieden sind, und eben diese Zahl min(n, n) = n,
wenn sie gleich sind, ist eine Verknüpfung
min : N × N → N
(m, n) 7→ min(m, n)
Z×Z → Z
(m, n) 7→ m − n
1.5.4. Eine Verknüpfung > auf einer Menge X heißt assoziativ, wenn gilt
31
Die Wahrheitstafeln für „und“ und „oder“. Gemeint ist hier wie stets in der
Mathematik das „nichtausschließende oder“. Sagen wir, es gelte A oder B, so ist
insbesondere auch erlaubt, daß beides gilt. Bei der Wahrheitstafel für das
„ausschließende oder“ müßte oben links als Verknüpfung von „Wahr“ mit
„Wahr“ ein „Falsch“ stehen.
32
1.5.5. Eine Verknüpfung > auf einer Menge X heißt kommutativ oder abelsch,
wenn gilt
x>y = y>x ∀x, y ∈ X
Die Bezeichnung „abelsch“ ehrt den norwegischen Mathematiker Nils Henrik
Abel.
Beispiele 1.5.6. Die Addition und Multiplikation auf Z sind assoziativ und kom-
mutativ. Für das Minimum in N gilt dasselbe. Die Subtraktion auf Z ist weder
kommutativ noch assoziativ.
Definition 1.5.7. Gegeben eine Menge mit Verknüpfung (X, >) heißt ein Element
e ∈ X ein neutrales Element von (X, >), wenn gilt
e>x = x>e = x ∀x ∈ X
Definition 1.5.10. Ein Monoid ist eine Menge mit einer assoziativen Verknüp-
fung, in der es ein neutrales Element gibt.
1.5.11. Das Wort „Monoid“ ist wohl von griechisch „µoνoς“ für „allein“ abgelei-
tet: Ein Monoid besitzt nur eine einzige Verknüpfung.
1.5.12 (Gebräuchliche Notationsschemata für Monoide). (1) Notiert man in
einem Monoid M die Verknüpfung mit dem Symbol +, so notiert man das neu-
trale Element meist 0M oder abkürzend 0 und nennt es das Null-Element oder
abkürzend die Null und spricht von einem additiv notierten Monoid. Nur kom-
mutative Monoide werden additiv notiert.
(2) Notiert man in einem Monoid M die Verknüpfung mit einem eher runden
Symbol wie · oder ◦ oder ∗ oder auch einfach durch Hintereinanderschreiben, so
notiert man das neutrale Element oft 1M oder abkürzend 1 und nennt es das Eins-
Element oder abkürzend die Eins und spricht von einem multiplikativ notierten
Monoid.
Beispiele 1.5.13. Die natürlichen Zahlen bilden mit der Addition ein Monoid
(N, +) mit neutralem Element 0. Sie bilden mit der Multiplikation ein Monoid
(N, ·) mit neutralem Element 1.
33
1.5.14 (Iterierte Verknüpfungen). Sei (A, >) ein Monoid. Ist n ∈ N eine na-
türliche Zahl und a ∈ A, so schreiben wir
n> a := a>a>
| {z. . . >a}
n-mal
für n ≥ 1 und setzen ergänzend 0> a := eA . Dann gelten offensichtlich für alle
m, n ∈ N und a, b ∈ A mit a>b = b>a die Regeln
1. (n + m)> a = (n> a)>(m> a)
2. (nm)> a = n> (m> a)
3. n> (a>b) = (n> a)>(n> b)
Beispiel 1.5.15 (Iterieren in additiv notierten Monoiden). Im Fall additiv no-
tierter Monoide schreibt man statt n> a meist na. Unsere drei Regeln werden dann
(n + m)a = (na) + (ma), (nm)a = n(ma) und n(a + b) = (na) + (nb) und
unsere Konvention 0> a = eM nimmt die Gestalt 0a = 0M an. Wenn ich es genau
nehmen will, schreibe ich in diesem Fall n+ a statt na.
Beispiel 1.5.16 (Iterieren in multiplikativ notierten Monoiden). Im Fall mul-
tiplikativ notierter Monoide schreibt man statt n> a meist an . Unsere drei Regeln
werden dann an+m = (an )(am ), anm = (an )m und (ab)n = (an )(bn ) falls ab = ba
und unsere Konvention 0> a = eM nimmt die Gestalt a0 = 1M an.
1.5.17. Die natürlichen, ja die ganzen Zahlen, ja sogar die rationalen Zahlen mit
Multiplikation und Addition nehmen wir hier als gegeben hin ebenso wie die Tat-
sache, daß in diesem Fall die n-fach iterierte Addition gerade die Multiplikation
ist. Den Aufbau dieser Strukturen aus der Mengenlehre diskutieren wir erst in
[LA1] 4.1.
Definition 1.5.18. 1. Ist (M, >) ein Monoid und a ∈ M ein Element, so nen-
nen wir ein weiteres Element ā ∈ M invers zu a, wenn gilt a>ā = e =
ā>a für e ∈ M das neutrale Element unseres Monoids. Ein Element eines
Monoids, das ein Inverses besitzt, heißt invertierbar;
2. Eine Gruppe ist ein Monoid, in dem jedes Element ein Inverses besitzt;
3. Eine kommutative Gruppe oder abelsche Gruppe ist eine Gruppe, deren
Verknüpfung kommutativ ist.
Beispiele 1.5.19. Von unseren Beispielen 1.5.3 für Mengen mit Verknüpfung oben
ist nur (Z, +) eine Gruppe, und diese Gruppe ist kommutativ. Ein anderes Beispiel
für eine kommutative Gruppe ist die Menge Q der rationalen Zahlen mit der Addi-
tion als Verknüpfung, ein weiteres die Menge Q\{0} der von Null verschiedenen
rationalen Zahlen mit der Multiplikation als Verknüpfung. Auch jedes einelemen-
tige Monoid ist eine Gruppe.
34
1.5.20. Der Begriff einer „Gruppe“ wurde von Évariste Galois (1811-1832) in
die Mathematik eingeführt. Er verwendet den Begriff „Gruppe von Transforma-
tionen“ sowohl in der Bedeutung einer „Menge von bijektiven Selbstabbildungen
einer gegebenen Menge“ als auch in der Bedeutung einer „Menge von bijekti-
ven Selbstabbildungen einer gegebenen Menge, die abgeschlossen ist unter Ver-
knüpfung und Inversenbildung“, und die damit in der Tat ein Beispiel für eine
Gruppe im Sinne der obigen Definition bildet. Unsere obige Definition 1.5.18
geht auf eine Arbeit von Arthur Cayley aus dem Jahre 1854 mit dem Titel „On
the theory of groups as depending on the symbolic equation θn = 1“ zurück und
wurde damit formuliert, bevor Cantor die Sprache der Mengenlehre entwickelte.
Die Terminologie „abelsche Gruppe“ wurde zu Ehren des norwegischen Mathe-
matikers Niels Hendrik Abel eingeführt.
Lemma 1.5.21. Jedes Element eines Monoids besitzt höchstens ein Inverses.
Beweis. Aus a>ā = e und b>a = e folgt durch Anwenden von b> auf die erste
Gleichung mit dem Assoziativgesetz sofort ā = b.
1.5.22. Wir dürfen also den bestimmten Artikel benutzen und von nun an von
dem Inversen eines Elements eines Monoids und insbesondere auch einer Gruppe
reden.
Beispiel 1.5.23 (Invertieren in additiv notierten Monoiden). Im Fall additiv
notierter Monoide schreibt man statt ā meist −a und nennt dieses „additive In-
verse“ das Negative von a. Üblich ist in diesem Kontext auch die Abkürzung
a − b := a + (−b).
Beispiel 1.5.24 (Invertieren in multiplikativ notierten Monoiden). Im Fall mul-
tiplikativ notierter Monoide bleiben wir vorerst bei unserer Notation ā.
1.5.25 (Zweimaliges Invertieren). Gegeben ein invertierbares Element ist offen-
sichtlich auch sein Inverses invertierbar und das Inverse des Inversen ist wieder
das ursprüngliche Element, in Formeln ❠= a. In additiver Notation liest sich das
−(−a) = a.
Lemma 1.5.26. Sind a und b invertierbare Elemente eines Monoids, so ist auch
a>b invertierbar mit Inversem (a>b) = b̄>ā.
Beweis. In der Tat rechnen wir schnell (a>b)>(b̄>ā) = e = (b̄>ā)>(a>b).
Diese Formel ist auch aus dem täglichen Leben vertraut: Wenn man sich morgends
zuerst die Strümpfe anzieht und dann die Schuhe, so muß man abends zuerst die
Schuhe ausziehen und dann die Strümpfe.
1.5.27. In additiver Notation liest sich das −(a + b) = (−b) + (−a) oder, da
additiv notierte Monoide stets als abelsch angenommen werden, gleichbedeutend
−(a + b) = (−a) + (−b).
35
1.5.28 (Gruppe der invertierbaren Elemente eines Monoids). Die invertier-
baren Elemente eines Monoids bilden offensichtlich stets eine Gruppe. Für die
Gruppe der invertierbaren Elemente eines multiplikativ notierten Monoids M ver-
wenden wir die Notation M × .
1.5.29 (Negativ iterierte Verknüpfung invertierbarer Elemente). Ist (A, >) ein
Monoid und a ∈ A invertierbar, so erweitern wir unsere Notation n> a aus 1.5.14
weiter auf alle ganzen Zahlen n ∈ Z, indem wir für n negativ setzen n> a :=
(−n)> ā. Dann gelten offensichtlich sogar für alle m, n ∈ Z und a, b ∈ A× mit
a>b = b>a die für m, n ∈ N bereits aus 1.5.14 bekannten Regeln
1. (n + m)> a = (n> a)>(m> a)
2. (nm)> a = n> (m> a)
3. n> (a>b) = (n> a)>(n> b)
1.5.30 (Negativ iterierte Verknüpfung in additiver Notation). Im Fall additiv
notierter Monoide erweitern wir unsere Notation na := n> a für Elemente a mit
Negativem auf alle n ∈ Z und finden für jedes Element a mit Negativem insbeson-
dere (−1)a = −a sowie die Regeln (n + m)a = (na) + (ma), (nm)a = n(ma)
und n(a + b) = (na) + (nb) für alle n, m ∈ Z und alle Elemente a, b mit Negati-
vem. Wenn ich es genau nehmen will, schreibe ich auch hier n+ a.
1.5.31 (Negativ iterierte Verknüpfung in multiplikativer Notation). Im Fall
multiplikativ notierter Monoide erweitern wir unsere Notation an := n> a für
invertierbare Elemente a auf alle n ∈ Z und finden für jedes invertierbare Ele-
ment a insbesondere a−1 = ā. Das nehmen wir hinfort als unsere übliche No-
tation für multiplikative Inverse. Unsere drei Regeln erhalten dann die Gestalt
an+m = (an )(am ), anm = (an )m und (ab)n = (an )(bn ) für alle n, m ∈ Z und a, b
invertierbar mit ab = ba.
Definition 1.5.32. Seien (A, >) und (B, ⊥) Magmas. Ein Homomorphismus
von Magmas ist eine Abbildung ϕ : A → B mit
Definition 1.5.33. Seien (A, >) und (B, ⊥) Monoide. Ein Homomorphismus
von Monoiden ist ein Magmahomomorphismus ϕ : A → B, der das neutrale
Element auf das neutrale Element abbildet.
Definition 1.5.34. Seien (A, >) und (B, ⊥) Gruppen. Ein Homomorphismus
von Gruppen ist ein Monoidhomomorphismus ϕ : A → B.
Beispiele 1.5.35. 1. Die Multiplikation mit einer festen Zahl a ∈ Z ist ein
Gruppenhomomorphismus (a·) : (Z, +) → (Z, +).
36
2. Das Potenzieren n 7→ q n ist für alle q ∈ Q ein Monoidhomomorphis-
mus (N, +) → (Q, ·) und für q 6= 0 sogar ein Gruppenhomomorphismus
(Z, +) → (Q, ·).
3. Allgemeiner ist für jedes Element q eines Monoids (M, >) das Iterieren
n 7→ n> q ein Monoidhomomorphismus (N, +) → (M, >), ja der einige
Monoidhomomorphismus mit 1 7→ q, und für invertierbares q sogar ein
Monoidhomomorphismus (Z, +) → (M, >), wieder der einzige mit 1 7→ q.
1.5.36. Ein Isomorphismus bezeichnet einen bijektiven Homomorphismus, des-
sen Umkehrabbildung auch ein Homomorphismus für die jeweiligen Strukturen
ist. Im Fall von Magmas oder Monoiden ist jeder bijektive Homomorphismus ein
Isomorphismus. Ein erstes Beispiel für einen bijektiven Homomorphismus, der
kein Isomorphismus ist, lernen wir in 2.2.4 im Zusammenhang mit teilgeordneten
Mengen kennen.
Übungen
Übung 1.5.37. In einer Gruppe (G, >) ist das neutrale Element e ∈ G das einzige
Element x ∈ G mit x>x = x. Jeder Magmahomomorpismus von einem Monoid
in eine Gruppe ist bereits ein Monoidhomomorphismus.
Übung 1.5.38. Sei Z eine Menge. Das Schneiden von Teilmengen ist eine Verk-
nüpfung
∩ : P(Z) × P(Z) → P(Z)
(A, B) 7→ A ∩ B
auf der Potenzmenge. Dasselbe gilt für die Vereinigung und das Bilden der Diffe-
renzmenge. Welche dieser Verknüpfungen sind kommutativ oder assoziativ? Wel-
che besitzen neutrale Elemente?
Ergänzende Übung 1.5.39. Man gebe die Wahrheitstafeln für ⇒ und ⇔ an. Be-
zeichne weiter ¬ : {Wahr, Falsch} → {Wahr, Falsch} die „Verneinung“. Man
zeige, daß die Formel
(A ⇒ B) ⇔ ((¬B) ⇒ (¬A))
beim Einsetzen beliebiger Wahrheitswerte aus {Wahr, Falsch} für A und B stets
den Wert Wahr ausgibt.
Übung 1.5.40. Ein Element a eines Monoids M ist invertierbar genau dann, wenn
es b, c ∈ M gibt mit b>a = e = a>c für e das neutrale Element.
Übung 1.5.41 (Kürzen). Sind a, b, c Elemente eines Monoids und ist a invertier-
bar, so folgt aus a>b = a>c bereits b = c. Ebenso folgt aus b>a = c>a bereits
b = c.
37
Übung 1.5.42. Gegeben eine Menge Z ist das Bilden des Komplements ein Mo-
noidhomomorphismus (P(Z), ∩) → (P(Z), ∪).
Übung 1.5.43. Jeder Monoidhomomorphismus M → N bildet invertierbare Ele-
mente auf invertierbare Elemente ab und induziert so einen Gruppenhomomor-
phismus M × → N × .
Übung 1.5.44. Jeder Monoidhomomorphismus ϕ : (M, >) → (N, ⊥) kommu-
tiert mit dem Iterieren, in Formeln ϕ(n> x) = n⊥ (ϕ(x)) für alle n ∈ N, x ∈ M
und ebenso für alle n ∈ Z, x ∈ M × .
Definition 1.6.2. Ein Ring (R, +, ·) ist eine Menge R mit zwei Verknüpfungen,
genannt die Addition + und die Multiplikation · des Rings, derart daß die fol-
genden drei Bedingungen erfüllt sind:
a · (b + c) = (a · b) + (a · c) ∀a, b, c ∈ R
(b + c) · a = (b · a) + (c · a) ∀a, b, c ∈ R
Ein Ring, dessen Multiplikation kommutativ ist, heißt ein kommutativer Ring
und bei uns kürzer auch Kring. Die Gruppe (R, +) heißt die additive Gruppe
des Rings.
Beispiel 1.6.3. Die ganzen Zahlen (Z, +, ·) bilden einen kommutativen Ring. Die
einelementige Menge ist mit der einzig möglichen Verknüpfung als Addition und
Multiplikation ein Ring, der Nullring.
Definition 1.6.4. Ein Körper (K, +, ·) ist ein kommutativer Ring, dessen multi-
plikativ invertierbare Elemente genau alle vom neutralen Element 0K von (K, +)
verschiedenen Elemente sind, in Formeln
38
1.6.5. Das neutrale Element jedes Monoids ist invertierbar, folglich muß nach un-
seren Annahmen in einem Körper K das neutrale Element 1K des multiplikativen
Monoids (K, ·) von 0K verschieden sein, in Formeln
1K 6= 0K
Die Gruppe invertierbaren Elemente von K × = (K, ·)× eines Körpers K heißt
die multiplikative Gruppe des Körpers.
Beispiele 1.6.6. Ein erstes Beispiel ist der Körper der rationalen Zahlen (Q, +, ·).
Ein anderes Beispiel ist der zweielementige Körper mit den durch die Axiome er-
zwungenen Rechenregeln, der fundamental ist in der Informatik. Die ganzen Zah-
len (Z, +, ·) bilden keinen Körper, da (Z\{0}, ·) keine Gruppe ist, da es nämlich
in Z\{0} nur für 1 und −1 ein multiplikatives Inverses gibt.
Ergänzung 1.6.7 (Ursprung der Terminologie). Der Begriff „Körper“ ist in die-
sem Zusammenhang wohl zu verstehen als „besonders gut unter den verschiedens-
ten Rechenoperationen abgeschlossener Zahlbereich“, in Analogie zu geometri-
schen Körpern wie Kugeln oder Zylindern, die man entsprechend als „besonders
gut in sich geschlossene Bereiche des Raums“ ansehen könnte. Die Bezeichnung
als „Distributivgesetz“ rührt daher, daß uns dieses Gesetz erlaubt, beim Multipli-
zieren eines Elements mit einer Summe den „Faktor auf die Summanden zu vertei-
len“. Das Wort „distribution“ für Verteilung von Nahrungsmitteln und dergleichen
auf Französisch und Englisch kommt von demselben lateinischen Wortstamm, auf
die auch unsere Bezeichnung „Distributivgesetz“ zurückgeht.
1.6.8 (Weglassen von Multiplikationssymbolen). Beim Rechnen mit Buchsta-
ben werden wir meist ab := a · b abkürzen. Das wäre beim Rechnen mit durch Zif-
fernfolgen dargestellten Zahlen wenig sinnvoll, da man dann nicht wissen könnte,
ob 72 nun als „Zweiundsiebzig“ oder vielmehr als „Sieben mal Zwei“ zu verste-
hen sein soll. Beim Einsetzen von Zahlen für die Buchstaben müssen also wieder
Multiplikationssymbole eingefügt werden.
Ergänzung 1.6.9 (Weglassen von Additionssymbolen). In der Schule und au-
ßerhalb der Mathematik ist es üblich, 1 + 21 mit 1 12 abzukürzen und „Andert-
halb Stunden“ zu sagen oder „Dreieinviertel Pfund“. In diesem Fall wird also
ein Additionssymbol weggelassen. Das ist jedoch in der höheren Mathematik
nicht üblich. In der gesprochenen Sprache ist es noch viel merkwürdiger. Neun-
zehnhundertvierundachzig versteht jeder, in Symbolen geschrieben sieht 9 10 100
4 + 80 dahingegen ziemlich sinnlos aus, und statt der üblichen Interpretation
((9+10)100)+4+80 wären durchaus auch andere Interpretationen denkbar. In der
gesprochenen Sprache scheint eher eine Konvention befolgt zu werden, nach der
die Operationen der Reihe nach auszuführen sind wie bei einem Taschenrechner,
wobei eine Multiplikation gemeint ist, wenn die zuerst genannte Zahl die Klei-
nere ist, und eine Addition, wenn sie die Größere ist. Nur die Zahlen von 13 bis
39
19 scheinen dieser Regel nicht zu gehorchen. Kein Wunder, daß es Erstklässlern
schwer fällt, sich den Zahlenraum zu erschließen, wenn sie zuvor dieses Dickicht
von Konventionen durchdringen müssen.
1.6.10 (Punkt vor Strich). Wir vereinbaren zur Vermeidung von Klammern die
Regel „Punkt vor Strich“, so daß also zum Beispiel unter zusätzlicher Beachtung
unserer Konvention des Weglassens von Multiplikationssymbolen, in diesem Fall
das Weglassen des Punktes, das Distributivgesetz kürzer in der Form a(b + c) =
ab + ac geschrieben werden kann.
1.6.11 (Brüche). Gegeben ein Körper K und Elemente a, b ∈ K mit b 6= 0K
vereinbaren wir die Notation
a
:= ab−1
b
Sie werden zur Übung zeigen, daß die üblichen Regeln der Bruchrechnung auch
in dieser Allgemeinheit gelten.
1. a · 0R = 0R = 0R · a ∀a ∈ R
2. (−1R ) · a = −a = a · (−1R ) ∀a ∈ R
3. (−1R )(−1R ) = 1R
4. (−a)(−b) = ab ∀a, b ∈ R
40
Abbildung (·b) : a 7→ ab ein Monoidhomomorphismus (R, +) → (R, +)
ist und folglich nach Übung 1.5.44 gilt
1.6.13 (Binomische Formel). Für alle a, b in einem Ring R mit ab = ba und alle
n ∈ N gilt die binomische Formel
n
n
X n ν n−ν
(a + b) = a b
ν=0
ν
Um das einzusehen prüft man, daß wir bei der Herleitung nach 1.1.23 nur Ring-
axiome und die Eigenschaft ab = ba verwandt haben. Man beachte hierbei unsere
Konvention 00R = 1R aus 1.5.16, angewandt auf das Monoid (R, ·). Die Multipli-
kation mit den Binomialkoeffizienten in dieser Formel ist zu verstehen als wie-
derholte Addition im Sinne der Bezeichnungskonvention na = n+ a aus 1.5.15,
angewandt auf den Spezialfall der additiven Gruppe unseres Rings.
1.6.14 (Minus mal Minus gibt Plus). Die Frage, wie das Produkt zweier nega-
tiver Zahlen zu bilden sei, war lange umstritten. Mir scheint der vorhergehende
Beweis das überzeugendste Argument für „Minus mal Minus gibt Plus“ : Es sagt
salopp gesprochen, daß man diese Regel vereinbaren muß, wenn man beim Rech-
nen das Ausklammern ohne alle Einschränkungen erlauben will.
1.6.15. Den Begriff eines Homomorphismus verwendet man bei Mengen mit
mehr als einer Verknüpfung analog. Zum Beispiel ist ein Ringhomomorphismus
ϕ von einem Ring R in einen Ring S definiert als eine Abbildung ϕ : R → S
derart, daß gilt ϕ(a + b) = ϕ(a) + ϕ(b) und ϕ(ab) = ϕ(a)ϕ(b) für alle a, b ∈ R
sowie ϕ(0R ) = 0S und ϕ(1R ) = 1S . Die Bedingung ϕ(0R ) = 0S ist nach 1.5.37
an dieser Stelle sogar überflüssig. In anderen Worten mag man einen Ringhomo-
morphismus auch definieren als eine Abbildung, die sowohl für die Addition als
auch für die Multiplikation ein Monoidhomomorphismus ist. Einen Ringhomo-
morphismus zwischen Körpern nennt man einen Körperhomomorphismus.
1.6.16. Gegeben ein bijektiver Ringhomomorphismus ist auch seine Umkehrab-
bildung ein Ringhommorphismus und wir dürfen einen bijektiven Ringhomo-
morpismus deshalb einen Ringisomorphismus und im Fall von Körpern einen
Körperisomorphismus nennen.
Satz 1.6.17 (Ganze Zahlen und allgemeine Ringe). Für jeden Ring R gibt es
genau einen Ringhomomorphismus ϕ : Z → R. Er wird gegeben durch die Vor-
schrift ϕ(n) = n+ 1R .
Beweis. Um den Überblick zu behalten, verwende ich hier die Notation n+ a statt
na für die iterierte Verknüpfung im Sinne von 1.5.29, also n+ a = a + a + . . . + a
41
mit n Summanden im Fall n ≥ 1. Wir wissen aus 1.5.35, daß n 7→ n+ a für alle
a ∈ R der einzige Gruppenhomomorphismus (Z, +) → (R, +) ist mit 1 7→ a.
Für einen Ringhomomorphismus muß aber gelten ϕ(1) = 1R , also muß er durch
die Formel ϕ(n) = n+ 1R gegeben sein. Es bleibt zu zeigen, daß diese Abbildung
ϕ mit der Multiplikation verträglich ist, in Formeln ϕ(nm) = ϕ(n)ϕ(m). Dazu
rechnen wir
ϕ(nm) = (nm)+ 1R per definitionem,
= n+ (m+ 1R ) nach der zweiten Iterationsregel 1.5.29,
= n+ (1R (m+ 1R )) weil 1R neutral ist in (R, ·),
= (n+ 1R )(m+ 1R ) nach der letzten Regel in 1.6.12,
= ϕ(n)ϕ(m) per definitionem.
1.6.18. Gegeben ein Ring R und n ∈ Z verwenden wir oft die Abkürzungen
n+ 1R = nR = n. Unser Satz zeigt, daß es meist nicht so genau darauf ankommt,
ob n nun eine ganze Zahl oder das Element nR eines abstrakten Rings bedeutet.
Insbesondere kürzt man eigentlich immer 0R ab durch 0 und 1R durch 1. Man
beachte jedoch, daß für verschiedene ganze Zahlen n 6= m durchaus nR = mR
gelten kann: Ist etwa R = K ein Körper mit zwei Elementen, so gilt nK = 0K für
gerades n und nK = 1K für ungerades n. Vom höheren Standpunkt wird das alles
in [LA1] 5.1.11 nocheinmal ausführlich diskutiert werden.
1. ab = 0K ⇒ (a = 0K oder b = 0K )
2. ac
bd
= ac
bd
für alle a, c ∈ K und b, d ∈ K ×
3. ac
bc
= a
b
für alle a ∈ K und b, c ∈ K ×
4. a
b
+ c
d
= ad+bc
bd
für alle a, c ∈ K und b, d ∈ K ×
4. Das wird bewiesen, indem man die Brüche auf einen Hauptnenner bringt
und das Distributivgesetz anwendet.
42
Übungen
Übung 1.6.20. Jeder Ring R mit 0R = 1R hat nur ein einziges Element.
Übung 1.6.21. Ist K ein Körper derart, daß es kein x ∈ K gibt mit x2 = −1,
so kann man die Menge K × K = K 2 zu einem Körper machen, indem man die
Addition und Multiplikation definiert durch
(a, b) + (c, d) := (a + c, b + d)
(a, b) · (c, d) := (ac − bd, ad + bc)
43
2 Die reellen Zahlen
2.1 Rationale Wurzeln rationaler Zahlen
Satz 2.1.1. Es gibt keine rationale Zahl x ∈ Q mit x2 = 2.
2.1.2. Dieser Satz erklärt, warum wir uns mit den rationalen Zahlen nicht zu-
frieden geben. In der Tat suchen wir nach einem Zahlbereich, in dem jeder „an-
schaulichen Länge“, wie zum Beispiel der Länge der Diagonale eines Quadrats
der Kantenlänge Eins, auch tatsächlich eine Zahl entspricht. Wir zeigen in 3.3.14,
daß im Zahlbereich der reellen Zahlen immerhin aus allen nichtnegativen Zahlen
Quadratwurzeln gezogen werden können, und diskutieren in 3.4.1, wie sich sogar
unsere anschauliche Vorstellung von der Länge des Einheitskreises zur Definition
einer reellen Zahl präzisieren läßt.
Erster Beweis. Setzen wir die in [LA1] 4.4.8 bewiesene Eindeutigkeit der Prim-
faktorzerlegung als bekannt voraus, so folgt unmittelbar, daß das Quadrat eines
unkürzbaren Bruches mit Nenner 6= ±1 wieder ein unkürzbarer Bruch mit Nen-
ner 6= ±1 sein muß. Für eine rationale Zahl x ∈ Q folgt aus x 6∈ Z also x2 6∈ Z.
Gäbe es mithin eine rationale Zahl x ∈ Q mit x2 = 2, so müßte x bereits selbst
eine ganze Zahl sein. Offensichtlich gibt es jedoch keine ganze Zahl x ∈ Z mit
x2 = 2.
Zweiter Beweis. Ohne die Eindeutigkeit der Primfaktorzerlegung als bekannt vor-
auszusetzen können wir in unserer speziellen Situation auch elementarer mit dem
Primfaktor 2 durch Widerspruch argumentieren: Nehmen wir an, wir fänden gan-
ze Zahlen p, q ∈ Z mit q 6= 0 derart, daß x = p/q ein unkürzbarer Bruch wäre mit
x2 = 2. Es folgte p2 = 2q 2 , also p2 gerade, also p gerade, also p2 durch 4 teilbar,
also q 2 gerade, also q gerade. Dann wäre unser Bruch aber doch kürzbar gewesen,
nämlich durch 2.
44
2.2 Angeordnete Körper
Definition 2.2.1. Eine Relation T auf einer Menge X ist eine Teilmenge T ⊂
X × X des kartesischen Produkts von X mit sich selbst, also eine Menge von
Paaren von Elementen von X. Statt (x, y) ∈ T schreiben wir in diesem Zusam-
menhang meist xT y.
Definition 2.2.2. Eine Relation T auf einer Menge X heißt eine Ordnungsrelati-
on oder eine Teilordnung oder eine partielle Ordnung, wenn für alle x, y, z ∈ X
gilt:
1. Transitivität: (xT y und yT z) ⇒ xT z;
45
x 6= y) mit x > y. Auf jeder angeordneten Menge definieren wir Verknüpfungen
max und min in offensichtlicher Verallgemeinerung von 1.5.3.
Definition 2.2.7. Ein angeordneter Kring ist ein Kring (R, +, ·) mit einer An-
ordnung ≤ derart, daß für beliebige Elemente x, y, z ∈ R gilt:
1. x ≥ y ⇒ x + z ≥ y + z;
2. (x ≥ 0 und y ≥ 0) ⇒ xy ≥ 0.
Eine Anordnung eines Krings mit diesen Eigenschaften nennen wir eine Kring-
anordnung. Die Elemente x ∈ R mit x > 0 beziehungsweise x < 0 nennen
wir positiv beziehungsweise negativ. Die Elemente mit x ≥ 0 beziehungsweise
x ≤ 0 nennen wir nichtnegativ beziehungsweise nichtpositiv. Ein angeordneter
Körper ist ein Körper mit einer Kringanordnung.
Beispiel 2.2.8. Der Ring Z der ganzen Zahlen ist mit seiner üblichen Anordnung
ein angeordneter Kring. Der Körper Q der rationalen Zahlen ist mit seiner übli-
chen Anordnung ein angeordneter Körper. Dasselbe wird auch für den Körper R
der „reellen Zahlen“ gelten, den wir demnächst einführen.
2.2.9 (Eigenschaften angeordneter Kringe). Wir listen einige Tatsachen auf, die
in beliebigen angeordneten Kringen R gelten.
1. (x ≤ y und a ≤ b) ⇒ (x + a ≤ y + b)
In der Tat folgt aus den Annahmen x + a ≤ y + a ≤ y + b.
3. (0 ≤ x ≤ y und 0 ≤ a ≤ b) ⇒ (0 ≤ xa ≤ yb)
In der Tat erhalten wir 0 ≤ xa ≤ ya ≤ yb.
4. (x ≤ y) ⇒ (−y ≤ −x)
Das folgt durch Addition von (−y − x) auf beiden Seiten.
6. x2 ≥ 0
In der Tat ist x2 = (−x)2 und wir haben x ≥ 0 ⇔ (−x) ≤ 0.
46
7. 1 ≥ 0
In der Tat gilt 1 = 12 .
Definition 2.2.12. Für jeden angeordneten Kring R definieren wir eine Abbildung
R → R, x 7→ |x|, genannt der Absolutbetrag oder kürzer Betrag, durch die
Vorschrift
x falls x ≥ 0;
|x| :=
−x falls x < 0.
47
2.2.13 (Eigenschaften des Absolutbetrags). Wir listen einige Eigenschaften des
Absolutbetrags auf. Der Beweis der ersten fünf sei dem Leser überlassen.
1. x ≤ |x|
2. |x| = 0 ⇔ x = 0
3. |−x| = |x|
4. |xy| = |x||y|
In Worten ist also der Betrag einer Summe stets kleinergleich der Summe
der Beträge der Summanden. In der Tat gilt ja x + y ≤ |x| + |y| und ebenso
auch −(x + y) ≤ |x| + |y|. Unsere Ungleichung heißt deshalb Dreiecks-
ungleichung, weil sie in einem allgemeineren Kontext sagt, daß in einem
Dreieck zwei Seiten zusammen stets länger sind als die Dritte.
Übungen
Übung 2.2.15. In jedem angeordneten Körper gilt:
48
3. Aus |y − b| ≤ η ≤ |b|/2 und b 6= 0 folgt y 6= 0 und |1/y − 1/b| ≤ 2η/|b|2 .
Ergänzende Übung 2.2.16. In jedem angeordneten Ring gilt für x ≥ −1 und
n ∈ N die sogenannte Bernoulli-Ungleichung (1 + x)n ≥ 1 + nx. Hinweis:
Vollständige Induktion.
Übung 2.2.17. Seien K ein angeordneter Körper und I ⊂ K ein Intervall, in
Formeln (x < y < z und x, z ∈ I) ⇒ y ∈ I. Wir nennen eine Funktion φ :
I → K konvex, wenn „ihr Graph unter jeder seiner Sekanten liegt“, wenn also in
Formeln für alle x < y < z aus I gilt
φ(x) − φ(y) φ(y) − φ(z)
≤
x−y y−z
Man zeige in dieser SituationP für beliebige x1 , . . . , xn ∈ I und beliebige nichtne-
gative µ1 , . . . , µn ∈ K≥0 mit ni=1 µi = 1 die Jensen’sche Ungleichung
n
! n
X X
φ µ i xi ≤ µi φ(xi )
i=1 i=1
In Worten ist also „der Funktionswert beim gewichteten Mittel der xi beschränkt
durch das gewichtete Mittel der Funktionswerte“. Hinweis: Die Voraussetzung
läßt sich als der Fall n = 2 verstehen. Davon ausgehend führt Induktion ans Ziel.
49
Eine teilgeordnete Menge mit zwei minimalen und einem
maximalen Element, die weder ein kleinstes noch ein größtes
Element besitzt. Die Darstellung ist in der Weise zu verstehen,
daß die fetten Punkte die Elemente unserer Menge bedeuten und
daß ein Element größer ist als ein anderers genau dann, wenn es
von diesem „durch einen aufsteigenden Weg erreicht werden
kann“.
50
Definition 2.3.3. Seien (X, ≤) eine teilgeordnete Menge und Y ⊂ X eine Teil-
menge.
Definition 2.3.4. Seien (X, ≤) eine teilgeordnete Menge und Y ⊂ X eine Teil-
menge.
2. Ein Element i ∈ X heißt die größte untere Schranke oder lateinischer das
Infimum von Y in X, wenn i das größte Element ist in der Menge {u ∈
X | u ist untere Schranke von Y }. Wir schreiben dann i = inf Y = inf X Y .
Übungen
Übung 2.3.7. Die Menge {x ∈ Q | x2 ≤ 2} besitzt in Q keine größte untere
Schranke.
Übung 2.3.8. Sei X eine teilgeordnete Menge. Besitzt eine Teilmenge Y ⊂ X
ein größtes Element g ∈ Y , so gilt g = sup Y . Besitzt eine Teilmenge Y ⊂ X
ein kleinstes Element k ∈ Y , so gilt k = inf Y . Sind Teilmengen Z ⊂ Y ⊂ X
gegeben und besitzen Z und Y ein Supremum in X, so gilt sup Z ≤ sup Y .
51
Die Menge Y = {1/n | n ∈ N≥1 } besitzt in Q eine größte untere Schranke,
nämlich die Null, in Formeln inf Y = 0. Sie besitzt in Q auch eine kleinste obere
Schranke, nämlich die Eins, in Formeln sup Y = 1.
52
Ergänzende Übung 2.3.9 (Teilordnungen und Verbandsstrukturen). Erklären
wir auf einer teilgeordneten Menge B, in der jede zweielementige Teilmenge ein
Supremum und ein Infimum hat, die beiden Verknüpfungen ∨ und ∧ durch a∨b :=
sup{a, b} und a ∧ b := inf{a, b}, so erhalten wir einen Verband im Sinne von
[GR] 2.6.3. Erklären wir umgekehrt auf einem Verband (B, ∨, ∧) eine Relation
R durch aRb genau dann, wenn a ∨ b = b oder gleichbedeutend a = a ∧ b,
so ist R ein Teilordnung und jede zweielementige Teilmenge hat ein Supremum
und ein Infimum. Schließlich sind diese beiden Konstruktionen zueinander inverse
Bijektionen zwischen Verbandsstrukturen und Teilordnungen mit der fraglichen
Eigenschaft auf jeder festen Menge B.
53
besitzt;
2.4.4. Durch Multiplikation mit (−1) sehen wir, daß die im Satz formulierte „In-
fimumseigenschaft“ im Fall eines angeordneten Körpers gleichbedeutend ist zur
Supremumseigenschaft, daß jede nichtleere Teilmenge mit einer oberen Schran-
ke auch eine kleinste obere Schranke besitzt.
2.4.5. Die im Satz gegebene Charakterisierung trifft auf den angeordneten Körper
der rationalen Zahlen nicht zu. Zum Beispiel wissen wir nach 2.3.7, daß die Men-
ge {x ∈ Q | x2 ≤ 2} in Q keine größte untere Schranke besitzt. Sie ist jedoch
nicht leer und besitzt in Q durchaus untere Schranken, nur eben keine größte.
Beweis von [Link]. Wir konstruieren einen derartigen Körper R = RD als eine
Menge R ⊂ P(Q) von Teilmengen der Menge Q aller rationalen Zahlen,
α ist nicht leer,
α hat eine untere Schranke,
R := α⊂Q
α hat kein kleinstes Element,
α enthält mit x auch jedes y > x.
Man nennt solch ein α einen Dedekind’schen Schnitt und bezeichnet die so kon-
struierte Menge R als das „Dedekind’sche Modell der reellen Zahlen“. Auf un-
serer Menge R von Teilmengen von Q ist die Inklusionsrelation eine Anordnung
und wir schreiben α ≤ β statt α ⊃ β. Ist Y ⊂ R eine nichtleere Teilmenge mit
unterer Schranke, so liegt offensichtlich auch die Vereinigung
[
α = {q ∈ Q | Es gibt α ∈ Y mit q ∈ α}
α∈Y
aller Teilmengen aus Y in R und ist das Infimum von Y . Damit haben wir bereits
eine angeordnete Menge mit der geforderten Eigenschaft konstruiert. Wir müssen
darauf nur noch eine Addition und eine Multiplikation erklären derart, daß unsere
Struktur zu einem angeordneten Körper wird. Die Addition ist unproblematisch:
Wir setzen
α + β := {x + y | x ∈ α, y ∈ β}
und prüfen mühelos, daß aus α, β ∈ R schon folgt α + β ∈ R, daß R so zu einer
kommutativen Gruppe wird mit neutralem Element 0R = {x ∈ Q | x > 0}, und
daß gilt α ≤ β ⇒ α + γ ≤ β + γ für alle α, β, γ ∈ R. Das Negative zu α
54
Zum Infimum in R
55
kann man etwa erhalten, indem man die Menge {y ∈ Q | y + x > 0 ∀x ∈ α}
betrachtet und ihr für den Fall, daß sie ein kleinstes Element haben sollte, das
noch wegnimmt. Wir erlauben uns nun die Abkürzung 0R = 0. Die Multiplikation
positiver Elemente ist ebenfalls unproblematisch: Für α, β ∈ R mit α > 0, β > 0
setzen wir
αβ := {xy | x ∈ α, y ∈ β}
und prüfen mühelos, daß aus α, β ∈ R>0 schon folgt αβ ∈ R>0 und daß R>0 so
zu einer kommutativen Gruppe mit neutralem Element 1R = {x ∈ Q | x > 1}
wird. Das Distributivgesetz in Q impliziert mit diesen Definitionen auch sofort
die Regel
α(β + γ) = αβ + αγ
für alle α, β, γ ∈ R>0 . Um unsere Multiplikation so auf ganz R auszudehnen, daß
R ein angeordneter Körper wird, verwenden wir das anschließende technische
Lemma 2.4.6. Eine Beweisskizze für die in Teil 2 behauptete Eindeutigkeit geben
wir zu Ende dieses Abschnitts.
Lemma 2.4.6. Sei (R, +) eine kommutative Gruppe mit einer Anordnung ≤ der-
art, daß gilt α ≤ β ⇒ α + γ ≤ β + γ ∀α, β, γ ∈ R. Sei auf R>0 eine Verknüpfung
(α, β) 7→ αβ gegeben, die R>0 zu einem kommutativen Monoid macht. Es gelte
außerdem die Regel
Beweis. Wenn die Fortsetzung unserer Multiplikation auf ganz R das Distributiv-
gesetz erfüllen soll, müssen wir notwendig setzen
0 α = 0 oder β = 0;
−((−α)β) α < 0, β > 0;
αβ :=
−(α(−β)) α > 0, β < 0;
(−α)(−β) α < 0, β < 0.
Es gilt nun, für diese Multiplikation Kommutativität und die Ringaxiome nachzu-
weisen. Unsere Multiplikation auf R ist offensichtlich kommutativ und assoziativ
und macht R\{0} zu einem Monoid. Wir müssen also nur noch das Distributiv-
gesetz
α(β + γ) = αβ + αγ ∀α, β, γ ∈ R
56
nachweisen. Ohne Beschränkung der Allgemeinheit dürfen wir hierbei α > 0 und
β + γ > 0 annehmen. Die einzigen nicht offensichtlichen Fälle sind dann β > 0,
γ < 0 beziehungsweise β < 0, γ > 0. Sei ohne Beschränkung der Allgemeinheit
β > 0, γ < 0. Nach unseren Annahmen gilt ja die Regel
2. Für jede positive reelle Zahl ε > 0 gibt es eine positive natürliche Zahl
n ≥ 1 mit 0 < n1 < ε;
4. Zwischen zwei verschiedenen reellen Zahlen liegt stets noch eine rationale
Zahl, in Formeln: Gegeben x < y in R gibt es r ∈ Q mit x < r < y.
2.4.11. Dies Korollar gilt mit demselben Beweis für jeden archimedisch angeord-
neten Körper.
Beweis. Die erste Aussage folgt aus 2.4.9. Um die Zweite zu zeigen, suche man
n > 1/ε. Die dritte Aussage folgt unmittelbar aus der zweiten. Um die vierte
Aussage zu zeigen, suchen wir zunächst n ∈ N, n ≥ 1 mit 0 < n1 < y − x, also
57
1 < ny − nx, das heißt 1 + nx < ny. Nun gibt es a, b ∈ Z mit a < ny < b, also
gibt es eine größte ganze Zahl m mit m < ny und folglich ny ≤ m + 1, woraus
hinwiederum folgt nx < m und dann x < m n
< y.
Definition 2.4.12. Mit einem endlichen Dezimalausdruck wie 3,141 bezeichnet
man wie auf der Schule die rationale Zahl 3141/1000. Die durch einen unend-
lichen Dezimalausdruck wie 3,1415 . . . dargestellte reelle Zahl erklären wir als
das Supremum der Menge ihrer endlichen Teilausdrücke beziehungsweise das In-
fimum, wenn ein Minus davorsteht. Wir setzen also zum Beispiel
3
3,1
3,14
3,1415 . . . := sup
3,141
3,1415
...
Die Elemente der Menge aller endlichen Teilausdrücke haben wir hier nur der
Übersichtlichkeit halber untereinander geschrieben, statt sie durch Kommata zu
trennen, und rationale Zahlen haben wir stillschweigend mit ihren Bildern in R
identifiziert.
Beispiel 2.4.13. Ich zeige 1 = 0, 99999 . . . Nach unserer Konvention 2.4.12 gilt
es zu zeigen 1 = sup{1 − 10−n | n ∈ N≥1 }. Eine evidente Rechnung zeigt, daß
es äquivalent ist, 0 = inf{10−n | n ∈ N≥1 } zu zeigen, und das folgt unmittelbar
aus Korollar 2.4.10, in dem wir 0 = inf{1/k | k ∈ N≥1 } gezeigt hatten.
Proposition 2.4.14. 1. Jede reelle Zahl läßt sich durch einen unendlichen De-
zimalausdruck darstellen;
2. Genau dann stellen zwei verschiedene unendliche Dezimalausdrücke die-
selbe reelle Zahl dar, wenn es eine Stelle vor oder nach dem Komma gibt
und eine von Neun verschiedene Ziffer z derart, daß die beiden Dezimal-
ausdrücke bis zu dieser Stelle übereinstimmen, ab dieser Stelle jedoch der
eine die Form z99999 . . . hat und der andere die Form (z + 1)00000 . . .
Beweis. Für den ersten Teil reicht es zu zeigen, daß sich jede nichtnegative reelle
Zahl y ≥ 0 als ein unendlicher Dezimalausdruck darstellen läßt. Nehmen wir zu
jedem s ∈ N die größte reelle Zahl rs ≤ y unter y mit höchstens s Stellen nach
dem Komma, so gilt
y = sup{r0 , r1 , r2 , . . .}
In der Tat ist y eine obere Schranke dieser Menge, aber jede reelle Zahl x < y
ist keine obere Schranke dieser Menge: Nach 2.4.10 oder, genauer, seinem Be-
weis gibt es nämlich für jedes x ∈ R mit x < y ein s ∈ N und ein m ∈ Z mit
58
x < m · 10−s < y, als da heißt, es gibt ein s mit x < rs . Um den zweiten Teil
zu zeigen, dürfen wir uns weiter auf nichtnegative Zahlen beschränken. Wir se-
hen wie in 2.4.13, daß jeder Dezimalausdruck mit einer Neunerperiode dieselbe
reelle Zahl darstellt wie ein geeigneter anderer Dezimalausdruck ohne Neunerpe-
riode. Betrachten wir nun zwei verschiedene Dezimalausdrücke ohne Neunerperi-
ode und zeigen, daß sie verschiedene reelle Zahlen darstellen. Ohne Beschränkung
der Allgemeinheit seien sie gleich vor dem Komma, aber verschieden in der ersten
Nachkommastelle. Ohne Beschränkung der Allgemeinheit mögen sie sogar beide
nur eine Null vor dem Komma haben. Nach dem Komma habe der Dezimalaus-
druck a die Ziffern a1 , a2 , . . . und der Dezimalausdruck b die Ziffern b1 , b2 , . . . und
ohne Beschränkung der Allgemeinheit gelte a1 > b1 . Wir finden nach Annahme
ein r ≥ 1 mit br 6= 9. Bezeichne α, β ∈ R die durch unsere beiden Dezimalaus-
drücke dargestellten reellen Zahlen. Dann gilt offensichtlich
a1 a1 1
α≥ > − r ≥β
10 10 10
Beweisskizze für [Link]. Wir gehen von der Bijektion zwischen einem beliebi-
gen angeordneten Körper R mit der Supremumseigenschaft und der Menge al-
ler „Dezimalausdrücken ohne Neunerperiode“ aus 2.4.14 aus. verwendet zusam-
men mit der in den Übungen 2.4.18, 2.4.19 und 2.4.20 gegebenen Beschreibung
von Addition und Multiplikation von Dezimalausdrücken. Dieser Beweis ist zwar
vom höheren Standpunkt aus nicht besonders geschickt oder natürlich, aber da-
für vielleicht vom Schulstoff aus besser zugänglich. Ein Zugang „vom höheren
Standpunkt“ wird in Übung 2.4.21 skizziert. Daß jeder Körperhomomorphismus
zwischen zwei Körpern R, R0 mit der Supremumseigenschaft die Anordnung er-
halten muß, wird in 3.3.14 klar werden, wo wir zeigen, daß für jeden angeordneten
Körper R mit der Supremumseigenschaft die nichtnegativen Elemente genau alle
Quadrate sind, in Formeln R≥0 = {x2 | x ∈ R}.
Ergänzung 2.4.15. Es ist durchaus möglich, die Menge D aller „Dezimalaus-
drücke“ ohne jegliche Identifizierungen zu betrachten. Wenn wir diese Menge D
mit der Struktur einer angeordneten Menge zu versehen, ist auch durchaus die Su-
premumseigenschaft erfüllt. Es ist jedoch nicht möglich, diese angeordnete Men-
ge zu einem angeordneten Körper zu machen. Der naive Ansatz scheitert daran,
daß nicht klar ist, wie man mit den eventuell unendlich vielen Überträgen bei
der Addition und Multiplikation umgehen soll. Daß überhaupt jeder Ansatz zum
Scheitern verurteilt ist, erkennt man etwa daran, daß es in D Elemente gibt mit
d = supD X ⇒ d ∈ X für Teilmengen X ⊂ D, wie etwa d := 1, 0000 . . .,
und andere Elemente wie etwa d = 0, 99999 . . ., für die diese Implikation nicht
gilt. Für jeden angeordneten Körper K muß jedoch die Addition eines beliebigen
∼
Elements k ∈ K ein Ordnungsisomorphismus (k+) : K → K sein.
59
Übungen
Übung 2.4.16. Man zeige, daß es für je zwei nichtleere Teilmengen M, N ⊂ R
mit x ≤ y für alle x ∈ M und y ∈ N stets ein a ∈ R gibt mit x ≤ a ≤ y für alle
x ∈ M und y ∈ N . Man zeige weiter, daß diese Bedingung an eine angeordnete
Menge sogar gleichbedeutend ist zur Forderung, jede nichtleere Teilmenge mit
einer unteren Schranke möge auch eine größte untere Schranke besitzen.
Übung 2.4.17. Bezeichne R = RD das Dedekind’sche Modell der reellen Zahlen.
Man zeige, daß die durch die Struktur eines angeordneten Körpers auf R nach
2.2.10 definierte Injektion Q ,→ R auch beschrieben werden kann durch die Vor-
schrift p 7→ pR := {q ∈ Q | q > p}.
Übung 2.4.18 (Summe nichtnegativer Zahlen in Dezimaldarstellung). Seien
X und Y nichtleere nach oben beschränkte Teilmengen von R. Mit der Notation
X + Y ⊂ R für die Menge {x + y | x ∈ X, y ∈ Y } zeige man sup(X + Y ) =
sup X + sup Y . Damit ist klar, wie man zu zwei durch Dezimalausdrücke dar-
gestellten nichtnegativen reellen Zahlen einen Dezimalausdruck für ihre Summe
bestimmen kann: Man betrachtet die Menge S aller Summen endlicher Teilaus-
drücke und nimmt den lexikographisch größten Dezimalausdruck, dessen sämtli-
che Anfangsstücke mit Anfangsstücken von Dezimalausdrücken aus unserer Men-
ge S übereinstimmen. Da der Übertrag beim Addieren jeweils höchstens Eins sein
kann, ist an jeder Stelle, an der nicht zwei Neuner übereinanderstehen, schon klar,
welche Ziffer in unserem Dezimalausdruck für die Summe an der Stelle davor
stehen muß.
Übung 2.4.19 (Differenz nichtnegativer Zahlen in Dezimaldarstellung). Man
überlegt sich, daß man sich mit 2.4.18 darauf zurückziehen kann zu erklären, wie
man für jede durch einen Dezimalausdruck a mit einer Null vor dem Komma
gegebene reelle Zahl α einen Dezimalausdruck für β := 1−α bestimmt. Sind aber
a1 , a2 , . . . die Nachkommastellen unseres Dezimalausdrucks a, so sind die Ziffern
bi gegeben durch ai + bi = 9 nach 2.4.18 offensichtlich Nachkommastellen, die
zusammen mit einer Null vor dem Komma einen Dezimalausdruck für β bilden.
Übung 2.4.20 (Produkt in Dezimaldarstellung). Seien X und Y nichtleere nach
oben beschränkte Teilmengen von R>0 . Mit der Notation XY ⊂ R für die Menge
{xy | x ∈ X, y ∈ Y } zeige man sup(XY ) = (sup X)(sup Y ). Damit ist ähn-
lich wie in 2.4.18 klar, wie man zu je zwei durch Dezimalausdrücke dargestellten
reellen Zahlen einen Dezimalausdruck für ihr Produkt bestimmen kann.
Ergänzende Übung 2.4.21 (Für höhere Semester). Man zeige die in [Link] be-
hauptete Eindeutigkeit der reellen Zahlen bis auf eindeutigen Isomorphismus.
Hinweis: Die gesuchte Bijektion ϕ kann zum Beispiel konstruiert werden durch
die Vorschrift ϕ(α) = inf{qR0 | q ∈ Q, qR > α}. Man zeige allgemeiner auch,
daß jeder Körperhomomorphismus R → R die Identität ist. Hinweis: Nach 3.3.14
60
sind die nichtnegativen reellen Zahlen genau die Quadrate, jeder Körperhomo-
morphismus R → R erhält also die Anordnung. Andererseits aber muß er auf Q
die Identität sein.
Ergänzende Übung 2.4.22 (Für höhere Semester). Gegeben ein archimedisch an-
geordneter Körper k gibt es genau einen ordnungserhaltenden Körperhomomor-
phismus k → R. Hinweis: Ähnlich wie 2.4.21, das man umgekehrt aus diesem
Resultat ableiten kann, sobald man weiß, daß es zu jeder positiven reellen Zahl
eine Quadratwurzel gibt.
Beweis. 1. Für jede natürliche Zahl N gibt es nur endlich viele Brüche p/q ∈ Q
mit p, q ∈ Z, q 6= 0 und |p| ≤ N , |q| ≤ N . Wir beginnen unser Abzählen von Q
mit den Brüchen für N = 1, dann nehmen wir die Brüche hinzu mit N = 2, und
indem wir so weitermachen zählen wir ganz Q ab.
2. Hierzu verwenden wir das Cantor’sche Diagonalverfahren. Man beachte zu-
nächst, daß ein unendlicher Dezimalbruch, in dem die Ziffern Null und Neun nicht
vorkommen, nur dann dieselbe reelle Zahl darstellt wie ein beliebiger anderer un-
endlicher Dezimalbruch, wenn die beiden in jeder Stelle übereinstimmen. Wir
betrachten nun eine beliebige Abbildung N≥1 → R, i 7→ ri , und zeigen, daß sie
keine Surjektion sein kann. Wir schreiben dazu jedes ri als unendlichen Dezimal-
bruch. Dann finden wir einen unendlichen Dezimalbruch r, bei dem die Ziffern
Null und Neun nicht vorkommen und so, daß r für an der i-ten Stelle nach dem
Komma verschieden ist von ri . Dies r ist dann verschieden von allen ri und unsere
Abbildung i 7→ ri kann keine Surjektion gewesen sein.
Bemerkung 2.5.3. Man kann sich fragen, ob jede Teilmenge der reellen Zahlen
entweder abzählbar ist oder in Bijektion zu den reellen Zahlen selber. Die schon
61
N × N ist abzählbar und damit auch allgemeiner das Produkt von je zwei und
dann auch von endlich vielen abzählbaren Mengen.
62
auf Cantor zurückgehende Vermutung, das könnte gelten, ist bekannt als die Kon-
tinuumshypothese. Sie wurde 1963 von Paul Cohen in sehr merkwürdiger Weise
geklärt: Er zeigte, daß unsere Frage in dem axiomatischen Rahmen, in dem man
die Mengenlehre üblicherweise formalisiert, nicht entscheidbar ist. Cohen wur-
de für diese Leistung auf dem internationalen Mathematikerkongress 1966 mit
der Fields-Medaille ausgezeichnet. Die Kontinuumshypothese ist übrigends die
erste Frage einer berühmten Liste von 23 Fragestellungen, den sogenannten Hil-
bert’schen Problemen, die David Hilbert in seiner Ansprache auf dem interna-
tionalen Mathematikerkongress 1900 in Paris vorstellte in seinem Bemühen, „aus
verschiedenen mathematischen Disziplinen einzelne bestimmte Probleme zu nen-
nen, von deren Behandlung eine Förderung der Wissenschaft sich erwarten läßt“.
63
3 Stetigkeit und Grenzwerte
3.1 Anschauung für Funktionen
3.1.1. Abbildungen mit Werten in irgendeiner Art von Zahlen nennen wir Funk-
tionen. Wir erlauben hier auch Werte in R̄. Wollen wir besonders betonen, daß
nur reelle Zahlen als Werte angenommen werden, so sprechen wir von reellwer-
tigen Funktionen. Reellwertige Funktionen auf der reellen Zahlengeraden mag
man sich auf viele verschiedene Arten vorstellen. Gleichzeitig diskutiere ich An-
schauungen für Abbildungen Rm → Rn .
64
Vier verschiedene Anschauungen für eine reellwertige Funktion einer reellen
Veränderlichen am Beispiel des Absolutbetrags x 7→ |x|
65
3.1.2. Bereits beliebige Abbildungen R → R können „wild aussehen“. Man den-
ke etwa an die Abbildung, die jeder rationalen Zahl den Betrag ihres Nenners nach
vollständigem Kürzen zuordnet und jeder irrationalen Zahl ihre fünfte Nachkom-
mastelle. Wir führen nun die „stetigen Funktionen“ ein und zeigen insbesondere,
daß für stetige auf einem Intervall definierte und injektive Funktionen auch ihr
Bild ein Intervall ist und die Umkehrfunktion stetig. Das liefert uns viele Funk-
tionen als Umkehrfunktionen bereits bekannter Funktionen. In der schmutzigen
Anschauung ist eine reellwertige Funktion auf einem reellen Intervall stetig, wenn
man „ihren Graphen zeichnen kann ohne den Stift abzusetzen“. Diese Anschau-
ung werden wir im Folgenden präzisieren.
3.1.3. Die mit dieser Materie bereits Vertrauten seien vorgewarnt, daß ich im fol-
genden bei der Behandlung von Grenzwerten und Stetigkeit einen eher ungewöhn-
lichen Ansatz verfolge. Am Anfang steht der Begriff einer Intervallumgebung ei-
nes Punktes in den erweiterten reellen Zahlen R̄ := R t {∞, −∞} und allgemei-
ner eines Quaders um einen Punkt in R̄n . Danach erklären wir, wann eine Abbil-
dung von einer Teilmenge D ⊂ R̄m nach R̄n stetig ist bei einem Punkt p ∈ D und
besprechen die Stetigkeit der Verknüpfung stetiger Abbildungen. Die Betrachtung
mehrerer Variablen scheint mir didaktisch vorteilhaft, weil sie ausdrucksstärkere
graphische Illustrationen erlaubt und darin Aussagen wie die Stetigkeit der Addi-
tion und Multiplikation R2 → R formuliert und bewiesen werden können. Danach
erst erklären wir den Grenzwert einer Funktion als den „Funktionswert der ein-
deutigen stetigen Fortsetzung“ und den Grenzwert einer Folge als den Spezialfall
des Grenzwerts einer auf N definierten Funktion. Dieses Vorgehen steht im Kon-
trast zu der übliche Vorgehensweise, bei der man mit Grenzwerten von Folgen
beginnt, bevor man von dort ausgehend zur Stetigkeit von Funktionen und ihren
Grenzwerten kommt.
66
ein Intervall I ⊂ R̄ mit Supremum a = sup I und Infimum b = inf I gibt es die
Alternativen a ∈ I oder a 6∈ I und b ∈ I oder b 6∈ I. Es gibt damit vier Typen von
Intervallen in R̄, für die die beiden folgenden Notationen gebräuchlich sind:
[a, b] = [a, b] = {x ∈ R̄ | a ≤ x ≤ b}
]a, b[ = (a, b) = {x ∈ R̄ | a < x < b}
[a, b[ = [a, b) = {x ∈ R̄ | a ≤ x < b}
]a, b] = (a, b] = {x ∈ R̄ | a < x ≤ b}
Wählen wir hier a, b ∈ R̄ beliebig mit a < b, so erhalten wir genau alle Intervalle
in R̄ mit mehr als einem Element, die mehrpunktigen Intervalle. Wir benutzen
die eben erklärten Notationen jedoch auch im Fall a ≥ b, sie bezeichnen dann
manchmal eine einpunktige Menge und meist die leere Menge. Ein Intervall in R
nennen wir ein reelles Intervall.
3.2.4 (Diskussion der Notation). Ich hoffe, daß der Leser aus dem Kontext er-
schließen kann, wann mit (a, b) ein Intervall gemeint ist und wann ein Paar aus
R2 . Sind a und b konkrete Zahlen, etwa a = 1 und b = 27, so wäre zu allem
Überfluß auch noch eine dritte Lesart von (1, 27) als die in Klammern notierte
Dezimalzahl 1,27 denkbar. Ich hoffe, daß der Leser aus dem Kontext erschließen
kann, was jeweils gemeint ist. Wenn man genau hinguckt, sollte auch im letzteren
Fall der Abstand nach dem Komma etwas kleiner sein.
3.2.5. Ein Intervall in R̄ heißt kompakt, wenn es eines unserer Intervalle [a, b]
ist. Der Begriff „kompakt“ wird in 5.1.1 auf beliebige Teilmengen von R̄ verall-
gemeinert.
3.2.6. Ein reelles Intervall heißt offen, wenn es eines unserer Intervalle (a, b) ist.
Der Begriff „offen“ wird in 5.5.1 auf beliebige Teilmengen von R verallgemeinert.
Definition 3.2.7. Gegeben ein Punkt p ∈ R̄ verstehen wir unter einer Intervall-
umgebung von p ein Intervall I ⊂ R̄ mit p ∈ I, das auch einen Punkt β > p
enthält, falls es einen solchen Punkt in R̄ gibt, sowie einen Punkt α < p, falls es
einen solchen Punkt in R̄ gibt.
Beispiel 3.2.8. Intervallumgebungen von p ∈ R sind alle Intervalle der Gestalt
[a, b], (a, b], [a, b), (a, b) mit a < p < b und a, b ∈ R̄.
Beispiel 3.2.9. Intervallumgebungen von ∞ sind alle Intervalle der Gestalt [a, ∞]
oder (a, ∞] mit a ∈ R̄ und a < ∞.
Beispiel 3.2.10. Intervallumgebungen von −∞ sind alle Intervalle der Gestalt
[−∞, b] oder [−∞, b) mit b ∈ R̄ und −∞ < b.
Definition 3.2.11. Gegeben ein Punkt p = (p1 , . . . , pn ) ∈ R̄n verstehen wir unter
einer Quaderumgebung von p oder kurz einem Quader um p eine Teilmenge
Q ⊂ R̄n der Gestalt Q = I1 × . . . × In mit Iν jeweils einer Intervallumgebung
von pν .
67
Definition 3.2.12. Eine Abbildung f : R̄m → R̄n heißt stetig an einer Stelle
p ∈ R̄m , wenn es für jeden Quader Q um f (p) einen Quader Q0 um p gibt mit
f (Q0 ) ⊂ Q.
3.2.13. Ein Datum bestehend aus einer Menge X, einer Teilmenge D ⊂ X und
einer Abbildung f : D → Y in eine weitere Menge Y notieren wir im folgenden
abkürzend
f :X⊃D→Y
Definition 3.2.14. Eine Abbildung f : R̄m ⊃ D → R̄n heißt stetig an einer Stel-
le p ∈ D, wenn es für jeden Quader Q um f (p) einen Quader Q0 um p gibt mit
f (Q0 ∩ D) ⊂ Q. Eine Abbildung, die stetig ist an jeder Stelle ihres Definitionsbe-
reichs, heißt stetig.
3.2.15. Auf Englisch sagt man für stetig continuous, auf Französisch continue.
Beispiel 3.2.16 (Aufschneiden der Ebene). Die Abbildung f : R2 → R2 gege-
ben durch (x, y) 7→ (x, y) für x < 0 und (x, y) 7→ (x + 1, y) für x ≥ 0 bedeutet
anschaulich, daß wir die Ebene längs der y-Achse aufschneiden und den rechten
Teil, dem wir auch die y-Achse selbst zuschlagen, um Eins nach rechts schieben.
Sie ist nicht stetig an allen Punkten der y-Achse, ist jedoch stetig an allen Punk-
ten außerhalb der y-Achse. An dieser Stelle möge als Argumentation ein Bild
genügen.
Beispiel 3.2.17 (Stetigkeit konstanter Funktionen). Konstante Abbildungen c :
R̄m ⊃ D → R̄n sind stetig. In diesem Fall gilt für jeden Quader Q um c(p) und
jeden beliebigen Quader Q0 um p bereits c(Q0 ∩ D) ⊂ Q.
Beispiel 3.2.18 (Stetigkeit von Einbettungen). Eine beliebige Einbettungsabbil-
dung i : R̄m ⊃ D → R̄m gegeben durch x 7→ x ist stetig. In diesem Fall ist
für jeden Quader Q um p = i(p) bereits Q0 := Q selbst ein Quader um p mit
i(Q0 ∩ D) ⊂ Q.
3.2.19. Gegeben x = (x1 , . . . , xn ) ∈ Rn erklären wir |x| := max{|x1 |, . . . , |xn |}
als das Maximum der Absolutbeträge der Koordinaten von x. Gegeben p ∈ Rn
und ε > 0 erklären wir den ε-Quader um p durch die Vorschrift
B(p; ε) := {x ∈ Rn | |p − x| < ε}
Die Notation B für unseren Quader bedeutet „Ball“ und ist die übliche Bezeich-
nung für dieses Konzept im Kontext allgemeiner „metrischer Räume“.
3.2.20. Offensichtlich sind für p ∈ Rn die ε-Quader um p auch Quader um p.
Offensichtlich umfäßt weiter jeder Quader um p ∈ Rn für hinreichend kleines
ε > 0 den ε-Quader um p. Wenn „nirgends ±∞ vorkommt“, können wir die
Stetigkeit auch mit diesen speziellen Quadern charakterisieren, wie im folgenden
Lemma ausgeführt wird.
68
Lemma 3.2.21 (ε-δ-Kriterium für Stetigkeit). Seien f : Rm ⊃ D → Rn eine
Abbildung und p ∈ D ein Punkt. Genau dann ist f stetig bei p, wenn es für jedes
ε > 0 ein δ = δ(ε) > 0 gibt derart, daß für alle x ∈ D mit |x − p| < δ gilt
|f (x) − f (p)| < ε.
Beweis. Ist f stetig bei p, so gibt es insbesondere für jedes ε > 0 und den Quader
Q := B(f (p), ε) um f (p) einen Quader Q0 um p mit f (Q0 ∩ D) ⊂ Q. Für diesen
Quader Q0 hinwiederum gibt es δ > 0 mit B(p, δ) ⊂ Q0 und dann gilt a forteriori
f (B(p, δ) ∩ D) ⊂ B(f (p), ε) = Q alias
Ist umgekehrt das ε-δ-Kriterium erfüllt und ist Q ein Quader um f (p), so wählen
wir ein ε > 0 mit B(f (p), ε) ⊂ Q und finden dazu ein δ > 0 mit f (B(p, δ)∩D) ⊂
B(f (p), ε) und dann ist Q0 := B(p, δ) ein Quader um p mit f (Q0 ∩ D) ⊂ Q und
f ist stetig bei p.
3.2.22 (Konventionen zu ε). Wenn Sie in der Analysis die Formulierung „für
alle ε > 0 gilt was auch immer“ antreffen, so dürfen Sie erwarten, daß dieses
„was auch immer“, wenn es denn für ein gegebenes ε > 0 gilt, für alle größe-
ren ε > 0 erst recht gilt. Salopp gesprochen besteht also die unausgesprochene
Übereinkunft, durch die Verwendung des Buchstabens ε das anzudeuten, was man
umgangsprachlich vielleicht mit „für jedes auch noch so kleine ε > 0“ ausdrücken
würde. Sie müssen nur einmal versuchen, beim Vorrechnen einer Übungsaufga-
be statt ε den Buchstaben M zu verwenden: Auch wenn formal alles richtig sein
sollte, wird Ihr Tutor deutlich länger darüber nachdenken müssen, ob Ihre For-
mulierung auch wirklich stimmt. „Sei ε < 0“ schließlich ist ein mathematischer
Witz.
3.2.23. Wenn wir den Beweis des ε-δ-Kriteriums nocheinmal durchgehen, stellen
wir fest, daß dabei nur zwei Eigenschaften unserer ε-Quader B(p, ε) eine Rolle
spielen: Zum ersten, daß jeder ε-Quader B(p, ε) um p einen Quader um p umfaßt,
etwa sich selber, und zum zweiten, daß jeder Quader Q um p ∈ Rn einen ε-
Quader B(p, ε) um p umfaßt, für geeignetes ε > 0. Gegeben p ∈ R̄n nennt man
allgemeiner U ⊂ R̄n eine Umgebung von p, wenn es einen Quader Q um p gibt
mit p ∈ Q ⊂ U , und erhält in derselben Weise ein weiteres Stetigkeitskriterium,
das weniger eckig daherkommt.
Beweis. Analog zum Beweis von 3.2.21 und dem Leser überlassen.
69
Beispiel 3.2.25 (Stetigkeit des Absolutbetrags). Der Absolutbetrag abs : R →
R, x 7→ |x| ist stetig. In der Tat gilt in diesem Fall an jeder Stelle p das ε-δ-
Kriterium mit δ = ε, denn aus |x − p| < ε folgt ||x| − |p|| < ε. Sogar die
Fortsetzung des Absolutbetrags zu abs : R̄ → R̄ durch |−∞| = |∞| = ∞ ist
stetig, wie der Leser zur Übung selbst zeigen mag.
3.2.26. Ich will versuchen, an der Tafel einem Farbencode zu folgen, nach dem
vorgegebene Umgebungen von Grenzwerten und dergleichen in gelber Farbe dar-
gestellt werden, dazu zu findende N und dergleichen dahingegen in blauer Farbe.
Rote Farbe ist an grünen Tafeln für nicht wenige Menschen schwer zu lesen.
Beispiel 3.2.27 (Stetigkeit der Addition). Die Addition ist eine stetige Abbildung
add : R2 → R, (x, y) 7→ x + y. Um das zu sehen, müssen wir zeigen, daß sie
stetig ist an jedem Punkt p := (a, b) ∈ R2 . Für alle ε > 0 gilt aber offensichtlich
Also ist an jeder Stelle p = (a, b) das ε-δ-Kriterium erfüllt mit δ = ε/2.
Beispiel 3.2.28 (Stetigkeit der Multiplikation). Die Multiplikation ist eine ste-
tige Abbildung mult : R2 → R, (x, y) 7→ xy. Um das zu sehen, müssen wir
zeigen, daß sie stetig ist an jedem Punkt p := (a, b) ∈ R2 . Wir überlegen uns dazu
zunächst die Abschätzung
Für jedes ε > 0 gibt es also ein δ > 0, nämlich δ = ε/(|b| + 1 + |a|), mit
Mithin ist das ε-δ-Kriterium erfüllt an jeder Stelle p = (a, b). Man beachte, daß
im Gegensatz zur Addition unser δ hier nicht nur von ε abhängt, sondern auch von
der auf Stetigkeit untersuchten Stelle p.
Beispiel 3.2.29 (Stetigkeit von Projektionen). Die Projektionen prν : R̄n → R̄
gegeben durch x = (x1 , . . . , xn ) 7→ xν sind stetig. Der Einfachkeit der Notation
halber zeigen wir das nur für ν = 1. Ist aber Q ein Quader um p1 = pr1 (p)
alias eine Intervallumgebung von p1 , so ist Q0 := Q × R̄n−1 ein Quader um p mit
pr1 (Q0 ) ⊂ Q.
70
Satz 3.2.30 (Stetigkeit der Verknüpfung stetiger Abbildungen). Seien Abbil-
dungen f : R̄m ⊃ D → R̄n und g : R̄n ⊃ E → R̄l gegeben und es gel-
te f (D) ⊂ E. Ist f stetig bei p ∈ D und g stetig bei f (p) ∈ E, so ist auch
g ◦ f : R̄m ⊃ D → R̄l , x 7→ g(f (x)) stetig bei p.
3.2.31. Genau genommen ist die Notation g ◦ f in der Formulierung von Satz
3.2.30 im Sinne von 1.4.9 nicht ganz korrekt: Wir müßten eigentlich erst eine
Abbildung f˜ : D → E definieren durch f˜(x) = f (x) für alle x ∈ D und dann
die Abbildung g ◦ f˜ betrachten. Das scheint mir jedoch ein Fall, in dem größere
Präzision nicht zu größerer Verständlichkeit führt.
Beweis. Da g stetig ist bei f (p), finden wir für jeden Quader Q um g(f (p)) einen
Quader Q0 um f (p) mit g(Q0 ∩ E) ⊂ Q. Da f stetig ist bei p, finden wir für
diesen Quader Q0 von f (p) einen Quader Q00 um p mit f (Q00 ∩ D) ⊂ Q0 . Damit
finden wir in der Tat für jeden Quader Q um (g ◦ f )(p) einen Quader Q00 um p mit
(g ◦ f )(Q00 ∩ D) ⊂ Q.
Variante zum Beweis. Idem mit Umgebungen statt Quadern und dem Umgebungs-
kriterium für Stetigkeit 3.2.24.
3.2.32 (Schnitte von Umgebungen). Offensichtlich ist der Schnitt von zwei Inter-
vallumgebungen von p ∈ R̄ wieder eine Intervallumgebung von p. Offensichtlich
ist allgemeiner der Schnitt von zwei Quadern um p ∈ R̄n wieder ein Quader um p.
Offensichtlich ist folglich der Schnitt von zwei Umgebungen von p ∈ R̄n wieder
eine Umgebung von p.
Beweis. Ist die Abbildung f stetig bei p, so auch alle prν ◦f als die Verküpfung
der bei p stetigen Funktion f mit der nach 3.2.29 überall stetigen Projektion prν .
Seien umgekehrt alle fν stetig bei p und sei Q ein Quader um f (p). Per definitio-
nem finden wir Intervallumgebungen Iν von fν (p) mit I1 ×. . .×In = Q. Da wir fν
stetig bei p annehmen, gibt es jeweils einen Quader Q0ν um p mit fν (Q0ν ∩D) ⊂ Iν .
Dann ist Q0 := Q01 ∩ . . . ∩ Q0n nach 3.2.32 wieder ein Quader um p und offensicht-
lich gilt f (Q0 ) ⊂ Q.
Korollar 3.2.34 (Summe und Produkt stetiger Funktionen sind stetig). Seien
Funktionen f, g : R̄m ⊃ D → R stetig bei p ∈ D. So sind auch die Funktionen
f + g : x 7→ f (x) + g(x) und f g : x 7→ f (x)g(x) stetig bei p.
71
Beweis. Wir schreiben f + g = add ◦(f, g) und f g = mult ◦(f, g) für (f, g) :
R̄m ⊃ D → R2 gegeben durch (f, g) : x 7→ (f (x), g(x)). Nun ist (f, g) stetig
bei p nach 3.2.33, denn seine Komponenten f, g sind stetig bei p nach Annah-
me. Weiter sind Addition und Multiplikation stetig nach 3.2.27, 3.2.28. Also sind
auch f + g = add ◦(f, g) und f g = mult ◦(f, g) stetig bei p nach 3.2.30 als
Verknüpfungen stetiger Abbildungen.
Beispiel 3.2.35 (Stetigkeit von Polynomfunktionen). Eine Abbildung f : R →
R, die gegeben wird durch eine Abbildungsvorschrift der Gestalt x 7→ an xn +
. . . + a1 x + a0 mit konstanten aν ∈ R, heißt eine Polynomfunktion. Jede Po-
lynomfunktion ist stetig, denn konstante Funktionen sind stetig nach 3.2.17, die
identische Funktion x 7→ x ist stetig nach 3.2.18 und Produkte sowie Summen
stetiger Funktionen sind stetig nach 3.2.34.
Vorschau 3.2.36. Jede Familie reeller Zahlen (an )n∈N , in der höchstens endlich
n
P
viele an von Null verschieden sind, liefert eine Polynomfunktion an x . Nach
Übung 3.5.53 oder allgemeiner [LA1] 5.4.3 liefern verschiedene Familien auch
stets verschiedene Funktionen. Im Licht dieser Tatsache werden wir unsere Po-
lynomfunktionen meist kürzer Polynome nennen, obwohl eigentlich der Begriff
Polynom eher den formalen Ausdruck meint. Diese Unterscheidung ist aber erst
in der Algebra wirklich von Belang. Wenn man nämlich mit endlichen Körpern ar-
beitet, so können verschiedene formale Ausdrücke an xn + . . . + a1 x + a0 durchaus
dieselbe Funktion liefern, vergleiche [LA1] 5.3.2.
3.2.37 (Diskussion der Terminologie). Das Wort „Polynom“ kommt von der
griechischen Vorsilbe „poly“ für „viele“ und dem lateinischen Wort „nomen“ für
„Namen“. Allgemeiner betrachtet man auch Polynome in mehreren Veränderli-
chen und meint damit Ausdrücke wie etwa xyz + 7x2 y 4 − 12z + 1. Dieses Poly-
nom ist die Summe der vier Monome xyz, 7x2 y 4 , −12z und 1, wobei das Wort
„Monom“ diesmal mit der griechischen Vorsilbe „mono“ für „allein“ gebildet ist.
Einen Ausdruck wie xyz + 7x2 y 4 würde man als Binom bezeichnen, diesmal mit
der griechischen Vorsilbe „bi“ für „Zwei“. Ein anderes Binom wäre der Ausdruck
(x + y), dessen Potenzen die „binomische“ Formel [EIN] 1.1.23 explizit angibt.
Es sollte klar sein, wie man aus unserer binomischen Formel auch Formeln für die
Potenzen eines beliebigen Binoms erhält.
Beispiel 3.2.38 (Stetigkeit von Einschränkungen). Ist f : R̄m ⊃ E → R̄n stetig
bei p ∈ E und D ⊂ E eine Teilmenge mit p ∈ D, so ist auch die Einschränkung
f |D : D → R̄n stetig bei p. Das folgt sofort aus der Definition oder alternativ
daraus, daß Einbettungen stetig sind nach 3.2.18 und die Verknüpfung stetiger
Abbildungen stetig nach 3.2.30.
Satz 3.2.39 (Stetigkeit ist eine lokale Eigenschaft). Seien f : R̄m ⊃ D → R̄n
eine Abbildung und p ∈ D ein Punkt. Gibt es eine Umgebung V von p derart, daß
72
die Einschränkung f : V ∩ D → R̄n stetig ist bei p, so ist auch f : D → R̄n
bereits stetig bei p.
Beweis. Gegeben ein Quader Q um f (p) finden wegen der Stetigkeit der Ein-
schränkung einen Quader Q01 um p mit f (Q01 ∩ V ∩ D) ⊂ Q. Da V eine Umge-
bung von p ist, finden wir weiter einen Quader Q02 um p mit Q02 ⊂ V . Ihr Schnitt
Q0 := Q01 ∩ Q02 ist dann der gesuchte Quader um p mit f (Q0 ∩ D) ⊂ Q.
Variante zum Beweis. Statt der Definition verwenden wir das Umgebungskriteri-
um für Stetigkeit 3.2.24. Gegeben eine Umgebung U von f (p) finden wegen der
Stetigkeit der Einschränkung eine Umgebung U 0 von p mit f (U 0 ∩ (V ∩ D)) ⊂ Q.
Dann ist U 0 ∩ V die gesuchte Umgebung von p mit f ((U 0 ∩ V ) ∩ D) ⊂ Q.
3.2.40 (Partiell stetig impliziert nicht stetig). Es gibt Funktionen f : R2 → R
derart, daß sowohl x 7→ f (x, b) als auch y 7→ f (a, y) stetig sind für alle b be-
ziehungsweise alle a, daß aber dennoch die Funktion f selbst nicht stetig ist. Als
Beispiel betrachte man die Funktion mit (x, y) 7→ xy/(x2 + y 2 ) für (x, y) 6= (0, 0)
und (0, 0) 7→ 0. Sie ist nicht stetig am Nullpunkt nach dem anschließenden Satz
3.2.30, da nämlich ihre Verknüpfung mit R → R2 , t 7→ (t, t) nicht stetig ist bei
t = 0. Die Stetigkeit von t 7→ (t, t) hinwiederum mag man aus der Komponen-
tenregel 3.2.33 folgern. Der Anschauung mag die Erkenntnis helfen, daß unsere
merkwürdige Funktion, wenn man vom Ursprung selbst einmal absieht, auf allen
Geraden durch den Ursprung konstant ist. Auf den beiden Koordinatenachsen ist
unsere Funktion konstant Null, auf allen anderen Geraden durch den Ursprung je-
doch nimmt sie nur am Ursprung den Wert Null an und sonst konstant einen von
Null verschiedenen Wert.
Übungen
Übung 3.2.41. In einer teilgeordneten Menge ist jeder Schnitt von Intervallen wie-
der ein Intervall.
Ergänzende Übung 3.2.42. Jede Teilmenge Y einer angeordneten Menge X ist
die disjunkte Vereinigung aller maximalen in Y enthaltenen nichtleeren Intervalle
von X. Hinweis: Hat ein System von Intervallen von X nichtleeren Schnitt, so ist
auch seine Vereinigung wieder ein Intervall von X.
Übung 3.2.43 (Eine nur im Ursprung stetige Funktion). Die Funktion f : R →
R mit f (x) = x für x ∈ Q und f (x) = 0 für x 6∈ Q ist nur an der Stelle p = 0
stetig.
Übung 3.2.44 (Addition und Multiplikation im Unendlichen). Addition und
Multiplikation lassen sich auf genau eine Weise fortsetzen zu stetigen Abbildun-
73
gen
add : R̄2 \{(∞, −∞), (−∞, ∞)} → R̄
mult : R̄2 \{(±∞, 0), (0, ±∞)} → R̄
und zwar durch
a+∞=∞+a=∞ falls a 6= −∞;
a + (−∞) = (−∞) + a = −∞ falls a 6= ∞;
a·∞=∞·a=∞ falls a > 0;
a · ∞ = ∞ · a = −∞ falls a < 0;
a · (−∞) = (−∞) · a = −∞ falls a > 0;
a · (−∞) = (−∞) · a = ∞ falls a < 0.
Sie lassen sich nicht weiter stetig fortsetzen auf die oben ausgeschlossenen Punkte
(∞, −∞), (−∞, ∞) für die Addition beziehungsweise (±∞, 0), (0, ±∞) für die
Multiplikation.
Übung 3.2.45. Gegeben f : R̄ ⊃ D → R̄ stetig bei p ∈ D und g : R̄ ⊃ E → R̄
stetig bei q ∈ E ist f × g : D × E → R̄2 stetig bei (p, q).
Übung 3.2.46 (Stetigkeit durch Einquetschen). Gegeben f, g, h : R̄m ⊃ D → R̄
mit f (x) ≤ g(x) ≤ h(x) ∀x ∈ D und f, h stetig bei p ∈ D mit f (p) = h(p) ist
auch g stetig bei p.
Übung 3.2.47 (Stetigkeit durch Verkleben). Seien I, J ⊂ R̄ Intervalle mit nicht-
leerem Schnitt I ∩ J 6= ∅ und sei f : (I ∪ J) → R̄ eine Funktion. Man zeige: Sind
die Einschränkungen f |I und f |J stetig, so ist auch f selbst stetig. Im übrigen
wird sich der „schwierige“ Fall dieser Übung als Spezialfall von [AN2] 1.5.12
erweisen.
Übung 3.2.48. Man zeige, daß auf einem offenen reellen Intervall I jede konvexe
reelle Funktion stetig ist. Hinweis: Die graphische Darstellung zum Beweis von
5.5.15 mag helfen. Eine Funktion heißt konvex, wenn für alle x, z ∈ I gilt
f (tx + (1 − t)z) ≤ tf (x) + (1 − t)f (z) ∀t ∈ [0, 1]
Anschaulich bedeutet das, daß unsere Funktion „unter jeder ihrer Sekanten liegt“.
Die Stetigkeit durch Einquetschen 3.2.46 mag helfen.
74
Illustration zum Zwischenwertsatz. Im vorliegenden Fall wir der gegebene
Zwischenwert z sogar dreimal als Funktionswert angenommen. Unser erster
Beweis führt stets zum hier eingezeichneten größten p ∈ [a, b], an dem z als
Funktionswert angenommen wird.
75
Eine Abbildung heißt monoton, wenn sie monoton wachsend oder fallend ist.
Eine Abbildung heißt streng monoton, wenn sie streng monoton wachsend oder
fallend ist.
Proposition 3.3.2 (Stetigkeit monotoner Surjektionen auf Intervalle). Es sei
f : R̄ ⊃ D → R̄ eine monotone Abbildung. Ist ihr Bild f (D) ein Intervall in R̄,
so ist f stetig.
Beweis. Sei ohne Beschränkung der Allgemeinheit f monoton wachsend. Gege-
ben p ∈ D gilt es, für jeden Quader Q um f (p) einen Quader Q0 um p zu finden
mit f (Q0 ∩ D) ⊂ Q. Wir setzen I := f (D) und unterscheiden vier Fälle.
1. Ist f (p) ∈ I weder das größte noch das kleinste Element von I, so umfaßt
jeder Quader Q um f (p) ein Intervall der Gestalt [α, β] mit α < f (p) < β
und α, β ∈ I, also α = f (a) und β = f (b) mit a, b ∈ D und a < p < b.
Dann können wir Q0 = [a, b] nehmen;
2. Ist f (p) ∈ I das größte aber nicht das kleinste Element von I, so umfaßt
jeder Quader Q um f (p) ein Intervall der Gestalt [α, f (p)] mit α < f (p) und
α ∈ I, also α = f (a) mit a ∈ D und a < p. Dann können wir Q0 = [a, ∞]
nehmen;
3. Ist f (p) ∈ I das kleinste aber nicht das größte Element von I, so argumen-
tieren wir analog;
4. Ist f (p) ∈ I das kleinste und das größte alias das einzige Element von I, so
ist f konstant und wir können Q0 = [−∞, ∞] nehmen.
Beispiel 3.3.3 (Stetigkeit des Invertierens). Die Funktion R× → R, x 7→ x1
ist stetig. In der Tat reicht es aufgrund der Lokalität der Stetigkeit 3.2.39 zu zei-
gen, daß ihre Einschränkung auf R>0 und auf R<0 jeweils stetig ist. Diese Ein-
schränkungen sind jedoch beide monoton und haben als Bildmenge jeweils ein
Intervall.
Beispiel 3.3.4 (Stetigkeit des erweiterten nichtnegativen Invertierens). Die Ab-
bildung
inv+ : [0, ∞] → [0, ∞]
gegeben durch x 7→ x1 für x ∈ (0, ∞) sowie 0 7→ ∞ und ∞ 7→ 0 ist stetig. In der
Tat ist diese Abbildung monoton und ihr Bild ist ein Intervall und die Behauptung
folgt aus der Stetigkeit monotoner Surjektionen auf Intervalle 3.3.2.
Korollar 3.3.5 (Quotienten stetiger Funktionen sind stetig). Gegeben stetige
Funktionen f, g : R̄m ⊃ D → R mit g(x) 6= 0 ∀x ∈ D ist auch die Funktion
f /g : D → R, x 7→ f (x)/g(x) stetig.
76
Beweis. Bezeichne i : R× → R die Funktion x 7→ 1/x. Sie ist stetig nach 3.3.3.
Also ist auch i ◦ g : D → R, x 7→ 1/g(x) stetig und dann auch das Produkt dieser
Funktion mit der stetigen Funktion f .
Beispiel 3.3.6. Die Funktion
x4 − 2x2 + 1
x 7→
x3 − 1
ist stetig auf D := R\1. Sie kann sogar zu einer stetigen Funktion auf ganz R
fortgesetzt werden, die gegeben wird durch die Abbildungsvorschrift
x3 + x2 − x − 1
x 7→
x2 + x + 1
3.3.7. Eine Funktion, die sich als der Quotient eines Polynoms durch ein von Null
verschiedenes Polynom darstellen läßt, heißt eine rationale Funktion. So eine
Funktion ist a priori natürlich nur da definiert, wo der Nenner nicht verschwindet,
und ist nach dem vorhergehenden Korollar auf dem Komplement der Nullstellen-
menge ihres Nenners stetig. Betrachten wir unsere rationale Funktion jedoch nicht
als Abbildung, sondern als formalen Ausdruck, so verstehen wir unter ihrem De-
finitionsbereich die etwas größere Menge, auf der „nach maximalem Kürzen“ der
Nenner keine Nullstellen hat, vergleiche [LA1] 5.5.7. Man beachte, daß die hier
gegebene etwas unscharfe Formulierung „nach maximalem Kürzen“ eigentlich
erst in [AL] 2.4.19 gerechtfertigt wird, wo wir die Eindeutigkeit der „Primfaktor-
zerlegung“ in Polynomringen diskutieren. Bleibt auch nach maximalem Kürzen
noch ein nichtkonstantes Polynom im Nenner stehen, so spricht man von einer
gebrochenrationalen Funktion.
3.3.9 (Die schmutzige Anschauung). Wenn man sich eine stetige reellwertige
Funktion auf einem reellen Intervall vorstellt als eine Funktion, deren Graphen
man zeichnen kann ohne den Bleistift abzusetzen, so ist auch der Zwischenwert-
satz anschaulich klar: Wenn unser Graph unter einer horizontalen Linie anfängt
und oberhalb aufhört oder umgekehrt, so muß er an irgendeiner Stelle unsere ho-
rizontale Linie kreuzen.
Beweis. Wir dürfen ohne Beschränkung der Allgemeinheit f (a) ≤ f (b) anneh-
men. Gegeben z ∈ [f (a), f (b)] suchen wir p ∈ [a, b] mit f (p) = z. Wir betrachten
dazu
p := sup{x ∈ [a, b] | f (x) ≤ z}
77
und behaupten f (p) = z. Um das zu zeigen führen wir die Annahmen f (p) < z
und z < f (p) beide zum Widerspruch. Aus f (p) < z folgte zunächst p < b,
und dann gäbe es aufgrund der Stetigkeit ein q mit p < q < b und f (q) ≤ z
und p wäre gar keine obere Schranke unserer Menge gewesen. Aus z < f (p)
dahingegen folgte zunächst a < p, und dann gäbe es aufgrund der Stetigkeit ein
r mit a < r < p und z < f (x) für alle x ∈ [r, p]. Also wäre auch r schon eine
obere Schranke unserer Menge und p könnte nicht ihre kleinste obere Schranke
gewesen sein.
Korollar 3.3.10 (Abstrakter Zwischenwertsatz). Das Bild eines Intervalls unter
einer stetigen Funktion ist ein Intervall. Ist also in Formeln I ⊂ R̄ ein Intervall
und f : I → R̄ stetig, so ist auch f (I) ein Intervall.
Beweis. Das ist nur eine Umformulierung des Zwischenwertsatzes 3.3.8.
78
Illustration zur Stetigkeit in mehreren Veränderlichen. Dargestellt ist ein
Geradenstück D in der Ebene nebst einer Abbildung f : D → R2 , die es in die
Ebene abbildet und es dabei an einer Stelle p ∈ D zerreißt. Dargestellt ist weiter
eine Umgebung U von f (p), für die es keine Umgebung U 0 von p gibt mit
f (U 0 ) ⊂ U , so daß in der Tat f an dieser Aufreißstelle p nicht stetig ist.
79
als die Umkehrfunktion zur n-ten Potenzfunktion
√ x 7→ xn . Nach dem Satz über
die Umkehrfunktion
√ √ 3.3.11 ist x 7→ x stetig. Im Fall n = 2 verwendet man die
n
Abkürzung x := x. 2
Übungen
Übung 3.3.18. Man zeige, daß die Funktion {(x, y) ∈ R2 | y 6= 0} → R gegeben
durch (x, y) 7→ x/y stetig ist.
Übung 3.3.19. Man zeige, daß die Funktion R2 → R gegeben durch (x, y) 7→
(x2 y + xy 3 )/(x2 + y 2 + 1) stetig ist.
Ergänzende Übung 3.3.20. Seien a ≤ b aus R̄ gegeben und sei f : [a, b] → R
stetig mit f (b) = 0. Man zeige, daß dann f eine kleinste Nullstelle in [a, b] hat.
Übung 3.3.21. Jede Polynomfunktion x 7→ an xn + . . . + a0 mit an 6= 0 und n
ungerade besitzt mindestens eine reelle Nullstelle. Ist an > 0 und a0 > 0, so
besitzt sie sogar mindestens eine negative Nullstelle.
Übung 3.3.22. Gegeben ein Intervall I ⊂ R̄ ist jede injektive stetige Funktion
I → R̄ streng monoton.
80
Seien x, y : R2 → R die beiden Abbildungen, die jedem Punkt der Ebene seine
erste beziehungsweise zweite Koordinate zuordnen, also v = (x(v), y(v)) ∀v ∈
R2 . Die Distanz d(v, w) ∈ R zwischen zwei Punkten v, w ∈ R2 der Ebene er-
klären wir in Erinnerung an den Satz des Pythagoras durch die Formel
p
d(v, w) := (x(v) − x(w))2 + (y(v) − y(w))2
Die Kreiszahl π ∈ R definieren wir dann als das Supremum über die „Längen
aller in unseren Halbkreis H einbeschriebenen Polygonzüge“, in Formeln
( n
X n ∈ N, v0 , v1 , . . . , vn ∈ H,
π := sup d(vi−1 , vi )
x(v0 ) < x(v1 ) < . . . < x(vn )
i=1
√
Mithilfe der einfachen Abschätzung a2 + b2 ≤ |a| + |b| erkennt man, daß die
Zahl 4 eine obere Schranke ist für unsere Menge von Längen von Polygonzügen,
mithin haben wir hier in der Tat eine reelle Zahl π ∈ R definiert. Wir werden in
6.1.31 sehen, wie man diese Zahl im Prinzip bis zu einer beliebig vorgegebenen
Stelle nach dem Komma berechnen kann. Die Definition selbst ist elementar. Ich
habe sie nur deshalb nicht gleich im Zusammenhang mit der Definition der reellen
Zahlen gegeben, weil sie die Existenz reeller Quadratwurzeln von nichtnegativen
reellen Zahlen benötigt, die erst in 3.3.14 gezeigt wurde.
Ergänzung 3.4.2. Die Zahl π ist nicht rational, in Formeln π 6∈ Q, wie Lambert
bereits 1761 zeigen konnte. Anders ausgedrückt läßt sich π nicht durch einen peri-
odischen Dezimalbruch darstellen. Wir beweisen diese Tatsache in 5.8.12. Unsere
Kreiszahl π ist noch nicht einmal algebraisch, als da heißt Nullstelle eines nicht-
trivialen Polynoms mit rationalen Koeffizienten. Es gilt in anderen Worten keine
Gleichung der Gestalt
Reelle Zahlen, die nicht algebraisch sind, heißen transzendent, lateinisch für
„überschreitend“, da ihre Behandlung „die Grenzen der Algebra überschreitet“.
Die Transzendenz von π wurde 1882 von Lindemann in Freiburg bewiesen. Sei-
ne Büste steht im vierten Stock des Mathematischen Instituts. Er war übrigends
Hilbert’s Doktorvater. Johann Heinrich Lambert alias Jean-Henri Lambert wur-
de 1728 als Sproß einer hugenottischen Familie in Mulhouse geboren, das zu der
Zeit mit den umgebenden Landstrichen als unabhängige Republik Mitglied der
Eidgenossenschaft war. Er veröffentlichte seine Arbeit zur Irrationalität von π auf
französisch in der „Histoire de l’Academie Royale des Sciences et Belles-Lettres“
in Berlin, wo er 1763 eine Anstellung an der preußischen Akademie der Wissen-
schaften erhielt.
81
Ein einbeschriebener Polygonzug
Diese Abbildung soll veranschaulichen, warum 4 eine obere Schranke für die
Längen einbeschriebener Polygonzüge ist: Die horizontalen Stücke und die
vertikalen Stücke haben jeweils zusammengenommen eine Gesamtlänge ≤ 2.
82
3.5 Grenzwerte
Definition 3.5.1. Seien C, D ⊂ R̄n Teilmengen.
2. Ein Punkt p ∈ D heiße ein isolierter Punkt von D, wenn er kein Häufungs-
punkt von D ist. Gleichbedeutend ist die Bedingung, daß es eine Umgebung
V von p in R̄n gibt mit V ∩ D = {p}.
3.5.2. Ich verwende hier die Bezeichnungen p, C, D in der Weise, daß a priori
p ein Häufungspunkt von D und ein Häufungspunkt zu C ist, salopp gesprochen
D = C ∪{p}, so daß also p in D liegen muß und in C liegen darf. Je nach Kontext
ist die eine oder die andere Konvention geschickter.
3.5.3 (Diskussion der Terminologie). Die im vorhergehenden eingeführte Ter-
minologie der „Häufungspunkte von und zu“ ist ein Versuch, die sprachlichen
Schwierigkeiten zu vermeiden, die in der üblichen Terminologie dadurch ent-
stehen, daß ein Häufungspunkt einer Menge kein Punkt besagter Menge zu sein
braucht.
Beispiele 3.5.4. Die Menge Z der ganzen Zahlen besteht aus isolierten Punkten.
Die Menge Q der rationalen Zahlen besteht aus Häufungspunkten. Die Menge
N ∪ {∞} hat als einzigen Häufungspunkt den Punkt ∞. Daß dieser Punkt in der
Tat ein Häufungspunkt ist, folgt aus der Archimedizität des angeordneten Körpers
R der reellen Zahlen 2.4.9.
3.5.5 (Notation für Komplemente einpunktiger Teilmengen). Wir vereinbaren
für die Differenz einer Menge X und einer einpunktigen Menge {p} die abkürzen-
de Schreibweise X\p := X\{p}. Der Punkt p muß dabei nicht zu X gehören,
dann haben wir eben X\p = X.
83
Der Grenzwert oder Limes einer Funktion mit einer „Fehlstelle“ in ihrem
Definitionsbereich ist, wenn er existiert, der Wert an der fraglichen Fehlstelle der
einzig möglichen dort stetigen Fortsetzung.
84
sowie Umgebungen U10 und U20 von p mit f1 (U10 ∩ D) ⊂ U1 und f2 (U20 ∩ D) ⊂ U2 .
Daraus folgte aber
im Widerspruch dazu, daß U10 ∩ U20 ∩ D nicht nur aus unserem Häufungspunkt p
bestehen kann, weil ja nach 3.2.32 auch U10 ∩ U20 eine Umgebung von p ist.
als Abkürzung für die Aussage, daß die Fortsetzung unserer Funktion f zu einer
Funktion f : C ∪{p} → R̄n durch f (p) := b stetig ist bei p. In diesem Fall nennen
wir b den Grenzwert oder lateinisierend Limes der Funktion f für x → p.
3.5.8 (Eindeutigkeit des Grenzwerts). Nach der Eindeutigkeit 3.5.6 stetiger Fort-
setzungen in Häufungspunkten folgt aus limx→p f (x) = a und limx→p f (x) = b
bereits a = b.
3.5.9. Salopp gesprochen verhält es sich demnach so, daß eine Funktion mit einer
einpunktigen Definitionslücke an einem Häufungspunkt ihres Definitionsbereichs
auf höchstens eine Weise stetig in diese Definitionslücke hinein fortgesetzt wer-
den kann. Der Wert dieser an besagter Stelle stetigen Fortsetzung ist dann per
definitionem der Grenzwert unserer Funktion an besagter Stelle.
Beispiel 3.5.10. Wir haben
x2 − 1 (x + 1)(x − 1)
lim = lim = lim x + 1 = 2
x→1 x − 1 x→1 x−1 x→1
Beispiel 3.5.11. Wir haben limx→∞ 1/x = 0 und lim(0,1)3x→0 1/x = ∞, denn
unser erweitertes nichtnegatives Invertieren inv+ : [0, ∞] → [0, ∞] ist stetig nach
3.3.4 mit inv+ (∞) = 0 und inv+ (0) = ∞.
3.5.12 (ε-δ-Kriterium für Grenzwerte). Seien D ⊂ Rm eine Teilmenge, p ∈ D
ein Häufungspunkt von D und f : D\p → Rn eine Funktion. Sei weiter b ∈ Rn
gegeben. Genau dann gilt limx→p f (x) = b, wenn es für jedes ε > 0 ein δ > 0
gibt mit
|x − p| < δ ⇒ |f (x) − b| < ε
Das ist eine direkte Konsequenz des ε-δ-Kriteriums für Stetigkeit 3.2.21.
85
Lemma 3.5.13 (Grenzwerte für x → ∞). Sei f : R ⊃ C → Rn eine Funktion
und sei ∞ ein Häufungspunkt zu C. Sei weiter b ∈ Rn gegeben. Genau dann gilt
limx→∞ f (x) = b, wenn es für jedes ε > 0 ein N = Nε ∈ R gibt mit
x > N ⇒ |f (x) − b| < ε
Beweis. Wir wenden das Umgebungskriterium für Stetigkeit 3.2.24 an und setzen
D := C ∪ {∞}. Ist die Fortsetzung von f zu f : D → Rn durch f (∞) := b
stetig bei ∞, so gibt es für die Umgebung U = B(b; ε) von b = f (∞) eine
Umgebung U 0 von ∞ mit f (U 0 ∩ D) ⊂ B(b; ε). Diese Umgebung U 0 von ∞
umfaßt aber per definitionem eine Teilmenge der Gestalt (N, ∞] mit N ∈ R. Wir
sehen so, daß es zu jedem ε > 0 ein N ∈ R gibt mit x > N ⇒ |f (x) − b| < ε.
Sei umgekehrt diese Bedingung erfüllt. Es gilt zu folgern, daß unsere Fortsetzung
f : D → Rd stetig ist bei p := ∞. Gegeben eine Umgebung U von b = f (∞)
finden wir ε > 0 mit B(b; ε) ⊂ U . Zu diesem ε finden wir dann ein N ∈ R mit
f ((N, ∞) ∩ C) ⊂ B(b; ε). Somit ist U 0 := (N, ∞] die gesuchte Umgebung von
∞ mit f (U 0 ∩ D) ⊂ U .
Beispiel 3.5.14 (Grenzwerte konstanter Funktionen). Wir haben limx→p c = c
für jede konstante Funktion c, denn konstante Funktionen sind stetig.
Beispiel 3.5.15 (Grenzwert der Identitätsfunktion). Wir haben limx→p x = p,
denn die Identität id ist stetig.
3.5.16. Gegeben Mengen A und I bezeichnet man eine Abbildung I → A ganz
allgemein auch als eine durch I indizierte Familie von Elementen von A und
benutzt die Notation
(ai )i∈I
Diese Sprechweise und Notation für Abbildungen verwendet man insbesondere
dann, wenn man der Menge I eine untergeordnete Rolle zugedacht hat. Im Fall
I = ∅ spricht man von der leeren Familie von Elementen von A.
Definition 3.5.17. Eine Abbildung N → X, n 7→ an von den natürlichen Zahlen
in eine Menge X nennen wir eine Folge in X. Wir schreiben eine Folge meist
(an )n∈N oder a0 , a1 , a2 , . . . oder auch einfach nur (an ). Die Elemente an heißen
die Folgenglieder. Manchmal nennen wir auch Abbildungen Folgen, die erst ab
n = 1 definiert sind.
3.5.18 (Folgenkonvergenz). Eine Folge (an ) in R̄d ist dasselbe wie eine Funktion
f : R̄ ⊃ N → R̄d , nämlich die Funktion f (n) := an . Der Punkt ∞ ist ein
Häufungspunkt zu N in R̄, wie wir bereits in 3.5.4 bemerkt hatten. Gegeben b ∈
R̄d sagen wir, die Folge an konvergiere gegen a, wenn im Sinne des allgemeinen
Grenzwertbegriffs 3.5.7 gilt
lim an = a
N3n→∞
86
Graphische Darstellung der Folge an = 33−n − (−2)4−n , die gegen Null
konvergiert, wie Sie bald werden zeigen können. Die Folgenglieder sind die
kleinen Kreuzchen auf der reellen Achse, ihre Indizes tragen sie an
unterschiedlich langen gestrichelt eingezeichneten Stangen.
87
In diesem Fall nennen wir a den Grenzwert oder lateinisierend Limes der Folge.
3.5.19. Sagen wir, eine Aussage gelte für fast alle Elemente einer Menge, so soll
das bedeuten, daß sie gilt für alle Elemente bis auf höchstens endlich viele Aus-
nahmen. Sagen wir, eine Aussage gelte für fast alle Glieder einer Folge, so soll
das bedeuten, daß für fast alle Indizes n unsere Aussage für das n-te Folgenglied
gilt.
3.5.20 (ε-N -Kriterium für Folgenkonvergenz). Gegeben eine Folge (an ) in Rd
und a ∈ Rd ist limn→∞ an = a nach 3.5.13 gleichbedeutend dazu, daß es für jedes
ε > 0 ein N = Nε ∈ R gibt mit n > N ⇒ |an − a| < ε.
Lemma 3.5.21 (Charakterisierung der Folgenkonvergenz). Gegeben eine Fol-
ge (an ) in R̄d ist limn→∞ an = a gleichbedeutend dazu, daß jede Umgebung von
a fast alle Glieder unserer Folge enthält.
Beweis. Wir setzen D := N ∪ {∞}. Bezeichne ā : D → R̄d die Fortsetzung von
n 7→ an durch ∞ 7→ a. Per definitionem ist limn→∞ an = a gleichbedeutend dazu,
daß ā stetig ist bei ∞. Das ist gleichbedeutend dazu, daß es für jede Umgebung
U von a = ā(∞) eine Umgebung U 0 von ∞ gibt mit ā(U 0 ∩ D) ⊂ U . Das
hinwiederum ist gleichbedeutend dazu, daß es für jede Umgebung U von a ein
N ∈ R gibt mit ā((N, ∞] ∩ D) ⊂ U oder, wegen ā(∞) = a ∈ U immer noch
gleichbedeutend, mit ā((N, ∞] ∩ N) ⊂ U .
3.5.22. Eine Nullfolge ist eine Folge, die gegen Null konvergiert. Zum Beispiel
folgt aus Korollar 2.4.10 zur Archimedizität der reellen Zahlen sofort, daß die
Folge n 7→ 1/n gegeben für n ≥ 1 eine Nullfolge ist, in Formeln
lim 1/n = 0
n→∞
Alternativ folgt das auch durch Einschränken der Erkenntnis limx→∞ 1/x = 0 aus
3.5.11 auf positive natürliche Zahlen. Bei dieser Argumentation versteckt sich die
Archimedizität der reellen Zahlen in der implizit verwendeten Eigenschaft, daß
∞ ein Häufungspunkt zu N in R̄ ist.
3.5.23 (Diskussion der Terminologie). Mit unserer Konvention für die „Konver-
genz gegen ±∞“ bewegen wir uns zwar im Rahmen des allgemeinen Begriffs der
„Konvergenz in topologischen Räumen“ [AN2] 1.4.5, aber außerhalb der in der
einführenden Literatur zur Analysis üblichen Konventionen. Üblicherweise wird
stattdessen die Terminologie bestimmte Divergenz gegen ±∞ verwendet. Übli-
cherweise bleibt in anderen Worten der Begriff der konvergenten Folge reserviert
für Folgen, die gegen eine reelle Zahl konvergieren. Wir nennen solche Folgen
reell konvergent. Falls eine Folge nicht konvergiert, auch nicht gegen ∞ oder
−∞, so nennt man sie unbestimmt divergent. Wir verlieren mit unserer Termi-
nologie zwar etwas an terminologischer Kohärenz, da wir im weiteren „Reihen“
88
aus wieder anderen Gründen nur dann konvergent nennen werden, wenn die Fol-
ge ihrer Partialsummen reell konvergent ist. Das schien mir jedoch ein kleineres
Übel, als es eine unnötig einschränkende oder in Fälle aufspaltende Formulierung
von Aussagen wie 3.5.32 wäre.
3.5.24 (Lokalität des Grenzwerts). Der Grenzwert einer Funktion für x → p
hängt nur von ihrem Verhalten in einer Umgebung von p ab. Ist genauer p ∈ D
Häufungspunkt einer Teilmenge D ⊂ R̄m und f : D\p → R̄n eine Funk-
tion und V eine Umgebung von p, so existiert limx→p f (x) genau dann, wenn
limx→p (f |V ∩D\p )(x) existiert, und unter diesen Umständen gilt
89
Limites lassen sich iterieren:
lim f (x) = q und lim g(y) = c ⇒ lim g(f (x)) = c
x→p y→q x→p
Das zeigen wir, indem wir unsere Erkenntnisse aus 3.5.28 zum Vertauschen von
Limites mit dem Nachschalten stetiger Funktionen anwenden auf C := N und den
Häufungspunkt p := ∞ und an statt f (x) schreiben.
Beispiel 3.5.30. Wenden wir unsere Erkenntnisse 3.5.29 zur Vertauschung von
Folgenkonvergenz und stetigen Funktionen nach einer geschickten Umformung
2
auf die Funktion f (x) := 5+x
3+x
und die Folge an := 1/n an, so erhalten wir
5n3 + n 5 + (1/n)2 5
lim = lim =
n→∞ 3n3 + n2 n→∞ 3 + (1/n) 3
Definition 3.5.31. Sei b0 , b1 , b2 , . . . eine Folge. Ist 0 ≤ n0 < n1 < n2 < . . . eine
streng monoton wachsende Folge natürlicher Zahlen, so nennen wir die Folge
(bnk )k∈N mit Gliedern
bn0 , bn1 , bn2 , . . .
eine Teilfolge der Folge bn . Schreiben wir eine Folge in X als eine Abbildung
b : N → X, n 7→ b(n) = bn , so ist eine Teilfolge von b demnach eine Abbildung
der Gestalt b ◦ a für eine streng monoton wachsende Folge a : N → N gegeben
durch a(k) := nk .
90
In der Tat liegen in jeder Umgebung des Grenzwerts fast alle Glieder unserer
Folge und a forteriori auch fast alle Glieder jeder Teilfolge. Alternativ ist es auch
eine formale Konsequenz aus der Regel für iterierte Limites nach 3.5.27, die wir
spezialisieren können zu
(limk→∞ nk = ∞ und limn→∞ bn = b) ⇒ limk→∞ bnk = b
Nach unseren Annahmen ist hier limk→∞ nk = ∞ offensichtlich. Formal folgt es
auch aus der Regel für den Grenzwert durch Einquetschen 3.5.36.
3.5.33 (Grenzwert als komponentenweiser Grenzwert). Sei C ⊂ R̄m und p ∈
R̄m ein Häufungspunkt zu C und f = (f1 , . . . , fn ) : C\p → R̄n eine Abbildung
und b = (b1 , . . . , bn ) ∈ R̄n ein Punkt. So gilt
lim f (x) = b ⇔ lim fν (x) = bν ∀ν
x→p x→p
In der Tat folgt das unmittelbar aus unserer Erkenntnis 3.5.33, daß Stetigkeit
gleichbedeutend ist zu komponentenweiser Stetigkeit.
3.5.34 (Grenzwert von Summe, Produkt und Quotient). Seien C ⊂ R̄m eine
Teilmenge und p ∈ R̄m ein Häufungspunkt zu C und seien f, g : C\p → R reell-
wertige Funktionen mit reellen Grenzwerten limx→p f (x) = b und limx→p g(x) =
c. So folgt aus der Stetigkeit von Summe und Produkt stetiger Funktionen 3.2.34
unmittelbar limx→p (f + g)(x) = b + c und limx→p (f g)(x) = bc. Ebenso folgt aus
der Stetigkeit des Quotienten 3.3.5 unter der zusätzlichen Annahme, daß g keine
Nullstelle hat und der Grenzwert c nicht Null ist, auch limx→p f (x)/g(x) = b/c.
3.5.35 (Grenzwert durch Einquetschen). Seien C ⊂ R̄m eine Teilmenge und
p ∈ R̄m ein Häufungspunkt zu C und f, g, h : C\p → R̄ Funktionen mit
f (x) ≤ g(x) ≤ h(x) für alle x ∈ C\p.
So folgt aus limx→p f (x) = b = limx→p h(x) schon limx→p g(x) = b. In der Tat
gibt es unter diesen Annahmen für jede Intervallumgebung I von b Umgebungen
U, W von p mit f (U ∩C\p) ⊂ I und h(W ∩C\p) ⊂ I. Dann aber ist V := U ∩W
offensichtlich eine Umgebung von p mit g(V ∩ C\p) ⊂ I. Alternativ folgt das
auch sofort aus unserer Übung zur Stetigkeit durch Einquetschen 3.2.46.
Beispiel 3.5.36. Aus limx→p f (x) = ∞ und f (x) ≤ g(x) ∀x folgt durch Einquet-
schen limx→p g(x) = ∞. In diesem Fall können wir als „obere Quetschfunktion“
h die konstante Funktion h(x) = ∞ ∀x wählen.
Lemma 3.5.37 (Erhaltung schwacher Ungleichungen im Grenzwert). Seien
C ⊂ R̄m eine Teilmenge und p ein Häufungspunkt zu C und f, g : C\p → R̄
Funktionen mit f (x) ≤ g(x) für alle x ∈ C\p. Existieren die Grenzwerte von f
und g für x → p, so gilt
lim f (x) ≤ lim g(x)
x→p x→p
91
3.5.38. Man beachte den Unterschied zum Grenzwert durch Einquetschen 3.5.35.
Er gibt ein hinreichendes Kriterium für die Existenz eines Grenzwerts, wohin-
gegen Lemma 3.5.37 über die Erhaltung von Ungleichungen im Grenzwert nur
Eigenschaften von Grenzwerten behauptet, deren Existenz bereits bekannt ist.
Beweis. Durch Widerspruch. Sei a der Grenzwert von f und b der Grenzwert von
g. Hätten wir a > b alias b < a, so fänden wir k mit b < k < a. Dann wäre
[−∞, k) eine Umgebung von b und (k, ∞] eine Umgebung von a. Es gäbe also
Umgebungen U und V von p mit f (U ∩ C\p) ⊂ (k, ∞] und g(V ∩ C\p) ⊂
[−∞, k). Da p Häufungspunkt zu C ist, wäre U ∩ V ∩ C\p nicht leer. Für jeden
Punkt x aus dieser Menge gälte aber f (x) > g(x) im Widerspruch zu unserer
Annahme.
x>1 limn→∞ xn = ∞;
x=1 limn→∞ xn = 1;
|x| < 1 limn→∞ xn = 0;
x ≤ −1 Die Folge xn divergiert unbestimmt.
Beweis. Im Fall x > 1 schreiben wir x = 1 + y mit y > 0 und erhalten mit der
binomischen Formel
xn = (1 + y)n ≥ 1 + ny
Die Folge n 7→ 1 + ny strebt aber gegen ∞ und nach 3.5.36 strebt dann die Folge
xn auch gegen ∞. Im Fall x = 1 ist die Folge konstant 1 und es ist nichts zu
zeigen. Falls 0 < x < 1 gilt nach dem Vorhergehenden limn→∞ 1/xn = ∞ und
daraus folgt limn→∞ xn = 0 durch Anwenden der stetig von (0, ∞) auf [0, ∞]
fortgesetzten Funktion t 7→ 1/t aus 3.3.4. Für −1 < x ≤ 0 folgt die Behaup-
tung dann wegen −|x|n ≤ xn ≤ |x|n durch Einquetschen. Im Fall x ≤ −1 gilt
|xn − xn+1 | ≥ 2 für alle n. Also kann die Folge nicht gegen eine reelle Zahl a
konvergieren, denn dann müßte gelten |a − xn | < 1 für fast alle n und dann nach
der Dreiecksungleichung |xn −xn+1 | < 2 für fast alle n. Die Folge kann in diesem
Fall aber auch nicht gegen ∞ oder −∞ konvergieren, da die Folgenglieder immer
abwechselnd positiv und negativ sind.
92
daß f die Gleichung f (x) = xf (1) erfüllt. Auch ohne die Stetigkeit von f zu
benutzen, folgern wir f (q) = qf (1) zunächst für alle q ∈ N, dann für alle q ∈ Z,
dann für alle q ∈ Q. Um unsere Gleichung f (x) = xf (1) sogar für alle x ∈
R zu zeigen, nutzen wir die Erkenntnis, daß nach 2.4.10 jede reelle Zahl x ein
Häufungspunkt zu Q ist. Für alle x ∈ R gilt also
f (x) = lim f (q) = lim qf (1) = xf (1)
Q3q→x Q3q→x
Ofensichtlich existiert in dieser Situation der Grenzwert bei p genau dann, wenn
der linkseitige Grenzwert und der rechtseitige Grenzwert existieren und überein-
stimmen.
Beispiel 3.5.42. Es gilt limx&0 1/x = ∞ und limx%0 1/x = −∞.
Satz 3.5.43 (Stetigkeit als Folgenstetigkeit). Seien f : R̄m ⊃ D → R̄n eine
Funktion und a ∈ D ein Punkt. So sind gleichbedeutend:
1. f ist stetig bei a;
2. Für jede Folge a0 , a1 , . . . von Punkten aus D mit limi→∞ ai = a gilt bereits
limi→∞ f (ai ) = f (a).
3.5.44. Dieser Satz ist für uns bis auf weiteres nicht relevant. Soweit ich sehen
kann, benötigen wir ihn im hier verfolgten Aufbau der Theorie erst in Analysis 3,
um zu zeigen, daß die Fouriertransformierte einer integrierbaren Funktion stetig
ist. Allerdings kann es leicht passieren, daß Sie in einer Prüfung nach diesem Satz
gefragt werden.
Beweis. 1 ⇒ 2 haben wir schon in 3.5.29 erledigt. Wir konzentrieren uns deshalb
auf 2 ⇒ 1. Das zeigen wir durch Widerspruch. Für unser a ∈ R̄n finden wir nach
Übung 3.5.46 eine absteigende Folge von Umgebungen V0 ⊃ V1 ⊃ V2 ⊃ . . .
derart, daß jede Umgebung V von a fast alle Vi umfaßt. Ist f nicht stetig bei a, so
gibt es eine Umgebung U von f (a) derart, daß für kein i gilt f (Vi ∩ D) ⊂ U . Für
jedes i finden wir also ai ∈ Vi ∩ D mit f (ai ) 6∈ U . Die ai bilden dann eine Folge
in D mit limi→∞ ai = a, für die nicht gilt limi→∞ f (ai ) = f (a).
93
Übungen
Übung 3.5.45. Sei C ⊂ R eine Teilmenge derart, daß ∞ ein Häufungspunkt
zu C ist, und sei f : C → R̄ eine Funktion. Man zeige, daß genau dann gilt
limx→∞ f (x) = −∞, wenn es für jedes M ∈ R ein N = NM ∈ R gibt mit
x > N ⇒ f (x) < M
Übung 3.5.46. Für jedes a ∈ R̄n gibt es eine absteigende Folge von Umgebungen
V0 ⊃ V1 ⊃ V2 ⊃ . . . derart, daß jede Umgebung von a fast alle der Vi umfaßt.
Übung 3.5.47. Ist A ⊂ R̄ eine nichtleere Teilmenge, so ist sup A das größte Ele-
ment in der Menge G aller Punkte aus den erweiterten reellen Zahlen, die Grenz-
werte von Folgen aus A sind. Diese Übung wird verwendet für die Herleitung des
Satzes über Extrema auf Kompakta.
Übung 3.5.48. Sei C ⊂ R̄ eine Teilmenge. Genau dann ist p ∈ R̄ Häufungspunkt
zu C, wenn es eine Folge reeller Zahlen xn in C\p gibt mit limn→∞ xn = p.
Übung 3.5.49. Aus limn→∞ an = a folgt limn→∞ |an | = |a|. Umgekehrt folgt aus
limn→∞ |an | = 0 bereits limn→∞ an = 0.
Übung 3.5.50. Ist (an ) eine Folge reeller Zahlen, die gegen eine reelle Zahl kon-
vergiert, so gilt limn→∞ (an+1 − an ) = 0.
Übung 3.5.51 (Folgenkriterium für Grenzwerte von Funktionen). Sei C ⊂ R̄
eine Teilmenge, p ein Häufungspunkt zu C und f : C\p → R̄ eine Funktion. So
gilt limx→p f (x) = b genau dann, wenn für jede Folge xn in C\p mit xn → p gilt
f (xn ) → b.
Übung 3.5.52. Sei C ⊂ R̄m eine Teilmenge, p ein Häufungspunkt zu C, f :
C\p → R eine Funktion und b ∈ R. So gilt
lim f (x) = b ⇔ lim |f (x) − b| = 0
x→p x→p
94
Übung 3.5.55. Man zeige: Die Regeln zum Vertauschen von Grenzwertbildung
mit Addition und Multiplikation gelten auch noch, wenn wir a, b ∈ R̄ zulassen
und a + b beziehungsweise ab sinnvoll definiert sind im Sinne von Übung 3.2.44.
Ergänzende Übung 3.5.56. Sei L ⊂ R eine Untergruppe der additiven Gruppe der
reellen Zahlen, die keine Häufungspunkte in R hat. So gibt es α ∈ R mit L = Zα.
3.6.5. Hier mögen Sie sich an unsere Sprachregelung [GR] 1.7.3 erinnern. Ge-
meint ist demnach: Jede Folge in einer angeordneten Menge besitzt mindestens
eine monotone Teilfolge.
Beweis. Wir nennen ein Folgenglied xn oder präziser seinen Index n einen „Aus-
sichtspunkt“ der Folge, wenn alle späteren Folgenglieder kleiner sind, in Formeln
xn > xm für alle m > n. Besitzt unsere Folge unendlich viele Aussichtspunkte,
95
Bei der Folge (−1)n 6/n ist jedes zweite Folgenglied ein Ausichtspunkt im Sinne
des Beweises von Lemma 3.6.4.
96
so bilden diese eine streng monoton fallende Teilfolge. Sonst gibt es einen letzten
Aussichtspunkt xn . Dann finden wir aber eine monoton wachsende Teilfolge, die
mit xn+1 beginnt, denn ab dem Index n + 1 kommt dann nach jedem Folgenglied
noch ein anderes, das mindestens ebenso groß ist.
Beweis. Jede Folge in R̄ besitzt nach 3.6.4 eine monotone Teilfolge, und diese ist
nach 3.6.3 konvergent in R̄. Ist unsere Folge beschränkt, so ist auch jede solche
Teilfolge beschränkt und konvergiert folglich gegen eine reelle Zahl.
Definition 3.6.7. Eine Folge (xn )n∈N in einem angeordneten Körper heißt eine
Cauchy-Folge, wenn es für jedes ε > 0 ein N = Nε ∈ N gibt derart, daß gilt
|xn − xm | < ε falls n, m ≥ N .
Satz 3.6.8. Eine Folge reeller Zahlen konvergiert gegen eine reelle Zahl genau
dann, wenn sie eine Cauchy-Folge ist.
Beweis. Daß jede reell konvergente Folge Cauchy sein muß, ist leicht zu sehen:
Aus limn→∞ xn = x folgt, daß es für alle ε > 0 ein N ∈ N gibt mit |xn −x| < ε/2
für n ≥ N . Daraus folgt dann |xn − xm | < ε für n, m ≥ N . Wir zeigen nun
umgekehrt, daß auch jede Cauchy-Folge gegen eine reelle Zahl konvergiert. Eine
Cauchy-Folge xn ist sicher beschränkt, denn wählen wir für ε = 1 ein N = Nε ,
so liegen fast alle Folgenglieder im Intervall (xN − 1, xN + 1), und die endlich
vielen Ausnahmen können wir durch eine hinreichend große Schranke auch noch
einfangen. Unsere Cauchy-Folge besitzt daher nach 3.6.6 eine reell konvergente
Teilfolge xnk , sagen wir limk→∞ xnk = x. Wir behaupten, daß dann auch die
Folge xn selbst gegen x konvergiert. In der Tat gibt es für alle ε > 0 ein Nε mit
n, m ≥ Nε ⇒ |xn −xm | < ε. Aus n ≥ Nε folgt damit insbesondere |xn −xnk | < ε
für fast alle k und dann im Grenzwert |xn − x| ≤ ε , da ja die Ungleichungen
−ε ≤ xn − xnk ≤ ε bestehen bleiben beim Grenzübergang k → ∞.
3.6.9. Ein angeordneter Körper, in dem jede Cauchy-Folge konvergiert, heißt voll-
ständig. Dieser Begriff ist Teil einer alternativen Charakterisierung der reellen
Zahlen, die wir im folgenden als Übung formulieren.
Übungen
Übung 3.6.10. Gegeben ein angeordneter Körper sind gleichbedeutend: (1) Je-
de nichtleere Teilmenge mit einer unteren Schranke besitzt eine größte untere
Schranke; (2) Der Körper ist archimedisch angeordnet und vollständig.
97
Übung 3.6.11 (Intervallschachtelungsprinzip). Gegeben eine absteigende Folge
von nichtleeren
T kompakten reellen Intervallen R ⊃ I0 ⊃ I1 ⊃ I2 . . . ist auch ihr
Schnitt ν∈N Iν nicht leer.
Übung 3.6.12 (Cauchy-Kriterium für Grenzwerte von Funktionen). Sei C ⊂
R̄ eine Teilmenge, p ein Häufungspunkt zu C und f : C\p → R eine reell-
wertige Funktion. Genau dann existiert der Grenzwert limx→p f (x) und ist eine
reelle Zahl, wenn es für alle ε > 0 eine Umgebung U = Uε von p gibt mit
(a, b ∈ U ∩ C\p) ⇒ |f (a) − f (b)| < ε.
Übung 3.6.13. Ich erinnere an die Fibonacci-Folge und den goldenen Schnitt aus
[EIN] 1.2.2. Man zeige, daß der Quotient zweier aufeinanderfolgender Glieder
der Fibonacci-Folge gegen den goldenen Schnitt strebt, daß also in Formeln gilt
√
xi+1 1+ 5
lim =
i→∞ xi 2
für unsere Fibonacci-Folge x0 , x1 , x2 , . . . aus [EIN] 1.2.2.
Übung 3.6.14. Gegeben zwei reelle Zahlen a, b ∈ R definiert man ihr arithme-
tisches Mittel als die Zahl (a + b)/2. Gegeben zwei nichtnegative
√ reelle Zahlen
a, b ∈ R≥0 definiert man ihr geometrisches Mittel als die Zahl ab. Anschaulich
ist das die Kantenlänge eines Quadrats, das dieselbe Fläche hat wie das Rechteck
mit den Seitenlängen a und b, und daher kommt vermutlich auch√die Terminolo-
gie. Man zeige für je zwei positive reelle Zahlen die Ungleichung ab ≤ (a+b)/2
zwischen geometrischem und arithmetischen Mittel und zeige, daß Gleichheit nur
gilt im Fall a = b = 0.
Da die Folge der xn monoton fällt und durch Null nach unten beschränkt ist,
besitzt sie einen Grenzwert x ≥ 0. Aus der Gleichung
2xn xn+1 = x2n + a
folgt dann x2 = a durch Übergang zum Grenzwert für n → ∞ auf beiden Seiten.
98
induktiven Formel für die Glieder der Folge xn
Graphische Darstellung unserer√
mit Grenzwert a aus dem Beweis von 3.3.14
99
√
3.7.2. Die Ungleichungen a/xn ≤ a < xn erlauben uns sogar abzuschätzen,
wie gut unsere Approximation
√ xn mindestens sein muß. Machen wir für den Feh-
ler den Ansatz xn = a(1 + fn ), so ergibt sich mit etwas Rechnen
fn2
fn+1 =
2(1 + fn )
100
4 Exponentialfunktion
4.1 Konvergenz von Reihen
Definition 4.1.1. Sei (ak )k∈N eine Folge reeller Zahlen. Der Ausdruck
∞
X
ak
k=0
bezeichnet sowohl die Folge (sn ) der Partialsummen sn := nk=0 ak als auch,
P
101
4.1.6 (Herkunft der Terminologie). Die Folgen der Gestalt axn heißen geome-
trische Folgen, da bei ihnen zumindest im Fall a > 0, x > 0 jedes Folgenglied
nach dem ersten das geometrische Mittel im Sinne von 3.6.14 seines Vorgängers
und seines Nachfolgers ist. Die geometrische Reihe hinwiederum erbt ihren Na-
men von der geometrischen Folge.
Beispiel 4.1.7. Es gilt 1 + 21 + 41 + 18 + . . . = 2 und
∞
9 X 1
0,999 . . . = =1
10 k=0 10k
P P
Satz 4.1.8.
P Sind ak und
P bk konvergente Reihen, so konvergieren auch die
Reihen (ak + bk ) und λak und es gilt:
P P P
(akP
+ bk ) = P ak + b k
λak = λ ak
Beweis. Das folgt, indem man die Vertauschbarkeit 3.5.34 von Summen und Pro-
dukten mit Grenzwerten auf die Folgen der Partialsummen anwendet.
4.1.9. Eine Reihe kann nur dann konvergieren, wenn die Folge der Reihenglieder
gegen Null strebt. In der Tat folgt das sofort, wenn wir Übung 3.5.50 auf die
Folge der Partialsummen anwenden. Diese Übung besagte, nur zur Erinnerung,
daß die Differenzen aufeinanderfolgender Glieder einer reell konvergenten Folge
stets eine Nullfolge bilden.
Lemma 4.1.10 (Konvergenz beschränkter nichtnegativer Reihen). Eine Reihe,
die aus nichtnegativen Gliedern besteht, konvergiert genau dann, wenn die Folge
ihrer Partialsummen beschränkt ist.
Beweis. Ist kein Reihenglied negativ, so wächst die Folge der Partialsummen mo-
noton. Ist diese Folge auch noch beschränkt, so muß die Folge der Partialsummen
nach 3.6.3 reell konvergent sein. Die Umkehrung ist eh klar.
Beispiel 4.1.11. Die harmonische Reihe ∞ 1
P
k=1 k konvergiert nicht, da ja gilt
1 1
2
≥ 2
1 1 1
3
+ 4
≥ 2
1
5
+ 16 + +
1
7
1
8
≥ 1
2
und so weiter.
102
Die Divergenz der harmonischen Reihe 4.1.11 zeigt, daß man mit hinreichend
vielen identischen Bauklötzen einen beliebig weit neben seinem Grundklotz
endenden Turm bauen kann. Obiges Bild zeigt etwa, wie weit man mit vier
Klötzen so gerade eben mal kommen kann.
103
Vorschau 4.1.12. In der Funktionentheorie können Sie lernen, daß diese Reihen
sogar eine außerordentlich interessante Funktion ζ(s) definieren, die sogenannte
Riemann’sche ζ-Funktion. Wir werden in [FT1] 6.2.9 zeigen, daß zum Beispiel
2 4 π6
gilt ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945 und nach [FT1] 6.2.7 haben wir sogar ganz
allgemein ζ(2n) ∈ Qπ 2n für beliebige natürliche Zahlen n ≥ 1. Alle diese For-
meln sind berühmte Resultate des 1707 in Basel geborenen Mathematikers Leon-
hard Euler. Als Übung 5.5.28 werden Sie im übrigen zeigen, daß auch die Reihe
der Kehrwerte aller Primzahlen bereits divergiert. Für diejenigen unter Ihnen, die
die komplexen Zahlen bereits kennen, sei erwähnt, daß es mit etwas größerem
Aufwand sogar gelingt, ζ(s) zu definieren für jede komplexe Zahl s 6= 1, ver-
gleiche etwa [FT1] 7.1.7. Die vielleicht berühmteste Vermutung der Mathematik,
die Riemann’sche Vermutung, besagt, daß alle Nullstellen der Riemann’schen
ζ-Funktion, die nicht auf der reellen Achse liegen, Realteil 1/2 haben müssen.
Ein Beweis dieser Vermutung hätte weitreichende Konsequenzen für unser Ver-
ständnis der Verteilung der Primzahlen, wie der Beweis des Primzahlsatzes [FT1]
7.1.1 illustriert. Die Riemann’sche Vermutung ist übrigends der Kern des achten
Hilbert’schen Problems.
Definition 4.1.13. Wir sagen, eine Reihe ∞
P
k=0 ak konvergiere absolut, wenn die
ReiheP∞der Absolutbeträge der Reihenglieder konvergiert, wenn also in Formeln
gilt k=0 |ak | < ∞.
Beispiel 4.1.14. Die sogenannte alternierende harmonische Reihe
∞
X 1 1 1 1
(−1)k+1 = 1 − + − + ...
k=1
k 2 3 4
konvergiert, aber nicht absolut. Daß die Reihe nicht absolut konvergiert, hatten wir
schon in 4.1.11 gesehen. Um zu zeigen, daß unsere Reihe dennoch konvergiert,
beachten wir, daß für die Folge sn der Partialsummen gilt
s2 ≤ s4 ≤ s6 ≤ . . . s5 ≤ s3 ≤ s1
Folglich existiert S = sup{s2 , s4 , . . .}. Da aber gilt s2k ≤ S ≤ s2k+1 für alle
k erhalten wir |S − sn | ≤ n1 und folglich limn→∞ sn = S. Wir werden in 6.4.1
sehen, daß genauer gilt 1 − 12 + 13 − 41 + . . . = log 2.
Satz 4.1.15. Jede absolut konvergente Reihe konvergiert.
Beweis. Sei ∞
P
k=0 ak unsere absolut konvergente Reihe. Seien
n
X n
X
sn = ak , Sn = |ak |
k=0 k=0
104
die Partialsummen der Reihe selbst und der Reihe der Absolutbeträge. Nach An-
nahme konvergiert die Folge der PnSn in R und istPalso
n
eine Cauchy-Folge. Da aber
für n > m gilt |sn − sm | = | k=m+1 ak | ≤ k=m+1 |ak | = Sn − Sm , ist dann
auch sn eine Cauchy-Folge und konvergiert in R nach 3.6.8.
P
Proposition 4.1.16 (Majorantenkriterium). Sei ak eine Reihe. Gibt es für
unsere
P Reihe eine konvergente Majorante, als da heißt eine P
konvergente Reihe
bk mit |ak | ≤ bk für fast alle k, so konvergiert unsere Reihe ak absolut.
Beweis. Indem wir endlich viele Glieder abändern, dürfen wir ohne Beschränkung
P
der Allgemeinheit annehmen, daß |ak | ≤ bk sogar für alle k gilt. Die Reihe |ak |
besteht nun aus nichtnegativen
P Gliedern und die Folge ihrer Partialsummen ist
beschränkt durch bk . Aus der KonvergenzPbeschränkter nichtnegativer Reihen
4.1.10 folgt damit die Konvergenz der Reihe |ak |.
105
P
Beweis.
P∞ Da |ak | konvergiert, finden wir schon mal für jedes ε > 0 ein N mit
k=N +1 |a k | ≤ ε. Ist M so groß, daß gilt u({1, . . . , M }) ⊃ {1, . . . , N }, so er-
halten wir daraus für alle n ≥ N die Abschätzung
M
X n
X
au(k) − ak ≤ ε
k=0 k=0
Diese Abschätzung gilt nach der Erhaltung 3.5.37 von Ungleichungen im Grenz-
wert und der Vertauschbarkeit 3.5.28 von stetigen Funktionen und insbesondere
der Betragsfunktion mit Grenzwerten dann auch im Grenzwert n → ∞ und zeigt,
daß die Folge der Partialsummen der umgeordneten Reihe konvergiert und den-
selben Grenzwert hat wie die Folge der Partialsummen der ursprünglichen Reihe.
Wenden wir diese Erkenntnis auf die Reihe der Absolutbeträge an, so folgt auch
die absolute Konvergenz der umgeordneten Reihe.
4.1.22
P (Problematik der Umordnung nicht absolut konvergenter Reihen). Ist
ak eine konvergente Reihe reeller Zahlen, die nicht P
absolut konvergiert, so gibt
es für jedes x ∈ R̄ eine Umordnung u : N → N mit ∞
∼
k=0 au(k) = x. In der Tat
divergieren in diesem Fall die Reihen ihrer positiven und ihrer negativen Terme
jeweils für sich genommen. Die Strategie im Fall x ∈ R ist nun, erst nur positi-
ve Reihenglieder zu nehmen, bis man oberhalb von x ist, dann nur negative, bis
man wieder drunterrutscht, und immer so weiter. Für x = ±∞ muß man diese
Strategie noch etwas verfeinern.
Definition* 4.1.23. Gegeben eine Familie von reellen Zahlen (ai )i∈I und s ∈ R̄
schreiben wir X
ai = s
i∈I
als Abkürzung für die Aussage, daß es für jede Umgebung U von s eine endli-
che Teilmenge P IU ⊂ I gibt derart, daß für jede endliche Teilmenge J ⊂ I mit
IU ⊂ J gilt i∈J ai ∈ U . Es ist klar, daß hier s eindeutig bestimmt ist, wenn es
existiert. Ist zusätzlich s reell, so nennen wir unsere Familie von reellen Zahlen
summierbar.
4.1.24. Mir gefällt am Konzept der Summierbarkeit, daß darin von einer Reihen-
folge der Summanden erst gar nicht die Rede ist. Später, wenn wir auch in „nor-
mierten“ Vektorräumen unendlicher Dimension summieren, sind Summierbarkeit
und absolute Konvergenz nicht mehr gleichbedeutend, und dann erweist sich das
Analogon der Summierbarkeit 4.1.23 als der nützlichere Begriff.
Satz* 4.1.25 (Summierbarkeit und absolute Konvergenz). Eine Familie (ai )i∈I
von reellen Zahlen ist genau dann summierbar, wenn entweder I endlich ist oder
106
P∞
es eine Injektion z : N ,→ I gibt mit (ai 6= 0 ⇒ i ∈ z(N)) derart, daß k=0 az(k)
absolut konvergiert. In diesem Fall gilt dann
X ∞
X
ai = az(k)
i∈I k=0
Beweis. Bei einer summierbaren Familie kann es offensichtlich für alle n ∈ N≥1
höchstens endlich viele Indizes i geben mit ai ≥ 1/n und ebenso höchstens end-
lich viele Indizes i mit ai ≤ −1/n. Ist I unendlich, so finden wir demnach eine In-
jektion z : N ,→ I mit (ai 6= 0 ⇒ i ∈ z(N)). Weiter müssen bei einer summierba-
ren Familie die Werte endlicher Teilsummen offensichtlich eine beschränkte Men-
ge von reellen Zahlen bilden. Das gilt insbesondere für alle endlichen Teilsummen
aus positiven ai ebenso wie für Palle endlichen Teilsummen aus negativen P∞ ai und
∞
zeigt die absolute Konvergenz k=0 |az(k) | < ∞. Setzen wir nun s := k=0 az(k)
und ist U eine Umgebung von s, so finden wir ε > 0 P mit (s − ε, s + ε) ⊂ U und
wegen der absoluten Konvergenz weiter N gibt mit ∞ k=N |az(k) | < ε. Nehmen
wir alsoPIU := z({0, 1, . . . , N − 1}), so folgt für endliches J ⊂ I aus J ⊃ IU
bereits i∈J ai ∈ U und damit
X ∞
X
ai = s = az(k)
i∈I k=0
Daß umgekehrt aus absoluter Konvergenz die Summierbarkeit folgt wie im Satz
behauptet, zeigt dieses Argument gleich mit.
Übungen
Übung 4.1.26. Genau dann läßt sich eine reelle Zahl durch einen periodischen
Dezimalausdruck darstellen, wenn sie rational ist.
Übung 4.1.27. Man zeige das Leibniz’sche Konvergenzkriterium:
P∞ Ist ak eine
k
monoton fallende Nullfolge, so konvergiert die Reihe k=0 (−1) ak .
P
Ergänzende Übung 4.1.28. Ist ak eine konvergente Reihe reeller Zahlen und
∼
u : N → N eine Umordnung mit der Eigenschaft,P daß |u(k) − k| beschränkt ist,
so konvergiert auch die umgeordnete Reihe au(k) und zwar gegen denselben
Grenzwert. Für derartige Umordnungen erhält man also die Aussage des Umord-
nungssatzes auch ohne absolute Konvergenz.
Ergänzende Übung 4.1.29. Gegeben eine summierbare Familie von reellen Zah-
len (ai )i∈I zeige man, daß auch für eine beliebige Teilmenge J ⊂FI die Familie
(ai )i∈J summierbar ist und daß für eine beliebige Zerlegung I = k∈K I(k) von
107
I in eine Vereinigung von paarweise disjunkten Teilmengen I(k) gilt
X X X
ai = ai
i∈I k∈K i∈I(k)
xk xk n(n−1)...(n−k+1)
PM PM
+ k=0 k! − k=0 k! n · n · ... · n
P∞ xk n(n−1)...(n−k+1)
+ k=M +1 k! n · n · ... · n
108
Da die Exponentialreihe für vorgegebenes x absolut konvergiert, gibt es für jedes
ε > 0 ein M = Mε derart, daß für jedes n der erste und der letzte Term rechts
beschränkt sind durch ε. Für dies feste M geht der mittlere Term bei n → ∞
gegen Null, es gibt also N = Nε derart, daß
n er für dies feste M kleiner wird als ε
falls n ≥ N . Damit gilt exp(x) − 1 + nx ≤ 3ε falls n ≥ N .
4.2.4. Aus unserer Proposition 4.2.3 folgt unmittelbar für alle k ∈ N≥1 die Formel
exp(kx) = (exp x)k vermittels der Rechnung
n kn
kx kx x nk
exp(kx) = lim 1 + = lim 1 + = lim 1 + = (exp x)k
n→∞ n n→∞ kn n→∞ n
Funktionalgleichung 4.2.10.
4.2.5 (Exponentialfunktion und Wachstum). Die Darstellung der Exponenti-
alfunktion als Grenzwert von Potenzen 4.2.3 kann man dahingehend interpretie-
ren, daß exp(x) das Kapital ist, das in x Jahren aus einem Euro entsteht bei ei-
ner „kontinuierlichen Verzinsung mit einem Zinssatz von 100%“. Legen wir das
Geld zum Beispiel für ein Jahr an, so haben wir bei jährlicher Verzinsung am
Ende des Jahres zwei Euro auf dem Konto. Bei monatlicher Verzinsung ergeben
1 12
sich mit Zinseszinsen schon (1 + 12 ) Euro, und bei kontinuierlicher Verzinsung
e := exp(1) = 2,781 . . . Euro. Man nennt e die Euler’sche Zahl. In der Schule
haben Sie möglicherweise ex statt exp(x) geschrieben, aber wir erlauben uns das
erst ab 4.3.5, wo wir für beliebiges a > 0 die Abbildung Z → R, n 7→ an zu
einer Abbildung R → R, b 7→ ab fortsetzen und zwar nach 4.3.21 auf die einzig
mögliche Weise, bei der die Funktion b 7→ ab monoton ist und die „Funktional-
gleichung“ ab+c = ab ac erfüllt.
4.2.6. In einem Ausdruck der Gestalt ab nennt man für gewöhnlich a die Basis und
b den Exponenten, weil er eben exponiert oben an die Basis geschrieben wird.
Daher rührt auch die Bezeichnung als „Exponentialfunktion“. Ich würde unsere
Funktion viel lieber ihrer Natur nach die „Funktion des natürlichen Wachstums“
oder die „Wachstumsfunktion“ nennen, aber die aus der Schreibweise abgeleitete
Bezeichnung hat sich nun einmal durchgesetzt, mag sie auch aus historischen Zu-
fällen entstanden sein: Hätte sich für die Bezeichnung des Quadrats einer Zahl a
statt der Notation a2 die Notation a2 eingebürgert, so würde in Anbetracht dieses
Schemas der Begriffsbildung unsere Exponentialfunktion heute vielleicht „Pedes-
talfunktion“ heißen. . .
109
Der Graph der Exponentialfunktion in zwei Maßstäben. Man erkennt unschwer,
daß ein konstantes Wirtschaftswachstum über längere Zeiträume in einer
Katastrophe enden muß. In derselben Weise entwickelt sich im Übrigen auch die
Geschwindigkeit einer Vorlesung unter der Annahme, daß die Stoffmenge, die in
einer Stunde vermittelt werden kann, proportional ist zur Menge des Stoffes, den
die Zuhörer bereits kennen. . .
110
4.2.7 (Didaktische Gedanken zur Einführung der Exponentialfunktion). Eine
infinitesimale Formulierung der in 4.2.5 erläuterten Bedeutung der Exponential-
funktion gibt Korollar 5.5.9, in dem die Exponentialfunktion charakterisiert wird
als die eindeutig bestimmte differenzierbare Funktion von den reellen Zahlen in
sich selber, die mit ihrer eigenen Ableitung übereinstimmt und bei Null den Wert
Eins annimmt. Gehen wir von dieser Charakterisierung aus, so führt uns der For-
malismus der Taylorreihen 6.2.2 ganz natürlich zu der Reihe, die wir in 4.2.1
haben vom Himmel fallen lassen. Ein Randerer Zugang zur Exponentialfunktion
x
besteht darin, von der Funktion x 7→ 1 (1/t) dt auszugehen, von der man un-
∼
schwer zeigt, daß sie einen stetigen Gruppenisomorphismus R× → R liefert, und
dann die Exponentialfunktion als deren Umkehrfunktion zu erhalten. Das bedeu-
tet jedoch, daß man mit der Einführung der Exponentialfunktion die Konstruktion
des Integrals abwarten muß. Eigentlich will ich es ja nach Möglichkeit vermei-
den, Formeln vom Himmel fallen zu lassen. In diesem Fall schienen mir aber die
didaktischen Vorteile der dadurch ermöglichten frühzeitigen Einführung dieser
außerordentlich wichtigen Funktion zu überwiegen.
4.2.8. Die Exponentialfunktion wächst ungeheuer schnell. Eine gewisse Vorstel-
lung davon mag die Erkenntnis 7.1.16 geben, nach der der Graph der Funktion
(exp(x)+exp(−x))/2, in einem jeweils der speziellen Situation angepaßten Maß-
stab auf die Wand gemalt, genau die Gestalt einer zwischen zwei Nägeln durch-
hängenden Kette hat. Ist die Kette zwanzigmal so lang ist wie der Abstand der
beiden Nägel, so stellt sie unsere Funktion in etwa auf dem Intervall von −2,3 bis
2,3 dar. Ist die Kette zweihundertmal so lang wie der Abstand der beiden Nägel,
so erhalten wir unsere Funktion in etwa auf dem Intervall von −4,6 bis 4,6. Und
eine Zwei-Meter-Kette hängt zwischen zwei im Abstand von einem knappen Zen-
timeter eingeschlagenen Nägeln schon recht steil!
4.2.9. In 1.3.11 habe ich erklärt, wie man mit einem Blatt Papier auf den Mond
kommt und wie auch der Fortgang dieser Vorlesung exponentiellen Charakter hat.
In der Wirtschaft ist es nicht anders. Ein jährliches Wirtschaftswachstum von 3%
bedeutet wegen (1, 03)25 > 2 etwas mehr als eine Verdopplung der Wirtschafts-
leistung in 25 Jahren und muß auf die Dauer unweigerlich in einer Katastrophe
enden.
Satz 4.2.10 (Funktionalgleichung der Exponentialfunktion). Die Exponential-
funktion ist ein Monoidhomomorphismus von der additiven Gruppe der reellen
Zahlen in das multiplikative Monoid der reellen Zahlen. In Formeln ausgedrückt
gilt also exp(0) = 1 und
exp(x + y) = exp(x) exp(y) ∀x, y ∈ R
4.2.11. Unsere Formel exp(kx) = (exp x)k aus 4.2.4 können wir auch unschwer
mit Induktion über k aus der Funktionalgleichung herleiten.
111
4.2.12. Stellen wir uns exp(x) vor als das Vermögen, daß in x Jahren aus einem
Euro entsteht bei kontinuierlicher Verzinsung mit 100%, so erhalten wir offen-
sichtlich gleichviel, ob wir unser Vermögen exp(x) nach x Jahren gleich wieder
für y Jahre anlegen, oder ob wir unseren Euro gleich von Anfang an x + y Jah-
re arbeiten lassen. Das ist die Bedeutung der Funktionalgleichung. Nach 1.5.43
induziert jeder Monoidhomomorphismus (R, +) → (R, ·) einen Gruppenhomo-
morphismus R → R× . In 4.3.21 werden Sie zeigen, daß die Gruppenhomomor-
phismen ϕ : R → R× mit der Eigenschaft x < y ⇒ ϕ(x) < ϕ(y) genau die
Abbildungen ϕ(x) = exp(ax) sind mit a > 0. In 4.3.2 werden wir zeigen, daß die
Exponentialfunktion sogar einen Isomorphismus zwischen der additiven Gruppe
der reellen Zahlen und der multiplikativen Gruppe der positiven reellen Zahlen
liefert.
Ergänzung 4.2.13. Der gleich folgende Beweis der Funktionalgleichung gefällt
mir nicht besonders. Ein anderer aber in seiner Weise auch etwas verwickelter
Beweis wird in 4.2.22 vorgestellt. Ein mehr konzeptueller Zugang zur Exponen-
tialfunktion und ihrer Funktionalgleichung wird in 5.8.11 und 5.8.22 skizziert. Er
benötigt jedoch Hilfsmittel, die uns hier noch nicht zur Verfügung stehen. Er läßt
auch nicht so einfach auf den Fall von komplexen Zahlen verallgemeinern, der
für uns bei der Diskussion von Sinus und Cosinus eine wesentliche Rolle spie-
len wird. Aus diesen Gründen gebe ich für die Funktionalgleichung zunächst den
algebraisch-formalen Beweis. Wir schicken dem eigentlichen Beweis einige all-
gemeine Betrachtungen voraus.
112
induziert. Dann gilt offensichtlich
N 2 −1 N −1
! N −1
!
X X X
au(k) bv(k) = ai bj
k=0 i=0 j=0
Im Limes für N → ∞ und unter Verwendung der Erkenntnisse, daß jede absolut
konvergene Reihe konvergent ist und daß jede Teilfolge einer konvergenten Folge
gegen denselben Genzwert konvergiert, folgt die Behauptung.
Beweis der Funktionalgleichung 4.2.10. Wir rechnen
P∞ 1
exp(x + y) = (x + y)k
Pk=0
∞
k!
1
P k! i j
= k=0 k! i+j=k i!j! x y
P∞ P xi xj
= k=0 i+j=k i! j!
Hier verwenden wir im zweiten Schritt die binomische Formel und der Index i +
j = k an einer Summe bedeutet, daß wir über alle Paare (i, j) ∈ N × N mit
i+j = k summieren. Andererseits erhalten wir mit unserem Satz über das Produkt
∼
von Reihen 4.2.14 bei einer geeigneten Wahl der Bijektion (u, v) : N → N × N
und nach Übergang zu einer Teilfolge der Folge der Partialsummen auch
P P
∞ xi ∞ yj
exp(x) exp(y) = i=0 i! j=0 j !
P∞ P xi y j
= k=0 i+j=k i! j!
Vorschau 4.2.16. Die Stetigkeit der Exponentialfunktion können wir später auch
aus dem allgemeinen Satz 6.1.4 folgern, der besagt, daß Potenzreihen auf ihrem
Konvergenzbereich immer stetige Funktionen darstellen.
Beweis. Wir wenden das ε-δ-Kriterium 3.2.21 an. Mit der Funktionalgleichung
finden wir
113
wo wir im zweiten Schritt die Dreiecksungleichung sowie die Erhaltung von Un-
gleichungen im Grenzwert verwenden und die Nenner verkleinern. Aus |x − p| ≤
1 folgt also | exp(x) − exp(p)| ≤ exp(p)|x − p| e und für gegebenes ε > 0 können
wir mithin δ = inf{1, ε/(exp(p) e)} nehmen.
Korollar* 4.2.17 (Produkt summierbarer Familien). Sind (ai )i∈I und (bj )j∈J
summierbare Familien reeller Zahlen, so bilden auch ihre Produkte eine summier-
bare Familie (ai bj )(i,j)∈I×J und es gilt
! !
X X X
ai b j = ai bj
(i,j)∈I×J i∈I j∈J
Beweis. Wir wissen aus 4.1.25, daß die Summierbarkeit einer Familie reeller Zah-
len im wesentlichen gleichbedeutend ist zu absoluter Konvergenz. Damit erweist
sich das Korollar als eine Umformulierung des vorhergehenden Satzes.
Übungen
Übung 4.2.18. Man folgere aus der Funktionalgleichung der Exponentialfunktion
4.2.10 die Formeln exp(−x) = exp(x)−1 , exp(x)p > 0 ∀x ∈ R, exp(n) = en ,
exp(nx) = (exp x)n ∀n ∈ Z sowie exp(x/2) = exp(x).
Ergänzende Übung 4.2.19. Der Übersichtlichkeit halber kürzen wir hier im Vor-
griff auf 4.3.5 schon exp(x) = ex ab. Man zeige, daß für alle i, N ∈ N gilt
i N n−i
N i e−N
nN 1 1
lim 1− =
n→∞ i n n i!
Dieses Resultat ist in der Stochastik wichtig, wie ich im folgenden ausführen will.
Gegeben λ ∈ R heißt die Funktion i 7→ λi e−λ /i! ganz allgemein die Poisson-
Verteilung mit Parameter λ. Sie hat die folgende Bedeutung: Knetet man in einen
großen Teig genau nN Rosinen ein und teilt ihn dann in n Rosinenbrötchen, so
i N n−i
ist n1 1 − n1 die Wahrscheinlichkeit, daß i vorgegebene Rosinen in ei-
nem fest gewählten Brötchen landen und die restlichen Rosinen in den anderen
1 i 1 N n−i
Brötchen. Mithin ist nN
i n
1 − n
die Wahrscheinlichkeit, daß in ei-
nem fest gewählten Brötchen genau i Rosinen landen. Ist unser Brötchen klein
im Vergleich zum ganzen Teig, so liegt diese Wahrscheinlichkeit also nahe bei
N i e−N /i! oder allgemeiner bei λi e−λ /i! mit λ der durchschnittlichen Zahl von
Rosinen in dem Teigvolumen, das man für ein Brötchen braucht. Genau genom-
men stimmt das allerdings nur für punktförmige Rosinen, denn sonst liefert die
Größe des Brötchens eine obere Schranke für die möglichen Anzahlen der darin
verbackenen Rosinen.
114
Ergänzende Übung 4.2.20. Man berechne die Euler’sche Zahl e bis auf 5 sichere
Stellen hinter dem Komma.
Ergänzende Übung 4.2.21. Die Euler’sche Zahl e ist nicht rational. Man zeige
dies, indem man von ihrer Darstellung als Reihe ausgeht und durch geeignete
Abschätzungen nachweist, daß q!e für q ∈ N mit q ≥ 2 nie eine ganze Zahl sein
kann.
Ergänzende Übung 4.2.22. In dieser Übung sollen Sie einen anderen Zugang zur
Funktionalgleichung der Exponentialfunktion ausarbeiten, den ich in einer Arbeit
von Martin Kneser kennengelernt habe: Man zeige, indem man den Beweis von
für jede Folge reeller Zahlen xn ∈ R aus limn→∞ xn =
4.2.3 verallgemeinert, daß
xn n
x folgt limn→∞ 1 + n = exp(x). Mithilfe der Identität
x y x + y + (xy/n)
1+ 1+ = 1+
n n n
folgere man dann die Funktionalgleichung.
log : (0, ∞) → R
der Exponentialfunktion, log(exp(x)) = x, und erhalten aus Satz 3.3.11 die Ste-
tigkeit des Logarithmus. In der französischen Literatur bezeichnet man diese Funk-
tion auch als logarithme népérien in Erinnerung an den schottischen Mathema-
tiker John Napier, der die ersten Logarithmentafeln aufstellte.
4.3.3. Die Exponentialfunktion liefert nach 4.2.10 und 4.3.2 einen Isomomorphis-
mus zwischen der additiven Gruppe der reellen Zahlen und der multiplikativen
Gruppe aller positiven reellen Zahlen. Daraus folgt sofort
Die erste Formel mag man die Funktionalgleichung des Logarithmus nennen.
115
Die Graphen von Logarithmus und Exponentialfunktion gehen wie immer bei
Umkehrfunktionen durch Spiegelung an der Hauptdiagonalen x = y auseinander
hervor.
116
4.3.4 (Diskussion der Terminologie). Die Notation „log“ ist leider nicht univer-
sell. Auf vielen Taschenrechnern und auch in älteren Büchern wird unsere Funk-
tion „log“ notiert als „ln“ für „logarithmus naturalis“ oder „logarithme néperien“
und das Kürzel „log“ steht für den „Logarithmus zur Basis 10“, den wir in 4.3.9
einführen und mit log10 bezeichnen werden. Der Logarithmus zur Basis 10 wird
in manchen Quellen auch der „Brigg’sche Logarithmus“ genannt und mit „lg“
bezeichnet. Die Norm ISO 31-11 empfiehlt die Notationen „ln“ und „lg“. Wir
verwenden jedoch log statt ln, weil das in der reinen Mathematik so üblich ist
und wir damit der Konvention folgen, spezielle Funktionen nach Möglichkeit mit
Kürzeln aus drei Buchstaben zu notieren. „Logarithmus“ ist das griechische Wort
für „Rechnung“, und für das Rechnen waren die Logarithmentafeln, in denen die
Werte des Logarithmus zur Basis Zehn aufgelistet wurden, auch außerordentlich
praktisch: Mit ihrer Hilfe konnte man nämlich Divisionen in Subtraktionen ver-
wandeln und Wurzelziehen in Divisionen, wie wir gleich näher ausführen. Die
Entdeckung der Logarithmen und die ersten Logarithmentafeln von Napier be-
deuteten für die damalige Wissenschaft eine ungeheure Arbeitserleichterung und
wurden begeistert begrüßt.
ax := exp(x log a)
Im Fall x > 0 vereinbart man zusätzlich 0x = 0. Das führt dazu, daß für x > 0 die
Funktion a 7→ ax sogar stetig ist auf [0, ∞). Es führt allerdings auch dazu, daß die
Funktion x 7→ 0x mit unserer Konvention 00 = 1 zwar auf [0, ∞) definiert aber
bei x = 0 nicht stetig ist. Damit müssen wir nun weiterleben.
117
Dieses Bild stellt den unangenehm verzwickelten Bereich aller (x, a) ∈ R2 dar,
für die ax definiert ist: Bei x ∈ N sind das jeweils alle a ∈ R, bei x ∈ Z<0 nur
alle a ∈ R× , bei reellem nichtganzen x > 0 alle a ≥ 0, bei reellem nichtganzen
x < 0 alle a > 0. Besonders schlimm ist die Unstetigkeitsstelle am Ursprung, auf
der senkrechten Koordinatenachse ist ja unsere Funktion konstant Eins und auf
der positiven waagerechten Koordinatenachse konstant Null. Diese
Unstetigkeitsstelle ist aber auch die Einzige.
118
Satz 4.3.8 (Gruppenwege in R× ). Die stetigen Gruppenhomomorphismen R →
R× von der additiven Gruppe der reellen Zahlen in die multiplikative Gruppe der
von Null verschiedenen reellen Zahlen sind genau die Abbildungen x 7→ ax für
beliebiges aber festes a ∈ R>0 .
Definition 4.3.9. Gegeben a > 1 nennt man die Umkehrabbildung der streng
monoton wachsenden Abbildung x 7→ ax auch den Logarithmus zur Basis a
loga : (0, ∞) → R
4.3.10. Der natürliche Logarithmus ist also der Logarithmus mit der Euler’schen
Zahl e als Basis, in Formeln log = loge . Der Logarithmus zur Basis a läßt sich
durch den natürlichen Logarithmus ausdrücken vermittels der Formel loga x =
log x
log a
. Man kommt deshalb meist mit dem natürlichen Logarithmus aus. Die No-
tation loga ist konform mit der Norm ISO 31-11, in der zusätzlich auch noch die
Abkürzung log2 = lb für den binären Logarithmus empfohlen wird. In Loga-
rithmentafeln wird üblicherweise der Logarithmus zur Basis 10 tabelliert, weil ja
gilt log10 (10 · x) = 1 + log10 (x) und man sich so auf Dezimalausdrücke x mit
einer Null vor dem Komma und keiner Null nach dem Komma beschränken kann.
Beispiel 4.3.11. Für alle a > 0 folgt aus der Stetigkeit der Exponentialfunktion
und indem man für ein logisch vollständiges Argument die folgende Gleichungs-
kette von hinten nach vorne liest
√
limn→∞ n a = limn→∞ exp n1 log a
= exp(0)
= 1
Beispiel 4.3.12. Aus dem Quetschlemma 3.5.35 und der Darstellung von ex durch
die Exponentialreihe folgt limx→∞ ex = ∞. Aus 3.5.7 und 3.3.2 folgt dann weiter
limy→∞ log y = ∞. Das Quetschlemma mit der Darstellung von ex duch die Ex-
ponentialreihe liefert auch limx→∞ (x/ ex ) = 0 und durch Substitution x = log y
und 3.5.7 sowie 3.2.30 folgt limy→∞ (log y)/y = 0.
119
Übungen
P
Ergänzende Übungp4.3.13. Sei ak eine Reihe. Man zeige
P das Wurzelkriteri-
um: Gilt limk→∞ |ak | < 1, so konvergiert die Reihe
k
ak absolut. Hinweis:
Analog zum Beweis des Quotientenkriteriums. Meiner Erfahrung nach ist dies
Kriterium in der Praxis selten von Nutzen, da es meist auf schwer zu bestimmen-
de Grenzwerte führt.
Übung 4.3.14. Man folgere aus der Funktionalgleichung 4.3.3 des Logarithmus
√
die Formeln log(1) = 0, log(x−1 ) = − log(x), log(xn ) = n log(x) und log( q x) =
1
q
log(x).
√
Übung 4.3.15. Man zeige für a > 0 die Identität limn→∞ n(1 − n a) = log a.
Übung 4.3.16. Man zeige limx→∞ (xa /bx ) = 0 für alle a ∈ R und
√ b > 1. Man
c
zeige limx→∞ (log x/x ) = 0 für alle c > 0. Man zeige limn→∞ n = 1. Man
n
zeige s
(5n)!
lim n
= 55
n→∞ (n!)5
Beispiel 4.3.17. Bei einem radiokativen Material wird nach einem Tag nur noch
90% der Strahlungsaktivität gemessen. Wie lange dauert es, bis die Aktivität auf
die Hälfte abgeklungen ist? Nun, halten wir einen Referenzzeitpunkt beliebig fest,
so wird die Aktivität nach Vergehen einer Zeitspanne τ gemäß Überlegungen wie
in 4.2.5 gegeben durch eine Formel der Gestalt M ecτ mit unbekannten M und
c. Wir kürzen die Zeiteinheit „Stunde“ ab mit dem Buchstaben h für lateinisch
„hora“. Formal ist h eine Basis des in [EIN] 1.2.6 angedachten eindimensiona-
len reellen Vektorraums „aller Zeitspannen“, und formal ist auch M ein Element
eines gedachten eindimensionalen reellen Vektorraums „aller Strahlungsaktivi-
täten“ und c liegt im Raum der Linearformen auf dem Raum aller Zeitspannen, in
dem wir mit h−1 dasjenige Element bezeichnen werden, das auf h den Wert Eins
annimmt. So formal will ich hier aber eigentlich gar nicht werden und schreibe
das Auswerten solch einer Linearform auf einer Zeitspanne schlicht als Produkt.
90
Für τ = 24 h wissen wir nun nach unserer Messung M ec·24 h = 100 M und damit
−1
c = ((log 9/10)/24) h . Bezeichnet t die Zeitspanne, nach der die Aktivität auf
die Hälfte abgeklungen ist, so haben wir also M ect = M/2 alias ct = − log 2 und
damit
log 2 − log(2) · 24
t=− = h
c log(9/10)
Ergänzende Übung 4.3.18. Das eingestrichene A liegt bei 440 Herz. Bei wie-
viel Herz etwa liegt das eingestrichene F? Hinweis: Die Lösung dieser Aufgabe
benötigt zusätzlich zu mathematischen Kenntnissen auch physikalische und mu-
sikalische Vorkenntnisse.
120
Ergänzung 4.3.19. Versteht man eine positive reelle Zahl als das Verhältnis zweier
gleichartiger Größen, so sagt man für den Zehnerlogarithmus besagter Zahl auch,
er „drücke das Verhältnis in Bel aus“. Diese Sprechweise ehrt Alexander Graham
Bell, der das Telephon einführte. So könnte man etwa sagen, das Verhältnis von
Gramm zu Kilo betrage 3 Bel, statt von einem Verhältnis von Eins zu Tausend
alias 1 zu 103 zu reden. Das Verhältnis von Kilo zu Tonne beträgt natürlich auch
3 Bel, und das Verhältnis von Gramm zu Tonne folglich 6 Bel. Häufig redet man
auch von Dezibel alias „zehntel Bel“. Das ist jedoch „multiplikativ“√zu verstehen,
10
ein Verhältnis von 1 Dezibel meint also ein Verhältnis von Eins zu 10 ≈ 1,26.
Ergänzung 4.3.20. Physikalisch beschreibt man eine Lautstärke durch die Leis-
tung, die sie etwa an einer Membran verrichtet. Gibt man eine Lautstärke in De-
zibel an, so ist allerdings das Verhältnis des Quadrats dieser Leistung zum Qua-
drat der Leistung einer Standardlautstärke gemeint. Diese Standardlautstärke ist
so vereinbart, daß sie etwa bei der Hörschwelle eines menschliches Ohrs liegt.
Eine Lautstärke von Null Dezibel bedeutet also, daß ein gesunder Mensch das
Geräusch so gerade noch hören kann, und jede Erhöhung einer Lautstärke um
zwanzig Dezibel bedeutet, daß das Ohr zehnmal soviel Leistung
√ aufnehmen wird.
Bei einer Erhöhung um zehn Dezibel wird das Ohr also 10 ≈ 3 mal soviel
Leistung aufnehmen.
Ergänzende Übung 4.3.21. Die monotonen Gruppenhomomorphismen R → R×
von der additiven Gruppe der reellen Zahlen in die multiplikative Gruppe der von
Null verschiedenen reellen Zahlen sind genau die stetigen Gruppenhomomorphis-
men, also genau die Abbildungen x 7→ ax für festes a ∈ R>0 .
Ergänzende Übung 4.3.22. Man finde alle stetigen Funktionen G : R× → R mit
G(xy) = G(x) + G(y) ∀x, y ∈ R× , also alle stetigen Gruppenhomomorphismen
von der multiplikativen Gruppe der von Null verschiedenen reellen Zahlen in die
additive Gruppe aller reellen Zahlen.
Ergänzende Übung 4.3.23. Man zeige, daß die Aussage der vorhergehenden Sätze
3.5.40 und 4.3.8 sogar folgt, wenn wir von unseren Gruppenhomomorphismen nur
die Stetigkeit bei Null fordern.
121
Anschauung für das Quadrieren komplexer Zahlen in ihrer anschaulichen
Interpretation als Punkte der komplexen Zahlenebene
122
tut, als ob man aus (−1) eine Quadratwurzel ziehen könnte, gab es noch keine
Mengenlehre und erst recht nicht den abstrakten Begriff eines Körpers 1.6.4. Das
Rechnen mit Zahlen, die keine konkreten Interpretationen als Länge oder Gutha-
ben oder zumindest als Schulden haben, schien eine „imaginäre“ Angelegenheit,
ein bloßer Trick, um zu reellen Lösungen reeller Gleichungen zu kommen.
4.4.2. Der Körper der komplexen Zahlen (C, +, ·) ist die Menge C := R2 mit
Addition und Multiplikation definiert durch
(a, b) + (c, d) := (a + c, b + d)
(a, b) · (c, d) := (ac − bd, ad + bc)
Diese Struktur ist nach Übung 1.6.21 ein Körper und die Abbildung κ : R → C,
a 7→ (a, 0) ist ein Körperhomomorphismus. Kürzen wir κ(a) zu a ab und setzen
i := (0, 1), so gilt i2 = −1 und (a, b) = a + b i. Wenn wir die Vorstellung von C
als die Menge aller Punkte der Koordinatenebene evozieren wollen, sprechen wir
von der komplexen Zahlenebene.
4.4.3. Ich hoffe, Sie werden schnell merken, daß sich viele Fragestellungen bei
Verwendung dieser sogenannt komplexen Zahlen sehr viel leichter lösen lassen
und daß die komplexen Zahlen auch der Anschauung ebenso zugänglich sind wie
die reellen Zahlen. Früher schrieb man „complex“, deshalb die Bezeichnung C.
Unser i ist eine „Wurzel aus (−1)“, und weil es so eine Wurzel in den reellen
Zahlen nicht geben kann, notiert man sie i wie „imaginär“.
Re, Im : C → R
Im Fall einer reellen Zahl x ∈ R ist diese Norm genau unser Absolutbetrag aus
2.2.12, in Formeln |x| = |x|. In der Anschauung der komplexen Zahlenebene
bedeutet die Norm einer komplexen Zahl ihren Abstand vom Ursprung.
123
Dies Bild soll zusätzliche Anschauung für die Abbildung z 7→ z 2 der komplexen
Zahlenebene auf sich selbst vermitteln. Es stellt diese Abbildung dar als die
Komposition einer Abbildung der Einheitskreisscheibe auf eine räumliche sich
selbst durchdringende Fläche, gegeben in etwa durch eine Formel der Gestalt
z 7→ (z 2 , ε(Im z)) in C × R ∼= R3 für geeignetes monotones und in einer
Umgebung von Null streng monotones ε, gefolgt von einer senkrechten
Projektion auf die ersten beiden Koordinaten. Das hat den Vorteil, daß im ersten
Schritt nur Punkte der reellen Achse identifiziert werden, was man sich leicht
wegdenken kann, und daß der zweite Schritt eine sehr anschauliche Bedeutung
hat, eben die senkrechte Projektion.
124
4.4.6 (Verschiedene Bedeutungen von |z|). Hier ist unsere Notation nicht voll-
y) ∈ R2 bereits |(x, y)| = max(|x|, |y|) verein-
ständig konsistent, da wir für (x, p
bart hatten und nun |x + iy| = x2 + y 2 setzen. Für Stetigkeitsbetrachtungen
spielt diese Verwirrung keine Rolle, da stets gilt
p √
|(x, y)| ≤ x2 + y 2 ≤ 2 |(x, y)|
Bei der Betrachtung komplexer Zahlen hat bei uns |z| a priori die eben in 4.4.5
eingeführte Bedeutung als „komplexe Norm“.
4.4.7 (Diskussion der Terminologie). Bei rechtem Lichte besehen scheint mir
an dieser Terminologie absonderlich, daß der Imaginärteil einer komplexen Zahl
darin eine reelle Zahl ist, aber so hat es sich nun einmal eingebürgert.
4.4.8. Stellen wir uns |z| vor als den Streckfaktor der Drehstreckung (z·), so wird
anschaulich klar, daß für alle z, w ∈ C gelten muß
|zw| = |z||w|
Besonders bequem rechnet man diese Formel nach, indem man zunächst für z =
x + y i ∈ C die konjugierte komplexe Zahl z̄ = x − y i ∈ C einführt. Im
Bild der komplexen Zahlenebene bedeutet das komplexe Konjugieren anschaulich
die Spiegelung an der reellen Achse. Nun prüft man durch explizite Rechnung
unschwer die Formeln
z + w = z̄ + w̄
z · w = z̄ · w̄
|z|2 = z z̄
Dann rechnet man einfach
|zw|2 = zwzw = z z̄ww̄ = |z|2 |w|2
Nach dem vorhergehenden ist z 7→ z̄ ein Körperisomorphismus C → C, die
komplexe Konjugation. Offensichtlich gilt auch z̄¯ = z und ebenso offensichtlich
gilt |z| = |z̄|.
4.4.10. Für unsere Norm komplexer Zahlen aus 4.4.5 gilt offensichtlich
|z| = 0 ⇔ z = 0
Da in einem Dreieck eine einzelne Seite nicht länger sein kann als die beiden
anderen zusammengenommen, erwarten wir weiter die Dreiecksungleichung
|z + w| ≤ |z| + |w|
Formal mag man sie prüfen, indem man beide Seiten quadriert, wodurch die äqui-
valente Behauptung (z + w)(z̄ + w̄) ≤ z z̄ + 2|z||w| + ww̄ entsteht, und dann
vereinfacht zu immer noch äquivalenten Behauptung 2 Re(z w̄) ≤ 2|z w̄|. Die Ab-
schätzungen Re(u) ≤ |u| und Im(u) ≤ |u| sind aber für jede komplexe Zahl u
auch formal offensichtlich.
125
Anschauung für das Invertieren komplexer Zahlen
4.4.9. Wir können den Realteil und den Imaginärteil von z ∈ C mithilfe der
konjugierten komplexen Zahl ausdrücken als
z + z̄ z − z̄
Re z = Im z =
2 2i
Weiter gilt offensichtlich z = z ⇔ z ∈ R und für komplexe Zahlen z der
Norm |z| = 1 ist die konjugierte komplexe Zahl genau das Inverse, in For-
meln |z| = 1 ⇒ z̄ = z −1 . Im Bild der komplexen Zahlenebene kann man
das Bilden des Inversen einer von Null verschiedenen komplexen Zahl anschau-
lich interpretieren als die „Spiegelung“ oder präziser Inversion am Einheitskreis
z 7→ z/|z|2 gefolgt von der Spiegelung an der reellen Achse z 7→ z̄. Der Ein-
heitskreis S 1 := {z ∈ C× | |z| = 1} 126ist insbesondere eine Untergruppe der
multiplikativen Gruppe des Körpers der komplexen Zahlen und die Multiplika-
∼
tion liefert einen Gruppenisomorphismus R>0 × S 1 → C× . Wir nennen S 1 die
Kreisgruppe.
Übungen
Übung 4.4.11. Gegeben eine komplexe Zahl z 6= −1 vom Betrag |z| = 1 zeige
man, daß sie genau eine Wurzel w mit positivem Realteil hat und daß diese gege-
ben wird durch w = (1+z)/|1+z|. Können Sie auch die geometrische Bedeutung
dieser Formel erklären? Man folgere, daß für beliebiges a < 1 jedes Element von
S 1 eine Potenz eines Elements z mit Realteil Re(z) > a ist.
Lemma 4.5.2. Jede absolut konvergente Reihe komplexer Zahlen konvergiert, als
da heißt, die Folge ihrer Partialsummen konvergiert gegen eine komplexe Zahl.
P∞ P∞
Beweis.
P∞ Sei k=0 a k unsere Reihe. Aus k=0 |ak | < ∞ folgt
P∞ zunächst einmal
k=0 | Re a k | < ∞ und nach 4.1.15 konvergiert dann auch Re ak . Eben-
k=0P
so sehen wir, daß k=0 Im ak konvergiert, und damit konvergiert ∞
P∞
k=0 ak nach
unserer Beschreibung des Grenzwerts als komponentenweiser Grenzwert 3.5.33,
nur eben gegen eine komplexe Zahl.
4.5.3. Der Umordnungssatz 4.1.21 gilt analog für absolut konvergente Reihen
komplexer Zahlen. Das folgt, indem wir den reellen Umordnungssatz 4.1.21 auf
Real- und Imaginärteil anwenden.
Definition 4.5.4. Für jede komplexe Zahl z ∈ C erklären wir eine weitere kom-
plexe Zahl exp(z) ∈ C durch die Vorschrift
∞
X 1 k
exp(z) := z
k=0
k!
Diese Reihe konvergiert für alle z ∈ C nach 4.5.2, da sie absolut konvergiert. Wir
erhalten so eine Abbildung exp : C → C, die komplexe Exponentialfunktion.
Dazu gehen wir den Beweis im reellen Fall nochmal durch und müssen insbeson-
dere prüfen, daß der Satz 4.2.14 über das Produkt absolut konvergenter Reihen
127
Auch für komplexes z zeigt man wie in 4.2.3 die Formel
z n
exp(z) = lim 1 +
n→∞ n
Das obige Bild stellt unter anderem den vierten Term dieser Folge im Fall z = i
dar. Ich finde, man kann recht gut erkennen, wie diese Folge bei wachsendem n
gegen den Punkt auf der Kreislinie konvergiert, für den das Segment der
Kreislinie, das von ihm zur reellen Achse herunterläuft, die Länge Eins hat.
128
auch im Komplexen gilt. In der Tat funktioniert derselbe Beweis auch in die-
sem Fall. Offensichtlich gilt immer noch exp(0) = 1. In der Sprache der Alge-
bra ausgedrückt ist die Exponentialabbildung also ein Monoidhomomorphismus
exp : (C, +) → (C, ·) und induziert damit nach 1.5.43 einen Gruppenhomomor-
phismus von der additiven Gruppe der komplexen Zahlen in die multiplikative
Gruppe der von Null verschiedenen komplexen Zahlen. Man erhält insbesondere
exp(−z) = (exp z)−1 . Wie im Reellen 4.2.15 zeigt man auch die Stetigkeit von
exp : C → C zunächst im Nullpunkt über die Reihenentwicklung und dann an
jeder Stelle z ∈ C mithilfe der Funktionalgleichung.
4.5.6 (Komplexe Exponentialfunktion und Konjugation). Aus der Stetigkeit
der komplexen Konjugation und ihrer Vertauschbarkeit mit Summe und Produkt
folgern wir
exp(z̄) = exp z ∀z ∈ C
Für den Betrag von exp z erhalten wir dann
| exp z|2 = (exp z)(exp z)
= exp(z) exp(z̄)
= exp(z + z̄)
= exp(2 Re z)
Folglich gilt | exp z| = exp(Re z) und speziell | exp(i t)| = 1 für alle t ∈ R.
4.5.7. Ich nenne u : R → S 1 , t 7→ exp(it) die Umlaufabbildung. Sie beschreibt
salopp gesprochen einen Punkt, der „mit konstanter Geschwindigkeit Eins im Ge-
genuhrzeigersinn auf dem Einheitkreis S 1 umläuft und sich zum Zeitpunkt t = 0
an der Stelle u(0) = 1 befindet“. In den folgenden Sätzen 4.5.8 und 4.5.10 will ich
diese Anschauung rechtfertigen. Aus der Funktionalgleichung 4.5.5 folgt unmit-
telbar, daß unsere Umlaufabbildung ein Gruppenhomomorphismus von der Zah-
lengeraden zur Kreisgruppe ist. Aus der Abschätzung
∞
X (i(t − s))k
| exp(it) − exp(is)| = | exp(i(t − s)) − 1| = ≤ exp(|s − t|) − 1
k=1
k!
oder auch direkt aus der Stetigkeit der komplexen Exponentialfunktion folgt, daß
die Umlaufabbildung u stetig ist.
Satz 4.5.8 (Gruppenwege in der Kreisgruppe). Die stetigen Gruppenhomomor-
phismen R → S 1 von der additiven Gruppe der reellen Zahlen in die Kreisgruppe
sind genau alle Abbildungen der Gestalt t 7→ exp(ait) mit a ∈ R.
Beweis. Unsere Umlaufabbildung u ist nicht konstant, aus der Reihenentwicklung
folgt genauer die Abschätzung Im(exp(t i)) > 0 für t ∈ (0, 1]. Aufgrund der
Stetigkeit gibt es folglich c > 0 mit Re u(c) < 1 und
(t ∈ [−c, c] ⇒ Re u(t) > 0)
129
Ist γ : R → S 1 ein weiterer Gruppenhomomorphismus mit stetigem Realteil,
so gibt es auch b > 0 mit (t ∈ [−b, b] ⇒ Re γ(t) ≥ Re u(c)). Es folgt, daß wir
g ∈ [−c, c] finden mit Re γ(b) = Re u(g). Indem wir notfalls g durch −g ersetzen,
dürfen wir zusätzlich annehmen, daß auch gilt Im γ(b) = Im u(g) und damit
γ(b) = u(g) und (|s| ≤ b ⇒ Re γ(s) > 0) sowie (|t| ≤ g ⇒ Re u(t) > 0).
Daraus aber folgt γ(b/2) = u(g/2), denn beide Seiten sind die eindeutig be-
stimmte Quadratwurzel aus γ(b) = u(g) mit positivem Realteil. Induktiv folgt
erst γ(b/2n ) = u(g/2n ) für alle n ∈ N und dann γ(mb/2n ) = u(mg/2n ) für alle
m ∈ Z und dann aufgrund der Stetigkeit γ(tb) = u(tg) für alle t ∈ R.
4.5.9. Ich erinnere daran, daß in der Algebra der Kern ker γ eines Gruppenho-
momorphismus γ : G → H erklärt wird als die Menge ker γ := γ −1 (eH ) aller
Elemente von G, die auf das neutrale Element von H abgebildet werden.
Satz 4.5.10 (Komplexe Exponentialfunktion und Kreiszahl). Die Umlaufab-
bildung u : t 7→ exp(it) ist ein surjektiver Gruppenhomomorphismus u : R S 1
mit Kern ker(u) = 2πZ für unsere Kreiszahl π aus 3.4.1.
Vorschau 4.5.11. Wir überlegen uns in 4.5.22, daß der Gruppenhomomorphismus
C → C× gegeben durch dieselbe Formel z 7→ exp(iz) immer noch denselben
Kern hat, so daß gilt ker(exp(C → C× )) = 2πiZ.
Beweis. Beim Beweis von 4.5.8 haben wir bereits gesehen, daß es a < 1 gibt
derart, daß alle Elemente der Kreislinie mit Realteil > a im Bild von u liegen
müssen. Nach Übung 4.4.11 sind aber alle Elemente von S 1 Potenzen derartiger
Elemente. Folglich ist u eine Surjektion. Mit
gilt offensichtlich u(κ) = u(−κ) = −1, aber u nimmt auf dem offenen Intervall
(−κ, κ) den Wert (−1) nicht an. So folgt (ker u) ∩ (0, 2κ) = ∅ und 2κZ ⊂ ker u.
Hätten wir in ker u noch Elemente außerhalb von 2κZ, so müßten wir darin auch
Elemente aus (0, 2κ) finden und erhielten einen Widerspruch. So folgt ker u =
2κZ und es bleibt nur noch zu zeigen
κ=π
für unsere Kreiszahl π aus 3.4.1. Dieser Teil des Beweises wird sich in 7.1.15 als
ein Spezialfall unserer Sätze über die sogenannte „Bogenlänge“ erweisen, aber
hier argumentieren wir noch „zu Fuß“. Sicher gilt u(0) = 1 und u induziert eine
∼
Bijektion u : (−κ, κ] → S 1 , denn das Bild ist dasselbe wie das Bild von R =
(−κ, κ] + 2κZ und aus u(t) = u(s) folgt t − s ∈ 2κZ. Der Imaginärteil von u
130
hat auf diesem Intervall also nur die beiden Nullstellen 0 und κ. Wir wissen schon
vom Beginn des vorhergehenden Beweises, daß gilt Im(u(t)) > 0 für t ∈ (0, 1].
Also induziert u eine Bijektion
∼
u : [0, κ] → {z ∈ S 1 | Im(z) ≥ 0}
und Re u muß auf diesem Intervall nach Übung 3.3.22 streng monoton fallen. Die-
se Erkenntnis liefert für unsere Kreiszahl π aus 3.4.1 die alternative Beschreibung
( n )
X
π = sup |u(ti ) − u(ti−1 )| 0 ≤ t0 < t1 < . . . < tn ≤ κ
i=1
131
Sinus und Cosinus am Einheitskreis
Die Graphen vom Sinus als durchgezogene Linie und vom Cosinus als
gestrichelte Linie.
132
4.5.13. Das Wort Trigonometrie bedeutet so etwas wie „Dreiwinkelmessung“.
Die Wurzel „gon“ taucht auch im deutschen Wort „Knie“ auf und bedeutet im
Griechischen sowohl „Knie“ als auch im übertragenen Sinne „Winkel“. In der Li-
nearen Algebra [LA2] 1.7.5 führe ich die „abstrakte Winkelgruppe“ W ein sowie
in [LA2] 1.7.9 den „Standardisomorphismus“
∼
kw : W → S 1
cosg := Re ◦ kw : W → R
der „Winkelgruppe“ in die reellen Zahlen, die durch die Regel „Ankathete durch
Hypothenuse“ beschrieben wird, und andererseits dem hier erklärten analytischen
Cosinus cos = cosa : R → R, der sich daraus ergibt durch das Vorschalten der
Umlaufabbildung u : R → S 1 gefolgt vom invertierten Standardisomorphismus
als
cos = cosa = cosg ◦ kw−1 ◦u = Re ◦u
Analog mag man für die anderen Winkelfunktionen vorgehen.
4.5.14 (Bezug zum Bogenmaß). Dieselbe Argumentation wie beim vorhergehen-
den Beweis zeigt für alle t ≥ 0 die Formel
( n )
X
t = sup |u(ti ) − u(ti−1 )| 0 ≤ t0 < t1 < . . . < tn ≤ t
i=1
Anschaulich bedeutet mithin t die Länge des Kreisbogens von 1 bis exp(it). Auf
Taschenrechnern muß man, um die hier definierten Funktionen sin und cos zu er-
halten, meist noch spezifizieren, daß die Eingabe im Bogenmaß, auf englisch „Ra-
dians“ oder abgekürzt „rad“, zu verstehen sein soll. Auf lateinisch bedeutet Sinus
übrigends „Bodenwelle“ und „Busen“, wortverwandt ist französisch „le sein“.
4.5.15 (Eigenschaften von Sinus und Cosinus). Aus der Definition 4.5.12 von
Sinus und Cosinus folgen unmittelbar eine ganze Reihe von Eigenschaften.
1. Aus den Definitionen folgt sofort die Identität sin2 + cos2 = 1. Diese For-
mel wird oft nach Pythagoras benannt. Hier haben wir (sin t)2 = sin2 t und
(cos t)2 = cos2 t abgekürzt. Diese Abkürzungen sind auch üblich für alle
anderen Potenzen und alle anderen trigonometrischen beziehungsweise hy-
perbolischen trigonometrischen Funktionen, denn das spart Klammern und
die alternativ möglichen Bedeutungen sin2 t = sin(sin t) und dergleichen
133
kommen nie vor. Für die Umkehrfunktionen vereinbaren wir bald die Nota-
tion arcsin sowie arccos und verwenden auch für negative obere Indizes die
Notationen sin−1 (x) := 1/ sin(x) sowie cos−1 (x) := 1/ cos(x). Man findet
für diese Funktionen auch die Bezeichnung als Secans sec(x) := 1/ cos(x)
beziehungsweise Cosecans cosec(x) := 1/ sin(x).
4. Die Periodizitäten sin(t) = sin(t + 2π) und cos(t) = cos(t + 2π) folgen
unmittelbar aus der Beschreibung des Kerns von t 7→ exp(it) in 4.5.10.
∼
5. Daß der Cosinus eine streng monoton fallende Bijektion cos : [0, π] →
[−1, 1] ist, wissen wir bereits aus dem Beweis von 4.5.10. Die Formel des
Pythagoras zeigt dann, daß π die kleinste positive Nullstelle von sin ist.
Zusammen mit sin(0) = 0 und der Periodizität folgt, daß die Nullstellen
des Sinus genau die ganzzahligen Vielfachen von π sind.
7. Unsere Funktionen cos und sin werden, wie sofort aus 4.5.12 folgt, darge-
stellt durch die absolut konvergenten Reihen
P∞ k t2k t2 t4
cos t = k=0 (−1) (2k)! = 1− 2!
+ 4!
− ...
P∞ k t2k+1 t3 t5
sin t = k=0 (−1) (2k+1)! = t− 3!
+ 5!
− ...
4.5.16. Wir wissen bereits aus dem Beweis von 4.5.10, daß der Cosinus eine ste-
∼
tige streng monoton fallende Bijektion cos : [0, π] → [−1, 1] ist. Deren Umkehr-
abbildung ist nach 3.3.11 auch stetig. Sie heißt der Arcuscosinus und wird notiert
als
∼
arccos : [−1, 1] → [0, π]
134
4.5.17. Der Sinus wächst wegen 4.5.16 und der zuvor gezeigten Identität sin t =
− cos(t + π/2) streng monoton auf [−π/2, π/2] und definiert folglich eine Bijek-
∼
tion sin : [−π/2, π/2] → [−1, 1]. Deren Umkehrabbildung ist nach 3.3.11 auch
stetig. Sie heißt der Arcussinus und wird notiert als
∼
arcsin : [−1, 1] → [−π/2, π/2]
In derselben Weise erklärt man den Arcuscotangens arccot : R → (0, π) als die
∼
Umkehrfunktion des Kotangens cot : (0, π) → R.
4.5.22 (Kern und Bild der komplexen Exponentialfunktion). Nach 4.5.10 in-
duziert die Exponentialfunktion eine Surjektion der imaginären Geraden iR auf
den Einheitskreis S 1 = {z ∈ C | |z| = 1}. Daß die Exponentialfunktion ei-
∼
ne Bijektion R → R>0 induziert, wissen wir bereits aus 4.3.2. Da sich nun
jede von Null verschiedene komplexe Zahl w schreiben läßt als Produkt w =
(w/|w|)|w| mit w/|w| auf dem Einheitskreis und |w| positiv, ist die Exponenti-
alfunktion nach der Funktionalgleichung sogar ein surjektiver Gruppenhomomor-
phismus exp : C C× . Der Kern dieses Gruppenhomomorphismus, als da heißt
135
Der Arcussinus
136
Der Tangens
137
Die Bilder ausgewählter Teile der komplexen Zahlenebene unter der komple-
xen Exponentialfunktion. Die Vertikalen werden zu Kreislinien aufgewickelt,
die Horizontalen in vom Nullpunkt ausgehende Strahlen transformiert. Anschau-
lich mag man sich die komplexe Exponentialfunktion denken als Abbildung,
bei der die komplexe Zahlenebene zunächst in horizontaler Richtung verzerrt
und ganz auf die Halbebene mit positivem Realteil herübergeschoben wird mit
x + iy 7→ exp(x) + iy, gefolgt von einer Aufwicklung dieser Halbebene zu einer
Wendeltreppe a + iy 7→ (a cos y, a sin y, y) in den Raum gefolgt von einer senk-
rechten Projektion dieser Wendeltreppe auf die Ebene alias dem Weglassen der
letzten Koordinate.
138
das Urbild des neutralen Elements 1 ∈ C× , besteht aufgrund unserer Gleichung
| exp z| = exp(Re z) aus allen ganzzahligen Vielfachen von 2πi, in Formeln
ker(exp) = 2πiZ
4.5.23. Wir bestimmen mit dieser Erkenntnis die n-ten Einheitswurzeln, als da
heißt die komplexen Lösungen der Gleichung z n = 1. Nach 4.5.22 hat jede
Lösung die Gestalt z = eb für geeignetes b ∈ C und so ein z löst unsere Glei-
chung genau dann, wenn gilt z n = enb = 1 alias nb ∈ 2πiZ. Wir erhalten so die
Lösungen exp(2πiν/n) für ν = 0, 1, . . . , n − 1 und erkennen auch, daß sie paar-
weise verschieden sind und es keine anderen Lösungen geben kann. In der kom-
plexen Zahlenebene kann man sich die n-ten Einheitswurzeln veranschaulichen
als die Ecken desjenigen in den Einheitskreis einbeschriebenen regelmäßigen n-
Ecks, das als eine Ecke die 1 hat.
Ergänzung 4.5.24. Der Satz von Hermite-Lindemann besagt, daß für eine von
Null verschiedene im Sinne von 3.4.2 algebraische komplexe Zahl α der Wert der
Exponentialfunktion exp(α) stets transzendent ist. Daraus folgt sowohl, daß die
Euler’sche Zahl e = exp(1) transzendent ist, als auch, daß 2πi und damit natürlich
auch π transzendent sind, da nämlich exp(2πi) = 1 nicht transzendent ist. In etwas
allgemeinerer Form sagt der Satz, daß gegeben komplexe algebraische Zahlen
α1 , . . . , αn , die linear unabhängig sind über Q, die Werte der Exponentialfunktion
exp(α1 ), . . . , exp(αn ) algebraisch unabhängig sind über Q im Sinne von [KAG]
5.6.2. Mehr dazu findet man etwa in [Lor96]. Schanuels Vermutung, wie das zu
verallgemeinern sein sollte, findet man in [KAG] 5.6.17.
4.5.25 (Potenzen mit komplexen Exponenten). Für eine reelle Zahl a > 0 und
z ∈ C setzen wir wieder
az := exp(z log a)
und schreiben insbesondere auch exp z = ez für z ∈ C. Mit dieser Notation liest
sich die Euler’sche Formel dann als eit = cos t + i sin t. Insbesondere erfüllen
unsere Hauptdarsteller die bemerkenswerte Identität eiπ = −1. Aus exp(−it) =
exp(it) folgern wir umgekehrt für alle t ∈ R die Formeln
139
Übungen
Übung 4.5.27. Sei n ∈ N. Für jede komplexe Zahl a 6= 0 besitzt die Gleichung
z n = a genau n Lösungen z ∈ C.
Übung 4.5.28. Man zeige: Jeder Gruppenhomomorphismus R → C× mit stetigem
Real- und Imaginärteil hat die Gestalt t 7→ exp(at) für genau eine komplexe Zahl
a ∈ C. Hinweis: Man wiederhole den Beweis von 4.5.8 und beachte 4.5.22.
Übung 4.5.29 (Unmöglichkeit globaler stetiger komplexer Wurzelfunktionen).
Gäbe es eine stetige Funktion w : C → C mit w(z)2 = z für alle z, so folgte
w(z 2 ) = ±z für alle z und damit wäre ε : z 7→ w(z 2 )/z eine stetige Funkti-
on ε : C× → {1, −1} mit ε(−z) = −ε(z). Man führe das zum Widerspruch.
Hinweis: Zwischenwertsatz.
Ergänzende Übung 4.5.30 (Der goldene Schnitt im regelmäßigen Fünfeck). In
einem regelmäßigen Fünfeck stehen die Längen der Diagonalen zu den Längen
der Seiten im Verhältnis des goldenen Schnitts. Man prüfe diese elementargeome-
trisch leicht einzusehende Behauptung durch algebraische Rechnung. Hinweis:
Der goldene Schnitt ist die positive Lösung der Gleichung a/1 = (1 + a)/a alias
a2 − a − 1 = 0, seine geometrische Bedeutung wurde in [EIN] 1.2.2 erklärt. Es
gilt zu zeigen, daß für ζ = e2πi/5 der Ausdruck a = |1 − ζ 2 |/|1 − ζ| = |1 + ζ| die
fragliche Gleichung löst. Man verwende ζ 4 = ζ̄.
Ergänzende Übung 4.5.31. In einem regelmäßigen Siebeneck sei a der Abstand
von einer Ecke zur nächsten Ecke, b der Abstand zur übernächsten Ecke, und c
der Abstand zur überübernächsten Ecke. Man zeige
1 1 1
= +
a b c
In Formeln zeige man für ζ = e2πi/7 die Identität |1−ζ|−1 = |1−ζ 2 |−1 +|1−ζ 3 |−1 .
Ergänzende Übung 4.5.32. Die Nullstellen des komplexen Sinus liegen alle auf
der reellen Achse.
Ergänzende Übung 4.5.33. Man leite einige Formeln der nachstehenden Tabelle
her.
140
Die Überlagerung zweier Sinuswellen mit nahe beieinanderliegender Periode.
Rechnerisch finden wir etwa die Identität
Liegen hier ω1 und ω2 nah beieinander, so ergibt sich für diesen Ausdruck als
Funktion von t das obige Bild, in dem sich anschaulich gesprochen immer
abwechselnd beide Sinuswellen einmal gegenseitig auslöschen und dann wieder
addieren. Man kann das auch mit eigenen Ohren erfahren, wenn man sich von
zwei Kommilitonen zwei nahe beieinanderliegende Töne vorsingen läßt: Es ist
dann so eine Art Wummern zu hören, das eben mit der Frequenz ω1 − ω2
geschieht.
141
sin cos
π 0 −1
π/2 1 0
√
π/3 3/2 1/2
√ √
π/4 1/ 2 1/ 2
p √ √ √
π/5 5 − 5/2 2 ( 5 + 1)/4
√
π/6 1/2 3/2
π/7 ? ?
q
1
√ q
1
√
π/8 2
− 2 2
+ 2
π/9 ? ?
√ p √ √
π/10 ( 5 − 1)/4 5 + 5/2 2
π/11 ? ?
Man bemerkt, daß sich für cos(π/5) gerade die Hälfte unseres „goldenen Schnitts“
aus 4.5.30 ergibt. Bei der Bestimmung der Werte für π/5 und π/10 mag man
von nebenstehendem Bild ausgehen, das insbesondere bei der Bestimmung von
sin(π/10) helfen sollte. Wir zeigen in [AL] 4.8.9, warum es unmöglich ist, For-
meln derselben Bauart auch für sin(π/7) oder sin(π/9) oder sin(π/11) anzuge-
ben.
Ergänzende Übung 4.5.34. Man zeige mit der Euler’schen Gleichung 4.5.12 die
Identität sin3 ϑ = 43 sin ϑ − 41 sin(3ϑ).
Ergänzende Übung 4.5.35. Man zeige, daß der Sinus keine Polynomfunktion ist.
142
Illustration zur Berechnung von sin(π/10)
143
5 Integration und Ableitung
5.1 Stetige Funktionen auf Kompakta
Definition 5.1.1. Man nennt eine Teilmenge K ⊂ R̄n kompakt oder ein Kom-
paktum, wenn jede Folge in K eine Teilfolge besitzt, die gegen einen Punkt aus
K konvergiert.
144
schon konvergent mit limn→∞ xn = q. Durch Vertauschen der stetigen Funktion
f mit Folgenkonvergenz nach 3.5.29 folgt dann
Die Existenz von p ∈ K mit f (p) = inf f (K) zeigt man analog.
Satz 5.1.7 (Fundamentalsatz der Algebra). Jedes nicht konstante komplexe Po-
lynom besitzt mindestens eine komplexe Nullstelle.
5.1.8. Der im folgenden wiedergegebene Beweis von Jean-Robert Argand hat den
Vorteil, mit besonders wenigen technischen Hilfsmitteln auszukommen. Einen
Überblick über die gängigsten alternativen Beweise mit ihren Stärken und Schwä-
chen gebe ich in [LA1] 5.3.25. Alle Beweise benutzen wesentlich analytische
Methoden und das muß auch so sein, da ja R und C Objekte der Analysis sind.
Merkwürdig ist eher die Bezeichnung als „Fundamentalsatz der Algebra“ für ein
Resultat der Analysis.
Vorschau 5.1.9. Aus dem Fundamentalsatz der Algebra folgert man unschwer,
daß das Aufmultiplizieren eine Bijektion
Endliche Multimengen ∼ Komplexe Polynome
→
von komplexen Zahlen mit Leitkoeffizient Eins
µ {λ1 , . . . , λr } 7→ (X − λ1 ) . . . (X − λr )
liefert. Das vorgestellte µ aus der linken Seite ist ein „Multimengenanzeiger“, mit
dem wir es uns erlauben, Elemente mit Vielfachheiten zu betrachten und anzu-
geben. Den Beweis überlassen wir der Algebra. Man muß dazu im wesentlichen
nur wissen, daß man für jede Nullstelle einen Linearfaktor abspalten kann. Das
hinwiederum folgt aus dem Teilen mit Rest in Polynomringen.
Beweis. Sei P ∈ C[X] unser Polynom. Wir zeigen zunächst, daß es eine Stelle
p ∈ C gibt, an der die Funktion C → R, z 7→ |P (z)| ihr Minimum annimmt, in
Formeln |P (z)| ≥ |P (p)| ∀z ∈ C. Sei dazu P (X) = an X n +an−1 X n−1 +. . .+a0 .
Aus |z| > 0 folgt
|P (z)| ≥ |an z n | − |an−1 z n−1 + . . . + a0 |
≥ |an ||z|n − |an−1 ||z|n−1 − . . . − |a0 |
≥ |z|n |an | − |an−1 |/|z| − . . . − |a0 |/|z|n
Nun finden wir sicher R > 0 mit |an−1 |/R + . . . + |a0 |/Rn ≤ |an |/2. Aus |z| > R
folgt dann |P (z)| ≥ |z|n (|an |/2). Nehmen wir also irgendein u ∈ C her, so gibt
es R ∈ R derart, daß aus |z| ≥ R folgt
145
Als stetige Funktion nimmt aber die Funktion z 7→ |P (z)| auf einem beliebigen
kompakten Rechteck K ⊂ C, das die Kreisscheibe {z | |z| ≤ R} umfaßt, ein
Minimum an, sagen wir an der Stelle p ∈ K. Das muß dann auch das Minimum
von |P (z)| auf ganz C sein. Wir zeigen nun P (p) = 0 durch Widerspruch und
zeigen dazu: Ist p ∈ C gegeben und P eine nichtkonstante Polynomfunktion mit
P (p) 6= 0, so nimmt die Funktion z 7→ |P (z)| bei p nicht ihr Minimum an. Es
reicht, das für p = 0 zu zeigen. Wir dürfen auch ohne Beschränkung der Allge-
meinheit zusätzlich P (0) = 1 annehmen. Dann hat unser Polynom die Gestalt
P (X) = 1 + bX m + X m+1 Q(X)
mit b 6= 0 und m ≥ 1 und einem weiteren Polynom Q(X) und wir müssen zeigen,
daß |P (z)| nicht minimal ist bei z = 0. Dafür müssen wir nur eine Richtung
w ∈ C finden derart, daß |(P (z)| kleiner wird, wenn wir uns in dieser Richtung w
vom Ursprung entfernen, in Formeln |P (tw)| < 1 für hinreichend kleines t > 0.
Nach 4.5.27 gibt es jedoch w ∈ C mit wm b = −1 und für solch ein w finden wir
P (tw) = 1 − tm + tm+1 wm+1 Q(tw)
Für t ∈ [0, 1] und C > 0 eine positive obere Schranke für die stetige Funktion
[0, 1] → R, t 7→ |wm+1 Q(tw)| folgt nach der Dreiecksungleichung
|P (tw)| ≤ 1 − tm + tm+1 C
Gilt zusätzlich 0 < t < C −1 , so ist das sicher kleiner als Eins.
Definition 5.1.10. Eine Funktion f : Rm ⊃ D → Rn heißt gleichmäßig stetig,
wenn es für beliebiges ε > 0 ein δ > 0 gibt derart, daß für alle x, y ∈ D mit
|x − y| < δ gilt |f (x) − f (y)| < ε.
5.1.11. Bei der Definition der gleichmäßigen Stetigkeit kommt es wesentlich auf
den Definitionsbereich D an. Da wir Funktionen vielfach angeben, ohne ihren De-
finitionsbereich explizit festzulegen, ist es in diesem Zusammenhang oft sinnvoll,
den jeweils gemeinten Definitionsbereich zu präzisieren. Dazu benutzen wir die
Sprechweise f ist gleichmäßig stetig auf D.
5.1.12. Im Gegensatz zur Stetigkeit ist die gleichmäßige Stetigkeit kein sinnvoller
Begriff für Funktionen f : R̄m ⊃ D → R̄n .
5.1.13 (Unterschied zwischen Stetigkeit und gleichmäßiger Stetigkeit). Ich
will nun den Unterschied zwischen Stetigkeit und gleichmäßiger Stetigkeit dis-
kutieren. Eine Funktion f : Rm ⊃ D → Rn ist ja nach dem ε-δ-Kriterium 3.2.21
stetig bei p ∈ D genau dann, wenn es für jedes ε > 0 ein δ = δ(ε, p) > 0 gibt
derart, daß für alle x ∈ D mit |x − p| < δ(ε, p) gilt |f (x) − f (p)| < ε. Des
weiteren heißt sie stetig, wenn sie an jeder Stelle p ∈ D stetig ist. Gleichmäßige
Stetigkeit bedeutet nun, daß für jedes ε > 0 ein δ = δ(ε) gewählt werden kann,
das es als δ(ε) = δ(ε, p) für alle p ∈ D gleichzeitig tut.
146
Gleichmäßige Stetigkeit für stetige Funktionen auf Intervallen kann man sich
anschaulich wie folgt denken: Für eine beliebig für ein Rechteck vorgegebene
Höhe 2ε > 0 findet man bei gleichmäßiger Stetigkeit immer eine Breite 2δ > 0
derart, daß an welchen Punkt des Graphen meiner Funktion ich das Zentrum
meines Rechtecks auch verschiebe, der Graph das Rechteck nie durch die Ober-
oder Unterkante verläßt. So ist etwa die Wurzelfunktion gleichmäßig stetig auf
R≥0 , die Quadratfunktion jedoch nicht.
147
5.1.14 (Eine nicht gleichmäßig stetige Funktion). Die Funktion f : R → R,
x 7→ x2 ist nicht gleichmäßig stetig auf R, denn |x2 − y 2 | = |x − ykx + y| kann
auch für sehr kleines |x − y| noch groß sein, wenn nur |x + y| hinreichend groß
ist. Die Einschränkung dieser Funktion auf ein beliebiges reelles Kompaktum ist
aber daselbst gleichmäßig stetig nach dem anschließenden Satz.
Beweis. Wir argumentieren durch Widerspruch und zeigen, daß eine Funktion auf
einem Kompaktum, die nicht gleichmäßig stetig ist, auch nicht stetig sein kann.
Wäre f nicht gleichmäßig stetig, so gäbe es ein ε > 0, für das wir kein δ > 0
finden könnten: Wir probieren alle δ = 1/n aus und finden immer wieder Punkte
xn , yn ∈ K mit |xn − yn | < 1/n, für die dennoch gilt |f (xn ) − f (yn )| ≥ ε. Gehen
wir zu einer Teilfolge über, so dürfen wir ohne Beschränkung der Allgemeinheit
annehmen, daß die Folge der xn gegen einen Punkt von K konvergiert, in Formeln
limn→∞ xn = x mit x ∈ K. Damit folgt natürlich auch limn→∞ yn = x. Wäre
nun f stetig bei x, so folgte
und damit lägen notwendig fast alle f (xn ) und desgleichen fast alle f (yn ) im
Quader B(f (x); ε/2). Das steht jedoch im Widerspruch dazu, daß ja nach Kon-
struktion gilt |f (xn ) − f (yn )| ≥ ε für alle n. Wir haben also gezeigt, daß eine
Funktion auf einem reellen Kompaktum, die nicht gleichmäßig stetig ist, auch
nicht stetig sein kann.
Übungen
Übung 5.1.16. Jeder Quader der Gestalt [a1 , b1 ] × . . . × [an , bn ] ⊂ R̄n ist kompakt.
Übung 5.1.17. Jede endliche Vereinigung von Kompakta Ki ⊂ R̄n ist kompakt.
Übung 5.1.18. Das Bild eines Kompaktums K ⊂ R̄n unter einer stetigen Abbil-
dung K → R̄m ist stets kompakt.
Übung 5.1.19. Man zeige, daß jede beschränkte, monotone und stetige Funktion
f : R → R gleichmäßig stetig ist.
Übung 5.1.20. Sind K ⊂ R̄m und L ⊂ R̄n kompakt, so ist auch K × L ⊂ R̄m+n
kompakt.
148
5.2 Integration stetiger Funktionen
Definition 5.2.1. Gegeben f : R ⊃ [a, b] → R eine stetige reellwertige Funktion
auf einem nichtleeren kompakten reellen Intervall erklären wir die Menge T(f ) ⊂
R aller „naiven Integrale zu Treppen, die unter f liegen“ durch
Alle möglichen Wahlen von n ∈ N
n−1
und von Stellen a = a0 ≤ a1 ≤ . . . ≤ an = b
X
T(f ) := ci (ai+1 − ai )
und von Werten c0 , . . . , cn−1 ∈ R derart,
i=0
daß gilt f (x) ≥ ci für alle x ∈ [ai , ai+1 ]
Da f stetig ist, hat es nach 5.1.5 einen beschränkten Wertebereich, als da heißt, es
gibt m, M ∈ R mit m ≤ f (x) ≤ M ∀x ∈ [a, b]. Daraus folgt, daß m(b − a) zu
T(f ) gehört und daß M (b − a) eine obere Schranke von T(f ) ist. Als nichtleere
nach oben beschränkte Teilmenge von R hat T(f ) nach 2.4.4 ein Supremum in
R. Wir nennen dies Supremum das Integral der Funktion f über das Intervall
[a, b] und schreiben
Z b Z b Z
sup T(f ) := f (x) dx = f= f
a a [a,b]
Auf die Bedeutung der Notationen für das Integral gehen wir in 5.2.6 ein.
5.2.2. Anschaulich mißt das Integral von f die Fläche zwischen dem Graphen
von f und der x-Achse, wobei Flächenstücke unterhalb der x-Achse negativ zu
rechnen sind. Das Wort ist aus dem Lateinischen abgeleitet und bedeutet so etwas
wie „Zusammenfassung“. Der folgende Satz listet einige Eigenschaften unseres
Integrals auf. Man kann leicht zeigen, daß unser Integral sogar durch diese Eigen-
schaften charakterisiert wird.
149
Die schraffierte Fläche stellt ein Element von T(f ) dar für die durch den
geschwungenen Graphen dargestellte Funktion f .
150
5.2.4. Die beiden letzten Punkte bedeuten in der Sprache der linearen Algebra,
daß das Integral eine Linearform auf dem reellen Vektorraum aller stetigen re-
ellwertigen Funktionen auf unserem kompakten Intervall ist, als da heißt, eine
lineare Abbildung in den Körper der reellen Zahlen.
Beweis. 1. Wir wissen ja schon, daß aus m = 1 ≤ f (x) ≤ 1 = M folgt b − a ≤
Rb
a
f ≤ b − a.
2. Für Teilmengen A, B ⊂ R definiert man eine neue Teilmenge A + B ⊂ R
durch die Vorschrift A + B = {x + y | x ∈ A, y ∈ B}. Offensichtlich gilt
151
Die schraffierte Fläche stellt die fünfte Riemannsumme der durch den
geschwungenen Graphen beschriebenen Funktion dar.
152
Rb
Proposition 5.2.5. Für a ≤ b und f : [a, b] → R stetig gilt a
f = lim S r (f ).
r→∞
Rb
Ergänzung 5.2.6. In der Notation a f (x) dx, die auf den Philosophen
R und Mathe-
matiker Leibniz zurückgeht, bedeutet das Integralzeichen ein S wie „Summe“
und dx meint die „Differenz im x-Wert“. Manchmal verwendet man auch allge-
meiner für eine weitere Funktion g : [a, b] → R mit guten Eigenschaften, R etwa
für g die Differenz zweier monoton wachsender Funktionen, die Notation f dg,
und meint damit den Grenzwert der Summen r−1
P
i=0 f (ti )(g(ti+1 ) − g(ti )), dessen
Existenz in [AN2] 8.4.2 folgende in großer Allgemeinheit diskutiert wird.
5.2.7. Man mag versucht sein, die in Proposition 5.2.5 enthaltene Beschreibung
gleich als Definition des Integrals zu nehmen. Ich rate davon jedoch ab, da die
Existenz des fraglichen Grenzwerts nicht so leicht zu zeigen ist, und da auch die
Zweite unserer Integrationsregeln 5.2.3 aus dieser Definition nicht so direkt folgt.
Nun kommt das natürlich eigentlich nicht darauf an, wenn unsere Definitionen
äquivalent sind. Aber man legt eben auch in Deutschland ein zentrales Ausliefe-
rungslager besser nach Frankfurt als nach Freiburg!
Beweis. Wir definieren zusätzlich zur r-ten Riemann-Summe die r-ten Unter-
summen und Obersummen durch
r−1 r−1
r
X r X
S (f ) := (inf f [ti , ti+1 ])( b−a
r
) und S (f ) := (sup f [ti , ti+1 ])( b−a
r
)
i=0 i=0
153
Rb
In der Notation a f (x) dx, die auf den Philosophen
R und Mathematiker Leibniz
zurückgeht, bedeutet das Integralzeichen ein S wie „Summe“ und dx meint die
„Differenz im x-Wert“.
Die schraffierte Fläche stellt die vierte Obersumme der durch den
geschwungenen Graphen beschriebenen Funktion dar, der kreuzweise
schraffierte Teil ihre Untersumme.
154
Beispiel 5.2.8 (Fläche eines rechtwinkligen Dreiecks als Integral). Für b ∈ R≥0
finden wir
Rb
0 b 2b (r−1)b b
0
x dx = lim r→∞ r
+ r
+ r
+ · · · r r
r(r−1) b2
= limr→∞ 2
· r2
nach 1.1.1
b2
= 2
Übungen
Übung 5.2.11. Diese Übung wird verwendet bei der Diskussion der Bogenlänge.
Sei a = a0 ≤ a1 ≤ a2 ≤ . . . ≤ an = b eine Unterteilung des kompakten
reellen Intervalls [a, b]. Gegeben eine Funktion f : [a, b] → R bezeichnet man die
Summen
Xn−1
f (ζi )(ai+1 − ai )
i=0
mit beliebigen ζi ∈ [ai , ai+1 ] als die Riemann-Summen von f zur vorgegebenen
Unterteilung. Die maximale Länge sup{ai −ai−1 | 1 ≤ i ≤ n} eines Teilintervalls
heißt die Feinheit der Unterteilung. Man zeige: Ist f : [a, b] → R stetig, so
gibt es zu jedem ε > 0 ein δ > 0 derart, daß R alle Riemannsummen von f zu
Unterteilungen der Feinheit ≤ δ vom Integral f einen Abstand ≤ ε haben.
155
Darstellung einer Riemannsumme im Sinne von 5.2.11.
156
Ergänzung 5.2.12. Allgemeiner heißt eine nicht notwendig stetige Funktion auf
einem kompakten
R reellen Intervall f : [a, b] → R Riemann-integrierbar mit
Integral f , wenn die Bedingung vom Ende der vorhergehenden Übung erfüllt
ist, daß es nämlich zu jedem ε > 0 ein δ > 0 gibt derart, R daß alle Riemann-
Summen von f zu Unterteilungen der Feinheit ≤ δ von f einen Abstand ≤
ε haben. Wir werden in diesem Text den Begriff der Riemann-Integrierbarkeit
vermeiden: Später wird eh das sehr viel stärkere Lebesgue-Integral eingeführt,
und bis dahin reicht unser Integrationsbegriff für stetige Funktionen aus. Für ein
vertieftes Studium der Analysis ist jedoch auch der Begriff der Riemann-Integrier-
barkeit relevant.
Ergänzende Übung 5.2.13. Man zeige den Mittelwertsatz der Integralrechnung:
R kompaktes Intervall [a, b] ⊂ R und f : [a, b] → R stetig
Gegeben ein nichtleeres
gibt es ξ ∈ [a, b] mit f = (b − a)f (ξ). Gegeben
R eine Rweitere stetige Funktion
g : [a, b] → R≥0 gibt es sogar ξ ∈ [a, b] mit f g = f (ξ) g.
f (x) − f (p)
lim =b
x→p x−p
d
f (x) = b
dx x=p
5.3.3. Jede nicht vertikale alias nicht zur y-Achse parallele Gerade in der Ebene
ist die Lösungsmenge genau einer Gleichung der Gestalt y = a + bx. Die reelle
Zahl b heißt in diesem Fall die Steigung unserer Gerade. Anschaulich bedeutet
der Differenzenquotient
f (x) − f (p)
x−p
die Steigung der Gerade durch die Punkte (p, f (p)) und (x, f (x)). Diese Gerade
heißt auch eine Sekante, lateinisch für „Schneidende“, da sie eben den Graphen
unserer Funktion in den beiden besagten Punkten schneidet. Der Grenzwert f 0 (p)
157
Eine Sekantensteigung und die Tangentensteigung der durch den gezahnten
Graphen dargestellten Funktion
158
der Sekantensteigungen bedeutet anschaulich die Steigung der Tangente, latei-
nisch für „Berührende“, an den Graphen von f im Punkt (p, f (p)). Die Umkeh-
rung dieser Anschauung liefert auch eine präzise Definition besagter Tangente als
der Gerade durch den Punkt (p, f (p)) mit der Steigung f 0 (p).
5.3.4 (Differenzierbarkeit, Umformulierungen der Definition). Wir geben noch
zwei Umformulierungen der Definition der Differenzierbarkeit. Ist D ⊂ R ei-
ne halboffene Teilmenge, so ist nach 3.5.7 eine Funktion f : D → R diffe-
renzierbar bei p mit Ableitung f 0 (p) = b genau dann, wenn es eine Funktion
ϕ = ϕp : D → R gibt, die stetig ist bei p mit Funktionswert ϕ(p) = b alias
limx→p ϕ(x) = ϕ(p) = b derart, daß für alle x ∈ D gilt
f (p + h) = f (p) + bh + ε(h)h
für eine Funktion ε, die stetig ist bei Null und die dort den Wert ε(0) = 0 annimmt,
in Formeln limh→0 ε(h) = ε(0) = 0. Hierbei ist zu verstehen, daß die Funktion
ε definiert sein soll auf der Menge aller h mit h + p ∈ D. Diese Formulierung
des Ableitungsbegriffs hat den Vorteil, besonders gut zum Ausdruck zu bringen,
inwiefern für festes p und kleines h der Ausdruck f (p) + bh eine besonders gute
Approximation von f (p + h) ist.
Beispiele 5.3.5. Eine konstante Funktion R → R ist an jeder Stelle differenzierbar
mit Ableitung Null. Die Funktion id : R → R, x 7→ x hat bei jedem Punkt p die
Ableitung id0 (p) = dx
dx
(p) = 1.
Lemma 5.3.6. Die Funktion x 7→ x1 ist differenzierbar bei jedem Punkt von R×
und ihre Ableitung bei einer Stelle p ∈ R× ist − p12 .
1
− p1 −1
Beweis. Wir rechnen limx→p x
x−p
= limx→p xp
= − p12 nach 3.5.9.
Beweis. Das folgt aus der Darstellung f (x) = f (p) + (x − p)ϕ(x) mit ϕ stetig
bei p aus 5.3.4.
159
5.3.8. Ist f : (a, b) → R definiert auf einem offenen Intervall um einen Punkt
p ∈ (a, b) und existieren die Grenzwerte
f (x) − f (p) f (x) − f (p)
lim beziehungsweise lim
x%p x−p x&p x−p
im Sinne von 3.5.41, so nennen wir sie die linksseitige beziehungsweise die
rechtsseitige Ableitung von f an der Stelle p. Nach der Charakterisierung 3.5.41
eines Grenzwerts als übereinstimmender rechts- und linksseitiger Grenzwert ist f
differenzierbar bei p genau dann, wenn dort die linksseitige und die rechtsseiti-
ge Ableitung existieren und übereinstimmen. Man erkennt so zum Beispiel, daß
der Absolutbetrag abs : R → R, x 7→ |x| nicht differenzierbar ist bei p = 0,
da dort die linksseitige und die rechtsseitige Ableitung zwar existieren, aber nicht
übereinstimmen.
5.4 Ableitungsregeln
Proposition 5.4.1. Seien Funktionen f, g : R ⊃ D → R für D halboffen differen-
zierbar bei p ∈ D. So sind auch die Funktionen f + g und f g differenzierbar bei
p und es gilt
(f + g)0 (p) = f 0 (p) + g 0 (p) und (f g)0 (p) = f 0 (p)g(p) + f (p)g 0 (p)
f (p + h) = f + f 0 h + ε(h)h
g(p + h) = g + g 0 h + ε̂(h)h
Durch Addieren beziehungsweise Multiplizieren dieser Gleichungen erhalten wir
dann
(f + g)(p + h) = (f + g)(p) + [f 0 + g 0 ] h + ε(h) + ε̂(h) h
(f g)(p + h) = (f g)(p) + [f 0 g + f g 0 ] h
+ ε(h)g + f ε̂(h) + (f 0 + ε(h))(g 0 + ε̂(h))h h
Nach unseren Kenntnissen über stetige Funktionen steht aber in der letzten ecki-
gen Klammer auf der rechten Seite jeder dieser Gleichungen eine Funktion, die
stetig ist bei h = 0 und die dort den Wert Null annimmt.
160
Definition 5.4.2. Ist eine Funktion f : R ⊃ D → R mit D halboffen differenzier-
bar an jedem Punkt von D, so nennen wir f differenzierbar auf D und nennen
die Funktion f 0 : D → R, p 7→ f 0 (p) ihre Ableitung.
Beispiel 5.4.3. Die Funktion x 7→ 1/x ist differenzierbar auf R× mit Ableitung
−1/x2 . Sind f und g differenzierbar, so auch f + g und f g und für ihre Ableitun-
gen gelten die Summenregel und die Produktregel oder Leibniz-Regel
Korollar 5.4.4 (Ableiten ganzzahliger Potenzen). Für alle n ∈ Z und unter der
Voraussetzung x 6= 0 im Fall n ≤ 0 ist die Ableitung der Funktion x 7→ xn die
Funktion x 7→ nxn−1 .
5.4.5. Im Fall n = 0 ist die Ableitung der konstanten Funktion x0 = 1 natürlich
überall definiert und Null, kann aber nur für x 6= 0 in der Form 0x−1 geschrieben
werden.
Beweis. Man zeigt das durch vollständige Induktion über n separat für n ≥ 0 und
n ≤ −1.
Satz 5.4.6 (Kettenregel). Seien D, E ⊂ R halboffene Teilmengen und f : D → R
sowie g : E → R Funktionen und es gelte f (D) ⊂ E. Sei f differenzierbar bei
p ∈ D und g differenzierbar bei f (p). So ist g ◦ f : D → R differenzierbar bei p
mit Ableitung
(g ◦ f )0 (p) = g 0 (f (p)) · f 0 (p)
Beweis. Der besseren Übersichtlichkeit halber benutzen wir hier Großbuchstaben
für die Ableitungen und setzen f 0 (p) = L und g 0 (f (p)) = M . Wir haben
f (p + h) = f (p) + Lh + ε(h)h
g(f (p) + k) = g(f (p)) + M k + ε̂(k)k
für Funktionen ε und ε̂, die stetig sind bei Null und die dort verschwinden. Wir
erhalten durch Einsetzen von Lh + ε(h)h für k sofort
g(f (p + h)) = g f (p) + Lh + ε(h)h
= g(f (p)) + M Lh + M ε(h)h + ε̂(Lh + ε(h)h)(L + ε(h))h
Es ist nun aber offensichtlich, daß sich hier die Summe der Terme ab dem dritten
Summanden einschließlich in der Gestalt η(h)h schreiben läßt für eine Funktion
η, die stetig ist bei Null und die dort verschwindet, und wir erhalten
161
Proposition 5.4.7 (Quotientenregel). Sei f : R ⊃ D → R eine Funktion ohne
Nullstelle und D ⊂ R halboffen.
Beweis. Teil 1 folgt sofort aus der Formel 5.3.6 für die Ableitung de Funktion
x 7→ 1/x mit der Kettenregel. Teil 2 folgt aus Teil 1 mit der Produktregel.
5.4.8. Seien D ⊂ R halboffen und g, f : R ⊃ D → R differenzierbar. Hat f
keine Nullstelle auf D, so ist auch g/f differenzierbar auf D mit der Ableitung
0
g g 0 f − gf 0
=
f f2
Beweis. In 6.1.16 werden wir lernen, daß man „Potenzreihen gliedweise differen-
zieren darf“. Da wir das aber bis jetzt noch nicht wissen, müssen wir etwas mehr
arbeiten. Wir bestimmen zunächst die Ableitung der Exponentialfunktion an der
Stelle p = 0 und erhalten
exp(x)−exp(0)
exp0 (0) = limx→0 x−0
P∞ xi−1
= limx→0 i=1 i!
P∞
xi−2
= limx→0 1 + x i=2 i!
= 1
162
Hier verwenden wir im letzten Schritt den schon behandelten Fall p = 0 und
formal im ersten Schritt eine der Verknüpfungsregeln für Grenzwerte aus 3.5.27,
um den Grenzwert x → p in einen Grenzwert h → 0 umzuformen.
5.4.10 (Ableitung der trigonometrischen Funktionen). Ganz genau wie im vor-
hergehenden Beweis zeigt man, daß Sinus und Cosinus bei Null differenzierbar
sind mit der Ableitung sin0 (0) = 1 und cos0 (0) = 0. Mit der Additionsformel
sin(t + h) = sin(t) cos(h) + cos(t) sin(h) folgt sin0 = cos und mit der anderen
Additionsformel cos0 = − sin.
Beweis. Nach unseren Annahmen gibt es eine stetige Funktion ohne Nullstelle
ϕ : I → R mit f (x) − f (p) = (x − p)ϕ(x) und ϕ(p) = f 0 (p). Setzen wir hier
x = f −1 (y), so ist ψ = 1/(ϕ ◦ f −1 ) : f (I) → R eine stetige Funktion mit
(y − q)ψ(y) = f −1 (y) − f −1 (q) und ψ(q) = 1/f 0 (p).
Beispiel 5.4.12. Die Ableitung des Logarithmus ist mithin
1 1
log0 (q) = =
exp(log q) q
Damit ergibt sich für alle a ∈ R die Ableitung der allgemeinen Potenzen, also
der Funktionen (0, ∞) → R, x 7→ xa , zu x 7→ axa−1 . In der Tat, nach Definition
gilt ja xa = exp(a log x), die Ableitung wird also a x1 exp(a log x) = axa−1 .
Beispiel 5.4.13. Der Arcussinus ist nach 5.4.11 differenzierbar auf (−1, 1) und
seine Ableitung ergibt sich mit unserer Regel für die Ableitung einer Umkehr-
funktion zu
arcsin0 (x) = 1/(cos(arcsin
p x))
2
= 1/√ 1 − sin (arcsin x)
= 1/ 1 − x2
Beispiel 5.4.14. Die Ableitung des Tangens ergibt sich mit der Quotientenregel zu
2 x+sin2 x
tan0 (x) = cos cos2x = 1 + tan2 (x). Die Ableitung von arctan ergibt sich mit
der Regel 5.4.11 über die Ableitung der Umkehrfunktion zu
1
arctan0 (t) =
1 + t2
163
Veranschaulichung der Formel 5.4.11 für die Ableitung von Umkehrfunktionen
164
Lemma 5.4.15. Die Funktion f : R → R gegeben durch
−1/x
e x>0
f (x) =
0 x≤0
ist beliebig oft differenzierbar.
Beweis. Wir betrachten allgemeiner für alle n ∈ N die Funktion fn : R → R,
−n −1/x
x e x>0
fn (x) =
0 x≤0
und zeigen, daß sie differenzierbar ist mit Ableitung fn0 = −nfn+1 + fn+2 . Damit
sind wir dann natürlich fertig. Das einzige Problem ist die Ableitung an der Stelle
p = 0, wo wir nachweisen müssen, daß die Sekantensteigungen „von rechts“ auch
gegen Null streben, daß also für alle n ∈ N gilt
Nun wissen wir aber nach der Definition von exp, daß für jedes m ∈ N und
x > 0 gilt exp(x) > xm /m!. Für jedes n ∈ N und x > 0 gilt also exp(1/x) >
x−n−2 /(n + 2)! und wir folgern 0 < x−n−1 e−1/x < (n + 2)! x für x > 0.
Übungen
Übung 5.4.16 (Eine differenzierbare Funktion mit unstetiger Ableitung). Die
Funktion f : R → R gegeben durch f (x) = x2 sin(x−1 ) für x 6= 0 und f (0) = 0
ist differenzierbar auf R, aber ihre Ableitung ist nicht stetig beim Nullpunkt.
165
Illustration zu 5.4.16. Der Graph der Funktion ist zwischen zwei parabolischen
Backen eingezwängt und hat deshalb am Ursprung Null Grenzwert der
Sekantensteigungen, hat aber beliebig nah am Ursprung immer wieder Stellen
mit Steigung Eins. Die entsprechend durch x2 sin(x−2 ) gegebene Funktion wird
sogar beliebig nah am Ursprung beliebig steil.
166
5.5.4. Die Bedingung, unsere Teilmenge sei offen, ist an dieser Stelle wesentlich:
Gegeben reelle Zahlen a < b nimmt etwa die Funktion x 7→ x auf dem Intervall
[a, b] ihr Minimum bei a und ihr Maximum bei b an, aber die Ableitung unserer
Funktion verschwindet weder bei a noch bei b. Für Minima oder Maxima einer
Funktion f : [a, b] → R, die auf (a, b) differenzierbar ist, kommen ganz allgemein
nach unserem Satz nur in Frage: Einerseits Endpunkte des Intervalls, und ande-
rerseits die Punkte im Innern des Intervalls, an denen die Ableitung verschwindet.
Mit etwas Glück können wir unter diesen Punkten dann durch Ausprobieren her-
auskriegen, wo das Minimum und das Maximum wirklich angenommen werden.
und damit steht das Brechnungsgesetz sin ϕ = γ sin ϕ0 auch schon da.
Satz 5.5.6 (von Rolle). Seien a < b aus R̄ gegeben und sei f : [a, b] → R stetig
auf dem kompakten Intervall [a, b] und differenzierbar auf dem offenen Intervall
(a, b). Gilt dann f (a) = f (b), so gibt es p ∈ (a, b) mit f 0 (p) = 0.
Beweis. Nach 5.1.5 gibt es Punkte p, q ∈ [a, b], an denen f sein Maximum und
sein Minimum annimmt. Liegt einer dieser Punkte im Innern (a, b) unseres In-
tervalls, so verschwindet dort die Ableitung nach dem vorhergehenden Satz und
167
Veranschaulichung der notwendigen Bedingung für ein Maximum 5.5.2
Zum Brechungsgesetz
168
wir sind fertig. Nimmt f sein Maximum und sein Minimum auf dem Rand des
Intervalls an, so ist die Funktion f wegen unserer Annahme f (a) = f (b) konstant
und wir sind auch fertig.
Korollar 5.5.7 (Mittelwertsatz). Seien a, b ∈ R gegeben mit a < b und sei
f : [a, b] → R stetig auf dem ganzen kompakten Intervall [a, b] und differenzierbar
auf dem offenen Intervall (a, b). So gibt es p ∈ (a, b) mit
f (b) − f (a)
f 0 (p) =
b−a
Beweis. Man wende den vorhergehenden Satz von Rolle 5.5.6 an auf die Funktion
g : [a, b] → R, g(x) = f (x) − f (a) − (x − a) f (b)−f
b−a
(a)
, die aus f entsteht durch
„Subtraktion der globalen Sekanten“.
Satz 5.5.8 (Erste Ableitung und Monotonie). Seien I ⊂ R ein mehrpunktiges
Intervall und f : I → R eine differenzierbare Funktion. So gilt
f0 >0 ⇒ f wächst streng monoton
f0 ≥0 ⇔ f wächst monoton
f0 <0 ⇒ f fällt streng monoton
f0 ≤0 ⇔ f fällt monoton
f0 =0 ⇔ f ist konstant
Beweis. Es reicht, die beiden ersten Aussagen zu zeigen. Wächst f nicht streng
monoton, so gibt es a < b mit f (a) ≥ f (b) und nach dem Mittelwertsatz finden
wir p ∈ (a, b) mit
f (a) − f (b)
f 0 (p) = ≤0
a−b
Wächst f nicht monoton, so finden wir in derselben Weise p ∈ I mit f 0 (p) < 0.
Das zeigt schon mal ⇒. Umgekehrt folgt aus f monoton wachsend, daß alle Se-
kantensteigungen nichtnegativ sind, und damit auch alle Grenzwerte von Sekan-
tensteigungen.
Korollar 5.5.9 (Funktionen, die ihre eigene Ableitung sind). Sei I ⊂ R ein
mehrpunktiges Intervall. Genau dann stimmt eine differenzierbare Funktion f :
I → R überein mit ihrer eigenen Ableitung, wenn sie ein Vielfaches der Exponen-
tialfunktion ist, in Formeln
f 0 = f ⇔ ∃c ∈ R mit f (x) = c exp(x)
5.5.10. Eine differenzierbare Funktion f : R× → R mit f 0 = f muß keineswegs
ein Vielfaches der Exponentialfunktion sein. Zum Beispiel wäre die Funktion f
mit f (x) = 0 für x < 0 und f (x) = 5 exp(x) für x > 0 auch eine Möglichkeit.
Aber gut, R× ist ja auch kein Intervall.
169
Veranschaulichung des Mittelwertsatzes 5.5.7
170
Beweis. Bezeichne I ⊂ R unser mehrpunktiges Intervall und f : I → R un-
sere differenzierbare Funktion mit f = f 0 . Die Ableitung der Funktion f (x) e−x
ergibt sich mit der Produktregel zu f 0 (x) e−x −f (x) e−x = 0, mithin ist die Funk-
tion f (x) e−x konstant, sagen wir mit einzigem Funktionswert c, und wir folgern
f (x) = c ex ∀x ∈ I.
5.5.11 (Terminologisches zu Intervallen). Ein reelles Intervall ist halboffen im
Sinne unserer Definition 5.3.1 genau dann, wenn es nicht aus einem einzigen
Punkt besteht. In der Literatur wird der Begriff „halboffen“ meist abweichend ver-
wendet für Intervalle, die weder offen noch kompakt sind, also für reelle Intervalle
der Gestalt (a, b] oder [a, b). Bei uns heißen jedoch auch Intervalle der Gestalt [a, b]
mit a < b halboffen, da sie eben halboffen sind als Teilmengen von R im Sinne
der obigen Definition. Da aber der Begriff eines „halboffenen Intervalls“ schon so
fest besetzt ist und da auch der Terminus „unendliches Intervall“ vermutlich eher
als „Intervall unendlicher Länge“ verstanden wird, will ich stattdessen lieber von
„nicht einpunktigen Intervallen“ oder im Fall, daß sie auch nicht leer sind, wie
bisher von „mehrpunktigen reellen Intervallen“ reden. So richtig gefällt mir das
auch nicht, es hört sich so diskret an. Mir ist aber nichts Besseres eingefallen, und
das Konzept wird uns so oft begegnen, daß es eine griffige Bezeichnung braucht.
1. Gilt f 00 (p) > 0, so besitzt f ein isoliertes lokales Minimum bei p, als
da heißt, es gibt r > 0 derart, daß gilt f (q) > f (p) für alle q ∈ I mit
0 < |q − p| < r;
mit ϕ stetig in p und ϕ(p) = f 00 (p) > 0. So gibt also r > 0 mit ϕ(q) > 0 für
q ∈ I ∩ (p − r, p + r), und wir folgern f 0 (q) < 0 für q ∈ I ∩ (p − r, p) und
f 0 (q) > 0 für q ∈ I ∩ (p, p + r). Unseren Funktion f fällt also streng monoton
auf I ∩ (p − r, p) und wächst streng monoton auf I ∩ (p, p + r). Der andere Fall
f 00 (p) < 0 wird analog behandelt.
Definition 5.5.13. Wir nennen eine Funktion f : I → R auf einem reellen Inter-
vall I konvex beziehungsweise konkav, wenn ihr Graph unter beziehungsweise
171
über jeder seiner Sekanten liegt, wenn also in Formeln für alle x < y < z aus I
gilt
f (x) − f (y) f (y) − f (z)
≤
x−y y−z
beziehungsweise ≥ für konkave Funktionen.
5.5.14. Man zeigt leicht, daß die Bedingung der Konvexität gleichbedeutend ist
zu
f (tx + sz) ≤ tf (x) + sf (z) ∀s, t ∈ [0, 1] mit s + t = 1.
Beweis. Wir zeigen nur die erste Aussage. Ist f nicht konvex, so gibt es x, y, z
mit x < y < z aber
f (x) − f (y) f (y) − f (z)
>
x−y y−z
Nach dem Mittelwertsatz finden wir dann aber ξ < ζ mit f 0 (ξ) > f 0 (ζ) und
bei nochmaligem Anwenden η mit f 00 (η) < 0. Ist umgekehrt f konvex, so reicht
es nach 5.5.8 zu zeigen, daß f 0 monoton wächst. Kürzen wir die Steigung der
Sekante durch (x, f (x)) und (y, f (y)) ab mit sxy := f (x)−f
x−y
(y)
, so impliziert die
Konvexität die Ungleichungskette
Hier ist sxy ≤ syz eine direkte Konsequenz der Konvexität, und da sicher gilt
(x − y)sxy + (y − z)syz = (x − z)sxz , liegt sxz als ein „gewichtetes Mittel“
zwischen sxy und syz . Unsere Ungleichungskette schreiben wir aus zu
f (x) − f (z)
f 0 (x) ≤ ≤ f 0 (z)
x−z
172
Links der Graph einer konvexen, rechts der einer konkaven Funktion
173
Definition 5.5.16. Wir nennen eine Funktion f : I → R auf einem reellen In-
tervall I streng konvex beziehungsweise streng konkav, wenn ihr Graph echt
unter beziehungsweise echt über jeder Sekante liegt, wenn also in Formeln für
alle x < y < z aus I gilt
Beweis. Übung.
Übungen
Übung 5.5.18. An welchen Stellen nimmt die Funktion [−1, 2] 7→ R gegeben
durch x 7→ |2 − x2 | ihr Minimum und Maximum an?
Ergänzende Übung 5.5.19. Bei welchem Verhältnis zwischen Durchmesser und
Höhe umfaßt eine Konservendose mit fest vorgegebener Oberfläche das größt-
mögliche Volumen?
Übung 5.5.20. Eine differenzierbare Funktion auf einem mehrpunktigen Intervall,
deren Ableitung beschränkt ist, ist gleichmäßig stetig.
Ergänzende Übung 5.5.21. Gegeben eine differenzierbare Funktion auf einem
mehrpunktigen Intervall ist das Bild des fraglichen Intervalls unter der Ableitung
unserer Funktion wieder ein Intervall. Hinweis: Mittelwertsatz. Man beachte, daß
die Stetigkeit der Ableitung nicht vorausgesetzt wird.
Übung 5.5.22. Sei a ∈ R gegeben. Ist f : R → R differenzierbar und löst die
Differentialgleichung f 0 = af , so gilt f (x) = f (0) eax für alle x ∈ R.
Übung 5.5.23 (Funktionen, die mindestens ihre eigene Ableitung sind). Ist eine
Funktion f : [0, b) → R differenzierbar mit f 0 (t) ≤ f (t) für alle t ∈ [0, b), so folgt
f (t) ≤ f (0)et für alle t ∈ [0, b). Ist allgemeiner f : [0, b) → R differenzierbar und
α ∈ R derart, daß gilt f 0 (t) ≤ αf (t) für alle t ∈ [0, b), so folgt f (t) ≤ f (0)eαt
für alle t ∈ [0, b).
Übung 5.5.24. Seien I ⊂ R ein mehrpunktiges Intervall und f : I → R differen-
zierbar mit der Eigenschaft f (x) = 0 ⇒ f 0 (x) < 0. Man zeige, daß dann f in
174
I höchstens eine Nullstelle haben kann, und daß f links von dieser Nullstelle po-
sitiv und rechts davon negativ sein muß. Hinweis: Zwischen zwei verschiedenen
Nullstellen muß es nach Voraussetzung eine Nichtnullstelle geben und dann eine
kleinste Nullstelle oberhalb und eine größte Nullstelle unterhalb dieser Nichtnull-
stelle. Von da aus finde man einen Widerspruch zu den Annahmen. Die Übung
wird bei der Diskussion differentieller Ungleichungen helfen.
Ergänzende Übung 5.5.25. Man zeige, daß ein Punkt (x, y) ∈ (0, 1)2 genau dann
auf einem Geradensegment der Länge Eins mit einem Ende auf der x-Achse und
dem anderen Ende auf der y-Achse liegt, wenn gilt y 2/3 + x2/3 ≤ 1. Hinweis: Man
halte x fest und berechne für alle a ∈ [x, 1] die Höhe hx (a) an der Stelle x eines
Brettes der Länge 1, das bei a auf der x-Achse steht und an die y-Achse angelehnt
ist. Man bestimme das Maximum dieser Höhen bei festem x und variablem a.
Übung 5.5.26. Gegeben reelle Zahlen a, b ≥ 0 und p, q > 1 mit p1 + 1q = 1 zeige
man die Young’sche Ungleichung ab ≤ p−1 ap + q −1 bq . Hinweis: Man gehe von
der Konvexität der Exponentialfunktion aus.
Übung 5.5.27. Gegeben reelle Zahlen a, b ≥ 0 und p ≥ 1 zeige man die Un-
gleichung (a + b)p ≤ 2p−1 (ap + bp ). Hinweis: Man gehe von der Konvexität der
Funktion [0, ∞) → R, x 7→ xp aus.
Ergänzende Übung 5.5.28. Für P ⊂ N die Menge aller Primzahlen gilt
X1
=∞
p∈P
p
Haben g und g 0 keine Nullstelle auf I\p und existiert der Grenzwert des Quotien-
ten der Ableitungen limx→p (f 0 (x)/g 0 (x)) in R̄, so existiert auch der Grenzwert des
175
Illustration zu Übung 5.5.25.
176
Quotienten der Funktionen limx→p (f (x)/g(x)) in R̄ und diese beiden Grenzwerte
stimmen überein, in Formeln
0
f (x) f (x)
lim = lim
x→p g(x) x→p g 0 (x)
Vorschau 5.6.3. Um dieses Lemma anschaulich zu verstehen, mag man den Weg
γ : [a, b] → R2 betrachten, der durch γ(t) = (f (t), g(t)) gegeben wird. Es sagt
dann, daß der Vektor γ(a) − γ(b) und der Geschwindigkeitsvektor γ 0 (t) nicht für
alle t ∈ (a, b) voneinander linear unabhängig sein können. Das ist eh klar, wenn
γ(a) − γ(b) Null ist oder γ 0 (t) irgendwo den Wert Null annimmt, und scheint mir
andernfalls zumindest anschaulich offensichtlich.
5.6.4. Verschwindet g 0 nirgends auf (a, b), so gilt g(a) 6= g(b) nach dem Satz von
Rolle 5.5.6 und wir können unsere Gleichung schreiben in der Form
f (a) − f (b) f 0 (ξ)
= 0
g(a) − g(b) g (ξ)
Ist g(x) = x, so erhalten wir unseren Mittelwertsatz 5.5.7 als Spezialfall. Der
verallgemeinerte Mittelwertsatz wird in dieser Vorlesung ebenso wie die Regeln
von de l’Hospital bei der Diskussion von Restgliedern in der Taylorentwicklung
noch eine Rolle spielen.
Beweis. Man wende den Satz von Rolle 5.5.6 an auf die Funktion
F (x) := f (x) g(a)) − g(b) − g(x) f (a) − f (b)
Jetzt zeigen wir die Regeln von de l’Hospital. Wir dürfen ohne Beschränkung der
Allgemeinheit p 6∈ I annehmen, indem wir sonst I an der Stelle p in zwei Teile
zerschneiden und den rechtsseitigen und linksseitigen Grenzwert bei p getrennt
betrachten. Für jede Umgebung W des Grenzwerts
finden wir per definitionem eine Intervallumgebung V von p mit der Eigenschaft
ξ ∈ I ∩ V ⇒ f 0 (ξ)/g 0 (ξ) ∈ W . Für beliebige a, b ∈ I ∩ V mit a 6= b gilt weiter
177
Veranschaulichung der Regel von de l’Hospital 5.6.1 im Fall p ∈ R unter der
Annahme, daß beide Funktionen bei p nach Null streben. Es scheint mir
anschaulich klar, daß der Grenzwert des Quotienten sich nicht ändert, wenn wir
beide Funktionen durch ihre beste lineare Approximation bei p ersetzen, und das
ist auch genau die anschauliche Bedeutung der Regel von de l’Hospital.
178
g(a) 6= g(b), da nach Annahme die Ableitung von g keine Nullstelle auf I\p hat.
Aus dem verallgemeinerten Mittelwertsatz 5.6.2 folgt dann
f (a) − f (b)
∈W für alle a, b ∈ I ∩ V mit a 6= b.
g(a) − g(b)
Von nun an müssen wir die beiden Fälle im Satz getrennt weiterbehandeln. Als
erstes behandeln wir den Fall limx→p f (x) = limx→p g(x) = 0. Ist W ein kom-
paktes Intervall, so folgt f (a)/g(a) ∈ W sofort, indem wir a festhalten, b ge-
gen p streben lassen und uns an die Erhaltung von schwachen Ungleichungen im
Grenzwert 3.5.37 erinnern. Die Behauptung im ersten Fall folgt dann, da für je-
den Punkt q ∈ R̄ jede Umgebung von q eine kompakte Intervallumgebung von q
umfaßt. Jetzt behandeln wir noch den Fall limx→p |g(x)| = ∞. Dafür schreiben
wir unseren Quotienten um zu
f (a) − f (b) f (b)/g(b) − f (a)/g(b)
=
g(a) − g(b) 1 − g(a)/g(b)
und folgern unmittelbar
f (b)
∈ 1 − g(a)/g(b) W + f (a)/g(b) für alle a, b ∈ I ∩ V mit a 6= b.
g(b)
Ist nun a ∈ I ∩ V fest gewählt, so finden wir für jedes ε ∈ (0, 1) eine Umgebung
Uε von p derart, daß gilt b ∈ Uε ∩ I ⇒ |f (a)/g(b)| < ε, |g(a)/g(b)| < ε und
insbesondere a 6= b. Damit sehen wir, daß wir für jede Umgebung W von q und
jedes ε ∈ (0, 1) eine Umgebung Uε von p finden können mit
f (b)
b ∈ Uε ∩ I ⇒ ∈ (1 − ε, 1 + ε)W + (−ε, ε)
g(b)
Die Behauptung folgt im zweiten Fall, da es für jede Umgebung W 0 von q eine
Umgebung W von q und ε ∈ (0, 1) gibt mit (1 − ε, 1 + ε)W + (−ε, ε) ⊂ W 0 .
Beispiel 5.6.5. Für λ > 0 gilt
179
ein Punkt a ∈ I ist die Funktion
F : I → RRx
x 7→ a f (t) dt
Da f stetig ist, finden wir für jedes ε > 0 ein δ > 0 derart, daß aus |t − p| ≤ δ
folgt f (p) − ε ≤ f (t) ≤ f (p) + ε. Aus 0 < x − p ≤ δ folgen also durch Bilden
des Integrals und Teilen durch (x − p) die Ungleichungen
Z x
1
f (p) − ε ≤ f (t) dt ≤ f (p) + ε
x−p p
Beweis. Wir betrachten F : I → R wie im Hauptsatz 5.7.1 und folgern aus der
Eindeutigkeitsaussage von dort F (x) = G(x) − G(a) für alle x ∈ [a, b].
5.7.4. Ist G ein komplizierterer Ausdruck, so ist es bequem und üblich, die Dif-
ferenz G(b) − G(a) mit G(x)|ba abzukürzen. Man spricht einen solchen Ausdruck
180
Veranschaulichung des Hauptsatzes der Differential- und Integralrechnung 5.7.1.
Die kreuzweise schraffierte Fläche stellt F (p) dar, die irgendwie schraffierte
F (x), die einfach schraffierte F (x) − F (p). Ich hoffe, man sieht, daß die Fläche
unter der Kurve beim Verschieben der oberen Grenze um so stärker wächst, je
größer dort der Wert unserer Funktion ist. Das ist qualitativ ausgedrückt die
anschauliche Bedeutung des Hauptsatzes.
181
„G, ausgewertet zwischen den Grenzen a und b“. Für a, b positiv ergibt sich zum
Beispiel Z b
1
dx = log x|ba = log b − log a
a x
Die Ableitung von R× → R, x 7→ log |x| ist im übrigen x 7→ 1/x, als da heißt,
für a, b negativ würden wir log |b| − log |a| erhalten. Über den Nullpunkt hinweg
dürfen wir die Funktion 1/x aber trotzdem nicht in dieser Weise integrieren. Unser
Korollar erlaubt das auch nicht, es trifft vielmehr nur Aussagen über die Integra-
tion von auf einem mehrpunktigen Intervall definierten stetigen Funktionen.
Übungen
Rt
Übung 5.7.5. Gegeben α ∈ R zeige man, daß limt→∞ 1 xα dx existiert in R̄ und
daß dieser Grenzwert endlich
R1 ist genau dann, wenn gilt α < −1. Des weiteren
zeige man, daß limε→0 ε xα dx existiert in R̄ und daß dieser Grenzwert endlich
ist genau dann, wenn gilt α > −1. Anschaulich gesprochen ist also die Hyperbel
x 7→ (1/x) gerade der Grenzfall, in dem sowohl die Fläche zwischen Kurve und
x-Achse ab jedem x-Wert als auch symmetrisch die Fläche zwischen Kurve und
y-Achse ab jedem y-Wert unendlich groß sind.
Ergänzende Übung 5.7.6. Der Integral-Logarithmus Li : (1, ∞) → R wird
erklärt durch die Vorschrift
Z x
dt
Li(x) :=
2 log t
5.8 Integrationsregeln
Satz 5.8.1 (Integration durch Substitution). Gegeben reelle Zahlen a < b und
g : [a, b] → R stetig differenzierbar und f : g([a, b]) → R stetig gilt
Z b Z g(b)
0
f (g(x))g (x) dx = f (y) dy
a g(a)
Im Fall g(b) < g(a) ist das Integral rechts dabei der Konvention 5.2.10 gemäß als
das Negative des Integrals über das Intervall [g(b), g(a)] zu verstehen.
182
Illustration zu Übung 5.7.5.
183
5.8.2. Es gibt durchaus differenzierbare Abbildungen, deren Ableitung nicht stetig
ist, vergleiche 5.4.16. Das Wort „Substitution“ bedeutet ebenso wie „Prostitution“
auf lateinisch „Ersetzen“.
Beweis. Ist g konstant, so verschwinden beide Seiten und die Formel gilt. Ist sonst
F eine Stammfunktion von f , in Formeln F 0 = f , so ist F ◦ g nach der Ketten-
regel 5.4.6 eine Stammfunktion von t 7→ f (g(t))g 0 (t). Berechnen wir beide Inte-
grale mithilfe dieser Stammfunktionen, so ergibt sich auf beiden Seiten der Wert
F (g(b)) − F (g(a)).
5.8.3 (Anschauung für die Substitutionsregel). Wächst g streng monoton, so
kann man einen anschaulicheren Beweis geben, indem man a = a0 < a1 <
. . . < ar = b äquidistant unterteilt und nach dem Mittelwertsatz ξi ∈ (ai−1 , ai )
findet mit g(ai ) − g(ai−1 ) = g 0 (ξi )(ai − ai−1 ). Damit gilt ja die Gleichheit von
Riemannsummen
r
X r
X
0
f (g(ξi ))g (ξi )(ai − ai−1 ) = f (g(ξi ))(g(ai ) − g(ai−1 ))
i=1 i=1
verwenden. Auch wenn g nicht umkehrbar ist, kann man in dieser Weise vorgehen
und statt g −1 (α) und g −1 (β) eben irgendwelche a, b wählen derart, daß g auf ganz
184
Anschauliche Bedeutung der Substitutionsregel nach 5.8.3 im Fall g(x) = x2 .
Die schraffierte Fläche stellt in diesem Spezialfall für r = 4 und das Intervall
[a, b] = [0, 4] die Summe
r−1
X r−1
X
f (g(ξi ))g 0 (ξi )(ai+1 − ai ) = f (g(ξi ))(g(ai+1 ) − g(ai ))
i=0 i=0
dar. Die ξi sind mit dem Mittelwertsatz gerade so gewählt, daß gilt
g(ai+1 ) − g(ai ) = g 0 (ξi )(ai+1 − ai ). Ich finde, man sieht sehr gut, daß diese
R g(b) R 16
Summen gegen g(a) f (y) dy = 0 f (y) dy konvergieren.
185
[a, b] stetig differenzierbar ist mit α = g(a) und β = g(b). Meist arbeiten wir
sogar ohne explizite Erwähnung der Grenzen: Suchen wir nur eine Stammfunk-
tion, so kommt es auf die untere Grenze eh nicht an und die obere Grenze wird
mitgedacht und nach gelungener Integration wieder „zurücksubstituiert“, wie es
unsere Formel fordert.
√
Beispiel 5.8.7. Wir√ bestimmen eine Stammfunktion von f (y) = y 1 − y durch
die Substitution 1 − y = x, y = 1 − x2 = g(x), dy = −2x dx zu
R √ R
y 1 − y dy = (1 − x2 )x(−2x) dx
R
= (2x4 − 2x2 ) dx
2 5
= 5
x − 32 x3
2
√ √
= 5
(1 − y)2 1 − y − 23 (1 − y) 1 − y
R1 √
Beispiel 5.8.8 (Fläche des Einheitskreises). Es gilt π/2 = −1 1 − t2 dt. In
der schmutzigen Anschauung ist also π die Fläche des Einheitskreises. Um das zu
prüfen, substituieren wir t = sin x, dt = cos x dx und erhalten
Z 1√ Z π/2
2
1 − t dt = cos2 x dx
−1 −π/2
Mithilfe der Formel cos2 x = 12 + 12 cos 2x, die ihrerseits aus den Additionsformel
folgt, ergibt sich unser Integral mühelos zu
π/2
1 1 π
x + sin 2x =
2 4 −π/2 2
Satz 5.8.9 (Partielle Integration). Gegeben reelle Zahlen a < b und zwei stetig
differenzierbare Funktionen f, g : [a, b] → R gilt
Z b Z b
0 b
f g = f g|a − f 0g
a a
Beweis. Nach der Produktregel gilt f g 0 = (f g)0 − f 0 g auf [a, b], folglich stimmen
auch die Integrale dieser Funktionen überein.
R 2 x R
Beispiele 5.8.10. x e dx = x2 ex − 2x ex dx
R
= x2 ex −2x ex + 2 ex dx
= (x2 − 2x + 2) ex
log x dx = x log x − x x1 dx
R R
= x log x − x
186
Eine anschauliche Begründung dafür, daß die Fläche einer Kreisscheibe das
Produkt aus Radius und halbem Umfang sein sollte. Der erste geschlängelte Pfeil
deutet dabei ein Zerschneiden und Neu-Zusammenfügen an, die anderen einen
Grenzübergang.
187
5.8.11 (Alternativer Zugang zur Exponentialfunktion). Ich erkläre nun noch
einen alternativen Zugang zur Exponentialfunktion, der unsere Definition über ei-
ne a priori unmotivierte Reihe vermeidet. Suchen wir eine stetig differenzierbare
Funktion g : R → R>0 mit g 0 = g und g(0) = 1, so haben wir nach der Substitu-
tionsregel
Z x Z x 0 Z g(x)
g (t) 1
x= dt = dt = du
0 0 g(t) 1 u
Man definiert also
R y notgedrungen eine Funktion log : R>0 → R durch die Vor-
1
schrift log(y) = 1 u du und die gesuchte Funktion g muß deren Umkehrfunktion
sein.
Satz* 5.8.12. Die Kreiszahl π ist nicht rational, in Formeln π 6∈ Q.
5.8.13. Das wurde bereits 1766 von Johann Heinrich Lambert gezeigt. Der Beweis
der Transzendenz von π ist schwieriger, mir gefällt die Darstellung in [Lor96]. Der
hier gegebene Beweis der Irrationalität wirkt auf mich wie Zauberei. Ich folge der
Darstellung von Stewart [Ste89].
Beweis. Man betrachte für reelles α 6= 0 und natürliches n ∈ N das Integral
Z 1
In = In (α) = (1 − x2 )n cos(αx) dx
−1
für Pn , Qn ∈ Z[X] Polynome vom Grad ≤ 2n. Wäre nun π = a/b mit a, b ∈ Z
und setzen wir oben α = π ein, so ergäbe sich, daß
a2n+1
In (π)
n!
für alle n ∈ N eine von Null verschiedene ganze Zahl sein muß. Das steht im
Widerspruch dazu, daß dieser Ausdruck für n → ∞ gegen Null strebt. Dasselbe
Argument zeigt: Gegeben α ∈ Q× können nicht sin α und cos α beide rational
sein.
Übungen
Übung 5.8.14. Eine Funktion f : R → R heißt gerade, wenn gilt f (−x) = f (x)
für alle x, und ungerade, wenn gilt f (−x) = −f (x) für alleR r x. Man zeige für
jede ungerade stetige Funktion und alle reellen r die Formel −r f = 0.
188
Übung 5.8.15. Man finde Stammfunktionen zu den Kehrwerten quadratischer Po-
lynome, also zu Funktionen der Gestalt x 7→ (x2 + ax + b)−1 . Hinweis: Hat das
fragliche quadratische Polynom zwei verschiedene reelle Nullstellen λ 6= µ, so
kann man unsere Funktion in der Gestalt α/(x − λ) + β/(x − µ) schreiben. Sonst
bringe man sie in die Form ((x + a/2)2 + d)−1 mit d ≥ 0 und erinnere sich an
arctan0 (t) = 1/(1 + t2 ).
√
Übung 5.8.16. Man finde eine Stammfunktion von 1 − t2 . Hinweis: Bei der
Berechnung 5.8.8 der Fläche des Einheitskreises haben wir das schon fast erreicht.
Übung 5.8.17. Man finde eine Stammfunktion für den Arcustangens. Hinweis:
Man wende auf das Produkt 1 · arctan partielle Integration an.
Ergänzende Übung 5.8.18. Man führe die partiellen Integrationen des Beweises
von 5.8.12 aus und prüfe die Induktionsbasis, als da heißt die Fälle n = 0, 1.
Rx 1
Übung 5.8.19. Man zeige limx→∞ −x 1+t 2 dt = π.
189
Die Abbildung γ aus 5.8.20
190
Ergänzende Übung 5.8.23. Man zeige durchP Vergleich mit dem Integral der Funk-
tion x−α , daß für jedes α > 1 die Reihe ∞
k=1 k −α
konvergiert.
Die Funktion cosh nimmt bei x = 0 ihr Minimum an und sinh ist eine Bijektion
sinh : R → R. Die inverse Abbildung nennt man Area Sinus hyperbolicus und
√ : R → R. Sie läßt sich auch elementar ausdrücken als
bezeichnet sie mit arsinh
arsinh(x) = log(x + x2 + 1) und für die Ableitung von arsinh erhalten wir
1
arsinh0 (y) = p
1 + y2
q
In der Tat gilt sinh0 (x) = cosh(x) = 1 − sinh2 (x), sinh0 (arsinh y) = 1 + y 2 .
p
Ähnlich liefert cosh eine Bijektion cosh : [0, ∞) → [1, ∞), die inverse Abbildung
Area Cosinus hyperbolicus √arcosh : [1, ∞) → [0, ∞) kann geschrieben werden
als arcosh(x) = log(x + x2 − 1) und ist differenzierbar auf (1, ∞) mit der
Ableitung
1
arcosh0 (y) = p
2
y −1
Sehr viel seltener benutzt man den Secans hyperbolicus x 7→ 1/ cosh(x), den
Cosecans hyperbolicus x 7→ 1/ sinh(x) und den Tangens hyperbolicus tanh :
∼
x 7→ sinh(x)/ cosh(x) sowie seine Umkehrung artanh : (−1, 1) → R.
191
Die Graphen von Sinus und Cosinus hyperbolicus
192
Die geometrische Bedeutung von Sinus und Cosinus hyperbolicus
193
5.9.4 (Diskussion der Terminologie). Die Namen unserer Funktionen haben den
folgenden geometrischen Hintergrund: Für t ∈ R durchläuft der Punkt mit Koor-
dinaten (cosh t, sinh t) den Hyperbelast
{(x, y) ∈ R2 | (x + y)(x − y) = 1, x > 0}
Hierbei ist |t/2| gerade die Fläche oder lateinisch „area“, die von x-Achse, Hy-
perbel und dem Geradensegment von (0, 0) nach (cosh t, sinh t) eingeschlossen
wird. Es ist eine ausgezeichnete Übung, diese Behauptung nachzurechnen. Man
sieht so die Verwandschaft zu den üblichen trigonometrischen Funktionen, bei de-
nen man nur die Hyperbel x2 − y 2 = 1 zu ersetzen hat durch den Einheitskreis
x2 + y 2 = 1. Dehnen wir die hyperbolischen trigonometrischen Funktionen in
der offensichtlichen Weise zu Funktionen C → C aus, so können wir die formale
Analogie mit den gewöhnlichen trigonometrischen Funktionen präzisieren zu den
Formeln cos z = cosh(iz) und sin z = −i sinh(iz) für alle z ∈ C.
5.9.5. Die Lösungsmengen in der Ebene R2 von Gleichungen der Gestalt ax2 +
bxy + cy 2 = d mit (a, b, c) 6= (0, 0, 0) heißen ebene Quadriken oder auch Ke-
gelschnitte, da man sie erhalten kann als Schnitte räumlicher Ebenen mit dem
Kegel {(x, y, z) ∈ R3 | x2 + y 2 = z 2 } bei geeigneter orthonormaler Identifikation
unserer räumlichen Ebenen mit dem R2 . Jeder Kegelschnitt ist bis auf Drehung
und Verschiebung eine Ellipse αx2 + βy 2 = 1 mit α, β > 0, eine Hyperbel
xy = γ mit γ > 0, eine Parabel x2 = δy mit δ > 0, ein Geradenkreuz, eine
Gerade, ein Punkt oder die leere Menge. Die Bezeichnung „Parabel“ kommt hier
vom griechischen Wort für „Werfen“. In der Tat beschreibt ein Wurfgeschoss unter
Vernachlässigung des Luftwiderstands stets eine „parabolische“ Bahn, vergleiche
[AN2] 10.1.10.
Übungen
Ergänzende Übung 5.9.6. Sei H := {(x, y) ∈ R2 | x2 − y 2 = 1} die Hyperbel.
∼
Wir konstruieren eine Bijektion ϕ : R\{±1} → H\(1, 0), indem wir jedem Punkt
t ∈ R\{±1} den Schnittpunkt der Geraden durch (0, t) und (1, 0) mit H\(1, 0)
zuordnen. Man prüfe, daß diese Abbildung gegeben wird durch
2
t + 1 2t
ϕ(t) = 2 ,
t − 1 t2 − 1
Eine eng verwandte Parametrisierung des Einheitskreises wurde in 5.8.20 bespro-
chen.
√
Übung 5.9.7. Man finde eine Stammfunktion von 1 + t2 . Hinweis: Bei der Be-
rechnung
√ 5.8.8 der Fläche des Einheitskreises haben wir fast eine Stammfunktion
von 1 − t2 bestimmt. Man gehe ähnlich vor mit der Substitution t = sinh x.
194
Die geometrische Bedeutung der Abbildung ϕ aus 5.9.6
195
5.10 Integration rationaler Funktionen
5.10.1 (Das Prinzip der Integration durch Partialbruchzerlegung). Zur Inte-
gration rationaler Funktionen erinnern wir zunächst die Partialbruchzerlegung aus
[LA1] 5.5.12. Danach bilden die Potenzen (X n )n≥0 mitsamt den Potenzen der
Inversen der Linearfaktoren ((X − µ)−n )n≥1, µ∈C eine C-Basis des Körpers der
komplexen rationalen Funktionen C(X). Wenn wir vergessen, daß wir uns dabei
in die komplexe Zahlenebene vorgewagt haben, so wird das Integrieren rationaler
Funktionen sehr einfach. Es reicht damit nämlich, Stammfunktionen für die Funk-
tionen x 7→ (x − µ)m mit m ∈ Z anzugeben, und derartige Stammfunktionen sind
1
für µ ∈ R bekanntlich m+1 (x − µ)m+1 im Fall m 6= −1 sowie log |x − µ| im
Fall m = −1. Im folgenden soll ausgeführt werden, inwiefern diese Formeln für
µ ∈ C im wesentlichen genauso gelten, wenn wir sie nur richtig interpretieren.
5.10.2. Es gibt auch eine Partialbruchzerlegung für reelle rationale Funktionen
und man kann auch mit ihrer Hilfe reelle rationale Funktionen integrieren. So
kann man die komplexen Zahlen weitgehend vermeiden, erhält aber komplizier-
tere Formeln gewinnt weniger konzeptuelle Klarheit.
Beispiel 5.10.3. Wir bestimmen eine Stammfunktion zu 1/(x2 − 1). Die Nullstel-
len des Nenners sind ±1 und der Grad des Zählers ist echt kleiner als der Grad
des Nenners. Wir dürfen den Ansatz
1 a b
= +
x2 −1 x+1 x−1
machen und finden sofort (a + b)x − a + b = 1, also a + b = 0 und b − a = 1 und
folglich a = −1/2 und b = 1/2. Eine Stammfunktion ist mithin
1 1
log |x − 1| − log |x + 1|
2 2
Man beachte, daß unsere Funktion zwei Definitionslücken hat und wir mit unse-
rer Stammfunktion nur die Integrale über Intervalle [a, b] bestimmen können, die
keine der beiden Definitionslücken enthalten.
Beispiel 5.10.4. Wir bestimmen zu (x4 + 2x2 )/(x2 + 2x + 1) eine Stammfunktion.
Die Partialbruchzerlegung haben wir bereits in [LA1] 5.5.17 durchgeführt und
erhielten
x4 + 2x2 8 3
2
= x2 − 2x + 5 − +
x + 2x + 1 x + 1 (x + 1)2
Als Stammfunktion finden wir damit sofort
x3 3
− x2 + 5x − 8 log |x + 1| −
3 (x + 1)
196
Beispiel 5.10.5. Wir bestimmen eine Stammfunktion zu 1/(x2 + 1). Wir wissen
zwar bereits aus 5.4.14, daß der Arcustangens arctan(x) so eine Stammfunktion
ist, aber diesmal geht es uns um das allgemeine Prinzip. Die Nullstellen des Nen-
ners sind ± i und der Grad des Zählers ist echt kleiner als der Grad des Nenners.
Wir dürfen deshalb den Ansatz
1 a b
2
= +
1+x x+i x−i
machen und finden sofort (a + b)x − i a + i b = 1, also a + b = 0 und a − b = i und
folglich a = i /2 und b = − i /2. Wir dürfen folglich die Hoffnung haben, daß
i i
log(x + i) − log(x − i)
2 2
eine Stammfunktion ist, wenn wir diesen Ausdruck richtig interpretieren. Dazu
lege ich eine Pause ein und diskutiere den komplexen Logarithmus.
5.10.6. Aus unseren Erkenntnissen 4.5.22 über die komplexe Exponentialfunktion
folgt, daß sie eine Bijektion
exp : R + (−π, π] i → C×
∼
wird auf der positiven reellen Achse gegeben durch unseren üblichen Logarithmus
u 7→ log u, auf der negativen reellen Achse durch u 7→ log(−u) + i π/2 und auf
der oberen beziehungsweise unteren komplexen Halbebene durch die Vorschrift
√ π u
log(u + i v) = log u2 + v 2 ± i − i arctan für ± v > 0
2 v
Diese Funktion log heißt der Hauptzweig des komplexen Logarithmus. Man
beachte, daß er nicht stetig ist längs der negativen reellen Achse, obwohl seine
Einschränkung auf die negative reelle Achse durchaus stetig ist: Wir haben für
u < 0 genauer
lim log(u + i v) = log(u) = lim log(u + i v) + 2π i
v&0 v%0
198
Vorschau 5.10.12. Die Theorie holomorpher Funktionen heißt die „Funktionen-
theorie“ und ist der Gegenstand einer eigenen Vorlesung. Man zeigt dort zum
Beispiel, daß jede injektive holomorphe Funktion bereits offenes Bild und eine
holomorphe Umkehrfunktion hat.
5.10.13. Eine komplexwertige Funktion f : R ⊃ D → C auf D ⊂ R halboffen
heißt differenzierbar oder genauer reell-komplex differenzierbar bei p ∈ D,
wenn es b ∈ C gibt mit
f (x) − f (p)
lim =b
x→p x−p
Wir kürzen diese Aussage auch in dieser Situation ab durch f 0 (p) = b. Nimmt
hier f nur reelle Werte an, ist das unsere ganz gewöhnliche Ableitung. Nach un-
seren Regeln für komponentenweise Grenzwerte 3.5.33 ist f in dieser Situation
allgemeiner genau dann reell-komplex differenzierbar, wenn Re f und Im f reell
differenzierbar sind, und dann gilt
f 0 (p) = (Re f )0 (p) + i(Im f )0 (p)
Schränken wir anderseits eine komplex differenzierbare Funktion h : C ⊃ ◦U →C
ein auf die reelle Achse zu h : R ⊃
◦ D → C mit D := R ∩ U , so gilt für alle p ∈ D
offensichtlich die Beziehung
h0 (p) = h0 (p)
zwischen der komplexen Ableitung und der reell-komplexen Ableitung der Ein-
schränkung auf die reelle Achse. Eine Funktion F : R ⊃ D → C mit F 0 = f
im Sinne der reell-komplexen Ableitung nennen wir wieder eine Stammfunktion
von f oder ausführlicher eine Stammfunktion im Sinne der reell-komplexen
Ableitung. Dann ist Re(F ) eine Stammfunkton von Re f im ursprünglichen Sin-
ne.
5.10.14 (Stammfunktion durch komplexe Partialbruchzerlegung). Wir erin-
nern, daß die Potenzen (X n )n≥0 mitsamt den Potenzen der Inversen der Linear-
faktoren ((X − µ)−n )n≥1, µ∈C eine C-Basis des Körpers der komplexen rationalen
Funktionen C(X) bilden. Um eine Stammfunktion im Sinne der reell-komplexen
Ableitung einer komplexen rationalen Funktion P (x)/Q(x) anzugeben, reicht es
aus, ihre Partialbruchzerlegung zu bestimmen und Stammfunktionen aller (xn )n≥0
und aller ((x − µ)−n )n≥1, µ∈C anzugeben. Nach unseren Vorüberlegungen sind
solche Stammfunktionen xn+1 /(n + 1) beziehungsweise (x − µ)−n+1 /(−n + 1)
falls n > 1 beziehungsweise log(x − µ) falls n = 1, jeweils mit log unserem
Hauptzweig des Logarithmus. Damit ist unsere Integrationsaufgabe zurückgeführt
auf die Bestimmung der Partialbruchzerlegung. Dieses Problem hinwiederum läßt
sich algorithmisch lösen, wenn man die Nullstellen des Nennerpolynoms kennt.
Für die Bestimmung dieser Nullstellen jedoch gibt es nur algebraische Verfahren,
wenn unser Polynom höchstens den Grad vier hat.
199
5.10.15 (Die Problematik komplexer Potenzen). Setzt man für a ∈ C× und
b ∈ C ähnlich wie im Reellen ab := exp(b log a) mit log dem eben definier-
ten Hauptzweig des komplexen Logarithmus, so ergibt sich ii = exp(−π/2).
Insbesondere ist in diesem Sinne also ii reell. Allerdings ist dann a 7→ ab für
b ∈ C\Z unstetig längs der negativen reellen Achse und wir haben im allgemei-
nen abc 6= (ab )c .
√
5.10.16 (Integrale rationaler Ausdrücke R(et ), R( n t)). Gegeben eine rationale
Funktion R = P/Q betrachten wir die Funktion D → R, t 7→ R(et ) mit dem De-
finitionsbereich D = {t ∈ R | Q(et ) 6= 0}. Das Integral eines solchen rationalen
Ausdrucks in et kann man auf das Integral einer rationalen Funktion zurückführen
durch die Substitution x = et , dx = et dt = x dt. Zum Beispiel berechnen wir
Z Z Z
dt 2 dt 2 dx
= 1 = = 2 arctan x = 2 arctan(et )
cosh t t
e + et x2 + 1
√
Das Integral eines rationalen Ausdrucks √in n t für eine natürliche Zahl n ≥ 1
kann man ähnlich durch die Substitution n t = x, dt = nxn−1 dx auf das Integral
einer rationalen Funktion in x zurückführen.
5.10.17 (Integrale rationaler Ausdrücke R(sin, cos)). Das Integral eines ratio-
nalen Ausdrucks im Funktionenpaar (sin, cos) wie zum Beispiel
sin3 (τ ) + cos(τ )
cos(τ ) + cos2 (τ )
kann man auffassen als Kurvenintegral im Sinne von 7.1.23 einer rationalen Funk-
tion in zwei Veränderlichen, in unserem Beispiel das Integral der Funktion
y3 + x
R(x, y) =
x + x2
über ein Stück des Einheitskreises. Mit der Umparametrisierung 5.8.20, also mit-
hilfe der Substitution t = tan(τ /2) und folglich sin(τ ) = 2t/(1 + t2 ), cos(τ ) =
(1 − t2 )/(1 + t2 ), dτ = (2/(1 + t2 )) dt läßt es sich dann umwandeln in ein Integral
einer rationalen Funktion einer Veränderlichen.
√
5.10.18 (Integrale rationaler Ausdrücke √ R( 1 − x2 , x)). Integrale über ratio-
2
nale Ausdrücke im Funktionenpaar ( 1 − x , x) kann man in ähnlicher Wei-
se√als Kurvenintegral auffassen und lösen, im Gegensatz zu eben hat nur x 7→
( 1 − x2 , x) nicht konstante √ absolute Geschwindigkeit 1, sondern vielmehr die
absolute Geschwindigkeit 1/ 1 − x2 . Formal mag man auch x = sin t, dx =
cos t dt substituieren und sich so auf den bereits behandelten Fall eines rationalen
Ausdrucks im Funktionenpaar (sin, cos) zurückziehen.
200
√
2
5.10.19 (Integrale rationaler Ausdrücke R( √ x ± 1, x)). Integrale
√ von ratio-
nalen Ausdrücken in den Funktionenpaaren ( x + 1, x) oder ( x2 − 1, x) kann
2
Übungen
Übung 5.10.21. Man zeige für die reell-komplexe Ableitung differenzierbarer
komplexwertiger Funktionen f, g : R ⊃ D → C einer reellen Veränderlichen
auf einer halboffenen Teilmenge D ⊂ R die Summenregel (f + g)0 = f 0 + g 0 , die
Produktregel (f g)0 = f 0 g + f g 0 und die Regel für die Ableitung des Kehrwerts
(1/f )0 = −f 0 /f 2 .
Ergänzende Übung 5.10.22. Man finde eine Stammfunktion zu 1/(1 + x4 ).
Übung 5.10.23. Für alle λ ∈ C hat die Abbildung C → C, z 7→ eλz die komplexe
Ableitung z 7→ λ eλz .
201
6 Potenzreihen und höhere Ableitungen
6.1 Funktionenfolgen und Potenzreihen
P∞(aν )ν∈Nν eine Folge reeller Zahlen.P
Satz 6.1.1. Sei Konvergiert für eine reelle Zahl
z die Reihe ν=0 aν z , so konvergiert die Reihe ∞ ν
ν=0 aν x absolut für alle reel-
len Zahlen x mit |x| < |z| .
Vorschau 6.1.2. Dieser Satz gilt ganz genauso und mit demselben Beweis, wenn
wir darin überall „reell“ durch „komplex“ ersetzen. Wir konzentrieren uns hier
auf den Fall reeller Potenzreihen.
Beweis. Die Glieder einer konvergenten Reihe sind beschränkt, unter unseren An-
nahmen gibt es also eine endliche Schranke B mit |aν z ν | ≤ B für alle ν. Aus
|x| < |z| folgt mithilfe der Konvergenz der geometrischen Reihe 4.1.5 dann
∞
X ∞
X ∞
X
ν
ν
|aν x | ≤ ν
|aν z | |x/z| ≤ B |x/z|ν < ∞
ν=0 ν=0 ν=0
P∞
6.1.3. Ein Ausdruck der Gestalt ν=0 aν xν heißt eine Potenzreihe. Eine Potenz-
reihe anzugeben bedeutet also nichts anderes, als die Folge (aν )ν∈N ihrerP
Koeffi-
zienten anzugeben. Der Konvergenzradius r ∈ [0, ∞] einer Potenzreihe aν xν
ist per definitionem das Supremum
r := sup{ |z| | aν z ν konvergiert}
P
Die Bezeichnung als „Radius“ kommt vom Kontext komplexer Potenzreihen her.
Potenzreihe mit Konvergenzradius r vermittels der Ab-
Nach 6.1.1 definiert jedeP
bildungsvorschrift x 7→ ∞ ν
ν=0 aν x eine reellwertige Funktion auf dem Intervall
(−r, r) sowie eine komplexwertige Funktion auf der Kreisscheibe |z| < r.
Satz 6.1.4 (Stetigkeit
P∞ und gliedweises Ableiten von Potenzreihen). Die durch
ν
eine Potenzreihe ν=0 aν x mit positivem Konvergenzradius r > 0 gegebene
Funktion s : (−r, r) → R ist stetig, ja sogar differenzierbar, und ihre Ableitung
wird an jeder Stelle x ∈ (−r, r) gegeben durch die Potenzreihe
∞
X
s0 (x) = νaν xν−1
ν=1
Beispiel 6.1.5. Dieser Satz liefert einen zweiten Beweis für die bereits in 5.4.9
bewiesene Tatsache, daß die Exponentialfunktion ihre eigene Ableitung ist.
Vorschau 6.1.6. Obiger Satz gilt auch für komplexe Potenzreihen und die komple-
xe Ableitung. Er braucht dann aber einen anderen Beweis, den Sie in der Funk-
tionentheorie kennenlernen können.
202
6.1.7. Der Beweis dieses Satzes wird den größten Teil dieses Abschnitts einneh-
men. Wir zeigen in 6.1.13, daß jede durch eine Potenzreihe definierte Funktion
stetig ist, und zeigen die weitergehenden Aussagen in 6.1.16. Zunächst jedoch
müssen wir einige technische Hilfsmittel bereitstellen.
Definition 6.1.8. Seien D eine Menge, (fn )n∈N eine Folge von auf D definierten
Funktionen fn : D → R und f : D → R eine weitere Funktion.
1. Wir sagen, die Folge fn konvergiert punktweise gegen die Funktion f ,
wenn für alle x ∈ D gilt limn→∞ fn (x) = f (x);
2. Wir sagen, die Folge fn konvergiert gleichmäßig gegen die Funktion f und
schreiben limn→∞ fn = f , wenn es für beliebiges ε > 0 ein N = Nε ∈ N
gibt derart, daß für alle n ≥ N und alle x ∈ D gilt |fn (x) − f (x)| < ε.
203
Bei gleichmäßiger Konvergenz müssen für jedes ε > 0 fast alle fn auf dem
ganzen Definitionsbereich D im „ε-Schlauch um f “ bleiben.
204
6.1.12. Eine Potenzreihe mit Konvergenzradius r konvergiert im allgemeinen kei-
neswegs gleichmäßig auf dem ganzen Intervall (−r, r). Ein Gegenbeispiel wäre
etwa die Exponentialfunktion, ein anderes die geometrische Reihe.
Beweis. Für alle x ∈ [−ρ, ρ] gilt |aν xν | ≤ |aν ρν | und folglich
∞
X
|sn (x) − s(x)| ≤ |aν ρν |
ν=n+1
P∞
Da ν=0 |aν ρν | konvergiert, gibt es für jedes ε > 0 ein N ∈ N mit
∞
X
|aν ρν | < ε
ν=N +1
Für n ≥ N und beliebiges x ∈ [−ρ, ρ] gilt dann |sn (x) − s(x)| < ε.
Korollar 6.1.13 (Stetigkeit von Potenzreihen). Die durch eine Potenzreihe mit
positivem Konvergenzradius r > 0 auf (−r, r) definierte Funktion ist stetig.
Beweis. Nach Proposition 6.1.11 und Satz 6.1.10 ist unsere Funktion für alle ρ ∈
[0, r) stetig auf [−ρ, ρ] als gleichmäßiger Grenzwert stetiger Funktionen. Da Ste-
tigkeit eine lokale Eigenschaft ist, muß sie damit stetig sein auf ganz (−r, r).
Satz 6.1.14 (Vertauschen von Integral und Grenzübergang). Ist eine Funktion
f : [a, b] → R gleichmäßiger Grenzwert einer Folge von stetigen Funktionen
fn : [a, b] → R, so gilt
Z b Z b
f = lim fn
a n→∞ a
Vorschau 6.1.15. Sehr viel stärkere Sätze in dieser Richtung werden wir im Rah-
men der Integrationstheorie von Lebesgue als Satz über monotone Konvergenz
[AN3] 1.5.12 und Satz über dominierte Konvergenz [AN3] 1.6.10 kennenlernen.
Beweis. Für alle ε > 0 gibt es N ∈ N derart, daß gilt |f (x) − fn (x)| < ε für alle
n ≥ N und alle x ∈ [a, b]. Es folgt
Z b Z b Z b Z b
f− fn = (f − fn ) ≤ |f − fn | ≤ (b − a)ε
a a a a
für alle n ≥ N .
205
Einige Glieder einer Funktionenfolge, die punktweise gegen die Nullfunktion
konvergiert, deren Integrale jedoch nicht gegen das Integral der Nullfunktion
konvergieren. Später mögen Sie lernen, daß unsere Funktionenfolge im Raum
der „verallgemeinerten Funktionen“ gegen die „Dirac’sche δ-Funktion bei Null“
konvergiert.
206
Satz 6.1.16 (Integration und Ableiten von Potenzreihen). 1. P
Ist eine Funk-
tion f : (−r, r) → R gegeben durch die Potenzreihe f (x) = ∞ ν
ν=0 aν x , so
konvergiert auch die Potenzreihe
∞
X
1
a xν+1
ν+1 ν
ν=0
207
Diese Potenzreihe hinwiederum kann man ganz allgemein für jede in einer Umge-
bung des Nullpunkts beliebig oft differenzierbare Funktion betrachten. Sie heißt
dann die Taylorreihe besagter Funktion oder genauer ihre Taylorreihe am Null-
punkt, muß aber keineswegs positiven Konvergenzradius haben und muß, selbst
wenn sie positiven Konvergenzradius haben sollte, keineswegs gegen besagte Funk-
tion konvergieren. Zum Beispiel hat nach 5.4.15 die Funktion
−1/x
e x > 0,
f (x) =
0 x ≤ 0;
im Nullpunkt die Ableitungen f (ν) (0) = 0 ∀ν ≥ 0, aber dennoch gilt f (x) > 0 für
x > 0. Inwiefern die Taylorreihe dennoch unsere Funktion recht gut approximiert,
diskutieren wir in 6.2.
Beispiel 6.1.19. Die Darstellung
x2 x3
log(1 + x) = x − + − ... ∀x ∈ (−1, 1)
2 3
ergibt sich, indem wir die geometrische Reihe (1 + x)−1 = 1 − x + x2 − x3 . . .
gliedweise integrieren.
Beispiel 6.1.20. Mit unserer Formel arctan0 (t) = 1/(1 + t2 ) für die Ableitung des
Arcustangens aus 5.4.14 erhalten wir durch gliedweises Integrieren der geometri-
schen Reihe 4.1.5 für den Arcustangens für |t| < 1 die Reihenentwicklung
t3 t5 t7
arctan(t) = t − + − ...
3 5 7
und mit dem Abel’schen Grenzwertsatz 6.4.2 ergibt sich
π 1 1 1
= 1 − + − ...
4 3 5 7
Es scheint, daß diese Formel bereits in dem 1530 erschienenen Analysis-Buch
„Ganita Yuktibhasa“ des Autors Jyesthadeva zu finden ist, eines Mathematikers
aus Kerala in Indien, und daß sie auf den indischen Mathematiker Madhava zu-
rückgeht.
2
Beispiel 6.1.21. Um die fünfte Ableitung bei x = 0 von (ex sinh x) bestimmen,
rechnen wir
2 x4 x6
ex = 1 + x2 + 2
+ 3!
+ ...
x3 x5
sinh x = x + 3!
+ 5!
+ ...
2
ex sinh x = x + x3 ( 3!1 + 1) + x5 1 1 1
5!
+ 3!
+ 2
+ ...
208
Hier haben wir einmal unsere Erkenntnisse über das Produkt absolut konvergenter
Reihen verwendet. Die gesuchte fünfte Ableitung bei x = 0 ergibt sich mit 6.1.18
zu
1 1 1
5! + + = 1 + 20 + 60 = 81
5! 3! 2
Definition 6.1.22 (Verallgemeinerte Binomialkoeffizienten). Für α ∈ R und
k ∈ N setzen wir
α α(α − 1) . . . (α − k + 1) α
:= falls k ≥ 1 und := 1.
k k(k − 1) . . . 1 0
Vorschau 6.1.24. Die Proposition gilt mit demselben Beweis auch für x, α ∈ C,
vergleiche [FT1] 4.2.15. Aus unseren Überlegungen in 6.1.18 zu den Koeffizien-
ten konvergenter Potenzreihen folgt auch unmittelbar, daß die Koeffizienten einer
Potenzreihenentwicklung von (1 + x)α , wenn es sie denn gibt, notwendig die
verallgemeinerten Binomialkoeffizienten sein müssen. Daß es aber eine derartige
Entwicklung auch wirklich gibt, muß noch gezeigt werden. Also an die Arbeit!
Beweis. Für α ∈ Z≥−1 kennen wir diese Formel schon: Im Fall α ∈ N gilt
α
k
= 0 falls k > α und wir erhalten einen Spezialfall der binomischen For-
mel 1.6.13. Im Fall α = −1 gilt αk = (−1)k und wir erhalten die geometrische
Reihe 4.1.5 für −x. Unter der Annahme α 6∈ N sagt uns das Quotientenkriterium,
daß die Potenzreihe rechts für |x| < 1 konvergiert, sagen wir gegen die Funktion
f : (−1, 1) → R. Ich behaupte (1 + x)f 0 (x) = αf (x). Das prüft man durch
gliedweises Differenzieren der binomischen Reihe mithilfe der Beziehung
α−1 α−1 α
+ =
k k−1 k
Diese Beziehung kann durch eine kurze Rechnung gezeigt werden. Rechenfaule
können sie auch als eine Gleichheit von Polynomen in α verstehen, von der wir be-
reits wissen, daß sie nach Einsetzen von α ∈ N≥1 gilt, und die folglich als Gleich-
heit von Polynomen gelten muß, da ja Polynome nur endlich viele Nullstellen ha-
ben. Aus (1 + x)f 0 (x) = αf (x) und f (0) = 1 folgt aber schon f (x) = (1 + x)α ,
denn setzt man ϕ(x) = f (x)/(1 + x)α , so gilt ϕ(0) = 1 und
209
√
Beispiel 6.1.25. Aus unserer Formel arcsin0 (x) = 1/ 1 − x2 nach 5.4.13 ergibt
sich die Reihenentwicklung
1 · x3 1 · 3 · x5
arcsin(x) = x + + + ... ∀x ∈ (−1, 1)
2·3 2·4·5
Rx
In der Tat gilt arcsin(x) = 0 (1 − t2 )−1/2 dt, und nach der binomischen Reihe
6.1.23 haben wir
∞
2 −(1/2)
X −1/2 1 1·3 4
(1 − t ) = (−t2 )k = 1 + t2 + t + ...
k=0
k 2 2·4
Ähnlich ergibt sich die Entwicklung von arsinh(x) in eine Potenzreihe, indem wir
in der binomischen Reihe für (1 + y)−1/2 überall y durch x2 ersetzen und die so
entstehende Potenzreihe für (1 + x2 )−1/2 gliedweise integrieren.
6.1.26. Die Formel für die binomische Reihe kann umgeschrieben werden zur nun
für alle y ∈ (0, 2) gültigen Darstellung
∞
α
X α
y = (y − 1)k
k=0
k
als eine Entwicklung von f in eine Potenzreihe um den Punkt p. Mit denselben
Argumenten wie zuvor gilt dann aν = f (ν) (p)/ν!. Ist allgemeiner f beliebig oft
differenzierbar bei p, so erklären wir die Taylorreihe von f zum Entwicklungs-
punkt p als die Potenzreihe
∞
X f (ν) (p) ν
h
ν=0
ν!
Auch wenn die Partialsummen dieser Reihe nicht gegen f (p + h) konvergieren
müssen, liefern sie doch die „bestmöglichen“ Approximationen von f (p + h)
durch Polynome in h von einem vorgegebenen maximalen Grad, wie wir im fol-
genden Abschnitt 6.2 ausführen werden.
Übungen
Übung 6.1.27. Ist (aν )ν∈N eine Folge von von Null verschiedenen reellen Zahlen
und existiert der Grenzwert limν→∞ |aP ν /aν+1 | in [0, ∞], so ist dieser Grenzwert
der Konvergenzradius der Potenzreihe ∞ ν
ν=0 aν x .
210
Ergänzende Übung 6.1.28. Eine Funktion, die für jeden Punkt ihres Definitions-
bereichs in einer Umgebung besagten Punktes durch eine Potenzreihe dargestellt
werden kann, heißt analytisch. Wir werden erst in [FT1] 4.2.8 im Rahmen der
Funktionentheorie zeigen, daß Potenzreihen analytische Funktionen liefern: Dort
geht es mit den Tricks der Funktionentheorie sehr elegant, wir könnten es aber et-
was weniger elegant auch hier schon zeigen. Man zeige: Stimmen zwei auf dem-
selbem reellen Intervall definierte analytische Funktionen auf der Umgebung eines
Punktes aus unserem Intervall überein, so sind sie gleich. Hinweis: Man betrach-
te das Supremum der Menge aller Punkte, an denen unsere beiden Funktionen
übereinstimmen.
Ergänzende Übung 6.1.29.
√ Wie lauten die ersten vier Koeffizienten der Potenz-
reihenentwicklung von 1 +√x ? Wie lauten die ersten vier Koeffizienten der Po-
tenzreihenentwicklung von 2 + x ? Gemeint ist jeweils die Entwicklung um
x = 0.
Ergänzende Übung 6.1.30. Wir würfeln mit einem Würfel eine unendlich lan-
ge Zahlenreihe. Anschaulich ist klar, daß der durchschnittliche Abstand zwischen
zwei aufeinanderfolgenden Einsen gerade Sechs sein muß. Betrachtet man nun die
Wahrscheinlichkeiten, daß die nächste Eins beim nächsten Wurf, beim übernächs-
ten Wurf etc. kommt, multipliziert sie jeweils mit Eins, Zwei etc. und summiert
diese Produkte auf, so sollte sich auch dieser dieser durchschnittliche Abstand
ergeben. Die Aufgabe ist nun, zu beweisen, daß die Reihe
∞ n−1
X 5 1
n
n=1
6 6
6.2 Taylorentwicklung
6.2.1. Um im folgenden auch den Fall n = 0 zulassen zu dürfen, vereinbaren wir,
daß „0-mal differenzierbar bei p“ zu verstehen sein soll als „stetig bei p“.
211
Satz 6.2.2 (Taylorentwicklung). Seien I ⊂ R ein mehrpunktiges Intervall und
f : I → R eine Funktion, deren (n − 1)-te Ableitung f (n−1) auf ganz I existiert
und deren n-te Ableitung f (n) (p) an einer Stelle p ∈ I existiert. So gilt:
für eine Funktion ε mit limh→0 ε(h) = ε(0) = 0, die also in Worten stetig
ist bei Null mit Funktionswert Null;
2. Dieses Polynom ist das eindeutig bestimmte Polynom Q vom Grad ≤ n mit
Q(ν) (p) = f (ν) (p) für 0 ≤ ν ≤ n, dessen Funktionswert und Ableitungen
bei p also bis zur n-ten Ableitung einschließlich mit den entsprechenden
Ableitungen bei p unserer Funktion f übereinstimmen.
1. Der Graph des Approximationspolynoms bis zur nullten Ordnung ist die
Parallele zur x-Achse durch (p, f (p));
2. Der Graph des Approximationspolynoms bis zur ersten Ordnung heißt die
Tangente an den Graphen von f im Punkt (p, f (p));
3. Der Graph des Approximationspolynoms bis zur zweiten Ordnung heißt die
Schmiegeparabel an den Graphen von f im Punkt (p, f (p)).
Beweis. Sicher gibt es genau ein Polynom Q, das die Bedingung aus Teil 2 erfüllt,
nämlich das Polynom
212
Eine unvollkommene Darstellung der Tangente y = x + 1 und Schmiegeparabel
y = x2 /2 + x + 1 an den Graph der Exponentialfunktion im Punkt (0, 1).
213
Damit bleibt nur noch zu zeigen, daß kein anderes Polynom Q̂ die Bedingung aus
Teil 1 erfüllen kann. In der Tat folgt aber für zwei Polynome vom Grad ≤ n aus
Q̂(x) − Q(x)
lim =0
x→p (x − p)n
Das gilt zusätzlich für jeden reellen Punkt x im Abschluß von I, auf den die
Funktion f stetig fortgesetzt werden kann.
Integraldarstellung des Restglieds: Ist f (n+1) zusätzlich auch noch stetig auf
ganz I, so gilt für alle x ∈ I die Formel
n x
f (ν) (p)
Z
X
ν 1
f (x) = (x − p) + (x − t)n f (n+1) (t) dt
ν=0
ν! n! p
214
Beweis. Nur die zweite und dritte DarstellungP des Restglieds sind noch zu zei-
gen. Wir kürzen die Summe wie zuvor mit = Q(x) ab. Für den Rest r(x) =
f (x) − Q(x) verschwinden, wie wir bereits wissen, die ersten n Ableitungen bei
x = p, und unter unseren zusätzlichen Voraussetzungen ist r sogar (n + 1)-mal
differenzierbar auf ganz I mit r(n+1) = f (n+1) . Um daraus die beiden Darstellun-
gen des Restglieds zu erhalten, brauchen wir zwei Rechnungen.
2. Mit dem verallgemeinerten Mittelwertsatz 5.6.2 und der Erkenntnis, daß Nen-
ner und Zähler bei x = p verschwinden, erhalten wir unter der Annahme p 6= x
sofort
r(x) r0 (ξ1 ) r00 (ξ2 ) r(n+1) (ξ)
= = = ... =
(x − p)n+1 (n + 1)(ξ1 − p)n n(n + 1)(ξ2 − p)n−1 (n + 1)!
mit ξ1 , . . . , ξ im offenen Intervall zwischen p und x.
3. Durch wiederholtes partielles Integrieren erhalten wir
Rx Rx Rx
r(x) = p r0 (t) dt = p (x − t)r00 (t) dt = 12 p (x − t)2 r000 (t) dt
= . . .R
x
= n!1 p (x − t)n r(n+1) (t) dt
6.2.6. Diese Abschätzungen liefern umgekehrt auch alternative Beweise für den
Satz 6.2.2 über die Taylorentwicklung, aber eben nur unter stärkeren Vorausset-
zungen an die zu entwickelnde Funktion.
Übungen
Übung 6.2.7 (Hinreichende Kriterien für lokale Extrema). Seien I ⊂ R ein
mehrpunktiges Intervall und f : I → R eine n-mal differenzierbare Funktion
und sei p ∈ I gegeben mit f (1) (p) = . . . = f (n) (p) = 0. Sei weiter und f (n)
differenzierbar an der Stelle p. Man zeige: Ist n ungerade und f (n+1) (p) > 0
beziehungsweise f (n+1) (p) < 0, so hat f ein isoliertes lokales Minimum bezie-
hungsweise Maximum bei p. Ist I offen und n gerade und f (n+1) (p) 6= 0, so hat f
weder ein isoliertes lokales Minimum noch ein isoliertes lokales Maximum bei p.
Hinweis: Taylorentwicklung.
Übung 6.2.8. Gegeben eine differenzierbare Funktion f auf einem offenen reellen
Intervall I ⊂
◦ R, deren Ableitung bei p ∈ I differenzierbar ist, zeige man
f (p + h) + f (p − h) − 2f (p)
f 00 (p) = lim
h→0 h2
P 6.2.9 (Spezielles
Übung zu Potenzreihen mit nichtnegativen Koeffizienten).
Sei ∞ a
k=0 k x k
eine Potenzreihe mit nichtnegativen Koeffizienten ak ≥ 0 und
215
sei r ∈ R≥0 echt kleiner als ihr Konvergenzradius. Hat die Taylorreihe um den
Entwickungspunkt r der durch unsere ursprüngliche Reihe gegebenen Funktion f
den Konvergenzradius ρ, so hat unsere ursprüngliche Reihe mindestens den Kon-
+ ρ. Hinweis: Man drücke f (ν) (r) durch die ursprüngliche Reihe
vergenzradius r P
aus und folgere ak (r + ε)k < ∞ für 0 ≤ ε < ρ.
wenn gilt f (p + h) = g(p + h) + hn ε(h) für eine Funktion ε, die stetig ist bei
Null mit Funktionswert ε(0) = 0 und die definiert ist auf der Menge aller h mit
p + h ∈ D.
6.3.2. Die Notation f ∼np g scheint mir bequem und suggestiv, sie ist aber nicht
üblich. Häufig nennt man eine Funktion, die bei x = 0 mit der Nullfunktion über-
einstimmt bis zur Ordnung n, auch ein kleines o von xn und bezeichnet so ei-
ne Funktion mit o(xn ). In dieser Notation würde man statt f ∼np g schreiben
f (x) = g(x) + o((x − p)n ).
6.3.3. Natürlich folgt aus f ∼np g und g ∼np h schon f ∼np h. Sind P und Q
Polynome vom Grad ≤ n und ist p ein Häufungspunkt von D, so folgt aus P ∼np
Q schon P = Q. Der Satz über die Taylorentwicklung 6.2.2 liefert uns für eine n-
mal stetig differenzierbare Funktion f auf einem mehrpunktigen Intervall D das
eindeutig bestimmte Polynom Q vom Grad ≤ n, das bei p mit f übereinstimmt bis
zur Ordnung n. Genauer besagt dieser Satz, daß dieses Polynom Q charakterisiert
werden kann durch die Bedingungen Q(ν) (p) = f (ν) (p) für 0 ≤ ν ≤ n.
Satz 6.3.4. 1. (Höhere Summen- und Produktregel). Seien f, g : D → R
zwei auf einer Teilmenge D ⊂ R definierte Funktionen. Sei p ∈ D ein
Punkt und seien P, Q Polynome mit f ∼np P und g ∼np Q. So folgt
g ◦ f ∼np Q ◦ P
216
6.3.5. Im Fall n = 0 spezialisiert dieser Satz zur Stetigkeit von Summen und
Produkten 3.2.34 sowie Verknüpfungen 3.2.30. Im Fall n = 1 spezialisiert er zur
Summenregel 5.4.1, Produktregel 5.4.1 und Kettenregel 5.4.6.
Vorschau 6.3.6. Alle Aussagen dieses Satzes werden sich als Konsequenzen des
Approximationssatzes in mehreren Veränderlichen [AN2] 3.3.6 erweisen.
Beweis. 1. Das bleibt dem Leser überlassen. Im Fall der Summe gilt das sogar
für beliebige Funktionen P und Q. Im Fall des Produkts reicht anstelle der Po-
lynomialität die schwächere Annahme, daß P und Q in einer Umgebung von p
beschränkt sind.
2. Wir zeigen zunächst g ◦f ∼np Q◦f und dann Q◦f ∼np Q◦P . Zum Beweis der
ersten Aussage schreiben wir g(y) = Q(y) + (y − f (p))n ε(y − f (p)) für ε stetig
bei Null mit Funktionswert Null. Durch Einsetzen von y = f (x) und Erweitern
des letzten Terms mit (x − p)n erhalten wir
n
n f (x) − f (p)
(g ◦ f )(x) = (Q ◦ f )(x) + (x − p) ε(f (x) − f (p))
x−p
Q ◦ f ∼np Q ◦ P
217
wir wegen f (0) = 0 dann sofort
2 x4 x6
1/ cosh(x) = 1 − ( x2 + 4!
+ 6!
)
2 x4 x6 2
+( x2 + 4!
+ 6!
)
2 x4 x6 3
−( x2 + 4!
+ 6!
) + ...
x2 x4 x6
a0 + a1 x + . . . + a6 x6 = 1 + bx8 + . . .
1+ + +
2 4! 6!
für die ebendort eingeführten Catalan-Zahlen Cn , die die Zahl der möglichen Ver-
klammerungen eines Wortes in (n + 1) Symbolen angeben. Diese Zahlen erfüllen
offensichtlich die Rekursion
n
X
Cn+1 = Ck Cn−k
k=0
Die erzeugende
P Funktion der Folge der Catalan-Zahlen alias die formale Potenz-
reihe P = n≥0 Cn xn erfüllt demnach im Ring der formalen Laurentreihen aus
[LA1] 5.3.43 die Formel xP 2 = P −1 alias P 2 − x1 P + x1 = 0. Damit folgt, immer
im Ring der formalen Laurentreihen, eine Identität der Form
r √
1 1 1 1 ± 1 − 4x
P = ± − =
2x 4x2 x 2x
218
falls die fragliche Wurzel im Ring der formalen Laurentreihen existieren sollte,
wobei das Vorzeichen noch zu bestimmen ist. Nach 6.3.9 existiert diese Wurzel
jedoch in der Tat und kann beschrieben werden durch die binomische Reihe
∞
√
X 1/2
1 − 4x = (−4x)n
n
n=0
Deren konstanter Term ist Eins, so daß für unser Vorzeichen nur das Minus in
Frage kommt. Damit muß notwendig gelten
√
1 − 1 − 4x
P =
2x
Die Koeffizienten unserer binomischen Reihe lassen sich vereinfachen zu
1/2 n n 1 1 −1 −3 −2n + 3
(−1) 4 = ... (−1)n 4n
n n! 2 2 2 2
1
= − (1 · 3 . . . (2n − 3))2n
n!
−2(2(n − 1))!
=
(n − 1)!(n − 1)!
Die letzte Identität stimmt dabei nur für n ≥ 1. Setzen wir alles zusammen, so
ergibt sich wie gewünscht
1 2n
Cn =
n+1 n
Übungen
Übung 6.3.9. Gegeben zwei beliebig oft differenzierbare Funktionen auf einem
Intervall ist die Taylorreihe ihrer Summe die Summe der Taylorreihen und die
Taylorreihe des Produkts das Produkt der Taylorreihen. Hier verstehen wir Pro-
dukt und Summe von Potenzreihen im formalen Sinn, vergleiche [LA1] 5.3.42.
Ergänzende Übung 6.3.10. Man zeige, daß die Identitäten exp(log(x+1)) = x+1
und log((ex −1) + 1) = x auch als formale Identitäten von Potenzreihen gelten,
daß also etwa im ersten Fall für k ≥ 2 gilt
1 −(−1)j(1) −(−1)j(i)
X
... =0
i! j(1) j(i)
j(1)+...+j(i)=k
219
k = 1 gerade den Wert Eins ergibt. Allgemeiner führe man aus, inwiefern die
Taylorreihe der Verknüpfung zweier unendlich oft differenzierbarer Funktionen
gerade die Verknüpfung ihrer Taylorreihen ist.
Ergänzende Übung 6.3.11. Gegeben ein Kring k, für den ein Ringhomomorphis-
mus Q → k existiert, liefert das formale Einsetzen in formale Potenzreihen eine
∼
Bijektion exp : tkJtK → 1 + tkJtK mit der Inversen log gegeben durch die Potenz-
reihe von log(1 + x). Diese Bijektion ist ein Gruppenisomorphismus zwischen der
additiven Gruppe tkJtK und der multiplikativen Gruppe 1 + tkJtK.
Vorschau 6.4.3. Für diejenigen Leser, die bereits mit komplexen Potenzreihen ver-
traut sind, sei bemerkt, daß die entsprechende Aussage im Komplexen in dieser
Form nicht mehr gilt. Mehr dazu finden Sie etwa in [FT1] 4.2.2.
Beweis. Wir dürfen ohne Beschränkung der Allgemeinheit annehmen,
P∞ daß x = 1
der besagte Randpunkt des Konvergenzbereichs ist. Sei also k=0 ak eine P∞konver-k
gente Reihe reeller Zahlen. Wir müssen zeigen, daß die Reihe f (x) = k=0 ak x
für x ∈ [0, 1] eine stetige Funktion darstellt. Dazu schreiben wir die Differenzen
220
der Partialsummen in der Form
Pm k
k=n ak x = (xn − xn+1 ) (an )
+ (xn+1 − xn+2 ) (an + an+1 )
+ (xn+2 − xn+3 ) (an + an+1 + an+2 )
... ...
m−1
+ (x − xm ) (an + . . . . . . . . . + am−1 )
+ xm (an + . . . . . . . . . + am−1 + am )
Für alle ε > 0 finden wir nun wegen der Konvergenz unserer Reihe ein N derart,
daß für alle n, m mit N ≤ n ≤ m gilt |an + . . . + am | ≤ ε. Für alle n, m mit
N ≤ n ≤ m und alle x ∈ [0, 1] folgt daraus die Abschätzung
Pm k
k=n ak x ≤ (xn − xm ) ε + xm ε ≤ ε
Diese Abschätzung zeigt die gleichmäßige Konvergenz der Folge der Partialsum-
men auf [0, 1] und damit die Stetigkeit der Grenzfunktion.
Vorschau 6.4.4. Läßt sich die durch eine Potenzreihe im Inneren des Konver-
genzintervalls definierte Funktion stetig auf einen Randpunkt fortsetzen, so muß
die Potenzreihe an besagtem Randpunkt keineswegs konvergieren. Nehmen wir
P (−1, 1) ist und der fragli-
der Einfachkeit halber an, daß das Konvergenzintervall
che Randpunkt die 1, so folgtPdie Konvergenz von an jedoch aus der stetigen
n
Fortsetzbarkeit der Funktion an x von x ∈ [0, 1) auf [0, 1] zusammen mit der
Tauber-Bedingung, daß die Folge nan betragsmäßig beschränkt sein möge. Un-
ter der stärkeren Annahme limn→∞ nan = 0 wurde das bereits von Tauber gezeigt.
221
7 Raumwertige Funktionen und Schwingungen
7.1 Bogenlänge und Geschwindigkeit
7.1.1. Gegeben v = (v1 , . . . , vn ) ∈ Rn setzen wir
q
kvk := v12 + . . . + vn2
und nennen diese Zahl die Skalarproduktnorm oder kurz Länge von v. Offen-
sichtlich haben wir kλvk = |λ|kvk für alle λ ∈ R. Auf der Schule und in der
Linearen Algebra lernen Sie, inwieweit kvk dem entspricht, was wir anschaulich
die „Länge des Vektors v“ nennen würden, und daß für alle v, w ∈ Rn die Drei-
ecksungleichung kv + wk ≤ kvk + kwk gilt.
Man spricht in diesem Zusammenhang meist von der Bogenlänge und nennt eine
stetige Abbildung γ : I → Rn wie oben einen Weg in Rn .
γ(p + t) − γ(p)
v = lim
t→0 t
Dann schreiben wir γ 0 (p) := v und nennen γ 0 (p) die Ableitung von γ bei p
oder, wenn wir uns t als Zeit denken, den Geschwindigkeitsvektor. Die Länge
kγ 0 (p)k des Geschwindigkeitsvektors nennen wir die absolute Geschwindigkeit.
Ist γ differenzierbar an allen Stellen p ∈ D, so nennen wir γ differenzierbar oder
genauer differenzierbar auf D.
222
Eine Approximation eines Weges durch einen Polygonzug
223
Denken wir uns t als Zeit, so mag man γ 0 (p) auch den „Geschwindigkeitsvektor“
nennen. Er ist stets tangential an die Bahnkurve. Seine Länge hängt jedoch von
der Anzeige des Tachometers ab, wenn wir uns hier mal ein Auto denken, das auf
einem Fußballfeld herumkurvt. Dieser Aspekt ist in einem Bild leider schwer
darzustellen.
224
7.1.5. Seien γ : R ⊃ D → Rn eine Abbildung von einer halboffenen Teilmenge
D ⊂ R nach Rn und sei p ∈ D ein Punkt. Nach unseren Regeln über komponen-
tenweise Grenzwerte ist γ = (γ1 , . . . , γn ) differenzierbar bei p genau dann, wenn
alle γi : D → R differenzierbar sind bei p, und dann haben wir
225
Eine nicht konvexe Teilmenge der Ebene
226
Vorschau 7.1.11. Der Satz gilt genauso für C konvex und „abgeschlossen“, da
T ein C schreiben können als den Schnitt der offenen konvexen Mengen
wir so
C = η>0 (C + B(0; η)).
Beispiel 7.1.12 (Anschauung für den Schrankensatz). Anschaulich können wir
den Inhalt des Satzes interpretieren wie folgt: Sei C eine Kreisscheibe im Rich-
tungsraum der Anschauungsebene mit Radius 20 km/h. Fahren wir mit einem Ge-
ländewagen um 14:00 Uhr an einem Parkplatz los und kurven durch die Gegend
und der Tacho zeigt nie mehr als 20 km/h an, so sind wir um 17:00 Uhr höchstens
60 km von unserem ursprünglichen Parkplatz entfernt. Besteht C dahingegen aus
einem einzigen Punkt, der sagen wir die Geschwindigkeit von 20 km/h in einer
festen Richtung bedeutet, so besagt unser Satz: Fahren wir konstant mit 20 km/h
in diese Richtung, so haben wir um 17:00 Uhr genau 60 km in besagte Richtung
zurückgelegt. Für dieses Beispiel wählen wir implizit einen Isomorphismus der
Zeitachse T mit der reellen Zahlengeraden R derart, daß jeder Stunde ein Inter-
vall der Länge Eins entspricht. Das bedeutet insbesondere, daß wir implizit auch
vektorielle Geschwindigkeiten mit Richtungsvektoren identifizieren. Im übrigen
wird in [AN2] 2.3.11 erklärt, wie man auch mit „echten“ Geschwindigkeiten for-
mal korrekt arbeiten kann.
7.1.13 (Beziehung zwischen Schrankensatz und Mittelwertsatz). Der Satz folgt
im Fall Rn = R leicht aus unserem bisherigen Mittelwertsatz 5.5.7 und er spielt
auch im allgemeinen eine ähnliche Rolle, indem er es erlaubt, „den von einem
Teilchen in einem Zeitintervall [a, b] gewonnenen Abstand von seinem Ausgangs-
punkt aus der Kenntnis seiner lokalen Geschwindigkeiten abzuschätzen“. Jedoch
kann man im allgemeinen Fall des Rn im allgemeinen keinen Zeitpunkt mehr fin-
den, zu dem das Teilchen „mittlere Geschwindigkeit“ hätte. Es gibt in anderen
Worten im allgemeinen keinen Punkt ξ ∈ [a, b] mit γ(b) − γ(a) = (b − a)γ 0 (ξ).
Man stelle sich etwa vor, daß unser Geländewagen ein Rundtour fährt, bei der er
zu keiner Zeit die Geschwindigkeit Null hat. Mich befriedigt deshalb die in der
älteren Literatur übliche Bezeichnung als „Mittelwertsatz in mehreren Veränder-
lichen“ nicht vollständig.
Beweis. Offensichtlich gilt für eine konvexe Teilmenge C ⊂ Rn und beliebige
reelle s, t ≥ 0 stets sC + tC = (s + t)C. Das zeigt, daß in unserem Satz die
Aussage für das ganze Intervall folgt, wenn wir sie für alle Stücke einer Zerlegung
in endlich viele Teilintervalle zeigen können. Kürzen wir genauer für p, q ∈ [a, b]
mit S(p, q) die Aussage γ(q) − γ(p) ∈ (q − p)C ab, so gilt für a ≤ p ≤ q ≤ r ≤ b
in Formeln ausgedrückt
S(p, q) und S(q, r) ⇒ S(p, r)
Da wir C offen angenommen hatten, besitzt jeder Punkt p ∈ [a, b] eine Umgebung
227
Up mit
γ(q) − γ(p)
q ∈ [a, b] ∩ Up \p ⇒ ∈C
q−p
oder umgeschrieben eine Umgebung Up mit (q ∈ [a, b] ∩ Up ) ⇒ S(p, q). Nun
setzen wir
s := sup{c ∈ [a, b] | Es gilt S(a, x) ∀x ∈ [a, c]}
Dann gilt S(a, s), denn im Fall a = s ist das eh klar und sonst gibt es x ∈ [a, s)
mit S(x, s) wahr und S(a, x) gilt nach Annahme eh für alle x ∈ [a, s). Hätten wir
nun nicht s = b, so fänden wir q ∈ (s, b] mit S(s, x) wahr für alle x ∈ [s, q] und
damit S(a, x) wahr für alle x ∈ [a, q] im Widerspruch zur Wahl von s.
Satz 7.1.14 (Bogenlänge als Integral). Die Länge eines stetig differenzierbaren
Weges γ : [a, b] → Rn stimmt überein mit dem Integral über seine absolute Ge-
schwindigkeit, in Formeln
Z b
L(γ) = kγ 0 (t)k dt
a
0
Beweis. Sei ε > 0 beliebig. Da γ nach 5.1.15 gleichmäßig stetig ist auf [a, b],
finden wir ein δ > 0 mit kγ 0 (x) − γ 0 (y)k < ε falls |x − y| ≤ δ. Gegeben eine
Unterteilung a = a0 ≤ a1 ≤ . . . ≤ ar = b einer Feinheit ≤ δ folgern wir aus dem
Schrankensatz 7.1.10 dann
γ(ai+1 ) − γ(ai ) ∈ (ai+1 − ai ) B(γ 0 (ai ); ε)
und insbesondere kγ(ai+1 ) − γ(ai )k ∈ (ai+1 − ai ) kγ 0 (ai )k + [−ε, ε] . Durch
Aufsummieren folgt
r−1
X r−1
X
kγ(ai+1 ) − γ(ai )k − kγ 0 (ai )k(ai+1 − ai ) ≤ (b − a)ε
i=0 i=0
für jede Unterteilung der Feinheit ≤ δ. Das zeigt schon mal L(γ) < ∞, da kγ 0 (t)k
beschränkt sein muß auf dem kompakten Intervall [a, b]. Nach Übung 5.2.11 zum
Riemannintegral können wir δ zusätzlich so klein wählen, daß für jede Untertei-
lung der Feinheit ≤ δ auch noch gilt
r−1
X Z
kγ (ai )k(ai+1 − ai ) − kγ 0 k ≤ ε
0
i=0
228
Zusammen erhalten wir
Z
L(γ) − kγ 0 k ≤ (b − a)ε + 2ε
kγ 0 k wie gewünscht.
R
Da das für alle ε > 0 gilt, folgt L(γ) =
Beispiel 7.1.15 (Kreislänge). Unsere Definition der Kreiszahl π aus 3.4.1 be-
deutet wie bereits ewähnt in√der hier eingeführten Terminologie π = L(γ) für
γ : [−1, 1] → R2 , x 7→ (x, 1 − x2 ). Bezeichne andererseits κ > 0 die kleins-
te positive Zahl mit u(κ) = −1 für unsere Umlaufabbildung u(t) := eit . Es gilt
zu zeigen κ = π. Wir wissen sin(t) > 0 für t ∈ (0, κ), folglich fällt cos streng
∼
monoton auf [0, κ] und induziert eine Bijektion cos : [0, κ] → [−1, 1]. Unter der
Umparametrisierung mit dem Cosinus erhalten wir γ(cos t) = (cos t, sin t). Weil
die Länge sich bei monotoner Umparametrisierung nicht ändert, folgern wir
Z κ Z κ
0
π = L(γ) = L(γ ◦ cos) = k(γ ◦ cos) (t)k dt = 1 dt = κ
0 0
Ergänzung 7.1.16 (Gestalt einer hängenden Kette). Wir gehen davon aus, daß
die Gestalt einer hängenden Kette durch den Graphen einer stetig differenzierba-
ren Funktion f : R → R beschrieben wird, und zeigen, daß diese Funktion bei
Wahl einer geeigneten Längeneinheit und eines passenden Urspungs der Cosinus
hyperbolicus sein muß. Auf das Kettensegment über einem kompakten Intervall
[a, b] wirken die Zugkraft in der Kette von beiden Seiten sowie die Schwerkraft.
Bezeichnet Lba die Länge des besagten Kettensegments und vx = (1, f 0 (x)) den
Tangentenvektor an unsere Kurve bei (x, f (x)) mit 1 als erster Komponente, so
impliziert das Kräftegleichgewicht die vektorielle Gleichung
für geeignete positive Zahlen ca , cb und eine positive Konstante D, die von den
physikalischen Konstanten unseres Problems abhängen. Die Positivität von ca , cb
und D wird dabei auch nur anschaulich motiviert und nicht mathematisch herge-
leitet. Mathematisch wäre auch durchaus die an der y-Achse gespiegelte „stehende
Kette“ eine mögliche Lösung, aber eben mit negativen ca , cb . Durch Betrachtung
der ersten Komponenten liefert unsere vektorielle Gleichung für das Kräftegleich-
gewicht erst einmal ca = cb = c. Insbesondere ist der horizontale Anteil der
Zugspannung in der Kette also an jeder Stelle derselbe. Durch Betrachtung der
zweiten Komponenten folgt weiter
Z bp
0 0 b
cf (a) − cf (b) = −DLa = −D 1 + f 0 (x)2 dx
a
229
Illustration zur hängenden Kette
230
Folglich erfüllt unsere Funktion eine Differentialgleichung der Gestalt
Z bp
0 0
f (a) − f (b) = −k 1 + f 0 (x)2 dx
a
p
für positives k := D/c, mithin gilt f 00 (x) = k 1 + f 0 (x)2 . Daraus folgern wir
Z b
f 00 (x) dx
p =b−a
a k 1 + f 0 (x)2
und mit der Substitution f 0 (x) = y, f 00 (x) dx = dy weiter
Z f 0 (b)
dy
p =b−a
f 0 (a) k 1 + y2
Dies Integral lösen wir durch die Substitution y = sinh t, dy = cosh t dt und
erhalten als Stammfunktion für den Integranden k −1 arsinh y. Damit ergibt sich
k −1 arsinh f 0 (b) = b + m für eine Konstante m und f 0 (b) = sinh(k(b + m)) und
schließlich
f (b) = k −1 cosh(k(b + m)) + h
für geeignete Konstanten k, m und h. Hier beschreibt k, wie „steil“ die Kette
hängt, m ist das Negative der x-Koordinate der Stelle kleinster Höhe, und h be-
schreibt, wie hoch unsere Kette hängt. In Worten bedeutet das, daß es für eine
vorgegebene hängende Kette stets ein orthogonales Koordinatensystem und ins-
besondere eine Längeneinheit gibt, für die sie genau entlang des Graphen des
Cosinus hyperbolicus hängt.
Vorschau 7.1.17. In [TM] 4.6.10 skizziere ich einen Beweis dafür, daß sogar ein
„Weg gegebener Länge kleinster potentieller Energie“ zwischen vorgegebenen
Aufhängepunkten existiert und eindeutig bestimmt ist und unsere Kettenlinie sein
muß.
Übungen
Übung 7.1.18. Seien D ⊂ R eine halboffene Teilmenge und A : D → Mat(n ×
m; R) sowie B : D → Mat(m×k; R) differenzierbare matrixwertige Funktionen.
So ist auch das Produkt AB : t 7→ A(t)B(t) differenzierbar und die Geschwin-
digkeit (AB)0 der Produktfunktion AB : D → Mat(n×k; R) wird gegeben durch
die Formel
(AB)0 = A0 B + AB 0
Übung 7.1.19. Gegeben s ∈ R bezeichne (s·) : Rn → Rn die Multiplikation
mit s. Sei γ : I → Rn eine Abbildung von einem Intervall nach Rn . Man zeige
L((s·) ◦ γ) = |s|L(γ) für s 6= 0.
231
Übung 7.1.20. Für jede Abbildung γ : [a, b] → Rn gilt L(γ) ≥ kγ(a) − γ(b)k.
Ist γ zusätzlich stetig, so haben wir Gleichheit genau dann, wenn γ aus dem Weg
φ : [0, 1] → Rn , t → tγ(a) + (1 − t)γ(b) entsteht durch monotone Umparametri-
sierung.
Übung 7.1.21. Eine Abbildung von einem reellen Intervall I nach Rn heiße nach
der Bogenlänge parametrisierend, wenn ihre Einschränkung auf jedes nicht-
leere kompakte Teilintervall dieselbe Länge hat wie das Teilintervall selber. Man
zeige, daß sich eine stetige Abbildung von einem reellen Intervall nach Rn , die
auf keinem mehrpunktigen Teilintervall konstant ist und deren Einschränkung auf
jedes kompakte Teilintervall endliche Länge hat, stets „nach der Bogenlänge pa-
rametrisieren“ läßt, daß es also genauer für solch eine Abbildung γ : I → Rn
∼
stets eine stetige Bijektion ψ : J → I von einem weiteren reellen Intervall J nach
I gibt derart, daß γ ◦ ψ nach der Bogenlänge parametrisierend ist.
Übung 7.1.22. Man zeige, daß eine stetig differenzierbare Abbildung von einem
mehrpunktigen reellen Intervall in den Rn genau dann nach der Bogenlänge pa-
rametrisierend ist, wenn die zugehörige absolute Geschwindigkeit konstant Eins
ist.
Übung 7.1.23. Gegeben ein stetig differenzierbarer Weg γ : [a, b] → Rn und eine
stetige Funktion f : γ([a, b]) → R erklärt man das Kurvenintegral von f längs
γ als die reelle Zahl Z Z b
f= f (γ(t)) kγ 0 (t)k dt
γ a
Man zeige, daß dies Kurvenintegral unabhängig ist von der Parametrisierung und
daß es mit denselben Notationen wie oben geschrieben werden kann als der Grenz-
wert der Riemannsummen
r−1
X
Sγr (f ) = f (γ(ai )) kγ(ai+1 ) − γ(ai )k
i=0
232
Temperaturdifferenz zwischen eintretendem und austretendem Wasser beschrei-
ben.
7.1.25 (Diskussion der Terminologie). Das hier definierte Kurvenintegral wird
oft auch als „Wegintegral“ bezeichnet. Ich will den Begriff des Wegintegrals je-
doch für eine andere Konstruktion reservieren, die in [AN2] 8.4 besprochen wer-
den wird.
Übung 7.1.26 (Länge des Graphen einer Funktion). Gegeben eine stetig diffe-
renzierbare Funktion f : [a, b] → R wird die Länge ihres Graphen, als da heißt
die Länge des Weges γ : [a, b] → R2 , t 7→ (t, f (t)), gegeben durch das Integral
Rbp
L(γ) = a 1 + f 0 (t)2 dt.
γ 0 (t) = Aγ(t) ∀t ∈ R
Bei dieser Schreibweise fassen wir implizit die Elemente des Rn als Spaltenvekto-
ren auf, also γ = (γ1 , . . . , γn )> , wo der obere Index > unsere Zeilenmatrix in eine
Spaltenmatrix transponiert. Man nennt so eine Gleichung ein homogenes System
von linearen Differentialgleichungen mit konstanten Koeffizienten. Die Spe-
zifikation „mit konstanten Koeffizienten“ grenzt unsere Gleichung ab von dem
noch allgemeineren Fall, bei dem auch die Matrix A noch von t abhängen darf,
also A = A(t), und der noch außerhalb unserer Reichweite ist. Die Spezifikati-
on „homogen“ grenzt es ab vom allgemeineren Fall einer Gleichung der Gestalt
γ 0 (t) = Aγ(t) + f (t) für eine zusätzlich gegebene vektorwertige Funktion f ,
den wir in 7.6.1 diskutieren. Anschaulich gesprochen geben wir uns auf dem Rn
das sehr spezielle Vektorfeld x 7→ Ax vor und interessieren uns für die Bahnen
solcher Teilchen, die bei x ∈ Rn jeweils die Geschwindigkeit Ax haben.
Beispiel 7.2.2. Im Fall n = 1 hat A genau einen Eintrag a ∈ R und wir hatten
schon in 5.5.9 im Fall a = 1 und in Übung 5.5.22 für allgemeines a gesehen,
daß alle Lösungen der Differentialgleichung γ 0 = aγ die Form γ(t) = c exp(at)
haben.
7.2.3. Im Allgemeinen erklären wir die Exponentialfunktion auf Matrizen durch
die Vorschrift
exp : Mat(n; R) → Mat(n; R)
P∞ 1 k 1 2 1 3
A 7→ k=0 k! A = I +A + 2 A + 6 A + . . .
233
x 0 −1 x
Das ebene Vektorfeld 7→
y 1 0 y
234
Hier bedeutet A0 = I nach unserer Konvention 1.5.16 die Einheitsmatrix und
unsere unendliche Reihe ist zu verstehen als der Grenzwert der Folge ihrer Par-
tialsummen. Wir zeigen, daß diese Grenzwerte existieren. Bezeichnen wir dazu
für eine quadratische Matrix A ∈ Mat(n; R) mit |A| das Maximum der Abso-
lutbeträge ihrer Einträge, so gilt offensichtlich |AB| ≤ n|A||B| für jede weitere
Matrix B ∈ Mat(n; R). Daraus folgt |Ak | ≤ (n|A|)k und dann zeigt die Kon-
vergenz der Exponentialreihe zu n|A| die absolute Konvergenz aller Reihen von
Matrixeinträgen in der Exponentialreihe zu A.
Lemma 7.2.4 (Funktionalgleichung für das Exponential von Matrizen). Die
Exponentialabbildung wirft die Null auf die Identität, in Formeln exp(0) = I. Sind
A, B zwei kommutierende quadratische Matrizen AB = BA, so gilt
exp(A + B) = (exp A)(exp B)
7.2.5. Insbesondere folgt exp(−A) = (exp A)−1 . Die Exponentialabbildung ist
mithin eine Abbildung von der Menge aller quadratischen Matrizen in die Menge
aller invertierbaren quadratischen Matrizen
exp : Mat(n; R) → GL(n; R)
Beweis. Aus 7.2.3 wissen wir für A ∈ Mat(n; R) um die absolute Konvergenz
∞
X 1 k
(exp A)pq = (A )pq
k=0
k!
der Exponentialreihe in jedem Matrixeintrag. Aus unseren Erkenntnissen über
Umordnung und Produkt absolut konvergenter Reihen folgt dann
Pn
(exp A)(exp B) pr = q=1 (exp A)pq (exp B)qr
Pn P 1 i j
= q=1 (i,j)∈N×N i!j! (A )pq (B )qr
1 i j
P
= (i,j)∈N×N i!j! (A B )pr
P∞ 1 k
= k=0 k! (A + B) pr
= exp(A + B) pr
k!
Die Annahme AB = BA brauchen wir, um (A + B)k = i+j=k i!j! Ai B j ver-
P
wenden zu dürfen.
Satz 7.2.6 (Erste lineare Differentialgleichungen). Ist A ∈ Mat(n; R) eine
quadratische Matrix und c ∈ Rn ein Spaltenvektor, so gibt es genau eine diffe-
renzierbare Abbildung γ : R → Rn mit Anfangswert γ(0) = c derart, daß gilt
γ 0 (t) = Aγ(t) für alle t ∈ R, und diese Abbildung wird gegeben durch die Vor-
schrift
γ(t) = exp(tA)c
235
7.2.7. Es ist durchaus möglich, mithilfe dieses Satzes auch ganz konkrete Dif-
ferentialgleichungen ganz konkret zu lösen. Wir gehen darauf in den weiteren
Abschnitten näher ein.
Beweis. Wir behaupten zunächst, daß die Abbildung g : R → Mat(n; R), t 7→
exp(tA) differenzierbar ist mit der Ableitung g 0 (t) = A exp(tA). In der Tat wissen
wir nach 6.1.16, daß man Potenzreihen gliedweise differenzieren darf, und unsere
Formel ergibt sich, wenn wir diese Erkenntnis anwenden auf alle Einträge unserer
Matrix. Nach der matrixwertigen Produktregel 7.1.18 ist nun auch die Abbildung
γ : R → Rn , t 7→ exp(tA)c differenzierbar mit Ableitung γ 0 (t) = A exp(tA)c =
Aγ(t) und die Bedingung γ(0) = c ist offensichtlich. Unsere Funktion ist damit
eine Lösung der Differentialgleichung mit dem vorgegebenen Anfangswert. Ist
umgekehrt γ(t) eine beliebige Lösung unserer Differentialgleichung γ 0 = Aγ, so
berechnen wir die Ableitung der Funktion t 7→ h(t) = exp(−tA)γ(t) mithilfe der
matrixwertigen Produktregel 7.1.18 und erhalten
Die Funktion h(t) = exp(−tA)γ(t) ist also konstant mit Wert γ(0) und mit der
matrixwertigen Funktionalgleichung 7.2.4 folgt γ(t) = exp(tA)γ(0).
Beweis. Der Beweis ist im wesentlichen derselbe wie der Beweis von 7.2.6.
7.2.9. Ist A ∈ Mat(n; R) eine quadratische Matrix und I ⊂ R ein mehrpunktiges
Intervall, so bildet die Menge aller differenzierbaren Abbildungen γ : I → Rn mit
γ 0 (t) = Aγ(t) für alle t ∈ I einen Untervektorraum L im Vektorraum Ens(I, Rn )
aller Abbildungen I → Rn , den Lösungsraum unserer Differentialgleichung, und
das Auswerten an einer beliebigen Stelle t0 ∈ I liefert einen Vektorraumisomor-
∼
phismus L → Rn , γ 7→ γ(t0 ), den Anfangswertisomorphismus. All das folgt
unmittelbar aus dem vorhergehenden Satz 7.2.8.
Übungen
Übung 7.2.10. Gegeben eine Diagonalmatrix A = diag(a1 , . . . , an ) haben wir
exp(A) = diag(ea1 , . . . , ean ). Analoges gilt für blockdiagonale Matrizen.
236
7.3 Gedämpfte Schwingungen
7.3.1. Wir interessieren uns für die Bewegung eines Massepunktes, der an einer
Feder aufgehängt ist und dessen Bewegung durch eine zur Geschwindigkeit pro-
portionale Reibung gedämpft wird. Mißt die Funktion x : R → R, t 7→ x(t) seine
Auslenkung von der Gleichgewichtslage zum Zeitpunkt t, so muß unsere Funk-
tion aus physikalischen Gründen eine Differentialgleichung zweiten Grades der
Gestalt
x0 = −ax0 − bx
erfüllen, wobei die Konstanten a und b die Stärke der Feder und der Dämpfung
ausdrücken und in physikalisch relevanten Fällen nichtnegativ sind. Wir lösen die-
se Differentialgleichung hier erst einmal ad hoc und erheben danach in 7.4.2 die-
sen Zugang zur Methode.
Lemma 7.3.2 (Lösung einiger Schwingungsgleichungen). Seien reelle Zahlen
a, b ∈ R gegeben.
1. Die Menge aller zweimal differenzierbaren Funktionen x : R → R mit
x00 +ax0 +bx = 0 bildet einen Untervektorraum des Raums Ens(R, R) aller
Abbildungen R → R, den Lösungsraum L unserer Differentialgleichung;
∼
2. Die Abbildung x 7→ (x(0), x0 (0)) liefert einen Isomorphismus L → R2
dieses Lösungsraums mit dem R2 , den Anfangswertisomorphismus;
Teil 2 folgt damit aus 7.2.9. Für Teil 3 müssen wir folglich nur prüfen, daß die
beiden angegebenen Funktionen in der Tat linear unabhängige Lösungen sind.
Das kann dem Leser überlassen bleiben.
237
Ergänzung 7.3.4 (Lösung mithilfe des Exponentials von Matrizen). Statt beim
Beweis von Teil 3 des vorhergehenden Satzes mögliche Lösungen einfach zu er-
raten, hätten wir uns auch daran erinnern können, daß ja nach 7.2.8 jede Lösung
von der Form
x(t) = γ1 (t) = pr1 (exp(tA)c)
sein muß für c = (x(0), x0 (0)). Jetzt brauchen wir weitergehende Kenntnisse in
linearer Algebra. Das charakteristische Polynom unserer Matrix A ergibt sich zu
X 2 + aX + b. Hat es zwei verschiedene reelle Nullstellen λ, µ und bilden wir eine
Matrix P mit Eigenvektoren zu λ und µ als Spalten, so gilt A = P diag(λ, µ)P −1
und exp(tA) = P diag(eλt , eµt )P −1 und wir erkennen auf Anhieb, daß jede Lösung
eine Linearkombination der Gestalt x(t) = α eλt +β eµt sein muß. Im Fall einer
doppelten reellen Nullstelle finden wir ähnlich ein P mit
λ 1
A=P P −1
0 λ
und die Funktionalgleichung für das Exponential von Matrizen 7.2.4 liefert
u u
u t u 0 0 t e 0 1 t e t eu
exp = exp exp = =
0 u 0 u 0 0 0 eu 0 1 0 eu
Die allgemeine Lösung ergibt sich so als eine Linearkombination der Gestalt
α eλt +βt eλt .
7.3.5. Im Fall der gedämpften Schwingung hat unser Polynom X 2 + aX + b die
beiden Nullstellen r
a a2
− ± −b
2 4
Bei hinreichend großer Dämpfung a2 /4 ≥ b erhalten wir reelle nichtpositive
Lösungen und unser Massepunkt kehrt mit höchstens einmaligem Überschwingen
zum Ruhezustand zurück. Im Fall kleiner Dämpfung a2 /4 < b hat unser Polynom
dahingegen keine reellen Nullstellenpmehr und stattdessen die beiden komplexen
Nullstellen ± i ω − a/2 mit ω = b − a2 /4 > 0. Um hier weiterzukommen
verallgemeinern wir zunächst einmal alles bisher Gesagte ins Komplexe.
238
2. Die Abbildung x 7→ (x(0), x0 (0)) liefert einen Vektorraumisomorphismus
∼
L → C2 , den Anfangswertisomorphismus;
und zeigt, daß g : R → Mat(n; C), g(t) = exp(tA) differenzierbar ist mit der
Ableitung g 0 (t) = A exp(tA). Dann zeigt man die Produktregel für Abbildungen
der Zahlengerade in Räume komplexer Matrizen und folgert, daß die Abbildung
γ(t) = exp(tA)c eine differenzierbare Abbildung γ : R → Cn ist mit Anfangs-
wert γ(0) = c und
γ 0 (t) = Aγ(t)
für alle t ∈ R. Schließlich prüft man wieder mit der matrixwertigen Produktregel,
daß für jede Lösung γ dieser Differentialgleichung die Abbildung exp(−tA)γ(t)
die Ableitung Null hat und folglich konstant ist. Daraus folgt der Anfangswertiso-
morphismus und die Erkenntnis, daß die Lösungsmenge der Differentialgleichung
γ 0 (t) = Aγ(t) ein n-dimensionaler komplexer Untervektorraum des Abbildungs-
raums Ens(R, Cn ) ist. Indem wir von unserer Differentialgleichung zweiter Ord-
nun zu einem System von Differentialgleichungen erster Ordnung übergehen, er-
geben sich die beiden ersten Aussagen der Proposition. Durch explizites Rechnen
folgt dann leicht der dritte Teil.
7.3.7 (Beziehung zwischen reellen und komplexen Lösungen). Sind in der Si-
tuation aus 7.3.6 die Koeffizienten a, b beide reell, so bilden die reellwertigen
Lösungen unseres Systems nach 7.3.2 einen zweidimensionalen reellen Unter-
vektorraum LR ⊂ Ens(R, R). Seine komplexwertigen Lösungen bilden dahin-
gegen nach 7.3.6 einen zweidimensionalen komplexen Untervektorraum LC ⊂
Ens(R, C), der stabil ist unter dem Übergang zu den komplex konjugierten Funk-
tionen, in Formeln
f ∈ LC ⇔ f¯ ∈ LC
Per definitionem gilt weiter LR = LC ∩ Ens(R, R). Haben wir nun Erzeuger
f1 , . . . , fr für den C-Vektorraum der komplexwertigen Lösungen gefunden, so
239
erzeugen deren Realteile und Imaginärteile den R-Vektorraum der reellwertigen
Lösungen. In der Tat schreibt sich jede Lösung f als f = c1 f1 + . . . + cr fr mit
cν ∈ C, und ist f reellwertig und schreiben wir cν = aν + ibν mit aν , bν ∈ R und
nehmen auf beiden Seiten den Realteil, so ergibt sich für f die Darstellung
den Raum der reellwertigen Lösungen aufspannen. Die Größe ω heißt in diesem
Zusammenhang auch die Winkelgeschwindigkeit. Die Additionstheoreme zei-
gen, daß sich jede reelle Linearkombination α sin(ωt) + β cos(ωt) der Funktionen
cos(ωt) und sin(ωt) als Sinuswelle mit Amplitude k und Phase φ in der Form
Übungen
Übung 7.3.10. Ist A ∈ Mat(n; R) eine reelle Matrix und γ : R → Cn eine
komplexe Lösung der Differentialgleichung γ 0 (t) = Aγ(t), so sind ihr koordina-
tenweise gebildeter Real- und Imaginärteil Re γ und Im γ reelle Lösungen. Er-
zeugt eine Menge Cn -wertiger Funktionen den C-Vektorraum der Cn -wertigen
Lösungen unserer Differentialgleichung, so erzeugen ihre Real- und Imaginärtei-
le zusammen den R-Vektorraum der Rn -wertigen Lösungen.
240
7.4 Differentialgleichungen höherer Ordnung
7.4.1. Die Erfahrungen, die wir bei der Behandlung gedämpfter Schwingungen
gemacht haben, fassen wir nun noch allgemeiner.
2. Die Abbildung f 7→ (f (0), f 0 (0), . . . , f (n−1) (0)) ist ein Isomorphismus die-
ses Lösungsraums mit dem Cn , der Anfangswertisomorphismus;
Ergänzung 7.4.3. Der Satz bleibt gültig, wenn wir darin R durch ein beliebiges
mehrpunktiges Intervall I ⊂ R ersetzen.
Beweis. Teil 1 ist offensichtlich. Um die in Teil 2 behauptete Existenz und Ein-
deutigkeit zu zeigen beachten wir zunächst, daß unsere Überlegungen aus 7.2.6
ohne Änderungen auch im Komplexen gültig sind. Für eine quadratische Ma-
trix A ∈ Mat(n; C) mit komplexen Einträgen haben also die differenzierbaren
Funktionen g : R → Cn , die die Differentialgleichung g 0 = Ag lösen, die Form
g(t) = (exp tA)g(0) wo wir den Anfangswert g(0) ∈ Cn frei wählen dürfen. Ins-
besondere definiert die Abbildung g 7→ g(0) einen Isomorphismus vom Lösungs-
raum der Differentialgleichung g 0 = Ag mit dem Cn . Jetzt beachten wir, daß die
Vorschrift f 7→ g = (f, f 0 , f 00 , . . . , f (n−1) )> eine Bijektion induziert zwischen
der Menge aller n-mal differenzierbaren Funktionen f : R → C, die die Dif-
ferentialgleichung aus dem Satz erfüllen, und der Menge aller differenzierbaren
Funktionen g : R → Cn , die das System von Differentialgleichungen
g00 = g1
g10 = g2
..
.
0
gn−1 = an−1 gn−1 + . . . a1 g1 + a0 g0
lösen, wo wir etwas ungewöhnlich g = (g0 , . . . , gn−1 ) indiziert haben der besse-
ren Übersichtlichkeit halber. Damit folgt Teil 2 aus 7.2.6.
3. Motiviert durch unsere Erkenntnisse bei der Lösung von 7.3.6 beginnen wir
241
mit dem Ansatz f (t) = eλt für λ ∈ C. Mögliche λ sind dann offensichtlich ge-
nau die Nullstellen des Polynoms X n + an−1 X n−1 + . . . + a1 X + a0 . Ist λ eine
Nullstelle der Vielfachheit r, so sind sogar, wieder in Verallgemeinerung unserer
Erkenntnisse bei der Lösung von 7.3.6, auch teλt , . . . , tr−1 eλt noch Lösungen un-
serer Gleichung. Um das einzusehen, betrachten wir den Vektorraum C ∞ (R) aller
beliebig oft differenzierbaren Funktionen R → C und fassen das Ableiten auf als
eine lineare Abbildung
D : C ∞ (R) → C ∞ (R)
Zerfällt unser Polynom in Linearfaktoren
und die Behauptung folgt per Induktion. Um zu zeigen, daß die tj etλi für 0 ≤ j <
ni eine Basis des Lösungsraums bilden, reicht es deren lineare Unabhängigkeit
nachzuweisen. Beherrscht man die zugehörige lineare Algebra, so erkennt man
leicht, daß die tm eλt jeweils zum Hauptraum Hau(D; λ) gehören und muß we-
gen [LA2] 3.2.7 nur noch die lineare Unabhängigkeit der tm eλt für festes λ und
variables m zeigen, die hinwiederum sofort aus der linearen Unabhängigkeit der
Funktionen tm folgt. Man vergleiche hierzu auch [LA2] 3.2.9.
Beherrscht man die zugehörige lineare Algebra noch Pnicht, so muß man mehr ar-
beiten. Man setzt dann etwa eine Linearkombination cji tj eλi t = 0 an und muß
zeigen, daß alle cji verschwinden. Sonst könnten wir aber nach eventueller Um-
nummerierung der Nullstellen ein k finden mit ck1 6= 0 aber cj1 = 0 für j > k.
Wenden wir dann auf unsere Summe den Differentialoperator
(D − λ1 )k (D − λ2 )N . . . (D − λr )N
Übungen
Ergänzende Übung 7.4.4. Man bestimme eine Basis des komplexen sowie des
reellen Lösungsraums der Differentialgleichung f 000 = f .
242
7.5 Gekoppelte Schwingungen*
7.5.1. In diesem Abschnitt wird mehr lineare Algebra benötigt, als ich im derzei-
tigen Studienplan voraussetzen kann.
Beispiel 7.5.2. An gegenüberliegenden Wänden eines Zimmers ist jeweils ein
Wägelchen mit einer Feder befestigt und die beiden Wägelchen sind auch un-
tereinander durch eine Feder verbunden. Bezeichnen x(t) beziehungsweise y(t)
die Position des ersten beziehungsweise zweiten Wägelchens auf einer Skala, auf
der x = y = 0 den Gleichgewichtszustand bedeuten und größere x beziehungs-
weise y einen größeren Abstand eines Wägelchens von „seiner“ Wand, so genügt
unser System einer Differentialgleichung
für Konstanten a, b, c, d > 0, in die die Stärke der Federn und die Massen der
Wägelchen eingehen. Erklären wir v : R → R2 , t 7→ v(t) = (x(t), y(t)) und
betrachten die Matrix
−(a + b) −b
A=
−d −(c + d)
v 00 (t) = Av(t)
Der Leser mag als Übung zeigen, daß der Lösungsraum vierdimensional sein muß.
Unsere Matrix A hat, wie man dem charakteristischen Polynom ansieht, negative
reelle Eigenwerte λ1 , λ2 . Also hat bereits der R2 eine Basis v1 , v2 aus Eigenvek-
toren von A. Dann sind die vier Funktionen
p
t 7→ exp((± λi )t)vi mit i = 1, 2
243
allen Zeiten in derselben beziehungsweise in entgegengesetzten Richtungen fah-
ren. Die Bewegung der einzelnen Wägelchen x(t) = x+ (t) und y(t) = x− (t) wird
dann beschrieben durch
mit komplexen ci . Nimmt man hier zum Beispiel c1 = c2 = 1, so ergibt sich die
Lösung
x(t) = 2 cos((ω1 − ω2 )t/2) cos((ω1 + ω2 )t/2)
y(t) = 2 sin((ω1 − ω2 )t/2) sin((ω1 + ω2 )t/2)
Ist die verbindende Feder schwach im Verhältnis zu den Federn gegen die Wände,
in Formeln a b, so liegen die beiden Eigenwerte λ1 , λ2 und damit auch die Win-
kelgeschwindigkeiten ω1 , ω2 verhältnismäßig nah beieinander. Im Versuch kann
man in diesem Fall schön sehen, wie die beiden Wägelchen mit der Winkelge-
schwindigkeit (ω1 − ω2 )/2 ihre Energie untereinander austauschen.
7.5.3. Im Übrigen ist es auch a priori klar, daß in der symmetrischen Situation
die zweielementige Symmetriegruppe unserer Gleichung, die der Vertauschung
der beiden Wägelchen entspricht, auf dem Lösungsraum operieren muß, daß wir
also uns schon von Anfang an hätten darauf beschränken dürfen, nur die symme-
trischen und die antisymmetrischen Lösungen zu bestimmen und die allgemeine
Lösung als Linearkombination solcher speziellen Lösungen zu erhalten.
lösen, so rät einem die Methode der Variation der Konstanten zum Ansatz
γ(t) = exp(tA)g(t)
Man erkennt leicht, daß dieser Ansatz eine Lösung liefert, wenn g : R → Cn
differenzierbar ist und die Gleichung f (t) = exp(tA)g 0 (t) erfüllt, als da heißt für
Z t
g(t) = exp(−τ A)f (τ ) dτ
Hier ist g(t) als unbestimmes Integral nur bis auf eine additive Konstante aus dem
Cn wohldefiniert. Daß wir mit diesem Verfahren tatsächlich auch alle Lösungen
244
γ(t) unseres inhomogenen Systems von Differentialgleichungen erhalten ergibt
sich daraus, daß ja ganz offensichtlich die Differenz von je zwei Lösungen unserer
inhomogenen Gleichung eine Lösung der homogenen Gleichung γ 0 = Aγ(t) sein
muß. In der Sprache der linearen Algebra bilden die Lösungen der inhomogenen
Gleichung also einen affinen Teilraum des Raums aller Funktionen, dessen Raum
von Richtungsvektoren der Lösungsraum der homogenen Gleichung ist.
Beispiel 7.6.2 (Angeregte Schwingungen). Eine Lampe ist mit einer Feder an
einer vibrierenden Decke aufgehängt. Sei h(t) die Auslenkung der Decke zur Zeit
t und x(t) die Höhe der Lampe zur Zeit t, beide gemessen auf einer gegen den
Boden festen Skala, auf der h = x = 0 einen Zustand beschreibt, in dem sich die
Federkraft, die die Lampe zur Decke zieht, und die Schwerkraft der Lampe die
Waage halten. So genügt x(t) einer Differentialgleichung der Gestalt
Hierbei ist a positiv und hängt von der Masse der Lampe und der Federkonstante
ab. Wir schreiben das um zu einem System erster Ordnung
γ00 = γ1
γ10 = −aγ0 + ah
oder in Matrixschreibweise
0 0 1 0
γ = γ+
−a 0 ah
245
unseren Überlegungen 7.6.1 lautet die allgemeine Lösung dieser Differentialglei-
chung Z t
ϕ(t) = exp(tB)g(t) mit g(t) = exp(−τ B)f (τ ) dτ
Nehmen wir zum Beispiel an, unsere Decke vibriere mit h(t) = k sin(ωt) für
ω > 0, so ergibt sich die erste Komponente g1 (t) von g(t) zu
Rt i τω − i τω
g1 (t) = − 2kai η ei τ η e −e 2i
dτ
R t i τ (η+ω) R t i τ (η−ω)
= ka4η
e dτ − ka 4η
e dτ
ka
(
4 i η(η−ω)
ei t(η−ω) falls η 6= ω;
ka i t(η+ω)
= konst + 4 i η(η+ω) e − ka
4η
t falls η = ω.
Ähnlich berechnen wir g2 (t) und erkennen, daß in dem Fall, daß die Eigenfre-
quenz der Lampe nahe an der Frequenz der Decke ist, also für |η − ω| klein, die
Schwingung sehr groß werden kann und im Fall η = ω die Auslenkung even-
tuell sogar gegen Unendlich strebt. In der Physik spricht man in diesen Fällen
von Resonanz beziehungsweise von einer Resonanzkatastrophe. Seien nun die
Eigenschwingung unseres Systems t 7→ ei tη und die Anregung t 7→ h(t) oder
gleichbedeutend t 7→ f (t) periodisch mit derselben Periode. Nehmen wir der
Einfachkeit halber p = 2π an, so finden wir η ∈ Z, undR entwickeln wir f in
t
eine „Fourierreihe“, so zeigt unsere obige Formel g(t) = exp(−τ B)f (τ ) dτ,
± i tη
daß nur die Summanden c±η e für die Resonanz verantwortlich sind in dem
Sinne, daß alle anderen Summanden der Fourierreihe nur periodische Beiträge
zu g(t) liefern. Später in [AN3] 3.1.2 folgende werden Sie lernen, daß g1 (t) im
allgemeinen bis auf eine Konstante auch interpretiert werden kann als der „Wert
bei −η der Fouriertransformierten des Produkts von f1 mit der charakteristischen
Funktion des Intervalls [0, t]“.
246
8 Danksagung
Dieser Text hat sich über lange Jahre aus meiner Auseinandersetzung mit der
Lehrbuchliteratur im Rahmen meiner Vorlesungstätigkeit entwickelt. Besonders
prägend waren die Einflüsse von Forster [For92], Königsberger [Kön97], Lang
[Lan68], Rudin [Rud76], Bröcker [Brö95], Courant [Cou71] und Dieudonné [Die03].
Für Korrekturen und Verbesserungen danke ich Christina Pflanz, Olaf Schnürer,
...
247
9 Tagebuch WS 22/23
Es handelte sich um eine vierstündige Vorlesung Analysis 1, also 4×45 Minuten
Vorlesung, mit 2 Stunden Übungen.
18.10 Vollständige Induktion und bimonische Formel 1.1.1. Mengen 1.2. Leere
Menge noch nicht eingeführt.
8.11 Die reellen Zahlen 2.4, Konstruktion und Eindeutigkeit. Noch nicht: Ratio-
nale und reelle Zahlen im Vergleich 2.5.
9.11 Kurze Diskussion der Eindeutigkeit von R. Rationale und reelle Zahlen im
Vergleich 2.5. Intervalle und Umgebungen 3.2. Beginn der Diskussion der
Stetigkeit 3.1. Stetigkeit der Addition bisher nur graphisch.
15.11 Stetigkeit der Addition nochmal formal. Konstante Funktionen sind stetig,
Einbettungen sind stetig. Stetig meint stetig bei jedem Punkt. Stetigkeit von
Multiplikation, Verknüpfung. Komponentenweise Stetigkeit. Zwischendrin
Anschauung für Abbildungen Rm → Rn . Folgerungen. Im wesentlichen
Abschnitt 3.1. Epsilon-Delta-Charakterisierung der Stetigkeit.
248
22.11 Grenzwerte 3.5. Häufungspunkte, Eindeutigkeit sttiger Fortsetzung, Defini-
tion des Grenzwerts, Charakterisierung für Folgenkonvergenz, auch ε-N -
Kriterium. Lokalität, Vertauschen mit Anwenden stetiger Funktionen, spe-
ziell auch für Folgen. Konvergenz von Teilfolgen.
29.11 Konvergenz von Reihen 4.1. Absolute Konvergenz. Cauchy-Folgen und de-
ren Konvergenz. Majorantenkriterium, Quotientenkriterium, Konvergenz der
Exponentialreihe. Umordnungssatz.
30.11 Wachstum und Zerfall 4.2. Logarithmus und allgemeine Potenzen 4.3.
20.12 Ableitung 5.3. Ableitungsregeln 5.4. Lemma 5.4.15 weggelassen, das die
Existenz einer beliebig differenzierbaren zeigt, die Null ist für x ≤ 0 und
positiv für x > 0. Ableitung des Arcussinus besprochen, Ableitung des
Arcustangens weggelassen.
10.1 Hospital 5.6.1. Hauptsatz der Differential- und Integralrechnung 5.7.1. Sub-
stitutionsregel, erste Beispiele.
249
18.1 Gleichmäßige Konvergenz bei Potenzreihen fertig diskutiert. Gliedweise
Ableitung und Integration von Potenzreihen 6.1. Binomische Reihe. Bei-
spiele. Noch nicht Beispiel mit Berechnung höherer Ableitungen.
24.1 Beispiel mit Berechnung höherer Ableitungen. Taylorreihe 6.2 und ihre
Restglieder.
250
Literatur
[AL] Skriptum Algebra und Zahlentheorie. Wolfgang Soergel.
[Ste89] Ian Steward. Galois Theory. Chapman and Hall, second edition, 1989.
251
Indexvorwort
Hier werden die Konventionen zum Index erläutert. Kursive Einträge bedeuten,
daß ich die fragliche Terminologie oder Notation in der Literatur gefunden habe,
sie aber selbst nicht verwende. Bei den Symbolen habe ich versucht, sie am An-
fang des Index mehr oder weniger sinnvoll gruppiert aufzulisten. Wenn sie von
ihrer Gestalt her einem Buchstaben ähneln, wie etwa das ∪ dem Buchstaben u
oder das ⊂ dem c, so liste ich sie zusätzlich auch noch unter diesem Buchstaben
auf. Griechische Buchstaben führe ich unter den ihnen am ehesten entsprechenden
deutschen Buchstaben auf, etwa ζ unter z und ω unter o.
252
Index
f : X ⊃ D → Y , 68 von Abbildungen, 27
0 neutrales Element für +, 33 − Differenz von Mengen, 18
0M im Fall von (M, +), 33 ak Potenz, 10
natürliche Zahl, 33 ax allgemeine Potenz, 117
1 neutrales Element für ·, 33 ≥,
Q >, ≤, < bei Ordnungsrelation, 45
1M im Fall von (M, ·), 33 Produkt
natürliche Zahl, 33 P von Zahlen, 8
| Notation bei Teilmengen, 16 Summe
¬ Verneinung, 37 von Zahlen, 7
Beweisende, 5 ∩ Schnitt, 18
]√Kardinalität, 15 ⊂ Teilmenge, 19
x Wurzel, 80 ∪ Vereinigung, 18
n! Fakultät, 8 ×
f 0 Ableitung, 157 kartesisches Produkt, 18
∅ leere Menge, 14 (x|y) Notation für Paare, 19
∈ Element von, 14 G(x)|ba := G(b) − G(a), 180
6∈ nicht Element von, 14 f |X Einschränkung auf X, 27
X\Y Differenz von Mengen, 18 f |X Einschränkung auf X, 27
X\p Komplement des Punktes p, 83
,→ Injektion, 26 Abbildung, 24
7→ wird abgebildet auf, 25 identische, 25
→ Abbildung, 24 inverse, 28
∼
→ Bijektion, 26 Umkehrabbildung, 28
Surjektion, 26 Abel’scher Grenzwertsatz, 220
{ } Mengenklammern, 14 abelsch
| | Absolutbetrag, 47 Gruppe, 34
| | Kardinalität, 15 Verknüpfung, 33
(x|y) Ableitung
n
Notation für Paare, 19 n-te Ableitung, 207
k
Binomialkoeffizient, 9
f 0 Ableitung, 157 allgemeiner Potenzen, 163
X 2 = X × X, 18 als Funktion, 161
z̄ komplexe Konjugation, 43 bei fester Stelle, 157
f −1 Kehrwertfunktion, 78 Exponentialfunktion, 162
f −1 Umkehrabbildung, 28 linksseitige, rechtsseitige, 160
= Gleichheitszeichen, 14 Logarithmus, 163
= : wird definiert als, 7 vektorwertige, 222
:= ist definiert durch, 7 von Brüchen, reell, 162
◦ Verknüpfung von Umkehrfunktion
253
reell, 163 beschränkt
absolut konvergente Reihe, 104 Menge reeller Zahlen, 95
Absolutbetrag, 47 bestimmte Divergenz, 88
abzählbar, 61 Betrag, 47
abzählbar unendlich, 61 Bijektion, 26
Additionsformeln bijektiv
für sin und cos, 134 Abbildung, 26
äquidistante Unterteilung, 151 Bild, 24
algebraisch binärer Logarithmus, 119
reelle Zahl, 81 Binom, 72
allgemeine Potenzen, 117 Binomialkoeffizienten, 9
alternierende harmonische Reihe, 104 binomische Formel, 10
Amplitude, 240 Binomische Reihe, 209
analytisch Bogenlänge, 222
auf R, 211 parametrisiert nach, 232
Anfangswertisomorphismus, 236, 241 Bolzano-Weierstraß, 97
bei reeller Schwingungsgleichung, Brechungsgesetz, 167
237 Bruchzahlen, 14
bei Schwingungsgleichung, 239
angeordnet Cantor’sches Diagonalverfahren, 61
Ring, 46 card, 15
Anordnung, 45 Catalan-Zahlen
antisymmetrisch Herleitung der Formel, 218
Relation, 45 Cauchy-Folge, 97
Approximationspolynom, 212 continue, 68
arccot Arcuscotangens, 135 continuous, 68
archimedisch cos Cosinus
angeordnet, 57 komplexer, 139
arctan Arcustangens, 135 Cosecans, 134
Arcuscosinus, 134 Cosecans hyperbolicus, 191
Arcuscotangens, 135 cosh Cosinus hyperbolicus, 191
Arcussinus, 135 Cosinus, 131
Arcustangens, 135 Cosinus hyperbolicus, 191
Area Cosinus hyperbolicus, 191 Cotangens, 135
Area Sinus hyperbolicus, 191 de Morgan’sche Regeln, 20
arithmetisches Mittel, 98 Dedekind’scher Schnitt, 54
assoziativ, 31 Definition, 7
Auswerten, 24 Definitionsbereich, 25
Bel, 121 Dezibel, 121
Bernoulli-Ungleichung, 49 Differenz
254
von Mengen, 18 Fakultät, 8
differenzierbar Familie, 86
in einer Veränderlichen, 157 fast alle
reell-komplex, 199 Menge, 88
vektorwertige Funktion, 222 Folge, 86
disjunkt, 19 geometrische, 102
Distributivgesetz Fresnel’sches Prinzip, 167
bei Ring, 38 Fundamentalsatz der Algebra, 145
Dreiecksungleichung Funktion, 64
für Absolutbetrag eines angeord- gebrochenrationale, 77
neten Körpers, 48 rationale, 77
für komplexen Absolutbetrag, 125 Umkehrfunktion, 28
Durchschnitt Funktionalgleichung
zweier Mengen, 18 des Logarithmus, 115
255
halboffen in Monoid, 34
Teilmenge von R, 157 Inversion, 126
Halbordnung, 45 invertierbar, 34
harmonische Reihe, 102 isolierter Punkt, 83
Hauptzweig des Logarithmus, 197 isoliertes lokales Maximum, 171
Hermite-Lindemann, 139 isoliertes lokales Minimum, 171
Hilbert’sche Probleme, 63
Nummer 1, 63 Jensen’sche Ungleichung
Nummer 8, 104 diskrete, 49
holomorph, 198 Kardinalität, 15
Hospital, Regeln von, 175 kartesisch
Hyperbel, 194 Produkt
id, 25 von zwei Mengen, 18
Identität, 25 Kegel
Imaginärteil im R3 , 194
bei komplexen Zahlen, 123 Kegelschnitt, 194
Induktion, vollständige, 5 Kettenlinie, 191
Induktionsannahme, 5 Kettenregel
Induktionsbasis, 5 höhere, 216
Induktionsschritt, 5 in einer Veränderlichen
Induktionsvoraussetzung, 5 reell, 161
inf, Infimum, 51 kleines o von xn , 216
Infimum, 51 kleinstes
Injektion, 26 Element, 49
injektiv Körper, 38
Abbildung, 26 kommutativ
Inklusion, 27 Verknüpfung, 33
Integral kompakt
stetige reelle Funktion Intervall in R̄, 67
über kompaktes Intervall, 149 Teilmenge von R̄n , 144
Integrallogarithmus, 182 Kompaktum, 144
Integration Komplement, 18
partielle, 186 Komplementmenge, 18
integrierbar komplexe Exponentialfunktion, 127
Riemann-integrierbar, 157 komplexe Konjugation, 43
Intervall, 66 komplexe Zahlen, 43
mehrpunktiges, 67 konjugierte komplexe Zahl, 125
Intervallschachtelungsprinzip, 98 konkave Funktion, 171
Intervallumgebung, 67 konstante Abbildung, 26
invers Kontinuumshypothese, 63
256
konvergent von Folge, 88
reelle Reihe, 101 von Funktion, 85
Konvergenz ln logarithmus naturalis, 117
gleichmäßige Lösungsraum
reeller Funktionen, 203 einer linearen Diferentialgleichung,
punktweise 241
reeller Funktionen, 203 einer Schwingungsgleichung, 237,
von Folgen 238
in R̄d , 86 lineare Differentialgleichung
von reellen Reihen, 101 konstante Koeffizienten, 236
Konvergenzradius log Logarithmus, 115
im Reellen, 202 logarithme népérien, 115
konvex Logarithmus
Funktion, 49, 74, 171 binärer, 119
in Rn , 225 Hauptzweig des komplexen, 197
Korrespondenz, 45 natürlicher, 115
Kreisgruppe, 126
Kring Mächtigkeit, 15
angeordneter, 46 Magma, 29
Kringanordnung, 46 Magmahommorphismus, 36
Kurvenintegral, 232 Majorante, 105
Majorantenkriterium, 105
L(γ) Länge eines Weges, 222 max, 46
Länge, 222 maximal
eines Weges, 222 Element, 49
Laufindex, 7 Maximum, 171
lb, 119 mehrpunktiges Intervall, 67
leer Menge, 13
Familie, 86 leere Menge, 14
Menge, 14 Potenzmenge, 16
Leibniz’sches Konvergenzkriterium, 107 Teilmenge, 15
Leibniz-Regel Mengenklammern, 14
für reelle Funktionen, 161 min, 31
lg = log10 , 117 min, 46
limn→∞ Grenzwert von Folge minimales
in R̄d , 88 Element, 49
limx%p linksseitiger Grenzwert, 93 Minimum, 171
limx&p rechtsseitiger Grenzwert, 93 Mittelwertsatz, 169
limx→p Grenzwert von Abbildung der Integralrechnung, 157
von Teilmengen von R̄n , 85 in mehreren Veränderlichen, 227
Limes verallgemeinerter, 177
257
Monoid, 33 angeordnetes, 18
additiv notiertes, 33 Parabel, 194
multiplikativ notiertes, 33 Partialsumme, 101
Monoidhommorphismus, 36 partiell
Monom, 72 Integration, 186
monoton, 74 Ordnung, 45
Multinomialkoeffizient, 29 Pascal’sches Dreieck, 11
Phase, 240
N natürliche Zahlen, 14 phytagoreische Zahlentripel, 189
N0 , 14 Poisson-Verteilung, 114
népérien, logarithme, 115 Polynomfunktion, 72
Nachschalten von Abbildung, 27 poset, 45
natürliche Zahlen, 14 positiv, 46
negativ, 46 Pot(X) Potenzmenge, 16
Negatives, 35 Potenzmenge, 16
neutrales Element, 33 Potenzreihe, 202
Newton-Verfahren, 100 prX
nichtnegativ, 46 Projektion, 26
nichtpositiv, 46 Produkt
Norm von Reihen, 112, 114
einer komplexen Zahl, 123 Produktregel
Null-Element, 33 für reelle Funktionen, 161
Nullfolge, 88 Projektion
Obersumme, 153 bei zwei Mengen, 26
offen Punkt, 13
in R, 165 Q rationale Zahlen, 14
in Rn , 225 Quaderumgebung
in der komplexen Zahlenebene, 198 in R̄n , 67
reelles Intervall, 67 Quotientenkriterium, 105
Ordnung, 45 Quotientenregel, 162
für Teilordnung, 45
lineare, 45 R reelle Zahlen, 57
partielle, 45 rad
totale, 45 Radian, 133
Ordnungsrelation, 45 rationale Zahlen, 14
Raum, 13
π Kreiszahl, 80 Realteil
P(X)
Q Potenzmenge, 16 bei komplexen Zahlen, 123
Produkt reell konvergent, 88
von Zahlen, 8 reelle Zahl, 57
Paar
258
reflexiv sin Sinus
Relation, 45 komplexer, 139
Regeln von de l’Hospital, 175 sinh Sinus hyperbolicus, 191
Reihenglieder, 101 Sinus, 131
Relation Sinus hyperbolicus, 191
auf einer Menge, 45 Skalarproduktnorm, 222
mehrstellige, 45 Stammfunktion, 180
zwischen zwei Mengen, 45 Steigung, 157
Resonanz, 246 stetig
Resonanzkatastrophe, 246 gleichmäßig
Restglied reelle Funktion, 146
Integraldarstellung, 214 stimmen überein bis zur Ordnung, 216
Lagrange’sche Form, 214 Substitutionsregel, 182
Riemann Summanden, 7
ζ-Funktion, 104 Summenregel, 161
Riemann’sche Vermutung, 104 summierbar
Riemann-integrierbar, 157 Familie reeller Zahlen, 106
Riemannsumme sup, Supremum, 51
für reelle Funktion, 151, 155 Supremum, 51
Ring, 38 Surjektion, 26
Ringhomomorphismus, 41 surjektiv
Rolle, 167 Abbildung, 26
Russell’sches Paradoxon, 23
Tangens, 135
1
RS Einheitskreis, 126 Tangens hyperbolicus, 191
PIntegral, 149 Tangente, 159, 212
P Reihe, 101 Tauber-Bedingung, 221
Summe Taylorentwicklung
von Zahlen, 7 in einer Veränderlichen, 212
Schmiegeparabel, 212 Taylorreihe
Schnitt in einer Veränderlichen, 208, 210
zweier Mengen, 18 Teilfolge, 90
Schranke Teilmenge, 15
größte untere, 51 echte, 15
kleinste obere, 51 Teilordnung, 45
obere, 51 Teleskopsumme, 101
untere, 51 Totalität
Schrankensatz, 225 für Relation, 45
Secans, 134 transitiv
Secans hyperbolicus, 191 Relation, 45
Sekante, 157 transzendent
259
reelle Zahl, 81 ganze, 14
Trigonometrie, 133 natürliche, 14
rationale, 14
überabzählbar, 61 reelle, 57
Umgebung Zwischenwertsatz, 77
eines Punktes von R̄n , 69
Umkehrfunktion, 28
Umordnungssatz, 105
unbestimmt divergent, 88
unendlicher Dezimalausdruck, 58
ungerade
Funktion, 188
Untersumme, 153
Unterteilung
von Intervall, 155
van-de-Ven-Diagramm, 19
Variation der Konstanten, 244
verallgemeinerter Mittelwertsatz, 177
Vereinigung, 18
Verknüpfung
auf einer Menge, 29
von Abbildungen, 27
Verknüpfungstafel, 30
vollständig
angeordneter Körper, 97
Vorschalten von Abbildung, 27
Wahrheitstafel, 31
Wert, 24
Wertebereich, 25
Winkelgeschwindigkeit, 240
Wurzel
n-te Wurzel, 78
Wurzelkriterium, 120
Z ganze Zahlen, 14
ζ-Funktion
Riemann’sche, 104
Zahl
260