BA-script SoSe 24
BA-script SoSe 24
Vorlesungsskript
Fachbereich Wirtschaftswissenschaften
Goethe-Universität Frankfurt
Sommersemester 2024
Gebrauchsanweisung: Alte und neue Prüfungsordnung (PO)
Zum Sommersemester 2022 trat eine neue Prüfungsordnung (PO) in Kraft, welche die alte PO von 2009
ablöste. Student(inn)en, die unter der alten PO ihr Studium aufgenommen haben, müssen es auch nach
der alten PO fortsetzen. Inwieweit betrit dieser Wechsel die Statistik im Orientierungsjahr (OSTA) ?
Und wie lösen wir als OSTA-Lehrkräfte die damit einhergehenden Herausforderungen?
Nach der alten PO ist OSTA mit 15 Kreditpunkten die umfangreichste und mit 3 Vorlesungen pro
Woche zeitaufwändigste Veranstaltung unseres gesamten Bachelorstudiums. Damit kommt zum Ausdruck,
dass die Kolleg(inn)en unseres Fachbereichs Kompetenz in empirischen Methoden als erforderlich für ein
erfolgreiches Studium der Wirtschaftswissenschaften halten. Gleichzeitig stöhnt mancher Student unter
der im ersten Semester damit einhergehenden Methodenlast. Daher wurde OSTA für die neue PO gekürzt,
auf 2 Vorlesungen pro Woche, für die es nur noch 10 Kreditpunkte gibt. In der Summe erhöhen sich
Aufwand und Kreditpunkte für empirische Methoden jedoch sogar leicht, denn nach der neuen PO ist
nach dem Orientierungsjahr eine Ökonometrieveranstaltung im Umfang von 6 Kreditpunkten Picht, was
nach der alten PO nicht der Fall ist. Infolge des unterschiedlichen Umfangs von OSTA nach neuer und
alter PO sind auch die damit verbundenen Klausuren am Ende des Semesters unterschiedlich.
3. Der umfangreiche Foliensatz zur Vorlesung darf in der Abschlussklausur nicht verwendet werden.
4. Über ein Dutzend Tutorien, die von Student(inn)en höherer Semester gehalten werden, nden zu
unterschiedlichen Terminen in kleinen Gruppen statt; davon sollte eines pro Woche besucht werden.
Eine Sammlung von Tutoriumsaufgaben wird bereitgestellt und in den Tutorien besprochen.
5. Zusätzlich werden in einer zentralen Übung von einer Mitarbeiterin oder von einem Mitarbeiter
weitere Beispiele und Aufgaben gerechnet und besprochen. Eine Sammlung von Übungsaufgaben
wird bereitgestellt
8. Das Lehrmaterial aus 2. bis 5. richtet sich auch an Student(inn)en nach der alten PO.
9. Darüber hinaus gibt es nur nach der alten PO klausurrelevantes Material, das im abschlieÿenden
Kapitel 14 versammelt ist. Am Ende jedes Abschnitts gibt es dort Übungsaufgaben. Dieser Sto und
diese Aufgaben aus Kapitel 14 werden in Videokonserven behandelt und auf OLAT bereitgestellt.
10. Die Klausur nach alter PO enthält zum einen die identischen Aufgaben aus der Klausur in 6.;
auÿerdem umfasst sie zusätzliche Aufgaben, auch zu dem Sto aus 9., und entsprechend ist die
Formelsammlung, es kann und soll nicht den regelmäÿigen Besuch der Vorlesung oder das Eigenstudium
Dieses Skript ist eng an folgendes Lehrbuch (Verlag: Springer Gabler) angelehnt:
Hassler, U., Statistik im Bachelor-Studium: Eine Einführung für Wirtschaftswissenschaftler.
Für Angehörige der Goethe-Universität ist dieses Buch elektronisch kostenfrei über die Unibibliothek
zugänglich (https://hds.hebis.de/ubm/Record/HEB42868078X).
Zum Sommersemester 2022 wurde die Ausbildung in empirischen Methoden in unserem Bachelorstudium
neu organisiert. Insbesondere wurde der Umfang und Inhalt der Statistik im Orientierungsjahr reduziert.
Daher wird in dieser Neuauage nicht mehr der komplette Sto aus dem genannten Buch behandelt;
siehe obenstehende Gebrauchsanweisung. Auch haben wir die Gelegenheit genutzt, einige Themen leicht
anders (und hoentlich besser) aufzubereiten und in einer Anordnung zu präsentieren, die von der im
Buch abweicht.
Fahrmeir, L., R. Künstler, I. Pigeot, G. Tutz, A. Caputo, S. Lang, Arbeitsbuch Statistik, Springer-Verlag.
Newbold, P., W.L. Carlson, B. Thorne, Statistics for Business and Economics, Pearson Prentice Hall.
Schlittgen, R., Einführung in die Statistik: Analyse und Modellierung von Daten, Oldenbourg Verlag.
Die Verwendung der neuesten Auage ist bei den meisten Statistikbüchern nicht unbedingt erforderlich.
Ältere Auagen sind oft billiger zu haben und besser in den Bibliotheken verfügbar.
Notation und Sprachgebrauch sind über die verschiedenen Bücher hinweg nicht einheitlich und unter-
scheiden sich daher zum Teil von der Konvention in diesem Skript. Auch lässt sich nicht immer vermeiden,
dass ein und dasselbe Symbol im Verlauf der Veranstaltung verschiedene Bedeutungen trägt.
Diese Unterlagen basieren auf Vorlesungsausarbeitungen, die an der Goethe-Universität Frankfurt über
zwanzig Jahre entwickelt und eingesetzt wurden. Für viele hilfreiche Hinweise schulde ich den (ehemaligen)
Kollegen Horst Entorf, Dieter Nautz, Marc Pohle, Sven Schreiber und Michael Weba Dank.
Inhaltsverzeichnis
1 Einführung 1
2.2 Häugkeitsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3 Maÿzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3.1 Lage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3.2 Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3.3 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.2 Verteilung(sfunktion)en . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.1 Lage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.3.2 Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.3.3 Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5 Verteilungsmodelle 14
5.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.3 Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6 Bivariate Zufallsvariablen 17
6.1 Diskreter Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.4 Kovarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
8 Parameterschätzung 22
8.1 Schätzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.3 Stichprobenvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
9 Kondenzintervalle (KI) 24
9.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
9.2.3 Approximativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
10 Statistische Tests 26
10.1 Prinzipien des Testens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
10.2.3 Approximativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
10.4 P -Werte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
10.7 Gütefunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
11.2 χ2 -Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
14.2 Konzentrationsmessung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
14.5 Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
14.10Varianzanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2
14.11.2 χ -Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
1
1 Einführung
Die Statistik hat einen schlechten Ruf: Glaube keiner Statistik, die du nicht selbst gefälscht hast. Tatsache
aber ist, dass Statistik in vielen Bereichen des täglichen Lebens sowie der Wirtschaft und Wissenschaft
• Covid-19,
• Mietspiegel,
• Wahlprognosen,
• Marktforschung,
• Wetter.
Dabei gibt es den Begri Statistik in einem doppelten Wortsinn. Er wird zum einen im Sinne der
tistik, zum anderen als Begri für Methoden zur Darstellung und Analyse von Daten. Diesen Methoden
ist die Lehrveranstaltung gewidmet. Die nächsten zwei Kapitel beginnen mit der beschreibenden oder
deskriptiven Statistik, also der Darstellung von Daten und Zusammenhängen. Danach legen wir in den
Kapiteln 4 bis 7 die theoretischen Grundlagen für die schlieÿende oder induktive Statistik; diese erlaubt
(statistische) Schlussfolgerungen auf der Basis von Zufallsstichproben (ab Kapitel 8). Die Unterschei-
dung von beschreibender und schlieÿender Statistik erscheint in der Praxis oft künstlich, weil es von der
• ordinal: Ordnungsstruktur,
Schlieÿlich können Merkmale eindimensional (oder univariat) oder mehrdimensional (oder multivariat)
sein.
2.2 Häugkeitsverteilungen
Summenzeichen: Die Summe von N Summanden si kürzen wir ab wie folgt:
N
X
si = s1 + s2 + · · · + sN .
i=1
Der Laundex muss nicht immer i heiÿen, und die Summation muss nicht immer mit 1 beginnen. Wir
schreiben auch
N
X
sj = sm + sm+1 + · · · + sN für m ≤ N.
j=m
N
X N
X N
X
c = c + c + ··· + c = N c und c si = c si .
i=1 i=1 i=1
Diskrete Merkmale: Diskretes Merkmal X mit den Ausprägungen a1 , . . . , a k . Normalerweise der Gröÿe
nach geordnet: a1 < · · · < ak . Die Ausprägungen werden beobachtet für einen dazu gehörigen Datensatz
Empirische Verteilungsfunktion: Wieviel % der Beobachtungen kleiner als eine reelle Zahl x oder höchstens
gleich sind:
Diese inhaltliche Denition gilt im diskreten und im stetigen Fall. Kann auch durch die Indikatorfunktion
ausgedrückt werden:
n
1X
Fb(x) = H(X ≤ x) = 1{xi ≤x} ,
n i=1
1 für xi ≤ x
wobei 1{xi ≤x} = .
0 sonst
0 für x < a1
Pj
Fb(x) = i=1 hi für aj ≤ x < aj+1 , j = 1, . . . , k − 1 .
1 für ak ≤ x
Absolute Häugkeit nj : Anzahl der Realisationen aus j -ter Klasse (a∗j−1 , a∗j ].
Relative Häugkeit: hj = nj /n.
Klassenbreiten: ∆j = a∗j − a∗j−1 .
Häugkeitsdichte fˆ:
hj /∆j für a∗j−1 < x ≤ a∗j , j = 1, . . . , k
fˆ(x) = . (2.2)
0 sonst
Empirische Verteilungsfunktion: Relative Häugkeit H(X ≤ x) von Beobachtungen kleiner oder gleich x:
Wie in (2.1) deniert.
Häugkeitstabelle:
2.3 Maÿzahlen
2.3.1 Lage
Arithmetisches Mittel x (Mittelwert oder Durchschnitt):
4 2 BESCHREIBUNG UNIVARIATER DATENSÄTZE
n
1X
x= xi . (2.3)
n i=1
Kann auch wie folgt berechnet, bzw. approximiert werden:
k
X
x= aj · hj (aus Häugkeitstabelle, diskret), (2.4)
j=1
k
X
x≈ aj · hj (aus Häugkeitstabelle, stetig, approximativ) , (2.5)
j=1
a∗j−1 + a∗j
wobei āj die Klassenmitte der j -ten Klasse ist: āj = .
2
Regeln:
Median oder 50%-Punkt, xb0.50 : halbiert den geordneten Datensatz x(1) , . . . , x(n) :
x( n+1 ) , n ungerade
x
b0.5 = 2 ,
1
2 x( n2 ) + x( n2 +1) , n gerade
oder (unter Verwendung des Symbols ⌊q⌋ für den ganzzahligen Anteil einer Zahl q)
n
x(⌊ n2 ⌋+1) , 2 ∈
/N
x
b0.5 = . (2.6)
1 n
2 x( n2 ) + x( n2 +1) , 2 ∈N
Auf diese Weise deniert man auch beliebige Prozentpunkte oder Quantile. Wir beginnen mit dem 25%-
Punkt ( unteres Quartil ) xb0.25 :
n
x(⌊ n4 ⌋+1) , 4 ∈
/N
x
b0.25 = .
1 n
2 x( n4 ) + x( n4 +1) , 4 ∈N
Die Berechnung von Quantilen ist nur bei stetigen Merkmalen oder bei diskreten Merkmalen mit einiger-
maÿen vielen Ausprägungen sinnvoll. Bei der Denition aus (2.7) gilt im Fall np ∈ N gerade Fb(b
xp ) = p,
was bedeutet: p · 100 % der Beobachtungen sind kleiner oder gleich dem p-Quantil x
bp . Für p = 0.75 erhält
man speziell den 75%-Punkt x
b0.75 oberes Quartil ).
(
2.3.2 Streuung
Mittlere quadratische Abweichung d2 : Maÿ für die Streuung der Daten:
n
1X
d2 = (xi − x)2 . (2.8)
n i=1
2.4 Zeitreihen und Wachstumsraten 5
k
X
d2 = (aj − x)2 · hj (aus Häugkeitstabelle, diskret), (2.9)
j=1
k
X
d2 ≈ (aj − x)2 · hj (aus Häugkeitstabelle, stetig, approximativ), (2.10)
j=1
Regeln:
• Verschiebungssatz: d2 = x2 − x2 ,
1
Pn
wobei x2 = n i=1 x2i für die Rohdaten und analog für die Berechnung aus Häugkeitstabellen.
Interquartilsabstand:
b0.75 − x
IQA = x b0.25 .
2.3.3 Boxplot
Die grundlegende Form des Boxplots basiert auf fünf Kennzahlen eines Datensatzes, dem Minimum x(1) ,
dem unteren Quartil x
b0.25 , dem Median x
b0.50 , dem oberen Quartil x
b0.75 und dem Maximum x(n) . Diese
Werte sind aus einem geordneten Datensatz ohne groÿe Rechnung leicht zu bestimmen:
x(1) x
b0.25 x
b0.50 x
b0.75 x(n)
Vom unteren bis zum oberen Quartil wird eine Schachtel (box) gezeichnet. Diese wird durch den Median
unterteilt. Die Länge der Schachtel entspricht natürlich dem IQA. Vom unteren Quartil bis zum Minimum
sowie vom oberen Quartil bis zum Maximum zeichnet man einen Strich und zieht dann einen Zaun,
der die Stichprobe begrenzt. Mitunter wird der Zaun nicht bei der kleinsten und gröÿten Beobachtung
gezogen, sondern bei der kleinsten/gröÿten Beobachtung, deren Abstand zum Quartil nicht das 1.5-Fache
des IQA überschreitet. Beobachtungen auÿerhalb des Zauns werden dann durch Kringel markiert. Durch
diese Maÿnahme werden extreme Werte als Ausreiÿer klassiziert.
xt , t = 1, 2, . . . , n.
Graphisch werden Zeitreihen üblicherweise dargestellt, indem man die Werte xt gegen die Zeit t abträgt.
6 2 BESCHREIBUNG UNIVARIATER DATENSÄTZE
∆xt = xt − xt−1 , t = 1, 2, . . . , n.
Diese Approximation funktioniert gut, solange die Wachstumsraten rt dem Betrage nach klein sind.
1 Wir folgen hier der in der Wirtschaftswissenschaft weitverbreiteten Konvention, den natürlichen Logarithmus zur Ba-
sis e mit log und nicht mit ln zu bezeichnen. Beachten Sie aber bei konkreten Berechnungen, dass auf den meisten
Taschenrechnern die Taste für den natürlichen Logarithmus mit ln beschriftet ist.
7
Y gemessen, was n Beobachtungspaare (x1 , y1 ), . . . , (xn , yn ) ergibt. Wir sprechen dann auch von einer
b1 , . . . , b ℓ mit:
absolute Randhäugkeit:
Pℓ
für X = ai : ni• = j=1 nij ,
Pk
für Y = bj : n•j = i=1 nij ,
relative Randhäugkeit:
Pℓ
hi• = H(X = ai ) = j=1 hij ,
Pk
h•j = H(Y = bj ) = i=1 hij .
keiten hat:
Damit folgt
nij ni•
= bei Unabhängigkeit,
n•j n
oder
ni• n•j
nij = bei Unabhängigkeit.
n
Die rechte Seite ist die Zahl, die man als absolute Häugkeit für das gemeinsame Auftreten von X = ai
und Y = bj bei Unabhängigkeit erwartet:
ni• n•j
n
eij = . (3.1)
n
Maÿ für die Stärke der Abhängigkeit (Abweichung von Unabhängigkeit):
k X ℓ
X (nij − neij )2
χ2 = . (3.2)
i=1 j=1
n
eij
Man kann zeigen, dass dieser χ2 -Koezient Werte zwischen 0 und n(m − 1) annehmen kann, wobei m
das Minimum aus den Anzahlen möglicher Ausprägungen k und ℓ ist: m = min{k, ℓ}. Daher normieren
wir:
χ2
C2 = ∈ [0, 1] ,
n (m − 1)
8 3 BESCHREIBUNG BIVARIATER DATENSÄTZE: ZUSAMMENHANGSANALYSEN
Regeln
Verschiebungssatz: 1
Pn
• dxy = xy − x · y mit xy = n i=1 xi · yi ,
Lineartransformation der Daten: da+bx,α+βy = b β dxy
• (Kovarianz von a + bxi und α + βyi ).
Korrelationskoezient: Maÿzahl für linearen Zusammenhang:
dxy dxy
ρbxy = q = . (3.4)
2 2
dx dy dx dy
• Normierung: |b
ρxy | ≤ 1.
Es ergeben sich:
mit
n n
1X 1X
dxy = (xi − x)(yi − y) = xy − x · y mit xy = xi · yi ,
n i=1 n i=1
wobei
dxy dx
ρbxy = = b̂ . (3.6)
dx · dy dy
Empirische Regressionsgerade:
yb = b
a + bb x . (3.7)
Bestimmtheitsmaÿ: Anteil der durch die Regression erklärten Streuung im Verhältnis zur Gesamtstreuung:
Pn Pn
2 i=1 (ŷi − ŷ)2 2
i=1 ûi
R = Pn 2
= 1 − Pn 2
,
i=1 (yi − y) i=1 (yi − y)
X nimmt Werte gröÿer als a und kleiner oder gleich b an: [a < X ≤ b].
Gegen- oder Komplementärereignis : Gegeben ein Ereignis A ist das Gegen- oder Komplementärereignis
Ac das Ereignis, dass A gerade nicht eintritt; A und Ac können nicht gleichzeitig eintreten, sind sich
ausschlieÿende Ereignisse.
Unmögliches Ereignis : z. B. das gemeinsame Auftreten von A und Ac , notiert auch mit dem Symbol der
leeren Menge : ∅ = A und Ac .
Sicheres Ereignis : z. B. X ∈ R, notiert auch mit dem Symbol Ω.
Vereinigung : A oder B , A tritt ein oder B oder beides; gebräuchliche Notation: A ∪ B .
Schnitt : A und B treten beide ein; gebräuchliche Notation: A ∩ B .
Dierenz : A tritt ein und B nicht; gebräuchliche Notation: A \ B (sprich: A ohne B ).
Wahrscheinlichkeit für das Eintreten von Ereignissen A: P(A) ∈ [0, 1].
Es seien A und B beliebige Ereignisse mit Elementen aus Ω, und ∅ sei ein unmögliches Ereignis. Dann
gilt:
c
b) P(A ) = 1 − P(A);
4.2 Verteilung(sfunktion)en
Verteilungsfunktion F der Zufallsvariablen X:
Diskrete Zufallsvariable nimmt k (abzählbar viele) Ausprägungen an: a1 < a2 < . . . < ak
Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen X :
P(X = aj ) = pj , x ∈ {a1 , a2 , . . .}
P(X = x) = .
0, sonst
2 Streng genommen sind Ereignisse Mengen, weshalb man für die oder- bzw. und-Verknüpfungen auch die gängigen
Symbole für Vereinigungs- bzw. Schnittmengen verwendet: P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
4.3 Theoretische Maÿzahlen 11
Verteilungsfunktion
X
F (x) = P(X ≤ x) = P(X = aj ). (4.2)
aj ≤x
Stetige Zufallsvariable kann alle Werte aus einem reellen Intervall annehmen.
(Wahrscheinlichkeits-)Dichte (oder Dichtefunktion) von X : Funktion f (x) mit f (x) ≥ 0, sodass:
Z a2
P(a1 < X ≤ a2 ) = f (x) dx.
a1
weil
Verteilungsfunktion:
Z x
F (x) = P(X ≤ x) = f (t) dt. (4.3)
−∞
Exkurs (Integralrechnung): Integral von f als Dierenz der Stammfunktion F an der Ober- bzw. Unter-
grenze bestimmen:
Z b
b
f (x) dx = [F (x)]a = F (b) − F (a).
a
xk+1
xk k+1 k ̸= −1
x−1 = 1
x log (x) x>0
1 cx
ecx ce c ̸= 0
Z ∞
E(X) = xf (x) dx (stetig), (4.5)
−∞
Regeln:
4.3.2 Streuung
Varianz Var(X) bzw. σx2 :
k
X
Var(X) = (aj − E(X))2 P(X = aj ) (diskret), (4.6)
j=1
Z ∞
Var(X) = (x − E(X))2 f (x) dx (stetig), (4.7)
−∞
Verschiebungssatz:
wobei
k
X
2
E(X )= a2j P(X = aj ) (diskret),
j=1
Z ∞
2
E(X )= x2 f (x) dx (stetig).
−∞
Weitere Regeln:
p
σx = Var(X).
[µ ± k · σ] = [µ − k · σ, µ + k · σ] , (4.9)
4.3.3 Quantile
Quantile oder Prozentpunkte xp bei stetigen Zufallsvariablen:
Z xp
F (xp ) = f (a) da = p, 0 < p < 1. (4.10)
−∞
Median: x0.5 .
Zentrales Schwankungsintervall zum Niveau 1 − α, 0 < α < 1: jeweils mit Wahrscheinlichkeit α/2 treten
kleinere Werte als die untere Intervallgrenze und Werte oberhalb der oberen Intervallgrenze auf:
ZSI1−α = xα/2 , x1−α/2 . (4.11)
4.3 Theoretische Maÿzahlen 13
deniert man Schiefe und Wölbung (kurz für Schiefekoezienten und Wölbungskoezienten):
E[(X − µ)3 ] E[(X − µ)4 ]
γ1 = , γ2 = . (4.13)
σ3 σ4
Beachte: Hinter µk verbergen sich Integrale, die nicht notwendig endlich sein müssen (man sagt dann: die
γ2 ≥ 1 .
n
1X
mk = (xi − x)k
n i=1
gegeben: Die theoretische Bildung von Erwartungswerten wird durch empirisches Mitteln ersetzt. Damit
m3
γ
b1 = , (4.14)
d3
m4
γ
b2 = . (4.15)
d4
14 5 VERTEILUNGSMODELLE
5 Verteilungsmodelle
5.1 Diskrete Verteilungen
a) Diskrete Gleichverteilung
X ∼ DG(k),
1
P(X = x) = mit x = 1, 2, . . . k,
k
k+1 k2 − 1
E(X) = und Var(X) = .
2 12
b) Bernoulli-Verteilung
X ∼ Be(p),
c) Binomialverteilung
Summe von n unabhängig, identisch verteilten Bernoullivariablen (Xi ∼ Be(p)):
n
X
X= Xi ∼ Bi(n, p),
i=1
n x
P(X = x) = p (1 − p)(n−x) , x = 0, 1, . . . , n,
x
E(X) = np und Var(X) = np(1 − p),
1 − 2p
γ1 = p .
np(1 − p)
Mit Binomialkoezienten
n n! n n
= für x = 1, . . . , n − 1 , und = = 1,
x (n − x)! x! 0 n
und Fakultät m! = m · (m − 1) · · · 2 · 1, m ∈ N, 0! = 1.
d) Poisson-Verteilung
X ∼ P o(λ), λ > 0,
λx
P(X = x) = e−λ , x = 0, 1, . . . ,
x!
E(X) =λ und Var(X) = λ,
1 1
γ1 = √ und γ2 = 3 + .
λ λ
Die Poisson-Verteilung geht aus der Binomialverteilung Bi(n, p) mit λ = np für n→∞ hervor.
5.2 Stetige Verteilungen 15
X ∼ SG(a, b),
1
a≤x≤b
f (x) = b−a ,
0 sonst
a+b (b − a)2
E(X) = und Var(X) = ,
2 12
0 x≤a
x−a
F (x) = a≤x≤b ,
b−a
1 x≥b
γ1 = 0 und γ2 = 1.8.
b) Exponentialverteilung
X ∼ Ex(λ), λ > 0,
λe−λx x ≥ 0
f (x) = ,
0 sonst
F (x) = 1 − e−λx , x ≥ 0,
1 1
E(X) = und Var(X) = ,
λ λ2
γ1 = 2 und γ2 = 9.
c) Pareto-Verteilung
X ∼ P a(θ; x0 ), θ > 0, x0 > 0,
θ
θx 0
x ≥ x0
xθ+1
f (x) = ,
0 sonst
x θ
0
F (x) = 1 − , x ≥ x0 ,
x
θx0
E(X) = für θ > 1,
θ−1
θx20
Var(X) = , θ > 2.
(θ − 1)2 (θ − 2)
d) Laplace-Verteilung
Nicht klausurrelevant.
e) Normalverteilung
X ∼ N (µ, σ 2 ), σ > 0,
2 !
1 1 x−µ
f (x) = √ exp − , x ∈ R,
2πσ 2 σ
5.3 Normalverteilung
Standardnormalverteilung mit µ = 0 und σ = 1, Z ∼ N (0, 1). Es gilt:
X −µ
X ∼ N (µ, σ 2 ) ⇒ Z= ∼ N (0, 1).
σ
Die Verteilungsfunktion von Z hat die Bezeichnung Φ, vgl. Tabelle A:
Prozentpunkte der Standardnormalverteilung zp , für die P(Z ≤ zp ) = Φ(zp ) = p sind in Tabelle B gelistet.
Wegen Symmetrie gilt
zp = −z1−p .
Für eine beliebige Normalverteilung, X ∼ N (µ, σ 2 ), erhält man die Quantile durch die Umkehrung der
Standardisierung:
p
xp = µ + zp · σ = E(X) + zp · Var(X). (5.2)
ZSI1−α = µ − z1−α/2 · σ; µ + z1−α/2 · σ = µ ± z1−α/2 · σ .
17
6 Bivariate Zufallsvariablen
6.1 Diskreter Fall
Zwei Zufallsvariablen X und Y mit (der Gröÿe nach sortierten Ausprägungen):
X ∈ {a1 , . . . , ak } , Y ∈ {b1 , . . . , bℓ } .
Gemeinsame Wahrscheinlichkeit :
Randwahrscheinlichkeiten :
ℓ
X ℓ
X
P(X = ai ) = P(X = ai und Y = bj ) = pij ,
j=1 j=1
k
X k
X
P(Y = bj ) = P(X = ai und Y = bj ) = pij .
i=1 i=1
Gemeinsame Verteilungsfunktion :
X X
Fxy (a, b) = P(X ≤ a und Y ≤ b) = P(X = ai und Y = bj ) .
ai ≤a bj ≤b
Randverteilungsfunktion :
ℓ
X X X
Fx (a) = P(X ≤ a) = P(X = ai und Y = bj ) = P(X = ai ) .
ai ≤a j=1 ai ≤a
nij /n hij
H(X = ai |Y = bj ) = =
n•j /n h•j
H(X = ai und Y = bj )
= .
H(Y = bj )
Bedingte Wahrscheinlichkeit eines Ereignisses A unter der Bedingung des Eintretens des Ereignisses B,
mit P(B) > 0:
P(A und B)
P(A |B) = , P(B) > 0. (6.1)
P(B)
P(A und B)
P(B |A) = , P(A) > 0.
P(A)
Unabhängigkeit: Zwei Ereignisse A und B mit P(A) > 0 und P(B) > 0 heiÿen (stochastisch) unabhängig,
wenn gilt:
Bedingte Wahrscheinlichkeit :
P(X = ai und Y = b)
P(X = ai | Y = b) = , i = 1, . . . , k .
P(Y = b)
Bedingte Verteilungsfunktion :
X
Fx|b (a) = P(X ≤ a | Y = b) = P(X = ai | Y = b) .
ai ≤a
Bedingter Erwartungswert :
k
X
E(X | Y = b) = ai P(X = ai | Y = b) .
i=1
P(X = ai ) · P(Y = b)
P(X = ai | Y = b) = = P(X = ai ) , i = 1, . . . , k ,
P(Y = b)
E(X | Y = b) = E(X) .
6.4 Kovarianz
Theoretische Kovarianz:
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))]. (6.9)
k X
X ℓ
Cov(X, Y )= (ai − E(X))(bj − E(Y )) pij .
i=1 j=1
a) Kovarianzzerlegung:
Cov(X, Y ) = E(XY ) − E(X)E(Y ) (6.10)
mit
k X
X ℓ
E(XY )= ai bj pij .
i=1 j=1
Theoretischer Korrelationskoezient:
Cov(X, Y )
ρxy = . (6.11)
σx σy
Es gilt |ρxy | ≤ 1. X und Y heiÿen unkorreliert, wenn Cov(X, Y )=0 bzw. ρxy = 0.
Unabhängig vs. unkorreliert:
bzw.
Insbesondere gilt
n
! n
!
X X
E Xi = nµ, Var Xi = n σ2 . (7.1)
i=1 i=1
Weiter gilt
σ2
2) Var(X) = σx2 = n mit Var(X) →0 für n → ∞.
Wegen 2) streut X mit wachsendem Stichprobenumfang immer weniger; wegen 1) konzentriert sich X mit
wachsendem n auf den wahren Wert. Man spricht auch vom Gesetz der groÿen Zahlen: Lässt man den
Stichprobenumfang n über alle Grenzen wachsen, so konvergiert X gegen µ. Genauer gesagt konvergiert
2
X im quadratischen Mittel (symbolisch: X → µ). Eine präzise Denition und weitere Ausführungen
eine (Standard)Normalverteilung.
Standardisierung: Wenn die Zufallsstichprobe normalverteilt ist (Xi ∼ N (µ, σ2 )), dann gilt
X −µ
Z= √ ∼ N (0, 1) .
σ/ n
Zentraler Grenzwertsatz (ZGS): Wir standardisieren nun entsprechend ohne die Annahme normalverteil-
ter Variablen: Pn
X −µ i=1Xi − nµ √ X − µ
Zn = √ = √ = n .
σ/ n nσ σ
Für jede Zufallsstichprobe X1 , . . . , Xn mit E(Xi ) =µ und V ar(Xi ) = σ 2 gilt mit z ∈ R:
wobei Φ(·) die Verteilungsfunktion der Standardnormalverteilung ist. In diesem Sinne konvergiert Zn in
d
Verteilung gegen Z ∼ N (0, 1): Zn → Z . Alternativ sagen wir auch, dass Zn asymptotisch (approximativ)
7.3 Asymptotische (approximative) Normalverteilung 21
a
Zn ∼ N (0, 1).
σ2
a
X ∼ N µ, .
n
Viele Gröÿen aus den vorhergehenden Kapiteln haben die Gestalt eines arithmetischen Mittels von Trans-
n
1X
V = Vi ,
n i=1
so ergibt sich für Vi = (Xi −X)2 die mittlere quadratische Abweichung. Wegen des ZGS ist asymptotische
Normalität nicht überraschend. Allerdings wird der für die Normalisierung erforderliche Varianzausdruck
komplizierter:
√ a
n(D2 − σ 2 ) ∼ N (0, µ4 − σ 4 ) ,
wobei µ4 = E((Xi − µ)4 ) ist. Unter der Annahme, dass die Zufallsstichprobe normalverteilt ist, Xi ∼
2
N (µ, σ ), vereinfacht sich dies zu
√ a
n(D2 − σ 2 ) ∼ N (0, 2σ 4 ) . (7.2)
Deniert man
(Xi − X)(Yi − Y )
Vi = q ,
Dx2 Dy2
so ergibt sich auch der empirische Korrelationskoezient aus (3.4) als arithmetisches Mittel V, und
8 Parameterschätzung
8.1 Schätzfunktionen
(Unbekannter) Parameter θ, θ ∈ R.
Stichprobenfunktion oder Schätzfunktion g(X1 , . . . , Xn ) aufgrund von Zufallsstichprobe, g: Rn → R, ist
eine Zufallsvariable.
Vorsicht: Kurzschreibweise θ̂ sowohl für Zufallsvariable g(X1 , . . . , Xn ) als auch für Schätzwert g(x1 , . . . , xn ).
generell µ µ̂ = X µ
1
Pn n−1 2
generell σ2 σ̂12 = D2 = n i=1 (Xi − X)2 n σ
1
Pn
σ̂22 = S 2 = n−1 i=1 (Xi − X)2 σ2
Bernoulliverteilung p p̂ = X p
Poissonverteilung λ λ̂ = X λ
1 n
Exponentialverteilung λ λ̂ = n−1 λ
X
Stet. Gleichvtlg. auf [0, b] b b̂ = 2 · X b
E(θ̂) = θ.
b(θ) b − θ.
b = E(θ) (8.1)
lim E(θ̂) = θ.
n→∞
Zur Beurteilung eines Schätzers kann man dessen Varianz und Verzerrung kombinieren. Dazu denieren
M QF (θ) b 2 + Var(θ).
b = b(θ) b (8.3)
8.3 Stichprobenvarianz 23
Ein Schätzer θb1 ist besser als θb2 wenn M QF (θb1 ) < M QF (θb2 ).
Eine Schätzfunktion θ̂ für den Parameter θ wird konsistent genannt, wenn gilt
Wegen (8.3) ist dies gleichbedeutend damit, dass MQF mit wachsendem n gegen null strebt. Im Sinne
8.3 Stichprobenvarianz
Verzerrung der mittleren quadratischen Abweichung D2 = 1
Pn
n i=1 (Xi − X)2 Man kann zeigen:
2 n−1 2 1
E(D ) = σ = 1− σ2 .
n n
2
1) E(D ) → σ2 für n → ∞: D2 ist asymptotisch erwartungstreu oder asymptotisch unverzerrt für σ2 .
2
2) Var(D )→0 für n → ∞.
Der M QF (D2 ) = E (D2 − σ 2 )2 wird wieder in die quadrierte Verzerrung und die Varianz zerlegt:
Stichprobenvarianz : S 2 mit
n
1 X
S2 = (Xi − X)2 (8.4)
n − 1 i=1
meter θ∈R ab: µ = h(θ). Man setze das empirische Mittel dem theoretischen gleich, X = h(θ)
b, und löse
Die Konsistenz und asymptotische Normalität von X überträgt sich unter allgemeinen Bedingungen auf
θbM M .
24 9 KONFIDENZINTERVALLE (KI)
9 Kondenzintervalle (KI)
9.1 Einführung
Kondenzintervall θbu , θbo Kondenzniveau 1 − α:
h i
überdeckt den unbekannten Parameter θ mit
P (θbu ≤ θ ≤ θbo ) = 1 − α .
Zentrales KI, bei dem überdies gilt:
α
P (θbu ≥ θ) = P (θbo ≤ θ) = .
2
Realisiertes Kondenzintervall
h i
θbu , θbo für Stichprobe θbu = gu (x1 , . . . , xn ) und θbo = go (x1 , . . . , xn ).
gelten
2 σ2
n ≥ 4z1− α .
2 L20
t-Verteilung
Es seien X1 , . . . , Xn normalverteilte Zufallsvariablen einer Zufallsstichprobe mit Xi ∼ N (µ, σ 2 ). Dann
folgt
√ X −µ
T = n ,
S
einer sogenannten t-Verteilung mit ν =n−1 Freiheitsgraden:
√ X −µ
T = n ∼ t(n − 1) .
S
Prinzipiell hat die t-Verteilung eine sehr ähnliche Gestalt wie die Standardnormalverteilung: Die Dichte
3
ist symmetrisch um den Erwartungswert und Median Null , so dass für die Quantile (siehe Tabelle C)
gilt:
Zur Konstruktion eines Kondenzintervalls für µ bei unbekanntem σ verwendet man also die Prozent-
punkte t1− α
2
(n − 1) der t-Verteilung:
S S
KI1−α = X − t1− α2 (n − 1) √ ; X + t1− α2 (n − 1) √ . (9.2)
n n
9.2.3 Approximativ
Für jede konsistente Varianzschätzung b2
σ gilt (ZGS) für groÿen Stichprobenumfang:
√ X −µ a
Z= n ∼ N (0, 1) wobei σ
b konsistent für σ.
σ
b
Für groÿen Stichprobenumfang ist diese Statistik näherungsweise standardnormalverteilt, ohne Normal-
verteilung der Stichprobenvariablen. Daher ergibt sich als asymptotisches oder approximatives Konden-
p̂ − E(p̂) p̂ − p a
p =p ∼ N (0, 1) .
Var(p̂) p(1 − p)/n
Da p in der Varianz von p̂ allerdings nicht bekannt ist, wird es dort durch den konsistenten Schätzer p̂
ersetzt. Daher lautet das approximative Kondenzintervall zum Niveau 1 − α, vgl. (9.3):
" p p #
pb(1 − pb) pb(1 − pb)
KI1−α ≈ pb − z1− 2
α √ ; pb + z1− 2
α √ . (9.4)
n n
Soll die Länge einen Wert L0 nicht überschreiten, so ergibt sich der erforderliche Stichprobenumfang
2 2
durch Auösen nach n als n ≥ 4z1− α p̂(1 − p̂)/L0 . Eine hinreichende Bedingung dafür für alle p̂ ist:
2
2
z1− α
n≥ 2
.
L20
Daten annimmt, dann ergibt sich die einfache Gestalt aus (7.2). Dies liefert
" #
n D2 n D2
KI1−α ≈ √ ; √ . (9.5)
n + z1− α2 2 n n − z1− α2 2 n
26 10 STATISTISCHE TESTS
10 Statistische Tests
10.1 Prinzipien des Testens
Ausgangspunkt für das Testen ist eine Hypothese, oft auch als Nullhypothese, H0 , bezeichnet, und die
zugehörige Alternativ- oder Gegenhypothese, H1 . Ein statistischer Test ist eine Entscheidungsregel, bei
der auf Basis eines Datensatzes unter bestimmten Verteilungsannahmen mit Hilfe einer Teststatistik
bzw. Prüfgröÿe eine Entscheidung über eine Hypothese getroen wird. Dabei können Fehlentscheidungen
Realität H0 H1
Entscheidung ist richtig ist richtig
Auf Basis der Daten (oder Stichprobe) wird eine spezielle Stichprobenfunktion gebildet: die Teststatistik.
Dabei gibt es Werte, die für und andere, die gegen die Nullhypothese H0 sprechen. Die Grenzen des
Ablehnbereiches oder auch kritischen Bereiches lassen sich auf Basis der Verteilung der Teststatistik und
dem festgelegten α bestimmen. Fällt der Wert der Teststatistik in diesen kritischen Bereich, wird die
Nullhypothese H0 abgelehnt, ansonsten wird sie beibehalten. Damit ist α die Wahrscheinlichkeit, mit der
der Fehler 1. Art (Entscheidung gegen die Nullhypothese H0 , obwohl diese richtig ist) höchstens auftreten
kann. Man nennt α auch das sog. Signikanzniveau des Tests.
Testet man aus Beobachtungen auf einen unbekannten Parameter θ, so unterscheiden wir einfache Nullhy-
pothesen, die nur aus einem Wert θ0 bestehen, von zusammengesetzten Nullhypothesen, wo der Parameter
aus einem durch θ0 begrenzten Bereich ist (z. B. θ ∈ (−∞, θ0 ] oder θ ∈ [θ0 , ∞)). Formuliert man die
Alternativhypothese als logische Verneinung, so erhält man zweiseitige bzw. einseitige Testprobleme:
Die Einseitigkeit des Testproblems hängt genau an der Alternative und nicht an H0 . Schränkt man den
Parameterraum a priori auf θ ≥ θ0 ein (bzw. auf θ ≤ θ0 ), so erhält man bei einfacher Nullhypothese als
Um das Signikanzniveau α kontrollieren zu können, unterstellen wir für das Folgende eine Zufallsstich-
Hypothesen: a) H0 : µ = µ0 gegen H1 : µ ̸= µ0
b) H0 : µ ≤ µ0 gegen H1 : µ > µ0
H0 : µ ≥ µ0 gegen H1 : µ < µ0
c)
X − µ0 X − µ0
Teststatistik: Z= = √
σx σ/ n
Verteilung unter µ = µ0 : Z ∼ N (0, 1)
Testentscheidung: a) |Z| > z1−α/2
H0 ablehnen, wenn b) Z > z1−α
c) Z < −z1−α
Testschema:
Hypothesen: a) H0 : µ = µ0 gegen H1 : µ ̸= µ0
b) H0 : µ ≤ µ0 gegen H1 : µ > µ 0
c)H0 : µ ≥ µ0 gegen H1 : µ < µ0
X − µ0
Teststatistik: T = √
S/ n
Verteilung unter µ = µ0 : T ∼ t(ν) mit ν =n−1
Testentscheidung: a) |T | > t1−α/2 (n − 1)
H0 ablehnen, wenn b) T > t1−α (n − 1)
c) T < −t1−α (n − 1)
10.2.3 Approximativ
Ohne Annahme normalverteilter Stichprobenvariablen gilt für groÿes n wie oben ausgeführt, dass T unter
a
µ = µ0 approximativ standardnormalverteilt ist, T ∼ N (0, 1). Entsprechend kann die t-Statistik T für
p̂ − p0 p̂ − p0
Z= =q .
σ̂p̂ p̂(1−p̂)
n
Testschema:
Test auf p
Modell: Xi ∼ Be(p), i = 1, . . . , n
Hypothesen: a) H0 : p = p 0 gegen H1 : p ̸= p0
b) H0 : p ≤ p0 gegen H1 : p > p0
H0 : p ≥ p0 gegen H1 : p < p0
c)
p̂ − p0 p̂ − p0
Teststatistik: Z= =q
σ̂p̂ p̂(1−p̂)
n
a
Verteilung unter p = p0 : Z ∼ N (0, 1)
Testentscheidung: a) |Z| > z1−α/2
H0 ablehnen, wenn b) Z > z1−α
c) Z < −z1−α
10.4 P -Werte
Alternativ kann die Testentscheidung auch über den sog. P -Wert (in Englisch P -value für probability
value) erfolgen. Der P -Wert ist dabei die Wahrscheinlichkeit, unter der (Null-)Hypothese H0 den beob-
achteten Wert der Teststatistik oder einen in Richtung der Gegenhypothese H1 noch extremeren Wert zu
erhalten. Der P -Wert ist sozusagen das minimale Signikanzniveau, zu dem H0 gerade noch verworfen
werden kann. Groÿe P -Werte sprechen also dafür, dass die Empirie mit der Hypothese H0 vereinbar
ist, weshalb man diese nicht verwerfen sollte. Kleine P -Werte hingegen sagen, dass das Auftreten der
beobachteten Realisation der Teststatistik unwahrscheinlich ist, wenn die Hypothese H0 stimmt, weshalb
man dann dazu neigt, sie zu verwerfen. Die Entscheidungsregel lautet also bei vorgegebenem Niveau α:
Computerprogramme geben im allgemeinen beim Testen den P -Wert an, da auf diese Art und Weise kein
kritischer Wert in Abhängigkeit von willkürlich gewähltem α berechnet werden muss. Obwohl P -Werte
im Prinzip für beliebige Testverfahren berechnet werden können, erlauben unsere Tabellen im Anhang
nur bei (approximativer) Normalverteilung eine vernünftige Bestimmung. Es sei der realisierte Wert zr
a
einer Prüfgröÿe die Realisation von Z ∼ N (0, 1) oder Z ∼ N (0, 1). Dann berechnet sich beim zweiseitigen
Test, a), oder bei den einseitigen Tests, b) oder c), der P -Wert wie folgt:
4 Eine alternative Variante der Teststatistik verwendet im Einklang mit der Nullhypothese p0 statt p̂ bei der Varianz-
schätzung:
p̂ − p0
Z0 = q .
p0 (1−p0 )
n
Wir ziehen hier die Statistik Z vor, weil so der zweiseitige Test auf p direkt über das Kondenzintervall ohne weitere
überdeckt. Die Regel mittels der Prüfgröÿe T und die Regel mittels des Kondenzintervall führen, wie
Entsprechendes gilt auch bei dem zweiseitigen Testproblem über einen Anteilswert p: Es gilt
" p p #
pb(1 − pb) pb(1 − pb)
p0 ∈ p̂ − z 1− α √ ; p̂ + z1− α2 √
2
n n
p̂ − p0
q ≤ z1− α2 .
p̂(1−p̂)
n
zu n → ∞, auch noch Normalverteilung der Daten angenommen. Während das KI für n D2 deniert
2
wurde, können wir die Teststatistik äquivalent durch (n − 1) S ausdrücken.
(n − 1) S 2 n D2
Teststatistik: Σ= =
σ02 σ02
a
Verteilung unter σ 2 = σ02 : Σ ∼ N (n, 2n)
√
Testentscheidung: a) Σ > n + z1−α/2 2n
√
oder Σ < n − z1−α/2 2n
√
H0 ablehnen, wenn b) Σ > n + z1−α 2n
√
c) Σ < n − z1−α 2n
10.7 Gütefunktion
Als Güte eines Tests bezeichnet man oft die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie
falsch ist. Allgemein denieren wir jetzt als Gütefunktion G(θ) eines Tests über den Parameter θ die
30 10 STATISTISCHE TESTS
Ablehnwahrscheinlichkeit
welche vom wahren Wert θ abhängt. Man beachte, dass hierbei P(· || θ ist wahrer Wert) = Pθ (·) keine
√ X − µ0
Z0 = n .
σ
√
Die Prüfgröÿe ist nur standardnormalverteilt, wenn µ = µ0 ist; allg. gilt Z0 ∼ N (− n (µ0 − µ)/σ, 1),
oder
√ µ0 − µ
Z0 + n· ∼ N (0, 1) . (10.1)
σ
In Abhängigkeit der Hypothesen ergeben sich damit unterschiedliche Gütefunktionen.
H0 : µ ≤ µ0 , H1 : µ > µ0 ,
µ − µ0 √
G(µ) = P(Z0 > z1−α ||µ) = 1 − Φ z1−α − n . (10.2)
σ
H0 : µ ≥ µ0 , H1 : µ < µ0 ,
so erhält man
µ0 − µ √
G(µ) = P(Z0 < −z1−α ||µ) = Φ n − z1−α . (10.3)
σ
H0 : µ = µ0 , H1 : µ ̸= µ0 ,
µ0 − µ √ µ0 − µ √
G(µ) = Pµ (|Z0 | > z1−α/2 ) = 1 + Φ n − z1−α/2 −Φ n + z1−α/2 . (10.4)
σ σ
31
U nverbundene Stichproben Xi und Yj werden an verschiedenen Objekten oder Personen oder zu ver-
V erbundene Stichproben Xi und Yi werden an identischen Objekten oder Personen oder zu identischen
Zeitpunkten gemessen, sodass n=m Paare an Variablen vorliegen, (Xi , Yi ), i = 1, . . . , n, und man von
lung eines Merkmals auf Basis einer Stichprobe getestet werden, richten wir nun das Augenmerk auf den
Vergleich zweier Erwartungswerte (µx und µy ). Die Hypothesen im Fall einer verbundenen Stichprobe
(bivariate Zufallsvariablen) und im Fall zweier unverbundener Stichproben gleichen sich. In jedem Fall
müssen Xi und Yj oder (Xi , Yi ) (und damit deren Erwartungswerte µx und µy ) vergleichbar sein und
a) H0 : µx = µy vs. H1 : µx ̸= µy ,
b) H0 : µx ≤ µy vs. H1 : µx > µy ,
c) H0 : µx ≥ µy vs. H1 : µx < µy .
Ein einseitiger Test kann auch bei Nullhypothesen durchgeführt werden, die nicht zusammengesetzt,
b) H0 : µx = µy gegen H1 : µx > µy ,
c) H0 : µx = µy gegen H1 : µx < µy .
bivariate Variablen aus einer Stichprobe, d.h. für jedes i gehören Xi und Yi beispielsweise zur gleichen
Person oder Firma. Aus diesem Grund trägt die Dierenz ∆i = Xi − Yi eine inhaltliche Bedeutung.
Im Grunde schlagen wir hier gar keinen neuen Test vor, sondern eine Rückführung auf den schon behan-
delten univariaten Fall. Dazu unterstellen wir, dass die Dierenzen einer Normalverteilung folgen,
a) H1 : µδ ̸= 0,
32 11 TESTS BEI (UN)VERBUNDENEN STICHPROBEN
b) H1 : µδ > 0,
c) H1 : µδ < 0.
Die Entscheidungsregel ist wie beim gewöhnlichen t-Test auf µ: Die Quantile stammen dabei wieder aus
der t(n − 1)-Verteilung. Bei groÿem Stichprobenumfang kann auch wieder approximativ über die Stan-
dardnormalverteilung getestet werden, ohne dass wir die Annahme normalverteilter Stichprobenvariablen
Wieder betrachten wir zwei normalverteilte Variablen Xi und Yj , die jetzt aber aus einer unverbundenen
Messung, also aus zwei unabhängigen Stichproben stammen. Überdies wird Gleichheit der Varianzen
verlangt. (Beachte: Diese Annahmen sind in der Praxis oft nicht erfüllt.)
i = 1, . . . , n, j = 1, . . . , m, σx2 = σy2
Hypothesen: a) H0 : µx = µy gegen H1 : µx ̸= µy
b) H0 : µx ≤ µy gegen H1 : µx > µy
c) H0 : µx ≥ µy gegen H1 : µx < µy
X −Y
Teststatistik: T = s
(n − 1)Sx2 + (m − 1)Sy2
1 1
+
n m m+n−2
Verteilung
In der Praxis sind die Annahmen gleicher Varianzen und normalverteilter Daten nur in den seltensten
Fällen gerechtfertigt. Dann kann man sich approximativ wie beim Dierenzen-t-Test helfen, vorausgesetzt,
dass der Stichprobenumfang groÿ ist. Wir unterstellen unabhängige Stichproben vom Umfang n und
X −Y a
Z=q 2
∼ N (0, 1).
2
σ̂x σ̂ y
n + m
Eine gute Näherung erfordert, dass beide Stichprobenumfänge n und m groÿ sind.
11.2 χ2 -Unabhängigkeitstest 33
11.2 χ2 -Unabhängigkeitstest
Der χ2 -Unabhängigkeitstest ist ein Test zur Überprüfung der Unabhängigkeit zweier Merkmale; es liegt ei-
ne verbundene Stichprobe vor: (Xi , Yi ). Auf Basis einer Kontingenztabelle oder Kreuztabelle soll überprüft
werden, ob Xi und Yi voneinander unabhängig sind. Der in Abschnitt 3.1 schon eingeführte χ2 -Koezient
dient als Testgröÿe. Die Prüfgröÿe beruht auf dem Vergleich von tatsächlich beobachteten Häugkeiten
nij mit den unter H0 zu erwartenden Häugkeiten. Da diese Abweichungen quadriert werden, führt die
Teststatistik (approximativ) auf eine sog. χ2 -Verteilung mit r Freiheitsgraden. Quantile der Verteilungen
sind in Abhängigkeit des Freiheitsgradparameters in Tabelle D tabelliert. Wir bezeichnen das p-Quantil
2
bei r Freiheitsgraden wie folgt: χp (r).
Testschema:
χ2 -Unabhängigkeitstest
Modell: (Xi , Yi ) i.i.d., i = 1, . . . , n
gruppiert in (k × ℓ)-Kontingenztabelle
Hypothesen: H0 : X und Y unabhängig
H1 : X und Y abhängig
Pk Pℓ (nij − ñij )2
Teststatistik: χ2 = i=1 j=1
ñij
ni• · n•j
mit ñij =
n
und den Randhäugkeiten ni• und n•j
a
Verteilung unter H0 : χ2 ∼ χ2 (r) mit r = (k − 1) · (ℓ − 1)
H0 ablehnen, wenn χ2 > χ21−α (r)
vor: (Xi , Yi ). Der Test basiert natürlich auf dem empirischen Korrelationskozienten ρbxy .
Testschema:
12.1 Einfachregression
Linearer Zusammenhang,
y = a + bx, (12.1)
Yi = a + b xi + Ui , i = 1, . . . , n. (12.2)
Dabei sind a und b die skalaren Parameter der Regressionsgeraden, die es auf der Basis einer bivariaten
Stichprobe (xi , yi ), i = 1, . . . , n, zu schätzen oder zu testen gilt. Die Regressoren xi sind fest gegeben
und Ui sind die unbeobachtbaren Fehler- oder Störterme, d. h. nicht kontrollierbare Zufallsvariablen.
Konsequenterweise sind Yi , i = 1, . . . , n, im Modell auch Zufallsvariablen. Über die Störterme werden die
Die Gleichheit der Varianzen der Störterme bezeichnet man als Homoskedastizit ät. Ist diese Annahme
nicht erfüllt, spricht man von Heteroskedastizit ät. Die Annahme der Normalverteilung ist nur für das
Testen relevant; sie kann ersetzt werden durch die Annahme eines groÿen Stichprobenumfangs n, um
Die Schätzung der Parameter nach der Methode der Kleinsten Quadrate (KQ-Methode) ist schon bekannt.
Als Schätzer für a und b ergeben sich auf diese Weise (siehe Abs. 3.3 für weitere Details):
Pn
(x − x)(Yi − Y)
b̂ = Pn i
i=1
2
, â = Y − b̂x.
i=1 (xi − x)
Daraus ergibt sich bekanntlich die geschätzte Regressionsgerade, Ŷ = â + b̂ · x, mit den Residuen (ge-
schätzten Störtermen): Ûi = Yi − Ŷi . Aus ihnen lässt sich die Varianz der Störterme schätzen:
n
1 X 2
σ̂ 2 = Û . (12.3)
n − 2 i=1 i
2
E(â) = a, E(b̂) =b und E(σ̂ ) = σ2 .
Des weiteren sind die Schätzer konsistent, wenn ihre Varianzen gegen Null streben für n → ∞:
x2 1
Var(â) = σa2 = σ 2 · und Var(b̂) = σb2 = σ 2 · .
nd2x nd2x
Wir erinnern uns überdies zur Modellbeurteilung an das sog. Bestimmtheitsmaÿ als Anteil der durch die
b̂ − b0
Teststatistiken: Tb =
σ̂b
Verteilung: Tb ∼ t(n − 2)
Testentscheidung: a) |Tb | > t1−α/2 (n − 2)
H0 ablehnen, wenn b) Tb > t1−α (n − 2)
c) Tb < −t1−α (n − 2)
Aufgrund des Zusammenhangs zw. zweiseitigem Test und Kondenzintervall, erhält man zum Kondenz-
Die in der Praxis wichtigste Nullhypothese ist H0 : b = 0, was inhaltlich mit der Frage verbunden ist, ob
die Variable X überhaupt einen signikanten Einuss auf Y hat. Man kann zeigen, dass für b0 = 0 gilt:
ρbxy √
Tb = q n − 2,
1 − ρb2xy
d.h. der Test auf b = 0 (kein linearer Zusammenhang) entspricht gerade dem Test auf Unkorreliertheit aus
Abschnitt 11.3. Wie dort erläutert, lassen sich auch im linearen Regressionsmodell statt Tests auf Basis
der t-Verteilung Tests auf Basis approximativer Standardnormalverteilung für groÿes n ohne Annahme
Inferenz über den Achsenabschnitt a behandeln wir hier nicht; dies ist als Spezialfall im nächsten Ab-
schnitt enthalten.
5 Jetzt brauchen wir doch noch eine Annahme über den Regressor: dass seine mittlere quadratische Abweichung d2x gegen
K
X
Yi = β1 + β2 xi,2 + . . . + βK xi,K + Ui = βk xi,k + Ui , (12.5)
k=1
wobei der zum Achsenabschnitt β1 gehörende Regressor konstant xi,1 = 1 ist. Über den unbeobachtbaren
Fehlerterm Ui erhalten wir die obigen Annahmen aufrecht, also Var(Ui ) = σ 2 , und insbesondere E(Ui ) = 0:
Wieder nach dem Kleinste-Quadrate-Prinzip lassen sich die Schätzer βb1 bis βbK bestimmen; wir verzichten
auf die Formel dafür. Auch die Varianzen der Schätzer behandeln wir als Black-Box:
Var(β
bk ) = σk2 = σ 2 Vk , k = 1, . . . , K,
wobei sich der Faktor Vk aus den Regressoren und dem Stichprobenumfang n allein berechnen lässt. Die
2
unbekannte Störtermvarianz σ kann wieder erwartungstreu und konsistent aus den Residuen geschätzt
werden durch
n
1 X b2
b2 =
σ U , (12.7)
n − K i=1 i
(0)
Parametertests auf einen nullhypothetischen Wert βk beruhen auf der t-Statistik,
(0)
βbk − βk
Tk = , k = 1, . . . K, (12.8)
σ
bk
wobei in σ̂k2 die Varianz σ2 durch die Schätzung σ̂ 2 ersetzt wird:
bk2 = σ
σ b 2 Vk , k = 1, . . . , K.
(0)
Stimmt der wahre Parameterwert mit βk überein, so gilt bei Annahme normalverteilter Störterme:
Tk ∼ t(n − K), k = 1, . . . , K.
angezogen werden, um formal zu testen, ob alle Regressoren (auÿer der Konstanten, d. h. x2 bis xK )
gemeinsam einen Einuss auf Yi haben, d. h. signikant zur Erklärung beitragen. Die Nullhypothese
H0 : β2 = · · · = βK = 0 .
Unter H0 passt sich also Yi nicht den Erklärenden xi,2 bis xi,K an. Die Gegenhypothese ist gerade die
logische Verneinung hiervon: mindestens einer der Regressoren hat einen Erklärungsbeitrag für Yi . Die
R2 a
χ2 = (n − K) mit χ2 ∼ χ2 (K − 1) unter H0 . (12.9)
1 − R2
38 12 DAS LINEARE REGRESSIONSMODELL
Der asymptotische Test lehnt also H0 zum Niveau α ab, wenn χ2 das Quantil χ21−α (K −1) übersteigt. Man
beachte, dass die Anzahl der Freiheitsgrade (K − 1) gerade mit der Anzahl der unter H0 restringierten
Parameter überein stimmt. Diese Teststatistik kann noch zu R2 n vereinfacht werden, weil unter der
Nullhypothese asymptotisch
R2
R2 n ≈ (n − K) unter H0 (12.10)
1 − R2
gilt; vgl. auch Abschnitt 11.3.
39
Tabelle A: Standardnormalverteilung
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-0.00 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
-0.10 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.20 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.30 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.40 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.50 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.60 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.70 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.80 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.90 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-1.00 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-1.10 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.20 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.30 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.40 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
-1.50 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
-1.60 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.70 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.80 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.90 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-2.00 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-2.10 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.20 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.30 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.40 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.50 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.60 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.70 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.80 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.90 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-3.00 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-3.10 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.20 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
-3.30 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.40 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
40 13 TABELLEN ZU VERTEILUNGSFUNKTIONEN UND QUANTILEN
Tabelle A: Standardnormalverteilung
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.10 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.20 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.30 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.40 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
41
p 0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009
0.000 −∞ -3.0902 -2.8782 -2.7478 -2.6521 -2.5758 -2.5121 -2.4573 -2.4089 -2.3656
0.010 -2.3263 -2.2904 -2.2571 -2.2262 -2.1973 -2.1701 -2.1444 -2.1201 -2.0969 -2.0749
0.020 -2.0537 -2.0335 -2.0141 -1.9954 -1.9774 -1.9600 -1.9431 -1.9268 -1.9110 -1.8957
0.030 -1.8808 -1.8663 -1.8522 -1.8384 -1.8250 -1.8119 -1.7991 -1.7866 -1.7744 -1.7624
0.040 -1.7507 -1.7392 -1.7279 -1.7169 -1.7060 -1.6954 -1.6849 -1.6747 -1.6646 -1.6546
0.050 -1.6449 -1.6352 -1.6258 -1.6164 -1.6072 -1.5982 -1.5893 -1.5805 -1.5718 -1.5632
0.060 -1.5548 -1.5464 -1.5382 -1.5301 -1.5220 -1.5141 -1.5063 -1.4985 -1.4909 -1.4833
0.070 -1.4758 -1.4684 -1.4611 -1.4538 -1.4466 -1.4395 -1.4325 -1.4255 -1.4187 -1.4118
0.080 -1.4051 -1.3984 -1.3917 -1.3852 -1.3787 -1.3722 -1.3658 -1.3595 -1.3532 -1.3469
0.090 -1.3408 -1.3346 -1.3285 -1.3225 -1.3165 -1.3106 -1.3047 -1.2988 -1.2930 -1.2873
0.100 -1.2816 -1.2759 -1.2702 -1.2646 -1.2591 -1.2536 -1.2481 -1.2426 -1.2372 -1.2319
0.110 -1.2265 -1.2212 -1.2160 -1.2107 -1.2055 -1.2004 -1.1952 -1.1901 -1.1850 -1.1800
0.120 -1.1750 -1.1700 -1.1650 -1.1601 -1.1552 -1.1503 -1.1455 -1.1407 -1.1359 -1.1311
0.130 -1.1264 -1.1217 -1.1170 -1.1123 -1.1077 -1.1031 -1.0985 -1.0939 -1.0893 -1.0848
0.140 -1.0803 -1.0758 -1.0714 -1.0669 -1.0625 -1.0581 -1.0537 -1.0494 -1.0450 -1.0407
0.150 -1.0364 -1.0322 -1.0279 -1.0237 -1.0194 -1.0152 -1.0110 -1.0069 -1.0027 -0.9986
0.160 -0.9945 -0.9904 -0.9863 -0.9822 -0.9782 -0.9741 -0.9701 -0.9661 -0.9621 -0.9581
0.170 -0.9542 -0.9502 -0.9463 -0.9424 -0.9385 -0.9346 -0.9307 -0.9269 -0.9230 -0.9192
0.180 -0.9154 -0.9116 -0.9078 -0.9040 -0.9002 -0.8965 -0.8927 -0.8890 -0.8853 -0.8816
0.190 -0.8779 -0.8742 -0.8705 -0.8669 -0.8633 -0.8596 -0.8560 -0.8524 -0.8488 -0.8452
0.200 -0.8416 -0.8381 -0.8345 -0.8310 -0.8274 -0.8239 -0.8204 -0.8169 -0.8134 -0.8099
0.210 -0.8064 -0.8030 -0.7995 -0.7961 -0.7926 -0.7892 -0.7858 -0.7824 -0.7790 -0.7756
0.220 -0.7722 -0.7688 -0.7655 -0.7621 -0.7588 -0.7554 -0.7521 -0.7488 -0.7454 -0.7421
0.230 -0.7388 -0.7356 -0.7323 -0.7290 -0.7257 -0.7225 -0.7192 -0.7160 -0.7128 -0.7095
0.240 -0.7063 -0.7031 -0.6999 -0.6967 -0.6935 -0.6903 -0.6871 -0.6840 -0.6808 -0.6776
0.250 -0.6745 -0.6713 -0.6682 -0.6651 -0.6620 -0.6588 -0.6557 -0.6526 -0.6495 -0.6464
0.260 -0.6433 -0.6403 -0.6372 -0.6341 -0.6311 -0.6280 -0.6250 -0.6219 -0.6189 -0.6158
0.270 -0.6128 -0.6098 -0.6068 -0.6038 -0.6008 -0.5978 -0.5948 -0.5918 -0.5888 -0.5858
0.280 -0.5828 -0.5799 -0.5769 -0.5740 -0.5710 -0.5681 -0.5651 -0.5622 -0.5592 -0.5563
0.290 -0.5534 -0.5505 -0.5476 -0.5446 -0.5417 -0.5388 -0.5359 -0.5330 -0.5302 -0.5273
0.300 -0.5244 -0.5215 -0.5187 -0.5158 -0.5129 -0.5101 -0.5072 -0.5044 -0.5015 -0.4987
0.310 -0.4959 -0.4930 -0.4902 -0.4874 -0.4845 -0.4817 -0.4789 -0.4761 -0.4733 -0.4705
0.320 -0.4677 -0.4649 -0.4621 -0.4593 -0.4565 -0.4538 -0.4510 -0.4482 -0.4454 -0.4427
0.330 -0.4399 -0.4372 -0.4344 -0.4316 -0.4289 -0.4261 -0.4234 -0.4207 -0.4179 -0.4152
0.340 -0.4125 -0.4097 -0.4070 -0.4043 -0.4016 -0.3989 -0.3961 -0.3934 -0.3907 -0.3880
0.350 -0.3853 -0.3826 -0.3799 -0.3772 -0.3745 -0.3719 -0.3692 -0.3665 -0.3638 -0.3611
0.360 -0.3585 -0.3558 -0.3531 -0.3505 -0.3478 -0.3451 -0.3425 -0.3398 -0.3372 -0.3345
0.370 -0.3319 -0.3292 -0.3266 -0.3239 -0.3213 -0.3186 -0.3160 -0.3134 -0.3107 -0.3081
0.380 -0.3055 -0.3029 -0.3002 -0.2976 -0.2950 -0.2924 -0.2898 -0.2871 -0.2845 -0.2819
0.390 -0.2793 -0.2767 -0.2741 -0.2715 -0.2689 -0.2663 -0.2637 -0.2611 -0.2585 -0.2559
0.400 -0.2533 -0.2508 -0.2482 -0.2456 -0.2430 -0.2404 -0.2378 -0.2353 -0.2327 -0.2301
0.410 -0.2275 -0.2250 -0.2224 -0.2198 -0.2173 -0.2147 -0.2121 -0.2096 -0.2070 -0.2045
0.420 -0.2019 -0.1993 -0.1968 -0.1942 -0.1917 -0.1891 -0.1866 -0.1840 -0.1815 -0.1789
0.430 -0.1764 -0.1738 -0.1713 -0.1687 -0.1662 -0.1637 -0.1611 -0.1586 -0.1560 -0.1535
0.440 -0.1510 -0.1484 -0.1459 -0.1434 -0.1408 -0.1383 -0.1358 -0.1332 -0.1307 -0.1282
0.450 -0.1257 -0.1231 -0.1206 -0.1181 -0.1156 -0.1130 -0.1105 -0.1080 -0.1055 -0.1030
0.460 -0.1004 -0.0979 -0.0954 -0.0929 -0.0904 -0.0878 -0.0853 -0.0828 -0.0803 -0.0778
0.470 -0.0753 -0.0728 -0.0702 -0.0677 -0.0652 -0.0627 -0.0602 -0.0577 -0.0552 -0.0527
0.480 -0.0502 -0.0476 -0.0451 -0.0426 -0.0401 -0.0376 -0.0351 -0.0326 -0.0301 -0.0276
0.490 -0.0251 -0.0226 -0.0201 -0.0175 -0.0150 -0.0125 -0.0100 -0.0075 -0.0050 -0.0025
42 13 TABELLEN ZU VERTEILUNGSFUNKTIONEN UND QUANTILEN
p 0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009
0.500 0.0000 0.0025 0.0050 0.0075 0.0100 0.0125 0.0150 0.0175 0.0201 0.0226
0.510 0.0251 0.0276 0.0301 0.0326 0.0351 0.0376 0.0401 0.0426 0.0451 0.0476
0.520 0.0502 0.0527 0.0552 0.0577 0.0602 0.0627 0.0652 0.0677 0.0702 0.0728
0.530 0.0753 0.0778 0.0803 0.0828 0.0853 0.0878 0.0904 0.0929 0.0954 0.0979
0.540 0.1004 0.1030 0.1055 0.1080 0.1105 0.1130 0.1156 0.1181 0.1206 0.1231
0.550 0.1257 0.1282 0.1307 0.1332 0.1358 0.1383 0.1408 0.1434 0.1459 0.1484
0.560 0.1510 0.1535 0.1560 0.1586 0.1611 0.1637 0.1662 0.1687 0.1713 0.1738
0.570 0.1764 0.1789 0.1815 0.1840 0.1866 0.1891 0.1917 0.1942 0.1968 0.1993
0.580 0.2019 0.2045 0.2070 0.2096 0.2121 0.2147 0.2173 0.2198 0.2224 0.2250
0.590 0.2275 0.2301 0.2327 0.2353 0.2378 0.2404 0.2430 0.2456 0.2482 0.2508
0.600 0.2533 0.2559 0.2585 0.2611 0.2637 0.2663 0.2689 0.2715 0.2741 0.2767
0.610 0.2793 0.2819 0.2845 0.2871 0.2898 0.2924 0.2950 0.2976 0.3002 0.3029
0.620 0.3055 0.3081 0.3107 0.3134 0.3160 0.3186 0.3213 0.3239 0.3266 0.3292
0.630 0.3319 0.3345 0.3372 0.3398 0.3425 0.3451 0.3478 0.3505 0.3531 0.3558
0.640 0.3585 0.3611 0.3638 0.3665 0.3692 0.3719 0.3745 0.3772 0.3799 0.3826
0.650 0.3853 0.3880 0.3907 0.3934 0.3961 0.3989 0.4016 0.4043 0.4070 0.4097
0.660 0.4125 0.4152 0.4179 0.4207 0.4234 0.4261 0.4289 0.4316 0.4344 0.4372
0.670 0.4399 0.4427 0.4454 0.4482 0.4510 0.4538 0.4565 0.4593 0.4621 0.4649
0.680 0.4677 0.4705 0.4733 0.4761 0.4789 0.4817 0.4845 0.4874 0.4902 0.4930
0.690 0.4959 0.4987 0.5015 0.5044 0.5072 0.5101 0.5129 0.5158 0.5187 0.5215
0.700 0.5244 0.5273 0.5302 0.5330 0.5359 0.5388 0.5417 0.5446 0.5476 0.5505
0.710 0.5534 0.5563 0.5592 0.5622 0.5651 0.5681 0.5710 0.5740 0.5769 0.5799
0.720 0.5828 0.5858 0.5888 0.5918 0.5948 0.5978 0.6008 0.6038 0.6068 0.6098
0.730 0.6128 0.6158 0.6189 0.6219 0.6250 0.6280 0.6311 0.6341 0.6372 0.6403
0.740 0.6433 0.6464 0.6495 0.6526 0.6557 0.6588 0.6620 0.6651 0.6682 0.6713
0.750 0.6745 0.6776 0.6808 0.6840 0.6871 0.6903 0.6935 0.6967 0.6999 0.7031
0.760 0.7063 0.7095 0.7128 0.7160 0.7192 0.7225 0.7257 0.7290 0.7323 0.7356
0.770 0.7388 0.7421 0.7454 0.7488 0.7521 0.7554 0.7588 0.7621 0.7655 0.7688
0.780 0.7722 0.7756 0.7790 0.7824 0.7858 0.7892 0.7926 0.7961 0.7995 0.8030
0.790 0.8064 0.8099 0.8134 0.8169 0.8204 0.8239 0.8274 0.8310 0.8345 0.8381
0.800 0.8416 0.8452 0.8488 0.8524 0.8560 0.8596 0.8633 0.8669 0.8705 0.8742
0.810 0.8779 0.8816 0.8853 0.8890 0.8927 0.8965 0.9002 0.9040 0.9078 0.9116
0.820 0.9154 0.9192 0.9230 0.9269 0.9307 0.9346 0.9385 0.9424 0.9463 0.9502
0.830 0.9542 0.9581 0.9621 0.9661 0.9701 0.9741 0.9782 0.9822 0.9863 0.9904
0.840 0.9945 0.9986 1.0027 1.0069 1.0110 1.0152 1.0194 1.0237 1.0279 1.0322
0.850 1.0364 1.0407 1.0450 1.0494 1.0537 1.0581 1.0625 1.0669 1.0714 1.0758
0.860 1.0803 1.0848 1.0893 1.0939 1.0985 1.1031 1.1077 1.1123 1.1170 1.1217
0.870 1.1264 1.1311 1.1359 1.1407 1.1455 1.1503 1.1552 1.1601 1.1650 1.1700
0.880 1.1750 1.1800 1.1850 1.1901 1.1952 1.2004 1.2055 1.2107 1.2160 1.2212
0.890 1.2265 1.2319 1.2372 1.2426 1.2481 1.2536 1.2591 1.2646 1.2702 1.2759
0.900 1.2816 1.2873 1.2930 1.2988 1.3047 1.3106 1.3165 1.3225 1.3285 1.3346
0.910 1.3408 1.3469 1.3532 1.3595 1.3658 1.3722 1.3787 1.3852 1.3917 1.3984
0.920 1.4051 1.4118 1.4187 1.4255 1.4325 1.4395 1.4466 1.4538 1.4611 1.4684
0.930 1.4758 1.4833 1.4909 1.4985 1.5063 1.5141 1.5220 1.5301 1.5382 1.5464
0.940 1.5548 1.5632 1.5718 1.5805 1.5893 1.5982 1.6072 1.6164 1.6258 1.6352
0.950 1.6449 1.6546 1.6646 1.6747 1.6849 1.6954 1.7060 1.7169 1.7279 1.7392
0.960 1.7507 1.7624 1.7744 1.7866 1.7991 1.8119 1.8250 1.8384 1.8522 1.8663
0.970 1.8808 1.8957 1.9110 1.9268 1.9431 1.9600 1.9774 1.9954 2.0141 2.0335
0.980 2.0537 2.0749 2.0969 2.1201 2.1444 2.1701 2.1973 2.2262 2.2571 2.2904
0.990 2.3263 2.3656 2.4089 2.4573 2.5121 2.5758 2.6521 2.7478 2.8782 3.0902
43
p
ν 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
p
r 0.005 0.010 0.025 0.050 0.100 0.900 0.950 0.975 0.990 0.995
1 0.000 0.000 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.039 0.100 0.213 0.353 0.587 6.252 7.816 9.350 11.346 12.836
4 0.195 0.292 0.484 0.712 1.065 7.780 9.488 11.144 13.277 14.859
5 0.406 0.552 0.831 1.146 1.611 9.237 11.071 12.833 15.086 16.749
6 0.673 0.871 1.237 1.636 2.204 10.645 12.592 14.450 16.812 18.547
7 0.987 1.238 1.690 2.168 2.833 12.017 14.067 16.013 18.475 20.277
8 1.343 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.734 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.155 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757
12 3.074 3.570 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.041 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
27 11.808 12.878 14.573 16.151 18.114 36.741 40.113 43.195 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.256 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.953 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
35 17.192 18.509 20.569 22.465 24.797 46.059 49.802 53.203 57.342 60.275
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
45 24.311 25.901 28.366 30.612 33.350 57.505 61.656 65.410 69.957 73.166
50 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490
55 31.735 33.570 36.398 38.958 42.060 68.796 73.311 77.380 82.292 85.749
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
65 39.383 41.444 44.603 47.450 50.883 79.973 84.821 89.177 94.422 98.105
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
75 47.206 49.475 52.942 56.054 59.795 91.061 96.217 100.839 106.393 110.286
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
85 55.170 57.634 61.389 64.749 68.777 102.079 107.522 112.393 118.236 122.325
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
95 63.250 65.898 69.925 73.520 77.818 113.038 118.752 123.858 129.973 134.247
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
45
Lesen Sie auch noch einmal die Gebrauchsanweisung ganz zu Beginn dieser Seiten.
14.2 Konzentrationsmessung
1. Fall: Sei X ein diskretes Merkmal mit 0 < a1 < . . . < ak . Wir denieren vi als Anteil an der gesamten
Merkmalsumme, den die i kleinsten Merkmalausprägungen auf sich vereinigen,
Pi
j=1 a j nj
vi = Pk , i = 1, 2, . . . , k.
j=1 a j nj
Dann ändert sich die Denition von vi mit den Klassenmitten āj = (a∗j−1 + a∗j )/2:
Pi
j=1 āj nj
vi = Pk , i = 1, 2, . . . , k.
j=1 āj nj
In beiden Fällen deniert man ui als Anteil an allen n Beobachtungen, den die i kleinsten Ausprägungen
ausmachen,
Pi i
j=1 nj X
ui = = hj , i = 1, 2, . . . , k.
n j=1
Konzentrationsäche : Fläche zw. der Diagonalen (Winkelhalbierenden) und Lorenz-Kurve (welche immer
unterhalb verläuft).
Gini-Koezient G: Maÿzahl für Konzentration oder Ungleichheit, deniert als Quotient aus Konzentra-
tionsäche und Fläche unter der Diagonalen:
k
Konzentrationsäche X
G= =1− (ui − ui−1 ) (vi + vi−1 ). (14.1)
Fläche unter Diagonale
i=1
n
G∗ = G mit 0 ≤ G∗ ≤ 1.
n−1
46 14 ANHANG: NUR FÜR STUDENT(INN)EN NACH DER ALTEN PO
Aufgaben
Aufgabe 1
Drei Groÿunternehmen beherrschen einen Markt. Zwei davon haben einen Marktanteil von je 25 %, eines
hat einen Anteil von 50 %. Zur Konzentrationsmessung soll der Gini-Koezient G bestimmt werden.
Lösungshinweis: G = 1/6
Aufgabe 2
In einer achtköpgen WG leben vier Berufstätige und vier Student(inn)en. Zwei der Berufstätigen bezie-
hen 3 (Tausend) e, und je einer bezieht 4 und 7 (Tausend) e Brutto-Monatseinkommen.
b) Nehmen wir an, von den vier Student(inn)en beziehen nach dem Eintritt ins Berufsleben ebenfalls
zwei 3 (Tausend) e und je einer 4 und 7 (Tausend) e Brutto-Monatseinkommen. Wie lautet dann
der Gini-Koezient für alle acht WG-Bewohner(innen) (ohne Rechnung!)?
S1 S2
j aj nj aj nj
1 2 5 1 1
2 10 2 11 2
3 30 1 33 1
4 40 1 44 1
Dabei bezeichnet X den prozentualen Marktanteil mit den Ausprägungen aj . In S1 gibt es z. B. 2 Eisdielen
mit einem Marktanteil von 10 %, in S2 haben 2 Eisdielen je einen Marktanteil von 11 %.
Lösungshinweis: G = 0.904
Aufgaben
Aufgabe 5
Die Aktienkurse am Ende zweier Jahre betragen x1 = 160 und x2 = 80 mit x0 = 100 zu Beginn des
ersten Jahres.
Ein Zufallsvorgang führt zu einem von mehreren, sich gegenseitig ausschlieÿenden Ergebnissen. Vor der
Durchführung ist ungewiss, welches Ergebnis tatsächlich eintreten wird. Von einem Zufallsexperiment
spricht man, wenn der Vorgang unter gleichen Randbedingungen wiederholbar ist. Die Ergebnismenge
Ω ist die Menge aller möglichen Ergebnisse ω , ω ∈ Ω, eines Zufallsvorgangs. Teilmengen von Ω heiÿen
Ereignisse und die speziellen einelementigen Teilmengen {ω} Elementarereignisse.
Leere Menge: {} oder ∅ Unmögliches Ereignis
Auÿerdem seien hier noch einmal kurz einige Rechenregeln für Mengen dargestellt:
48 14 ANHANG: NUR FÜR STUDENT(INN)EN NACH DER ALTEN PO
Kommutativgesetze: A ∩ B = B ∩ A, A ∪ B = B ∪ A
Assoziativgesetze: (A ∩ B) ∩ C = A ∩ (B ∩ C)
(A ∪ B) ∪ C = A ∪ (B ∪ C)
Distributivgesetze: A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Aufgaben
Aufgabe 7
Stellen Sie die folgenden Aussagen über die Ereignisse A, B und C in Venn-Diagrammen und in symbo-
lischer Schreibweise dar:
Lösungshinweise: keine
14.5 Wahrscheinlichkeiten
Wir bezeichnen die Wahrscheinlichkeit für das Eintreten eines Ereignisses A mit P(A). Formal handelt es
sich um eine Abbildung, die A eine reelle Zahl zuordnet. Um Wahrscheinlichkeiten handelt es sich, wenn
die Abbildung die drei Axiome von Kolmogorov erfüllt:
6
1) P(A) ≥ 0,
2) P(Ω) = 1,
3) P(A ∪ B) = P(A) + P(B), falls A ∩ B = ∅.
Rechenregeln:
a) P(∅) =0
c
b) P(A ) = 1 − P(A)
6 Genau genommen muss das dritte Axiom für abzählbar viele Ereignisse gelten.
14.5 Wahrscheinlichkeiten 49
Aufgaben
Aufgabe 8
Wir betrachten die Studenten eines Fachbereichs. Sie müssen jeweils eine Klausur in Statistik und eine in
Mathematik bestehen. 80% der Studenten bestehen Statistik und 90% Mathe. 95% bestehen mindestens
eine der Klausuren.
a) Wie groÿ ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Student beide Klausuren besteht?
b) Wie groÿ ist die Wahrscheinlichkeit, dass ein Student weder die Statistik- noch die Matheklausur
besteht?
c) Wie groÿ ist die Wahrscheinlichkeit, dass ein Student Statistik aber nicht Mathe besteht?
c
⃝ P(A ) ≥ P(B c ), falls B⊆A
Lösungshinweise: keine
Aufgabe 11
Kreuzen Sie für die folgenden Aussagen R (richtig) oder F (falsch) an.
Lösungshinweise: keine
50 14 ANHANG: NUR FÜR STUDENT(INN)EN NACH DER ALTEN PO
Aufgabe 12
In einer ländlichen Gegend Süddeutschlands wählen 80 % der Einwohner(innen) die Partei A (Ereignis
A). 40 % der Einwohner(innen) befürworten den Bau einer Kläranlage (Ereignis B). 20 % der Einwoh-
ner(innen) sind Befürworter(innen) der neuen Kläranlage und A-Wähler(innen) (Wähler(innen) der Partei
A), d. h., es gilt P(A ∩ B) = 0.2.
Wie groÿ ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Einwohner oder eine zufällig ausge-
wählte Einwohnerin ...
P(X = x) = (1 − p)x p, x = 0, 1, 2, . . . ,
1−p 1−p
E(X) = und Var(X) = ,
p p2
x+1
F (x) = 1 − (1 − p) , x = 0, 1, 2, . . . .
b) Doppelexponentialverteilung
X ∼ DEx(λ), λ > 0,
λ λx
λ 2e x≤0
f (x) = e−λ|x| = λ −λx ,
2 2 e x≥0
2
E(X) =0 und Var(X) = ,
λ2
γ1 = 0 und γ2 = 6.
Aufgaben
Aufgabe 13
Die Zufallsvariable X sei geometrisch verteilt mit dem Parameter p = 0.1, d. h., es gilt
0.9x 0.1
für x = 0, 1, 2, . . .
P(X = x) = .
0 sonst
Aufgabe 14
√
Eine Zufallsvariable X folge einer Doppelexponentialverteilung mit dem Parameter λ= 2.
Zum Vergleich Für eine standardnormalverteilte Zufallsvariable Z gilt: P(|Z| > 2.5758) = 0.01.
Cov(X,Y )
die mit ρ= σx σy korreliert sind. Interessiert sind wir an gemeinsamen Wahrscheinlichkeitsaussagen:
P(X ≤ x, Y ≤ y) =?
Solche Wahrscheinlichkeiten lassen sich als Doppelintegral über eine gemeinsame Dichtefunktion f,
f : R2 7→ [0, ∞),
berechnen:
Za Zb
P(X ≤ a, Y ≤ b) = f (x, y)dydx.
−∞ −∞
( " 2 2 #)
1 1 x − µx x − µx y − µy y − µy
f (x, y) = exp − − 2ρ + ,
2(1 − ρ2 )
p
2πσx σy 1 − ρ2 σx σx σy σy
dann heiÿen X und Y bivariat normalverteilt. Symbolisch schreiben wir dann für den Vektor:
X
∼ N2 (µ, Σ),
Y
wobei µ ein Vektor und Σ eine symmetrische Matrix mit (Ko)-Varianzen ist:
µx Var(X) Cov(X, Y )
µ= , Σ= .
µy Cov(X, Y ) Var(Y )
Jede Linearkombination bivariat normalverteilter Zufallsvariablen ist univariat normalverteilt. Für den
Vektor λ ∈ R2 mit der Transponierten λ′ = (λ1 , λ2 ) gilt:
′ X
λ = λ1 X + λ2 Y ∼ N (λ′ µ, λ′ Σλ).
Y
Aufgaben
Aufgabe 15
X und Y seien bivariat normalverteilt,
X 0 1 1/2
∼ N2 (µ, Σ), µ= , Σ= .
Y 1 1/2 2
a) Betrachten Sie den Vektor λ′ = (0, 1), und bestimmen Sie den Erwartungswert
′ X
E λ .
Y
Aufgabe 16
X und Y seien bivariat normalverteilt,
X 0 1 0
∼ N2 (µ, Σ), µ= , Σ= .
Y 1 0 2
Bestimmen Sie die gemeinsame Dichte f (x, y) und die beiden Randdichten fx (x) und fy (y).
L(θ) = P (X1 = x1 , X2 = x2 , . . . , Xn = xn ; θ)
= P (X1 = x1 ; θ) · . . . · P (Xn = xn ; θ).
Der ML-Schätzer ist das Argument, das L(θ) maximiert, oder anders gesprochen: Für alle θ gilt: L(θ̂M L ) ≥
L(θ).
Sind die Variablen stetig, so wird die Likelihoodfunktion in termini von Dichtefunktionen deniert:
Aus rechentechnischen Gründen empehlt es sich oft, äquivalent θbM L als die Stelle zu bestimmen, wo die
sog. Log-Likelihoodfunktion, d. h. ℓ(θ) = log(L(θ)), maximal wird.
Aufgaben
Aufgabe 17
Für jemanden, der ohne Kenntnis der Fahrzeiten zufällig zum U-Bahnhof Bockenheimer Warte geht, kann
die Wartezeit X auf den Zug als stetig gleichverteilt auf dem Intervall [ 0, b ] angenommen werden, b > 0.
Ein zerstreuter Professor, der sich den Fahrplan nicht merken kann, wartet an fünf Tagen
An weiteren fünf Tagen wartet er 7.8, 2.2, 4.3, 6.0 und 3.7 Minuten.
θ3 2 −θx
f (x) = x e , θ > 0, x > 0,
2
und f (x) = 0 für x ≤ 0.
Bestimmen Sie den Maximum-Likelihood-Schätzwert θbM L für eine Stichprobe x1 , ...., xn .
Lösungshinweise: θ̂M L = 3/x
Aufgabe 19
Gegeben sei eine Zufallsstichprobe Xi , i = 1, ..., n, welche einer geometrischen Verteilung mit dem Para-
meter p folgt. Aus einer Realisation erhält man für das arithmetische Mittel x = 2.
Bestimmen Sie den Maximum-Likelihood-Schätzer für p. Welcher Schätzwert ergibt sich aus der Stich-
probe?
Wenn Zi eine standardnormalverteilte Zufallsvariable ist, dann folgt das Quadrat einer sogenannten χ2 -
Verteilung mit einem Freiheitsgrad:
Zi2 ∼ χ2 (1) .
Liegen n unabhängige standardnormalverteilte Zufallsvariablen vor, so gilt für deren Quadratsumme,
dass sie einer χ2 -Verteilung mit n Freiheitsgraden folgt:
n n
X X (Xi − µ)2
Zi2 = ∼ χ2 (n). (14.2)
i=1 i=1
σ2
Quantile der Verteilungen sind in Abhängigkeit des Freiheitsgradparameters in Tabelle F tabelliert. Wir
bezeichnen das p-Quantil bei ν Freiheitsgraden wie folgt: χ2p (ν).
In der Praxis ist µ nicht bekannt. Ersetzt man es durch seinen konsistenten und erwartungstreuen Schät-
zer, so reduziert sich der Freiheitsgrad um Eins, und es gilt:
n
S2 X (Xi − X)2
(n − 1) = ∼ χ2 (n − 1) . (14.3)
σ2 i=1
σ 2
Dieses Ergebnis kann man nutzen, um ein Kondenzintervall für die Varianz basierend auf der erwar-
tungstreuen Varianzschätzung wie folgt zu konstruieren:
" #
(n − 1)S 2 (n − 1)S 2
KI1−α = ; . (14.4)
χ21− α (n − 1) χ2α (n − 1)
2 2
Dies setzt allerdings wie gesagt voraus, dass X1 bis Xn unabhängig einer identischen Normalverteilung
folgen.
54 14 ANHANG: NUR FÜR STUDENT(INN)EN NACH DER ALTEN PO
Aufgaben
Aufgabe 20
Für n = 31 Tage wurde die Varianz einer Rendite erwartungstreu durch s2 = 0.2927 geschätzt.
a) Bestimmen Sie ein Kondenzintervall für σ2 zum Niveau 1 − α = 0.95 aufgrund der Stichprobe (bei
unterstellter Normalverteilung).
b) Führen Sie einen zweiseitigen Test auf die Nullhypothese H0 : σ 2 = 0.25 zum Niveau α = 0.05 durch.
c) Führen Sie einen zweiseitigen Test auf die Nullhypothese H0 : σ 2 = 0.25 zum Niveau α = 0.01 durch.
14.10 Varianzanalyse
Die (einfaktorielle) Varianzanalyse7 , oft auch als ANOVA (analysis of variance) bezeichnet, ist die Ver-
allgemeinerung des Zweistichproben-t-Tests für den Mehrstichprobenfall. Im Zusammenhang mit der
Varianzanalyse taucht eine neue Verteilung auf, die sog. F -Verteilung. Die F -Verteilung hängt nicht
nur von einem, sondern sogar von zwei Freiheitsgradparametern ab, siehe Tabelle E enthält Quantile
in Abhängigkeit der Freiheitsgrade. In folgendem Testschema bezeichnet c die Anzahl der unabhängigen
Stichproben, c ≥ 2, vom Umfang ni , i = 1, . . . , c. Die Gesamtzahl aller Beobachtungen wird mit n notiert.
Vorausgesetzt wird genau wie beim 2-Stichproben-t-Test auÿer der Normalverteilung auch die Gleichheit
der Varianzen in allen Stichproben.
Varianzanalyse
Pc
Modell: Xij ∼ N (µi , σi2 ), i = 1, . . . , c und j = 1, . . . , ni , n = i=1 ni ,
Xij unabhängig, σ12 = σ22 = . . . = σc2
Hypothesen: H0 : µ1 = µ2 = . . . = µc gegen
H1 : µi ̸= µj für mindestens ein Paar (i, j), i ̸= j
Pc
SSB = i=1 ni (X i − X)2
1
Pni 1
Pc Pni
mit X i = j=1 Xij und X = n i=1 j=1 Xij
Pnci P ni
SSW = i=1 j=1 (Xij − X i )2
n − c SSB
Teststatistik: F =
c − 1 SSW
Verteilung unter H0 : F ∼ F (c − 1, n − c)
Testentscheidung:
H0 ablehnen, wenn F > F1−α (c − 1, n − c)
In dieser schematischen Darstellung bezeichnet SSW die sum of squares within, d.h. die Quadratsumme
innerhalb der Stichproben. Als nächstes betrachten wir quadrierte Abweichungen der Stichprobenmittel
vom Gesamtmittel (X̄ ), genauer mit den Stichprobenumfängen gewichtet. Da hier quadrierte Abweichun-
gen zwischen (between) den Stichproben aufsummiert werden, verwendet man die Abkürzung SSB für
sum of squares between:
c
X
SSB = ni (X i − X)2 .
i=1
Die Varianzanalyse besteht dann einfach aus einer Evaluation folgender F-Statistik:
1
c−1 SSB n − c SSB
F = 1 = .
n−c SSW
c − 1 SSW
7 Einfaktoriell im Unterschied zu einer hier nicht behandelten mehrfaktoriellen Varianzanalyse.
14.10 Varianzanalyse 55
a
Bei groÿem Stichprobenumfang gilt unter der Nullhypothese approximativ: (c − 1)F ∼ χ2 (c − 1).
Aufgaben
Aufgabe 21
In dieser Aufgabe geht es um den Vergleich von Mieten, allerdings nicht auf der Basis von drei Gruppen.
Das Ziel ist die Klärung der Frage, ob sich die durchschnittlichen Mieten pro m2 für 3-Zimmer-Wohnungen
in drei Städten signikant unterscheiden. Die Zahlenwerte dieser Aufgabe sind sehr einfach gehalten, um
die einzelnen Rechenschritte nachvollziehbar zu machen. Die Mietdaten lauten wie folgt:
Stadt 1 9 8 10
Stadt 2 7 9 8 12 9
Stadt 3 10 13 14 12
Die arithmetischen Mittel und die Wurzeln aus den Stichprobenvarianzen ergeben sich wie folgt: Tabelle:
MIETE
STADT ni xi si
1 3 9.0000 1.0000
2 5 9.0000 1.8708
3 4 12.2500 1.7078
⃝ Der Wert der F -Statistik, der mit der F -Verteilung verglichen wird, beträgt 0.1598.
8 SSB
⃝ Der Wert der F -Statistik, der mit der F -Verteilung verglichen wird, berechnet sich als F = 2 SSW .
⃝ Die Nullhypothese wird bei einer Irrtumswahrscheinlichkeit von 5 % abgelehnt, wenn die F-Statistik
gröÿer als 3.32 ist.
⃝ Die F -Statistik darf näherungsweise mit Quantilen einer χ2 -Verteilung mit 33 Freiheitsgraden vergli-
chen werden.
Lösungshinweise: keine
Aufgabe 23
Aus jährlichen Daten wurden über ni Jahre die Anteile der Ausgaben für Entwicklungshilfe am Brutto-
nationaleinkommen (Xij in %) in 4 Ländern beobachtet (d. h., i = 1, 2, 3, 4). Es ergaben sich folgende
Mittelwerte und Stichprobenvarianzen bei den angegebenen Stichprobenumfängen ni :
i 1 2 3 4
Wir unterstellen für die Daten Normalverteilung, Unabhängigkeit und identische Varianzen. Führen Sie
eine Varianzanalyse durch zum Signikanzniveau α = 0.05.
c) Unterstellen Sie nun SSW = 6.1 für die sum of squares within und SSB = 57.9 für die sum of
squares between. Welchen Wert hat dann die F -Statistik?
d) Wie lautet der kritische Wert beim Test auf Gleichheit der mittleren Anteile zum Niveau α = 0.05?
γ1 = 0 und γ2 = 3.
Es ist bequem, mit den geschätzten Schiefe- und Kurtosis-Koezienten aus Abschnitt 4.3.4 folgende
Abkürzungen einzuführen:
√ γ
b1 √ (b
γ2 − 3)
Γ1 = n√ und Γ2 = n √ .
6 24
Der Test ist asymptotisch oder approximativ, denn es gilt mit wachsendem Stichprobenumfang für die
Quadrate:
a a a
Γ21 ∼ χ2 (1) , Γ22 ∼ χ2 (1) und JB = Γ21 + Γ22 ∼ χ2 (2).
In der Ökonometrie wird die Summe der beiden Quadrate (JB ) gern nach den Autoren Jarque und Bera
benannt. Abgelehnt zum Niveau α wird, falls die Prüfgröÿen das entsprechende Quantil χ21−α überschrei-
ten (mit 1 bzw. 2 Freiheitsgraden). Der Test lehnt also für zu groÿe Werte ab.
14.11.2 χ2 -Anpassungstest
Diskrete Verteilungen lassen sich im Rahmen des χ2 -Anpassungstests direkt überprüfen, stetige Variablen
hingegen müssen klassiert werden. In der Klassierung steckt natürlich eine gewisse Willkür, die beim
Testen stetiger Verteilungen Schwierigkeiten mit sich bringt.
Testschema:
χ2 -Anpassungstest
Modell: Xi , i = 1, . . . , n, i.i.d.,
aber keine spez. Verteilungsannahme
(0)
Hypothesen: H0 : P (X = aj ) = pj bzw.
(0)
P (a∗j−1 < X ≤ a∗j ) = pj , j = 1, . . . , k gegen
(0)
H1 : Mindestens eine Wahrscheinlichkeit ist ungleich pj
Pk (nj − ñj ) 2
(0)
Teststatistik: χ2 = j=1 mit ñj = n · pj
ñj
nj = n · H(X = aj ) bzw. nj = n · H(a∗j−1 < X ≤ a∗j )
a
Verteilung unter H0 : χ2 ∼ χ2 (r) mit r = k − 1 − ℓ
H0 ablehnen, wenn χ2 > χ21−α (r)
Bemerkungen: a) ñj ≥ 5 für Approximation, j = 1, . . . , k
b) ℓ ist die Anzahl der geschätzten Parameter
14.11 Tests auf Verteilung 57
Die Prüfgröÿe beruht auf dem Vergleich von tatsächlich beobachteten Häugkeiten nj (siehe Abschnitt
2.2) mit den unter H0 zu erwartenden Häugkeiten. Da diese Abweichungen quadriert werden, führt die
Teststatistik (approximativ) auf eine χ2 -Verteilung mit r Freiheitsgraden.
2
Im Rahmen des χ -Anpassungstests werden überdies zwei Varianten unterschieden:
Verteilungen mit ℓ unter H0 unbekannten Parametern, die geschätzt werden müssen; in dem Fall
wird mit den Quantilen der χ2 (k − 1 − ℓ)-Verteilung gearbeitet.
Aufgaben
Aufgabe 24
Es werden Renditen an n = 131 aufeinanderfolgenden Tagen beobachtet. Die Schiefe- und Kurtosis-
Koezienten ergeben sich daraus als
b1 = −0.12
γ und γ
b2 = 3.84 .
Es soll die Hypothese der Normalverteilung überprüft werden. Testen Sie dazu die Nullhypothese, dass
c) ... die Schiefe gleich 0 ist und die Kurtosis gleich 3 ist.
b) Testen Sie die Behauptung des Herstellers zu den Niveaus α = 0.10, α = 0.05 und α = 0.01.
Lösungshinweise: a) H0 : P(X=1)=0.9 H1 : P(X=1)̸=0.9 b) χ2 = 5.5̄; χ2 > χ20.9 (1) → H0 ablehnen;
χ2 > χ20.95 (1) → H0 ablehnen; χ2 < χ20.99 (1) → H0 nicht ablehnen
Aufgabe 26
Es soll untersucht werden, ob die Anzahl der Einsätze X pro Stunde der Feuerwehr einer Frankfurter
Wache einer Poisson-Verteilung folgen. Die folgende Häugkeitstabelle enthält die Anzahl der Einsätze
für alle Stunden eines Monats.
Testen Sie die Hypothese zum Niveau α = 0.05 auf Basis dieser Tabelle für
a) λ=1 bzw.
b) λ unbekannt.
Aufgabe 27
Aus einer Stichprobe von 125 Renditebeobachtungen wurde das Schiefemaÿ wie folgt geschätzt:
γ
b1 = 0.767 .
p = 0.95 r
ν 1 2 3 4 5 6 7 8 9 10
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40
3 10.13 9.55 9.28 9.14 9.04 8.97 8.92 8.88 8.84 8.82
4 7.71 6.94 6.59 6.39 6.26 6.17 6.10 6.05 6.01 5.97
5 6.61 5.79 5.40 5.19 5.05 4.95 4.88 4.82 4.77 4.74
6 5.99 5.14 4.75 4.53 4.39 4.28 4.21 4.15 4.10 4.06
7 5.59 4.74 4.34 4.12 3.97 3.87 3.79 3.73 3.68 3.64
8 5.32 4.46 4.06 3.84 3.69 3.58 3.50 3.44 3.39 3.35
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14
10 4.96 4.10 3.70 3.48 3.33 3.22 3.14 3.07 3.02 2.98
11 4.84 3.98 3.58 3.35 3.20 3.09 3.01 2.95 2.90 2.85
12 4.75 3.89 3.48 3.26 3.11 3.00 2.91 2.85 2.80 2.75
13 4.67 3.81 3.40 3.18 3.02 2.91 2.83 2.77 2.71 2.67
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60
15 4.54 3.68 3.28 3.05 2.90 2.79 2.71 2.64 2.59 2.54
16 4.49 3.63 3.23 3.01 2.85 2.74 2.66 2.59 2.54 2.49
17 4.45 3.59 3.19 2.96 2.81 2.70 2.61 2.55 2.49 2.45
18 4.41 3.55 3.15 2.93 2.77 2.66 2.58 2.51 2.46 2.41
19 4.38 3.52 3.12 2.89 2.74 2.63 2.54 2.48 2.42 2.38
20 4.35 3.49 3.09 2.86 2.71 2.60 2.51 2.45 2.39 2.35
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32
22 4.30 3.44 3.04 2.82 2.66 2.55 2.46 2.40 2.34 2.30
23 4.28 3.42 3.02 2.79 2.64 2.53 2.44 2.37 2.32 2.27
24 4.26 3.40 3.00 2.77 2.62 2.51 2.42 2.35 2.30 2.25
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24
26 4.23 3.37 2.97 2.74 2.59 2.47 2.39 2.32 2.27 2.22
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20
28 4.20 3.34 2.94 2.71 2.56 2.44 2.36 2.29 2.24 2.19
29 4.18 3.33 2.93 2.70 2.54 2.43 2.35 2.28 2.22 2.18
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16
35 4.12 3.27 2.87 2.64 2.48 2.37 2.29 2.22 2.16 2.11
40 4.08 3.23 2.83 2.60 2.45 2.34 2.25 2.18 2.12 2.08
45 4.06 3.20 2.81 2.58 2.42 2.31 2.22 2.15 2.10 2.05
50 4.03 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03
55 4.02 3.16 2.77 2.54 2.38 2.27 2.18 2.11 2.06 2.01
60 4.00 3.15 2.75 2.52 2.37 2.25 2.17 2.10 2.04 1.99
65 3.99 3.14 2.74 2.51 2.36 2.24 2.15 2.08 2.03 1.98
70 3.98 3.13 2.73 2.50 2.35 2.23 2.14 2.07 2.02 1.97
75 3.97 3.12 2.72 2.49 2.34 2.22 2.13 2.06 2.01 1.96
80 3.96 3.11 2.71 2.48 2.33 2.21 2.13 2.06 2.00 1.95
85 3.95 3.10 2.71 2.48 2.32 2.21 2.12 2.05 1.99 1.94
90 3.95 3.10 2.70 2.47 2.32 2.20 2.11 2.04 1.99 1.94
95 3.94 3.09 2.70 2.47 2.31 2.20 2.11 2.04 1.98 1.93
100 3.94 3.09 2.69 2.46 2.30 2.19 2.10 2.03 1.97 1.93
60 14 ANHANG: NUR FÜR STUDENT(INN)EN NACH DER ALTEN PO
p = 0.975 r
ν 1 2 3 4 5 6 7 8 9 10
1 647.79 799.50 864.16 899.58 921.85 937.11 948.22 956.66 963.28 968.63
2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40
3 17.44 16.04 15.44 15.18 14.98 14.83 14.72 14.64 14.57 14.52
4 12.22 10.65 9.97 9.60 9.38 9.21 9.09 9.00 8.92 8.86
5 10.01 8.43 7.74 7.39 7.15 6.98 6.86 6.76 6.69 6.62
6 8.81 7.26 6.58 6.22 5.99 5.82 5.70 5.60 5.53 5.46
7 8.07 6.54 5.87 5.52 5.28 5.12 4.99 4.90 4.82 4.76
8 7.57 6.06 5.40 5.05 4.82 4.65 4.53 4.43 4.36 4.30
9 7.21 5.71 5.06 4.71 4.48 4.32 4.20 4.10 4.03 3.96
10 6.94 5.46 4.81 4.46 4.23 4.07 3.95 3.85 3.78 3.72
11 6.72 5.26 4.62 4.27 4.04 3.88 3.76 3.66 3.59 3.53
12 6.55 5.10 4.46 4.12 3.89 3.73 3.61 3.51 3.44 3.37
13 6.41 4.97 4.33 3.99 3.77 3.60 3.48 3.39 3.31 3.25
14 6.30 4.86 4.23 3.89 3.66 3.50 3.38 3.29 3.21 3.15
15 6.20 4.77 4.14 3.80 3.57 3.41 3.29 3.20 3.12 3.06
16 6.12 4.69 4.06 3.73 3.50 3.34 3.22 3.12 3.05 2.99
17 6.04 4.62 4.00 3.66 3.44 3.28 3.16 3.06 2.98 2.92
18 5.98 4.56 3.94 3.60 3.38 3.22 3.10 3.01 2.93 2.87
19 5.92 4.51 3.89 3.56 3.33 3.17 3.05 2.96 2.88 2.82
20 5.87 4.46 3.85 3.51 3.29 3.13 3.01 2.91 2.84 2.77
21 5.83 4.42 3.81 3.47 3.25 3.09 2.97 2.87 2.80 2.73
22 5.79 4.38 3.77 3.44 3.21 3.05 2.93 2.84 2.76 2.70
23 5.75 4.35 3.74 3.40 3.18 3.02 2.90 2.81 2.73 2.67
24 5.72 4.32 3.71 3.38 3.15 2.99 2.87 2.78 2.70 2.64
25 5.69 4.29 3.68 3.35 3.13 2.97 2.85 2.75 2.68 2.61
26 5.66 4.27 3.66 3.33 3.10 2.94 2.82 2.73 2.65 2.59
27 5.63 4.24 3.64 3.30 3.08 2.92 2.80 2.71 2.63 2.57
28 5.61 4.22 3.62 3.28 3.06 2.90 2.78 2.69 2.61 2.55
29 5.59 4.20 3.60 3.26 3.04 2.88 2.76 2.67 2.59 2.53
30 5.57 4.18 3.58 3.25 3.03 2.87 2.75 2.65 2.57 2.51
35 5.48 4.11 3.51 3.18 2.95 2.80 2.68 2.58 2.50 2.44
40 5.42 4.05 3.45 3.12 2.90 2.74 2.62 2.53 2.45 2.39
45 5.38 4.01 3.41 3.08 2.86 2.70 2.58 2.49 2.41 2.35
50 5.34 3.97 3.38 3.05 2.83 2.67 2.55 2.46 2.38 2.32
55 5.31 3.95 3.36 3.03 2.81 2.65 2.53 2.43 2.36 2.29
60 5.29 3.93 3.33 3.00 2.79 2.63 2.51 2.41 2.33 2.27
65 5.26 3.91 3.32 2.99 2.77 2.61 2.49 2.39 2.32 2.25
70 5.25 3.89 3.30 2.97 2.75 2.59 2.47 2.38 2.30 2.24
75 5.23 3.88 3.29 2.96 2.74 2.58 2.46 2.37 2.29 2.22
80 5.22 3.86 3.28 2.95 2.73 2.57 2.45 2.35 2.28 2.21
85 5.21 3.85 3.27 2.94 2.72 2.56 2.44 2.34 2.27 2.20
90 5.20 3.84 3.26 2.93 2.71 2.55 2.43 2.34 2.26 2.19
95 5.19 3.84 3.25 2.92 2.70 2.54 2.42 2.33 2.25 2.19
100 5.18 3.83 3.24 2.91 2.70 2.54 2.42 2.32 2.24 2.18