Wir beschäftigen uns hier mit der mittleren Lage der Verteilung von
X
{\displaystyle X}
, gekennzeichnet durch den Erwartungswert
E
(
X
)
{\displaystyle \operatorname {E} (X)}
und der »Streuung« der Zufallswerte von
X
{\displaystyle X}
. Damit ist gemeint, wie groß die allgemeine Abweichung vom Mittelwert ist. Man kann auch von der Ausdehnung oder der Skalierung der Verteilung sprechen.
Um die Streuung zu messen, betrachten wir, wie stark die Werte von
X
{\displaystyle X}
von
E
(
X
)
{\displaystyle \operatorname {E} (X)}
abweichen. Die Abweichungen werden bestimmt durch die Zufallsvariable
|
X
−
E
(
X
)
|
{\displaystyle |X-\operatorname {E} (X)|}
, d. h. durch die Abstände von
X
{\displaystyle X}
bis
E
(
X
)
{\displaystyle \operatorname {E} (X)}
. Obwohl auch der Erwartungswert dieser Abstände, also
E
(
|
X
−
E
(
X
)
|
)
{\displaystyle \operatorname {E} (|X-\operatorname {E} (X)|)}
, als Maß für die Streuung im Betracht kommt, ist es üblich, die Erwartung der Quadrate dieser Abstände, also das zweite zentrale Moment
E
(
(
X
−
E
(
X
)
)
2
)
{\displaystyle \operatorname {E} ((X-\operatorname {E} (X))^{2})}
, als Maß zu nehmen. Diese Größe, also der erwartete quadratische Abstand, wird Varianz genannt.
Das zweite zentrale Moment einer Zufallsvariablen
X
{\displaystyle X}
nennen wir die Varianz von
X
{\displaystyle X}
und notieren es als
Var
(
X
)
{\displaystyle \operatorname {Var} (X)}
:
Var
(
X
)
:=
E
(
(
X
−
E
(
X
)
)
2
)
.
{\displaystyle \operatorname {Var} (X):=\operatorname {E} ((X-\operatorname {E} (X))^{2}).}
Weil die Varianz eine quadratische Größe ist, wird, wenn
X
{\displaystyle X}
in cm gemessen ist, die Varianz in cm2 ausgedrückt. Das bildet eine Schwierigkeit bei der praktischen Anwendung, die sich noch deutlicher zeigt, wenn wir die Varianz von z. B.
10
X
{\displaystyle 10X}
bestimmen. Dann zeigt sich, dass
Var
(
10
X
)
=
100
⋅
Var
(
X
)
{\displaystyle \operatorname {Var} (10X)=100\cdot \operatorname {Var} (X)}
, also eine Skalierungsänderung mit einem Faktor 10 bedeutet für das Skalierungsmaß einen Faktor 100. Deshalb wird die Quadratwurzel der Varianz, die wir Standardabweichung nennen, als praktisches Maß für Streuung benutzt.
Unter der Standardabweichung einer Zufallsvariablen
X
{\displaystyle X}
, bezeichnet mit
σ
X
{\displaystyle \sigma _{X}}
(oder
σ
(
X
)
{\displaystyle \sigma (X)}
), verstehen wir die Größe:
σ
X
:=
V
a
r
(
X
)
.
{\displaystyle \sigma _{X}:={\sqrt {\mathrm {Var} (X)}}.}
Um
Var
(
X
)
{\displaystyle \operatorname {Var} (X)}
zu berechnen, ist es oft nützlich die nächste Formel zu benutzen, die direkt aus der Definition von
Var
(
X
)
{\displaystyle \operatorname {Var} (X)}
hergeleitet werden kann.
Für die Varianz einer Zufallvariablen
X
{\displaystyle X}
gilt:
V
a
r
(
X
)
=
E
(
X
2
)
−
(
E
(
X
)
)
2
.
{\displaystyle \mathrm {Var} (X)=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}.}
Vorsicht ist geboten bei Berechnungen mit dieser Formel. Außer durch Rechenfehler entsteht auch durch vorzeitiges oder zu grobes Abrunden der Zwischenergebnisse leicht ein ungenauer Wert für die Varianz, oft sogar ein negativer Wert.
Wir zeigen an Hand eines Beispiels einige Berechnungen.
Beispiel 1 (zweimal Würfeln (Fortsetzung))
Bearbeiten
Die nächste Tabelle zeigt die Verteilung von
M
{\displaystyle M}
und die benötigte Berechnungen, um
Var
(
M
)
{\displaystyle \operatorname {Var} (M)}
zu bestimmen.
m
{\displaystyle m}
P
(
M
=
m
)
{\displaystyle P(M=m)}
m
P
(
M
=
m
)
{\displaystyle mP(M=m)}
m
−
E
(
M
)
{\displaystyle m-\operatorname {E} (M)}
(
m
−
E
(
M
)
)
2
{\displaystyle (m-\operatorname {E} (M))^{2}}
(
m
−
E
(
M
)
)
2
P
(
M
=
m
)
{\displaystyle (m-\operatorname {E} (M))^{2}P(M=m)}
m
2
P
(
M
=
m
)
{\displaystyle m^{2}P(M=m)}
1
1/36
1/36
−125/36
15625/1296
15625/46656
1/36
2
3/36
6/36
−89/36
7921/1296
23763/46656
12/36
3
5/36
15/36
−53/36
2809/1296
14045/46656
45/36
4
7/36
28/36
−17/36
289/1296
2023/46656
112/36
5
9/36
45/36
19/36
361/1296
3249/46656
225/36
6
11/36
66/36
55/36
3025/1296
33275/46656
396/36
Total
36/36
161/36
91980/46656
791/36
Es ergibt sich
E
(
M
)
=
161
/
36
{\displaystyle \operatorname {E} (M)=161/36}
und
V
a
r
(
M
)
=
E
(
(
M
−
E
(
M
)
)
2
)
=
∑
m
=
1
6
(
m
−
161
36
)
2
⋅
P
(
M
=
m
)
=
91980
46656
≈
1
,
97
.
{\displaystyle \mathrm {Var} (M)=\operatorname {E} ((M-\operatorname {E} (M))^{2})=\sum _{m=1}^{6}{\big (}m-{\tfrac {161}{36}}{\big )}^{2}\cdot P(M=m)={\tfrac {91980}{46656}}\approx 1{,}97\,.}
Mit dem Verschiebungssatz bekommen wir gleichfalls:
V
a
r
(
M
)
=
E
(
M
2
)
−
(
E
(
M
)
)
2
=
∑
m
=
1
6
m
2
P
(
M
=
m
)
−
(
E
(
M
)
)
2
=
791
36
−
(
161
36
)
2
=
91980
46656
.
{\displaystyle \mathrm {Var} (M)=\operatorname {E} (M^{2})-(\operatorname {E} (M))^{2}=\sum _{m=1}^{6}m^{2}P(M=m)-(\operatorname {E} (M))^{2}={\tfrac {791}{36}}-{\big (}{\tfrac {161}{36}}{\big )}^{2}={\tfrac {91980}{46656}}\,.}
Die Standardabweichung ist:
σ
M
=
V
a
r
(
M
)
=
91980
46656
=
1
,
40
.
{\displaystyle \sigma _{M}={\sqrt {\mathrm {Var} (M)}}={\sqrt {\tfrac {91980}{46656}}}=1{,}40\,.}
Wir berechnen auch
Var
(
Z
{\displaystyle \operatorname {Var} (Z}
):
z
{\displaystyle z}
2
3
4
5
6
7
8
9
10
11
12
Total
P
(
Z
=
z
)
{\displaystyle P(Z=z)}
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
36/36
z
P
(
Z
=
z
)
{\displaystyle zP(Z=z)}
2/36
6/36
12/36
20/36
30/36
42/36
40/36
36/36
30/36
22/36
12/36
252/36
z
2
P
(
Z
=
z
)
{\displaystyle z^{2}P(Z=z)}
4/36
18/36
48/36
100/36
180/36
294/36
320/36
324/36
300/36
242/36
144/36
1974/36
Also ist
V
a
r
(
Z
)
=
E
(
Z
2
)
−
(
E
(
Z
)
)
2
=
1974
36
−
49
=
210
36
=
5
5
6
{\displaystyle \mathrm {Var} (Z)=\operatorname {E} (Z^{2})-(\operatorname {E} (Z))^{2}={\tfrac {1974}{36}}-49={\tfrac {210}{36}}=5{\tfrac {5}{6}}}
und
σ
Z
=
Var
(
Z
)
=
210
36
=
2
,
42
.
{\displaystyle \sigma _{Z}={\sqrt {\operatorname {Var} (Z)}}={\sqrt {\tfrac {210}{36}}}=2{,}42\,.}
Man Bemerke, dass die Streuung in
Z
{\displaystyle Z}
größer ist als in
M
{\displaystyle M}
.
Die nächsten Eigenschaften der Varianz sind von Bedeutung.
Satz 7.2.2 (Eigenschaften von Varianz und Standardabweichung)
Bearbeiten
Für die Varianz einer Zufallsvariable
X
{\displaystyle X}
gilt:
(a)
Var
(
X
)
≥
0
{\displaystyle \operatorname {Var} (X)\geq 0}
und
σ
(
X
)
≥
0
{\displaystyle \sigma (X)\geq 0}
.
(b) wenn
Var
(
X
)
=
0
{\displaystyle \operatorname {Var} (X)=0}
, dann ist
X
{\displaystyle X}
entartet (d. h.
P
(
X
=
E
(
X
)
)
=
1
{\displaystyle P(X=\operatorname {E} (X))=1}
)
(c)
Var
(
a
X
+
b
)
=
a
2
Var
(
X
)
{\displaystyle \operatorname {Var} (aX+b)=a^{2}\operatorname {Var} (X)}
und
σ
(
a
X
+
b
)
=
|
a
|
σ
(
X
)
{\displaystyle \sigma (aX+b)=|a|\sigma (X)}
für jedes
a
{\displaystyle a}
und
b
{\displaystyle b}
.
Beweis
(c)
Var
(
a
X
+
b
)
=
E
(
(
a
X
+
b
−
E
(
a
X
+
b
)
)
2
)
=
E
(
(
a
X
+
b
−
a
E
(
X
)
−
b
)
2
)
=
a
2
E
(
(
X
−
E
(
X
)
)
2
)
=
a
2
Var
(
X
)
{\displaystyle \operatorname {Var} (aX+b)=\operatorname {E} ((aX+b-\operatorname {E} (aX+b))^{2})=\operatorname {E} ((aX+b-a\operatorname {E} (X)-b)^{2})=a^{2}\operatorname {E} ((X-\operatorname {E} (X))^{2})=a^{2}\operatorname {Var} (X)}
.
Beispiel 2 (zweimal Würfeln (Fortsetzung))
Bearbeiten
Wir haben berechnet:
Var
(
Z
)
=
E
(
Z
2
)
−
(
E
(
Z
)
)
2
=
5
5
6
{\displaystyle \operatorname {Var} (Z)=\operatorname {E} (Z^{2})-(\operatorname {E} (Z))^{2}=5{\tfrac {5}{6}}}
und
σ
Z
=
210
36
=
2
,
42
.
{\displaystyle \sigma _{Z}={\sqrt {\frac {210}{36}}}=2{,}42\,.}
Nun ist
Z
=
X
+
Y
{\displaystyle Z=X+Y}
, und die Ergebnisse
X
{\displaystyle X}
und
Y
{\displaystyle Y}
der einzelnen Würfen sind identisch verteilt. Wir wissen schon, dass die Verteilung von
X
+
Y
{\displaystyle X+Y}
eine andere ist als die Verteilung von
X
+
X
=
2
X
{\displaystyle X+X=2X}
. Das zeigt sich auch, wenn wir die Varianz von
2
X
{\displaystyle 2X}
berechnen:
Var
(
2
X
)
=
2
2
V
a
r
(
X
)
=
4
∑
x
=
1
6
(
x
−
7
2
)
2
⋅
1
6
=
4
⋅
105
36
=
11
2
3
≠
V
a
r
(
Z
)
.
{\displaystyle \operatorname {Var} (2X)=2^{2}\mathrm {Var} (X)=4\sum _{x=1}^{6}{\big (}x-{\tfrac {7}{2}}{\big )}^{2}\cdot {\tfrac {1}{6}}=4\cdot {\tfrac {105}{36}}=11{\tfrac {2}{3}}\neq \mathrm {Var} (Z)\,.}