Statistik: Streuungsparameter eines Merkmals mit wenig verschiedenen Ausprägungen

Hier wollen wir die Berechnung der Varianz eines häufbaren metrischen Merkmals ansehen. Unsere Überlegungen laufen analog zum arithmetischen Mittel. Wir betrachten das

Beispiel mit den verkauften Weinflaschen

Aus der Urliste mit 25 Beobachtungen:

4 4 4 4 4 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 10 10 10 10 10  

berechnen wir die Stichprobenvarianz aus

In dieser Formel ist xi die i. Beobachtung aus der Urliste.

Analog zum arithmetischen Mittel eines Merkmals mit wenig Ausprägungen werden wir aber nicht die obige Formel für die Varianz verwenden, sondern die Vorteile der Häufigkeitstabelle nützen. Wir können nämlich die Stichprobenvarianz berechnen als

wobei die xj jetzt die verschiedenen Ausprägungen des Merkmals darstellen.

j Preis für eine
Weinflasche

xj
absolute
Häufigkeit

nj
xj nj

1

4

5

20

5,5696

27,8480

2

5

8

40

1,8496

14,7968

3

7

7

49

0,4096

2,8672

4

10

5

50

13,2496

66,2480

Σ

25

159

111,7600

Zunächst benötigen wir den Mittelwert . Er berechnet sich wie in Lageparameter als

Wir erhalten nun

Der Computer kann das leicht ermitteln. Möchten wir jedoch die Varianz händisch ausrechnen, finden wir den „krummen“ Mittelwert als störend. Wir können natürlich auch hier den Verschiebungssatz anwenden. Es gilt nämlich für die benötigte Quadratsumme:

Wir berechnen sukzessive in unserer Häufigkeitstabelle die xj2 und xj2 nj und erhalten zunächst für Q

und für die Varianz


j Preis für eine
Weinflasche

xj
absolute
Häufigkeit

nj
 
xj nj
xj2 xj2nj
1 4 5 20 16 80
2 5 8 40 25 200
3 7 7 49 49 343
4 10 5 50 100 500
Σ   25 159   1123