Formelsammlung Statistik/ Varianzanalyse

univariate Varianzanalyse (ANOVA)

Man untersucht man den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägungen einer Zufallsvariablen.

Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen, und zwar vergleicht man die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen.

Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse.

Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests bei mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test.

Es sei $\mu _{i}$ der Erwartungswert der abhängigen Variable in der i. Gruppe.

\!H_{0}:\mu _{1}=\mu _{2}=...=\mu _{k}

(Es besteht kein Unterschied zwischen den Erwartungswerten der Gruppen.)

\!H_{1}:\exists i,j:\ \mu _{i}\neq \mu _{j}

(Es besteht zwischen mindestens zwei Erwartungswerten ein Unterschied.)

→ Wir wissen dann nur mit einer bestimmten Wahrscheinlichkeit, dass mindestens zwei Ausprägungen einen bedeutsamen Unterschied aufweisen.

Effektdarstellung :

X_{ij}=\mu +\alpha _{i}+\varepsilon _{ij},\quad i=1,\dots ,k,\ j=1,\dots ,n_{i}.

Darin sind:
X_ij: Zielvariable; annahmegemäß in den Gruppen normalverteilt
  k: Anzahl der Faktorstufen des betrachteten Faktors
  n_i: Stichprobenumfänge für die einzelnen Faktorstufen
  μ: arithmetisches Mittel der Erwartungswerte in den Gruppen
α_i: Effekt der i-ten Faktorstufe
ε_ij: Störvariablen, unabhängig und normalverteilt mit Erwartungswert 0 und gleicher (unbekannter) Varianz σ².

Erwartungswert in der i. Gruppe: $\mu _{i}=\mu +\alpha _{i}$

\sum _{i=1}^{k}n_{i}\alpha _{i}=0.

Betrachtung der Quadratsummen (Variabiliät)

Die gesamte Variabilität QST (gesamte quadratische Abweichung vom Mittelwert) lässt sich in zwei Teile zerlegen:

QST\,=\sum (X_{ij}-{\overline {\overline {X}}})^{2}=QSA+QSE

Der erste Teil QSA (Gruppenzugehörigkeit) entspricht der ('Inter-')Variabilität zwischen den Gruppen.

\!\,QSA=\sum _{i}n_{i}({\overline {X}}_{i}-{\overline {\overline {X}}})^{2},

Der Rest QSE entspricht der Variabilität innerhalb der Gruppen (gesamte 'Intra'-Abweichung von den Mittelwerten in den Gruppen, der 'Zufall'):

\!\,QSE=\sum _{i,j}(X_{ij}-{\overline {X_{i}}})^{2}.

Die zwei Quadratsummen QSA und QSE sind stochastisch unabhängig.

Im Fall von k Gruppen mit gleichem Umfang b=n/k gilt unter der Nullhypothese außerdem:

QSA/\sigma ^{2}

folgt einer Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden,

und

QSE/\sigma ^{2}

folgt einer Chi-Quadrat-Verteilung mit n-k Freiheitsgraden.

mittlere Quadratsummen:

MQSA={\frac {1}{k-1}}QSA,

und :

MQSE={\frac {1}{n-k}}QSE.

Prüfgröße:

F={\frac {MQSA}{MQSE}}.

Gruppen gleicher Größe

Im Falle Gruppen gleicher Größe ist F unter der Nullhypothese F-verteilt

mit $k-1$ Freiheitsgraden im Zähler und $k\cdot (b-1)$ Freiheitsgraden im Nenner.

Wenn die Prüfgröße

F={\frac {MQSA}{MQSE}}={\frac {\displaystyle {\frac {1}{k-1}}\cdot b\cdot \sum \limits _{i}({\overline {X}}_{i}-{\overline {\overline {X}}})^{2}}{\displaystyle {\frac {1}{k\cdot (b-1)}}\cdot \sum _{i,j}(X_{ij}-{\overline {X_{i}}})^{2}}}.

signifikant (d.h. $F>F_{krit}(\alpha ,k-1,k\cdot (b-1))$ wird, unterscheiden sich mindestens zwei Faktoren ('Gruppen') voneinander.

In Post-Hoc-Tests kann dann berechnet werden, zwischen welchen einzelnen Gruppen der Unterschied liegt.