I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit
II. Aufstellen der Nullhypothese
III. Festlegen der Testfunktion T
IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)
Fällt die Prüfgröße in den Bereich [ u; o],
wird H0 nicht abgelehnt. Es soll sein
-
(beachte: ein- oder zweiseitig)
α : Signifikanzniveau oder α-Fehler
V. Stichprobe erheben
VI. Entscheidung treffen
|
H0 ist wirklich wahr |
H1 ist wirklich wahr
|
H0 wird beibehalten |
richtige Entscheidung (1-α) |
Fehler 2. Art (β-Fehler)
|
H1 wird angenommen |
Fehler 1. Art (α-Fehler) |
richtige Entscheidung (1-β)
|
Test
|
|
|
zweiseitig
|
μ = μ0
|
μ ≠ μ0
|
rechtsseitig
|
μ ≤ μ0
|
μ > μ0
|
linksseitig
|
μ ≥ μ0
|
μ < μ0
|
-
Zweiseitiger Test für
-
linksseitiger Test für
-
Rechtsseitiger Test für
1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30
- Testfunktion
- (Gauß-Test):
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
2. X ist normalverteilt, σ ist unbekannt bei beliebigem n
- Testfunktion
- (t-Test).
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30
- Testfunktion
- (Gauß-Test) .
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
|
Einseitig
|
Zweiseitig
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Die Stichprobenwerte, die größer als der hypothetische Median sind, bekommen ein "+" zugeordnet;
Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.
Die Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar muss unabhängig
vom Wertepaar sein.
Besitzen beide Grundgesamtheiten den gleichen Median, gilt .
Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:
|
Einseitig
|
Zweiseitig
|
|
|
|
|
|
|
|
|
Die Wertepaare der Stichproben, bei denen gilt, bekommen ein "+" zugeordnet;
Wertepaare, für die gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt
und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):
-
mit
-
Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.
Bei Gültigkeit der Nullhypothese ist die Summe der positiven Differenzen binomialverteilt mit ,
da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)
verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.
Approximation durch die Normalverteilung
Mit nähert sich die Binomialverteilung einer Normalverteilung mit ,
als Faustregel ( ).
Mit bzw. ist die z-standardisierte Größe
näherungsweise standardnormalverteilt.
Bindungen (Nulldifferenzen)
Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert
oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),
die man so behandeln kann:
- Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
- Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
- Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.
Der Anteilswert θ wird geschätzt durch
- .
Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:
Test
|
|
|
zweiseitig
|
|
|
rechtsseitig
|
|
|
linksseitig
|
|
|
- für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
- kann man durch die Gauß-Verteilung approximieren:
- Testfunktion
- (Gauß-Test) .
|
Ablehnungsbereich
|
zweiseitig
|
|
rechtsseitig
|
|
linksseitig
|
|
- für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
- ist der exakte Binomialtest anzuwenden:
- Testfunktion
Die Teststatistik gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang aufgetreten ist.
Unter der Nullhypothese ist die Teststatistik -verteilt, das heißt
- .
- Ablehnungsbereich
Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau in der Regel nicht eingehalten werden.
Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau gilt .
Für den zweiseitigen Test werden daher als kritische Werte das größte und das kleinste bestimmt, für die gilt
- und
- .
Das exakte Signifikanzniveau ergibt sich als
.
Für die beiden einseitigen Tests wird analog verfahren.
Test
|
Kritische Werte
|
Kritischer Bereich
|
Grenze(n)
|
zweiseitig
|
und
|
|
|
rechtsseitig
|
|
|
c = kleinster Wert, für den
|
linksseitig
|
|
|
c = größter Wert, für den
|
Test
|
|
|
zweiseitig
|
|
|
rechtsseitig
|
|
|
linksseitig
|
|
|
1. X ist normalverteilt, μ ist unbekannt, n beliebig
- Testfunktion
-
|
Ablehnungsbereich
|
zweiseitig
|
oder
|
rechtsseitig
|
|
linksseitig
|
|
2. X ist normalverteilt, μ ist bekannt, n beliebig
- Testfunktion
-
|
Ablehnungsbereich
|
zweiseitig
|
oder
|
rechtsseitig
|
|
linksseitig
|
|
Tests auf Zusammenhangs- und Assoziationsparameter
Bearbeiten
- Nullhypothese
- : Die Merkmale und sind stochastisch unabhängig.
Die Beobachtungen der Merkmale und liegen paarweise in bzw. Klassen vor.
Es gibt insgesamt paarweise Beobachtungen von und , die sich auf Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
|
|
|
Merkmal
|
Summe Σ
|
Merkmal
|
1
|
2
|
…
|
k
|
…
|
r
|
nj.
|
1
|
n11
|
n12
|
...
|
n1k
|
...
|
n1r
|
n1.
|
2
|
n21
|
n22
|
…
|
n2k
|
…
|
n2r
|
n2.
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
j
|
…
|
…
|
…
|
njk
|
…
|
…
|
nj.
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
…
|
m
|
nm1
|
nm2
|
…
|
nmk
|
…
|
nmr
|
nm.
|
Summe Σ
|
n.1
|
n.2
|
…
|
n.k
|
…
|
n.r
|
n
|
|
|
Absolute Randhäufigkeiten bzw.
- und
Prüfgröße für den Unabhängigkeitstest:
-
Mit :
wird abgelehnt, wenn ist.
Chi-Quadrat-Anpassungs- oder Verteilungstest
Bearbeiten
Die Wahrscheinlichkeiten eines Merkmals seien in der Grundgesamtheit unbekannt.
Nullhypothese: : Das Merkmal besitzt die Wahrscheinlichkeitsverteilung
Für unabhängige Beobachtungen des Merkmals wird die Zahl
der Beobachtungen in der -ten Klasse ist die beobachtete Häufigkeit .
Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit ,
dass eine Ausprägung von in die Kategorie fällt. Die unter zu erwartende Häufigkeit ist:
-
Die Prüfgröße (Größe der Abweichung)
-
ist bei ausreichend großen annähernd chi-Quadrat-verteilt mit Freiheitsgraden.
wird abgelehnt, wenn gilt.
Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.
Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.
- (Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
- (Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)
Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion mit mittels der Teststatistik
- (sup: Supremum)
Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.
Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.
Von einer reellen Zufallsvariablen liegen aufsteigend sortierte Beobachtungswerte ( ) vor.
Von diesen Beobachtungen wird die relative Summenhäufigkeit mit der entsprechenden hypothetischen
Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung: ist stetig.
Für jedes werden die absoluten Differenzen
- und :
berechnet, wobei gesetzt wird. Wenn die größte Differenz aus allen Differenzen ,
einen kritischen Wert übersteigt, wird die Hypothese abgelehnt.
Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere werden sie über angenähert.
Liegt nun zusätzlich zur Zufallsvariablen eine entsprechende Zufallsvariable vor (mit geordneten Werten ),
so kann durch den Zweistichprobentest überprüft werden, ob und derselben Verteilungsfunktion folgen.
Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen bzw. ermittelt:
- und : .
Die Nullhypothese wird abgelehnt, falls den kritischen Wert überschreitet.
Für kleine Werte von und greift man auf Tabellen zurück.
Für große Werte von n und m wird die Nullhypothese abgelehnt, falls
- ,
wobei für große und näherungsweise als
berechnet werden kann.