Formelsammlung Statistik/ Druckversion

Formelsammlung Statistik


Uli Schell
Wikibooks

Grundlagen

Bearbeiten

Mengenlehre und DE MORGANsche Regeln

Bearbeiten

 

und

 

Kombinatorik

Bearbeiten

Fakultät

Bearbeiten

 

 

Binomialkoeffizient

Bearbeiten
 

 

Zufallsstichproben

Bearbeiten

Anzahl der möglichen Stichproben vom Umfang n aus einer Grundgesamtheit vom Umfang N:

Ohne Zurücklegen Mit Zurücklegen
Mit          
Ohne Berücksichtigung der Reihenfolge          

Definition der Wahrscheinlichkeit

Bearbeiten

(Symmetrieprinzip oder Prinzip nach LAPLACE)

Jedes Ergebnis A aus der Ergebnismenge Ω sei gleich häufig. |A| ist die Zahl der Ergebnisse,

die durch A belegt werden (Anzahl der günstigen Ergebnisse), |Ω| ist die Zahl aller möglichen Ergebnisse. Es ist

 

Axiome der Wahrscheinlichkeiten (Kolmogoroff):

Gegeben sind zwei Ereignisse A,B ⊂ Ω.

  1.   Nichtnegativität
  2.   Normiertheit
  3.   falls A und B disjunkt sind.

Additionssatz

Bearbeiten

Für zwei Ereignisse A, B aus Ω gilt :

 

Für drei Ereignisse A, B, C aus Ω gilt analog :

 

Falls die Ereignisse disjunkt sind, gilt

 
 

Bedingte Wahrscheinlichkeit

Bearbeiten
 

Unabhängigkeit von Ereignissen

Bearbeiten

Ein Ereignis A ist unabhängig von B, wenn

 

Totale Wahrscheinlichkeit

Bearbeiten

Sei A1 ...Ak eine disjunkte Zerlegung von Ω. Dann gilt für B ⊂ Ω:

 .

BAYES Theorem

Bearbeiten

Für zwei Ereignisse   und   mit   lässt sich die Wahrscheinlichkeit von

  unter der Bedingung, dass   eingetreten ist, angeben durch die Wahrscheinlichkeit von

  unter der Bedingung, dass   eingetreten ist:

 .

Hierbei ist

  die (bedingte) Wahrscheinlichkeit des Ereignisses   unter der Bedingung, dass   eingetreten ist,
  die (bedingte) Wahrscheinlichkeit des Ereignisses   unter der Bedingung, dass   eingetreten ist,
  die A-priori-Wahrscheinlichkeit des Ereignisses   und
  die A-priori-Wahrscheinlichkeit des Ereignisses  .


Endlich viele Ereignisse:

Wenn   eine Zerlegung der Ergebnismenge in disjunkte Ereignisse ist, gilt für die A-posteriori-Wahrscheinlichkeit  

 .

Den letzten Umformungsschritt bezeichnet man auch als Marginalisierung.


Da ein Ereignis   und sein Komplement   stets eine Zerlegung der Ergebnismenge darstellen, gilt insbesondere

 .

Zufallsvariablen und Verteilungsmodelle

Bearbeiten

diskrete Zufallsvariablen

Bearbeiten

Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge

von Ausprägungen x1, x2 ... annehmen kann, nennt man diskrete

Zufallsvariable X.

Eindimensionale Zufallsvariablen

Bearbeiten

Wahrscheinlichkeitsfunktion:

 

Verteilungsfunktion:

 

Normiertheit:

 

Erwartungswert

 

Varianz

 

bzw. mit dem Verschiebungssatz

 

Standardabweichung

 

Varianz der Summe unabhängiger Zufallsvariablen

 

Mehrdimensionale Zufallsvariablen

Bearbeiten

Einzelwahrscheinlichkeit

 

Kovarianz

 

bzw. mit dem Verschiebungssatz

 

Korrelationskoeffizient rxy nach Bravais-Pearson

Bearbeiten

für metrisch skalierte Merkmale zweier statistischer Variablen x und y

 

mit   als dem arithmetischen Mittel des Merkmals x. Mit Hilfe des Verschiebungssatzes:

 


Rangkorrelationskoeffizient nach Spearman

Bearbeiten
  • für Variablen, die stark von der Normalverteilung abweichen
  • sowie ordinalskalierte Variablen

Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird

jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:

 .

diskrete Verteilungsmodelle

Bearbeiten

Binomialverteilung

Bearbeiten

Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion

 

Erwartungswert

 

Varianz

 

Hypergeometrische Verteilung

Bearbeiten

Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern

N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),

wenn ihre Wahrscheinlichkeitsfunktion lautet

 

Erwartungswert

 

Varianz

 

Der Bruch   wird Korrekturfaktor genannt.

Poissonverteilung

Bearbeiten

Wahrscheinlichkeitsfunktion ( )

 


Erwartungswert und Varianz

 

stetige Zufallsvariablen

Bearbeiten

Eine stetige Zufallsvariable kann in jedem beschränkten Intervall unendlich viele Ausprägungen annehmen.

Ihre Verteilung lässt sich durch eine Dichtefunktion f(x) beschreiben.

(f(x) ist hier keine Wahrscheinlichkeit, sondern eine Dichte !)

Verteilungsfunktion

 
  • Es gilt: P(X = a) = 0.
  • Wegen P(X = a) = 0 ist P(X ≤ a) = P(X < a) und P(X > a) = P(X ≥ a)

Die Dichtefunktion f(x) ist die erste Ableitung der Verteilungsfunktion, falls diese an der Stelle x differenzierbar ist.

  • Die Dichtefunktion f(a) kann auch größer als 1 werden.
  • Ausgehend von   ist das p-Quantil x(p) der Wert x, der zu einer gegebenen Wahrscheinlichkeit p gehört. Speziell x(0,5) ist der Median.

Erwartungswert

 

falls E(X) existiert, d.h. nicht unendlich wird.

Varianz

 

wobei auch hier der Verschiebungssatz angewendet werden kann:

 

stetige Verteilungsmodelle

Bearbeiten

Stetige Gleichverteilung (Rechteckverteilung)

Bearbeiten

Dichtefunktion der Gleichverteilung im Intervall [a,b]

 

Erwartungswert

 

Varianz

 

Exponentialverteilung

Bearbeiten

Dichtefunktion der Exponentialverteilung

 

Verteilungsfunktion

 

Erwartungswert

 

Varianz

  .

Normalverteilung

Bearbeiten

Für eine Zufallsvariable   lautet die Dichtefunktion der NV

  für  

Normierung mit   ergibt die Standardnormalverteilung mit der Dichtefunktion  :

 

Anm.:Es wird auch die Schreibweise   anstelle   verwendet

Erwartungswert

 

Varianz

 

p-Quantil

Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)

  .

 

Beispielsweise ist z(0,975) = 1,96.

Linearkombinationen normalverteilter Zufallsvariablen

Bearbeiten

Für n normalverteilte Zufallsvariablen  

ist die Linearkombination

 

ebenfalls normalverteilt mit dem Erwartungswert

  .

Falls die   stochastisch unabhängig sind, gilt für die Varianz

  .

Die Varianz muss größer Null sein, deshalb muss zudem   für mindestens ein   gelten.

Verteilung des Stichprobendurchschnitts

Bearbeiten

Sind die n Zufallsvariablen   (i = 1, ... , n) sämtlich normalverteilt

mit gleichem μ und gleichem σ2, ist die Linearkombination

X mit a0 = 0, a1 = a2 = ... = an = 1/n, also : 

normalverteilt dem Erwartungswert

 

und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz

  .

CHI-Quadrat-verteilung

Bearbeiten

Die   seien unabhängige standardnormalverteilte Zufallsvariablen.

Dann ist die Verteilung der Zufallsvariablen  

chi-quadrat verteilt mit n Freiheitsgraden  

Erwartungswert:

 

Varianz

  .

Anm.: Die Gruppe der Hypothesentests mit  -Verteilung bezeichnet man als  -Test.

Hierunter sind mehrere Tests zu verstehen:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.

Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.

Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

t- (Student-) Verteilung

Bearbeiten

Für die unabhängigen Variablen   (standardnormalverteilt) und   ist die Variable

 

t-verteilt   mit n Freiheitsgraden.

Erwartungswert

  für  

Varianz

  für  


Fisher- Verteilung

Bearbeiten

Für die unabhängigen Variablen   und   ist die Verteilung der Variablen

 

Fisher- oder F-verteilt   mit den Freiheitsgraden m und n.

Erwartungswert

  für  

Varianz

  für  


Approximation von Verteilungen

Bearbeiten
Gesuchte Verteilung Approximation durch
  Binomial Poisson Normal
Binomial
 
---  
 
 
 
 
Hypergeometrische
 
 
 
über Binomialverteilung  
 
 
Poisson
 
--- ---  
χ2-Verteilung  
 
--- ---  
 
t-Verteilung
 
--- ---  
F-Verteilung
 
--- ---  
 

Grenzwertsatz

Bearbeiten

Gesetz der großen Zahlen

Bearbeiten

Für ein beliebig kleines c > 0 gilt

  für  

Theorem von Bernoulli

Bearbeiten

Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen

eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)

Hauptsatz der Statistik

Bearbeiten

Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)

für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)

 

(sup: Maximale Abweichung zwischen   und  ).

Zentraler Grenzwertsatz

Bearbeiten

Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ

und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)

der standardisierten Summe

 

für n → ∞ an jeder Stelle   gegen die Verteilungsfunktion   der Standardnormalverteilung

 

Grenzwertsatz von De Moivre

Bearbeiten

Die Verteilung der standardisierten absoluten Häufigkeit   der Standardnormalverteilung

konvergiert für n → ∞ gegen eine Standardnormalverteilung.

Deskriptive Statistik

Bearbeiten

Skalenniveaus

Bearbeiten

Nominalskala

Bearbeiten

Die Ausprägungen des nominalskalierten Merkmals können nicht geordnet werden,

man kann sie nur vergleichen und abzählen.

Es handelt sich um qualitative Merkmale. Erhalten die Ausprägungen Ziffern zugeordnet,

handelt es sich nur um eine Verschlüsselung (Codierung): 1 = männlich, 2 = weiblich.

Ordinalskala

Bearbeiten

Zwischen den Ausprägungen des ordinalskalierten (rangskalierten) Merkmals existiert eine Beziehung

der Form mehr oder weniger, < oder >, besser oder schlechter.

Eine Quotientenbildung macht wenig Sinn (Beispiel Noten: 1, 2, 3, 4, 5).

Intervallskala

Bearbeiten

Die Abstände zwischen den Ausprägungen des (quantitativen) Merkmals der Intervallskala

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen.

Beispiel: Kinderzahl, Temperatur.

Verhältnissskala

Bearbeiten

Sowohl die Abstände als auch Verhältnisse zwischen den Ausprägungen des (quantitativen) Merkmals

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen. Beispiel: Einkommen.

Zweig-Blätter-(stem-leaf-) Diagramm

Bearbeiten

Die linke Spalte enthält als „Stämme“ die Äquivalenzklassen, in die die auf der rechten Seite als „Blätter“

dargestellten Merkmale eingeteilt werden. Beispiel: Gegeben sind die Werte 0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7.

Wählt man die natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm:
3 5 7
2 5 5 6 7 8
1
0 3 4

Lageparameter

Bearbeiten

Arithmetisches Mittel

Bearbeiten
 

Median (Zentralwert)

Bearbeiten

Sind die Beobachtungswerte der Größe nach geordnet, ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt.

 

geometrisches Mittel

Bearbeiten
 

harmonisches Mittel

Bearbeiten
 

Modalwert

Bearbeiten

Der am häufigsten auftretende Wert

Grundgesamtheit:

 

Stichprobe:

 

Verschiebungssatz

Bearbeiten

Für jedes   gilt

 

Damit erhält man als Varianz

 

Variationskoeffizient

Bearbeiten
 


Konzentrationsmasse

Bearbeiten

Konzentrationsrate

Bearbeiten

Die Konzentrationsrate CRn ist die Summe der Marktanteile der n größten Unternehmen eines relevanten Marktes. Im GWB werden die Raten CR1, CR3 und CR5 herangezogen.

Lorenzkurve

Bearbeiten

Für eine geordnete Urliste x1 ≤ x2… ≤xn trägt man die kumulierte relative Merkmalssumme

 

über den Anteil der Merkmalsträger   auf.

Liegen die Merkmale in gruppierter Form vor, trägt man die kumulierte relative Merkmalssumme

 

über der Häufigkeit   auf.

Zwischen (0;0) und (1;1) wird die Winkelhalbierende des Koordinatensystems eingetragen.

Gini-Koeffizient

Bearbeiten

Als Ginikoeffizient G bezeichnet man das Verhältnis der Fläche zwischen Winkelhalbierender und der Lorenzkurve

zur Gesamtfläche unter der Winkelhalbierenden (= 1/2).

Die Fläche unterhalb der Lorenzkurve kann man einfach aus Teil-Trapezflächen zusammensetzen:

 

(p0 = 0 ; q0 = 0):


Herfindahl-Index

Bearbeiten
 

Parameterschätzung

Bearbeiten

Konfidenzintervall für den Erwartungswert μ

Bearbeiten

Normalverteiltes Merkmal mit bekannter Varianz

Bearbeiten

Das Zufallsintervall enthält mit einer Wahrscheinlichkeit 1-α den Parameter:

 

Konfidenzintervall

 

(Quantil z aus Normalverteilungstabelle)

Normalverteiltes Merkmal mit unbekannter Varianz

Bearbeiten

Für normalverteilte Merkmale und unbekannter Varianz muss die Varianz durch s2 geschätzt werden.

 .

Konfidenzintervall

 

(Quantil   aus der t-Verteilungstabelle bei Freiheitsgrad n-1).

Merkmal mit unbekannter Verteilung und bekannter Varianz

Bearbeiten

Konfidenzintervall

  für n > 30.


Merkmal mit unbekannter Verteilung und unbekannter Varianz

Bearbeiten

Konfidenzintervall

  für n > 50

Konfidenzintervalle für den Anteilswert einer dichotomen Grundgesamtheit

Bearbeiten

Modell mit Zurücklegen

Bearbeiten

Beschreibung durch den geschätztem Anteilswert  . Für n > 100 und  )

erhält man das 1-α-Konfidenzintervall für p durch eine Approximation der Binomialverteilung mit Hilfe der Normalverteilung:

 

Modell ohne Zurücklegen

Bearbeiten

Für   kann die hypergeometrische Verteilung durch die Normalverteilung approximiert werden:


 -Konfidenzintervall für  :


 

Hypothesentests

Bearbeiten

Vorgehen beim Hypothesentest

Bearbeiten

I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit

II. Aufstellen der Nullhypothese

III. Festlegen der Testfunktion T

IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)


Fällt die Prüfgröße   in den Bereich [ u;  o],

wird H0 nicht abgelehnt. Es soll sein

 

(beachte: ein- oder zweiseitig)

α : Signifikanzniveau oder α-Fehler


V. Stichprobe erheben

VI. Entscheidung treffen


H0 ist wirklich wahr H1 ist wirklich wahr
H0 wird beibehalten richtige Entscheidung (1-α) Fehler 2. Art (β-Fehler)
H1 wird angenommen Fehler 1. Art (α-Fehler) richtige Entscheidung (1-β)

Tests auf Lageparameter (Erwartungswert, Median, Anteilswert)

Bearbeiten

Test auf Erwartungswert

Bearbeiten
Test    
zweiseitig μ = μ0 μ ≠ μ0
rechtsseitig μ ≤ μ0 μ > μ0
linksseitig μ ≥ μ0 μ < μ0


1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30

Testfunktion
  (Gauß-Test):
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

2. X ist normalverteilt, σ ist unbekannt bei beliebigem n

Testfunktion
  (t-Test).
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30

Testfunktion
  (Gauß-Test) .
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

Vorzeichentest

Bearbeiten

Einstichprobenproblem

Bearbeiten
Einseitig Zweiseitig
       
       
       
       

Die Stichprobenwerte, die größer als der hypothetische Median   sind, bekommen ein "+" zugeordnet;

Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.

Zweistichprobenproblem

Bearbeiten

Die   Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar   muss unabhängig

vom Wertepaar   sein.

Besitzen beide Grundgesamtheiten den gleichen Median, gilt  .

Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:

Einseitig Zweiseitig
       
       

Die Wertepaare der Stichproben, bei denen   gilt, bekommen ein "+" zugeordnet;


Wertepaare, für die   gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt

und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

 

mit

 

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.

Bei Gültigkeit der Nullhypothese   ist die Summe der positiven Differenzen binomialverteilt mit  ,

da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)

verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.

Approximation durch die Normalverteilung

Mit   nähert sich die Binomialverteilung einer Normalverteilung mit  ,

als Faustregel   ( ).

Mit   bzw.   ist die z-standardisierte Größe

 

näherungsweise standardnormalverteilt.

Bindungen (Nulldifferenzen) Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert

oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),

die man so behandeln kann:

  • Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
  • Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
  • Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.


Test auf Anteilswert (Binomialtest)

Bearbeiten

Der Anteilswert θ wird geschätzt durch

 .

Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:

Test    
zweiseitig    
rechtsseitig    
linksseitig    


für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
kann man durch die Gauß-Verteilung approximieren:
Testfunktion
  (Gauß-Test) .
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    
für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
ist der exakte Binomialtest anzuwenden:
Testfunktion

Die Teststatistik   gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang   aufgetreten ist.

Unter der Nullhypothese   ist die Teststatistik  -verteilt, das heißt

 .
Ablehnungsbereich

 

Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau   in der Regel nicht eingehalten werden.

Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau   gilt  .

Für den zweiseitigen Test werden daher als kritische Werte das größte   und das kleinste   bestimmt, für die gilt

  •   und
  •  .

Das exakte Signifikanzniveau ergibt sich als

 .

Für die beiden einseitigen Tests wird analog verfahren.

Test Kritische Werte Kritischer Bereich Grenze(n)
zweiseitig     und    
rechtsseitig       c = kleinster Wert, für den  
linksseitig     c = größter Wert, für den  

Tests auf Streuung

Bearbeiten

Test auf Varianz

Bearbeiten
Test    
zweiseitig      
rechtsseitig        
linksseitig        


1. X ist normalverteilt, μ ist unbekannt, n beliebig

Testfunktion
 
Ablehnungsbereich
zweiseitig     oder  
rechtsseitig    
linksseitig    

2. X ist normalverteilt, μ ist bekannt, n beliebig

Testfunktion
 
Ablehnungsbereich
zweiseitig     oder  
rechtsseitig    
linksseitig    

Tests auf Zusammenhangs- und Assoziationsparameter

Bearbeiten

Chi-Quadrat-Unabhängigkeitstest

Bearbeiten
Nullhypothese
 : Die Merkmale   und   sind stochastisch unabhängig.

Die Beobachtungen der Merkmale   und   liegen paarweise in   bzw.   Klassen vor.

Es gibt insgesamt   paarweise Beobachtungen von   und  , die sich auf   Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
Merkmal   Summe Σ
Merkmal   1 2 k r nj.
1 n11 n12 ... n1k ... n1r n1.
2 n21 n22 n2k n2r n2.
j njk nj.
m nm1 nm2 nmk nmr nm.
Summe Σ n.1 n.2 n.k n.r n

Absolute Randhäufigkeiten   bzw.  

  und  


Prüfgröße für den Unabhängigkeitstest:

 

Mit : 

  wird abgelehnt, wenn   ist.

Anpassungs- oder Verteilungstests

Bearbeiten

Chi-Quadrat-Anpassungs- oder Verteilungstest

Bearbeiten

Die Wahrscheinlichkeiten eines Merkmals   seien in der Grundgesamtheit unbekannt.

Nullhypothese:  : Das Merkmal   besitzt die Wahrscheinlichkeitsverteilung  

Für   unabhängige Beobachtungen   des Merkmals   wird die Zahl

der Beobachtungen in der  -ten Klasse ist die beobachtete Häufigkeit  .

Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit  ,

dass eine Ausprägung von   in die Kategorie   fällt. Die unter   zu erwartende Häufigkeit ist:

 

Die Prüfgröße (Größe der Abweichung)

 

ist bei ausreichend großen   annähernd chi-Quadrat-verteilt mit   Freiheitsgraden.

  wird abgelehnt, wenn   gilt.


Kolmogorow-Smirnow-Anpassungstest

Bearbeiten

Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.

Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.

  (Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
  (Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)

Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion   mit   mittels der Teststatistik

  (sup: Supremum)

Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.

Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.

Einstichprobenproblem

Bearbeiten

Von einer reellen Zufallsvariablen   liegen   aufsteigend sortierte Beobachtungswerte   ( ) vor.

Von diesen Beobachtungen wird die relative Summenhäufigkeit   mit der entsprechenden hypothetischen

Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung:   ist stetig.

Für jedes   werden die absoluten Differenzen

  und : 

berechnet, wobei   gesetzt wird. Wenn die größte Differenz   aus allen Differenzen  ,  

einen kritischen Wert   übersteigt, wird die Hypothese abgelehnt.

Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere   werden sie über   angenähert.


Zweistichprobenproblem

Bearbeiten

Liegt nun zusätzlich zur Zufallsvariablen   eine entsprechende Zufallsvariable   vor (mit   geordneten Werten  ),

so kann durch den Zweistichprobentest überprüft werden, ob   und   derselben Verteilungsfunktion folgen.

Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen   bzw.   ermittelt:

  und  :  .


Die Nullhypothese wird abgelehnt, falls   den kritischen Wert   überschreitet.

Für kleine Werte von   und   greift man auf Tabellen zurück.

Für große Werte von n und m wird die Nullhypothese abgelehnt, falls

  ,

wobei   für große   und   näherungsweise als   berechnet werden kann.

Varianzanalyse

Bearbeiten

univariate Varianzanalyse (ANOVA)

Bearbeiten

Man untersucht man den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägungen einer Zufallsvariablen.

Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen, und zwar vergleicht man die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen.

Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse.

Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests bei mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test.

Es sei   der Erwartungswert der abhängigen Variable in der i. Gruppe.


  (Es besteht kein Unterschied zwischen den Erwartungswerten der Gruppen.)


  (Es besteht zwischen mindestens zwei Erwartungswerten ein Unterschied.)


→ Wir wissen dann nur mit einer bestimmten Wahrscheinlichkeit, dass mindestens zwei Ausprägungen einen bedeutsamen Unterschied aufweisen.

Effektdarstellung :

 

Darin sind:
Xij: Zielvariable; annahmegemäß in den Gruppen normalverteilt
  k: Anzahl der Faktorstufen des betrachteten Faktors
  ni: Stichprobenumfänge für die einzelnen Faktorstufen
  μ: arithmetisches Mittel der Erwartungswerte in den Gruppen
 αi: Effekt der i-ten Faktorstufe
εij: Störvariablen, unabhängig und normalverteilt mit Erwartungswert 0 und gleicher (unbekannter) Varianz σ2.

Erwartungswert in der i. Gruppe:  

 

Betrachtung der Quadratsummen (Variabiliät)

Die gesamte Variabilität QST (gesamte quadratische Abweichung vom Mittelwert) lässt sich in zwei Teile zerlegen:

 

Der erste Teil QSA (Gruppenzugehörigkeit) entspricht der ('Inter-')Variabilität zwischen den Gruppen.

 

Der Rest QSE entspricht der Variabilität innerhalb der Gruppen (gesamte 'Intra'-Abweichung von den Mittelwerten in den Gruppen, der 'Zufall'):

 

Die zwei Quadratsummen QSA und QSE sind stochastisch unabhängig.

Im Fall von k Gruppen mit gleichem Umfang b=n/k gilt unter der Nullhypothese außerdem:

  folgt einer Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden,

und

  folgt einer Chi-Quadrat-Verteilung mit n-k Freiheitsgraden.

mittlere Quadratsummen:

  und : 

Prüfgröße:

 

Gruppen gleicher Größe

Bearbeiten

Im Falle Gruppen gleicher Größe ist F unter der Nullhypothese F-verteilt

mit   Freiheitsgraden im Zähler und   Freiheitsgraden im Nenner.

Wenn die Prüfgröße

 

signifikant (d.h.   wird, unterscheiden sich mindestens zwei Faktoren ('Gruppen') voneinander.

In Post-Hoc-Tests kann dann berechnet werden, zwischen welchen einzelnen Gruppen der Unterschied liegt.

Regressionsrechnung

Bearbeiten

Lineare Regression

Bearbeiten
Methode der kleinsten Quadrate
 

bezüglich a und b.

Nach Ausmultiplikation, Ableiten und Nullsetzen

 
 

erhält man die gesuchten Regressionskoeffizienten als die Lösungen

 

und

 

wobei  .

Mit dem Verschiebungssatz kann man   auch so ermitteln:

 

Schätzungen

 

Residuen ri :

 

Stichprobenvarianz der Residuen:

 

Bestimmtheitsmaß

 

mit dem Verschiebungssatz :

 


 

Varianz der Residuen

 

Variablentransformation

Bearbeiten
Funktion u v
     
     
     
     
     

Die Methode kann auf weitere Parameter erweitert werden.

Zeitreihenanalyse

Bearbeiten

Komponentenunterteilung bei Zeitreihen

Bearbeiten

Mögliche Aufteilung einer Zeitreihe in Komponenten:

  • Trend Q
  • Konjunkturelle Schwankung K
  • Saisonale Schwankung S
  • Restschwankung r

Bei Unabhängigkeit dieser Komponenten kann man ein additives Modell annehmen:

 

Nehmen beispielsweise zyklische Schwankungen mit steigendem Trend zu, könnte ein multiplikatives Modell

 

angebracht sein. Variablentransformation durch Logarithmieren

 


Bearbeiten

‘‘‘Regressionsmodell‘‘‘

  bzw.    

mit den Lösungen

 
 
 

und

 
  .

Die Trendwerte Qt sind dann

 .

Nichtlinearer Trendverlauf: Lösung über Variablentransformation oder Anwendung eines nichtlinearen Regressionsansatzes

Schätzung der Saisonkomponente

Bearbeiten

Additives Modell

 

Nach Schätzung der Trendkomponente Qt bleibt noch die Abweichung

 

und

 

dt: trendbereinigter Zeitreihenwert

Bestimmung der saisonalen Komponente St über Fourieranalyse oder (einfacher)

Bildung des arithmetischen Durchschnitts aller Werte dt, die die gleiche Saison betreffen,

als Schätzung für die saisonale Komponente. Dann bleibt die nichterklärte Restschwankung

 

Prognose für den Zeitpunkt T+k (mit St als Wert in der Saison T+k)


 

Schätzung der glatten Komponente mit gleitenden Mittelwerten

Bearbeiten

Lässt sich die Trendkomponente des Zeitreihenmodells offensichtlich durch keine funktionale lineare oder

nichtlineare Beziehung darstellen, kann man eine glatte Komponente mit Hilfe gleitender Mittelwerte bestimmen.

einfacher gleitender Mittelwert

Bearbeiten

Beispiel: Mittelwert dritter Ordnung:

 

Die Ordnung des Mittelwerts sollte so gewählt werden, daß möglichst genau eine Periode umfasst wird.

Zur Prognose über den Beobachtungszeitraum hinaus sind gleitende Mittelwerte bedingt geeignet,

da die Randwerte der Zeitreihe nicht geschätzt werden.

gewichteter gleitender Mittelwert

Bearbeiten

Beispiel: Mittelwert dritter Ordnung mit z.B.  

 

Exponentielle Glättung

Bearbeiten

Gewichtung durch den Glättungsfaktor   mit  :

Geglätteter Schätzwert y*t als gewichteter Durchschnitt aus dem aktuellen Zeitreihenwert yt

und dem Schätzwert der Vorperiode y*t-1 (y*0 geeignet wählen):

 

Auflösung der Rekursivität:

 

Für die Wahl des Glättungsfaktors wird häufig 0,2 bis 0,3 empfohlen. Man kann aber auch mit Hilfe der Regressionsanalyse den Glättungsfaktor schätzen.


Exponentielle Glättung bei trendbehafteten Werten

Bearbeiten

Bei Trend werden die Zeitreihenwerte systematisch unter- bzw. überschätzt. Abhilfe bieten ggf. gleitende Durchschnitte zweiter Ordung.

Die bereits einmal geglätteten Werte erneut einer Glättung unterzogen. Man erhält den Schätzwert  , der sich analog zu oben berechnet aus

 

Für einen brauchbaren Prognosewert für Periode t+1 muss man dann bestimmen

  .

Symbolverzeichnis

Bearbeiten

allgemein

Bearbeiten
Symbol Verwendung
A,B Ereignisse
Ω = {A,B,C...} Ereignisraum
|A| Anzahl der Ereignisse A
P(A) Wahrscheinlichkeit für das Eintreten von A
∪ ∩ Und-Verknüpfung (Konjunktion) / Oder-Verknüpfung (Disjunktion)
P(A | B) Bedingte Wahrscheinlichkeit (A wenn B)
E(X) Erwartungswert von X
f(X) Wahrscheinlichkeitsfunktion
F(X) Verteilungsfunktion
N Grundgesamtheit
n Stichprobe
X Zufallsvariable
  Varianz von X
Θ Anteilswert einer Grundgesamtheit

Verteilungsmodelle

Bearbeiten
Symbol Verwendung
  Binomialverteilung
F(m,n) Fisherverteilung
  Hypergeometrische Verteilung
  Poissonverteilung
  Normalverteilung
t(n) t- (Student-) Verteilung
  Standardnormalverteilung

Tabellen

Bearbeiten
Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
2 0 0,9801 0,9025 0,81 0,64 0,5625 0,49 0,25
1 0,0198 0,095 0,18 0,32 0,375 0,42 0,5
2 0,0001 0,0025 0,01 0,04 0,0625 0,09 0,25
3 0 0,9703 0,8574 0,729 0,512 0,4219 0,343 0,125
1 0,0294 0,1354 0,243 0,384 0,4219 0,441 0,375
2 0,0003 0,0071 0,027 0,0960 0,1406 0,189 0,375
3 0 0,0001 0,001 0,008 0,0156 0,027 0,125
4 0 0,9606 0,8145 0,6561 0,4096 0,3164 0,2401 0,0625
1 0,0388 0,1715 0,2916 0,4096 0,4219 0,4116 0,25
2 0,0006 0,0135 0,0486 0,1536 0,2109 0,2646 0,375
3 0 0,0005 0,0036 0,0256 0,0469 0,0756 0,25
4 0 0 0,0001 0,0016 0,0039 0,0081 0,0625
5 0 0,951 0,7738 0,5905 0,3277 0,2373 0,1681 0,0313
1 0,048 0,2036 0,3281 0,4096 0,3955 0,3602 0,1563
2 0,001 0,0214 0,0729 0,2048 0,2637 0,3087 0,3125
3 0 0,0011 0,0081 0,0512 0,0879 0,1323 0,3125
4 0 0 0,0005 0,0064 0,0146 0,0284 0,1563
5 0 0 0 0,0003 0,001 0,0024 0,0313
6 0 0,9415 0,7351 0,5314 0,2621 0,178 0,1176 0,0156
1 0,0571 0,2321 0,3543 0,3932 0,356 0,3025 0,0938
2 0,0014 0,0305 0,0984 0,2458 0,2966 0,3241 0,2344
3 0 0,0021 0,0146 0,0819 0,1318 0,1852 0,3125
4 0 0,0001 0,0012 0,0154 0,033 0,0595 0,2344
5 0 0 0,0001 0,0015 0,0044 0,0102 0,0938
6 0 0 0 0,0001 0,0002 0,0007 0,0156
7 0 0,9321 0,6983 0,4783 0,2097 0,1335 0,0824 0,0078
1 0,0659 0,2573 0,372 0,367 0,3115 0,2471 0,0547
2 0,002 0,0406 0,124 0,2753 0,3115 0,3177 0,1641
3 0 0,0036 0,023 0,1147 0,173 0,2269 0,2734
4 0 0,0002 0,0026 0,0287 0,0577 0,0972 0,2734
5 0 0 0,0002 0,0043 0,0115 0,025 0,1641
6 0 0 0 0,0004 0,0013 0,0036 0,0547
7 0 0 0 0 0,0001 0,0002 0,0078


Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
8 0 0,9227 0,6634 0,4305 0,1678 0,1001 0,0576 0,0039
1 0,0746 0,2793 0,3826 0,3355 0,267 0,1977 0,0313
2 0,0026 0,0515 0,1488 0,2936 0,3115 0,2965 0,1094
3 0,0001 0,0054 0,0331 0,1468 0,2076 0,2541 0,2188
4 0 0,0004 0,0046 0,0459 0,0865 0,1361 0,2734
5 0 0 0,0004 0,0092 0,0231 0,0467 0,2188
6 0 0 0 0,0011 0,0038 0,01 0,1094
7 0 0 0 0,0001 0,0004 0,0012 0,0313
8 0 0 0 0 0 0,0001 0,0039
9 0 0,9135 0,6302 0,3874 0,1342 0,0751 0,0404 0,002
1 0,083 0,2985 0,3874 0,302 0,2253 0,1556 0,0176
2 0,0034 0,0629 0,1722 0,302 0,3003 0,2668 0,0703
3 0,0001 0,0077 0,0446 0,1762 0,2336 0,2668 0,1641
4 0 0,0006 0,0074 0,0661 0,1168 0,1715 0,2461
5 0 0 0,0008 0,0165 0,0389 0,0735 0,2461
6 0 0 0,0001 0,0028 0,0087 0,021 0,1641
7 0 0 0 0,0003 0,0012 0,0039 0,0703
8 0 0 0 0 0,0001 0,0004 0,0176
9 0 0 0 0 0 0 0,002
10 0 0,9044 0,5987 0,3487 0,1074 0,0563 0,0282 0,001
1 0,0914 0,3151 0,3874 0,2684 0,1877 0,1211 0,0098
2 0,0042 0,0746 0,1937 0,302 0,2816 0,2335 0,0439
3 0,0001 0,0105 0,0574 0,2013 0,2503 0,2668 0,1172
4 0 0,001 0,0112 0,0881 0,146 0,2001 0,2051
5 0 0,0001 0,0015 0,0264 0,0584 0,1029 0,2461
6 0 0 0,0001 0,0055 0,0162 0,0368 0,2051
7 0 0 0 0,0008 0,0031 0,009 0,1172
8 0 0 0 0,0001 0,0004 0,0014 0,0439
9 0 0 0 0 0 0,0001 0,0098
10 0 0 0 0 0 0 0,001


Weitere Werte können mittels =BINOMVERT(x;n;p;0) bei Tabellenkalkulationsprogrammen

oder der R-Funktion dbinom(x, n , p) bestimmt werden

Standard-Normalverteilung (Verteilungsfunktion)  
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5 0,504 0,508 0,512 0,516 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,591 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,648 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,67 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,695 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,719 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,758 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,791 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,834 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,877 0,879 0,881 0,883
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,898 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,937 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,975 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,983 0,9834 0,9838 0,9842 0,9846 0,985 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,989
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,992 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,994 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,996 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,997 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,998 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,999 0,999
3,1 0,999 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


Zur Bildung von z ist der Wert von linker Spalte und oberer Zeile zu addieren.

Ablesebeispiel:  

weitere Werte: =NORM.S.VERT(z;WAHR) bzw. (R-Aufruf): pnorm(z)

 -Verteilung (Quantile)
n p=
0,005
...
0,01
...
0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995
1 0,000 0,000 0,001 0,004 0,016 0,455 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,21 10,597
3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,86
5 0,412 0,554 0,831 1,145 1,61 4,351 9,236 11,07 12,833 15,086 16,75
6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,69 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,18 2,733 3,49 7,344 13,362 15,507 17,535 20,09 21,955
9 1,735 2,088 2,7 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,94 4,865 9,342 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,92 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 11,34 18,549 21,026 23,337 26,217 28,3
13 3,565 4,107 5,009 5,892 7,042 12,34 19,812 22,362 24,736 27,688 29,819
14 4,075 4,66 5,629 6,571 7,79 13,339 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 15,338 23,542 26,296 28,845 32 34,267
17 5,697 6,408 7,564 8,672 10,085 16,338 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,39 10,865 17,338 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 18,338 27,204 30,144 32,852 36,191 38,582
20 7,434 8,26 9,591 10,851 12,443 19,337 28,412 31,41 34,17 37,566 39,997
21 8,034 8,897 10,283 11,591 13,24 20,337 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 21,337 30,813 33,924 36,781 40,289 42,796
23 9,26 10,196 11,689 13,091 14,848 22,337 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 23,337 33,196 36,415 39,364 42,98 45,559
25 10,52 11,524 13,12 14,611 16,473 24,337 34,382 37,652 40,646 44,314 46,928
26 11,16 12,198 13,844 15,379 17,292 25,336 35,563 38,885 41,923 45,642 48,29
27 11,808 12,879 14,573 16,151 18,114 26,336 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 27,336 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 28,336 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 29,336 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 30,336 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 31,336 42,585 46,194 49,48 53,486 56,328
33 15,815 17,074 19,047 20,867 23,11 32,336 43,745 47,4 50,725 54,776 57,648
34 16,501 17,789 19,806 21,664 23,952 33,336 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 34,336 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 35,336 47,212 50,998 54,437 58,619 61,581
37 18,586 19,96 22,106 24,075 26,492 36,336 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 37,335 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 38,335 50,66 54,572 58,12 62,428 65,476
40 20,707 22,164 24,433 26,509 29,051 39,335 51,805 55,758 59,342 63,691 66,766


p = 1−α

weitere Werte: =CHIQU.INV(n;p) bzw. (R-Aufruf): qchisq(p,n)

Kritische Werte für den Kolmogorov-Smirnov- (KS-) Anpassungstest
n D0,20 D0,10 D0,05 D0,02 D0,01 D0,005
1 0,9 0,95 0,975 0,99 0,995 0,9975
2 0,68377 0,77638 0,84187 0,89998 0,92925 0,94995
3 0,56481 0,63604 0,70758 0,78452 0,82895 0,86419
4 0,49265 0,56521 0,62392 0,68884 0,73417 0,77628
5 0,44697 0,50944 0,56326 0,62715 0,66848 0,70533
6 0,41035 0,46799 0,51925 0,57738 0,61655 0,65277
7 0,38145 0,43606 0,48341 0,53841 0,57576 0,60966
8 0,35828 0,40962 0,45426 0,50652 0,54174 0,5742
9 0,33907 0,38746 0,43 0,47957 0,51327 0,54435
10 0,32257 0,36866 0,40924 0,4566 0,48889 0,51864
11 0,30825 0,35241 0,39121 0,43668 0,46766 0,49631
12 0,29573 0,33814 0,37542 0,41916 0,449 0,47664
13 0,28466 0,32548 0,36142 0,4036 0,43243 0,45914
14 0,27477 0,31416 0,34889 0,38968 0,41758 0,44345
15 0,26585 0,30397 0,33759 0,37711 0,40416 0,42927
16 0,25774 0,29471 0,32733 0,36569 0,39197 0,41637
17 0,25035 0,28626 0,31796 0,35526 0,38083 0,40458
18 0,24356 0,2785 0,30935 0,34568 0,37059 0,39374
19 0,23731 0,27135 0,30142 0,33684 0,36114 0,38373
20 0,23152 0,26473 0,29407 0,32864 0,35238<