Formelsammlung Statistik/ Druckversion

Formelsammlung Statistik


Uli Schell
Wikibooks

Grundlagen

Bearbeiten

Mengenlehre und DE MORGANsche Regeln

Bearbeiten

 

und

 

Kombinatorik

Bearbeiten

Fakultät

Bearbeiten

 

 

Binomialkoeffizient

Bearbeiten
 

 

Zufallsstichproben

Bearbeiten

Anzahl der möglichen Stichproben vom Umfang n aus einer Grundgesamtheit vom Umfang N:

Ohne Zurücklegen Mit Zurücklegen
Mit          
Ohne Berücksichtigung der Reihenfolge          

Definition der Wahrscheinlichkeit

Bearbeiten

(Symmetrieprinzip oder Prinzip nach LAPLACE)

Jedes Ergebnis A aus der Ergebnismenge Ω sei gleich häufig. |A| ist die Zahl der Ergebnisse,

die durch A belegt werden (Anzahl der günstigen Ergebnisse), |Ω| ist die Zahl aller möglichen Ergebnisse. Es ist

 

Axiome der Wahrscheinlichkeiten (Kolmogoroff):

Gegeben sind zwei Ereignisse A,B ⊂ Ω.

  1.   Nichtnegativität
  2.   Normiertheit
  3.   falls A und B disjunkt sind.

Additionssatz

Bearbeiten

Für zwei Ereignisse A, B aus Ω gilt :

 

Für drei Ereignisse A, B, C aus Ω gilt analog :

 

Falls die Ereignisse disjunkt sind, gilt

 
 

Bedingte Wahrscheinlichkeit

Bearbeiten
 

Unabhängigkeit von Ereignissen

Bearbeiten

Ein Ereignis A ist unabhängig von B, wenn

 

Totale Wahrscheinlichkeit

Bearbeiten

Sei A1 ...Ak eine disjunkte Zerlegung von Ω. Dann gilt für B ⊂ Ω:

 .

BAYES Theorem

Bearbeiten

Für zwei Ereignisse   und   mit   lässt sich die Wahrscheinlichkeit von

  unter der Bedingung, dass   eingetreten ist, angeben durch die Wahrscheinlichkeit von

  unter der Bedingung, dass   eingetreten ist:

 .

Hierbei ist

  die (bedingte) Wahrscheinlichkeit des Ereignisses   unter der Bedingung, dass   eingetreten ist,
  die (bedingte) Wahrscheinlichkeit des Ereignisses   unter der Bedingung, dass   eingetreten ist,
  die A-priori-Wahrscheinlichkeit des Ereignisses   und
  die A-priori-Wahrscheinlichkeit des Ereignisses  .


Endlich viele Ereignisse:

Wenn   eine Zerlegung der Ergebnismenge in disjunkte Ereignisse ist, gilt für die A-posteriori-Wahrscheinlichkeit  

 .

Den letzten Umformungsschritt bezeichnet man auch als Marginalisierung.


Da ein Ereignis   und sein Komplement   stets eine Zerlegung der Ergebnismenge darstellen, gilt insbesondere

 .

Zufallsvariablen und Verteilungsmodelle

Bearbeiten

diskrete Zufallsvariablen

Bearbeiten

Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge

von Ausprägungen x1, x2 ... annehmen kann, nennt man diskrete

Zufallsvariable X.

Eindimensionale Zufallsvariablen

Bearbeiten

Wahrscheinlichkeitsfunktion:

 

Verteilungsfunktion:

 

Normiertheit:

 

Erwartungswert

 

Varianz

 

bzw. mit dem Verschiebungssatz

 

Standardabweichung

 

Varianz der Summe unabhängiger Zufallsvariablen

 

Mehrdimensionale Zufallsvariablen

Bearbeiten

Einzelwahrscheinlichkeit

 

Kovarianz

 

bzw. mit dem Verschiebungssatz

 

Korrelationskoeffizient rxy nach Bravais-Pearson

Bearbeiten

für metrisch skalierte Merkmale zweier statistischer Variablen x und y

 

mit   als dem arithmetischen Mittel des Merkmals x. Mit Hilfe des Verschiebungssatzes:

 


Rangkorrelationskoeffizient nach Spearman

Bearbeiten
  • für Variablen, die stark von der Normalverteilung abweichen
  • sowie ordinalskalierte Variablen

Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird

jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:

 .

diskrete Verteilungsmodelle

Bearbeiten

Binomialverteilung

Bearbeiten

Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion

 

Erwartungswert

 

Varianz

 

Hypergeometrische Verteilung

Bearbeiten

Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern

N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),

wenn ihre Wahrscheinlichkeitsfunktion lautet

 

Erwartungswert

 

Varianz

 

Der Bruch   wird Korrekturfaktor genannt.

Poissonverteilung

Bearbeiten

Wahrscheinlichkeitsfunktion ( )

 


Erwartungswert und Varianz

 

stetige Zufallsvariablen

Bearbeiten

Eine stetige Zufallsvariable kann in jedem beschränkten Intervall unendlich viele Ausprägungen annehmen.

Ihre Verteilung lässt sich durch eine Dichtefunktion f(x) beschreiben.

(f(x) ist hier keine Wahrscheinlichkeit, sondern eine Dichte !)

Verteilungsfunktion

 
  • Es gilt: P(X = a) = 0.
  • Wegen P(X = a) = 0 ist P(X ≤ a) = P(X < a) und P(X > a) = P(X ≥ a)

Die Dichtefunktion f(x) ist die erste Ableitung der Verteilungsfunktion, falls diese an der Stelle x differenzierbar ist.

  • Die Dichtefunktion f(a) kann auch größer als 1 werden.
  • Ausgehend von   ist das p-Quantil x(p) der Wert x, der zu einer gegebenen Wahrscheinlichkeit p gehört. Speziell x(0,5) ist der Median.

Erwartungswert

 

falls E(X) existiert, d.h. nicht unendlich wird.

Varianz

 

wobei auch hier der Verschiebungssatz angewendet werden kann:

 

stetige Verteilungsmodelle

Bearbeiten

Stetige Gleichverteilung (Rechteckverteilung)

Bearbeiten

Dichtefunktion der Gleichverteilung im Intervall [a,b]

 

Erwartungswert

 

Varianz

 

Exponentialverteilung

Bearbeiten

Dichtefunktion der Exponentialverteilung

 

Verteilungsfunktion

 

Erwartungswert

 

Varianz

  .

Normalverteilung

Bearbeiten

Für eine Zufallsvariable   lautet die Dichtefunktion der NV

  für  

Normierung mit   ergibt die Standardnormalverteilung mit der Dichtefunktion  :

 

Anm.:Es wird auch die Schreibweise   anstelle   verwendet

Erwartungswert

 

Varianz

 

p-Quantil

Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)

  .

 

Beispielsweise ist z(0,975) = 1,96.

Linearkombinationen normalverteilter Zufallsvariablen

Bearbeiten

Für n normalverteilte Zufallsvariablen  

ist die Linearkombination

 

ebenfalls normalverteilt mit dem Erwartungswert

  .

Falls die   stochastisch unabhängig sind, gilt für die Varianz

  .

Die Varianz muss größer Null sein, deshalb muss zudem   für mindestens ein   gelten.

Verteilung des Stichprobendurchschnitts

Bearbeiten

Sind die n Zufallsvariablen   (i = 1, ... , n) sämtlich normalverteilt

mit gleichem μ und gleichem σ2, ist die Linearkombination

X mit a0 = 0, a1 = a2 = ... = an = 1/n, also : 

normalverteilt dem Erwartungswert

 

und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz

  .

CHI-Quadrat-verteilung

Bearbeiten

Die   seien unabhängige standardnormalverteilte Zufallsvariablen.

Dann ist die Verteilung der Zufallsvariablen  

chi-quadrat verteilt mit n Freiheitsgraden  

Erwartungswert:

 

Varianz

  .

Anm.: Die Gruppe der Hypothesentests mit  -Verteilung bezeichnet man als  -Test.

Hierunter sind mehrere Tests zu verstehen:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.

Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.

Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

t- (Student-) Verteilung

Bearbeiten

Für die unabhängigen Variablen   (standardnormalverteilt) und   ist die Variable

 

t-verteilt   mit n Freiheitsgraden.

Erwartungswert

  für  

Varianz

  für  


Fisher- Verteilung

Bearbeiten

Für die unabhängigen Variablen   und   ist die Verteilung der Variablen

 

Fisher- oder F-verteilt   mit den Freiheitsgraden m und n.

Erwartungswert

  für  

Varianz

  für  


Approximation von Verteilungen

Bearbeiten
Gesuchte Verteilung Approximation durch
  Binomial Poisson Normal
Binomial
 
---  
 
 
 
 
Hypergeometrische
 
 
 
über Binomialverteilung  
 
 
Poisson
 
--- ---  
χ2-Verteilung  
 
--- ---  
 
t-Verteilung
 
--- ---  
F-Verteilung
 
--- ---  
 

Grenzwertsatz

Bearbeiten

Gesetz der großen Zahlen

Bearbeiten

Für ein beliebig kleines c > 0 gilt

  für  

Theorem von Bernoulli

Bearbeiten

Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen

eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)

Hauptsatz der Statistik

Bearbeiten

Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)

für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)

 

(sup: Maximale Abweichung zwischen   und  ).

Zentraler Grenzwertsatz

Bearbeiten

Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ

und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)

der standardisierten Summe

 

für n → ∞ an jeder Stelle   gegen die Verteilungsfunktion   der Standardnormalverteilung

 

Grenzwertsatz von De Moivre

Bearbeiten

Die Verteilung der standardisierten absoluten Häufigkeit   der Standardnormalverteilung

konvergiert für n → ∞ gegen eine Standardnormalverteilung.

Deskriptive Statistik

Bearbeiten

Skalenniveaus

Bearbeiten

Nominalskala

Bearbeiten

Die Ausprägungen des nominalskalierten Merkmals können nicht geordnet werden,

man kann sie nur vergleichen und abzählen.

Es handelt sich um qualitative Merkmale. Erhalten die Ausprägungen Ziffern zugeordnet,

handelt es sich nur um eine Verschlüsselung (Codierung): 1 = männlich, 2 = weiblich.

Ordinalskala

Bearbeiten

Zwischen den Ausprägungen des ordinalskalierten (rangskalierten) Merkmals existiert eine Beziehung

der Form mehr oder weniger, < oder >, besser oder schlechter.

Eine Quotientenbildung macht wenig Sinn (Beispiel Noten: 1, 2, 3, 4, 5).

Intervallskala

Bearbeiten

Die Abstände zwischen den Ausprägungen des (quantitativen) Merkmals der Intervallskala

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen.

Beispiel: Kinderzahl, Temperatur.

Verhältnissskala

Bearbeiten

Sowohl die Abstände als auch Verhältnisse zwischen den Ausprägungen des (quantitativen) Merkmals

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen. Beispiel: Einkommen.

Zweig-Blätter-(stem-leaf-) Diagramm

Bearbeiten

Die linke Spalte enthält als „Stämme“ die Äquivalenzklassen, in die die auf der rechten Seite als „Blätter“

dargestellten Merkmale eingeteilt werden. Beispiel: Gegeben sind die Werte 0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7.

Wählt man die natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm:
3 5 7
2 5 5 6 7 8
1
0 3 4

Lageparameter

Bearbeiten

Arithmetisches Mittel

Bearbeiten
 

Median (Zentralwert)

Bearbeiten

Sind die Beobachtungswerte der Größe nach geordnet, ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt.

 

geometrisches Mittel

Bearbeiten
 

harmonisches Mittel

Bearbeiten
 

Modalwert

Bearbeiten

Der am häufigsten auftretende Wert

Grundgesamtheit:

 

Stichprobe:

 

Verschiebungssatz

Bearbeiten

Für jedes   gilt

 

Damit erhält man als Varianz

 

Variationskoeffizient

Bearbeiten
 


Konzentrationsmasse

Bearbeiten

Konzentrationsrate

Bearbeiten

Die Konzentrationsrate CRn ist die Summe der Marktanteile der n größten Unternehmen eines relevanten Marktes. Im GWB werden die Raten CR1, CR3 und CR5 herangezogen.

Lorenzkurve

Bearbeiten

Für eine geordnete Urliste x1 ≤ x2… ≤xn trägt man die kumulierte relative Merkmalssumme

 

über den Anteil der Merkmalsträger   auf.

Liegen die Merkmale in gruppierter Form vor, trägt man die kumulierte relative Merkmalssumme

 

über der Häufigkeit   auf.

Zwischen (0;0) und (1;1) wird die Winkelhalbierende des Koordinatensystems eingetragen.

Gini-Koeffizient

Bearbeiten

Als Ginikoeffizient G bezeichnet man das Verhältnis der Fläche zwischen Winkelhalbierender und der Lorenzkurve

zur Gesamtfläche unter der Winkelhalbierenden (= 1/2).

Die Fläche unterhalb der Lorenzkurve kann man einfach aus Teil-Trapezflächen zusammensetzen:

 

(p0 = 0 ; q0 = 0):


Herfindahl-Index

Bearbeiten
 

Parameterschätzung

Bearbeiten

Konfidenzintervall für den Erwartungswert μ

Bearbeiten

Normalverteiltes Merkmal mit bekannter Varianz

Bearbeiten

Das Zufallsintervall enthält mit einer Wahrscheinlichkeit 1-α den Parameter:

 

Konfidenzintervall

 

(Quantil z aus Normalverteilungstabelle)

Normalverteiltes Merkmal mit unbekannter Varianz

Bearbeiten

Für normalverteilte Merkmale und unbekannter Varianz muss die Varianz durch s2 geschätzt werden.

 .

Konfidenzintervall

 

(Quantil   aus der t-Verteilungstabelle bei Freiheitsgrad n-1).

Merkmal mit unbekannter Verteilung und bekannter Varianz

Bearbeiten

Konfidenzintervall

  für n > 30.


Merkmal mit unbekannter Verteilung und unbekannter Varianz

Bearbeiten

Konfidenzintervall

  für n > 50

Konfidenzintervalle für den Anteilswert einer dichotomen Grundgesamtheit

Bearbeiten

Modell mit Zurücklegen

Bearbeiten

Beschreibung durch den geschätztem Anteilswert  . Für n > 100 und  )

erhält man das 1-α-Konfidenzintervall für p durch eine Approximation der Binomialverteilung mit Hilfe der Normalverteilung:

 

Modell ohne Zurücklegen

Bearbeiten

Für   kann die hypergeometrische Verteilung durch die Normalverteilung approximiert werden:


 -Konfidenzintervall für  :


 

Hypothesentests

Bearbeiten

Vorgehen beim Hypothesentest

Bearbeiten

I. Feststellung der Verteilung des Merkmals in der Grundgesamtheit

II. Aufstellen der Nullhypothese

III. Festlegen der Testfunktion T

IV. Festlegen des Annahmebereichs ("Nichtablehnungsbereichs") (für ein zu bestimmendes Signifikanzniveau)


Fällt die Prüfgröße   in den Bereich [ u;  o],

wird H0 nicht abgelehnt. Es soll sein

 

(beachte: ein- oder zweiseitig)

α : Signifikanzniveau oder α-Fehler


V. Stichprobe erheben

VI. Entscheidung treffen


H0 ist wirklich wahr H1 ist wirklich wahr
H0 wird beibehalten richtige Entscheidung (1-α) Fehler 2. Art (β-Fehler)
H1 wird angenommen Fehler 1. Art (α-Fehler) richtige Entscheidung (1-β)

Tests auf Lageparameter (Erwartungswert, Median, Anteilswert)

Bearbeiten

Test auf Erwartungswert

Bearbeiten
Test    
zweiseitig μ = μ0 μ ≠ μ0
rechtsseitig μ ≤ μ0 μ > μ0
linksseitig μ ≥ μ0 μ < μ0


1. X ist normalverteilt, σ ist bekannt bei beliebigem n bzw. näherungsweise normalverteilt bei n > 30

Testfunktion
  (Gauß-Test):
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

2. X ist normalverteilt, σ ist unbekannt bei beliebigem n

Testfunktion
  (t-Test).
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

3. X ist näherungsweise normalverteilt, σ ist unbekannt bei n > 30

Testfunktion
  (Gauß-Test) .
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    

Vorzeichentest

Bearbeiten

Einstichprobenproblem

Bearbeiten
Einseitig Zweiseitig
       
       
       
       

Die Stichprobenwerte, die größer als der hypothetische Median   sind, bekommen ein "+" zugeordnet;

Werte, die kleiner sind, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt und dient als Teststatistik.

Zweistichprobenproblem

Bearbeiten

Die   Beobachtungspaare dürfen nicht voneinander abhängen, d.h. das Wertepaar   muss unabhängig

vom Wertepaar   sein.

Besitzen beide Grundgesamtheiten den gleichen Median, gilt  .

Folgende Hypothesen können mit dem Vorzeichentest geprüft werden:

Einseitig Zweiseitig
       
       

Die Wertepaare der Stichproben, bei denen   gilt, bekommen ein "+" zugeordnet;


Wertepaare, für die   gilt, ein "-". Die Anzahl der positiven Vorzeichen wird gezählt

und dient als Teststatistik. Die Teststatistik entspricht der Anzahl der positiven Vergleiche (Differenzen der Werte bzw. Ränge):

 

mit

 

Für das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen.

Bei Gültigkeit der Nullhypothese   ist die Summe der positiven Differenzen binomialverteilt mit  ,

da der Median dem 50 %-Quantil entspricht. n' bezeichnet den nach Behandlung von Ties (Nulldifferenzen, Rangbindungen, s.u.)

verbleibenden Stichprobenumfang. Bei Gültigkeit der Nullyhypothese ist die Verteilung der Prüfgröße symmetrisch.

Approximation durch die Normalverteilung

Mit   nähert sich die Binomialverteilung einer Normalverteilung mit  ,

als Faustregel   ( ).

Mit   bzw.   ist die z-standardisierte Größe

 

näherungsweise standardnormalverteilt.

Bindungen (Nulldifferenzen) Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverändert

oder im Einstichprobenproblem einige Werte gleich dem Median, ergeben sich Nulldifferenzen bzw. Bindungen (Ties),

die man so behandeln kann:

  • Beobachtungen mit Rangbindungen werden eliminiert, d.h. der Stichprobenumfang wird reduziert.
  • Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet. Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert.
  • Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0,5 einer der beiden Gruppen (+ oder -) zugeordnet.


Test auf Anteilswert (Binomialtest)

Bearbeiten

Der Anteilswert θ wird geschätzt durch

 .

Mit dem Binomialtest können folgende Hypothesenpaare für θ getestet werden:

Test    
zweiseitig    
rechtsseitig    
linksseitig    


für n > 30 , nθ0 ≥ 10 n(1-θ0) ≥ 10
kann man durch die Gauß-Verteilung approximieren:
Testfunktion
  (Gauß-Test) .
Ablehnungsbereich
zweiseitig    
rechtsseitig    
linksseitig    
für n < 30 oder nθ0 < 10 oder n(1-θ0) < 10
ist der exakte Binomialtest anzuwenden:
Testfunktion

Die Teststatistik   gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang   aufgetreten ist.

Unter der Nullhypothese   ist die Teststatistik  -verteilt, das heißt

 .
Ablehnungsbereich

 

Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau   in der Regel nicht eingehalten werden.

Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau   gilt  .

Für den zweiseitigen Test werden daher als kritische Werte das größte   und das kleinste   bestimmt, für die gilt

  •   und
  •  .

Das exakte Signifikanzniveau ergibt sich als

 .

Für die beiden einseitigen Tests wird analog verfahren.

Test Kritische Werte Kritischer Bereich Grenze(n)
zweiseitig     und    
rechtsseitig       c = kleinster Wert, für den  
linksseitig     c = größter Wert, für den  

Tests auf Streuung

Bearbeiten

Test auf Varianz

Bearbeiten
Test    
zweiseitig      
rechtsseitig        
linksseitig        


1. X ist normalverteilt, μ ist unbekannt, n beliebig

Testfunktion
 
Ablehnungsbereich
zweiseitig     oder  
rechtsseitig    
linksseitig    

2. X ist normalverteilt, μ ist bekannt, n beliebig

Testfunktion
 
Ablehnungsbereich
zweiseitig     oder  
rechtsseitig    
linksseitig    

Tests auf Zusammenhangs- und Assoziationsparameter

Bearbeiten

Chi-Quadrat-Unabhängigkeitstest

Bearbeiten
Nullhypothese
 : Die Merkmale   und   sind stochastisch unabhängig.

Die Beobachtungen der Merkmale   und   liegen paarweise in   bzw.   Klassen vor.

Es gibt insgesamt   paarweise Beobachtungen von   und  , die sich auf   Kategorien verteilen. Aufstellung z. B. in einer Häufigkeitstabelle:
Merkmal   Summe Σ
Merkmal   1 2 k r nj.
1 n11 n12 ... n1k ... n1r n1.
2 n21 n22 n2k n2r n2.
j njk nj.
m nm1 nm2 nmk nmr nm.
Summe Σ n.1 n.2 n.k n.r n

Absolute Randhäufigkeiten   bzw.  

  und  


Prüfgröße für den Unabhängigkeitstest:

 

Mit : 

  wird abgelehnt, wenn   ist.

Anpassungs- oder Verteilungstests

Bearbeiten

Chi-Quadrat-Anpassungs- oder Verteilungstest

Bearbeiten

Die Wahrscheinlichkeiten eines Merkmals   seien in der Grundgesamtheit unbekannt.

Nullhypothese:  : Das Merkmal   besitzt die Wahrscheinlichkeitsverteilung  

Für   unabhängige Beobachtungen   des Merkmals   wird die Zahl

der Beobachtungen in der  -ten Klasse ist die beobachtete Häufigkeit  .

Im Vergleich dazu wird die hypothetische Verteilung bestimmt aufgrund der Wahrscheinlichkeit  ,

dass eine Ausprägung von   in die Kategorie   fällt. Die unter   zu erwartende Häufigkeit ist:

 

Die Prüfgröße (Größe der Abweichung)

 

ist bei ausreichend großen   annähernd chi-Quadrat-verteilt mit   Freiheitsgraden.

  wird abgelehnt, wenn   gilt.


Kolmogorow-Smirnow-Anpassungstest

Bearbeiten

Test auf Übereinstimmung zweier Wahrscheinlichkeitsverteilungen.

Man betrachtet ein statistisches Merkmal X, dessen Verteilung in der Grundgesamtheit unbekannt ist.

  (Die Zufallsvariable X besitzt die Wahrscheinlichkeitsverteilung F0.)
  (Die Zufallsvariable X besitzt eine andere Wahrscheinlichkeitsverteilung als F0.)

Der Kolmogorow-Smirnow-Test vergleicht die empirische Verteilungsfunktion   mit   mittels der Teststatistik

  (sup: Supremum)

Die Teststatistik ist unabhängig von der hypothetischen Verteilung F0.

Ist der Wert der Teststatistik größer als der entsprechende tabellierte kritische Wert, so wird die Nullhypothese verworfen.

Einstichprobenproblem

Bearbeiten

Von einer reellen Zufallsvariablen   liegen   aufsteigend sortierte Beobachtungswerte   ( ) vor.

Von diesen Beobachtungen wird die relative Summenhäufigkeit   mit der entsprechenden hypothetischen

Verteilung der Grundgesamtheit F0(xi) verglichen. Voraussetzung:   ist stetig.

Für jedes   werden die absoluten Differenzen

  und : 

berechnet, wobei   gesetzt wird. Wenn die größte Differenz   aus allen Differenzen  ,  

einen kritischen Wert   übersteigt, wird die Hypothese abgelehnt.

Bis n=40 greift man auf Tabellen zurück (s. Anhang). Für größere   werden sie über   angenähert.


Zweistichprobenproblem

Bearbeiten

Liegt nun zusätzlich zur Zufallsvariablen   eine entsprechende Zufallsvariable   vor (mit   geordneten Werten  ),

so kann durch den Zweistichprobentest überprüft werden, ob   und   derselben Verteilungsfunktion folgen.

Von beiden Beobachtungen werden die die Differenzen der relativen Summenfunktionen   bzw.   ermittelt:

  und  :  .


Die Nullhypothese wird abgelehnt, falls   den kritischen Wert   überschreitet.

Für kleine Werte von   und   greift man auf Tabellen zurück.

Für große Werte von n und m wird die Nullhypothese abgelehnt, falls

  ,

wobei   für große   und   näherungsweise als   berechnet werden kann.

Varianzanalyse

Bearbeiten

univariate Varianzanalyse (ANOVA)

Bearbeiten

Man untersucht man den Einfluss einer unabhängigen Variable (Faktor) mit k verschiedenen Stufen (Gruppen) auf die Ausprägungen einer Zufallsvariablen.

Dazu werden die k Mittelwerte der Ausprägungen für die Gruppen miteinander verglichen, und zwar vergleicht man die Varianz zwischen den Gruppen mit der Varianz innerhalb der Gruppen.

Weil sich die totale Varianz aus den zwei genannten Komponenten zusammensetzt, spricht man von Varianzanalyse.

Die einfaktorielle ANOVA ist die Verallgemeinerung des t-Tests bei mehr als zwei Gruppen. Für k=2 ist sie äquivalent mit dem t-Test.

Es sei   der Erwartungswert der abhängigen Variable in der i. Gruppe.


  (Es besteht kein Unterschied zwischen den Erwartungswerten der Gruppen.)


  (Es besteht zwischen mindestens zwei Erwartungswerten ein Unterschied.)


→ Wir wissen dann nur mit einer bestimmten Wahrscheinlichkeit, dass mindestens zwei Ausprägungen einen bedeutsamen Unterschied aufweisen.

Effektdarstellung :

 

Darin sind:
Xij: Zielvariable; annahmegemäß in den Gruppen normalverteilt
  k: Anzahl der Faktorstufen des betrachteten Faktors
  ni: Stichprobenumfänge für die einzelnen Faktorstufen
  μ: arithmetisches Mittel der Erwartungswerte in den Gruppen
 αi: Effekt der i-ten Faktorstufe
εij: Störvariablen, unabhängig und normalverteilt mit Erwartungswert 0 und gleicher (unbekannter) Varianz σ2.

Erwartungswert in der i. Gruppe:  

 

Betrachtung der Quadratsummen (Variabiliät)

Die gesamte Variabilität QST (gesamte quadratische Abweichung vom Mittelwert) lässt sich in zwei Teile zerlegen:

 

Der erste Teil QSA (Gruppenzugehörigkeit) entspricht der ('Inter-')Variabilität zwischen den Gruppen.

 

Der Rest QSE entspricht der Variabilität innerhalb der Gruppen (gesamte 'Intra'-Abweichung von den Mittelwerten in den Gruppen, der 'Zufall'):

 

Die zwei Quadratsummen QSA und QSE sind stochastisch unabhängig.

Im Fall von k Gruppen mit gleichem Umfang b=n/k gilt unter der Nullhypothese außerdem:

  folgt einer Chi-Quadrat-Verteilung mit k-1 Freiheitsgraden,

und

  folgt einer Chi-Quadrat-Verteilung mit n-k Freiheitsgraden.

mittlere Quadratsummen:

  und : 

Prüfgröße:

 

Gruppen gleicher Größe

Bearbeiten

Im Falle Gruppen gleicher Größe ist F unter der Nullhypothese F-verteilt

mit   Freiheitsgraden im Zähler und   Freiheitsgraden im Nenner.

Wenn die Prüfgröße

 

signifikant (d.h.   wird, unterscheiden sich mindestens zwei Faktoren ('Gruppen') voneinander.

In Post-Hoc-Tests kann dann berechnet werden, zwischen welchen einzelnen Gruppen der Unterschied liegt.

Regressionsrechnung

Bearbeiten

Lineare Regression

Bearbeiten
Methode der kleinsten Quadrate
 

bezüglich a und b.

Nach Ausmultiplikation, Ableiten und Nullsetzen

 
 

erhält man die gesuchten Regressionskoeffizienten als die Lösungen

 

und

 

wobei  .

Mit dem Verschiebungssatz kann man   auch so ermitteln:

 

Schätzungen

 

Residuen ri :

 

Stichprobenvarianz der Residuen:

 

Bestimmtheitsmaß

 

mit dem Verschiebungssatz :

 


 

Varianz der Residuen

 

Variablentransformation

Bearbeiten
Funktion u v
     
     
     
     
     

Die Methode kann auf weitere Parameter erweitert werden.

Zeitreihenanalyse

Bearbeiten

Komponentenunterteilung bei Zeitreihen

Bearbeiten

Mögliche Aufteilung einer Zeitreihe in Komponenten:

  • Trend Q
  • Konjunkturelle Schwankung K
  • Saisonale Schwankung S
  • Restschwankung r

Bei Unabhängigkeit dieser Komponenten kann man ein additives Modell annehmen:

 

Nehmen beispielsweise zyklische Schwankungen mit steigendem Trend zu, könnte ein multiplikatives Modell

 

angebracht sein. Variablentransformation durch Logarithmieren

 


Bearbeiten

‘‘‘Regressionsmodell‘‘‘

  bzw.    

mit den Lösungen

 
 
 

und

 
  .

Die Trendwerte Qt sind dann

 .

Nichtlinearer Trendverlauf: Lösung über Variablentransformation oder Anwendung eines nichtlinearen Regressionsansatzes

Schätzung der Saisonkomponente

Bearbeiten

Additives Modell

 

Nach Schätzung der Trendkomponente Qt bleibt noch die Abweichung

 

und

 

dt: trendbereinigter Zeitreihenwert

Bestimmung der saisonalen Komponente St über Fourieranalyse oder (einfacher)

Bildung des arithmetischen Durchschnitts aller Werte dt, die die gleiche Saison betreffen,

als Schätzung für die saisonale Komponente. Dann bleibt die nichterklärte Restschwankung

 

Prognose für den Zeitpunkt T+k (mit St als Wert in der Saison T+k)


 

Schätzung der glatten Komponente mit gleitenden Mittelwerten

Bearbeiten

Lässt sich die Trendkomponente des Zeitreihenmodells offensichtlich durch keine funktionale lineare oder

nichtlineare Beziehung darstellen, kann man eine glatte Komponente mit Hilfe gleitender Mittelwerte bestimmen.

einfacher gleitender Mittelwert

Bearbeiten

Beispiel: Mittelwert dritter Ordnung:

 

Die Ordnung des Mittelwerts sollte so gewählt werden, daß möglichst genau eine Periode umfasst wird.

Zur Prognose über den Beobachtungszeitraum hinaus sind gleitende Mittelwerte bedingt geeignet,

da die Randwerte der Zeitreihe nicht geschätzt werden.

gewichteter gleitender Mittelwert

Bearbeiten

Beispiel: Mittelwert dritter Ordnung mit z.B.  

 

Exponentielle Glättung

Bearbeiten

Gewichtung durch den Glättungsfaktor   mit  :

Geglätteter Schätzwert y*t als gewichteter Durchschnitt aus dem aktuellen Zeitreihenwert yt

und dem Schätzwert der Vorperiode y*t-1 (y*0 geeignet wählen):

 

Auflösung der Rekursivität:

 

Für die Wahl des Glättungsfaktors wird häufig 0,2 bis 0,3 empfohlen. Man kann aber auch mit Hilfe der Regressionsanalyse den Glättungsfaktor schätzen.


Exponentielle Glättung bei trendbehafteten Werten

Bearbeiten

Bei Trend werden die Zeitreihenwerte systematisch unter- bzw. überschätzt. Abhilfe bieten ggf. gleitende Durchschnitte zweiter Ordung.

Die bereits einmal geglätteten Werte erneut einer Glättung unterzogen. Man erhält den Schätzwert  , der sich analog zu oben berechnet aus

 

Für einen brauchbaren Prognosewert für Periode t+1 muss man dann bestimmen

  .

Symbolverzeichnis

Bearbeiten

allgemein

Bearbeiten
Symbol Verwendung
A,B Ereignisse
Ω = {A,B,C...} Ereignisraum
|A| Anzahl der Ereignisse A
P(A) Wahrscheinlichkeit für das Eintreten von A
∪ ∩ Und-Verknüpfung (Konjunktion) / Oder-Verknüpfung (Disjunktion)
P(A | B) Bedingte Wahrscheinlichkeit (A wenn B)
E(X) Erwartungswert von X
f(X) Wahrscheinlichkeitsfunktion
F(X) Verteilungsfunktion
N Grundgesamtheit
n Stichprobe
X Zufallsvariable
  Varianz von X
Θ Anteilswert einer Grundgesamtheit

Verteilungsmodelle

Bearbeiten
Symbol Verwendung
  Binomialverteilung
F(m,n) Fisherverteilung
  Hypergeometrische Verteilung
  Poissonverteilung
  Normalverteilung
t(n) t- (Student-) Verteilung
  Standardnormalverteilung

Tabellen

Bearbeiten
Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
2 0 0,9801 0,9025 0,81 0,64 0,5625 0,49 0,25
1 0,0198 0,095 0,18 0,32 0,375 0,42 0,5
2 0,0001 0,0025 0,01 0,04 0,0625 0,09 0,25
3 0 0,9703 0,8574 0,729 0,512 0,4219 0,343 0,125
1 0,0294 0,1354 0,243 0,384 0,4219 0,441 0,375
2 0,0003 0,0071 0,027 0,0960 0,1406 0,189 0,375
3 0 0,0001 0,001 0,008 0,0156 0,027 0,125
4 0 0,9606 0,8145 0,6561 0,4096 0,3164 0,2401 0,0625
1 0,0388 0,1715 0,2916 0,4096 0,4219 0,4116 0,25
2 0,0006 0,0135 0,0486 0,1536 0,2109 0,2646 0,375
3 0 0,0005 0,0036 0,0256 0,0469 0,0756 0,25
4 0 0 0,0001 0,0016 0,0039 0,0081 0,0625
5 0 0,951 0,7738 0,5905 0,3277 0,2373 0,1681 0,0313
1 0,048 0,2036 0,3281 0,4096 0,3955 0,3602 0,1563
2 0,001 0,0214 0,0729 0,2048 0,2637 0,3087 0,3125
3 0 0,0011 0,0081 0,0512 0,0879 0,1323 0,3125
4 0 0 0,0005 0,0064 0,0146 0,0284 0,1563
5 0 0 0 0,0003 0,001 0,0024 0,0313
6 0 0,9415 0,7351 0,5314 0,2621 0,178 0,1176 0,0156
1 0,0571 0,2321 0,3543 0,3932 0,356 0,3025 0,0938
2 0,0014 0,0305 0,0984 0,2458 0,2966 0,3241 0,2344
3 0 0,0021 0,0146 0,0819 0,1318 0,1852 0,3125
4 0 0,0001 0,0012 0,0154 0,033 0,0595 0,2344
5 0 0 0,0001 0,0015 0,0044 0,0102 0,0938
6 0 0 0 0,0001 0,0002 0,0007 0,0156
7 0 0,9321 0,6983 0,4783 0,2097 0,1335 0,0824 0,0078
1 0,0659 0,2573 0,372 0,367 0,3115 0,2471 0,0547
2 0,002 0,0406 0,124 0,2753 0,3115 0,3177 0,1641
3 0 0,0036 0,023 0,1147 0,173 0,2269 0,2734
4 0 0,0002 0,0026 0,0287 0,0577 0,0972 0,2734
5 0 0 0,0002 0,0043 0,0115 0,025 0,1641
6 0 0 0 0,0004 0,0013 0,0036 0,0547
7 0 0 0 0 0,0001 0,0002 0,0078


Binomialverteilung (Wahrscheinlichkeitsfunktion)

n

x
p=
0,01
...
0,05

0,1

0,2

0,25

0,3

0,5
8 0 0,9227 0,6634 0,4305 0,1678 0,1001 0,0576 0,0039
1 0,0746 0,2793 0,3826 0,3355 0,267 0,1977 0,0313
2 0,0026 0,0515 0,1488 0,2936 0,3115 0,2965 0,1094
3 0,0001 0,0054 0,0331 0,1468 0,2076 0,2541 0,2188
4 0 0,0004 0,0046 0,0459 0,0865 0,1361 0,2734
5 0 0 0,0004 0,0092 0,0231 0,0467 0,2188
6 0 0 0 0,0011 0,0038 0,01 0,1094
7 0 0 0 0,0001 0,0004 0,0012 0,0313
8 0 0 0 0 0 0,0001 0,0039
9 0 0,9135 0,6302 0,3874 0,1342 0,0751 0,0404 0,002
1 0,083 0,2985 0,3874 0,302 0,2253 0,1556 0,0176
2 0,0034 0,0629 0,1722 0,302 0,3003 0,2668 0,0703
3 0,0001 0,0077 0,0446 0,1762 0,2336 0,2668 0,1641
4 0 0,0006 0,0074 0,0661 0,1168 0,1715 0,2461
5 0 0 0,0008 0,0165 0,0389 0,0735 0,2461
6 0 0 0,0001 0,0028 0,0087 0,021 0,1641
7 0 0 0 0,0003 0,0012 0,0039 0,0703
8 0 0 0 0 0,0001 0,0004 0,0176
9 0 0 0 0 0 0 0,002
10 0 0,9044 0,5987 0,3487 0,1074 0,0563 0,0282 0,001
1 0,0914 0,3151 0,3874 0,2684 0,1877 0,1211 0,0098
2 0,0042 0,0746 0,1937 0,302 0,2816 0,2335 0,0439
3 0,0001 0,0105 0,0574 0,2013 0,2503 0,2668 0,1172
4 0 0,001 0,0112 0,0881 0,146 0,2001 0,2051
5 0 0,0001 0,0015 0,0264 0,0584 0,1029 0,2461
6 0 0 0,0001 0,0055 0,0162 0,0368 0,2051
7 0 0 0 0,0008 0,0031 0,009 0,1172
8 0 0 0 0,0001 0,0004 0,0014 0,0439
9 0 0 0 0 0 0,0001 0,0098
10 0 0 0 0 0 0 0,001


Weitere Werte können mittels =BINOMVERT(x;n;p;0) bei Tabellenkalkulationsprogrammen

oder der R-Funktion dbinom(x, n , p) bestimmt werden

Standard-Normalverteilung (Verteilungsfunktion)  
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5 0,504 0,508 0,512 0,516 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,591 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,648 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,67 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,695 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,719 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,758 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,791 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,834 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,877 0,879 0,881 0,883
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,898 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,937 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,975 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,983 0,9834 0,9838 0,9842 0,9846 0,985 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,989
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,992 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,994 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,996 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,997 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,998 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,999 0,999
3,1 0,999 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09


Zur Bildung von z ist der Wert von linker Spalte und oberer Zeile zu addieren.

Ablesebeispiel:  

weitere Werte: =NORM.S.VERT(z;WAHR) bzw. (R-Aufruf): pnorm(z)

 -Verteilung (Quantile)
n p=
0,005
...
0,01
...
0,025

0,05

0,1

0,5

0,9

0,95

0,975

0,99

0,995
1 0,000 0,000 0,001 0,004 0,016 0,455 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,21 10,597
3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,86
5 0,412 0,554 0,831 1,145 1,61 4,351 9,236 11,07 12,833 15,086 16,75
6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,69 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,18 2,733 3,49 7,344 13,362 15,507 17,535 20,09 21,955
9 1,735 2,088 2,7 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,94 4,865 9,342 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,92 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 11,34 18,549 21,026 23,337 26,217 28,3
13 3,565 4,107 5,009 5,892 7,042 12,34 19,812 22,362 24,736 27,688 29,819
14 4,075 4,66 5,629 6,571 7,79 13,339 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 15,338 23,542 26,296 28,845 32 34,267
17 5,697 6,408 7,564 8,672 10,085 16,338 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,39 10,865 17,338 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 18,338 27,204 30,144 32,852 36,191 38,582
20 7,434 8,26 9,591 10,851 12,443 19,337 28,412 31,41 34,17 37,566 39,997
21 8,034 8,897 10,283 11,591 13,24 20,337 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 21,337 30,813 33,924 36,781 40,289 42,796
23 9,26 10,196 11,689 13,091 14,848 22,337 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 23,337 33,196 36,415 39,364 42,98 45,559
25 10,52 11,524 13,12 14,611 16,473 24,337 34,382 37,652 40,646 44,314 46,928
26 11,16 12,198 13,844 15,379 17,292 25,336 35,563 38,885 41,923 45,642 48,29
27 11,808 12,879 14,573 16,151 18,114 26,336 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 27,336 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 28,336 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 29,336 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 30,336 41,422 44,985 48,232 52,191 55,003
32 15,134 16,362 18,291 20,072 22,271 31,336 42,585 46,194 49,48 53,486 56,328
33 15,815 17,074 19,047 20,867 23,11 32,336 43,745 47,4 50,725 54,776 57,648
34 16,501 17,789 19,806 21,664 23,952 33,336 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 34,336 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 35,336 47,212 50,998 54,437 58,619 61,581
37 18,586 19,96 22,106 24,075 26,492 36,336 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 37,335 49,513 53,384 56,896 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 38,335 50,66 54,572 58,12 62,428 65,476
40 20,707 22,164 24,433 26,509 29,051 39,335 51,805 55,758 59,342 63,691 66,766


p = 1−α

weitere Werte: =CHIQU.INV(n;p) bzw. (R-Aufruf): qchisq(p,n)

Kritische Werte für den Kolmogorov-Smirnov- (KS-) Anpassungstest
n D0,20 D0,10 D0,05 D0,02 D0,01 D0,005
1 0,9 0,95 0,975 0,99 0,995 0,9975
2 0,68377 0,77638 0,84187 0,89998 0,92925 0,94995
3 0,56481 0,63604 0,70758 0,78452 0,82895 0,86419
4 0,49265 0,56521 0,62392 0,68884 0,73417 0,77628
5 0,44697 0,50944 0,56326 0,62715 0,66848 0,70533
6 0,41035 0,46799 0,51925 0,57738 0,61655 0,65277
7 0,38145 0,43606 0,48341 0,53841 0,57576 0,60966
8 0,35828 0,40962 0,45426 0,50652 0,54174 0,5742
9 0,33907 0,38746 0,43 0,47957 0,51327 0,54435
10 0,32257 0,36866 0,40924 0,4566 0,48889 0,51864
11 0,30825 0,35241 0,39121 0,43668 0,46766 0,49631
12 0,29573 0,33814 0,37542 0,41916 0,449 0,47664
13 0,28466 0,32548 0,36142 0,4036 0,43243 0,45914
14 0,27477 0,31416 0,34889 0,38968 0,41758 0,44345
15 0,26585 0,30397 0,33759 0,37711 0,40416 0,42927
16 0,25774 0,29471 0,32733 0,36569 0,39197 0,41637
17 0,25035 0,28626 0,31796 0,35526 0,38083 0,40458
18 0,24356 0,2785 0,30935 0,34568 0,37059 0,39374
19 0,23731 0,27135 0,30142 0,33684 0,36114 0,38373
20 0,23152 0,26473 0,29407 0,32864 0,35238 0,37445
21 0,22614 0,25857 0,28724 0,32103 0,34423 0,36582
22 0,22111 0,25283 0,28086 0,31392 0,33663 0,35776
23 0,21642 0,24746 0,2749 0,30727 0,32951 0,35021
24 0,21201 0,24241 0,2693 0,30102 0,32283 0,34313
25 0,20786 0,23767 0,26404 0,29515 0,31654 0,33646
26 0,20396 0,2332 0,25907 0,28961 0,3106 0,33016
27 0,20026 0,22897 0,25437 0,28437 0,30499 0,32421
28 0,19676 0,22497 0,24993 0,2794 0,29968 0,31857
29 0,19344 0,22117 0,24571 0,27469 0,29463 0,31322
30 0,19029 0,21756 0,2417 0,27021 0,28984 0,30813
31 0,18728 0,21412 0,23788 0,26595 0,28527 0,30328
32 0,18442 0,21084 0,23424 0,26188 0,28091 0,29865
33 0,18168 0,20771 0,23076 0,25799 0,27675 0,29423
34 0,17906 0,20471 0,22743 0,25428 0,27276 0,29
35 0,17655 0,20184 0,22424 0,25072 0,26895 0,28595


Für   kann näherungsweise die Formel   verwendet werden.

Werte berechnet nach George Marsaglia et al. “Evaluating Kolmogorov’s Distribution”. Journal of Statistical Software, 8(18):1-4, Nov 2003.

F-Verteilung (rechtsseitige Quantile)

n1
p
n2=
1
n2=
2
...
3

4

5

6

7

8

9
1

0,950
0,975
0,990
0,995

161,45
647,79
4052,2
16211
18,513
38,506
98,503
198,5
10,128
17,443
34,116
55,552
7,709
12,218
21,198
31,333
6,608
10,007
16,258
22,785
5,987
8,813
13,745
18,635
5,591
8,073
12,246
16,236
5,318
7,571
11,259
14,688
5,117
7,209
10,561
13,614
2

0,950
0,975
0,990
0,995

199,5
799,5
4999,5
20000
19
39
99
199
9,552
16,044
30,817
49,8
6,944
10,649
18
26,284
5,786
8,434
13,274
18,314
5,143
7,26
10,925
14,544
4,737
6,542
9,547
12,404
4,459
6,059
8,649
11,042
4,256
5,715
8,022
10,107
3

0,950
0,975
0,990
0,995

215,71
864,16
5403,4
21615
19,164
39,165
99,166
199,17
9,277
15,439
29,457
47,467
6,591
9,979
16,694
24,259
5,409
7,764
12,06
16,53
4,757
6,599
9,78
12,917
4,347
5,89
8,451
10,882
4,066
5,416
7,591
9,596
3,863
5,078
6,992
8,717
4

0,950
0,975
0,990
0,995

224,58
899,58
5624,6
22500
19,296
39,298
99,299
199,3
8,941
14,735
27,911
44,838
6,094
9,074
14,976
21,622
4,818
6,757
10,289
13,961
4,099
5,523
7,976
10,391
3,637
4,761
6,62
8,38
3,313
4,243
5,734
7,104
3,073
3,868
5,111
6,227
5

0,950
0,975
0,990
0,995

230,16
921,85
5763,6
23056
19,296
39,298
99,299
199,3
9,013
14,885
28,237
45,392
6,256
9,364
15,522
22,456
5,05
7,146
10,967
14,94
4,387
5,988
8,746
11,464
3,972
5,285
7,46
9,522
3,687
4,817
6,632
8,302
3,482
4,484
6,057
7,471
6

0,950
0,975
0,990
0,995

233,99
937,11
5859
23437
19,33
39,331
99,333
199,33
8,941
14,735
27,911
44,838
6,163
9,197
15,207
21,975
4,95
6,978
10,672
14,513
4,284
5,82
8,466
11,073
3,866
5,119
7,191
9,155
3,581
4,652
6,371
7,952
3,374
4,32
5,802
7,134
7

0,950
0,975
0,990
0,995

236,77
948,22
5928,4
23715
19,353
39,355
99,356
199,36
8,887
14,624
27,672
44,434
6,094
9,074
14,976
21,622
4,876
6,853
10,456
14,2
4,207
5,695
8,26
10,786
3,787
4,995
6,993
8,885
3,5
4,529
6,178
7,694
3,293
4,197
5,613
6,885
8

0,950
0,975
0,990
0,995

238,88
956,66
5981,1
23925
19,371
39,373
99,374
199,37
8,845
14,54
27,489
44,126
6,041
8,98
14,799
21,352
4,818
6,757
10,289
13,961
4,147
5,6
8,102
10,566
3,726
4,899
6,84
8,678
3,438
4,433
6,029
7,496
3,23
4,102
5,467
6,693
9

0,950
0,975
0,990
0,995

240,54
963,28
6022,5
24091
19,385
39,387
99,388
199,39
8,812
14,473
27,345
43,882
5,999
8,905
14,659
21,139
4,772
6,681
10,158
13,772
4,099
5,523
7,976
10,391
3,677
4,823
6,719
8,514
3,388
4,357
5,911
7,339
3,179
4,026
5,351
6,541
10

0,950
0,975
0,990
0,995

241,88
968,63
6055,8
24224
19,396
39,398
99,399
199,4
8,786
14,419
27,229
43,686
5,964
8,844
14,546
20,967
4,735
6,619
10,051
13,618
4,06
5,461
7,874
10,25
3,637
4,761
6,62
8,38
3,347
4,295
5,814
7,211
3,137
3,964
5,257
6,417
11

0,950
0,975
0,990
0,995

242,98
973,03
6083,3
24334
19,405
39,407
99,408
199,41
8,763
14,374
27,133
43,524
5,936
8,794
14,452
20,824
4,704
6,568
9,963
13,491
4,027
5,41
7,79
10,133
3,603
4,709
6,538
8,27
3,313
4,243
5,734
7,104
3,102
3,912
5,178
6,314


F-Verteilung (rechtsseitige Quantile)

n1
p
n2=
1
n2=
2
...
3

4

5

6

7

8

9
12

0,950
0,975
0,990
0,995

243,91
976,71
6106,3
24426
19,413
39,415
99,416
199,42
8,745
14,337
27,052
43,387
5,912
8,751
14,374
20,705
4,678
6,525
9,888
13,384
4
5,366
7,718
10,034
3,575
4,666
6,469
8,176
3,284
4,2
5,667
7,015
3,073
3,868
5,111
6,227
13

0,950
0,975
0,990
0,995

244,69
979,84
6125,9
24505
19,419
39,421
99,422
199,42
8,729
14,304
26,983
43,271
5,891
8,715
14,307
20,603
4,655
6,488
9,825
13,293
3,976
5,329
7,657
9,95
3,55
4,628
6,41
8,097
3,259
4,162
5,609
6,938
3,048
3,831
5,055
6,153
14

0,950
0,975
0,990
0,995

245,36
982,53
6142,7
24572
19,424
39,427
99,428
199,43
8,715
14,277
26,924
43,172
5,873
8,684
14,249
20,515
4,636
6,456
9,77
13,215
3,956
5,297
7,605
9,877
3,529
4,596
6,359
8,028
3,237
4,13
5,559
6,872
3,025
3,798
5,005
6,089
15

0,950
0,975
0,990
0,995

245,95
984,87
6157,3
24630
19,429
39,431
99,433
199,43
8,703
14,253
26,872
43,085
5,858
8,657
14,198
20,438
4,619
6,428
9,722
13,146
3,938
5,269
7,559
9,814
3,511
4,568
6,314
7,968
3,218
4,101
5,515
6,814
3,006
3,769
4,962
6,032
20

0,950
0,975
0,990
0,995

248,01
993,1
6208,7
24836
19,446
39,448
99,449
199,45
8,66
14,167
26,69
42,778
5,803
8,56
14,02
20,167
4,558
6,329
9,553
12,903
3,874
5,168
7,396
9,589
3,445
4,467
6,155
7,754
3,15
3,999
5,359
6,608
2,936
3,667
4,808
5,832
40

0,950
0,975
0,990
0,995

251,14
1005,6
6286,8
25148
19,471
39,473
99,474
199,47
8,594
14,037
26,411
42,308
5,717
8,411
13,745
19,752
4,464
6,175
9,291
12,53
3,774
5,012
7,143
9,241
3,34
4,309
5,908
7,422
3,043
3,84
5,116
6,288
2,826
3,505
4,567
5,519
50

0,950
0,975
0,990
0,995

251,77
1008,1
6302,5
25211
19,476
39,478
99,479
199,48
8,581
14,01
26,354
42,213
5,699
8,381
13,69
19,667
4,444
6,144
9,238
12,454
3,754
4,98
7,091
9,17
3,319
4,276
5,858
7,354
3,02
3,807
5,065
6,222
2,803
3,472
4,517
5,454
75

0,950
0,975
0,990
0,995

252,62
1011,5
6323,6
25295
19,482
39,485
99,486
199,49
8,563
13,974
26,278
42,086
5,676
8,34
13,615
19,554
4,418
6,101
9,166
12,351
3,726
4,937
7,022
9,074
3,29
4,232
5,789
7,263
2,99
3,762
4,998
6,133
2,771
3,426
4,449
5,367
100

0,950
0,975
0,990
0,995

253,04
1013,2
6334,1
25337
19,486
39,488
99,489
199,49
8,554
13,956
26,24
42,022
5,664
8,319
13,577
19,497
4,405
6,08
9,13
12,3
3,712
4,915
6,987
9,026
3,275
4,21
5,755
7,217
2,975
3,739
4,963
6,088
2,756
3,403
4,415
5,322
150

0,950
0,975
0,990
0,995

253,46
1014,9
6344,7
25380
19,489
39,491
99,492
199,49
8,545
13,938
26,202
41,957
5,652
8,299
13,539
19,44
4,392
6,059
9,094
12,248
3,698
4,893
6,951
8,977
3,26
4,188
5,72
7,17
2,959
3,716
4,929
6,042
2,739
3,38
4,38
5,278


p = 1−α

weitere Werte: =F.INV(p;n1;n2) bzw. (R-Aufruf): qf(p,n1,n2)

t-(Student-)Verteilung (Quantile)

n
p=
0,75
...
0,90

0,95

0,975

0,99

0,995

0,999

0,9995

0,9999
1 1,00 3,078 6,314 12,706 31,821 63,657 318,31 636,62 3183,1
2 0,816 1,886 2,92 4,303 6,965 9,925 22,327 31,599 70,700
3 0,765 1,638 2,353 3,182 4,541 5,841 10,215 12,924 22,204
4 0,741 1,533 2,132 2,776 3,747 4,604 7,173 8,61 13,034
5 0,727 1,476 2,015 2,571 3,365 4,032 5,893 6,869 9,678
6 0,718 1,44 1,943 2,447 3,143 3,707 5,208 5,959 8,025
7 0,711 1,415 1,895 2,365 2,998 3,499 4,785 5,408 7,063
8 0,706 1,397 1,86 2,306 2,896 3,355 4,501 5,041 6,442
9 0,703 1,383 1,833 2,262 2,821 3,25 4,297 4,781 6,01
10 0,7 1,372 1,812 2,228 2,764 3,169 4,144 4,587 5,694
11 0,697 1,363 1,796 2,201 2,718 3,106 4,025 4,437 5,453
12 0,695 1,356 1,782 2,179 2,681 3,055 3,93 4,318 5,263
13 0,694 1,35 1,771 2,16 2,65 3,012 3,852 4,221 5,111
14 0,692 1,345 1,761 2,145 2,624 2,977 3,787 4,14 4,985
15 0,691 1,341 1,753 2,131 2,602 2,947 3,733 4,073 4,88
16 0,69 1,337 1,746 2,12 2,583 2,921 3,686 4,015 4,791
17 0,689 1,333 1,74 2,11 2,567 2,898 3,646 3,965 4,714
18 0,688 1,33 1,734 2,101 2,552 2,878 3,61 3,922 4,648
19 0,688 1,328 1,729 2,093 2,539 2,861 3,579 3,883 4,59
20 0,687 1,325 1,725 2,086 2,528 2,845 3,552 3,85 4,539
21 0,686 1,323 1,721 2,08 2,518 2,831 3,527 3,819 4,493
22 0,686 1,321 1,717 2,074 2,508 2,819 3,505 3,792 4,452
23 0,685 1,319 1,714 2,069 2,5 2,807 3,485 3,768 4,415
24 0,685 1,318 1,711 2,064 2,492 2,797 3,467 3,745 4,382
25 0,684 1,316 1,708 2,06 2,485 2,787 3,45 3,725 4,352
26 0,684 1,315 1,706 2,056 2,479 2,779 3,435 3,707 4,324
27 0,684 1,314 1,703 2,052 2,473 2,771 3,421 3,69 4,299
28 0,683 1,313 1,701 2,048 2,467 2,763 3,408 3,674 4,275
29 0,683 1,311 1,699 2,045 2,462 2,756 3,396 3,659 4,254
30 0,683 1,31 1,697 2,042 2,457 2,75 3,385 3,646 4,234
31 0,682 1,309 1,696 2,04 2,453 2,744 3,375 3,633 4,216
32 0,682 1,309 1,694 2,037 2,449 2,738 3,365 3,622 4,198
33 0,682 1,308 1,692 2,035 2,445 2,733 3,356 3,611 4,182
34 0,682 1,307 1,691 2,032 2,441 2,728 3,348 3,601 4,167
35 0,682 1,306 1,69 2,03 2,438 2,724 3,34 3,591 4,153
37 0,681 1,305 1,687 2,026 2,431 2,715 3,326 3,574 4,127
38 0,681 1,304 1,686 2,024 2,429 2,712 3,319 3,566 4,116
39 0,681 1,304 1,685 2,023 2,426 2,708 3,313 3,558 4,105
40 0,681 1,303 1,684 2,021 2,423 2,704 3,307 3,551 4,094


p = 1−α

weitere Werte: =T.INV(p ;n) bzw. (R-Aufruf): qt(p ,n)