Ein Merkmal X, das aufgrund zufälliger Ereignisse eine (endliche) Menge
von Ausprägungen x1, x2 ... annehmen kann, nennt man diskrete
Zufallsvariable X.
Eindimensionale Zufallsvariablen
Bearbeiten
Wahrscheinlichkeitsfunktion:
-
Verteilungsfunktion:
-
Normiertheit:
-
Erwartungswert
-
Varianz
-
bzw. mit dem Verschiebungssatz
-
Standardabweichung
-
Varianz der Summe unabhängiger Zufallsvariablen
-
Mehrdimensionale Zufallsvariablen
Bearbeiten
Einzelwahrscheinlichkeit
-
Kovarianz
-
bzw. mit dem Verschiebungssatz
-
Korrelationskoeffizient rxy nach Bravais-Pearson
Bearbeiten
für metrisch skalierte Merkmale zweier statistischer Variablen x und y
-
mit
als dem arithmetischen Mittel des Merkmals x.
Mit Hilfe des Verschiebungssatzes:
-
Rangkorrelationskoeffizient nach Spearman
Bearbeiten
- für Variablen, die stark von der Normalverteilung abweichen
- sowie ordinalskalierte Variablen
Nach Ordnung der einzelnen Beobachtungen von x bzw. y der Größe nach wird
jedem Wert wird seine Rangzahl rg(xi) und rg(yi) zugewiesen. Damit:
- .
Für eine binomialverteilte Zufallsvariable X mit den Parametern n und θ (0 ≤ θ ≤ 1) lautet die Wahrscheinlichkeitsfunktion
-
Erwartungswert
-
Varianz
-
Hypergeometrische Verteilung
Bearbeiten
Eine Zufallsvariable X ist hypergeometrisch verteilt mit den Parametern
N (Grundgesamtheit), M ("Kugeln der ersten Sorte") und n (Stichprobenumfang),
wenn ihre Wahrscheinlichkeitsfunktion lautet
-
Erwartungswert
-
Varianz
Der Bruch wird Korrekturfaktor genannt.
Wahrscheinlichkeitsfunktion ( )
-
Erwartungswert und Varianz
Stetige Gleichverteilung (Rechteckverteilung)
Bearbeiten
Dichtefunktion der Gleichverteilung im Intervall [a,b]
-
Erwartungswert
-
Varianz
-
Exponentialverteilung
Bearbeiten
Dichtefunktion der Exponentialverteilung
-
Verteilungsfunktion
-
Erwartungswert
-
Varianz
- .
Für eine Zufallsvariable lautet die Dichtefunktion der NV
- für
Normierung mit ergibt die Standardnormalverteilung mit der Dichtefunktion :
-
Anm.:Es wird auch die Schreibweise anstelle verwendet
Erwartungswert
-
Varianz
-
p-Quantil
Der zu einer gegebenen Wahrscheinlichkeit p zugehörige z-Wert z(p)
- .
Beispielsweise ist z(0,975) = 1,96.
Linearkombinationen normalverteilter Zufallsvariablen
Bearbeiten
Für n normalverteilte Zufallsvariablen
ist die Linearkombination
-
ebenfalls normalverteilt mit dem Erwartungswert
- .
Falls die stochastisch unabhängig sind, gilt für die Varianz
- .
Die Varianz muss größer Null sein, deshalb muss zudem für mindestens ein gelten.
Verteilung des Stichprobendurchschnitts
Bearbeiten
Sind die n Zufallsvariablen (i = 1, ... , n) sämtlich normalverteilt
mit gleichem μ und gleichem σ2, ist die Linearkombination
X mit a0 = 0, a1 = a2 = ... = an = 1/n, also :
normalverteilt dem Erwartungswert
-
und, falls die Xi (i = 1, ... , n) stochastisch unabhängig sind, mit der Varianz
- .
CHI-Quadrat-verteilung
Bearbeiten
Die seien unabhängige standardnormalverteilte Zufallsvariablen.
Dann ist die Verteilung der Zufalllsvariablen
chi-quadrat verteilt mit n Freiheitsgraden
Erwartungswert:
-
Varianz
- .
Anm.: Die Gruppe der Hypothesentests mit -Verteilung bezeichnet man als -Test.
Hierunter sind mehrere Tests zu verstehen:
Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.
Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.
Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.
t- (Student-) Verteilung
Bearbeiten
Für die unabhängigen Variablen (standardnormalverteilt) und ist die Variable
-
t-verteilt mit n Freiheitsgraden.
Erwartungswert
- für
Varianz
- für
Für die unabhängigen Variablen und ist die Verteilung der Variablen
-
Fisher- oder F-verteilt mit den Freiheitsgraden m und n.
Erwartungswert
- für
Varianz
- für
Gesetz der großen Zahlen
Bearbeiten
Für ein beliebig kleines c > 0 gilt
- für
Theorem von Bernoulli
Bearbeiten
Die relative Häufigkeit, mit der ein Ereignis A bei n unabhängigen Wiederholungen
eines Zufallsereignisses eintritt, konvergiert nach Wahrscheinlichkeit gegen P(A)
Hauptsatz der Statistik
Bearbeiten
Für eine Zufallsvariable X mit der Verteilungsfunktion F(x) gilt für die Verteilungsfunktion Fn(x)
für die unabhängigen wie identisch wie X verteilten X1…Xn (x∈ R)
-
(sup: Maximale Abweichung zwischen und ).
Zentraler Grenzwertsatz
Bearbeiten
Für unabhängig identisch verteilte Zufallsvariablen X1…Xn mit E(Xi ) = μ
und Var(Xi ) =σ2 > 0 konvergiert die Verteilungsfunktion Fn(z) = P(Zn≤z)
der standardisierten Summe
für n → ∞ an jeder Stelle gegen die Verteilungsfunktion der Standardnormalverteilung
Grenzwertsatz von De Moivre
Bearbeiten
Die Verteilung der standardisierten absoluten Häufigkeit
der Standardnormalverteilung
konvergiert für n → ∞ gegen eine Standardnormalverteilung.