Formelsammlung Statistik/ Deskriptive Statistik

Skalenniveaus

Bearbeiten

Nominalskala

Bearbeiten

Die Ausprägungen des nominalskalierten Merkmals können nicht geordnet werden,

man kann sie nur vergleichen und abzählen.

Es handelt sich um qualitative Merkmale. Erhalten die Ausprägungen Ziffern zugeordnet,

handelt es sich nur um eine Verschlüsselung (Codierung): 1 = männlich, 2 = weiblich.

Ordinalskala

Bearbeiten

Zwischen den Ausprägungen des ordinalskalierten (rangskalierten) Merkmals existiert eine Beziehung

der Form mehr oder weniger, < oder >, besser oder schlechter.

Eine Quotientenbildung macht wenig Sinn (Beispiel Noten: 1, 2, 3, 4, 5).

Intervallskala

Bearbeiten

Die Abstände zwischen den Ausprägungen des (quantitativen) Merkmals der Intervallskala

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen.

Beispiel: Kinderzahl, Temperatur.

Verhältnissskala

Bearbeiten

Sowohl die Abstände als auch Verhältnisse zwischen den Ausprägungen des (quantitativen) Merkmals

können gemessen werden. Es handelt sich bei den Ausprägungen um (reelle) Zahlen. Beispiel: Einkommen.

Zweig-Blätter-(stem-leaf-) Diagramm

Bearbeiten

Die linke Spalte enthält als „Stämme“ die Äquivalenzklassen, in die die auf der rechten Seite als „Blätter“

dargestellten Merkmale eingeteilt werden. Beispiel: Gegeben sind die Werte 0,3 0,4 2,5 2,5 2,6 2,7 2,8 3,5 3,7.

Wählt man die natürlichen Zahlen als Klasseneinteilung, ergibt sich folgendes Stamm-Blatt-Diagramm:
3 5 7
2 5 5 6 7 8
1
0 3 4

Lageparameter

Bearbeiten

Arithmetisches Mittel

Bearbeiten
 

Median (Zentralwert)

Bearbeiten

Sind die Beobachtungswerte der Größe nach geordnet, ist der Median z die Stelle, die die Teilgesamtheit in zwei gleiche Hälften teilt.

 

geometrisches Mittel

Bearbeiten
 

harmonisches Mittel

Bearbeiten
 

Modalwert

Bearbeiten

Der am häufigsten auftretende Wert

Grundgesamtheit:

 

Stichprobe:

 

Verschiebungssatz

Bearbeiten

Für jedes   gilt

 

Damit erhält man als Varianz

 

Variationskoeffizient

Bearbeiten
 


Konzentrationsmasse

Bearbeiten

Konzentrationsrate

Bearbeiten

Die Konzentrationsrate CRn ist die Summe der Marktanteile der n größten Unternehmen eines relevanten Marktes. Im GWB werden die Raten CR1, CR3 und CR5 herangezogen.

Lorenzkurve

Bearbeiten

Für eine geordnete Urliste x1 ≤ x2… ≤xn trägt man die kumulierte relative Merkmalssumme

 

über den Anteil der Merkmalsträger   auf.

Liegen die Merkmale in gruppierter Form vor, trägt man die kumulierte relative Merkmalssumme

 

über der Häufigkeit   auf.

Zwischen (0;0) und (1;1) wird die Winkelhalbierende des Koordinatensystems eingetragen.

Gini-Koeffizient

Bearbeiten

Als Ginikoeffizient G bezeichnet man das Verhältnis der Fläche zwischen Winkelhalbierender und der Lorenzkurve

zur Gesamtfläche unter der Winkelhalbierenden (= 1/2).

Die Fläche unterhalb der Lorenzkurve kann man einfach aus Teil-Trapezflächen zusammensetzen:

 

(p0 = 0 ; q0 = 0):


Herfindahl-Index

Bearbeiten