← zurück - zum Inhaltsverzeichnis - weiter →

K5: Einführung

Diskrete Wahrscheinlichkeitsrechnung

5. Simultane Wahrscheinlichkeitsverteilungen

5.1 Einführung

Oft werden bei einem Experiment an einem Objekt mehrere Daten gemessen, z.B. messen wir Alter, Länge und Gewicht einer beliebig gewählten Person. Auf dem Wahrscheinlichkeitsraum gibt es dann (gleichzeitig) verschiedene Zufallsvariablen X₁,X₂,...,X_n. Interessant sind dann die Beziehungen zwischen den Variablen. Wenn wir die Verteilungen der Zufallsvariablen einzeln kennen, ist es im Allgemeinen nicht möglich eine Aussage zu machen über die Wahrscheinlichkeit eines Ereignisses das sich auf zwei oder mehr der Zufallsvariablen bezieht. Aber gerade solche gemeinsame Wahrscheinlichkeiten interessieren uns, denn solche Wahrscheinlichkeiten erzählen uns über den Zusammenhang der Variablen.

Beispiel 1 (zweimal Würfeln (Fortsetzung))

Mit Z bezeichnen wir die Gesamtaugenzahl und mit M das Maximum der beiden Augenzahlen. Es ist klar dass es ein Zusammenhang gibt zwischen Z und M. Wenn z.B. M = 2, kann Z höchstens den Wert 4 haben. Die simultane Wahrscheinlichkeit P(Z=3 und M=2) können wir nicht herleiten aus der Wahrscheinlichkeiten P(Z=3) und P(M=2).

Definition 5.1.1

Wenn auf dem Wahrscheinlichkeitsraum (S,P) die Zufallsvariablen X₁,X₂,...,X_n gegeben sind, nennen wir die Folge X = (X₁,X₂,...,X_n) einen stochastischen Vektor mit Dimension n. Die Zufallsvariablen X₁,X₂,...,X_n selbst nennen wir die Komponente von X.

Die Begriffe Wertebereich, Wahrscheinlichkeitsfunktion und Wahrscheinlichkeitsverteilung werden analog definiert wie in einer Dimension.

Definition 5.1.2

Unter dem Wertebereich S_X eines stochastischen Vektors X verstehen wir die Menge aller möglichen Werte die X annehmen kann, also S_X = {X(s)|s∈S}.

Im nächsten werden wir, damit wir nicht immer wieder viele Indizes notieren müssen, nur den Fall von drei Zufallsvariablen X, Y und Z besprechen. Die Verallgemeinerung für beliebig viele Zufallsvariablen X₁,X₂,...,X_n ist meistens selbstverständlich.

Definition 5.1.3

Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Unter die simultane Wahrscheinlichkeitsfunktion von X, Y und Z verstehen wir die Funktion $p_{X,Y,Z}:S_{V}\to \mathbb {R}$ , definiert durch:

p_{_X,Y,Z}(x,y,z) = P(X=x und Y=y und Z=z).

Die simultane Wahrscheinlichkeitsfunktion induziert wieder eine Wahrscheinlichkeit (Maß) P_V auf dem Wertebereich S_V von V = (X,Y,Z). Dieser Wahrscheinlichkeitsmaß nennen wir die simultane (Wahrscheinlichkeits)Verteilung von X, Y und Z. Wenn aber keinen Grund zur Verwirrung besteht, werden wir auch die simultane Wahrscheinlichkeitsfunktion gelegentlich mit Wahrscheinlichkeitsverteilung bezeichnen.

Definition 5.1.4

Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Unter der simultane (Wahrscheinlichkeits)Verteilung von X, Y und Z verstehen wir die Funktion P_X,Y,Z, definiert für B ⊂ S_V durch:

P_{V}(B)=P_{X,Y,Z}(B)=\sum _{v\in B}p_{X,Y,Z}(x,y,z)

,

worin x, y und z die Komponente von V sind.

Satz 5.1.2

Die simultane Wahrscheinlichkeitsverteilung P_V des stochastischen Vektors V ist eine Wahrscheinlichkeit auf dem Wertebereich S_V von V.

Beispiel 2 (zweimal Würfeln (Fortsetzung))

Die simultane Wahrscheinlichkeitsfunktion p_Z,M von Z und M wird gegeben durch:

p_{Z,M}(z,m)=P(Z=z,M=m)={\begin{cases}{\tfrac {1}{36}}&{\mbox{für }}z=2m,\ m=1,...,6\\\,\\{\tfrac {2}{36}}&{\mbox{für }}m<z<2m,\ m=1,...,6\end{cases}}

Die nächste Tabelle zeigt diese simultane Wahrscheinlichkeitsfunktion .

z

2

3

4

5

6

7

8

9

10

11

12

m

P(M=m)

1

1/36

2

2/36

1/36

3/36

3

2/36

1/36

5/36

4

2/36

1/36

7/36

5

2/36

1/36

9/36

6

2/36

1/36

11/36

P(Z=z)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

36/36

Im rechten und unteren Rand der Tabelle sind die Zeilen- bzw. Spaltentotale angegeben. Diese Totale stellen gerade die Verteilungen (Wahrscheinlichkeitsfunktionen) p_M von M und p_Z von Z vor. Um ja z.B p_M(3) zu bestimmen, bedenken wir dass:

p_M(3) = P(M=3) = P(Z=4 und M=3 oder Z=5 und M=3 oder Z=6 und M=3) =

= P(Z=4 und M=3) + P(Z=5 und M=3) + P(Z=6 und M=3) = p_Z,M(4,3) + p_Z,M(5,3) + p_Z,M(6,3).

Deshalb nennen wir in diesem Zusammenhang die Verteilungen von M und von Z auch Randverteilungen oder marginale Verteilungen.

Wenn die simultane Verteilung (Wahrscheinlichkeitsfunktion) einiger Zufallsvariablen bekannt ist, können wir, wie sich oben heraus stellt, von jedem auf diese Zufallsvariablen bezogen Ereignis die Wahrscheinlichkeit berechnen. Insbesondere können wir auch die Wahrscheinlichkeiten von Ereignissen bestimmen, die sich nur auf einen Teil der Zufallsvariablen beziehen. Die dazu gehörende Wahrscheinlichkeitsverteilung nennen wir die marginale Verteilung oder Randverteilung.

Definition 5.1.5a

Es seien X, Y und Z die Komponente eines stochastischen Vektors V. Die Wahrscheinlichkeitsfunktionen p_X, p_Y und p_Z der Komponente von V nennen wir in diesem Zusammenhang auch marginale Wahrscheinlichkeitsfunktionen oder Randwahrscheinlichkeitsfunktionen.

Auch wenn es ein Teil der Komponente eines stochastischen Vektors V betrifft, sprechen wir von marginaler Verteilung. Wir formulieren die Definition nur für die zwei Komponente X und Z.

Definition 5.1.5b

Es seien X, Y und Z die Komponente des stochastischen Vektors V. Die simultane Wahrscheinlichkeitsfunktion der Komponente X und Z nennen wir in dieser Zusammenhang die marginale Wahrscheinlichkeitsfunktion oder Randwahrscheinlichkeitsfunktion von X und Z.

Im Beispiel 2 haben wir bereits gesehen, wie die marginale Wahrscheinlichkeitsfunktion einer Zufallsvariable berechnet werden kann aus der simultane Verteilung dieser Zufallsvariable und eine Andere. Der nächste Satz beschreibt dies.

Satz 5.1.1

Die marginale Wahrscheinlichkeitsfunktion der Zufallsvariable X bezieht sich zu der simultane Wahrscheinlichkeitsfunktion von X, Y und Z, laut:

p_{X}(x)=\sum _{y\in S_{Y},z\in S_{Z}}p_{X,Y,Z}(x,y,z)

.

D.h. man bekommt die Wahrscheinlichkeit auf einen Wert x van X damit man die zu x gehörende simultane Wahrscheinlichkeiten aggregiert über alle mögliche Werte y von Y und z von Z.

Wir können diesen Satz verallgemeinern für das Berechnen der marginale Verteilung der m Komponente einer Zufallsvariable. aus die simultane Verteilung aller n (n>m) Komponente. Wir schreiben diese selbstverständliche Verallgemeinerung aber nicht auf, sondern überlassen dies dem Leser.

Bevor wir ein Beispiel besprechen, introduzieren wir zuerst eine Verallgemeinerung der Binomialverteilung, und zwar die Multinomialverteilung. Die Binomialverteilung entsteht unter anderem wenn wir einer Urne mit zwei Sorten Kugeln, z.B. weiße und schwarze, beliebig und mit Zurücklegen, n mal eine Kugel entnehmen. Die Anzahl der gezogenen, weißen Kugeln ist dann binomialverteilt. Mit der Anzahl Weiße ist auch die Anzahl der Schwarzen festgelegt. Als Verallgemeinerung betrachten wir eine Urne mit fünf Sorten Kugeln: weiße, rote, gelbe, grüne und blaue. Wir entnehmen der Urne wieder beliebig und mit Zurücklegen, n Kugeln. Die Stichprobe kann nun von jeder Farbe einige Kugeln enthalten. Die Anzahlen der Kugeln, X₁,...,X₅, für die unterschiedene Farben, haben simultan eine Multinomialverteilung. Die Parameter dieser Verteilung sind: die Anzahl n der entnommene Kugeln, die Anzahl der mögliche Farben, hier 5, und die relative Anteile p₁,...,p₅ der Farben in der Urne.

Definition 5.1.6 (Multinomialverteilung)

Die Zufallsvariablen X₁,X₂,...,X_m haben eine Multinomialverteilung mit den Parametern n, m und p₁,p₂,...,p_m, wenn der Wertebereich des stochastischen Vektors X = (X₁,X₂,...,X_m) gegeben wird durch: S_X = {(n₁,n₂,...,n_m)|n_i ganzzählig, n_i ≥ 0 und n₁+ n₂+...+ n_m= n} und die simultane Wahrscheinlichkeitsverteilung von X₁,X₂,...,X_m bestimmt wird durch:

p_{X_{1},X_{2},...,X_{m}}(n_{1},n_{2},...,n_{m})={\tfrac {n!}{n_{1}!n_{2}!...n_{m}!}}\ p_{1}^{n_{1}}p_{2}^{n_{2}}...p_{m}^{n_{m}}

.

Darin sind n und m natürliche Zahlen und ist p_i ≥ 0 für jede i = 1,2,...,m, und es gilt: p₁+ p₂+...+ p_m= 1.

Beispiel 3 (Multinomialverteilung)

Als Verallgemeinerung eines Bernoulli-Versuches betrachten wir ein Experiment mit m unterschiedlichen Ergebnissen. Als Urnenmodell kann man an einer Urne mit Kugeln in m unterschiedlichen Farben denken. Die Wahrscheinlichkeiten der unterschiedlichen Ergebnisse nennen wir p₁,p₂,...,p_m, wofür gilt: p₁+ p₂+...+ p_m = 1. Wir entnehmen der Urne beliebig eine Kugel und legen sie zurück, nachdem wir die Farbe festgestellt haben. Mit X_i bezeichnen wir die Anzahl Malen dass die gezogene Kugel die Farbe i in n Wiederholungen des Versuchs hat. Die Zufallsvariablen X₁,X₂,...,X_m haben dann eine Multinomialverteilung mit Parametern n, m und p₁,p₂,...,p_m.

Wir bestimmen für den Fall m=3 (Trinomialverteilung) die marginale Verteilung von X₁. Für n₁= 0,1,...,n berechnen wir:

p_{X_{1}}(n_{1})=\sum _{n_{2}}\sum _{n_{3}}{\tfrac {n!}{n_{1}!n_{2}!n_{3}!}}\,p_{1}^{n_{1}}p_{2}^{n_{2}}p_{3}^{n_{3}}=\sum _{n_{2}}{\tfrac {n!}{n_{1}!n_{2}!(n-n_{1}-n_{2})!}}\,p_{1}^{n_{1}}p_{2}^{n_{2}}(1-p_{1}-p_{2})^{n-n_{1}-n_{2}}=

={\tfrac {n!}{n_{1}!(n-n_{1})!}}\,p_{1}^{n_{1}}(1-p_{1})^{n-n_{1}}

.

Es stellt sich heraus dass X₁ eine Binomialverteilung hat mit Parametern n und p₁.

Mathematik: Wahrscheinlichkeitstheorie: DW: K5: Einführung

5. Simultane Wahrscheinlichkeitsverteilungen

5.1 Einführung

Beispiel 1 (zweimal Würfeln (Fortsetzung))

Definition 5.1.1

Definition 5.1.2

Definition 5.1.3

Definition 5.1.4

Satz 5.1.2

Beispiel 2 (zweimal Würfeln (Fortsetzung))

Definition 5.1.5a

Definition 5.1.5b

Satz 5.1.1

Definition 5.1.6 (Multinomialverteilung)

Beispiel 3 (Multinomialverteilung)