Statistik: Gemeinsame Wahrscheinlichkeit mehrerer Ereignisse

Stochastische Unabhängigkeit

Ein häufiges Untersuchungsobjekt in der Statistik ist, ob verschiedene Ereignisse abhängig oder unabhängig voneinander sind, d.h. ob das Zustandekommen eines Ereignisses durch ein anderes begünstigt wird. So untersucht man beispielsweise in der Marktforschung, ob Status und Bildung eines Konsumenten die Ausgaben für eine bestimmte Zeitschrift beeinflussen.

Beispiel zum Begriff der stochastischen Unabhängigkeit

Grafik 1: Die Ereignisse: Studentin wohnt bei den Eltern - Die Studentin wohnt woanders

Eine umfangreiche Marketingstudie über Zahnputzgewohnheiten von Konsumenten hat ergeben, dass 50 % der Studierenden einer kleinen Hochschule bei ihren Eltern wohnen. Ebenso, dass 50 % der Studierenden Zahnpasta mit roten Streifen und 50 % andersfarbige Zahnpasta bevorzugen.

Betrachten wir den Zufallsvorgang: Eine Studentin kommt in einen Laden und kauft Zahnpasta. Es seien folgende Ereignisse definiert:

E: Die Studentin wohnt bei ihren Eltern.

R: Die Studentin kauft Zahnpasta mit roten Streifen.

Frage: Hat der Wohnort der Studentin einen Einfluss auf die Farbpräferenz?

Vermutlich nein, die Ereignisse E und R sind stochastisch unabhängig, d.h. in wahrscheinlichkeitstheoretischer Hinsicht unabhängig.

Wir interessieren uns zunächst für den Wohnort der Studierenden. In der Grafik 1 ist die Ergebnismenge nach dem Wohnort aufgeteilt.

Frage: Wieviel Prozent der Studierenden wohnen bei ihren Eltern und werden voraussichtlich Zahnpasta mit roten Streifen kaufen?

Da sich bei Unabhängigkeit der Ereignisse die Studierenden in Bezug auf ihre Farbpräferenz gleichmäßig auf die Wohnorte verteilen, werden wohl 50 % der Rotkäufer bei ihren Eltern wohnen und 50 % woanders. Das heißt 50 % von 50 % der Studierenden wohnen bei ihren Eltern und bevorzugen rote Zahnpasta. Es gilt also:

P(R\cap E)=0{,}5\cdot 0{,}5=0{,}25.

Die Grafik 2 zeigt, wie sich bei Unabhängigkeit der Variablen Wohnort und Farbpräferenz die Wahrscheinlichkeiten der Farbpräferenz auf die Wohnorte aufteilen.

Ist nun beispielsweise P(E) = 40 % und P(R) = 60 %, ergibt sich bei Unabhängigkeit die Aufteilung wie in der Grafik 3, denn auch hier müssten 60 % der „Nesthocker” und 60 % der „Nestflüchter” gleichermaßen Zahnpasta mit roten Streifen kaufen.

Grafik 2: Die Ereignisse Wohnort und Farbe der Zahnpasta durchmischen sich

Grafik 3: Die Ereignisse: Studentin wohnt bei den Eltern - Die Studentin wohnt woanders

Beispiel zum Begriff der stochastischen Abhängigkeit

Oben haben wir den Fall betrachtet, dass zwei Ereignisse unabhängig sind. Im Allgemeinen muss man aber davon ausgehen, dass Ereignisse, die man gemeinsam analysiert, abhängig sind.

Im Rahmen der Marketingstudie wurden Daten eines Gesundheitsamtes in Musterstadt verwendet, die die Zahngesundheit von Schulkindern betraf. Man weiß aus dieser Studie, dass 50 % der Schulkinder Karies haben und 50 % der Schulkinder sich regelmäßig die Zähne putzen.

Wir betrachten den Zufallsvorgang: Es wird ein Schulkind zufällig ausgewählt.

Wir definieren als Ereignisse

Z: Das Schulkind putzt sich regelmäßig die Zähne.

K: Das Schulkind hat Karies.

Grafik 4: Aufteilung von Zähneputzern und Kariesfällen

Ist nun

P(Z\cap K)>P(Z\cap {\bar {K}})

$oder\quad P(Z\cap K)<P(Z\cap {\bar {K}})?$

Ist also die Wahrscheinlichkeit, ein Kind zu erhalten, das sich regelmäßig die Zähne putzt und Karies hat, größer als die Wahrscheinlichkeit, ein Kind zu erhalten, das sich regelmäßig die Zähne putzt und keine Karies hat, oder ist es umgekehrt, oder sind vielleicht die Wahrscheinlichkeiten gleich?

Es ist vermutlich

P(Z\cap K)<P(Z\cap {\bar {K}}),

denn Zähneputzen und Karies sind bekanntlich nicht unabhängig voneinander zu betrachten. Also sind Z und K stochastisch abhängige Ereignisse. Wir werden vermutlich eine Aufteilung der gemeinsamen Wahrscheinlichkeiten erhalten, die ähnlich der Grafik 4 ist. Besonders groß sind P(Z ∩ K) und P(Z ∩ K).

Die gemeinsamen Wahrscheinlichkeiten können allerdings nicht mit unseren Informationen bestimmt werden, sie hängen von der Stärke der Abhängigkeit ab.

Bei stochastisch abhängigen Ereignissen interessiert man sich häufig für das bedingte Auftreten eines Ereignisses, z.B. für die bedingte Wahrscheinlichkeit

P(K|{\bar {Z}}),

dass ein zufällig ausgewähltes Schulkind Karies hat, wenn man weiß, dass es sich nicht regelmäßig die Zähne putzt.

Bedingte Wahrscheinlichkeiten

Beispiel

Wie hängen Kariesfälle und Zahnputzgewohnheit zusammen?

Einige Jahre später wurde in der Grundschule von Musterdorf zu Forschungszwecken wieder an 200 Kindern eine Reihenuntersuchung zur Zahngesundheit durchgeführt. Jetzt putzten sich 60 % der Kinder regelmäßig die Zähne. Von diesen Kindern hatten 40 Karies. Bei den Zahnputzmuffeln hatten 60 Kinder Karies.

Wir wollen ein maßstabsgetreues Venndiagramm konstruieren. Jedes Kästchen steht für 5 Kinder. Es sind

P(Z)=0{,}6;\qquad P({\bar {Z}})=0{,}4;

P(Z\cap K)=0{,}2;\qquad P(Z\cap {\bar {K}})=0{,}4;

P({\bar {Z}}\cap K)=0{,}3;\qquad P({\bar {Z}}\cap {\bar {K}})=0{,}1.

Wir interessieren uns nun für die bedingte Wahrscheinlichkeit, dass ein Kind Karies hat, wenn bekannt ist, dass es sich die Zähne putzt:

P(K|Z).

In andere Worte gekleidet: Der Anteil der Kinder mit Karies an den Kindern, die sich regelmäßig die Zähne putzen.

Es gilt für die bedingte Wahrscheinlichkeit

P(K|Z)={\frac {P(K\cap Z)}{P(Z)}}.

Wie ist diese Wahrscheinlichkeit zu verstehen?

Es werden zunächst alle Kinder, die sich regelmäßig die Zähne putzen, in die Aula geschickt. Aus diesen 120 Kindern wird nun zufällig eins ausgewählt. Mit welcher Wahrscheinlichkeit hat dieses Kind Karies? Wir betrachten also 120 zahnputzende Kinder, davon haben 40 Kinder Karies.

Genau diese Vorgehensweise ist das Prinzip der bedingten Wahrscheinlichkeiten!

Es ergibt sich: $P(K|Z)={\frac {40}{120}}={\frac {1}{3}}.$

Ein Drittel der zähneputzenden Kinder hat Karies: Dann haben natürlich zwei Drittel der zähneputzenden Kinder keine Karies. Wir sehen sogleich, dass die obige Rechnung die schon bekannte Formel

Wie teilen sich die Kariesfälle bezüglich der Zahnputzgewohnheiten auf?

P(K|Z)={\frac {P(K\cap Z)}{P(Z)}}={\frac {\frac {40}{200}}{\frac {120}{200}}}={\frac {40}{120}}={\frac {1}{3}},

darstellt. Entsprechend erhalten wir

P({\bar {K}}|Z)={\frac {P({\bar {K}}\cap Z)}{P(Z)}}={\frac {\frac {80}{200}}{\frac {120}{200}}}={\frac {2}{3}},

P(K|{\bar {Z}})={\frac {P(K\cap {\bar {Z}})}{P({\bar {Z}})}}={\frac {\frac {60}{200}}{\frac {80}{200}}}={\frac {3}{4}},

P({\bar {K}}|{\bar {Z}})={\frac {P({\bar {K}}\cap {\bar {Z}})}{P({\bar {Z}})}}={\frac {\frac {20}{200}}{\frac {80}{200}}}={\frac {1}{4}}.

Vergleichen Sie das Venndiagramm mit dem vorhergehenden! Wieso unterscheiden sich beide Diagramme?

Übung

Es ist bekannt, dass die Aktienkurse des Unternehmens Dachs an 55% aller Börsentage gestiegen sind.

Ereignisse: K₁: Der Kurs steigt am ersten Tag K₂: Der Kurs steigt am zweiten Tag

Man hat folgende Gesetzmäßigkeit der Kursentwicklung festgestellt: In 40 % aller Beobachtungen stieg der Kurs am ersten Tag und am zweiten Tag, in 15 % der Beobachtungen stieg der Kurs am ersten Tag und fiel am zweiten Tag. Dagegen fiel in 15 % der Beobachtungen der Kurs am ersten Tag und stieg am zweiten Tag. An den restlichen Tagespaaren fiel der Kurs an beiden Tagen.

Stellen Sie die gemeinsamen Wahrscheinlichkeiten im Venndiagramm grafisch dar.
Sind die Ereignisse K₁ und K₂ stochastisch unabhängig? (Begründen Sie die Antwort formal mit Hilfe der Wahrscheinlichkeitstheorie.)
Am heutigen Tag ist der Kurs gestiegen.
- Mit welcher Wahrscheinlichkeit wird er morgen steigen (Gesucht: P(K₂|K₁))?
- Mit welcher Wahrscheinlichkeit wird er dagegen fallen?
Mit welcher Wahrscheinlichkeit wird der Kurs morgen steigen, wenn er heute gefallen ist?

Bayessches Theorem

Häufig liegen die Informationen über zwei Ereignisse nur als bedingte Wahrscheinlichkeiten vor. Wie kann man sie weiter verwenden?

Beispiel für zwei Ereignisse

Ein bekannter Vergnügungspark verbraucht täglich große Mengen an Glühbirnen für die Dekoration der Stände. Damit die Verbrauchskosten nicht so hoch werden, setzen sich die Glühbirnen nur zu 60% aus Markenware und zu 40 % aus markenfreier Ware zusammen. Aufgrund langjähriger Beobachtungen weiß man, dass von den Marken-Glühbirnen pro Monat 5% defekt werden. Jedoch werden von den markenfreien Glühbirnen monatlich 10% defekt.

Zunächst wollen wir das Gegebene grafisch (Grafik 5) darstellen: Wenn von den Markenglühbirnen 5 % defekt werden, bleiben 95% heil. 5% ist also Anteil der defekten Glühbirnen an den Markenglühbirnen, d.h. es handelt sich um die bedingte Wahrscheinlichkeit P(D|M) usw.

Grafik 5

Der Betreiber des Vergnügungsparks braucht für die Kostenplanung des nächsten Sommers die Information, wie groß der Anteil der Markenglühbirnen an den defekten Glühbirnen ist, d.h. er sucht P(M|D). Das bedeutet: Alle defekten Glühbirnen eines Tages werden in einem Korb gesammelt. Es wird eine Glühbirne zufällig entnommen. Mit welcher Wahrscheinlichkeit erhält man eine Markenbirne?

Wir wissen, dass gilt:

P(M|D)={\frac {P(M\cap D)}{P(D)}}

.

Leider sind aber die Komponenten des Bruchs unbekannt. Wir werden nun eine Methode finden, sie doch zu berechnen.

Zunächst suchen wir den Zähler P(M ∩ D): Wir kennen P(D|M). Bekanntlicherweise berechnet es sich als

P(D|M)={\frac {P(M\cap D)}{P(M)}}

.

Also ist der gesuchte Zähler auch in P(D|M) enthalten und kann ganz einfach durch Auflösung der Gleichung berechnet werden als

P(M\cap D)=P(D|M)P(M)

.

also

P(M\cap D)=0{,}05\cdot 0{,}6=0{,}03

.

Jetzt fehlt noch der Nenner P(D). Betrachten wir das Venndiagramm Grafik 6. D setzt sich aus den Schnittmengen $D\cap M$ und $D\cap {\overline {M}}$ zusammen.

Grafik 6

Die gesamte Wahrscheinlichkeit von D ist also die Summe

P(D)=P(M\cap D)+P({\bar {M}}\cap D)

.

eine Erkenntnis, die man auch als Satz der totalen Wahrscheinlichkeit bezeichnet, und das gibt, wie wir oben gesehen haben,

P(D)=P(D|M)P(M)+P(D|{\bar {M}})P({\bar {M}})

,

in unserem Beispiel

P(D)=0{,}05\cdot 0{,}6+0{,}1\cdot 0{,}4=0{,}07

.

Es sind also 7% aller Glühbirnen defekt.

Die gesuchte bedingte Wahrscheinlichkeit ist nun

P(M|D)={\frac {P(M\cap D)}{P(D)}}={\frac {P(D|M)P(M)}{P(D|M)P(M)+P(D|{\bar {M}})P({\bar {M}})}}

,

Diese Formel wird als Bayessches Theorem bezeichnet.

Die gesuchte Wahrscheinlichkeit beträgt

P(M|D)={\frac {0{,}03}{0{,}07}}=0{,}4286

.

Diese Wahrscheinlichkeit fällt deshalb so überraschend hoch aus, weil 50% mehr Markenbirnen als markenfreie verwendet werden. Entsprechend ist der Anteil der markenfreien Glühbirnen an den defekten 0,5714.

Wir wollen nun mehr als zwei Ereignisse analysieren.

Beispiel für mehr als zwei Ereignisse

Eine Spedition beschäftigt drei LKW-Fahrer, die Herren Ahorn, Behorn und Zehorn. Ahorn fährt 50% aller Fuhren, Behorn 20% und Zehorn 30%. Aus Erfahrung weiß man, dass Ahorn bei 10% aller Fahrten eine Beule verursacht, Behorn bei 15% aller Fahrten und Zehorn bei 20% aller Fahrten (Grafik 7).

Wir definieren die Ereignisse:

F₁: Ahorn ist gefahren, F₂: Behorn ..., F₃: Zehorn ...

B: Eine Beule wurde gefahren.

Wir wollen zuerst das Gegebene festhalten: Wenn Ahorn in 10 % aller Fahrten eine Beule fährt, wickelt er die restlichen 90 % ohne Schaden ab usw.

Grafik 7

Man interessiert sich für die Wahrscheinlichkeit, dass Ahorn gefahren ist, wenn wieder ein Mal eine Beule in einem LKW auftaucht, d.h. für P(F₁|B).

Es ist wieder

P(F_{1}|B)={\frac {P(F_{1}\cap B)}{P(B)}}

.

Nach dem Multiplikationssatz der Wahrscheinlichkeiten muss

P(F_{1}\cap B)=P(B|F_{1}){P(F_{1})}

sein, also

P(F_{1}\cap B)=0{,}1\cdot 0{,}5=0{,}05

.

Aber wie erhalten wir P(B)? Auch hier gilt wieder der Satz von der totalen Wahrscheinlichkeit, z.B.:

P(F_{1}\cap B)=P(B|F_{1})\cdot P(F_{1})

.

Wir erhalten dann für P(B)

P(B)=P(F_{1}\cap B)+P(F_{2}\cap B)+P(F_{3}\cap B)

=P(B|F_{1})P(F_{1})+P(B|F_{2})P(F_{2})+P(B|F_{3})P(F_{3})

,

also

P(B)=0{,}1\cdot 0{,}5+0{,}15\cdot 0{,}2+0{,}2\cdot 0{,}3=0{,}05+0{,}03+0{,}06=0{,}14

.

Unsere gesuchte Wahrscheinlichkeit beträgt

P(F_{1}|B)={\frac {P(F_{1}\cap B)}{P(B)}}={\frac {0{,}05}{0{,}14}}=0{,}3571

.

Entsprechend sind

P(F_{2}|B)={\frac {0{,}03}{0{,}14}}=0{,}2143

und

P(F_{3}|B)={\frac {0{,}06}{0{,}14}}=0{,}4286

.

Also hat Zehorn mit größter Wahrscheinlichkeit die Beule gefahren.

Wir fassen nun das Gelernte dieser Seite zusammen:

Theoretische Erkenntnisse

Zwei Ereignisse A und B aus Ω:

Sind zwei Ereignisse A und B stochastisch unabhängig, ist ihre gemeinsame Wahrscheinlichkeit gleich dem Produkt der Einzelwahrscheinlichkeiten:

P(A\cap B)=P(A)\cdot P(B).

Man beachte: Ereignisse sind grundsätzlich nicht als unabhängig zu betrachten!

Die bedingten Wahrscheinlichkeiten für A und B sind

P(A|B)={\frac {P(A\cap B)}{P(B)}}

und

P(B|A)={\frac {P(A\cap B)}{P(A)}}

.

Allgemeiner Multiplikationssatz der Wahrscheinlichkeiten:

P(A\cap B)=P(A|B)P(B)=P(B|A)P(A)

.

Theorem von BAYES:

P(B|A)={\frac {P(A\cap B)}{P(A)}}={\frac {P(A|B)P(B)}{P(A|B)P(B)+P(A|{\bar {B}})P({\bar {B}})}}

.

Verallgemeinerung für m Ereignisse A_i (i =1,...,m):

Diese m Ereignisse zerlegen die Ergebnismenge, d.h. sie sind disjunkt und füllen Ω aus. Enthält Ω noch ein Ereignis B, so schneidet B mindestens ein Ereignis A_i, und B ist dann

P(B)=P(A_{1}\cap B)+P(A_{2}\cap B)+\dots +P(A_{m}\cap B)

.

Es gilt hier das Bayessche Theorem:

P(A_{i}|B)={\frac {P(A_{i}\cap B)}{P(B)}}={\frac {P(B|A_{i})P(A_{i})}{\sum _{j=1}^{m}P(B|A_{j})P(A_{j})}}

.

Übung:

Was ist P(A|B), falls A und B disjunkt sind?

Was ist P(A|B), falls A und B stochastisch unabhängig sind?

Lösungen der Übungen

Beispiel mit den Kursverläufen

1. Darstellung der verschiedenen Wahrscheinlichkeiten

	$K_{1}$ $0{,}55$	${\overset {\text{ }}{\overline {K_{1}}}}$ $0{,}45$
$K_{2}$ $0{,}55$ aus Summe der Zeile	$K_{1}\cap K_{2}$ $0{,}4$	${\overset {\text{ }}{{\overline {K}}_{1}\cap K_{2}}}$ $0{,}15$
${\overset {\text{ }}{{\overline {K}}_{2}}}$ $0{,}45$ aus Summe der Zeile	${\overset {\text{ }}{K_{1}\cap {\overline {K}}_{2}}}$ $0{,}15$	${\overset {\text{ }}{{\overline {K}}_{1}\cap {\overline {K}}_{2}}}$ $0{,}3$