Bedingte Wahrscheinlichkeit
Baumdiagramme, Bayes, Vierfeldertafel und stochastische Unabhängigkeit
1. Einstieg und Motivation
Eine alltägliche Frage
Ein medizinischer Schnelltest schlägt bei dir positiv an. Wie wahrscheinlich ist es, dass du tatsächlich erkrankt bist?
Viele Menschen würden antworten: „Sehr wahrscheinlich – der Test ist doch zuverlässig!" Doch die Antwort ist überraschend: Selbst bei einem sehr guten Test kann \(P(\text{krank} \mid \text{positiv})\) deutlich kleiner sein als erwartet. Am Ende von Kapitel 5 wirst du wissen, warum.
Das entscheidende Aha-Erlebnis
Die Frage „Wie wahrscheinlich ist es, positiv getestet zu werden, wenn man krank ist?" ist eine völlig andere als „Wie wahrscheinlich ist es, krank zu sein, wenn man positiv getestet wurde?"
In der Sprache der Stochastik:
\[ P(\text{positiv} \mid \text{krank}) \quad \neq \quad P(\text{krank} \mid \text{positiv}) \]Diese Verwechslung ist einer der häufigsten Denkfehler im Umgang mit Wahrscheinlichkeiten. Das gesamte Kapitel zielt darauf ab, diesen Unterschied systematisch zu verstehen und sicher anwenden zu können.
2. Bedingte Wahrscheinlichkeit
Definition
Für zwei Ereignisse \(A\) und \(B\) mit \(P(B) > 0\) ist die bedingte Wahrscheinlichkeit von \(A\) unter der Bedingung \(B\) definiert als:
\[ P(A \mid B) = \frac{P(A \cap B)}{P(B)} \]Lesart: „Wahrscheinlichkeit von \(A\), gegeben dass \(B\) eingetreten ist."
Anschauliche Deutung
Die Bedingung \(B\) schränkt den Ergebnisraum auf jene Fälle ein, in denen \(B\) gilt. Innerhalb dieses eingeschränkten Raums berechnet man den relativen Anteil von \(A \cap B\).
Der Nenner \(P(B)\) normiert auf die neue „Gesamtheit" — alles, was außerhalb von \(B\) liegt, wird ignoriert.
Typische Sprachsignale für Bedingungen
Erkenne Bedingungen an folgenden Formulierungen:
- „… gegeben, dass …"
- „… falls … bereits eingetreten ist"
- „… wenn man weiß, dass …"
- Relativsätze mit feststellendem Charakter: „der die 6 zeigt", „die rot ist", „das fehlerhaft ist"
Beispielaufgabe: Stifte in der Schultasche
In einer Schultasche befinden sich 12 Stifte: 7 blaue und 5 rote. Von den blauen sind 3 Druckkugelschreiber, der Rest sind Tintenroller. Von den roten sind 2 Druckkugelschreiber, der Rest sind Tintenroller. Es wird zufällig ein Stift gezogen.
a) Bestimme \(P(\text{Druckkuli} \mid \text{blau})\).
b) Bestimme \(P(\text{rot} \mid \text{Tintenroller})\).
Stolperstelle: Verwechsle nicht \(P(A \mid B)\) mit \(P(B \mid A)\). Im Stift-Beispiel ist \(P(\text{blau} \mid \text{Druckkuli}) = \tfrac{3}{5} \neq \tfrac{3}{7} = P(\text{Druckkuli} \mid \text{blau})\). Die Reihenfolge in \(P(\,\cdot \mid \cdot\,)\) ist nicht umkehrbar!
3. Baumdiagramm und Pfadregeln
Ein Baumdiagramm modelliert ein mehrstufiges Zufallsexperiment. Jede Stufe entspricht einem Teilschritt, jede Verzweigung einem möglichen Ausgang.
Was steht wo im Baumdiagramm?
| Position | Wahrscheinlichkeitstyp |
|---|---|
| Äste der 1. Stufe | Unbedingte Wahrscheinlichkeiten, z. B. \(P(A)\), \(P(\overline{A})\) |
| Äste ab 2. Stufe | Bedingte Wahrscheinlichkeiten, z. B. \(P(B \mid A)\) |
| Endknoten | Schnittwahrscheinlichkeiten (Pfadregel), z. B. \(P(A \cap B)\) |
Die beiden Pfadregeln
1. Pfadregel (Produktregel)
Die Wahrscheinlichkeit eines Pfades ist das Produkt der Wahrscheinlichkeiten entlang der Äste:
\[P(A \cap B) = P(A) \cdot P(B \mid A)\]2. Pfadregel (Summenregel)
Die Wahrscheinlichkeit eines Ereignisses, das durch mehrere Pfade dargestellt wird, ist die Summe der Pfadwahrscheinlichkeiten.
Spezialfall – Satz von der totalen Wahrscheinlichkeit:
\[P(B) = P(A) \cdot P(B \mid A) + P(\overline{A}) \cdot P(B \mid \overline{A})\]Beispielaufgabe: Fahrrad-Werkstatt
In einer Werkstatt werden Fahrräder von zwei Mechanikern montiert. Mechaniker M1 montiert 60 % der Räder, Mechaniker M2 die übrigen 40 %. Erfahrungsgemäß ist 1 % der von M1 montierten Räder fehlerhaft und 4 % der von M2 montierten Räder.
a) Zeichne ein Baumdiagramm.
b) Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewähltes Rad fehlerhaft ist?
Stolperstelle: Am Endknoten eines Pfades steht die Schnittwahrscheinlichkeit \(P(M1 \cap F)\), nicht die bedingte Wahrscheinlichkeit \(P(F \mid M1)\). Den bedingten Wert findest du an den Ästen der 2. Stufe — nicht am Endknoten!
4. Umgekehrtes Baumdiagramm
Im Originalbaum verzweigt man nach Ursache → Wirkung (z. B. „Welcher Mechaniker?" → „Fehlerhaft?"). Manche Fragen verlangen den Rückschluss von der Wirkung auf die Ursache: „Das Rad ist fehlerhaft — stammt es wahrscheinlich von M2?"
Dazu wird der Baum umgekehrt: Die ehemalige Stufe 2 wird zur neuen Stufe 1.
Konstruktion in drei Schritten
Schritt 1: Endknotenwahrscheinlichkeiten
Berechne alle Schnittwahrscheinlichkeiten aus dem Originalbaum mit der 1. Pfadregel.
Schritt 2: Neue Stufe 1
Berechne die Wahrscheinlichkeiten der Wirkungsereignisse mit dem Satz von der totalen Wahrscheinlichkeit.
Schritt 3: Neue Stufe 2 (bedingte Wahrscheinlichkeiten)
Die gesuchten bedingten Wahrscheinlichkeiten erhält man als:
\[ P(\text{Ursache} \mid \text{Wirkung}) = \frac{P(\text{Ursache} \cap \text{Wirkung})}{P(\text{Wirkung})} \]Zähler = Endknotenwahrscheinlichkeit aus Schritt 1, Nenner = Ergebnis aus Schritt 2.
Beispiel: Fortsetzung Werkstatt
Bestimme \(P(M2 \mid F)\): Ein Rad ist fehlerhaft — wie wahrscheinlich stammt es von M2?
5. Satz von Bayes
Der Satz von Bayes ist die formale Schreibweise des umgekehrten Baumdiagramms. Er liefert denselben Bruch — nützlich, wenn keine Zeichnung gewünscht ist.
Allgemeine Form
\[ P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)} \]Erweiterte Form mit totaler Wahrscheinlichkeit
\[ P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B \mid A) \cdot P(A) + P(B \mid \overline{A}) \cdot P(\overline{A})} \]Vokabular
- \(P(A)\): a-priori-Wahrscheinlichkeit — Vorwissen vor der Beobachtung
- \(P(B \mid A)\): Likelihood — wie wahrscheinlich ist \(B\), wenn \(A\) gilt?
- \(P(A \mid B)\): a-posteriori-Wahrscheinlichkeit — aktualisiertes Wissen nach Beobachtung von \(B\)
Beispielaufgabe: Medizintest
Eine bestimmte Krankheit tritt bei 0,5 % der Bevölkerung auf. Ein Test erkennt erkrankte Personen mit 99 % Wahrscheinlichkeit korrekt (Sensitivität). Bei gesunden Personen schlägt der Test mit 2 % Wahrscheinlichkeit fälschlich an (Falsch-Positiv-Rate).
Eine Person erhält ein positives Testergebnis. Wie wahrscheinlich ist es, dass sie tatsächlich erkrankt ist?
Basisratenfehler: Warum ist das Ergebnis so niedrig?
Die Krankheit ist sehr selten (0,5 %). Selbst bei geringer Falsch-Positiv-Rate gibt es unter 100.000 Getesteten nur 500 tatsächlich Kranke, aber 1.990 falsch positive Gesunde. Die absolute Zahl der Fehltreffer überwältigt die echten Treffer. Immer die Basisrate beachten!
6. Vierfeldertafel
Eine Vierfeldertafel ist eine \(2 \times 2\)-Tabelle, die zwei dichotome Merkmale gegenüberstellt. Sie kann mit absoluten Häufigkeiten oder mit Wahrscheinlichkeiten gefüllt werden.
Aufbau mit Wahrscheinlichkeiten
| \(B\) | \(\overline{B}\) | \(\Sigma\) | |
|---|---|---|---|
| \(A\) | \(P(A \cap B)\) | \(P(A \cap \overline{B})\) | \(P(A)\) |
| \(\overline{A}\) | \(P(\overline{A} \cap B)\) | \(P(\overline{A} \cap \overline{B})\) | \(P(\overline{A})\) |
| \(\Sigma\) | \(P(B)\) | \(P(\overline{B})\) | 1 |
Jede Zeilen- und Spaltensumme ergibt den jeweiligen Randwert. Die bedingte Wahrscheinlichkeit erhält man, indem man eine Zelle durch den zugehörigen Randwert dividiert.
Wann Baumdiagramm, wann Vierfeldertafel?
| Situation | Besser geeignet |
|---|---|
| Klar kausale Abfolge (erst eine Stufe, dann die nächste) | Baumdiagramm |
| Zwei Merkmale gleichzeitig erhoben (z. B. Geschlecht und LK-Wahl) | Vierfeldertafel |
| Frage nach bedingten Wahrscheinlichkeiten in beide Richtungen | Vierfeldertafel |
Beispielaufgabe: Pendler und E-Auto
In einer Stichprobe von 200 Pendler:innen wurde erhoben, ob sie ein E-Auto fahren (\(E\)) und ob sie eine eigene Wallbox zuhause besitzen (\(W\)). 80 Personen fahren ein E-Auto, 90 besitzen eine Wallbox, 60 Personen tun beides.
a) Stelle eine Vierfeldertafel mit absoluten Zahlen auf.
b) Berechne \(P(W \mid E)\) und \(P(E \mid W)\) und interpretiere die Werte.
7. Stochastische Unabhängigkeit
Definition
Zwei Ereignisse \(A\) und \(B\) heißen stochastisch unabhängig, wenn gilt:
\[ P(A \cap B) = P(A) \cdot P(B) \]Äquivalente Formulierungen
- Falls \(P(B) > 0\): \(P(A \mid B) = P(A)\)
- Falls \(P(A) > 0\): \(P(B \mid A) = P(B)\)
In Worten: Die Information „\(B\) ist eingetreten" verändert die Wahrscheinlichkeit von \(A\) nicht.
Übertragung auf Komplemente
Sind \(A\) und \(B\) unabhängig, so auch:
- \(A\) und \(\overline{B}\)
- \(\overline{A}\) und \(B\)
- \(\overline{A}\) und \(\overline{B}\)
Wichtige Abgrenzung: stochastisch vs. kausal
- Stochastisch unabhängig: rein rechnerische Beziehung — die Produktformel gilt.
- Kausal unabhängig: keine inhaltliche Ursache-Wirkungs-Beziehung.
Beispiel: „Erster Würfel zeigt 4" und „Augensumme beider Würfel ist 7" sind stochastisch abhängig, obwohl man inhaltlich sagen könnte, der zweite Würfelwurf sei unabhängig.
Beispielaufgabe: Kartendeck
Ein Kartendeck hat 32 Karten. Betrachte:
- \(H\): „Karte ist ein Herz"
- \(D\): „Karte ist eine Dame"
Prüfe, ob \(H\) und \(D\) stochastisch unabhängig sind.
8. Additionssatz und Vereinigungen
Allgemeine Form
\[ P(A \cup B) = P(A) + P(B) - P(A \cap B) \]Begründung: Beim Addieren von \(P(A)\) und \(P(B)\) wird der Schnittbereich \(A \cap B\) doppelt gezählt — er wird daher einmal abgezogen.
Spezialfall: disjunkte Ereignisse
Wenn \(A \cap B = \emptyset\):
\[P(A \cup B) = P(A) + P(B)\]Spezialfall: unabhängige Ereignisse
Wenn \(A\) und \(B\) unabhängig sind:
\[P(A \cup B) = P(A) + P(B) - P(A) \cdot P(B)\]Beispielaufgabe: Fahrrad und Roller
In einer Klasse haben 60 % der Schüler:innen ein Fahrrad und 45 % einen Roller. 20 % besitzen beides. Wie groß ist der Anteil derer, die mindestens eines von beidem besitzen?
9. De Morgan'sche Regeln
Die beiden Regeln
\[ \overline{A \cup B} = \overline{A} \cap \overline{B} \] \[ \overline{A \cap B} = \overline{A} \cup \overline{B} \]Faustregel
Beim Hineinziehen des Komplementstrichs in eine Klammer vertauschen sich \(\cup\) und \(\cap\): Aus „und" wird „oder", aus „oder" wird „und".
„Nicht (\(A\) oder \(B\))" \(=\) „Nicht \(A\) und nicht \(B\)"
„Nicht (\(A\) und \(B\))" \(=\) „Nicht \(A\) oder nicht \(B\)"
Anwendung in der Stochastik
Die Regeln sind rein mengentheoretisch und helfen, Gegenereignisse handhabbar zu machen. Ein häufiger Trick: \(P(\overline{A} \cap \overline{B})\) lässt sich über den Additionssatz schneller berechnen:
\[ P(\overline{A} \cap \overline{B}) = P\!\left(\overline{A \cup B}\right) = 1 - P(A \cup B) \]Das ist oft einfacher als das direkte Ausfüllen der Vierfeldertafel.
10. Übungsaufgaben
Die Aufgaben decken alle Lernziele in steigender Schwierigkeit ab. Klicke auf „Lösung anzeigen", wenn du fertig gerechnet hast oder nicht weiterkommst.
Aufgabe A – Bedingte Wahrscheinlichkeit (Basis) Leicht
In einer Lostrommel befinden sich 30 Lose: 12 tragen einen Hauptgewinn, der Rest ist eine Niete. Von den Hauptgewinnen sind 4 zusätzlich mit einem Sonderpreis markiert.
a) Wie groß ist \(P(\text{Sonderpreis} \mid \text{Hauptgewinn})\)?
b) Wie groß ist \(P(\text{Hauptgewinn} \cap \text{Sonderpreis})\)?
Kapitel: 2. Bedingte Wahrscheinlichkeit
Aufgabe B – Baumdiagramm und totale Wahrscheinlichkeit Leicht
In einer Bäckerei werden Brötchen aus zwei Teigsorten gebacken: 70 % Weizenteig und 30 % Dinkelteig. Bei 5 % der Weizenbrötchen und 12 % der Dinkelbrötchen kommt es zu kleinen Backfehlern.
a) Zeichne ein Baumdiagramm.
b) Wie groß ist die Wahrscheinlichkeit, dass ein zufällig gewähltes Brötchen einen Backfehler hat?
Kapitel: 3. Baumdiagramm
Aufgabe C – Umgekehrtes Baumdiagramm Mittel
Knüpfe an Aufgabe B an:
Ein Kunde reklamiert ein Brötchen mit Backfehler. Wie wahrscheinlich ist es, dass dieses Brötchen aus Dinkelteig hergestellt wurde?
Kapitel: 4. Umgekehrtes Baumdiagramm
Aufgabe D – Satz von Bayes Mittel
In einer Region tritt eine Pilzkrankheit bei 1 % der Weinreben auf. Ein Diagnoseverfahren erkennt befallene Reben in 95 % der Fälle korrekt. Bei gesunden Reben liefert es in 8 % der Fälle ein fälschlich positives Ergebnis.
Eine Rebe wird positiv getestet. Wie wahrscheinlich ist es, dass sie tatsächlich befallen ist?
Kapitel: 5. Satz von Bayes
Aufgabe E – Vierfeldertafel und Unabhängigkeit Mittel
Eine Umfrage unter 400 Personen ergibt: 220 fahren regelmäßig Fahrrad (\(F\)), 150 nutzen den ÖPNV regelmäßig (\(P\)), 90 Personen tun beides.
a) Erstelle eine Vierfeldertafel mit absoluten Zahlen.
b) Prüfe rechnerisch, ob die Merkmale stochastisch unabhängig sind.
Kapitel: 6. Vierfeldertafel, 7. Stochastische Unabhängigkeit
Aufgabe F – Unabhängigkeit beim Würfeln Mittel
Es werden zwei faire Würfel geworfen. Betrachte die Ereignisse:
- \(X\): „Beide Würfel zeigen dieselbe Augenzahl"
- \(Y\): „Die Augensumme ist gerade"
Sind \(X\) und \(Y\) stochastisch unabhängig? Begründe rechnerisch.
Kapitel: 7. Stochastische Unabhängigkeit
Aufgabe G – Additionssatz Leicht
In einer Sportgruppe spielen 70 % Tennis (\(T\)), 50 % Badminton (\(B\)), 30 % spielen beides.
a) Anteil mit mindestens einer der beiden Sportarten?
b) Anteil mit genau einer der beiden Sportarten?
c) Anteil ohne beide Sportarten?
Kapitel: 8. Additionssatz, 9. De Morgan
Aufgabe H – Synthese (Vierfeldertafel, Bayes, Unabhängigkeit) Schwer
Eine Online-Plattform unterscheidet bei der Registrierung zwischen Standardkonto (80 %) und Premiumkonto (20 %). Erfahrungsgemäß sind 15 % der Standardkonten und 3 % der Premiumkonten nach einem Jahr inaktiv.
a) Erstelle eine Vierfeldertafel mit Wahrscheinlichkeiten.
b) Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewähltes Konto inaktiv ist?
c) Ein Konto ist inaktiv. Mit welcher Wahrscheinlichkeit handelt es sich um ein Premiumkonto?
d) Prüfe, ob „Premiumkonto" und „inaktiv" stochastisch unabhängig sind.
Kapitel: 5. Bayes, 6. Vierfeldertafel, 7. Unabhängigkeit