Jahr der Mathematik, nächster Versuch. Heute Ziegen.
Genauer gesagt zwei Ziegen und ein Auto. In den 1990er Jahren waren Gameshows mit drei Toren angesagt. Harry Wynford versuchte es mit „Der Preis ist heiß“, Zonks und anderes Getier krabbelten durch die Fernsehlandschaften.
Man stelle sich eine solche Situation bildlich vor. In einer Gameshow steht der Kandidat von drei Toren, hinter einer Tür ist der Hauptpreis (ein schnelles Fluchtfahrzeug, um ganz der Show entfliehen zu können), hinter den andern beiden Türen sind Ziegen, die Nieten symbolisieren sollen. Der Kandidat hat keine Ahnung, was sich wo verbirgt, der neben ihm stehende Moderator allerdings schon.
Also wählt der Kandidat blind eines der Tore aus. Der Moderator öffnet daraufhin eines der beiden nicht ausgewählten Tore, darin ist eine Ziege (Es ist klar, dass der Moderator die Spannung erhalten möchte und daher unter keinen Umständen die Tür mit dem Auto öffnet. Er wird eine Ziegentüre öffnen).
Das Spiel hat sich verändert. Nur noch ein Gewinn und eine Niete sind im Spiel. Und dann die Frage des Moderators: „Möchten Sie wechseln?“
Auf den ersten Blick ein triviales Problem – die Chance auf das Auto steigt, wenn man in diese neue Situation ohne Vorwissen gehen würde, auf 50%. Doch Moment mal, man hat Vorwissen. Man weiss, dass man mit einer Wahrscheinlichkeit von 1/3 das Auto gewählt hat, also müsste man es doch mit einer Wahrscheinlichkeit von 2/3 nicht gewählt haben.
Marilyn vos Savant hat über dieses Problem einen langen akademischen Streit mit diversen Verfechtern der 50:50-Theorie geführt. Nachzulesen hier!
Alles in allem geht es um ein Problem mit bedingter Wahrscheinlichkeit. Die Auswahl in der ersten Runde bedingt das Verhalten des Moderators und damit die zweite Auswahlrunde. In einem Drittel der Fälle (dann, wenn man das Auto ausgewählt hat), ist hinter dem verbleibenden nichtgewählten Tor eine Ziege. In zwei Dritteln der Fälle ist hinter dem verbleibenden nichtgewählten Tor ein Auto. Also rentiert sich der Wechsel in 2 von 3 Fällen. Soweit die umgangssprachliche Erklärung.
Die Mathematik kann das auch, und zwar beispielsweise mit dem Theorem von Bayes. Bayes, in der Wirtschaftsinformatik gern zitierter presbyterianischer Pfarrer aus dem England des 18. Jahrhunderts, hat sein Theorem über bedingte Wahrscheinlichkeiten veröffentlicht, der mathematisch korrekte Beweis von Wikipedia übernommen. Gegeben sei der Fall, dass der Moderator Tor B geöffnet und man selbst das Tor A gewählt habe. Dann ist P(Gewinn in C | Moderator hat B geöffnet):
Noch deutlicher wird die Bedeutung der bedingten Wahrscheinlichkeit übrigens in der Medizin. Folgende Ausgangssituation (ausführlich beschrieben samt der psychologischen Folgen bei Gerd Gigerenzer im Buch „Das Einmaleins der Skepsis“): Eine Krankheit tritt bei etwa 2 von 10.000 Menschen auf. Nun hat gibt es einen Test zur Diagnose eben jener Krankheit, der die Krankheit in 99% der Fällen findet, in 1% der Fälle bei einem Gesunden fälschlicherweise aber auch anschlägt.
In Bayes-Notation:
- Krankheit tritt bei einem bestimmten Menschen aus der Grundgesamtheit aller Menschen auf: P(A) = 0,002%
- Test fällt positiv aus: P(B) = 0,0100196 (kann aus den übrigen Angaben errechnet werden)
- Krankheit wird vom Test bei einem erkrankten Menschen gefunden = P(B|A) = 99%
- Krankheit wird vom Test nicht bei einem erkrankten Menschen gefunden = P(B|AC) = 1% (AC = Komplement von A)
Setzt man dies nun in das Bayestheorem ein, erhält man als Erkrankungswahrscheinlichkeit bei positivem Test rund 2%! Das bedeutet: Man ist mit einer Wahrscheinlichkeit von etwas weniger als 1 gesund.
Das erscheint unglaublich. Aber da hilft ein bischen „Mengenlehre“. Nachfolgendes Bild zeigt drei Kreise. Der größte Kreis symbolisiere die Grundgesamtheit. Er hat einen Radius von 10 Längeneinheiten, und somit eine Fläche von etwa 314 Flächeneneinheiten. In diesem Kreis befindet sich ein zweiter Kreis. Der Kreis hat einen Radius von etwa 1 und eine Fläche von 3,202 Flächeneinheiten. Er symbolisiert die Menge aller Personen, bei denen der Test positiv anschlägt. Innerhalb dieses Kreises befindet sich ein weiterer kleiner Kreis. Er hat eine Fläche von 0,00628 Flächeneinheiten, also 0,002%*314, und symbolisiert die Menge aller Erkrankten. (Er schaut ein wenig aus dem Kreis heraus. Das sind die wenigen erkrankten Fälle, bei denen der Test nicht anschlägt).
Bei diesen Zahlenspielen ist aber eines noch zu beachten: Hier wurde als Grundgesamtheit eine repräsentative Stichprobe aller Menschen gewählt. Sollte man einen Test nicht auf eine solche Grundgesamtheit anwenden, sondern auf eine Menge, in der die Erkranktenquote sehr viel höher ist (beispielsweise Leute, die erste Symptome einer Krankheit aufweisen) steigt P(B|A) sofort merklich an.
Als Beispiel: Das Resultat des ersten Tests liege vor, und man kann nun einen zweiten Test verwenden, dessen Ergebnis von dem des ersten unabhängig sei. Statt 0,002% Erkrankungsquote ist die Quote jetzt bei 2% , sofort steigt die Wahrscheinlichkeit, bei positivem Ergebnis erkrankt zu sein, auf etwas über 66%. Ein dritter, unabhängiger Test erhöht sorgt bei positivem Ergebnis dann für annähernde Gewissheit: Also immer mehrere, unabhängige Tests verwenden, dann steigt die Chance einer korrekten Antwort.