Nash-Gleichgewicht und Gefangenen-Dilemma

Das Nash-Gleichgewicht tritt in der Spieltheorie ein, wenn das Abweichen von einer Strategie von allen (einzelnen) Spielern als schlecht empfunden wird.

Beispiel 1

5 Freunde gehen immer montags zum Schwimmen. Tom und Tim haben aber grade heute mehr Lust, Bouldern zu gehen. Dennoch wollen sie lieber etwas mit ihren Freunden machen als alleine Bouldern zu gehen. Daher ist es für jeden einzelnen nicht gut, von seiner Strategie (schwimmen zu gehen) abzuweichen. Wir haben ein Nash-Gleichgewicht.

Beispiel 2

Meine persönliche Strategie ist es, "ausreichend zu trinken", um nicht durstig zu sein. Tatsächlich macht das vermutlich jeder so. Auch hier haben wir ein Nash-Gleichgewicht; denn jeder hat eine Strategie, von der es schlecht ist abzuweichen.

In diesem Fall ist "ausreichend zu trinken" sogar eine dominante Strategie, da, unabhängig was die andern machen, für den Spieler "ausreichend zu trinken" die beste Strategie ist.

Beispiel 3

Das Uni Beispiel für ein Nash-Gleichgewicht ist das Gefangenen-Dilemma:

Zwei Schwerverbrecher werden bei einer schlimmen Aktion erwischt. Zum Beispiel haben sie auf einer anderen Website als Serlo Mathe gelernt. Leider kann man nicht nachweisen, dass sie die Tat wirklich getan haben. Daher wenden die Judikative (hier Eltern) eine verbotene Methode an. Die Gefangenen werden in unterschiedliche Räume gesperrt, und ihnen wir folgendes Angebot gemacht. Sie können entweder lügen, dass sie die andere Website nur kurz aus Versehen geöffnet haben; dann müssen sie sich entschuldigen und das Zimmer aufräumen. Oder sie können gestehen, dass sie auf der anderen Website gelernt haben; dann werden sie schwer bestraft und müssen den Müll runter bringen. Das Problem ist jedoch, dass die Schwerverbrecher in unterschiedlichen Räumen untergebracht sind, und wenn sie unterschiedlich antworten, kriegt der, der gelogen hat, richtig Ärger (er muss einen ganzen Monat den Müll runter bringen) und der, der die Wahrheit sagt, kommt ungeschoren davon.

Das war ziemlich viel Text. Fassen wir das mal in einem Diagramm zusammen.

Spieler 1 / Spieler 2	lügen	gestehen
lügen	unangenehm /unangenehm	katastrophal /nix
gestehen	nix /katastrophal	schlimm /schlimm

An der linken Seite stehen die Strategien für Spieler 1, hier "lügen" und "gestehen". Was aus der Strategie herauskommt, wird Auszahlung genannt, das steht rechts neben der Strategie. Die Auszahlung (in unserem Fall die Bestrafung) hängt jedoch auch von der Strategie des anderen Spielers ab. So werden in der ersten Zeile die Strategien von Spieler zwei gelistet. Die einzelnen Auszahlungen stehen dann in der Tabelle in der Form (Auszahlung von Spieler 1) / (Auszahlung von Spieler 2).

Als Beispiel sagen wir, Spieler 1 gesteht. Das bedeutet, dass wir in der untersten Zeile sind. Wenn jetzt Spieler 2 lügt, sind wir in der zweiten Ziele, also in der Tabelle bei "nix

/katastrophal"; das bedeutet, Spieler 1 wurde nicht bestraft und Spieler 2 wurde katastrophal bestraft. (Er muss einen ganzen Monat den Müll runter bringen)

Im Beispiel sehen wir: Wenn ein Spieler gesteht, ist es für den andern schlecht zu lügen.

Er sollte auch gestehen. Wenn beide Spieler die Strategie "gestehen" wählen, ist es für jeden Spieler schlecht abzuweichen. Wir haben ein Nash-Gleichgewicht.

Man sieht, wie in Beispiel 1 ist das Nash-Gleichgewicht nicht für alle Spieler die beste Lösung. Wenn beide Spieler die Strategie "lügen" gewählt hätten, wären sie beide glücklicher. Das ist jedoch kein Gleichgewicht, denn wenn ein Spieler vermutet, dass der andere die Strategie "lügen" gewählt hat, würde er gestehen, um der Strafe ganz zu entkommen. Auf Schwerverbrecher ist halt kein Verlass.

Dieses Werk steht unter der freien Lizenz
CC BY-SA 4.0 → Was bedeutet das?