www.wikidata.de-de.nina.az
Ein Zwei Personen Nullsummenspiel ist in der Spieltheorie ein Nullsummenspiel mit zwei Spielern Nullsummenspiele sind dadurch gekennzeichnet dass die Verluste der Verlierer genau den Gewinnen der Sieger entsprechen 1 Die meisten gangigen Spiele um Geld wie Skat Poker usw sind Beispiele hierfur Sind an einem Nullsummenspiel nur zwei Spieler beteiligt so entfallen auch alle Moglichkeiten fur kooperatives Verhalten auf Kosten Dritter Aus diesem Grund stellen Zwei Personen Nullsummenspiele ein gut uberblickbares Modell fur spieltheoretische Strategie und Gleichgewichtskonzepte dar das schon seit Beginn der Spieltheorie regelmassig untersucht wurde Als Besonderheit fallen hier die Begriffe Nash Gleichgewicht Gleichgewicht in Maximin Strategien und Gleichgewicht in Minimax Strategien zusammen Die Begriffe Maximin und Minimax Strategie werden in der Literatur allerdings nicht einheitlich verwendet es sollte immer angegeben werden welches inhaltliche Konzept damit verbunden ist Strategie schlimmstmoglicher Bestrafung des Gegners in diesem Artikel Minimax oder Maximierung des ungunstigsten Ergebnisses in diesem Artikel Maximin Der Artikel definiert die grundlegenden Begriffe und behandelt die zwei zentralen Satze fur die Bestimmung der Gleichgewichte Die Konzepte werden anhand der Beispiele Matching Pennies und Schere Stein Papier erlautert Inhaltsverzeichnis 1 Definitionen 1 1 Spiel in Normalform 1 2 Konstantsummenspiel 1 3 Nullsummenspiel 1 4 Zwei Personen Nullsummenspiel 1 5 Beispiele 1 5 1 Matching Pennies A 1 5 2 Schere Stein Papier B 1 5 3 Weitere Beispiele C D 2 Gleichgewichtskonzepte 2 1 Nash Gleichgewicht 2 2 Minimax 2 3 Maximin 2 4 Zusammenhang zwischen den Konzepten 3 Losungskonzepte 3 1 Endliche Strategiemengen 3 2 Gemischte Strategien 3 3 Beispiele Fortsetzung 3 3 1 Matching Pennies 3 3 2 Schere Stein Papier 4 Literatur 5 EinzelnachweiseDefinitionen BearbeitenSpiel in Normalform Bearbeiten Um ein Spiel in Normalform Spieltheorie zu beschreiben legt man fest welche Spieler am Spiel beteiligt sind man bezeichnet dies als die Spielermenge I displaystyle textstyle I nbsp Jedem Spieler i I displaystyle i in I nbsp wird eine Strategiemenge S i displaystyle S i nbsp zugeordnet Die Strategiemenge S i displaystyle S i nbsp enthalt alle Strategien aus denen Spieler i displaystyle i nbsp bei Durchfuhrung des Spiels eine Strategie s i displaystyle s i nbsp auswahlt Schliesslich gibt es fur jeden Spieler i I displaystyle i in I nbsp eine Auszahlungsfunktion u i displaystyle u i nbsp die jeder Strategiekombination s j j I displaystyle s j j in I nbsp eine Auszahlung fur Spieler i displaystyle i nbsp zuordnet Definition Unter einem Spiel G displaystyle Gamma nbsp in Normalform versteht man ein Tripel I S i i I u i i I displaystyle I S i i in I u i i in I nbsp 2 wobei u i j I S j R displaystyle textstyle u i prod j in I S j rightarrow mathbb R nbsp Konstantsummenspiel Bearbeiten Bei einem Konstantsummenspiel wird bei jeder Strategiekombination also jedem Spielergebnis die gleiche Auszahlungssumme C displaystyle C nbsp an alle Spieler ausgeschuttet Definition Ein Spiel G I S i i I u i i I displaystyle Gamma I S i i in I u i i in I nbsp heisst Konstantsummenspiel mit Auszahlungssumme C displaystyle C nbsp wenn gilt i I u i C displaystyle textstyle sum i in I u i C nbsp Konstantsummenspiele ergeben sich insbesondere wenn ein fester Ressourcenbestand oder ein fester Geldbetrag unter den Spielern als Spielergebnis aufgeteilt wird Nullsummenspiel Bearbeiten Definition Ein Konstantsummenspiel mit Auszahlungssumme C displaystyle C nbsp heisst Nullsummenspiel wenn C 0 displaystyle textstyle C 0 nbsp Spieltheoretisch besteht kein wesentlicher Unterschied zwischen Konstantsummen und Nullsummenspielen Aus einem Konstantsummenspiel G displaystyle Gamma nbsp mit Auszahlung C displaystyle C nbsp entsteht ein aquivalentes Nullsummenspiel G displaystyle tilde Gamma nbsp indem man einem beliebigen Spieler i displaystyle i nbsp vor Spielbeginn den Betrag C displaystyle C nbsp zuordnet den er nach Spielende sicher verliert und somit u i u i C displaystyle tilde u i u i C nbsp erhalt Die Auszahlungen im Spiel G displaystyle tilde Gamma nbsp summieren sich dann zu 0 Aus diesem Grund kann man sagen dass die Gewinne der Sieger den Verlusten der Unterlegenen entsprechen Zwei Personen Nullsummenspiel Bearbeiten Definition Ein Nullsummenspiel I S i i I u i i I displaystyle I S i i in I u i i in I nbsp heisst Zwei Personen Nullsummenspiel wenn I 2 displaystyle I 2 nbsp Bei Zwei Personen Nullsummenspielen ist die Auszahlung des zweiten Spielers bereits vollstandig durch die Auszahlung des ersten Spielers festgelegt Bezeichnet man die beiden Spieler mit 1 displaystyle 1 nbsp und 2 displaystyle 2 nbsp also I 1 2 displaystyle I 1 2 nbsp so gilt u 2 s 1 s 2 u 1 s 1 s 2 displaystyle u 2 s 1 s 2 u 1 s 1 s 2 nbsp Es ist daher moglich die Definition eines Zwei Personen Nullsummenspiels zu vereinfachen Definition Ein Zwei Personen Nullsummenspiel ist ein Tripel S 1 S 2 u displaystyle S 1 S 2 u nbsp wobei u S 1 S 2 R displaystyle u S 1 times S 2 rightarrow mathbb R nbsp 3 Die Spielermenge I displaystyle textstyle I nbsp ist hierbei naturlicherweise I 1 2 displaystyle I 1 2 nbsp die Auszahlungsfunktion u displaystyle u nbsp bezieht sich auf Spieler 1 Spieler 2 hat dann die Auszahlungsfunktion u 2 u displaystyle u 2 u nbsp Beispiele Bearbeiten Zwei Personen Nullsummenspiele bei denen jeder Spieler nur endlich viele Strategien hat werden gerne in Form einer Bimatrix oder vereinfacht als Matrix dargestellt Dabei entspricht jede Zeile einer Strategie s 1 displaystyle s 1 nbsp fur Spieler 1 also einem Element aus S 1 displaystyle S 1 nbsp jede Spalte entsprechend einer Strategie s 2 displaystyle s 2 nbsp fur Spieler 2 In den Feldern der Bimatrix stehen die Auszahlungen u 1 s 1 s 2 displaystyle u 1 s 1 s 2 nbsp und u 2 s 1 s 2 displaystyle u 2 s 1 s 2 nbsp Die Bimatrix stellt also eine Wertetabelle der Funktionen u 1 displaystyle u 1 nbsp und u 2 displaystyle u 2 nbsp gemass der ersten Definition eines Zwei Personen Nullsummenspiels dar Da die Auszahlung von Spieler 2 aber durch die Auszahlung von Spieler 1 bereits eindeutig festgelegt ist genugt eigentlich die Angabe der Auszahlung fur Spieler 1 dies fuhrt zur Matrixdarstellung gemass der 2 Definition Die Matrix ist dann eine Wertetabelle fur die Funktion u displaystyle u nbsp G displaystyle Gamma nbsp als Bimatrix s 2 1 displaystyle s 2 1 nbsp displaystyle cdots nbsp s 2 n displaystyle s 2 n nbsp s 1 1 displaystyle s 1 1 nbsp u 1 s 1 1 s 2 1 displaystyle u 1 s 1 1 s 2 1 nbsp u 2 s 1 1 s 2 1 displaystyle u 2 s 1 1 s 2 1 nbsp displaystyle cdots nbsp u 1 s 1 1 s 2 n displaystyle u 1 s 1 1 s 2 n nbsp u 2 s 1 1 s 2 n displaystyle u 2 s 1 1 s 2 n nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle ddots nbsp displaystyle vdots nbsp s 1 m displaystyle s 1 m nbsp u 1 s 1 m s 2 1 displaystyle u 1 s 1 m s 2 1 nbsp u 2 s 1 m s 2 1 displaystyle u 2 s 1 m s 2 1 nbsp displaystyle cdots nbsp u 1 s 1 m s 2 n displaystyle u 1 s 1 m s 2 n nbsp u 2 s 1 m s 2 n displaystyle u 2 s 1 m s 2 n nbsp In der vereinfachten Darstellung erhalt man dann G s 2 1 s 2 n s 1 1 u s 1 1 s 2 1 u s 1 1 s 2 n s 1 m u s 1 m s 2 1 u s 1 m s 2 n displaystyle begin array c ccc Gamma amp s 2 1 amp cdots amp s 2 n hline s 1 1 amp u s 1 1 s 2 1 amp cdots amp u s 1 1 s 2 n vdots amp vdots amp ddots amp vdots s 1 m amp u s 1 m s 2 1 amp cdots amp u s 1 m s 2 n end array nbsp Als Matrix des Spiels bezeichnet man dann die m n displaystyle m times n nbsp Matrix A A u s 1 1 s 2 1 u s 1 1 s 2 n u s 1 m s 2 1 u s 1 m s 2 n displaystyle A left begin array ccc u s 1 1 s 2 1 amp cdots amp u s 1 1 s 2 n vdots amp ddots amp vdots u s 1 m s 2 1 amp cdots amp u s 1 m s 2 n end array right nbsp Matching Pennies A Bearbeiten In der Spieltheorie wird haufig Matching Pennies als Nullsummenspiel betrachtet Zwei Spieler legen gleichzeitig eine Munze auf den Tisch Liegt bei beiden Munzen Kopf K oder bei beiden Munzen Zahl Z oben so gehoren die beiden Munzen Spieler 1 zeigen die beiden Munzen verschiedene Seiten so gehoren die beiden Munzen Spieler 2 Da der Sieger also die Munze des Verlierers gewinnt handelt es sich um ein Nullsummenspiel Als Bimatrix ergibt sich folgende Darstellung Auszahlungsmatrix fur Spieler 1 und Spieler 2 Kopf ZahlKopf 1 1 1 1Zahl 1 1 1 1In der vereinfachten Darstellung erhalt man folgende Matrix K Z K 1 1 Z 1 1 also die Matrix A 1 1 1 1 displaystyle begin array c rr amp K amp Z hline K amp 1 amp 1 Z amp 1 amp 1 end array quad text also die Matrix quad A left begin array rr 1 amp 1 1 amp 1 end array right nbsp Siehe auch Abschnitt Beispiel Kopf oder Zahl Matching Pennies im Artikel Unberechenbarkeit Spieltheorie Schere Stein Papier B Bearbeiten In Deutschland verbreiteter ist Schere Stein Papier Die Strategien in diesem Spiel heissen wie der Name des Spiels Man verbindet damit die Vorstellung dass die Schere S kaputt geht wenn man versucht mit ihr einen Stein St zu zerschneiden wohingegen die Schere das Papier P problemlos in Stucke schneidet Mit dem Papier kann man den Stein einwickeln Daraus ergibt sich dass Schere gegen Papier Papier gegen Stein und Stein gegen Schere gewinnt Bei gleicher Strategie beider Spieler kommt es zu einem Unentschieden Fur die spieltheoretische Behandlung wird meistens Sieg mit einem Punktgewinn Unentschieden mit 0 und Niederlage mit einem Punktverlust gewertet Die Strategiemengen der Spieler lauten also S 1 S 2 S S t P displaystyle S 1 S 2 S St P nbsp Die Menge aller moglichen Strategiekombinationen Kartesisches Produkt ist dann S 1 S 2 S S S S t S P S t S S t S t S t P P S P S t P P displaystyle S 1 times S 2 S S S St S P St S St St St P P S P St P P nbsp In Form einer Bimatrix 4 sieht das Spiel dann folgendermassen aus Auszahlungsmatrix fur Spieler 1 und Spieler 2 Schere Stein PapierSchere 0 0 1 1 1 1Stein 1 1 0 0 1 1Papier 1 1 1 1 0 0In der vereinfachten Matrixdarstellung sieht Schere Stein Papier dann so aus S S t P S 0 1 1 S t 1 0 1 P 1 1 0 also die Matrix B 0 1 1 1 0 1 1 1 0 displaystyle begin array c rrr amp S amp St amp P hline S amp 0 amp 1 amp 1 St amp 1 amp 0 amp 1 P amp 1 amp 1 amp 0 end array quad text also die Matrix quad B left begin array rrr 0 amp 1 amp 1 1 amp 0 amp 1 1 amp 1 amp 0 end array right nbsp Weitere Beispiele C D Bearbeiten Fur die weitere Diskussion sollen noch die folgenden beiden Spiele C und D eingefuhrt werden Bei Beispiel C sehen wir ein Nullsummenspiel das ein Nash Gleichgewicht in reinen Strategien enthalt welches in der Rubrik Losungskonzepte gelost wird D ist das Spiel Matching Pennies bei dem gemischte Strategien gewahlt werden konnen Auch Spiel C wird zunachst als Bimatrix und dann als Matrix angegeben Auszahlungsmatrix fur Spieler 1 und Spieler 2 Links Mitte RechtsOben 2 2 0 0 3 3Unten 3 3 2 2 4 4l m r o 2 0 3 u 3 2 4 also C 2 0 3 3 2 4 displaystyle begin array c rrr amp l amp m amp r hline o amp 2 amp 0 amp 3 u amp 3 amp 2 amp 4 end array quad text also quad C left begin array rrr 2 amp 0 amp 3 3 amp 2 amp 4 end array right nbsp Das Beispiel D zeigt ein Spiel bei dem die Strategiemengen der Spieler nicht endlich sind es handelt sich hier bei den Strategiemengen der Spieler um das Einheitsintervall 0 1 displaystyle 0 1 nbsp also ein Kontinuum D G S 1 S 2 u displaystyle Gamma S 1 S 2 u nbsp mit S 1 S 2 0 1 displaystyle S 1 S 2 0 1 nbsp und u 0 1 0 1 R u s 1 s 2 2 s 1 1 2 s 2 1 displaystyle u 0 1 times 0 1 rightarrow mathbb R u s 1 s 2 2s 1 1 2s 2 1 nbsp Gleichgewichtskonzepte BearbeitenDie Gleichgewichtskonzepte werden hier nur fur Zwei Personen Nullsummenspiele definiert Nash Gleichgewicht Bearbeiten Ein zentraler Begriff der Spieltheorie ist die beste Reaktion eines Spielers auf eine gegnerische Strategiekombination Im 2 Personen Spiel ist dies die Antwort auf die Frage mit welcher Strategie ein Spieler seine Auszahlung maximiert wenn die gegnerische Strategie vorgegeben ist Die Reaktionsfunktion oder auch Reaktionskorrespondenz eines Spielers gibt also fur jede gegnerische Strategie an was die beste strategische Antwort darauf ist der Begriff Reaktionskorrespondenz ist die Menge aller besten Antworten auf die gegnerische Strategie Definition Die Reaktionskorrespondenz R 1 s 2 displaystyle R 1 s 2 nbsp von Spieler 1 auf Spieler 2 ist die mengenwertige Funktion R 1 s 2 argmax s 1 S 1 u 1 s 1 s 2 displaystyle R 1 s 2 text argmax s 1 in S 1 u 1 s 1 s 2 nbsp Man beachte dass bei der vereinfachten Darstellung in der Definition einer besten Reaktion fur Spieler 2 minimiert statt maximiert wird Definition Die Reaktionskorrespondenz R 2 s 1 displaystyle R 2 s 1 nbsp von Spieler 2 auf Spieler 1 ist die mengenwertige Funktion R 2 s 1 argmin s 2 S 2 u s 1 s 2 displaystyle R 2 s 1 text argmin s 2 in S 2 u s 1 s 2 nbsp Unter einem Nash Gleichgewicht versteht man eine Strategienkombination bei der jeder Spieler seine Auszahlung fur die gegebene Strategie des Gegners maximiert also jeder Spieler eine beste Reaktion auf den Gegner spielt Fur ein Zwei Personen Nullsummenspiel in Normalform bedeutet dies folgendes Definition Die Strategiekombination s 1 s 2 displaystyle s 1 s 2 nbsp ist ein Nash Gleichgewicht wenn gilt s 1 argmax s 1 S 1 u 1 s 1 s 2 und s 2 argmax s 2 S 2 u 2 s 1 s 2 displaystyle s 1 in text argmax s 1 in S 1 quad u 1 s 1 s 2 quad text und quad s 2 in text argmax s 2 in S 2 quad u 2 s 1 s 2 nbsp Die Definition verandert sich fur die vereinfachte Darstellung S 1 S 2 u displaystyle S 1 S 2 u nbsp zu Definition Die Strategiekombination s 1 s 2 displaystyle s 1 s 2 nbsp ist ein Nash Gleichgewicht wenn gilt s 1 argmax s 1 S 1 u s 1 s 2 und s 2 argmin s 2 S 2 u s 1 s 2 displaystyle s 1 in text argmax s 1 in S 1 quad u s 1 s 2 quad text und quad s 2 in text argmin s 2 in S 2 quad u s 1 s 2 nbsp Minimax Bearbeiten Man kann auch unterstellen dass die Spieler im Wesentlichen daran interessiert sind den Gewinn ihres Gegners moglichst gering zu halten Fur Spieler 1 bedeutet dies dass er eine Strategie mit folgender Definition wahlt Definition Die Strategie s 1 displaystyle s 1 nbsp ist eine Minimax Strategie fur Spieler 1 wenn gilt s 1 argmin s 1 S 1 max s 2 S 2 u 2 s 1 s 2 displaystyle textstyle s 1 in text argmin s 1 in S 1 max s 2 in S 2 quad u 2 s 1 s 2 nbsp In der vereinfachten Darstellung S 1 S 2 u displaystyle S 1 S 2 u nbsp wird daraus Definition Die Strategie s 1 displaystyle s 1 nbsp ist eine Minimax Strategie fur Spieler 1 wenn gilt s 1 argmax s 1 S 1 min s 2 S 2 u s 1 s 2 displaystyle textstyle s 1 in text argmax s 1 in S 1 min s 2 in S 2 quad u s 1 s 2 nbsp Dies erklart warum die Begriffe Minimax und Maximin Strategie Min Max Theorem in der Literatur nicht einheitlich verwendet werden Eine Minimax Strategie im Sinne der hier gegebenen Definition wird auch als Strategie schlimmstmoglicher Bestrafung bezeichnet Spieler 1 kann also durch eine Minimax Strategie sicherstellen dass Spieler 2 hochstens max s 1 S 1 min s 2 S 2 u s 1 s 2 displaystyle textstyle max s 1 in S 1 min s 2 in S 2 quad u s 1 s 2 nbsp erhalt Da es sich um ein Nullsummenspiel handelt bedeutet dies dass Spieler 1 also mindestens V 1 max s 1 S 1 min s 2 S 2 u s 1 s 2 displaystyle textstyle V 1 max s 1 in S 1 min s 2 in S 2 quad u s 1 s 2 nbsp gewinnt Fur Spieler 2 gilt bei Anwendung einer Minimax Strategie dass er mit einer Minimax Strategie den Gewinn von Spieler 1 auf V 2 min s 2 S 2 max s 1 S 1 u s 1 s 2 displaystyle textstyle V 2 min s 2 in S 2 max s 1 in S 1 quad u s 1 s 2 nbsp beschranken kann Es gilt also V 1 V 2 displaystyle V 1 leq V 2 nbsp 5 Falls V 1 V 2 displaystyle V 1 V 2 nbsp gilt so spricht man von einem Gleichgewicht in Minimax Strategien Maximin Bearbeiten Sind die Spieler sehr pessimistisch so gehen sie davon aus dass es bei jeder Strategie die sie wahlen zum fur sie ungunstigsten Ergebnis kommt Sie sollten dann versuchen dieses Minimalergebnis zu optimieren Dies fuhrt zu folgender Definition Definition Die Strategie s 1 displaystyle s 1 nbsp ist eine Maximin Strategie fur Spieler 1 wenn gilt s 1 argmax s 1 S 1 min s 2 S 2 u 1 s 1 s 2 displaystyle textstyle s 1 in text argmax s 1 in S 1 min s 2 in S 2 quad u 1 s 1 s 2 nbsp In der vereinfachten Darstellung S 1 S 2 u displaystyle S 1 S 2 u nbsp wird daraus Definition Die Strategie s 1 displaystyle s 1 nbsp ist eine Maximin Strategie fur Spieler 1 wenn gilt s 1 argmax s 1 S 1 min s 2 S 2 u s 1 s 2 displaystyle textstyle s 1 in text argmax s 1 in S 1 min s 2 in S 2 quad u s 1 s 2 nbsp Vergleicht man die zweite Definitionsvariante mit der Definition einer Minimax Strategie so erkennt man dass bei Zwei Personen Nullsummenspielen kein Unterschied besteht Die Definitionen von V 1 displaystyle V 1 nbsp V 2 displaystyle V 2 nbsp und der Gleichgewichtsbegriff ubertragen sich ebenfalls und stimmen mit den unter Minimax eingefuhrten Begriffen uberein von einem Gleichgewicht in Maximin Strategien spricht man also nur falls V V 1 V 2 displaystyle V V 1 V 2 nbsp Wenn ein Gleichgewicht vorliegt so bezeichnet man mit V V 1 V 2 displaystyle V V 1 V 2 nbsp den Wert des Spiels V displaystyle V nbsp ist der Gewinn fur Spieler 1 und der Verlust fur Spieler 2 wenn sie das Spiel durchfuhren die Bezeichnung Wert des Spiels bezieht sich auf die Sicht von Spieler 1 Allgemein nennt man V 1 displaystyle V 1 nbsp unteren Spielwert und V 2 displaystyle V 2 nbsp oberen Spielwert des Spiels 6 Die Tatsache dass bei Zwei Personen Nullsummenspielen kein Unterschied zwischen Minimax und Maximin Strategien besteht verbunden mit der Tatsache dass einige Autoren die Reihenfolge der Anwendung der Optimierungsoperatoren andere Autoren jedoch die Reihenfolge im Schriftbild fur massgeblich halten und nicht zuletzt dass statt einer Gewinnauszahlung auch gerne eine Verlustfunktion als Spielergebnis verwendet wird fuhrt dazu dass man sich auf die Bedeutung der Begriffe Minimax und Maximin nicht verlassen kann Entscheidend ist vielmehr ob die Strategiewahl auf der schlimmstmoglichen Bestrafung des Gegners oder auf der Minimierung des eigenen Maximalverlusts beruht Im Bereich der Zwei Personen Nullsummenspiele ist diese Unterscheidung aber belanglos Zusammenhang zwischen den Konzepten Bearbeiten Die enge Beziehung zwischen Minimax und Maximin Gleichgewichten bei Zwei Personen Nullsummenspielen ergibt sich bereits aus den Definitionen Es gilt aber sogar der folgende Satz der die Aquivalenz aller drei Konzepte sichert Satz In einem Zwei Personen Nullsummenspiel S 1 S 2 u displaystyle S 1 S 2 u nbsp stimmen die Mengen der Nash Gleichgewichte der Gleichgewichte in Minimax Strategien und der Gleichgewichte in Maximin Strategien uberein Die Voraussetzung dass es sich um ein Zwei Personen Nullsummenspiel handelt ist dabei entscheidend Im Allgemeinen fallen bereits die Begriffe beste Reaktion Minimax Strategie und Maximin Strategie nicht zusammen Fur die konkrete Berechnung von Gleichgewichten in 2 Personen Nullsummenspielen bedeutet der Satz dass es genugt die Gleichgewichte nach einem beliebigen der drei Konzepte zu ermitteln Losungskonzepte BearbeitenEndliche Strategiemengen Bearbeiten Bei endlicher Strategiemenge lassen sich die besten Reaktionen Minimax und Maximin Strategien durch Ausprobieren finden Anschliessend kann man ebenfalls durch Ausprobieren feststellen ob es sich um ein Gleichgewicht handelt In Beispiel C gilt S 1 o u displaystyle S 1 o u nbsp und S 2 l m r displaystyle S 2 l m r nbsp In der Matrix wird die beste Reaktion von Spieler 1 auf Spieler 2 durch eine Unterstreichung die beste Reaktion von Spieler 2 auf Spieler 1 durch einen Strich uber der Zahl gekennzeichnet Falls also Spieler 1 o spielt sollte Spieler 2 mit r antworten daher erhalt die 3 displaystyle 3 nbsp eine Uberstreichung Das Matrixfeld u m displaystyle u m nbsp ist gleichzeitig beste Reaktion fur beide Spieler und somit ein Nash Gleichgewicht Da es keine weiteren derartigen Matrixfelder gibt handelt es sich bei u m displaystyle u m nbsp um das einzige Nash Gleichgewicht dieses Spiels Im Nash Gleichgewicht erhalt Spieler 1 eine Auszahlung von 2 displaystyle 2 nbsp Spieler 2 eine Auszahlung von 2 displaystyle 2 nbsp C l m r o 2 0 3 u 3 2 4 displaystyle begin array c rrr C amp l amp m amp r hline o amp 2 amp 0 amp overline 3 u amp underline 3 amp overline underline 2 amp underline 4 end array nbsp Bei Matching Pennies A sehen die besten Reaktionen so aus A K Z K 1 1 Z 1 1 displaystyle begin array c rr A amp K amp Z hline K amp underline 1 amp overline 1 Z amp overline 1 amp underline 1 end array nbsp Keine der Strategiekombinationen stellt ein Nash Gleichgewicht dar da nie beide eine beste Reaktion auf die gegnerische Strategie spielen Zur Ermittlung der Maximin Strategien fur Spieler 1 bestimmt man zunachst die Zeilenminima ZMin siehe letzte Spalte A K Z Z M i n K 1 1 1 Z 1 1 1 displaystyle begin array c rr c A amp K amp Z amp ZMin hline K amp 1 amp 1 amp 1 Z amp 1 amp 1 amp 1 end array nbsp Beide Zeilenminima sind gleich gross so dass sowohl K als auch Z eine Maximin Strategie fur Spieler 1 darstellen Es gilt V 1 1 displaystyle V 1 1 nbsp Spieler 1 kann also sicherstellen dass er nicht mehr als 1 verliert Fur Spieler 2 mussen analog die Spaltenmaxima SpMax ermittelt werden A K Z K 1 1 Z 1 1 S p M a x 1 1 displaystyle begin array c rr A amp K amp Z hline K amp 1 amp 1 Z amp 1 amp 1 hline SpMax amp 1 amp 1 end array nbsp Auch fur ihn sind beide Strategien Maximin Strategien es gilt V 2 1 displaystyle V 2 1 nbsp Nun ist aber V 2 gt V 1 displaystyle V 2 gt V 1 nbsp so dass auch kein Gleichgewicht in Maximin Strategien vorliegt Bei Schere Stein Papier liegen ahnliche Verhaltnisse wie bei Matching Pennies vor B S S t P Z M i n S 0 1 1 1 S t 1 0 1 1 P 1 1 0 1 S p M a x 1 1 1 displaystyle begin array c rrr c B amp S amp St amp P amp ZMin hline S amp 0 amp overline 1 amp underline 1 amp 1 St amp underline 1 amp 0 amp overline 1 amp 1 P amp overline 1 amp underline 1 amp 0 amp 1 hline SpMax amp 1 amp 1 amp 1 amp end array nbsp Auch die Bestimmung der Maximin Strategien fuhrt wieder zu dem Ergebnis dass fur jeden Spieler jede seiner Strategien eine Maximin Strategie ist es gilt auch hier 1 V 2 gt V 1 1 displaystyle 1 V 2 gt V 1 1 nbsp Matching Pennies und Schere Stein Papier haben also kein Gleichgewicht in der Menge der vorgegebenen Strategiekombinationen Um dieses Manko zu beheben fuhrt man gemischte Strategien ein Gemischte Strategien Bearbeiten Definition Unter einer gemischten Strategie fur Spieler 1 in einem Spiel S 1 S 2 u displaystyle S 1 S 2 u nbsp versteht man eine Wahrscheinlichkeitsverteilung uber der Strategienmenge S 1 displaystyle S 1 nbsp Lasst man fur beide Spieler gemischte Strategien zu so entsteht ein erweitertes Nullsummenspiel bei dem jeder Spieler die Wahrscheinlichkeiten fur seine Strategien wahlt Zur besseren Unterscheidung bezeichnet man die Strategien aus S 1 displaystyle S 1 nbsp bzw S 2 displaystyle S 2 nbsp als reine Strategien der Spieler Es handelt sich hierbei um besondere gemischte Strategien bei denen eine Strategie aus S i displaystyle S i nbsp die Wahrscheinlichkeit 1 tragt Mochte man betonen dass keine Strategie die Wahrscheinlichkeit 1 tragt so spricht man von einer echt gemischten Strategie Als Auszahlung u displaystyle u nbsp fur das erweiterte Nullsummenspiel nimmt man den Erwartungswert der sich ergibt wenn man davon ausgeht dass die Wahrscheinlichkeitsverteilungen der Spieler unabhangig sind Fur Matching Pennies fuhrt dies zu folgender Erweiterung auf gemischte Strategien Es sei s i 0 1 displaystyle s i in 0 1 nbsp die Wahrscheinlichkeit dass Spieler i displaystyle i nbsp Kopf wahlt Bei Unabhangigkeit ergeben sich dann die folgenden Wahrscheinlichkeiten fur die verschiedenen Strategiekombinationen P s 1 s 2 K Z K s 1 s 2 s 1 1 s 2 Z 1 s 1 s 2 1 s 1 1 s 2 displaystyle begin array c c c hline P s 1 s 2 amp K amp Z hline hline K amp s 1 s 2 amp s 1 1 s 2 hline Z amp 1 s 1 s 2 amp 1 s 1 1 s 2 hline end array nbsp Als Erwartungswert U displaystyle U nbsp fur die Auszahlung erhalt man dann U s 1 s 2 s 1 s 2 1 s 1 1 s 2 1 1 s 1 s 2 1 1 s 1 1 s 2 1 2 s 1 1 2 s 2 1 displaystyle U s 1 s 2 s 1 s 2 cdot 1 s 1 1 s 2 cdot 1 1 s 1 s 2 cdot 1 1 s 1 1 s 2 cdot 1 2s 1 1 2s 2 1 nbsp Vergleicht man dies mit Beispiel D so sieht man dass B gerade die Erweiterung von Matching Pennies auf gemischte Strategien darstellt u U displaystyle u U nbsp Bezeichnet man allgemein die Wahrscheinlichkeiten die Spieler 1 fur seine reinen Strategien aus S 1 s 1 1 s 1 2 s 1 m displaystyle S 1 s 1 1 s 1 2 s 1 m nbsp wahlt mit x x 1 x 2 x m T displaystyle x x 1 x 2 x m T nbsp und ebenso die Wahrscheinlichkeiten fur Spieler 2 mit y y 1 y 2 y n T displaystyle y y 1 y 2 y n T nbsp so lasst sich U E u displaystyle U E u nbsp als Matrizenprodukt schreiben A displaystyle A nbsp bezeichnet hierbei die Auszahlungsmatrix des Spiels U x T A y displaystyle U x T Ay nbsp Um eine beste Reaktion von Spieler 1 auf die gemischte Strategie y y 1 y 2 y n T displaystyle y y 1 y 2 y n T nbsp von Spieler 2 zu finden muss also das lineare Optimierungsproblemargmax x R m x T A y displaystyle text argmax x in mathbb R m quad x T Ay nbsp unter der Nebenbedingung i 1 m x i 1 x i 0 displaystyle textstyle sum i 1 m x i 1 x i geq 0 nbsp gelost werden Umgekehrt findet man eine beste Reaktion von Spieler 2 auf die gemischte Strategie x x 1 x 2 x m T displaystyle x x 1 x 2 x m T nbsp von Spieler 1 indem man folgendes lineare Optimierungsproblem lost argmin y R n x T A y displaystyle text argmin y in mathbb R n quad x T Ay nbsp j 1 n y j 1 y j 0 displaystyle textstyle sum j 1 n y j 1 y j geq 0 nbsp Eine Maximin Strategie bei Zwei Personen Nullsummenspielen aquivalent zur Minimax Strategie fur Spieler 1 findet man indem man folgendes Optimierungsproblem lost argmax x R m min y R n x T A y displaystyle text argmax x in mathbb R m quad text min y in mathbb R n quad x T Ay nbsp unter der Nebenbedingung i 1 m x i 1 x i 0 j 1 n y j 1 y j 0 displaystyle textstyle sum i 1 m x i 1 x i geq 0 sum j 1 n y j 1 y j geq 0 nbsp 7 Umgekehrt muss man fur eine Maximin Strategie von Spieler 2 folgendes Optimierungsproblem losen argmin y R n max x R m x T A y displaystyle text argmin y in mathbb R n quad text max x in mathbb R m quad x T Ay nbsp unter der Nebenbedingung i 1 m x i 1 x i 0 j 1 n y j 1 y j 0 displaystyle textstyle sum i 1 m x i 1 x i geq 0 sum j 1 n y j 1 y j geq 0 nbsp Die Existenz von Gleichgewichten nach der Erweiterung auf gemischte Strategien wird durch das folgende Minimax Theorem von John von Neumann 1928 sichergestellt Satz Es sei A displaystyle A nbsp eine reelle m n displaystyle m times n nbsp Matrix Dann existiert ein Tripel x y V displaystyle x y V nbsp so dass x T A y V y displaystyle x T Ay geq V quad forall y nbsp und x T A y V x displaystyle x T Ay leq V quad forall x nbsp 8 Hierbei stehen x displaystyle x nbsp bzw x displaystyle x nbsp fur Wahrscheinlichkeitsverteilungen uber die m displaystyle m nbsp Zeilen von A displaystyle A nbsp y displaystyle y nbsp bzw y displaystyle y nbsp fur Wahrscheinlichkeitsverteilungen uber die n displaystyle n nbsp Spalten von A displaystyle A nbsp Damit hat jedes Zwei Personen Nullsummenspiel mit endlichen Strategiemengen fur beide Spieler mindestens ein Gleichgewicht in gemischten Strategien Jede gleichgewichtige bzw Minimax oder Maximin Strategie eines Spielers bildet mit jeder gleichgewichtigen bzw Minimax oder Maximin Strategie des anderen Spielers in der Erweiterung des Spiels auf gemischte Strategien ein Gleichgewicht Beispiele Fortsetzung Bearbeiten Matching Pennies Bearbeiten Es sollen nun fur Matching Pennies A die Maximin Strategien fur Spieler 1 in gemischten Strategien ermittelt werden Zunachst muss fur jede vorgegebene Strategie s 1 displaystyle overline s 1 nbsp von Spieler 1 seine minimale Auszahlung bestimmt werden die sich durch optimales Verhalten von Spieler 2 ergibt min s 2 0 1 u s 1 s 2 displaystyle text min s 2 in 0 1 quad u overline s 1 s 2 nbsp Es gilt u s 1 s 2 s 1 s 2 s 1 1 s 2 1 s 1 s 2 1 s 1 1 s 2 1 2 s 1 4 s 1 2 s 2 displaystyle u overline s 1 s 2 overline s 1 s 2 overline s 1 1 s 2 1 overline s 1 s 2 1 overline s 1 1 s 2 1 2 overline s 1 4 overline s 1 2 s 2 nbsp Fur die Minimierung bezuglich s 2 displaystyle s 2 nbsp kommt es nur darauf an ob der Ausdruck 4 s 1 2 displaystyle 4 overline s 1 2 nbsp in der letzten Klammer positiv Null oder negativ ist Dieser Ausdruck ist positiv falls s 1 gt 1 2 displaystyle textstyle overline s 1 gt frac 1 2 nbsp Dann wird das Minimum fur s 2 0 displaystyle s 2 0 nbsp erreicht und betragt 1 2 s 1 displaystyle 1 2 overline s 1 nbsp Der Ausdruck in der Klammer ist negativ falls s 1 lt 1 2 displaystyle textstyle overline s 1 lt frac 1 2 nbsp Dann wird das Minimum fur s 2 1 displaystyle s 2 1 nbsp erreicht und betragt 1 2 s 1 displaystyle 1 2 overline s 1 nbsp Der Ausdruck in der Klammer ist Null falls s 1 1 2 displaystyle textstyle overline s 1 frac 1 2 nbsp s 2 displaystyle s 2 nbsp hat dann keinen Einfluss auf das Minimum u s 1 s 2 displaystyle u overline s 1 s 2 nbsp ist dann unabhangig von s 2 displaystyle s 2 nbsp immer 0 nbsp GrafikDamit lasst sich min s 2 0 1 u s 1 s 2 displaystyle text min s 2 in 0 1 quad u overline s 1 s 2 nbsp wie folgt schreiben U min s 1 min s 2 0 1 u s 1 s 2 1 2 s 1 fur s 1 lt 1 2 1 2 s 1 fur s 1 1 2 displaystyle textstyle U min overline s 1 text min s 2 in 0 1 quad u overline s 1 s 2 begin cases 1 2 overline s 1 amp text fur overline s 1 lt frac 1 2 1 2 overline s 1 amp text fur overline s 1 geq frac 1 2 end cases nbsp Somit erhalt man fur die Bestimmung der Maximin Strategie fur Spieler 1 folgendes Optimierungsproblem argmax s 1 0 1 min s 2 0 1 u s 1 s 2 argmax s 1 0 1 U min s 1 displaystyle textstyle text argmax s 1 in 0 1 min s 2 in 0 1 u s 1 s 2 text argmax s 1 in 0 1 U min s 1 nbsp U min displaystyle U min nbsp ist streng monoton steigend auf dem Intervall 0 1 2 displaystyle textstyle left 0 frac 1 2 right nbsp und streng monoton fallend auf dem Intervall 1 2 1 displaystyle textstyle left frac 1 2 1 right nbsp das Maximum von U min displaystyle U min nbsp liegt also bei s 1 1 2 displaystyle textstyle s 1 frac 1 2 nbsp Dies ist also die eindeutige Maximin Strategie fur Spieler 1 in gemischten Strategien Aus Symmetriegrunden gibt es auch nur eine Maximin Strategie fur Spieler 2 namlich s 2 1 2 displaystyle textstyle s 2 frac 1 2 nbsp Der Wert des Spiels betragt V 0 displaystyle V 0 nbsp Aufgrund des Aquivalenzsatzes ist dies auch das einzige Nash Gleichgewicht und auch das einzige Gleichgewicht in Minimax Strategien Schere Stein Papier Bearbeiten Fur Schere Stein Papier argumentiert man wie folgt Falls Spieler 1 nicht alle drei reinen Strategien mit der gleichen Wahrscheinlichkeit spielt so kann Spieler 2 durch Wahl einer geeigneten Strategie dafur sorgen dass die erwartete Auszahlung von Spieler 1 negativ wird Es sei zum Beispiel p 1 P S P S t P P p 3 displaystyle p 1 P S geq P St geq P P p 3 nbsp wobei mindestens eine der Ungleichungen strikt ist Insbesondere ist dann p 1 gt p 3 displaystyle p 1 gt p 3 nbsp Wenn Spieler 2 jetzt Stein spielt so ist die erwartete Auszahlung von Spieler 1 E u p 1 1 p 3 1 p 3 p 1 lt 0 displaystyle Eu p 1 cdot 1 p 3 cdot 1 p 3 p 1 lt 0 nbsp Wahlt Spieler 1 hingegen alle drei Wahrscheinlichkeiten gleich 1 3 displaystyle textstyle frac 1 3 nbsp also x T 1 3 1 3 1 3 displaystyle textstyle x T begin pmatrix frac 1 3 amp frac 1 3 amp frac 1 3 end pmatrix nbsp so ist seine erwartete Auszahlung 0 fur jede gemischte Strategie von Spieler 2 Seine erwartete Auszahlung ist dann namlich E u x T A y x T A y 1 3 1 3 1 3 0 1 1 1 0 1 1 1 0 y 1 y 2 y 3 0 0 0 y 1 y 2 y 3 0 displaystyle textstyle operatorname E u x T Ay x T A y left begin pmatrix frac 1 3 amp frac 1 3 amp frac 1 3 end pmatrix begin pmatrix 0 amp 1 amp 1 1 amp 0 amp 1 1 amp 1 amp 0 end pmatrix right begin pmatrix y 1 y 2 y 3 end pmatrix begin pmatrix 0 amp 0 amp 0 end pmatrix begin pmatrix y 1 y 2 y 3 end pmatrix 0 nbsp Falls die Wahrscheinlichkeiten bei Spieler 1 auf Schere Stein und Papier in anderer Grossenreihenfolge verteilt sind so gilt eine analoge Argumentation falls Spieler 2 die Strategie mit der mittleren Wahrscheinlichkeit spielt Zu jeder von x T 1 3 1 3 1 3 displaystyle textstyle x T begin pmatrix frac 1 3 amp frac 1 3 amp frac 1 3 end pmatrix nbsp verschiedenen Strategie existiert also eine Strategie von Spieler 2 die Spieler 1 eine negative Auszahlung liefert Somit ist x T 1 3 1 3 1 3 displaystyle textstyle x T begin pmatrix frac 1 3 amp frac 1 3 amp frac 1 3 end pmatrix nbsp die eindeutige Maximin Strategie von Spieler 1 Aus Symmetriegrunden gilt das auch fur Spieler 2 Damit ist diese Strategiekombination das einzige gemischte Gleichgewicht und der Wert des Spiels ist V 0 displaystyle V 0 nbsp Literatur BearbeitenAvinash K Dixit Barry J Nalebuff Spieltheorie fur Einsteiger Schaffer Poeschl Stuttgart 1997 ISBN 3 7910 1239 8 Christian Rieck Spieltheorie Eine Einfuhrung Christian Rieck Verlag 1993 S 102 104 Diether Coenen Quasi Nullsummenspiele und dominierte Gleichgewichtspunkte in Bimatrix Spielen Westdeutscher Verlag 1967 G Owen Spieltheorie Springer Verlag 1971 Morton D Davis Spieltheorie fur Nichtmathematiker Oldenbourg Verlag 1993 S 15 35 doi 10 1524 9783486836103 Burkhard Rauhut Norbert Schmitz Ernst Wilhelm Zachow Spieltheorie Teubner Stuttgart 1979 ISBN 3 519 02351 2 Sylvain Sorin A First Course on zero sum Repeated Games Springer 2002 Thomas Riechmann Spieltheorie Verlag Franz Vahlen 2002 S 63 67 Werner Krabs Spieltheorie Teubner Wiesbaden 2005 Einzelnachweise Bearbeiten G Owen Spieltheorie Springer Verlag 1971 S 11 Manfred J Holler Gerhard Illing Einfuhrung in die Spieltheorie Springer 2008 ISBN 978 3 540 69372 7 S 4 Sylvain Sorin A First Course on Zero Sum Repeated Games Springer Verlag Berlin Heidelberg 2002 S 151 Christian Rieck Spieltheorie Eine Einfuhrung Christian Rieck Verlag 1993 S 80 G Owen Spieltheorie Springer Verlag 1971 S 17 B Rauhut N Schmitz E W Zachow Spieltheorie Teubner Stuttgart 1979 S 138 G Owen Spieltheorie Springer Verlag Berlin Heidelberg New York 1997 S 16 Sylvain Sorin A First Course on Zero Sum Repeated Games Springer Verlag Berlin Heidelberg New york S 154 Abgerufen von https de wikipedia org w index php title Zwei Personen Nullsummenspiel amp oldid 228971214