www.wikidata.de-de.nina.az
Die lineare Optimierung wird im Rahmen der Spieltheorie zur Ermittlung optimal gemischter Strategien genutzt Das Verfahren ist insbesondere bei sehr komplizierten Nullsummenspielen anwendbar und garantiert daruber hinaus bei Spielen mit mehr als zwei Personen und einer Vielzahl moglicher Strategien die Ermittlung von Gleichgewichten 1 Inhaltsverzeichnis 1 Vorgehen 2 Beispiel 3 Belege 4 LiteraturVorgehen BearbeitenZweipersonenspiele die eine endliche Spieldauer aufweisen konnen nach John von Neumann und Oskar Morgenstern auf folgende Normalform gebracht werden 2 S1 S2 displaystyle ldots nbsp Sn 1 SnZ1 a1 1 a1 2 displaystyle ldots nbsp a1 n 1 a1 nZ2 a2 1 a2 2 displaystyle ldots nbsp a2 n 1 a2 n displaystyle vdots nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle ddots nbsp displaystyle vdots nbsp displaystyle vdots nbsp Zm 1 am 1 1 am 1 2 displaystyle ldots nbsp am 1 n 1 am 1 nZm am 1 am 2 displaystyle ldots nbsp am n 1 am nDie Menge Z 1 Z m displaystyle Z 1 ldots Z m nbsp sind die Strategien des Zeilenspielers Z Die Menge S 1 S n displaystyle S 1 ldots S n nbsp sind die Strategien des Spaltenspielers S Die Auszahlungsmatrix mit den Werten a i j i 1 m j 1 n displaystyle a i j i 1 ldots m j 1 ldots n nbsp beschreibt samtliche Auszahlungen des Zeilenspielers Wenn in Nullsummenspielen der Zeilenspieler die reine Strategie 1 wahlt und der Spaltenspieler die reine Strategie 1 so bekommt Z die Auszahlung a 1 1 displaystyle a 1 1 nbsp und S die Auszahlung a 1 1 displaystyle a 1 1 nbsp Nach dem Min Max Theorem sollten beide Spieler ihre Strategie so wahlen dass die eigenen maximalen Verluste minimiert werden Kann mit Hilfe des Min Max Kriteriums kein Sattelpunkt und damit keine fur jeden Spieler optimale reine Strategie ermittelt werden empfiehlt es sich die jeweiligen Strategien zu mischen Um die eigenen Auszahlungen zu maximieren muss die Auswahl der Strategien zufallig mit bestimmten Wahrscheinlichkeiten erfolgen 3 Wurfelt ein Spieler seine Strategie gemass dieser Wahrscheinlichkeitsverteilung zufallig aus ist ihm die bestmogliche Gewinnerwartung sicher die er haben kann wenn er seine Strategie unabhangig von der seines Gegners wahlt Die Wahrscheinlichkeiten mit der Z die Strategien Z i i 1 m displaystyle Z i i 1 ldots m nbsp wahlt werden im Folgenden mit p i p i 0 i 1 m p i 1 displaystyle p i p i geq 0 sum i 1 m p i 1 nbsp und die Wahrscheinlichkeiten mit der S die Strategien S j j 1 n displaystyle S j j 1 ldots n nbsp spielt mit q j q j 0 j 1 n q j 1 displaystyle q j q j geq 0 sum j 1 n q j 1 nbsp bezeichnet Mit der Verteilung der Wahrscheinlichkeiten p displaystyle p nbsp uber Z 1 Z m displaystyle Z 1 ldots Z m nbsp erhalt Z seine gemischte Strategie und mit der Verteilung der Wahrscheinlichkeiten q displaystyle q nbsp uber S 1 S n displaystyle S 1 ldots S n nbsp erhalt S seine gemischte Strategie Der erwartete Gewinn E displaystyle E nbsp des Zeilenspielers ergibt sich folgendermassen E p q i 1 m j 1 n p i q j a i j displaystyle operatorname E p q sum i 1 m sum j 1 n p i q j a ij nbsp Umgekehrt verliert der Spaltenspieler genau diesen Erwartungswert Fur das weitere Vorgehen ist es notwendig das Min Max Theorem und dessen Idee auf gemischte Strategien auszuweiten Es gilt diejenige gemischte Strategie zu spielen die das Minimum des erwarteten Gewinns maximiert bzw das Maximum des erwarteten Verlustes minimiert 4 Anders ausgedruckt stellen a displaystyle a nbsp die obere Auszahlungsschranke des Zeilenspielers und a displaystyle a nbsp die untere Auszahlungsschranke des Spaltenspielers dar a m a x p m i n S j E p S j displaystyle a underset p mathrm max underset S j mathrm min operatorname E p S j nbsp a m i n q m a x Z i E q Z i displaystyle a underset q mathrm min underset Z i mathrm max operatorname E q Z i nbsp Der Maximierungsspieler Z findet seine optimale Strategie p 0 displaystyle p 0 nbsp durch die Losung des folgenden Problems maximiere a displaystyle a nbsp so dass a i 1 m a i j p i j 1 n displaystyle a leq sum i 1 m a ij p i qquad j 1 ldots n nbsp und i 1 m p i 1 displaystyle sum i 1 m p i 1 nbsp undp i 0 i 1 m displaystyle quad p i geq 0 qquad i 1 ldots m nbsp Der Minimierungsspieler S hat auf der Suche nach der optimalen Strategie q 0 displaystyle q 0 nbsp folgendes Problem zu losen minimiere a displaystyle a nbsp so dass a j 1 n a i j q j i 1 m displaystyle a geq sum j 1 n a ij q j qquad i 1 ldots m nbsp und j 1 n q j 1 displaystyle sum j 1 n q j 1 nbsp undq j 0 j 1 n displaystyle quad q j geq 0 qquad j 1 ldots n nbsp Gilt a a displaystyle a a nbsp so ergibt sich ein gemischter Wert W displaystyle W nbsp Diesen Wert konnen sich beide Spieler nur aufgrund der Kenntnis der Auszahlungsmatrix durch Wahl der gemischten Minimax Strategie p 0 displaystyle p 0 nbsp und q 0 displaystyle q 0 nbsp jederzeit garantieren Es wird vorausgesetzt dass der Wert des Spiels W displaystyle W nbsp grosser 0 ist Dies ist immer dann gesichert wenn die Auszahlungsmatrix nur positive Elemente enthalt Wenn dies nicht der Fall ist kann es durch die Addition einer genugend grossen einheitlichen Konstante erreicht werden Nach Beendigung der Rechnung wird diese Konstante wieder abgezogen Die Einfuhrung der neuen Variablen x i p i a i 1 m displaystyle x i frac p i a i 1 ldots m nbsp und y j q j a j 1 n displaystyle y j frac q j a j 1 ldots n nbsp fuhrt durch Einsetzen in die oben ermittelten Gleichungen zu den finalen linearen Optimierungsproblemen Fur den Zeilenspieler ergibt sich folgendes Optimierungsproblem L 1 displaystyle L 1 nbsp 1 a i 1 m x i displaystyle frac 1 a sum i 1 m x i nbsp zu minimieren unter den Nebenbedingungen i 1 m a i j x i 1 x i 0 i 1 m j 1 n displaystyle sum i 1 m a ij x i geq 1 qquad x i geq 0 qquad i 1 ldots m j 1 ldots n nbsp Fur den Spaltenspieler ergibt sich folgendes Optimierungsproblem L 2 displaystyle L 2 nbsp 1 a j 1 n y j displaystyle frac 1 a sum j 1 n y j nbsp zu maximieren unter den Nebenbedingungen j 1 n a i j y j 1 y j 0 i 1 m j 1 n displaystyle sum j 1 n a ij y j leq 1 qquad y j geq 0 qquad i 1 ldots m j 1 ldots n nbsp Die Losung der Aufgabe erfolgt uber das Simplex Verfahren Da L 1 displaystyle L 1 nbsp und L 2 displaystyle L 2 nbsp zueinander duale Programme darstellen reicht es aus L 1 displaystyle L 1 nbsp oder L 2 displaystyle L 2 nbsp zu losen um die Strategien fur beide Spieler zu ermitteln Die Ergebnisse fur x i displaystyle x i nbsp und y j displaystyle y j nbsp konnen aus dem entwickelten Simplex Endtableau abgelesen werden und ermoglichen ohne viel Aufwand die Ermittlung des Spielwertes W displaystyle W nbsp und der optimal gemischten Strategien p 0 displaystyle p 0 nbsp und q 0 displaystyle q 0 nbsp Beispiel BearbeitenDas Vorgehen zur Bestimmung der optimal gemischten Strategien soll anhand des Knobelspiels Schere Stein Papier verdeutlicht werden Das Zwei Personen Nullsummenspiel weist folgende Auszahlungsmatrix auf Schere Stein PapierSchere 0 1 1Stein 1 0 1Papier 1 1 0Fur das gegebene Spiel liegt kein Sattelpunkt in reinen Strategien vor Die Losung des Problems erfolgt mit Hilfe der linearen Optimierung und der Ermittlung der Wahrscheinlichkeitsverteilungen Da fur das weitere Vorgehen positive Werte der Auszahlungsmatrix vorausgesetzt werden erfolgt die Addition einer Konstanten Dies fuhrt nicht zu einer Anderung der optimalen Strategien sondern nur zu einer Anderung der Erwartungswerte Nach Losung des Optimierungsproblems muss diese Konstante wieder abgezogen werden In dem gewahlten Beispiel fuhrt die Addition von 2 zu dem gewunschten Ergebnis So entsteht aus der Ausgangsmatrix A 0 1 1 1 0 1 1 1 0 A 2 1 3 3 2 1 1 3 2 displaystyle A begin pmatrix 0 amp 1 amp 1 1 amp 0 amp 1 1 amp 1 amp 0 end pmatrix Rrightarrow A prime begin pmatrix 2 amp 1 amp 3 3 amp 2 amp 1 1 amp 3 amp 2 end pmatrix nbsp Daraus entwickeln sich die folgenden Optimierungsprobleme Zeilenspieler minimiere 1 a i 1 3 x i displaystyle frac 1 a sum i 1 3 x i nbsp so dass 2 x 1 3 x 2 x 3 1 x 1 2 x 2 3 x 3 1 3 x 1 x 2 2 x 3 1 displaystyle begin alignedat 3 2x 1 amp amp 3x 2 amp amp x 3 geq 1 x 1 amp amp 2x 2 amp amp 3x 3 geq 1 3x 1 amp amp x 2 amp amp 2x 3 geq 1 end alignedat nbsp x i 0 i 1 2 3 displaystyle x i geq 0 i 1 2 3 nbsp Spaltenspieler maximiere 1 a j 1 3 y j displaystyle frac 1 a sum j 1 3 y j nbsp so dass 2 y 1 y 2 3 y 3 1 3 y 1 2 y 2 y 3 1 y 1 3 y 2 2 y 3 1 displaystyle begin alignedat 3 2y 1 amp amp y 2 amp amp 3y 3 leq 1 3y 1 amp amp 2y 2 amp amp y 3 leq 1 y 1 amp amp 3y 2 amp amp 2y 3 leq 1 end alignedat nbsp y j 0 j 1 2 3 displaystyle y j geq 0 j 1 2 3 nbsp Die beiden linearen Programme konnen mit Hilfe des Simplex Verfahrens gelost werden Fur das gewahlte Beispiel ergeben sich folgende Werte x 1 x 2 x 3 1 6 y 1 y 2 y 3 1 6 displaystyle x 1 x 2 x 3 frac 1 6 qquad y 1 y 2 y 3 frac 1 6 nbsp Fur 1 a i 1 m x i displaystyle frac 1 a sum i 1 m x i nbsp lasst sich der Wert 1 2 displaystyle frac 1 2 nbsp ermitteln Aufgrund der Beziehungen x i p i a y j q j a displaystyle x i frac p i a quad y j frac q j a nbsp ergeben sich die optimalen Strategien p displaystyle p nbsp und q displaystyle q nbsp p i 2 1 6 1 3 q j 2 1 6 1 3 displaystyle p i 2 cdot frac 1 6 frac 1 3 qquad q j 2 cdot frac 1 6 frac 1 3 nbsp Die optimale gemischte Strategie des Zeilenspielers lautet p i 1 3 1 3 1 3 displaystyle p i left frac 1 3 frac 1 3 frac 1 3 right nbsp Die optimale gemischte Strategie des Spaltenspielers lautet q j 1 3 1 3 1 3 displaystyle q j left frac 1 3 frac 1 3 frac 1 3 right nbsp Der Wert des Spiels mit der Auszahlungsmatrix A displaystyle A prime nbsp betragt a a W 2 displaystyle a a W prime 2 nbsp Fur die Ausgangsmatrix A displaystyle A nbsp ergibt sich der Spielwert durch Subtraktion der Konstanten und damit ist W W 2 0 displaystyle W W prime 2 0 nbsp Gilt fur ein Spiel W 0 displaystyle W 0 nbsp so wird dieses Spiel als fair bezeichnet Die ermittelten optimalen Strategien fur das Spiel A displaystyle A prime nbsp stellen aufgrund der Aquivalenz gleichzeitig optimale Strategien fur das Spiel A displaystyle A nbsp dar 5 Um den optimalen Gewinn zu erlangen mussen beide Spieler jede der moglichen Strategien mit einer Wahrscheinlichkeit von 33 33 spielen und diese damit zufallig gleich oft anwenden 6 Belege Bearbeiten Avinash K Dixit Barry J Nalebuff Spieltheorie fur Einsteiger Strategisches Know how fur Gewinner Schaeffer Poeschel Verlag Stuttgart 1997 S 175 John von Neumann Oskar Morgenstern Spieltheorie und wirtschaftliches Verhalten Physica Verlag Wurzburg 1967 S 93 Hans Jurgen Zimmermann Operations Research Vieweg Teubner Verlag Braunschweig Wiesbaden 2005 S 38 Frederick S Hillier Gerald J Liebermann Operations Research Oldenbourg 1996 S 360 Hans Jurgen Zimmermann Operations Research Vieweg Teubner Verlag Braunschweig Wiesbaden 2005 S 37 Karl Manteuffel Dieter Stumpe Spieltheorie Vieweg Teubner Verlag Leipzig 1997 S 32 Literatur BearbeitenJohn von Neumann Oskar Morgenstern Spieltheorie und wirtschaftliches Verhalten Physica Verlag Wurzburg 1967 Hans Jurgen Zimmermann Operations Research Vieweg Teubner Verlag Braunschweig Wiesbaden 2005 ISBN 978 3528032104 Avinash K Dixit Barry J Nalebuff Spieltheorie fur Einsteiger Strategisches Know how fur Gewinner Schaeffer Poeschel Verlag Stuttgart 1997 ISBN 3 7910 1239 8 Frederick S Hillier Gerald J Liebermann Operations Research Oldenbourg 1996 ISBN 978 3486239874 Karl Manteuffel Dieter Stumpe Spieltheorie Vieweg Teubner Verlag Leipzig 1997 ISBN 978 3322007247 Abgerufen von https de wikipedia org w index php title Lineare Optimierung Spieltheorie amp oldid 231353674