www.wikidata.de-de.nina.az
Das Quantenreaktionsgleichgewicht auch Quantal Response Gleichgewicht genannt englisch Quantal Response Equilibrium kurz QRE ist ein Begriff aus der Spieltheorie Es beschreibt in nicht kooperativen Spielen eine Kombination von Strategien Jeder Spieler wahlt eine Strategie von der aus es fur keinen Spieler sinnvoll ist von seiner gewahlten Strategie abzuweichen obwohl diese nicht wissen ob es sich um die beste der Strategien handelt und Fehler machen Die Strategien der Spieler sind demnach im besten Fall gegenseitig beste Antworten Wenn die Spieler vollstandig rational spielen konvergiert das Quantenreaktionsgleichgewicht zum Nash Gleichgewicht Das Quantenreaktionsgleichgewicht ist ein statistisches Losungskonzept der Spieltheorie Definition und Existenzbeweis des Quantenreaktionsgleichgewichts gehen auf das 1995 veroffentlichte Paper Quantal Response Equilibria for Normal Form Games der Okonomen Richard McKelvey und Thomas Palfrey zuruck Das Quantenreaktionsgleichgewicht findet unter anderem eine zentrale Bedeutung in wirtschaftswissenschaftlichen Bereichen wie der Okonometrie und der statistischen Betrachtung inkonsistenter Spieler zum Beispiel bei Wahlen oder dem Traveler s Dilemma Reisenden Dilemma Das Quantenreaktionsgleichgewicht ist nur fur Spiele mit diskreten Strategien definiert Inhaltsverzeichnis 1 Grundidee 2 Aufbau des Quantenreaktionsgleichgewicht in Normalform 2 1 Verbale Darstellung 2 2 Formale Darstellung 2 2 1 Annahmen 2 2 2 Die Nutzenfunktion der Spieler 2 2 3 Logit Quantenreaktionsgleichgewicht 3 Anwendungen 4 Aufbau des Quantenreaktionsgleichgewichts in Extensivform 4 1 Verbale Darstellung 5 Weblinks 6 Literatur 7 EinzelnachweiseGrundidee BearbeitenSpieler entscheiden sich fur eine Strategie von der sie nicht wissen ob es sich um die beste aller Strategien handelt und sie machen Fehler bei der Auswahl Sie wahlen aus einem diskreten Strategienraum und stellen Vermutungen uber die Wahl der Strategie des Gegenspielers an Diese Vermutung oder Belief bewahrheitet sich in Erwartung Im Gleichgewicht stimmen die Vermutungen uber die Wahl der Strategie des Gegenspielers und die Fehler in der Auswahl sind minimal sodass sich die Auszahlung jedes Spielers maximiert und gewahrleistet dass Fehler keine Auswirkungen auf die Strategienwahl eines Spielers haben Bei perfekt rational handelnden Individuen decken sich statistische Vorhersagen mit der theoretischen Gleichgewichtswahl da niemand Anreiz hat von seiner Gleichgewichtswahl abzuweichen Das Konzept des Quantenreaktionsgleichgewichts unterscheidet sich insofern von anderen theoretischen Gleichgewichtsvorhersagen als dass es sich um eine statistische Prognose einer Gleichgewichtswahl aus diskreten Strategien handelt Durch die Modellierung eines Fehlerterms kann jegliches Verhalten von Spielern vorhergesagt werden welche Tatsache die Gute eines Gleichgewichtskonzepts einschrankt 1 Grundsatzlich konnen Aussagen des Quantenreaktionsgleichgewichts als deskriptive Gleichgewichtsvorhersage interpretiert werden Aufbau des Quantenreaktionsgleichgewicht in Normalform BearbeitenVerbale Darstellung Bearbeiten Die strikte Annahme der perfekten Rationalitat der Spieler modelliert durch die deterministische Natur einer strategischen Spielumgebung soll durch die Hinzunahme eines stochastischen Ausdrucks erweitert werden Als Folge ist mogliche Inkonsistenz der Spieler moglich 2 In dieser Spielumgebung lassen sich Losungen des Gleichgewichts wie in deterministischen Spielumgebungen nur noch in Wahrscheinlichkeiten ausdrucken da das Gleichgewicht vom stochastischen Teil und einer Wahrscheinlichkeit der deterministischen Wahl abhangt und somit immer dann okonomisch relevant ist wenn der Nutzen eines Spielers von der Realisierung der Zufallsvariable bestimmt wird Die erwartete Auszahlung eines Spielers aus unterschiedlichen Strategien hangt von den Beliefs der Spieler uber die Wahl der Strategie anderer Spieler ab Beliefs determinieren erwartete Auszahlungen welche wiederum Auswahlmoglichkeiten und QR Funktionen generieren Im Gleichgewicht passen diese Beliefs zu den Gleichgewichtsauswahlmoglichkeiten 2 Spieler machen infinitesimal 3 Fehler Diese Anderung erlaubt es Abweichungen von perfekt rational erwarteten Spielverhalten zu beobachten und mithilfe von logistischer Regression formal zu beschreiben welche Tatsache signifikant unterschiedliche Ergebnisse zu Nash Gleichgewichtsvorhersagen haben kann jedoch mit steigender Wahrscheinlichkeit beziehungsweise Wissen uber die Realisierung der Zufallsvariable gegen das Nash Gleichgewicht konvergiert 4 Das Quantenreaktionsgleichgewicht nimmt im Vergleich zum Nash Gleichgewicht einen Unsicherheitsfaktor hinzu und macht es somit resistenter und allgemeingultiger als das deterministische Modell da das Verhalten von noisy players 2 modelliert werden kann Tatsachlich aber handelt es sich beim Quantenreaktionsgleichgewicht um eine Verallgemeinerung des Nash Gleichgewichts NGGW die zu diesem mit sinkendem m displaystyle mu nbsp beziehungsweise mit steigender Rationalitat konvergiert und sich der Beste Antwort Funktion annahert 5 Dies liefert einen nutzlichen theoretischen Rahmen fur die Beobachtung komparativ statischer Effekte von Parameterveranderungen Es fuhrt nicht zwingend zu Abweichungen von den Nash Vorhersagen 5 Spieler wahlen nicht die beste Antwort mit Wahrscheinlichkeit 1 wie im Nash Gleichgewicht Spieler wahlen Antworten mit hoherer erwarteter Auszahlung gewichtet mit hoherer Wahrscheinlichkeit bessere Antworten als beste Antworten Spieler haben rationale Erwartungen und nutzen wahre erwartete Fehler wenn sie Strategien anderer Spieler interpretieren 6 In dieser Modellierung haben Spieler eine freie Auswahl nach einem Gut hier Strategie und entscheiden unter stochastischem Einfluss Sie kennen die Auswahlwahrscheinlichkeit p und schatzen diese Wahrscheinlichkeit mit steigender Erfahrung besser Der deterministische Teil einer Strategienwahl des Spielers ist durch beobachtbare Attribute gepragt und der stochastische Teil unterliegt unbeobachtbaren Einflussen Die Praferenz der Spieler besteht darin eine Strategie zu wahlen die eine hohere erwartete Auszahlung generiert als andere obwohl nicht gegeben ist dass es sich um die beste aller Strategien handelt da Auszahlungen nur noch in Erwartungswerten existieren 7 Eine Annahme im Modell besteht darin dass die Spieler ihre erwarteten Auszahlungen korrekt schatzen Das bedeutet dass Spieler i displaystyle i nbsp seine Schatzung der Auszahlung aus Strategie a im Erwartungswert auch erhalt unter Berucksichtigung der stochastischen Gleichgewichtswahl der anderen Spieler Die hinzugenommene stochastische Variable im Einfluss auf die diskrete Wahl ist endogen im Modell 8 Im Unterschied zum Nash Gleichgewicht jedoch liefert das Quantenreaktionsgleichgewicht die Moglichkeit statt deterministischen Aussagen statistische Prognosen zu treffen Die Gute dieser statistischen Aussagen hangt signifikant von der Prazision der Beliefs der Spieler uber die erwarteten Auszahlungen der unterschiedlichen Strategien ab Erfahrungen der Spieler und Lernfahigkeit spielen eine besondere Rolle da diese Faktoren Einfluss auf die Fahigkeit praziser Einschatzungen erwarteter Auszahlungen aus bestimmten Strategien haben Dieses Phanomen kann auch durch den Effekt steigender Beobachtungen in der Okonometrie erklart werden 9 Formale Darstellung Bearbeiten Annahmen Bearbeiten Die Normalform eines Spiels mit den folgenden Elementen lautet Spieler Es existieren i N displaystyle i in mathbb N nbsp Spieler wobei N 1 n displaystyle N 1 ldots n nbsp Im Strategieraum s i S displaystyle s i in S nbsp existiert fur jeden Spieler eine StrategieS i j s 11 s 1 i s i 1 s i j displaystyle S ij begin pmatrix s 11 amp ldots amp s 1i ldots amp amp ldots s i1 amp ldots amp s ij end pmatrix nbsp dd bestehend aus J i displaystyle J i nbsp reinen Strategien AuszahlungsfunktionFur jeden Spieler i N displaystyle i in mathbb N nbsp gibt es eine Auszahlungsfunktion u i S R displaystyle u i colon S to mathbb R nbsp wo i N S i displaystyle prod i in mathbb N S i nbsp dd Wahrscheinlichkeitp i P X x i displaystyle p i mathcal P X x i quad nbsp und p i S i R displaystyle quad p i colon S i to mathbb R nbsp wo dd s i j S i p i s i j 1 displaystyle sum s ij in S i p i s ij 1 quad nbsp und p i s i j 0 displaystyle quad p i s ij geq 0 nbsp fur alle s i j S i displaystyle s ij in S i nbsp dd Zur Vollstandigkeit sei erwahnt dass sich alle p in einem Raum D displaystyle Delta nbsp von Wahrscheinlichkeiten befinden in dem gilt Alle Anderen p i displaystyle overline p i nbsp wobei p i P X x i displaystyle p i mathcal P X x i nbsp und p i 1 P X x i displaystyle overline p i 1 mathcal P X x i nbsp sodass p i p i 1 displaystyle p i overline p i 1 nbsp alsoD i p i p i 1 p i J j p i j 1 p i j 0 displaystyle Delta i left p i p i1 ldots p iJ sum j p ij 1 p ij geq 0 right nbsp dd Wahrscheinlichkeit Spieler i displaystyle i nbsp wahlt Strategie s i j displaystyle s ij nbsp p i j p i s i j displaystyle p ij p i s ij nbsp dd Daher reprasentiert die Notation s i j p i displaystyle s ij p i nbsp die Strategie wo i die Strategie s i j displaystyle s ij nbsp wahlt und alle anderen Spieler deren Auspragung von p adaptieren Nutzenfunktionu i s V i s e i s displaystyle u is V is varepsilon is nbsp dd Wobei V i s displaystyle V is nbsp den deterministischen Teil und e i s displaystyle varepsilon is nbsp den stochastischen Teil des Modells darstellt Weiterhin kann e i s displaystyle varepsilon is nbsp als weisses Rauschen beschrieben werden und mit folgenden Annahmen versehen werden E e i s 0 displaystyle mathbb E varepsilon is 0 nbsp i s displaystyle forall is nbsp dd Sowohl die Verteilungsfunktion als auch die Dichtefunktion sind unbekannt Der Erwartungswert existiert und ist null Im Logit Modell jedoch ist der stochastische Teil der Nutzenfunktion extremwertverteilt welche Annahme zu nutzlichen Effekten fuhrt Der extremwertverteilte Fehlerterm kann als Spieler i displaystyle i nbsp s Fehler Vektor definiert werden Die Nutzenfunktion der Spieler Bearbeiten Abweichungen von optimalen Entscheidungen sind negativ korreliert mit verbundenen Kosten In anderen Worten machen Spieler sehr ungern Fehler mit hohen Kosten Formal bildet die Nutzenfunktion einen Vektor mit einem deterministischen Teil V i s displaystyle V is nbsp und einem stochastischen Teil e i s displaystyle varepsilon is nbsp mit oben genannten Annahmen Erwartete Auszahlungen u i p p s 1 u i s 1 p s 2 u i s 2 E p u i displaystyle u i p p s 1 cdot u i s 1 p s 2 cdot u i s 2 ldots mathbb E p u i nbsp oder genauer u i p p s u i s displaystyle u i p sum p s u i s nbsp wiederum sind determiniert von Beliefs uber die Aktionen anderer Spieler und bilden den deterministischen Teil der Nutzenfunktion Die Auszahlungen der Spieler werden mit der Wahrscheinlichkeit dass die Strategie gespielt wird gewichtet Nash Gleichgewichte in reinen Strategien existieren unter oben genannten Annahmen nur noch in Erwartungswerten und mit Fehlerterm Die Auszahlungen konnen durch den Vektor u p u 1 p u 2 p u j p displaystyle overline u p begin pmatrix u 1 p u 2 p vdots u j p end pmatrix nbsp wo u i j p u i s i j p i displaystyle overline u ij p u i s ij p i nbsp verstandlicher gemacht werden Der Spieler i displaystyle i nbsp wahlt Strategie j wenn u i j u i k k J displaystyle overline u ij geq hat u ik forall k in J nbsp und u i j displaystyle overline u ij nbsp maximal wird Zudem kommt der Fehlerterm e displaystyle varepsilon nbsp sodass fur jedes u fur jeden Spieler i displaystyle i nbsp eine ij Antwort Menge R existiert R i j u i e i R u i j e i j u i k e i k k 1 J i displaystyle R ij overline u i varepsilon i in mathbb R mid overline u ij varepsilon ij geq overline u ik varepsilon ik forall k 1 ldots J i nbsp Eine Menge R i j u i p displaystyle R ij overline u i p nbsp mit gegebenen p gibt die Region der Fehler an die Spieler i displaystyle i nbsp zu Strategie j fuhrt s i j u i R i j u i f e d e displaystyle sigma ij overline u i int R ij overline u i f varepsilon mathrm d varepsilon nbsp was der Wahrscheinlichkeit dass Spieler i displaystyle i nbsp Strategie j gegeben u displaystyle overline u nbsp wahlt und dem Quantenreaktionsgleichgewicht entspricht 10 Es entsteht eine mit Wahrscheinlichkeit gewichtete Auszahlung aller Strategien unter Berucksichtigung der Auspragung des Residuums Es existiert eine zufallige Beste Antwort Funktion fur alle Spiele in Normalform und somit auch ein Quantenreaktionsgleichgewicht Die Gleichgewichts Wahlmoglichkeiten bilden das Quantenreaktionsgleichgewicht Im Gleichgewicht sind die Beliefs der Spieler richtig Eine Modellierung ist durch das Logit Gleichgewicht moglich da unbeobachtete Storterme Abweichungen des Nutzens der Spieler zur Folge haben und als Ziel der Modellierung so klein wie moglich gehalten werden sollen Logit Quantenreaktionsgleichgewicht Bearbeiten Die gangigste Angabe eines Quantenreaktionsgleichgewichts QRE ist das Logit Quantenreaktionsgleichgewicht englisch Logit Quantal Response Equilibrium kurz LQRE nbsp Gumbel VerteilungsfunktionKerngedanke der Logit Modellierung der Wahl der Strategie von Spielern bildet ein diskretes Entscheidungsmodell 11 Somit ist es moglich Aussagen bezuglich der Auswahl von alternativen Strategie der Spieler zu treffen Spieler i N displaystyle i in mathbb N nbsp wahlt aus dem Strategienraum s i S displaystyle s i in S nbsp ohne Berucksichtigung der Zeit t T displaystyle t in T nbsp da es sich um ein einmaliges Spiel handelt Der Spieler praferiert Strategie s displaystyle s nbsp vor s displaystyle overline s nbsp wenn gilt nbsp Gumbel Dichtefunktionu i s u i s s s S s s displaystyle u is geq u i overline s forall s overline s in S s neq overline s nbsp Unter Logit Modellen versteht man eine Form der binaren Auswahlprobleme in der der stochastische Teil der Nutzenfunktion e i s displaystyle varepsilon is nbsp aus unabhangig und identisch verteilten Stortermen die einer Extremwertverteilung folgen e i i d E l g displaystyle e stackrel mathrm i i d sim mathcal E lambda gamma nbsp Nach dem Fisher Tippett Theorem spater Fisher Tippett Gnedenko Theorem nahern sich diese einer Extremwertverteilung an 12 nbsp Gumbel Realisierungen Standard Die Verteilungsfunktion Uber Extremwertverteilung erfullt diese Annahmen und ist eine Klasse der Extremwertverteilung Die Verteilungsfunktion Graphik 1 zeigt an wie wahrscheinlich ein Ergebnis ist das hochstens der auf der x Achse stehender Wert beobachtet wird Die Realisierungen Graphik 3 4 dieser Verteilung zeigen die Beobachtungen im Zeitverlauf Unter Standard ist hier die Gumbel Verteilung 0 1 definiert und mu beta gibt eine anders skalierte Auspragung der Realisierungen an Der Flacheninhalt unter der Dichtefunktion Graphik 2 bis zu einer Realisierung korrespondiert zur Wahrscheinlichkeit zu der hochstens dieser Wert eintritt nbsp Gumbel Realisierungen mu beta Daher sind stochastische Storterme als Maximum der Zufallszahlen zu verstehen Die Form des Logit Modells erlaubt Schatzungen mithilfe der Maximum Likelihood Methode uber die Wahl der Spieler zu schatzen Durch extremverteilte stochastische Storterme ergibt sich die Auswahlwahrscheinlichkeit 13 P i M N L s S P u i s u i s s s e m V i s b s S e m V i s b displaystyle mathcal P i MNL s S mathcal P u is geq u i overline s forall s neq overline s frac e mu V is beta sum overline s in S e mu V is beta nbsp m R displaystyle mu in mathbb R nbsp kann in diesem Fall als Rationalitatsparameter identifiziert werden und gibt an wie rational die Spieler entscheiden Ein Spieler mit m 0 displaystyle mu to 0 nbsp entscheidet perfekt rational und alle Vorhersagen konvergieren zum Nash Gleichgewicht Problematisch allerdings ist die Annahme der unabhangig und identisch verteilten Storterme Die resultierende Korrelation von 0 zwischen den Stortermen hat ein Verhaltnis der Auswahlwahrscheinlichkeiten zur Folge Fur die Alternativen s s displaystyle s neq s dagger nbsp gilt das Verhaltnis 13 P i M N L s S P i M N L s S e m V i s b s S e m V i s b e m V i s b s S e m V i s b e m V i s b e m V i s b displaystyle frac mathcal P i MNL s S mathcal P i MNL s dagger S frac frac e mu V is beta sum s in S e mu V is beta frac e mu V is dagger beta sum s dagger in S e mu V is dagger beta frac e mu V is beta e mu V is dagger beta nbsp Die Konstanz dieses Verhaltnisses widerspricht der Unabhangigkeit von irrelevanten Alternativen englisch Independence of irrelevant alternatives kurz IIA Anwendungen BearbeitenDas Quantenreaktionsgleichgewicht findet in Spielen mit diskreten Strategien Anwendung Im Traveler s Dilemma kann das Quantenreaktionsgleichgewicht beobachtete Daten des Verhaltens der Spieler erklaren Wobei es moglich ist bei bestimmter Wahl des Rationalitatsparameters jegliches Verhalten von Spielern zu modellieren 1 s i j displaystyle s i j nbsp s 2 1 displaystyle s 2 1 nbsp s 2 2 displaystyle s 2 2 nbsp s 1 1 displaystyle s 1 1 nbsp 1 1 1 1 s 1 2 displaystyle s 1 2 nbsp 1 1 1 1 Spielermenge N 1 2 displaystyle N 1 2 nbsp Strategienmenge s 1 s 2 S displaystyle s 1 neq s 2 in S nbsp Strategienmenge Spieler 1 s 1 T B displaystyle s 1 T B nbsp Strategiemenge Spieler 2 s 2 L R displaystyle s 2 L R nbsp Nullsummenspiel mit diskreten StrategienZeilenspielers erwartete Auszahlungsfunktion aus Strategie T displaystyle T nbsp U T displaystyle U T nbsp ist eine Funktion der Auswahlwahrscheinlichkeit von Spaltenspielers Strategie R displaystyle R nbsp p R displaystyle p R nbsp welche durch Erwartungswerte gebildet werden kann U T p R p R 1 p R 2 p R 1 displaystyle U T p R p R 1 p R 2p R 1 nbsp nbsp Grafische Darstellung AnwendungAnalog dazu bildet sich Zeilenspielers erwartete Auszahlungsfunktion aus Strategie B aus der Auswahlwahrscheinlichkeit von Spaltenspieler seiner Strategie R U B p R 1 2 p R displaystyle U B p R 1 2p R nbsp Falls Spaltenspieler lieber R spielt p R 1 2 displaystyle p R geq 1 2 nbsp ist Zeilenspielers beste Antwort Strategie T Spaltenspielers erwartete Auszahlungen konnen analog errechnet werden Die QR Funktion glattet die unstetige errechnete Beste Antwort Funktion und reprasentiert monotone und stochastische Wahl als eine Funktion von Auszahlungen 14 In der Graphik schneiden sich QR Funktion und Beste Antwort Funktion im Nash Gleichgewicht Bei einem anderen Rationalitatsparameter verschiebt sich die QR Funktion und es kommt zu anderen statistischen Vorhersagen bezuglich eines Gleichgewichts Die QR Funktion des Gegenspielers errechnet sich analog Aufbau des Quantenreaktionsgleichgewichts in Extensivform BearbeitenVerbale Darstellung Bearbeiten In extensiver Form des Spiels wird der Faktor Zeit in das Modell mit aufgenommen und es entsteht eine Art Stufenspiel Im deterministischen Modell konnen auch im unendlich oft wiederholten Stufenspiel Aussagen uber ein zeitresistentes Gleichgewicht getroffen werden da ein Nash Gleichgewicht immer ein Gleichgewicht bleiben muss Der stochastische Einfluss und der Storterm jedoch verhindern diese Fahigkeit durch die Abhangigkeit des Gleichgewichts von den Realisierungen verschiedener Zufallsvariablen Es konnen lediglich Erwartungswerte angegeben werden die letztendlich keine sicheren Vorhersagen treffen konnen Das Gesetz der grossen Zahlen bewirkt dass mit steigenden Beobachtungen konsistentere Aussagen uber Gleichgewichte getroffen werden konnen McKelvey und Palfrey definieren fur das dynamische Spiel ein Agenten Quantenreaktionsgleichgewicht englisch Agent Quantal Response Equilibrium kurz AQRE welches mithilfe von Teilspielperfektheit ermittelt werden kann In diesem Spiel determiniert jeder Spieler seine erwartete Auszahlung mithilfe einer Modellierung der Zukunft als einen eigenen Spieler mit Kenntnis uber die Wahrscheinlichkeitsverteilung uber die Strategien 15 Weblinks BearbeitenMcKelvey Palfrey 1995 URL http www dklevine com archive refs4510 pdf McKelvey Palfrey 1998 URL http fisher osu edu schroeder 9 AMIS900 McKelvey1998 pdf Becker Carter Naeve 2005 URL https www uni hohenheim de RePEc hoh papers 252 pdf Goeree Holt Palfrey URL http people hss caltech edu jkg QRE 20Palgrave pdf Economics 209B Behavioral Experimental Game Theory URL http eml berkeley edu kariv 209B QRE pdfLiteratur BearbeitenMcFadden D 1973 Conditional logit analysis of qualitative choice behavior Fisher R A Tippett L H C 1928 Limiting forms of the frequency distribution of the largest or smallest member of a sample In Mathematical Proceedings of the Cambridge Philosophical Society Vol 24 Cambridge Univ Press Train K E 2009 Discrete Choice Methods with SimulationEinzelnachweise Bearbeiten a b Becker et al Experts Playing the Traveler s Dilemma Hohenheimer Diskussionsbeitrage Nr 252 2005 S 13 a b c Goeree Holt Palfrey Quantal Response Equilibrium Division of the Humanities and Social Sciences S 1 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 7 Zeile 2 1995 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 6 8 1995 a b Goeree Holt Palfrey Quantal Response Equilibrium Division of the Humanities and Social Sciences S 2 Economics 209B Behavioral Experimental Game Theory Lecture 4 Quantal Response Equilibrium QRE Spring 2008 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 10 better actions are more likely to be chosen than worse actions 1995 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 7 1995 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 8 ff 1995 McKelvey Palfrey Quantal Response Equilibria for Normal Form Games Games and Economic Behavior Vol 10 Seite 10 1995 Train K E Discrete Choice Methods with Simulation Cambridge University Press 2009 Fisher R A Tippett L H C 1928 Limiting forms of the frequency distribution of the largest or smallest member of a sample In Mathematical Proceedings of the Cambridge Philosophical Society Vol 24 Cambridge Univ Press pp 180 190 a b McFadden D 1973 Conditional logit analysis of qualitative choice behavior Goeree Holt Palfrey Quantal Response Equilibrium Division of the Humanities and Social Sciences A Motivating Example Generalized Matching Pennies S 1 ff McKelvey Richard Palfrey Thomas 1998 Quantal Response Equilibria for Extensive Form Games Experimental Economics Vol 1 Seite 9 41 Abgerufen von https de wikipedia org w index php title Quantenreaktionsgleichgewicht amp oldid 237875548