本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
序贯理性(Sequential Rationality)
序贯理性是一个原则:在博弈树的每个信息集上,玩家老是使用最佳策略。
这意味着,不管是否在均衡路径上,博弈次序的每一个阶段,玩家都是在作理智的选择。学习
序贯理性(Sequential Rationality)
给定玩家i对手的策略组合\(\sigma_{-i} \in \Delta S_{-i}\),玩家策略\(\sigma_i\)是序贯理性的,
当且仅当玩家i在每一个信息集上,老是选择\(\sigma_{-i}\)最佳响应。ui
方法 - 逆向概括法解:spa
从末端节点开始,在上一层的每一个节点的收益组合为节点玩家的(子节点的)最佳收益组合。
以此类推,直到根节点。根节点上的收益组合(多是多个)的博弈路径为逆向概括法解。htm
推论8.1 (Zermelo's Theorem)blog
任何有限完美信息博弈都有一个逆向概括法解,并且是顺序合理的。
此外,若是没有两个末端节点有(对每一个玩家)相同的收益,则逆向概括法解是惟一的。rem
推论get
任何有限完美信息博弈至少有一个顺序合理的纯策略形式的纳什均衡。
此外,若是没有两个末端节点有(对每一个玩家)相同的收益,则有惟一的顺序合理的纳什均衡。it
适当的子博弈(proper subgame)
博弈\(\Gamma\)的一个适当子博弈\(G\)只包含一个节点和它全部子孙节点,并具备性质:
若是\(s \in G\)而且\(x' \in h(x)\),则\(x' \in G\) - 属于子博弈\(G\)的节点,这个节点的信息集包含的全部节点都属于这个子博弈\(G\)。io
子博弈精炼均衡(subgame-perfect (Nash) equilibrium)
在一个扩展形式博弈\(\Gamma\)中,若是对于每个子博弈\(G\),\(\sigma^*\)都是\(G\)中的纳什均衡,则行为策略组合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一个子博弈精炼均衡。
事实
对于任何有限完美信息博弈,子博弈精炼纳什均衡的集合和逆向概括法的纳什均衡的集合是一致的。