本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
\[ S \equiv S_1 \times S_2 \times \cdots S_n \\ S_{-i} \equiv S_1 \times S_2 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots S_n \\ s = (s_1, s_2, \cdots, s_n) \\ s_{-i} = (s_1, s_2, \cdots, s_{i-1}, s_{i+1}, \cdots, s_n) \\ s = (s_i, s_{-i}) \]
\(S\): 全部人的全部策略组合。
\(S_{-i}\): 除了玩家\(i\)之外,全部人的全部策略组合。
\(s\): 全部人的一种策略组合。
\(s_{-i}\): 除了玩家\(i\)之外,全部人的一种策略组合。
引进\(S_{-i}\)和\(s_{-i}\)是为了dom
\[ v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), \forall s_{-i} \in S_{-i} \]函数
断言 4.1学习
一个理性玩家不会选择一个严格劣势策略。ui
\[ v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), \forall s'_i \in S_i, s'_i \neq s_i, and \ \forall s_{-i} \in S_{-i} \]spa
\[ s_i \equiv s_i^D, \forall i \in N \]htm
推论 4.1blog
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一个严格优点策略均衡\(s^D\),则\(s^D\)是惟一的严格优点策略均衡。get
断言 4.2数学
若是有的话,玩家必定会选择优点策略。
策略(strategy)
\(s_i\)是玩家的一个策略。
策略集合(strategy set)
\(S_i\)是玩家的全部策略集合。\(s_i \in S_i\)
\(S\)是全部玩家的全部策略的组合的集合。
策略组合(strategy profile)
\(s\)是N个玩家的一种策略组合。\(s = (s_1, s_2, \cdots, s_n), s \in S\)
策略均衡(strategy equilibrium)
\(s\)是任何一种致使合理结果的策略组合。
博弈论方法就是一个寻找均衡的过程。
方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本逻辑:
一个理性玩家不会选择一个严格劣势策略。
若是有的话,玩家必定会选择优点策略。
过程:略
推论 4.2
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一个严格优点策略均衡,则\(S^*\)是惟一的严格劣势策略的迭代消除(IESDS)均衡。
在已经学习的两个方法严格优点策略和严格劣势策略的迭代消除(IESDS)以外的状况下,若是玩家i的一个策略\(s_i\)不是一个严格劣势策略,那就意味着在必定条件下(对手的某些策略下),策略\(s_i\)是一个合理的响应。
最佳响应(best response)
玩家i的策略\(s_i \in S_i\)是对手策略\(s_{-i} \in S_{-i}\)的最佳响应,则:
\[ v_i(s_i, s_{-i}) \geq v_i(s'_i, s_{-i}), \forall s'_i \in S_i \]
信念(belief)
一个玩家i的信念就是一个他对手们的可能策略组合\(s_{-i} \in S_{-i}\)。
最佳响应对应(best-response correspondence)
最佳响应对应\(BR_i(s_{-i})\),是玩家i,在他的对手们的策略组合\(s_{-i}\)上的全部可能最佳响应的集合。
\(BR_i(s_{-i})\)能够认为是一个函数,其结果是一个集合。
不是一个最佳响应(never a best response)
玩家i,对于他的对手们的策略组合\(s_{-i}\)的最佳响应集合\(BR_i(s_{-i})\),若是\(s_{-i}\)不是在信任集合里,则\(s_i \in BR_i(s_{-i})\)都不是最佳响应。
方法
推论 4.1
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\)有一个严格优点策略均衡\(s^D\),则\(s^D\)是惟一的严格优点策略均衡。
推论 4.2
若是博弈\(\Gamma = (N, \{ S_i \}_{i=1}^{N},\{ v_i \}_{i=1}^{N})\),\(s^*\)是一个严格优点策略博弈,则\(S^*\)是惟一的严格劣势策略的迭代消除(IESDS)均衡。
推论 4.3
对于玩家i,一个严格劣势策略\(s_i\),不多是任何\(s_{-i} \in S_{-i}\)的最佳响应。
推论 4.4
在一个有限普通形式的博弈中,\(s^*\)是一个严格优点策略,或者是一个惟一的严格劣势策略的迭代消除(IESDS)均衡,
则s_i^*是一个对于任何\(s_{-i} \in S_{-i}\)的最佳响应。
断言 4.1
一个理性玩家不会选择一个严格劣势策略。
断言
若是有的话,玩家必定会选择优点策略。
断言 4.2
一个理性玩家,在认为他的对手选择策略\(s_{-i} \in S_{-i}\)时,总会选择\(s_{-i}\)的最想响应。
断言
一个理性玩家只会选择(他对手们的策略组合的)最佳响应。