本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。
玩家1和玩家2的收益函数有一个误差。着致使玩家1并不必定会提供真实的信息。
而玩家2则须要根据玩家1的类型来作出决策。函数
三个结论:学习
- 不存在彻底诚实的均衡。(或者能够理解为存在一个不诚实的均衡。)
- 老是存在一个瞎说的均衡(babbling equilibrium)。玩家1没有提供任何有用的信息,玩家2使用先验信念来计算其最大收益。
- 若是玩家1的误差不是太大,则在均衡中部分信息可以被真实传递。
案例:
玩家1了解真实的状况,\(\theta \in [0, 1]\)为两个值中之一。
玩家2的先验知识是这两种状态的可能性同样。
玩家2的行动\(a_2 \in \mathbb{R}\),其收益函数为\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最优策略是\(a_2 = \theta\)。
玩家1的行动\(a_1\),其收益函数为\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最优策略是\(a_2 = \theta + b\)。
事件的顺序为:玩家1给玩家2一个消息,而后玩家2决定其策略。ui
这里增长了一个条件:玩家1只能提供两个信息\(a \in \{ a', a'' \}, 0 \leq a' < a'' \leq 1.\)中的一个。spa
声明 18.5设计
在一个两消息均衡中,玩家1必定会使用一个阀值策略:若是\(0 \leq \theta \leq \theta^*\)时选择\(a'\),若是\(\theta^* \leq \theta \leq 1\)时选择\(a''\)。orm
声明 18.6htm
在一个两消息均衡中,玩家1使用一个阀值策略,则玩家2最佳反应\(a_2(a'_1) = \frac{\theta^*}{2}\)和\(a_2(a''_1) = \frac{1 - \theta^*}{2}\)。blog
声明 18.7事件
当且仅当\(b < \frac{1}{4}\)时,存在一个两消息精炼贝叶斯均衡。
案例:
在一个委员会中,玩家1是一个顾问,提供建议给政策制定者。玩家2制定政策。
玩家1了解真实的状况,\(\theta \in \{ -w, w\}, w > 0\)为两个值中之一。
玩家2的先验知识是这两种状态的可能性同样。
玩家2的行动\(a_2\),其收益函数为\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最优策略是\(a_2 = \theta\)。
玩家1的行动\(a_1\),其收益函数为\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最优策略是\(a_2 = \theta + b\)。
事件的顺序为:玩家1给玩家2一个消息,而后政策被指定。
解决方案1:
若是玩家2根据先验条件,则会获得\(a_2 = 0\)为最大收益的行动。根据\(a_2 = 0\)行动指定的策略,称之为现状策略(status quo policy)。
咱们能够理解为玩家2没有从玩家1那里获得任何信息。
替代规则
声明 18.8
在一个开放规则中,当且仅当\(b \leq w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta\)。
声明 18.9
在一个封闭规则中,当且仅当\(b \leq w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta + b\)。
声明 18.10
在一个封闭规则中,当且仅当\(b \leq 2w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta + w\)。
结论: