本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个误差。着致使玩家1并不必定会提供真实的信息。 而玩家2则须要根据玩家1的类型来作出决策。函数
三个结论:学习
- 不存在彻底诚实的均衡。(或者能够理解为存在一个不诚实的均衡。)
- 老是存在一个瞎说的均衡(babbling equilibrium)。玩家1没有提供任何有用的信息,玩家2使用先验信念来计算其最大收益。
- 若是玩家1的误差不是太大,则在均衡中部分信息可以被真实传递。
案例: 玩家1了解真实的状况,$\theta \in [0, 1]$为两个值中之一。 玩家2的先验知识是这两种状态的可能性同样。 玩家2的行动$a_2 \in \mathbb{R}$,其收益函数为$v_2(a_2, \theta) = -(\theta - a_2)^2$,意味着玩家2的最优策略是$a_2 = \theta$。 玩家1的行动$a_1$,其收益函数为$v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0$,意味着玩家2的最优策略是$a_2 = \theta + b$。 事件的顺序为:玩家1给玩家2一个消息,而后玩家2决定其策略。ui
这里增长了一个条件:玩家1只能提供两个信息$a \in { a', a'' }, 0 \leq a' < a'' \leq 1.$中的一个。spa
声明 18.5设计
在一个两消息均衡中,玩家1必定会使用一个阀值策略:若是$0 \leq \theta \leq \theta^$时选择$a'$,若是$\theta^ \leq \theta \leq 1$时选择$a''$。orm
声明 18.6htm
在一个两消息均衡中,玩家1使用一个阀值策略,则玩家2最佳反应$a_2(a'_1) = \frac{\theta^}{2}$和$a_2(a''_1) = \frac{1 - \theta^}{2}$。blog
声明 18.7事件
当且仅当$b < \frac{1}{4}$时,存在一个两消息精炼贝叶斯均衡。
案例: 在一个委员会中,玩家1是一个顾问,提供建议给政策制定者。玩家2制定政策。 玩家1了解真实的状况,$\theta \in { -w, w}, w > 0$为两个值中之一。 玩家2的先验知识是这两种状态的可能性同样。 玩家2的行动$a_2$,其收益函数为$v_2(a_2, \theta) = -(\theta - a_2)^2$,意味着玩家2的最优策略是$a_2 = \theta$。 玩家1的行动$a_1$,其收益函数为$v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0$,意味着玩家2的最优策略是$a_2 = \theta + b$。 事件的顺序为:玩家1给玩家2一个消息,而后政策被指定。
解决方案1: 若是玩家2根据先验条件,则会获得$a_2 = 0$为最大收益的行动。根据$a_2 = 0$行动指定的策略,称之为现状策略(status quo policy)。 咱们能够理解为玩家2没有从玩家1那里获得任何信息。
替代规则
声明 18.8
在一个开放规则中,当且仅当$b \leq w$时,存在一个彻底诚实的均衡,其中$a_2 = \theta$。
声明 18.9
在一个封闭规则中,当且仅当$b \leq w$时,存在一个彻底诚实的均衡,其中$a_2 = \theta + b$。
声明 18.10
在一个封闭规则中,当且仅当$b \leq 2w$时,存在一个彻底诚实的均衡,其中$a_2 = \theta + w$。
结论: