读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判

读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判

信息传递和廉价谈判(Information Transmission and Cheap Talk)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html

这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。
玩家1和玩家2的收益函数有一个误差。着致使玩家1并不必定会提供真实的信息。
而玩家2则须要根据玩家1的类型来作出决策。函数

三个结论:学习

  • 不存在彻底诚实的均衡。(或者能够理解为存在一个不诚实的均衡。)
  • 老是存在一个瞎说的均衡(babbling equilibrium)。玩家1没有提供任何有用的信息,玩家2使用先验信念来计算其最大收益。
  • 若是玩家1的误差不是太大,则在均衡中部分信息可以被真实传递。

两信息博弈

案例:
玩家1了解真实的状况,\(\theta \in [0, 1]\)为两个值中之一。
玩家2的先验知识是这两种状态的可能性同样。
玩家2的行动\(a_2 \in \mathbb{R}\),其收益函数为\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最优策略是\(a_2 = \theta\)
玩家1的行动\(a_1\),其收益函数为\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最优策略是\(a_2 = \theta + b\)
事件的顺序为:玩家1给玩家2一个消息,而后玩家2决定其策略。ui

这里增长了一个条件:玩家1只能提供两个信息\(a \in \{ a', a'' \}, 0 \leq a' < a'' \leq 1.\)中的一个。spa

声明 18.5设计

在一个两消息均衡中,玩家1必定会使用一个阀值策略:若是\(0 \leq \theta \leq \theta^*\)时选择\(a'\),若是\(\theta^* \leq \theta \leq 1\)时选择\(a''\)orm

声明 18.6htm

在一个两消息均衡中,玩家1使用一个阀值策略,则玩家2最佳反应\(a_2(a'_1) = \frac{\theta^*}{2}\)\(a_2(a''_1) = \frac{1 - \theta^*}{2}\)blog

声明 18.7事件

当且仅当\(b < \frac{1}{4}\)时,存在一个两消息精炼贝叶斯均衡。

应用:信息和立法组织

案例:
在一个委员会中,玩家1是一个顾问,提供建议给政策制定者。玩家2制定政策。
玩家1了解真实的状况,\(\theta \in \{ -w, w\}, w > 0\)为两个值中之一。
玩家2的先验知识是这两种状态的可能性同样。
玩家2的行动\(a_2\),其收益函数为\(v_2(a_2, \theta) = -(\theta - a_2)^2\),意味着玩家2的最优策略是\(a_2 = \theta\)
玩家1的行动\(a_1\),其收益函数为\(v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0\),意味着玩家2的最优策略是\(a_2 = \theta + b\)
事件的顺序为:玩家1给玩家2一个消息,而后政策被指定。

解决方案1:
若是玩家2根据先验条件,则会获得\(a_2 = 0\)为最大收益的行动。根据\(a_2 = 0\)行动指定的策略,称之为现状策略(status quo policy)。
咱们能够理解为玩家2没有从玩家1那里获得任何信息。

替代规则

  • 开放规则(open rule)
    玩家2能够选择任何策略。
    此时,玩家2的默认策略是现状策略,若是认为玩家1在瞎扯的是否。
    玩家1要比较瞎扯的结果(现状策略)和一个诚实\(a_2 = \theta\)的策略结果。
  • 封闭规则(close rule)
    玩家2能够在现状策略和一个玩家1建议的策略中选择一个。

声明 18.8

在一个开放规则中,当且仅当\(b \leq w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta\)

声明 18.9

在一个封闭规则中,当且仅当\(b \leq w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta + b\)

声明 18.10

在一个封闭规则中,当且仅当\(b \leq 2w\)时,存在一个彻底诚实的均衡,其中\(a_2 = \theta + w\)

结论:

  1. 玩家1的野心越小,越诚实。
  2. 在开放规则中,玩家1的野心较小时,诚实的结果优于现状策略。
  3. 在封闭规则中,玩家1能够从其中获益。

参照

相关文章
相关标签/搜索