本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
机制设计的目标是设计一个能够达到指望收益的博弈。
因为这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。
这个理论明显在经济和政治方面有不少用途。
咱们假象这样一个例子:函数
某个政府须要设计一个关于化工厂的环保政策。
这个政策可能涉及到:几个化工厂、政府和大众。
大概的想法是:政府有一些排放许可;化工厂须要从政府那里买排放许可;政府和大众利用得到的资金改善环境。
机制设计的核心是:制定玩家的行动和支付资金的关系。学习
从上面的例子能够看出一些新的元素:优化
新的概念:ui
机制设计者面临的问题和一个方向spa
在不完整信息博弈中,私有信息(机制设计者不知道的信息):设计
- 每一个玩家的类型\(\theta\)。
公共知识:- 类型集合\(\Theta\)
- 每种类型的选择规则,也就是每种类型玩家倾向的结果
- 每种类型的策略,就是每种类型玩家的倾向策略
- 策略行动致使的结果。
机制设计的两个方向之一,是在不知道玩家的类型(这是私有信息)的状况下,
设计出一个足够聪明的博弈,可以保证:orm
- 对于每种类型的玩家组合,其选择规则的结果,和博弈的贝叶斯纳什均衡的结果一致。
也就是说,其选择规则结果和博弈的策略引发的结果一致。
知足上面条件的机制,则称之实现了选择规则。
下面是相应的数学说明。
玩家i的收益函数
\(v_i(g(s), \theta_i)\)htm
贝叶斯纳什均衡(Bayesian Nash Equilibrium)
若是知足下面条件,一个策略组合\(s^*(\cdot) = (s_1^*(\cdot), \cdots, s_n^*(\cdot))\)
是一个机制\(\Gamma = \langle A_1, \cdots, A_n, g(\cdot) \rangle\)的贝叶斯纳什均衡:
\[ E_{\theta_{-1}} [v_i(g(s_i^*(\theta_i), s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(a_i, s_{-i}^*(\theta_{-i})), \theta_i) | \theta_i], \forall a_i \in A_i, \forall i \in N, \forall \theta_i \in \Theta_i \]blog
也就是说,对于每种类型组合,每一个玩家,当对手的策略是这个策略组合时,这个玩家的这个策略组合的策略是最优的(其指望收益大于等于其它的全部策略的指望收益)。
机制实现选择规则
若是知足下面条件,则这个机制\(\Gamma\)实现了(implement)选择规则\(f(\cdot)\):
存在一个贝叶斯纳什均衡\(s^*(s_1^*(\theta_1), \cdots, s_n^*(\theta_n))\),知足:
\[ g(s_1^*(\theta_1), \cdots, s_n^*(\theta_n)) = f(\theta), \forall \theta_i \in \Theta_i \]
部分实现(partial implementation)和彻底实现(full implementation)
除了指望的贝叶斯纳什均衡,若是容许存在其它的、不指望的均衡,成为部分实现;
若是不容许存在其它的、不指望的均衡,成为彻底实现;
机制设计的另一个方向:玩家意识到机制设计者会实现他的选择条件\(f(\cdot)\)时,玩家会透露本身的类型。
直接揭露机制(direct revelation mechanism)
一个选择规则\(f(\cdot)\)的直接揭露机制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)是:
\[ A_i = \Theta_i, \forall i \in N \\ g(\theta) = f(\theta), \forall \theta \in \Theta \]
解释:
对于每一个玩家,其行动集合\(\Theta\)是选择规则\(\Theta_i\)对应的行动集合(想象一下,每一个类型对应一个策略,一个策略对应一个行动)。
对于每一个类型\(\theta\),它的选择规则(想要的)结果\(f(\theta)\)和机制设计的结果\(g(\theta)\)一致。
在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)
一个选择规则\(f(\cdot)\)是在贝叶斯纳什均衡中诚实地可实现的,
若是这个选择规则的直接揭露机制\(\Gamma = \langle \Theta_1, \cdots, \Theta_n, f(\cdot) \rangle\)有一个贝叶斯纳什均衡\(s_i^*(\theta_i) = \theta_i\),
也就是说,知足:
\[ E_{\theta_{-1}} [v_i(f(\theta_i, \theta_{-i}), \theta_i) | \theta_i] \geq E_{\theta_{-1}} [v_i(g(\theta_i', \theta_{-i}), \theta_i) | \theta_i], \forall \theta_i' \in \Theta_i \]
解释:
当解释规则的直接揭露机制有有一个贝叶斯纳什均衡解,则其实彻底可知足的。
推论 14.1 : 对于贝叶斯纳什实现的揭露原理
一个选择规则\(f(\cdot)\)在贝叶斯纳什均衡中是可实现的,当且仅当它在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)。
揭露原理的想法:
在均衡中,玩家知道这个机制实现了选择规则\(f(\cdot)\),因此会何其保持一致。
所以他们可能会诚实地述说他们的类型,让机制设计者直接实现选择规则\(f(\cdot)\)。
推论 14.2
在一个准线性(quasilinear)环境中,给定一个实例状态\(\theta \in \Theta\),
一个替代物(alternative)\(x^* \in X\)是一个帕累托优化,当且仅当下面有一个解:
\[ \max_{x \in X} \sum_{i=1}^I u_i(x_i, \theta_i) \]
First-best decision rule
若是对于\(\forall \ \theta \in \Theta\), \(x^*(\theta)\)都是帕累托优化的,则\(x^*(\cdot)\)为First-best decision rule。
Vickrey-Clarke-Groves机制
给定一个宣布的类型\(\theta'\),
这个选择规则\(f(\theta') = (x(\theta'), m_1(\theta'), \cdots, m_n(\theta') )\)是一个Vickrey-Clarke-Groves机制,
若是\(x^*(\cdot)\)是一个第一好决定规则(first-best decision rule),而且:
\[ m_i(\theta') = \sum_{j \neq i} u_j(x^*(\theta'_j, \theta'_{-i}), \theta'_j) + h_i(\theta'_{-i}) \\ where \\ h_i(\theta'_{-i}) \text{ is an arbitrary function of } \theta'_{-i} \]
解释:
没有彻底看懂。大概的意思是对于First-best decision rule \(x^*(\cdot)\),
能够找到一个转移规则\((m_1(\cdot), \cdots, m_n(\cdot))\),
让选择规则成为一个在优点策略中可实现。
下面是一个解: