本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。html
多阶段博弈
多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每一个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。
这些阶段博弈的玩家都相同。每一个博弈都属于一段大相径庭的时期(distinct period)。dom
多阶段博弈:收益 - 折扣累计和收益(discounted sum payoff)
\[ v_i = v_i^1 + \delta^1 v_i^2 + \delta^2 v_i^3 + \cdots + \delta^{T-1} v_i^T = \sum_{t=1}^T \delta^{t-1} v_i^t \\ where \\ \delta \text{: discount rate} \]ide
多阶段博弈:策略
“若是在博弈1,博弈2,。。。博弈t-1中发生了这些,我会在博弈 t 中采起行动a。”学习
多阶段博弈:条件纯策略队列(conditional pure strategies list)
第t个阶段的策略(的参数)是以前的发生的事件。
\[ S_i = {s_i^1, s_i^2(h_1), \cdots, s_i^t(h_{t-1}), \cdots, s_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ s_i^t(h_{t-1}) \text { : an action for player i from the } t \text {th stage-game.} \\ h_{t-1} = ((a_1^1, \cdots, a_n^1), \cdots, (a_1^{t-1}, \cdots, a_n^{t-1})) \]spa
多阶段博弈:混合策略(mixed strategy)
\[ \sigma_i = {\sigma_i^1, \sigma_i^2(h_1), \cdots, \sigma_i^t(h_{t-1}), \cdots, \sigma_i^T(h_{T-1})} \\ where \\ h_{t-1} \text{ : a particular outcome that occurred up to period t, not including period t. or information set} \\ \sigma_i^t(h_{t-1}) \text { : an randomization over player i's actions from the } t \text {th stage-game.} \\ \]orm
推论9.1htm
在一个T阶段的多阶段博弈中,\(\sigma^{t*}\)是第t个阶段的一个纳什均衡。
则在这个多阶段博弈中存在一个子博弈精炼均衡,其均衡路径一致于\(\sigma^{1*}, \sigma^{2*}, \cdots, \sigma^{T*}\)产生的路径。blog
推论9.2队列
在一个由阶段博弈\(G_1, G_2, \cdots, G_T\)T组成的多阶段博弈中,\(\sigma^*\)是一个纳什均衡,
则在期间T(最后一个)的阶段博弈中,\(\sigma^*\)的约束必定是这个阶段博弈的纳什均衡。事件
最后一个博弈不存在依赖性。
后面的博弈若是有多个纳什均衡,则可能会影响前面阶段的博弈结果。(胡萝卜大棒理论)
推论9.3
在一个由有限个阶段博弈组成的多阶段博弈中,每一个阶段博弈都有一个惟一的纳什均衡,
则这个多阶段博弈有一个惟一的子博弈精炼均衡。
单阶段误差原理用来简化有多个阶段博弈的计算过程。
定理:9.1
一个单阶段不可改善的策略必定是最优的。