海盗分金问题解答---来自百度

海盗分金
经济学上有个“海盗分金”模型,是说5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,而后5人表决,超过半数赞成方案才被经过,不然他将被扔入大海喂鲨鱼,依此类推。“海盗分金”实际上是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让本身的方案得到经过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

1、经济学上的“海盗分金”模型

  假定“每人海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才可以使本身的收益最大化?”
  推理过程是这样的:
  从后向前推,若是1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号必定投反对票让4号喂鲨鱼,以独吞所有金币。因此,4号唯有支持3号才能保命。
  3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号爱财如命而将所有金币归为已有,由于他知道4号一无所得但仍是会投同意票,再加上本身一票,他的方案便可经过。
  不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。因为该方案对于4号和5号来讲比在3号分配时更为有利,他们将支持他而不但愿他出局而由3号来分配。这样,2号将拿走98枚金币。
  一样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。因为1号的这一方案对于3号和4号(或5号)来讲,相比2号分配时更优,他们将投1号的同意票,再加上1号本身的票,1号的方案可获经过,97枚金币可轻松落入囊中。这无疑是1号可以获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,本身独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。
  企业中的一把手,在搞内部人控制时,常常是抛开二号人物,而与会计和出纳们打得火热,就是由于公司里的小人物好收买。
  1号看起来最有可能喂鲨鱼,但他紧紧地把握住先发优点,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程当中先进国家的先发优点吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。
  不过,模型任意改变一个假设条件,最终结果都不同。而现实世界远比模型复杂。
  首先,现实中确定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一我的偏离了绝对聪明的假设,海盗1号不管怎么分均可能会被扔到海里去了。因此,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,不然先分者倒霉。
  若是某人偏好看同伙被扔进海里喂鲨鱼。果然如此,1号自觉得得意的方案岂不成了自掘坟墓!
  再就是俗话所说的“人心隔肚皮”。因为信息不对称,谎话和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。若是2号对三、四、5号大放烟幕弹,宣称对于1号所提出任何分配方案,他必定会再多加上一个金币给他们。这样,结果又当如何?
  一般,现实中人人都有自认的公平标准,于是时常会嘟嚷:“谁动了个人奶酪?”能够料想,一旦1号所提方案和其所想的不符,就会有人大闹……当你们都闹起来的时候,1号能拿着97枚金币毫发无损、不慌不忙地走出去吗?最大的可能就是,海盗们会要求修改规则,而后从新分配。想想二战前的希特勒德国吧!
  而假如由一次博弈变成重复博弈呢?好比,你们讲清楚下次再得100枚金币时,先由2号海盗来分……而后是3号……这很有点像美国总统选举,轮流主政。说白了,实际上是民主形式下的分赃制。
  最可怕的是其余四人造成一个反1号的大联盟并制定出新规则:四人平分金币,将1号扔进大海……这就是阿Q式的革命理想:高举平均主义的旗帜,将富人扔进死亡深渊……
  制度规范行为,理性打败愚昧!
  若是假设变为,是10人分100枚金币,投票50%或以上才能经过,不然他将被扔入大海喂鲨鱼,依此类推。50%是问题的关键,海盗能够投本身的票。所以若是剩下两我的,不管什么方案都会被经过,即100,0。
  往上推一步,3我的时,倒数第三我的知道若是出现两我的的状况,所以它会团结第一我的,给他一个金币
  “往前推一步。如今加一个更凶猛的海盗P3。P1知道———P3知道他知道———若是P3的方案被否决了,游戏就会只由P1和P2来继续,而P1就一枚金币也得不到。因此P3知道,只要给P1一枚金币,P1就会赞成他的方案(固然,若是不给P1一枚金币,P1反正什么也得不到,宁肯投票让P3去喂鱼)。因此P3的最佳策略是:P1得1枚,P2什么也得不到,P3得99枚。
  P4的状况差很少。他只要得两票就能够了,给P2一枚金币就可让他投票赞同这个方案,由于在接下来P3的方案中P2什么也得不到。P5也是相同的推理方法只不过他要说服他的两个同伴,因而他给每个在P4方案中什么也得不到的P1和P3一枚金币,本身留下98枚。
  依此类推,最终P10的最佳方案是:他本身得96枚,给每个在P9方案中什么也得不到的P二、P四、P6和P8一枚金币。
  结果,“海盗分金”最后的结果是P一、P二、P三、P四、P五、P六、P七、P八、P九、P10各能够得到0、一、0、一、0、一、0、一、0、96枚金币。
  在“海盗分金”中,任何“分配者”想让本身的方案得到经过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
  真地是难以置信。P10看起来最有可能喂鲨鱼,但他紧紧地把握住先发优点,结果不但消除了死亡威胁,还得到了最大收益。而P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都没法分到,却只可以保住性命而已。
  世界图书出版公司 ”

 
2、最通常性、可随意更改数据的解释。

 
一、问题的提出:

  5个海盗抢到了100颗宝石,每一颗都同样的大小和价值连城。
  他们决定这么分:
  1。抽签决定本身的号码(1,2,3,4,5)
  2。首先,由1号提出分配方案,而后你们5人进行表决,当且超过半数或半数的人赞成时,按照他的提案进行分配,不然将被扔入大海喂鲨鱼。
  3。若是1号死后,再由2号提出分配方案,而后你们4人进行表决,当且仅当半数和超过半数的人赞成时,按照他的提案进行分配,不然将被扔入大海喂鲨鱼。
  4。以次类推......
  条件:
  每一个海盗都是很聪明的人,都能很理智的判断得失,从而作出选择。
  问题:
  第一个海盗提出怎样的分配方案才可以使本身的收益最大化
  (若是在规则中加上下面一条会更加完善:海盗在本身的收益最大化的前提下乐意看到其余海盗被扔入大海喂鲨鱼。不加也说的过去,由于其余海盗被扔入大海喂鲨鱼符合每一个海盗的最大化利益。)

 
二、讨论以下:

  使用倒推法:
  1、假设一、二、3号已被扔入海中,则4号的方案必为100、0,且一定经过。故5号在获得3号1个宝石的状况下会坚定支持3号的方案。
  2、3号的方案必为9九、0、1,且一定经过。故4号在获得2号1个宝石的状况下会坚定支持2号的方案。
  3、2号的方案必为9九、0、一、0,且一定经过。2号不能把给4号的1个宝石给5号,5号未必坚决地支持2号的方案,由于3号一定经过的方案也能让他获得1个宝石。为了万无一失的保命,2号必须选4号,且一定经过。故3号、5号在各获得1号1个宝石的状况下会坚定支持1号的方案。
  4、1号的方案必为9八、0、一、0、1,且一定经过。
  故答案是:98,0,1,0,1。
  关于上述推理与网友讨论一下: (1)对于上面推理中的:
  “2、3号的方案必为9九、0、1,且一定经过。故4号在获得2号1个宝石的状况下会坚定支持2号的方案。”
  有网友认为应修改成:
  “2、3号的方案必为9九、0、1,且一定经过。三号知道这一份宝石必须给五号,由于四号了为要所有金币确定要反对本身。
  理由是:“二号已经死了,三号不会考虑四号支持二号的这个问题!”
  (2)讨论以下:
  在制订分金规则时,都“很聪明”“能很理智的判断得失”的5名海盗经过上面的推理就已经都知道:按照分金规则,只要本身运气好、抽到1 号,就能使本身的利益“合法地”最大化,即便抽不到1号,最坏的状况是抽到2号或4号、分到0个宝石,决不会“被扔入大海喂鲨鱼”。并且每一个海盗抽到1 号、“利益合法地最大化”的机会均等,这也正是5名海盗“都”赞成分金规则的根本缘由。
  又由于5名海盗都“很聪明”“能很理智的判断得失”,因此若是没抽到1号,即便是运气最差的抽到2号或4号、分到0个宝石的海盗,也都懂得遵照规则,由于他们知道若是不遵照规则,要求推倒重来、再制订新的分金规则,一样没法保证在本身“利益合法地最大化”时、不会被运气最差的其余海盗要求推倒重来。这样来回折腾下去,结果是:
  ①要么不分宝石,每一个人永远只有0个宝石。对运气最差的海盗来讲,还不如接受此分金规则的结果(即分0个宝石),由于分金规则被本身接受以后,分金规则从此继续得以执行,本身之后还有“利益合法地最大化”的机会。对运气好点的就更不用说了;
  ②要么之内斗的方式解决,进入“丛林法则”。那样的结果可能就会更惨,由于对运气最差的海盗来讲,他没法保证在内斗时“被扔入大海喂鲨鱼”的不是本身,除非他以为本身有足够的能力把其余海盗扔入大海喂鲨鱼,但那样他们5个就不须要制订分金规则了,就天然进入“丛林法则”了,会先“结盟生存”,最终“适者生存”。
  (3)由以上推理可见:
  ①当海盗进行此推理时,5个海盗都还活者 ,并且这是他们第一次分金。
  ②此推理涉及到了“先有鸡仍是先有蛋”的悖论。世上只因此既有了鸡又有了蛋、此推理只因此没有从“分金规则”异化为“丛林法则”,在于:
  虽然这是他们第一次分金,虽然他们都还不知道其余海盗也都“很聪明”“能很理智的判断得失”、在分金规则被5个海盗都赞成以前,他们在进行上面推理时都先假设了一、二、3号不“很聪明”、不“能很理智的判断得失”,但当分金规则被5个海盗都赞成的那一刻,5个海盗都明白了其余海盗也都“很聪明”“能很理智的判断得失”(正所谓英雄识英雄、英雄所见略同、惺惺相惜、“方信道,惺惺自古惜惺惺。”——《西厢记》),因而“分金规则”得以遵照、执行,并进入良性循环。
  若是5个海盗中的某些海盗不一样意“分金规则”,即有部分海盗不“很聪明”、不“能很理智的判断得失”,会形成“分金规则”没法得以执行,则将从“分金规则”异化到“丛林法则”的“结盟生存”阶段,由一个联盟消灭另外联盟。生存下来的这个联盟,其成员若都“很聪明”“能很理智的判断得失”,则自动执行“分金规则”;若都不“很聪明”、不“能很理智的判断得失”,则进入“丛林法则”的“适者生存”的阶段;若部分“很聪明”“能很理智的判断得失”、部分不“很聪明”、不“能很理智的判断得失”,则再次进入“结盟生存”阶段。
  (4)对多方博弈的启示:
  ①以何种方式博弈由短板决定。长板必须学习并采起短板的博弈方式。对长板来讲,最理想的固然是与长板博弈了。但愿这一天能早日在我国实现、在东亚或亚洲实现、在全球实现。那将是人类之福祉。
  ②宇宙法则造就万物,妙趣横生。对于“被扔入大海喂鲨鱼”这条规则的设计,执行时是用不上的,但缺了这条却不行。可见规则设计的重要性和妙处。
  ③此为微软试题。微软视高盛为最大对手,理由是高盛把人才都抢走了。
  (5)推理过程具体以下:
  推理①:
  假设①:一、二、3号已被扔入海中,由4号分宝石。
  由假设①推理出:
  结论① :4号的方案必为100、0,且一定经过。(故4号不可能被扔入海中,与假设①不矛盾)
  推理②:(要用到推理①的结论)
  假设②:一、2号已被扔入海中,由3号分宝石。
  由结论①、假设② 推理出:
  结论②: 3号进行“推理①”的推理,获得结论①后,知道了:本身只需给5号多于0个宝石,即方案为9九、0、1,其方案就一定经过。(故3号不可能被扔入海中,与假设②不矛盾,只要与假设②不矛盾就好了,与假设①没有丝毫关系,由于它们是两个互相独立的推理。)
  余下的推理你们依次类推。
  (6)经过上面清晰的推理路线,会发现:“假设①”只在“推理①”中有效,推理①与推理②是互相独立的,明白了这点就茅塞顿开,不会再说:“二号已经死了,三号不会考虑四号支持二号的这个问题!” 并且推理②用不上“三号知道这一份宝石必须给五号,由于四号了为要所有宝石确定要反对本身。”这个前提。它是多余的。

 
三、本题可推广以下:

  有X(1=<X=<202)个海盗,100颗宝石,其它规则同上。
  则1号海盗的最大化收益 Y =101-((X+1)/2所得数取整)。
  (当X=201及X=202时,1号海盗的最大化收益为0,但可保命。)
  Z(2=<Z=<X)号海盗的收益:Z为奇数时收益为 1, Z为偶数时收益为 0 。
  对于X>202时状况,可先在X=500个的状况下进行讨论,而后再做推广。
  依然是使用倒推法。
  203号海盗必须得到102张同意票,但他没法用100个宝石收买到101名同伙的支持。所以,不管203号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。
  204号海盗必须得到102张同意票,203号为了能保住性命,就必须让204号的方案经过,避免由203号本身来提出分配方案,因此不管204号海盗提出什么样的方案,均可以获得203号的坚决支持。这样204号海盗就能够保命:他能够获得他本身的1票、203号的1票、以及用100个宝石收买到的100名同伙的同意票,恰好达到所需的半数支持。能从204号那里得到1个宝石的海盗,必属于按照202号海盗的方案将一无所得的那102名海盗之列。
  205号海盗必须得到103张同意票,但他没法用100个宝石收买到102名同伙的支持。所以,不管205提出什么样的分配方案,他都注定会被扔到海里去喂鱼。
  206号海盗必须得到103张同意票,他能够获得205号的坚决支持,但他没法用100个宝石收买到101名同伙的支持。所以,不管206号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。
  207号海盗必须得到104张同意票,他能够获得205号和206号的坚决支持,但他没法用100个宝石收买到101名同伙的支持。所以,不管207号提出什么样的分配方案,他都注定会被扔到海里去喂鱼。
  208号海盗必须得到104张同意票,他能够获得205号、206号、207号的坚决支持,加上他本身1票以及收买的100票,使他得以保命。从208号那里得到1个宝石的海盗,必属于那些按照204号方案将一无所得的那104名海盗之列。
  如今能够看出一条新的、此后将一直有效的规律:那些方案能经过的海盗(他们的分配方案全都是把宝石用来收买100名同伙,本身连1个宝石都得不到)相隔的距离愈来愈远,而在他们之间的海盗则不管提出什么样的方案都会被扔进海里。所以,为了保命,他们必会投票支持排在他们前面的海盗提出的任何分配方案。得以免葬身鱼腹的海盗包括20一、20二、20四、20八、21六、23二、26四、32八、456号,
  即200+一、200+二、200+四、200+八、200+1六、200+3二、200+6四、200+12八、200+256。即
  200+2的0次幂,200+2的1次幂,200+2的2次幂,200+2的3次幂,200+2的4次幂,200+2的5次幂,200+2的6次幂,200+2的7次幂,200+2的8次幂,
  即其号码等于200加2的某次幂。

 
四、对本题做更通常的推广,以下:

  有X个海盗,A 颗宝石,其它规则同上。
  当X=<2A+2时,
  则1号海盗的最大化收益 Y=A+1-((X+1)/2所得数取整)。
  (当X=2A+1及X=2A+2时,1号海盗的最大化收益为0,但可保命。)
  Z号(2=<Z=<X)海盗的收益:Z为奇数时收益为 1, Z为偶数时收益为 0 。
  当X>2A+2时,
  若X=2A+2的B次幂,则1号海盗可保命,但无收益。其余海盗的收益状况由前面讨论可知有规律,但海盗的编号不固定,对它们的表述省略。
  若X不等于2A+2的某次幂,设B=b是能使(X>2A+2的B次幂)成立的最大B,则(X+1-(2A+2的b次幂))号海盗可保命,但无收益。以前的海盗都会被扔到海里去喂鱼。以后的海盗的收益状况由前面讨论可知有规律,但海盗的编号不固定,对它们的表述省略。

五、其它

  著名数学家和经济学家,加利福尼亚州 帕洛阿尔托 的 Stephen M. Omohundro 在1998年对此类问题进行了解答。   本题是该类问题的一个具体题目:   微软经典面试题------海盗分宝石,20分钟给出答案便可得到年薪8万美金的职位:   5个海盗抢到了100颗宝石,即 X=5,A=100。   此类问题体现出的多方博弈状况下的生存哲学:   一、没有永恒的朋友,只有永恒的利益。   二、在临界点之下,以决策者的身份出场,冒最大的风险,获得最大的利益。   三、在接近临界点的地方,是收益分配最接近公平的地方。半数的人均匀地受益,另半数的人均匀地不受益。   四、越过临界点以后,以决策者的身份出场,风险极大,甚至会将老本赔进去,而收益却为零,这是最糟的状况,由于你们的收益都不高。这是一种不稳定的状态,系统会经过自我调整向临界点靠拢。   五、永远都不可能发生全部人都有收益的状况,任什么时候候都有至少 一半或者接近一半 人无收益,除非只有1我的。   另外,若是逻辑推理没有漏洞,那么结论就一定站得住脚,即便它与你的直觉矛盾。