Python破解 斗地主残局 ,对王,而后3带2!

相信你们都玩过斗地主,规则就再也不介绍了。缓存

直接上一张朋友圈看到的残局图:函数

这道题我刚看到时,曾尝试用手工来破解,每次都觉得找到了农民的必胜策略时,最后都发现其实农民跑不掉。因为手工破解没法穷尽全部可能性,因此这道题究竟农民有没有妙手跑掉呢,只能经过代码来帮助咱们运算了。学习

本文将简要讲述怎么经过代码来求解此类问题,在最后会公布残局的最后结果优化

minimaxspa

代码的核心思想是minimax。minimax能够拆解为两部分,mini和max,分别是最小和最大的意思。code

直观的理解是什么呢?就有点像A、B两我的下棋。A如今能够在N个点走棋,假设A在某个点走棋了,使得A的这一步的盘面评估分数最高;可是轮到B下的时候,就必定会朝着让A最不利的方向走,使得A的下一步必然按照B设定的轨迹来,而无法达到A在第一步时估算到这一步的最高盘面评分。blog

在牌局中是同样的,若是农民的一手牌,让地主不管如何应对都不能赢的话,那么能够说农民有必胜策略;不然,农民必输。递归

核心逻辑ip

咱们能够用一个函数hand_out来模拟一我的的出牌过程。在现实生活中,一我的想要出牌的话,必然须要知道本身手上的全部牌:me_pokers,也须要知道上一手的出的牌:last_hand。若是咱们要用这个函数来模拟两我的的出牌,则还须要知道对手当前的全部牌:enemy_pokers。rem

这个函数的返回值,是轮到我me_pokers出牌时,是否可以必赢牌。若是能赢则返回真,不然返回假。

def hand_out(me_pokers, enemy_pokers, last_hand)

假设轮到我出牌时,若是我手上的牌都出完了,那么我将马上知道我赢了;反之若是对手的牌都出完了,而我没有,则我失败了。

if not me_pokers:
    return True
if not enemy_pokers:
    return False

由于如今轮到我出牌,因此我首先须要知道我如今能出的全部手牌组合。注意:这个组合中,包括过牌(即不出牌)的策略。

all_hands = get_all_hands(me_pokers)

如今咱们要对全部可能的手牌组合进行遍历。

首先我须要知道,上一手对方出的牌是什么。

若是对方上一手选择过牌,或者没有上一手牌,那么我这一轮必须不能过牌,可是我能够出任意的牌
若是对手上一手出了牌,则我必需要出一个比它更大的牌或者选择这一轮直接过牌(不出牌)
关键点来了,在出完个人牌或选择过牌后,咱们须要用一个递归调用来模拟对手下一步的行为。若是对手的下一次出牌不能获胜的话,则我这一次的出牌必胜;不然,对于个人每个出牌选择,对手都能获胜的话,则我必败。

所有代码以下:

def hand_out(me_pokers, enemy_pokers, last_hand, cache):
    if not me_pokers:
        # 我所有过牌,直接获胜
        return True
    if not enemy_pokers:
        # 对手所有过牌,我失败
        return False
    # 获取我当前能够出的全部手牌组合,包括过牌
    all_hands = get_all_hands(me_pokers)
    # 遍历个人全部出牌组合,进行模拟出牌
    for hand in all_hands:
        # 若是上一轮对手出了牌,则这一轮我必需要出比对手更大的牌 或者 对手上一轮选择过牌,那么我只需出任意牌,可是不能过牌
        if (last_hand and can_comb2_beat_comb1(last_hand, hand)) or (not last_hand and hand['type'] != COMB_TYPE.PASS):
            # 模拟对手出牌,若是对手不能取胜,则我必胜
            if not hand_out(enemy_pokers, make_hand(me_pokers, hand), hand, cache):
                return True
        # 若是上一轮对手出了牌,但我这一轮选择过牌
        elif last_hand and hand['type'] == COMB_TYPE.PASS:
            # 模拟对手出牌,若是对手不能取胜,则我必胜
            if not hand_out(enemy_pokers, me_pokers, None, cache):
                return True
    # 若是以前的全部出牌组合均不能必胜,则我必败
    return False

以上核心逻辑理清楚后,构建破解器将变得十分简单。

首先,咱们要用数字来表示牌的大小,这里咱们用3表示3,11来表示J,12表示Q,依次类推……

其次,咱们须要求出一个手牌的全部出牌组合,这里须要get_all_hands函数,具体实现比较繁琐可是很简单,就不在此赘述。

而后,咱们还须要一个牌力判断函数can_comb2_beat_comb1(comb1, comb2),这个函数用于比较两组手牌的牌力,看是否comb2能够击败comb1。惟一须要注意的一点,在斗地主的规则中,除了炸弹外,其余全部牌力均等,只有牌型同样时才能去比较。

最后,咱们须要一个模拟出牌函数make_hand(pokers, hand),用于求出在手牌为pokers的状况下打出一手牌hand后,剩下的手牌,实现也很是简单,只需简单的移除掉那些打出的牌便可。

效率

因为一副牌的可能手牌巨大,致使递归的分支数巨大。因此时间开销很是大,为阶乘级O(N!),根据斯特林公式,大约为O(N^N)。

因为可能会有不少重复的牌面出现,致使了不少重复的递归调用。因此加一个缓存能极大提高效率。

即对我方手牌和敌方手牌和上一轮手牌的描述(str(me_pokers)+str(enemy_pokers)+str(last_hand))为键,将求出的结果存进缓存字典中。下一次遇到相同的局面时,便可直接从缓存字典中取出,而无需再次重复计算。时间复杂度优化为指数级O(C^N)。

结果

代码运算出来的结果是,农民没有必胜策略。换言之,只要地主会玩,农民不可能赢。阶级固化已经如斯了么……

若是你们想找一个Python学习环境,能够加入咱们的Python学习圈: 784758214 ,咱们相互帮助,相互关心,相互分享内容,这样出问题帮助你的人就比较多,群号是784758214,这样就能够找到大神聚合,若是你只愿意别人帮助你,不肯意分享或者帮助别人,那就请不要加了,你把你会的告诉别人这是一种分享。
相关文章
相关标签/搜索