【算法】背包问题初探

时间 2019-11-06

标签算法背包问题初探繁體版

原文原文链接

【01背包问题】算法

　　背包问题是一类问题。一般其模型就是往一个背包里面装各类物品，来求一个极限状况时的物品明细或者某些物品属性。把这些描述给具体化能够获得不少不一样分化的背包问题。数组

　　01背包问题是背包问题中基础的一类。其描述是：app

　　有n个物品分别编号为a1,a2,a3...an。这些物品每一个都有两个属性，分别是重量和价值，物品ai对应的重量和价值分别用wi和vi表示。而后咱们手里还有一个背包，这个背包有一个容量属性volumn，意思是这个背包可以装下的最重的重量是volumn。ide

　　咱们要求解的是，在背包不被撑爆的状况下，如何安排物品的放入才能使背包中物品价值vi的总和最大化。函数

　　这个问题中的几个细节还须要强调一下：测试

　　1. 物品是个不是类，也就是说a1,a2...都只有一个，针对一个物品放入背包的操做只能作一次。对于“类”的背包问题，称为彻底背包问题，下面有机会细说优化

　　2. 物品没法分割，好比放入背包二分之一个a1这样的操做是不容许的。要么物品放入，要么不放入。这也是01背包问题中01这个前缀的由来。事实上，对于这种可分割的物品（好比把物品换算成多少钱一斤的糖果，这样感受上就是一种可分割的背包问题），可使用贪心算法来解决，还略微简单一些。因为是说明01，因此不展开了。spa

　　3. 题目中没有要求刚好装满背包，也就是说容许背包中有空。若是要求刚好装满背包，则能够稍稍修改01背包问题的算法实现。code

　　■　　动态规划求解blog

　　很明显，当选取一些物品放入背包以后，剩下物品中还能放入哪些物品受到以前放入物品决策的影响。所以能够经过动态规划的思想来解决。

　　（尝试了一下可否经过本身的语言来说一下这个算法从无到有的前因后果，不过发现仍是搞不太清… 目前先把现成的作法拿过来，等之后有机会再来解释解释原理）

　　咱们构造这样一个二维数组做为动态规划的中间值存储。这个数组的元素res[i][j]，指的是从a1到ai这(i-1)个物品中选出若干个物品放入最大承重量为 j 的背包，此时可以取到的物品总价值的最大值。（我不是很能理解为何 j 是最大承重量为 j 的背包。事实上，咱们手中并不存在一个最大承重量是j的背包，这个背包是虚拟的）显然，全部的res[0][j]表明了0件物品放入承重为j的背包，此时最大价值确定是0，由于没有物品。相对的，res[i][0]表明了i件物品放入承重为0的背包，因为背包彻底不承重，天然一个物品都不能放，因此其总价值也是0。其实到这里已经能够看出来，res这个二维数组的第一行和第一列的全部元素都是0。而咱们比较关注的部分的i的取值是1到n，j的取值是1到volumn。

　　到这里，其实感受这个二维数组很是像求最长子序列时须要构造的那个东西，也是第一行第一列置0。有了这样一个构造以后，后续数据的填充就不困难了。

　　对于二维数组中的一个元素res[i][j]，其实能够看到，分红是否将ai放入背包两种状况。

　　1. 若是不将ai放入背包，那么很明显，res[i][j]应该等于res[i-1][j]

　　2. 若是将ai放入背包，则res[i][j] == res[i-1][j-wi]。这个判断最开始我也想不太明白，主要问题是咱们没有在作彻底背包问题，总感受j-wi不精确等于i-1个物品时，取物品的总质量，这样的推断不太可靠。可是后来想了想，加入j-wi和i-1个物品时，取物品的总质量之间有一些“空隙”的话，那么这些空隙必然是不能容纳a(i-1)以前其余未进入背包的物品的，不然物品的总价值还能够继续变大。所以j-wi再加上wi以后，这个空隙仍是存在，而且依然不能容纳更多的物品。所以这个等式没毛病。

　　除了这两种状况以外，其实咱们还应该注意到，若是j < wi，那么j-wi变成了负数，显然不是咱们指望的。事实上，j < wi的意思是说ai的重量已经超过了当前背包最大承重量，此时ai确定不能加入背包。所以当j < wi的时候不用考虑第二种状况，直接走第一种状况。（事实上在Python中不这么处理可能不会报错，由于负下标是指从倒数开始计数的，可是这样的话数据确定不正确了）

　　填充数据时从1,1位置开始，一直走到最右下角。填充完毕以后，数组中的每一个元素都是相应i(对a1,a2...ai这些物品而言)和j(对背包总承重量为j的时候而言)时，能够取到的背包中物品价值最大值的状况。

　　显然，若是只是求V的最大值的话，直接取最右下角元素的值便可。

　　若是咱们想要求出此时背包中物品的明细，参照之前作最长公共子序列的作法，从右下角元素回溯上去，找出一条路径便可。此次咱们关心的，是每一行（即每一个i）的物品是否取。

　　具体而言，能够作一个由n个0构成的数组，对于要取的物品ai，将对应下标是i的元素置为1便可。而判断当前行的那个物品要不要取，就看当前所在数组元素的值的来源便可。若是这个值和同一列上一行的值(即[i-1][j])相同，说明这个物品并无取。不然就认为取了，而后将当前的j减去这个物品的重量，i再减去1，获得的新的res[i][j]就是没有加入这个物品前背包的状态，以此类推直到走到

　　综上所述，代码以下：（下面这个代码是附加结构代替递归模式的DP，若是要改形成递归也不困难，就是搞一个填充(i,j)位置的函数，而后按照代码中的逻辑填充数据便可。无非是调用入口的i,j是右下角的i,j）

# -*- coding:utf-8 -*-

def knapsack(_weight,_value,_volumn):
    '''
    :param _weight:  物品重量参数列表
    :param _value:   物品价值参数列表
    :param _volumn:   背包容量
    '''
    weight = list(_weight)
    weight.insert(0,0)    # 在头上加一个0，方便构造那个二维数组
    value = list(_value)
    value.insert(0,0)
    volumn = _volumn + 1  # 列数也加1，方便构造二维数组

    n = len(weight)
    res = [[0 for i in range(volumn)] for j in range(n)]

    for i in range(1,n):
        for j in range(1,volumn):
            # 从1,1位置开始填充数据
            if j < weight[i]:
                res[i][j] = res[i-1][j]
            else:
                res[i][j] = max(res[i-1][j], res[i-1][j-weight[i]]+value[i])
                # j-weight[i]，加入i,j的状况下总重量不到j，留出的空档不足以让一个新元素放进来
                # 那么减去weight[i]以后留下的空档依然是不够任何一个元素放进来的

    # 打印一下整个二维数组看下状况
    for row in res:
        for item in row:
            print item,'\t',
        print ''

    hot = [0] * (n-1)  # n是算上了第一个元素0的长度，结果列表里没必要包含这个0所以减1
    i,j = n-1,volumn-1
    while i > 0 and j > 0:
        if res[i-1][j] == res[i][j]:
            i -= 1
        else:
            hot[i-1] = 1  # 别忘了这里也要减1
            i -= 1
            j -= weight[i]

    print hot

if __name__ == '__main__':
    weight = [2,2,6,5,4]
    value = [6,3,5,4,6]
    volumn = 10
    knapsack(weight,value,volumn)

View Code

　　上面的测试数据中途生成的整个二维数组应该是这样的：

　　好比看res[2][3]这一格，意思是a1,a2做为可取物品，背包总承重量是3的状况可以取的最大价值。由于a1,a2的重量都是2，因此二者只能取其一放入背包，而a1的价值是6，a2的价值是3，天然取a1入背包比较好。

　　至于回溯路径，从res[5][10]开始回溯的话，标红的几个格子就是几个关键节点，表示V达到格子中的值时是经过了取了第i个物品所致的。

　　■　　优化

　　上述算法，若是说物品数量是M件，而背包大小是N的话，那么整体的时间复杂度是O(M*N)（恰好两层循环）。而空间复杂度很好判断，就是多用了这么一个二维数组结构，是O(M*N)。

　　和不少DP问题相似，在时间复杂度上，优化的空间不大，可是在空间复杂度上，若是不考虑放入物品的明细，只是求出最大价值的话，能够将二维数组优化为一个一维数组求解。

　　原理很简单，就是把一维数组视做上面二维数组里面的每一行，而后一遍遍地遍历修改更新数组中的值，使之成为下一行，直到最后一行。

　　在这个过程当中，如何遍历更新数组中的值很是重要。通常咱们想到简单的从左到右依次遍历，可是这个动态规划的状态转移方程中，设咱们的一维数组是vtable，那么要求是vtable[k] = max(vtable[k], vtable[k-weight] + value)，也就是说绝对vtable[k]的值的因素，还有一个vtable[k-weight]这样一个处于vtable左边的值。所以依次遍历若是是从左到右，可能在决定vtable[k]的时候其左端的值被改变从而没法求出正确的值。通常来讲，实践上会把遍历的顺序调整为从右到左。整个核心遍历过程的伪代码以下：

for i in 1..M，M是物品个数
    for j in N..0，N是背包大小
        vtable[j] = max(vtable[j], vtable[j-weight]+value)， weight,value是当前i对应物品的属性

　　能够看到，里层循环的循环顺序是从N到0，倒过来的。基于这个伪代码咱们能够很快写出Python的相关代码，而且作一些逻辑的补充和优化：

def knapsack(weights,values,pack):
    num = len(weights)
    vtable = [0] * (pack+1)
    # vtable = [0] + ([float('-inf')] * pack)   # 2
    for i in range(num):
        weight = weights[i]
        value = values[i]
        for j in range(pack,weight-1,-1):
            # if j - weight < 0:   # 1
            #     continue
            vtable[j] =  max(vtable[j],vtable[j-weight]+value)

    return vtable

print knapsack([2,2,6,5,4],[6,3,5,4,6],10)

　　这里能够注意一下，vtable初始化的长度应该是背包最大承重 + 1，由于要在逻辑上考虑背包承重为0的状况。而外层循环的i能够直接从0开始，由于上面二维数组中i是0的状况的那一行已经在vtable的初始化中给出了，即都是0的那行数组。

　　这段代码的输出是[0, 0, 6, 6, 9, 9, 12, 12, 15, 15, 15]，刚好也应该是以前二维数组的最后一行的值。

　　而后看注释#1处，按照上面给出的伪代码，里层循环应该是for j in range(pack, -1, -1)，而后为了不j - weight是负数的状况，在循环中加上一条continue条件。因为这个循环十分简单，能够直接将j - weight < 0的条件加载循环控制条件中。即range(pack ,weight - 1, -1)。

　　再看注释#2处。这个地方初始化采用了只有第一项（即j = 0，背包最大承重为0的时候）为0，其他项都初始化为负无穷的策略。这个策略是用来解决“刚好装满”的01背包问题的。方法是这么个方法，可是为何是这样呢？经典背包九讲中的解释是，能够理解为，不要求“刚好装满”时，只要背包内物品不超过最大承重量，背包的状态都是合法的，有机会将这种状态记录到结果集中。初始状态下无论j是多大，因为放入的物品是0，即不放入任何物品，总价值天然也是0，因此都初始化为0。另外一方面，若是要求“刚好装满”，除了j=0的状态是合法的外，其他任何大于0的j，放入物品为0时都不属于“装满”状态，所以都不能做为合法状态，一次你初始化为负无穷。

　　以负无穷表示非法状态的好处是，-inf无论加上的value是多少仍然是-inf。也就是说，非法的状态（好比背包有空隙时），不管再加入多少个什么物品（加入物品的同时j也变大，因此以前的空隙不会被填满）都仍是非法的。反过来，合法的状态再加入任何物品，只要不超过实际的背包承重量pack，也都是合法的。

　　只须要在初始化的时候进行这么一个简单的改造，就可使得不要求“刚好装满”的变成了要求“刚好装满”的。另外须要指出，这个“刚好装满”的控制条件普适于几乎全部的背包问题。

　　利用一维数组解01背包问题，不只仅是空间复杂度下降这个意义而已，不少扩展的背包问题的算法都要基于一维01背包算法，所以应该好好记住。

　　重申下几个重点。

　　1. 里层循环的逆序遍历 2. 里层循环循环控制条件优化 3. 数组初始化长度应+1 4. 数组初始化值的不一样对应是否刚好装满问题

【彻底背包问题】

　　上面也说过了，彻底背包问题中，可选的物品再也不是一件件，而是一类类的了。也就是说，每种物品均可以取用无数次放入背包。

　　■　　预处理

　　在彻底背包的场景中，有一些以前01背包问题中不是很明朗的东西变得很清晰。好比对于物品，咱们能够作一个预处理了。预处理包括了两方面:

　　1. 若是一种物品am和另外一种an，知足weights[m] <= weights[n] and value[m] >= value[n]，那么咱们就能够很是自信地说，an物品能够扔掉了。由于任何一个带有an的分配状况中，把全部的an都换成am，总可使得重量不超标的状况下总价值增长（准确的说是不减小）。

　　2. weight[k] > pack的那些ak物品也能够直接扔掉了，由于背包根本装不下这些物品哪怕只有一件，这个其实在01背包中也是成立的。

　　对于第二点，实现起来很方便，只要遍历的时候加个条件便可。

　　对于第一条就要稍微思考一下了。我本身的解决思路是现将weights从小到大排序，同时也将values按照weights排序的顺序进行从新排列。而后从头开始用i遍历这两个数组。因为对于weights而言随着i的增大weights[i]都会增大，所以只要关注values[i]的变化状况。而values[i]这个东西，若是它的值小于以前values中出现过的最大值，那么说明当前的这个i 对应的weights和values应该被舍弃，由于在它以前能够找到一个weights小于它可是values大于它的东西；反之，若是它的值大于以前的最大值，那么就能够更新最大值。以前的那个最大值要不要也舍弃，这个取决于weights[i]和weights[max_i]是否相同。若是相同，那么相同重量的物品，确定是取价值大的一种。若是不一样，那么不能直接舍弃。

　　下面是个人代码实现，直接按想法写出来的，比较弱…：

def preprocess(_weights,_values,pack):
    def double_sort(w,v,left,right):  # 由于涉及到同步排序，直接本身用快排实现了
        if left >= right:
            return
        pivot = w[left]
        i = idx = left + 1
        while i <= right:
            if w[i] <= pivot:
                w[idx],w[i] = w[i],w[idx]
                v[idx],v[i] = v[i],v[idx]
                idx += 1
            i += 1
        idx = idx - 1
        w[left],w[idx] = w[idx],w[left]
        v[left],v[idx] = v[idx],v[left]
        double_sort(w,v,left,idx-1)
        double_sort(w,v,idx+1,right)

    weights,values = list(_weights),list(_values)
    leng = len(weights)
    double_sort(weights,values,0,leng-1)
    max,maxIdx,drop = values[0],0,[]   # 三个变量分别记录values出现过的最大值，最大值所在下标，全部要被舍弃的物品的下标
    for i in range(1,leng):
        if weights[i] > pack:   # 对于出现超重的记录，能够直接将剩余记录都舍弃（由于从小到大排列）就结束了
            drop.extend(range(i,leng))
            break
        if max >= values[i]:   # 当前value小于历史最大值状况
            drop.append(i)
        else:
            if weights[maxIdx] == weights[i]:    # 两物品同重量状况
                drop.append(maxIdx)    # 舍弃以前那个，若不一样重量则不能舍弃
            max = values[i]    # 更新历史最大值
            maxIdx = i
    # 返回值中，全部drop中存在的下标的物品都不用了
    resWeight = [weights[i] for i in range(leng) if i not in drop]
    resValue = [values[i] for i in range(leng) if i not in drop]

    return resWeight,resValue

　　值得一说的是，最开始我误觉得求的只是性价比，即单纯的value/weight，可是立刻发现这样不对劲。好比weights = [2,3]以及values=[20,29]这样两种物品，显然第一种物品的性价比高，而按照上述算法这两种物品都会被保留。若是要求装一个容量是3的背包，那么最大价值显然是装一个重量是3的进去而不是2。所以，2虽然性价比比3高，可是不能直接舍弃3。反过来，若是values=[20,19]，此时按照上述算法3会被抛弃。而事实上，装一个容量是3的背包的时候，装一个3进去还不如装一个2进去的价值高，所以能够舍弃3。

　　■　　主要逻辑

　　预处理完成后，就能够看看到底如何选择物品来解决彻底背包问题了。

　　按照最上面的二维数组DP解法，能够获得状态转移方程是res[i][j] = max(res[i-1][j], res[i][j-weight] + value)。res[i-1][j]的意思是不取用第i种物品，而res[i][j-weight]，因为如今第i种物品能够取用若干次，因此“加取一件第i种物品”后总价值，其来源不该该是“明确不取用第i种物品”的res[i-1][j-weight]，而是“有可能取用了若干个第i种物品”的res[i][j-weight]。因此二维数组的解法，01背包和彻底背包相差就只有这么一点细节。

　　二维数组解法的具体代码就不写了。下面基于这个二维数组的推导式，尝试找用一维数组就能解决的办法。

　　一维数组的状况，状态转移方程和01问题时如出一辙。即vtable[k] = max(vtable[k], vtable[k-weight] + value)。这是能够理解的，由于不管是01仍是彻底，其取一件物品的时候都面临的是取or不取两个选择。那么不一样之处在哪里？在01问题的时候，咱们强调过算法里层循环的逆序特征。回忆一下，那是由于推导res[i][j]的值的时候要用到res[i-1][j-height]，而[i-1]在一维数组遍历的时候，指“上一次遍历结果”，所以整个数组要从右往左遍历以求当前值左边的全部值都还保持着“上一次遍历结果”时的状态。而到了彻底问题中，用到的值变成了res[i][j-weight]，[i]此时表示的，是“本次遍历结果”，即彻底问题中，遍历一维数组时要保证当前元素左边的全部元素都是通过本次遍历，而被更新过了的数据。换言之，遍历顺序变为了从左到右。

　　事实上，遍历顺序的改变也是惟一的，01问题和彻底问题在一维数组DP算法上的差异。伪代码：

for i = 1..M, M是物品种类数
    for j = 0..N，N是背包最大承重量
        vtable[j] = max(vtable[j], vtable[j-weight] + value)，weight和value是当前i对应物品的重量和价值

　　再次重申，彻底问题的算法和01问题的差异只在里层循环遍历方向上，前者逆序，后者顺序（固然是以一维数组DP做为解决算法的前提下）

　　参照上述伪代码和01问题中的代码，很容易就能够写出彻底背包问题的代码：

def totalknap(weights, values, pack):
    num = len(weights)
    vtable = [0] * (pack + 1)
    for i in range(num):
        weight = weights[i]
        value = values[i]
        for j in range(weight,pack+1):    # 注意循环控制条件，仍是j-weight不小于0
            vtable[j] = max(vtable[j], vtable[j-weight] + value)

    return vtable

　　固然这段代码里没加预处理。此外，正如上面01问题中提到的，vtable的初始化方式能够控制“是否刚好塞满”这个子问题。