青蛙与缓存:简化实用版动态规划

1. 从一只青蛙提及

青蛙

话说有一只青蛙,想要跳下n级台阶下水塘,它每次能够跳1个台阶或者2个台阶,那么请问它一共有多少种跳法下水塘(好比,n=30时)?python

用数学的语言来看,咱们须要求一个青蛙跳的函数f(n),对这种自变量取值为非负整数的函数,咱们能够从比较小的状况开始考虑,不可贵到f(1)=1, f(2)=2,问题是之后的穷举愈来愈麻烦。面试

想象你就是那只青蛙,面对n级台阶,第一次你能够先跳1级,那么剩下n-1级,有f(n-1)种跳法,第一次也能够跳两级,那么剩下n-2级,有f(n-2)种跳法,因此这个问题的答案并不陌生,是神奇的斐波拉契数列:算法

\begin{aligned} F_{0} &=0 \\ F_{1} &=1 \\ F_{n} &=F_{n-1}+F_{n-2} \quad(\mathrm{n} \geq 2) \end{aligned}

解决这类求函数值问题的第一步,是找到一个递推式。咱们把递推式翻译成python代码:数组

def fib(n):
    if n==0:
        return 1
    if n==1:
        return 1
    return fib(n-1)+fib(n-2)
复制代码
%%time
fib(30)

Wall time: 269 ms
832040
复制代码

运行时间284ms,有够慢的,为何慢?由于重复计算实在太多,以计算f(5)为例,调用关系以下:缓存

f(5)==>f(4), f(3)
f(4)==>f(3), f(2), f(3)==>f(2), f(1)
f(3)==>f(2), f(1), f(2)==>f(1), f(0), f(2)==>f(1), f(0), f(1)
f(2)==>f(1), f(0), f(1), f(1), f(0), f(1), f(0), f(1)
f(1), f(0), f(1), f(1), f(0), f(1), f(0), f(1)
复制代码

那么一个很天然的想法是咱们把中间计算结果都缓存下来,幸运的是,python中自带了这个“电池”。bash

from functools import lru_cache
@lru_cache()
def fib(n):
    if n==0:
        return 1
    if n==1:
        return 1
    return fib(n-1)+fib(n-2)
复制代码
%%time
fib(30)
Wall time: 0 ns
832040
复制代码

快到没计量出时间来。python中lru_cache的基本原理是构建一个字典,字典的key为调用参数,value就是该参数的计算结果。大体等价于以下代码:函数

def fib(n):
    if n in fib.cache:
        return fib.cache[n]
    if n==0:
        ans = 1
    elif n==1:
        ans = 1
    elif:
        ans = fib(n-1)+fib(n-2)
    fib.cache[n] = ans
    return ans
fib.cache = {}
复制代码

固然,针对这个问题,咱们可使用更加细致的缓存方法, 乃至去掉递归改用循环(至关于只保留两个缓存,大大减小了空间占用,可是若是咱们要反复计算各个n值,那么或许前一个方法才更合适):spa

def fib(n):
    a, b = 0, 1
    for i in range(n):
        a, b = b, a+b
    return a
复制代码

本题等同于 leetcode 70, 在leetcode上的python3解答以下:翻译

from functools import lru_cache
class Solution:
 @lru_cache()
    def climbStairs(self, n: int) -> int:
        if n==0:
            return 1
        if n==1:
            return 1
        return self.climbStairs(n-1)+self.climbStairs(n-2)
复制代码

执行用时52 ms,内存消耗13.2MB。设计

2. 简化实用版动态规划

咱们从这只青蛙中取得比较通用的启示,解决相似的可构造递推函数的问题:

  1. 寻找一个递推关系,创建递归函数,问题变成多个子问题的求解;
  2. 为了防止反复计算一样的子问题,使用缓存,用空间换时间。

在通常的算法教材或面试题解中,会花很多时间来设计这个缓存结构,在实际的工程问题中,咱们可能对多使用一些缓存空间没有那么敏感,所以只须要开发递归函数,再加上通用的缓存方案就基本解决问题了。只有在缓存空间成为问题时,咱们才须要进一步去考虑适应问题的更小的缓存。

为了检验这套方案,咱们再看几道题,直接在leetcode上再找几个来刷。

最大子序和

给定一个整数数组 nums ,找到一个具备最大和的连续子数组(子数组最少包含一个元素),返回其最大和。

示例:

输入: [-2,1,-3,4,-1,2,1,-5,4], 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。

咱们考虑数组中每个位置结尾能获得的最大和的递推关系。

\begin{aligned}  f(0)&=nums(0) \\ f(k)&=max(f(k-1), 0)+nums(k) \quad(k>0) \end{aligned}

基于此不可贵到最终结果为

ans = max_{i=0}^n(f(i))

在leetcode中翻译成python3代码以下:

from functools import lru_cache
class Solution:
    def maxSubArray(self, nums: List[int]) -> int:
        self.nums = nums
        return max(self.f(i) for i in range(len(nums)))
    
 @lru_cache()
    def f(self, k):
        if k == 0:
            return self.nums[0]
        else:
            return max(self.f(k-1), 0) + self.nums[k]
复制代码

执行耗时76 ms,内存消耗13.7 MB。

最小路径和

给定一个包含非负整数的 m x n 网格,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。

示例:

输入: [ [1,3,1], [1,5,1], [4,2,1] ] 输出: 7 解释: 由于路径 1→3→1→1→1 的总和最小。

将矩阵中每一个位置做为右下角,求最小路径和,不可贵到以下递推公式:

\begin{aligned} 
f(0, 0)&=grid(0, 0) \\
f(x, 0)&=f(x-1, 0)++grid(x, 0) \quad(x>0) \\
f(0, y)&=f(0, y-1)++grid(0, y) \quad(y>0) \\
f(x, y)&=min(f(x-1, y), f(x, y-1))+grid(x, y) \quad(x>0, y>0) 
\end{aligned}

在leetcode中翻译成python3代码以下:

from functools import lru_cache
class Solution:
    def minPathSum(self, grid: List[List[int]]) -> int:
        self.grid = grid
        return self.f(len(grid)-1, len(grid[0])-1)
 @lru_cache()
    def f(self, x, y):
        if x == 0 and y == 0:
            return self.grid[0][0]
        elif y == 0:
            return self.f(x-1, 0) + self.grid[x][0]
        elif x == 0:
            return self.f(0, y-1) + self.grid[0][y]
        else:
            return min(self.f(x-1,y), self.f(x,y-1)) + self.grid[x][y]
复制代码

执行耗时1052ms,内存消耗13.9M。

相关文章
相关标签/搜索