【论如何定义dp table】 2020-10-04（未允禁转）

2020-10-05 本文已影响0人 9_SooHyun

关于dp基础，见dp基础

1. dp table = 当前问题规模 + 当前问题状态

dp问题，首先要定义出dp table，然后找到对应的状态转移方程。如何定义dp table成为解决问题的前提

如何定义dp table，

对于简单的单状态dp问题，我们依靠经验、直觉、灵感等，定义出合适的dp table不会有很大的困难。因为状态单一，dp table仅仅用来刻画问题规模的变化
对于多状态dp问题，如果没有一个普适的思路，那么定义dp table也将变得困难，因为dp table既要描述问题规模，也要描述问题所在的状态，这样一来，相应的dp table也是高维的，这时经验、直觉、灵感就难以解决问题

归纳上面的分析，实际上，不管是多状态dp还是单状态dp，dp table都要正确描述2个方面的信息，【当前问题规模 + 当前问题状态】。只是单状态dp的状态单一，可以省略不去描述

dp = dp[scale][status]

[scale]可以是一维的，也可以是二维的，三维的，等等，要看具体问题。即

dp[i][status] or dp[i][j][status] or etc

[status]也可以是一维的（单状态），也可以是二维的，三维的，等等（多状态）。即

dp[scale][status1] or dp[scale][status1][status2] or etc

2. 实例

leetcode中，股票系列问题是很好的实例
本文也是参考股票问题系列通解（转载翻译）和Most consistent ways of dealing with the series of stock problems形成

股票系列的通用问题是，

给出一个数组prices，表示一只股票每一天的价格。求最多交易k次能够获得的最大利润
买卖规则：每次买入该股票时，必须未持有任何数量的股票。买卖一次视为一次交易

解：
首先直观感受，当前能够获得的最大利润，必然和这之前股票的买卖情况相关，这里面应该存在一个不同规模间的状态转移关系，可以dp。而dp就是暴力，多了备忘录的暴力，暴力就是尝试每一种买卖情况，总是可以得答案的。这么想下来，dp基本上能做

定义dp table，找scale和status。scale就是一维的[i]，表示到第i天的最大利润；status，这里有两类状态，分别是
status1 -> k，表示当天操作后至多交易了k次，取值[0, k]
status2 -> stock_keep，表示当天操作后股票持有情况，取值[0,1]，1持有，0不持有
这样，dp table就是如下形式
dp[scale][status1][status2] = dp[i][k][stock_keep]

状态转移方程
以买进作为一次交易的标志，则
dp[i][k][0] = max(dp[i - 1][k][0], dp[i - 1][k][1] + prices[i])
dp[i][k][1] = max(dp[i - 1][k][1], dp[i - 1][k - 1][0] - prices[i])
以卖出作为一次交易的标志，则
dp[i][k][0] = max(dp[i - 1][k][0], dp[i - 1][k - 1][1] + prices[i])
dp[i][k][1] = max(dp[i - 1][k][1], dp[i - 1][k][0] - prices[i])

确定dp的base
base = 各规模的初始状态对应的最优dp值 + 最小规模的所有状态对应的最优dp值

返回dp[-1][k][0]

leetcode122. 买卖股票的最佳时机 II

给定一个数组，它的第 i 个元素是一支给定股票第 i 天的价格。
设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易（多次买卖一支股票）

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        # 考虑把price缩小一点，就变成一个子问题，不同规模的问题可以转移。因此可以dp
        # dp[scale][status] -> dp[i][status]，表示在第i天时最后一次操作是buy/sell的最大利润

        l = len(prices)
        if l == 0 or l == 1:
            return 0
        dp = [[0, 0] for i in range(l)]
        # 初始化dp
        dp[0][0] = -prices[0]
        # 填充dp
        for i in range(1, l):
            # 状态转移方程
            dp[i][0] = max(dp[i-1][1] - prices[i], dp[i-1][0]) # buy
            dp[i][1] = max(dp[i-1][0] + prices[i], dp[i-1][1]) # sell
        # print(dp)
        return max(dp[-1])

leetcode 188. 买卖股票的最佳时机 IV

给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。
设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。
注意: 你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）

以买进作为一次交易的标志

class Solution:
    def maxProfit(self, k: int, prices: List[int]) -> int:
        if not prices:
            return 0
        
        def getMax(nums):
            res = 0
            base = nums[0]
            for i in range(1, len(nums)):
                if nums[i] >= base:
                    res += (nums[i] - base)
                base = nums[i]
            return res

        
        l = len(prices)
        # 如果k超过了prices长度的一半，直接简化成getMax(prices)
        if k > l // 2:
            return getMax(prices)

        ### dp 代码 ###
        # 以买进作为一次交易的标志
        # 3维dp
        dp = [[[0 for i in range(2)] for j in range(k+1)] for _ in range(l)]
        # 初始化dp base
        # 【各规模的初始状态】
        for i in range(l):
            dp[i][0][0] = 0
            dp[i][0][1] = 0
        # 【最小规模的所有状态】
        for i in range(1, k+1):
            dp[0][i][0] = 0
            dp[0][i][1] = -prices[0]
        
        for i in range(1, l):
            for kk in range(1, k+1):
                dp[i][kk][0] = max(dp[i - 1][kk][0], dp[i - 1][kk][1] + prices[i])
                dp[i][kk][1] = max(dp[i - 1][kk][1], dp[i - 1][kk - 1][0] - prices[i])
        return dp[-1][k][0]
        ### dp 代码 ###

以卖出作为一次交易的标志

class Solution:
    def maxProfit(self, k: int, prices: List[int]) -> int:
        if not prices:
            return 0
        
        def getMax(nums):
            res = 0
            base = nums[0]
            for i in range(1, len(nums)):
                if nums[i] >= base:
                    res += (nums[i] - base)
                base = nums[i]
            return res

        
        l = len(prices)
        # 如果k超过了prices长度的一半，直接简化成getMax(prices)
        if k > l // 2:
            return getMax(prices)

        ### dp 代码 ###
        # 以卖出作为一次交易的标志
        # 3维dp
        dp = [[[0 for i in range(2)] for j in range(k+1)] for _ in range(l)]
        # 初始化dp base
        # 【各规模初始状态】
        for i in range(l):
            dp[i][0][0] = 0
            dp[i][0][1] = -min(prices[:i+1])
        # 【最小规模所有状态】
        for i in range(1, k+1):
            dp[0][i][0] = 0
            dp[0][i][1] = -prices[0]
        
        # 状态转移
        for i in range(1, l):
            for kk in range(1, k+1):
                dp[i][kk][0] = max(dp[i - 1][kk][0], dp[i - 1][kk - 1][1] + prices[i])
                dp[i][kk][1] = max(dp[i - 1][kk][1], dp[i - 1][kk][0] - prices[i])
        return dp[-1][k][0]
        ### dp 代码 ###

【论如何定义dp table】 2020-10-04（未允禁转）

1. dp table = 当前问题规模 + 当前问题状态

2. 实例

leetcode122. 买卖股票的最佳时机 II

leetcode 188. 买卖股票的最佳时机 IV

猜你喜欢

热点阅读