球盒模型:回溯算法穷举的两种视角
本文讲解的例题
LeetCode | 力扣 | 难度 |
---|---|---|
78. Subsets | 78. 子集 | 🟠 |
46. Permutations | 46. 全排列 | 🟠 |
阅读本文之前,需要你熟悉 回溯算法核心框架 以及 回溯算法秒杀所有排列/组合/子集问题。
在上面这两篇文章中,有读者提出了不同的排列/组合/子集代码写法,比如通过 swap
元素实现全排列,还有没有 for 循环的子集解法代码。我之前不提这些不同的解法,是为了保持这些问题解法形式的一致性,如果在一开始就给大家太多选择,反而容易让人迷糊。
在这篇文章,我不仅会具体介绍之前没有讲到的回溯算法写法,还会告诉你为什么可以那样写,两种写法的本质区别是什么。
先说结论
1、回溯算法穷举的本质思维模式是「球盒模型」,一切回溯算法,皆从此出,别无二法。
2、球盒模型,必然有两种穷举视角,分别为「球」的视角穷举和「盒」的视角穷举,对应的,就是两种不同的代码写法。
3、从理论上分析,两种穷举视角本质上是一样的。但是涉及到具体的代码实现,两种写法的复杂度可能有优劣之分。你需要选择效率更高的写法。
球盒模型这个词是我随口编的,因为下面我会用「球」和「盒」两种视角来解释,你理解就好。
暴力穷举思维方法:球盒模型
一切暴力穷举算法,都从球盒模型开始,没有例外。
你懂了这个,就可以随心所欲运用暴力穷举算法,下面的内容,请你仔细看,认真想。
首先,我们回顾一下以前学过的排列组合知识:
1、P(n, k)
(也有很多书写成 A(n, k)
)表示从 n
个不同元素中拿出 k
个元素的排列(Permutation/Arrangement)总数;C(n, k)
表示从 n
个不同元素中拿出 k
个元素的组合(Combination)总数。
2、「排列」和「组合」的主要区别在于是否考虑顺序的差异。
3、排列、组合总数的计算公式:
排列 P(n, k)
好,现在我问一个问题,这个排列公式 P(n, k)
是如何推导出来的?为了搞清楚这个问题,我需要讲一点组合数学的知识。
排列组合问题的各种变体都可以抽象成「球盒模型」,P(n, k)
就可以抽象成下面这个场景:
即,将 n
个标记了不同序号的球(标号为了体现顺序的差异),放入 k
个标记了不同序号的盒子中(其中 n >= k
,每个盒子最终都装有恰好一个球),共有 P(n, k)
种不同的方法。
现在你来,往盒子里放球,你怎么放?其实有两种视角。
首先,你可以站在盒子的视角,每个盒子必然要选择一个球。
这样,第一个盒子可以选择 n
个球中的任意一个,然后你需要让剩下 k - 1
个盒子在 n - 1
个球中选择(这就是子问题 P(n - 1, k - 1)
):
另外,你也可以站在球的视角,因为并不是每个球都会被装进盒子,所以球的视角分两种情况:
1、第一个球可以不装进任何一个盒子,这样的话你就需要将剩下 n - 1
个球放入 k
个盒子。
2、第一个球可以装进 k
个盒子中的任意一个,这样的话你就需要将剩下 n - 1
个球放入 k - 1
个盒子。
结合上述两种情况,可以得到:
你看,两种视角得到两个不同的递归式,但这两个递归式解开的结果都是我们熟知的阶乘形式:
至于如何解递归式,涉及数学的内容比较多,这里就不做深入探讨了,有兴趣的读者可以自行学习组合数学相关知识。
组合 C(n, k)
了解了排列的推导过程,组合的推导是类似的,也是以球和盒两种视角来做选择,也可以写出两种等价形式。你不妨停在这里思考几分钟,看看你能不能自己发明出组合的推导过程。
下面我来带你推导,组合 C(n, k)
可以抽象成下面这个场景:
因为在组合问题中,我们不在乎元素的顺序,即 {1, 2, 3}
和 {1, 3, 2}
视为同一种组合。所以我们不需要对盒进行编号,可以认为只有一个盒,其容量是 k
。
现在你来,往盒子里放球,你怎么放?还是有两种视角。
首先,你可以站在盒子的视角,盒子必然要装 k
个球。
那么第一个球可以选择 n
个球中的任意一个,然后盒子剩余 k - 1
个位置,你需要在剩下的 n - 1
个球中选择(这就是子问题 C(n - 1, k - 1)
)。
想到这里,是不是就想列出关系式 C(n, k) = nC(n - 1, k - 1)
了?
不对,这里有个坑,你直接 nC(n - 1, k - 1)
是有重复的,正确的答案应该是 nC(n - 1, k - 1) / k
:
举例说明
举例来说就容易看出来了,比方说让你在 [1,2,3,4,5]
中选择 3 个元素,有多少种不同的组合?
你站在盒的视角,盒子容量为 3,开始穷举,第一个位置,你可以选择球 1,2,3,4,5
中的任意一个,比如说选了球 1
。
接下来你需要在剩下的元素 2,3,4,5
中选择两个元素,比方说最终你穷举出的组合是 {1,3,4}
。
要想知道是否有重复,重复了几次,你就盯紧这个 {1, 3, 4}
,它如果有重复,其他组合结果都会重复。
容易发现,如果我第一次选择的是球 3
,然后我可能得到 {3, 1, 4}
;如果我第一次选择的是球 4
,那么我可能得到 {4, 1, 3}
;这两种情况都是和 {1, 3, 4}
重复的,因此 {1, 3, 4}
共出现了三次。
有的读者会问,只有这两种情况是重复的吗?类似 {3, 4, 1}
这种情况不也是重复的吗?
不是,因为我们组合不考虑顺序,{3, 4, 1}
和 {3, 1, 4}
都是球 3
开头,所以是等价的。
综上,你不能直接用 nC(n - 1, k - 1)
,因为其中每种组合都出现了 k
次,所以要再除以 k
消除重复。
另外,你也可以站在球的视角,因为并不是每个球都会被装进盒子,所以球的视角分两种情况:
1、第一个球可以不装进盒子,这样的话你就需要将剩下 n - 1
个球放入 k
个盒子。
2、第一个球可以装进盒子,这样的话你就需要将剩下 n - 1
个球放入 k - 1
个盒子。
结合上述两种情况,可以得到:
注意组合和前面排列的区别,因为组合不考虑顺序,所以球选择装进盒子时,只有一种选择,而不是 k
种不同选择,所以 C(n-1, k-1)
不用乘 k
。
你看,两种视角得到两个不同的递归式,但这两个递归式解开的结果都是我们熟知的组合数公式:
至于如何解递归式,涉及数学的内容比较多,这里就不做深入探讨了。
上面的内容,我带你从头推导了排列组合的数学公式,但数学不是我的重点,重点在于,你有没有对「穷举」这个事情有了更深的理解?
用球盒模型重新理解全排列问题
好,上面从数学的角度介绍了全排列穷举的两种视角,现在回归到代码上,我要考你了哦。
前文 回溯算法核心框架 和 回溯算法秒杀排列/组合/子集的九种变体 都给出过全排列的代码。
就以最基本的元素无重不可复选的全排列为例,我直接把代码 copy 过来:
class Solution {
List<List<Integer>> res = new LinkedList<>();
// 记录回溯算法的递归路径
LinkedList<Integer> track = new LinkedList<>();
// track 中的元素会被标记为 true
boolean[] used;
// 主函数,输入一组不重复的数字,返回它们的全排列
public List<List<Integer>> permute(int[] nums) {
used = new boolean[nums.length];
backtrack(nums);
return res;
}
// 回溯算法核心函数
void backtrack(int[] nums) {
// base case,到达叶子节点
if (track.size() == nums.length) {
// 收集叶子节点上的值
res.add(new LinkedList(track));
return;
}
// 回溯算法标准框架
for (int i = 0; i < nums.length; i++) {
// 已经存在 track 中的元素,不能重复选择
if (used[i]) {
continue;
}
// 做选择
used[i] = true;
track.addLast(nums[i]);
// 进入下一层回溯树
backtrack(nums);
// 取消选择
track.removeLast();
used[i] = false;
}
}
}
class Solution {
public:
vector<vector<int>> res;
// 记录回溯算法的递归路径
vector<int> track;
// track 中的元素会被标记为 true
vector<bool> used;
// 主函数,输入一组不重复的数字,返回它们的全排列
vector<vector<int>> permute(vector<int>& nums) {
used = vector<bool>(nums.size(), false);
backtrack(nums);
return res;
}
// 回溯算法核心函数
void backtrack(vector<int>& nums) {
// base case,到达叶子节点
if (track.size() == nums.size()) {
// 收集叶子节点上的值
res.push_back(track);
return;
}
// 回溯算法标准框架
for (int i = 0; i < nums.size(); i++) {
// 已经存在 track 中的元素,不能重复选择
if (used[i]) {
continue;
}
// 做选择
used[i] = true;
track.push_back(nums[i]);
// 进入下一层回溯树
backtrack(nums);
// 取消选择
track.pop_back();
used[i] = false;
}
}
};
class Solution:
def __init__(self):
self.res = []
self.track = []
self.used = []
# 主函数,输入一组不重复的数字,返回它们的全排列
def permute(self, nums):
self.used = [False] * len(nums)
self.backtrack(nums)
return self.res
# 回溯算法核心函数
def backtrack(self, nums):
# base case,到达叶子节点
if len(self.track) == len(nums):
# 收集叶子节点上的值
self.res.append(self.track[:])
return
for i in range(len(nums)):
# 已经存在 track 中的元素,不能重复选择
if self.used[i]:
continue
# 做选择
self.used[i] = True
self.track.append(nums[i])
# 进入下一层回溯树
self.backtrack(nums)
# 取消选择
self.track.pop()
self.used[i] = False
func permute(nums []int) [][]int {
res := [][]int{}
track := []int{}
used := make([]bool, len(nums))
// 回溯算法核心函数
var backtrack func(nums []int)
backtrack = func(nums []int) {
// base case,到达叶子节点
if len(track) == len(nums) {
// 收集叶子节点上的值
temp := make([]int, len(track))
copy(temp, track)
res = append(res, temp)
return
}
// 回溯算法标准框架
for i := 0; i < len(nums); i++ {
// 已经存在 track 中的元素,不能重复选择
if used[i] {
continue
}
// 做选择
used[i] = true
track = append(track, nums[i])
// 进入下一层回溯树
backtrack(nums)
// 取消选择
track = track[:len(track)-1]
used[i] = false
}
}
backtrack(nums)
return res
}
var permute = function(nums) {
const res = [];
// 记录回溯算法的递归路径
const track = [];
// track 中的元素会被标记为 true
const used = new Array(nums.length).fill(false);
// 回溯算法核心函数
function backtrack(nums) {
// base case,到达叶子节点
if (track.length === nums.length) {
// 收集叶子节点上的值
res.push([...track]);
return;
}
// 回溯算法标准框架
for (let i = 0; i < nums.length; i++) {
// 已经存在 track 中的元素,不能重复选择
if (used[i]) {
continue;
}
// 做选择
used[i] = true;
track.push(nums[i]);
// 进入下一层回溯树
backtrack(nums);
// 取消选择
track.pop();
used[i] = false;
}
}
backtrack(nums);
return res;
};
小试牛刀
请问,这个解法是以什么视角进行穷举的?是以球的视角还是盒的视角?给你三分钟思考,请回答!
点击查看我的答案
这个代码是以盒的视角进行穷举的,即站在每个位置的角度来选择球,站在 nums
中的每个索引,来选择不同的元素放入这个索引位置。
为什么是这个答案呢?假设 nums
里面有 n
个数字,那么全排列问题相当于把 n
个球放到包含 n
个位置的盒子里,要求盒子必须装满,问你有几种不同的装法。
以盒的视角理解,盒子的第一个位置可以接收 n
个球的任意一个,有 n
种选择,第二个位置可以接收 n - 1
个球的任意一个,有 n - 1
种选择,第三个位置有 n - 2
种选择,以此类推。
我直接用 算法可视化面板 把递归树画出来,你一眼就可以看懂了。请你把进度条拖到最后让整棵回溯树显示出来,然后把鼠标在每一层节点上横向移动,观察递归树节点和树枝上的值:
这个算法确实还可以优化
我在 回溯算法核心框架 和 回溯算法秒杀排列/组合/子集的九种变体 中都写了上面这段代码,很多读者看了之后就跑来跟我说啊,他看的那个全排列算法是通过 swap
操作来计算的,不需要 used
数组的额外空间,比我讲解的回溯算法框架效率高,怎么怎么的。
是的,我之所以不用那个 swap
的解法,是因为前面那两篇文章的重点在于实践回溯算法「做选择」和「撤销选择」的思维框架,用 used
数组的解法更容易让初学者理解。但从算法效率上说,确实有更高效的代码实现方法。
下面就满足大家的好奇心,跟大家讲讲那个传说中的 swap
的解法,到底是何方神圣。
首先,我列出那个使用 swap
计算全排列的解法代码,请你先看一下:
class Solution {
List<List<Integer>> result = new ArrayList<>();
public List<List<Integer>> permute(int[] nums) {
backtrack(nums, 0);
return result;
}
// 回溯算法核心框架
void backtrack(int[] nums, int start) {
if (start == nums.length) {
// 找到一个全排列,Java 需要转化成 List 类型
List<Integer> list = new ArrayList<>();
for (int num : nums) {
list.add(num);
}
result.add(list);
return;
}
for (int i = start; i < nums.length; i++) {
// 做选择
swap(nums, start, i);
// 递归调用,传入 start + 1
backtrack(nums, start + 1);
// 撤销选择
swap(nums, start, i);
}
}
void swap(int[] nums, int i, int j) {
int temp = nums[i];
nums[i] = nums[j];
nums[j] = temp;
}
}
class Solution {
private:
vector<vector<int>> result;
public:
vector<vector<int>> permute(vector<int>& nums) {
backtrack(nums, 0);
return result;
}
// 回溯算法核心框架
void backtrack(vector<int>& nums, int start) {
if (start == nums.size()) {
// 找到一个全排列,Java 需要转化成 List 类型
result.push_back(nums);
return;
}
for (int i = start; i < nums.size(); i++) {
// 做选择
swap(nums, start, i);
// 递归调用,传入 start + 1
backtrack(nums, start + 1);
// 撤销选择
swap(nums, start, i);
}
}
void swap(vector<int>& nums, int i, int j) {
int temp = nums[i];
nums[i] = nums[j];
nums[j] = temp;
}
};
class Solution:
def __init__(self):
self.result = []
def permute(self, nums):
self.backtrack(nums, 0)
return self.result
# 回溯算法核心框架
def backtrack(self, nums, start):
if start == len(nums):
# 找到一个全排列,Python 直接转化成 List 类型
self.result.append(list(nums))
return
for i in range(start, len(nums)):
# 做选择
self.swap(nums, start, i)
# 递归调用,传入 start + 1
self.backtrack(nums, start + 1)
# 撤销选择
self.swap(nums, start, i)
def swap(self, nums, i, j):
temp = nums[i]
nums[i] = nums[j]
nums[j] = temp
// 全排列问题返回全排列结果函数
func permute(nums []int) [][]int {
var result [][]int
backtrack(nums, 0, &result)
return result
}
// 回溯算法核心框架
func backtrack(nums []int, start int, result *[][]int) {
if start == len(nums) {
// 找到一个全排列,Java 需要转化成 List 类型
list := append([]int(nil), nums...)
*result = append(*result, list)
return
}
for i := start; i < len(nums); i++ {
// 做选择
swap(nums, start, i)
// 递归调用,传入 start + 1
backtrack(nums, start + 1, result)
// 撤销选择
swap(nums, start, i)
}
}
func swap(nums []int, i int, j int) {
temp := nums[i]
nums[i] = nums[j]
nums[j] = temp
}
var permute = function(nums) {
const result = [];
// 回溯算法核心框架
function backtrack(start) {
if (start === nums.length) {
// 找到一个全排列,Python 直接转化成 List 类型
result.push([...nums]);
return;
}
for (let i = start; i < nums.length; i++) {
// 做选择
swap(start, i);
// 递归调用,传入 start + 1
backtrack(start + 1);
// 撤销选择
swap(start, i);
}
}
function swap(i, j) {
[nums[i], nums[j]] = [nums[j], nums[i]];
}
backtrack(0);
return result;
};
这个解法也可以正确计算全排列,请你思考,这段代码是以什么视角进行穷举的?是以球的视角还是盒的视角?
点击查看我的答案
答案是,这个解法是以盒的视角进行穷举的。即 nums
数组中的每个索引位置,来选择不同的元素放入这个索引位置。
你看解法代码也可以看出来,那个 start
参数就是当前在选择元素的索引位置,在 start
之前的元素已经心有所属,被其他位置挑走了,所以 start
位置只能从 nums[start..]
中选择元素。
我可以用 算法可视化面板 把递归树画出来,你一眼就可以看懂了。请你把进度条拖到最后让整棵回溯树显示出来,然后把鼠标在每一层节点上横向移动,观察递归树节点和树枝上的值:
拓展延伸
接下来一个很自然的问题,能不能写出一个以球的视角理解的全排列问题的解法?
当然可以,以球的视角来写全排列的解法代码,就是说 nums
中的每个元素来选择自己想去的索引,对吧。有了这个思路,代码还有何难写。
我先用 算法可视化面板 把递归树画出来,请你把进度条拖到最后让整棵回溯树显示出来,然后把鼠标在每一层节点上横向移动,观察递归树节点和树枝上的值,验证一下是不是元素在选索引:
当然我写的代码还有一些小优化的空间,比如说这个 swapIndex
其实就是 i
,而且我们其实不用等到 count == nums.length
,当 count == nums.length - 1
时就可以 return 了,因为最后剩的那个元素的位置不会找不到其他位置了。这些留给你优化吧。
class Solution {
// 结果列表
List<List<Integer>> res;
// 标记元素是否已被使用
boolean[] used;
// 记录有多少个元素已经选择过位置
int count;
public List<List<Integer>> permute(int[] nums) {
res = new ArrayList<>();
used = new boolean[nums.length];
count = 0;
backtrack(nums);
return res;
}
// 回溯算法框架
void backtrack(int[] nums) {
if (count == nums.length) {
List<Integer> temp = new ArrayList<>();
for (int num : nums) {
temp.add(num);
}
res.add(temp);
return;
}
// 找两个未被选择的位置
int originalIndex = -1, swapIndex = -1;
for (int i = 0; i < nums.length; i++) {
if (used[i]) {
continue;
}
if (originalIndex == -1) {
originalIndex = i;
}
swapIndex = i;
// 做选择,元素 nums[originalIndex] 选择 swapIndex 位置
swap(nums, originalIndex, swapIndex);
used[swapIndex] = true;
count++;
// 进入下一层决策树
backtrack(nums);
// 撤销选择,刚才怎么做的选择,就原样恢复
count--;
used[swapIndex] = false;
swap(nums, originalIndex, swapIndex);
}
}
void swap(int[] nums, int i, int j) {
int temp = nums[i];
nums[i] = nums[j];
nums[j] = temp;
}
}
class Solution {
public:
// 结果列表
vector<vector<int>> res;
// 标记元素是否已被使用
vector<bool> used;
// 记录有多少个元素已经选择过位置
int count;
vector<vector<int>> permute(vector<int>& nums) {
count = 0;
used = vector<bool>(nums.size(), false);
backtrack(nums);
return res;
}
// 回溯算法框架
void backtrack(vector<int>& nums) {
if (count == nums.size()) {
res.push_back(nums);
return;
}
// 找两个未被选择的位置
int originalIndex = -1, swapIndex = -1;
for (int i = 0; i < nums.size(); i++) {
if (used[i]) {
continue;
}
if (originalIndex == -1) {
originalIndex = i;
}
swapIndex = i;
// 做选择,元素 nums[originalIndex] 选择 swapIndex 位置
swap(nums, originalIndex, swapIndex);
used[swapIndex] = true;
count++;
// 进入下一层决策树
backtrack(nums);
// 撤销选择,刚才怎么做的选择,就原样恢复
count--;
used[swapIndex] = false;
swap(nums, originalIndex, swapIndex);
}
}
void swap(vector<int>& nums, int i, int j) {
int temp = nums[i];
nums[i] = nums[j];
nums[j] = temp;
}
};
class Solution:
def __init__(self):
# 结果列表
self.res = []
# 标记元素是否已被使用
self.used = []
# 记录有多少个元素已经选择过位置
self.count = 0
def permute(self, nums):
self.res = []
self.used = [False] * len(nums)
self.count = 0
self.backtrack(nums)
return self.res
# 回溯算法框架
def backtrack(self, nums):
if self.count == len(nums):
temp = [num for num in nums]
self.res.append(temp)
return
# 找两个未被选择的位置
originalIndex = -1
swapIndex = -1
for i in range(len(nums)):
if self.used[i]:
continue
if originalIndex == -1:
originalIndex = i
swapIndex = i
# 做选择,元素 nums[originalIndex] 选择 swapIndex 位置
nums[originalIndex], nums[swapIndex] = nums[swapIndex], nums[originalIndex]
self.used[swapIndex] = True
self.count += 1
# 进入下一层决策树
self.backtrack(nums)
# 撤销选择,刚才怎么做的选择,就原样恢复
self.count -= 1
self.used[swapIndex] = False
nums[originalIndex], nums[swapIndex] = nums[swapIndex], nums[originalIndex]
func permute(nums []int) [][]int {
// 结果列表
res := make([][]int, 0)
// 标记元素是否已被使用
used := make([]bool, len(nums))
// 记录有多少个元素已经选择过位置
count := 0
var backtrack func([]int)
// 回溯算法框架
backtrack = func(nums []int) {
if count == len(nums) {
temp := make([]int, len(nums))
copy(temp, nums)
res = append(res, temp)
return
}
// 找两个未被选择的位置
originalIndex := -1
swapIndex := -1
for i := 0; i < len(nums); i++ {
if used[i] {
continue
}
if originalIndex == -1 {
originalIndex = i
}
swapIndex = i
// 做选择,元素 nums[originalIndex] 选择 swapIndex 位置
swap(nums, originalIndex, swapIndex)
used[swapIndex] = true
count++
// 进入下一层决策树
backtrack(nums)
// 撤销选择,刚才怎么做的选择,就原样恢复
count--
used[swapIndex] = false
swap(nums, originalIndex, swapIndex)
}
}
backtrack(nums)
return res
}
func swap(nums []int, i, j int) {
nums[i], nums[j] = nums[j], nums[i]
}
var permute = function(nums) {
// 结果列表
var res = [];
// 标记元素是否已被使用
var used = Array(nums.length).fill(false);
// 记录有多少个元素已经选择过位置
var count = 0;
// 回溯算法框架
var backtrack = function(nums) {
if (count == nums.length) {
var temp = [];
for (var num of nums) {
temp.push(num);
}
res.push(temp);
return;
}
// 找两个未被选择的位置
var originalIndex = -1, swapIndex = -1;
for (var i = 0; i < nums.length; i++) {
if (used[i]) {
continue;
}
if (originalIndex == -1) {
originalIndex = i;
}
swapIndex = i;
// 做选择,元素 nums[originalIndex] 选择 swapIndex 位置
swap(nums, originalIndex, swapIndex);
used[swapIndex] = true;
count++;
// 进入下一层决策树
backtrack(nums);
// 撤销选择,刚才怎么做的选择,就原样恢复
count--;
used[swapIndex] = false;
swap(nums, originalIndex, swapIndex);
}
}
var swap = function(nums, i, j) {
var temp = nums[i];
nums[i] = nums[j];
nums[j] = temp;
}
backtrack(nums);
return res;
};
用球盒模型重新理解子集问题
有了前面的铺垫,我又要进一步为难你了。回溯算法秒杀排列/组合/子集的九种变体 都给出过子集问题的代码。
就以最基本的元素无重不可复选的子集为例,我直接把代码 copy 过来:
class Solution {
List<List<Integer>> res = new LinkedList<>();
// 记录回溯算法的递归路径
LinkedList<Integer> track = new LinkedList<>();
// 主函数
public List<List<Integer>> subsets(int[] nums) {
backtrack(nums, 0);
return res;
}
// 回溯算法核心函数,遍历子集问题的回溯树
void backtrack(int[] nums, int start) {
// 前序位置,每个节点的值都是一个子集
res.add(new LinkedList<>(track));
// 回溯算法标准框架
for (int i = start; i < nums.length; i++) {
// 做选择
track.addLast(nums[i]);
// 通过 start 参数控制树枝的遍历,避免产生重复的子集
backtrack(nums, i + 1);
// 撤销选择
track.removeLast();
}
}
}
class Solution {
public:
vector<vector<int>> res;
// 记录回溯算法的递归路径
vector<int> track;
// 主函数
vector<vector<int>> subsets(vector<int>& nums) {
backtrack(nums, 0);
return res;
}
// 回溯算法核心函数,遍历子集问题的回溯树
void backtrack(vector<int>& nums, int start) {
// 前序位置,每个节点的值都是一个子集
res.push_back(track);
// 回溯算法标准框架
for (int i = start; i < nums.size(); i++) {
// 做选择
track.push_back(nums[i]);
// 通过 start 参数控制树枝的遍历,避免产生重复的子集
backtrack(nums, i + 1);
// 撤销选择
track.pop_back();
}
}
};
class Solution:
def __init__(self):
self.res = []
# 记录回溯算法的递归路径
self.track = []
# 主函数
def subsets(self, nums: List[int]) -> List[List[int]]:
self.backtrack(nums, 0)
return self.res
# 回溯算法核心函数,遍历子集问题的回溯树
def backtrack(self, nums, start):
# 前序位置,每个节点的值都是一个子集
self.res.append(self.track[:])
# 回溯算法标准框架
for i in range(start, len(nums)):
# 做选择
self.track.append(nums[i])
# 通过 start 参数控制树枝的遍历,避免产生重复的子集
self.backtrack(nums, i + 1)
# 撤销选择
self.track.pop()
func subsets(nums []int) [][]int {
res := make([][]int, 0)
track := make([]int, 0)
// 回溯算法核心函数,遍历子集问题的回溯树
var backtrack func(start int)
backtrack = func(start int) {
// 前序位置,每个节点的值都是一个子集
tmp := make([]int, len(track))
copy(tmp, track)
res = append(res, tmp)
// 回溯算法标准框架
for i:=start; i<len(nums); i++ {
// 做选择
track = append(track, nums[i])
// 通过 start 参数控制树枝的遍历,避免产生重复的子集
backtrack(i+1)
// 撤销选择
track = track[:len(track)-1]
}
}
backtrack(0)
return res
}
var subsets = function(nums) {
var res = [];
// 记录回溯算法的递归路径
var track = [];
var backtrack = function(nums, start) {
// 前序位置,每个节点的值都是一个子集
res.push([...track]);
for (var i = start; i < nums.length; i++) {
// 做选择
track.push(nums[i]);
// 通过 start 参数控制树枝的遍历,避免产生重复的子集
backtrack(nums, i + 1);
// 撤销选择
track.pop();
}
}
backtrack(nums, 0);
return res;
};
再次小试牛刀
请问,这个解法是以什么视角进行穷举的?是以球的视角还是盒的视角?给你三分钟思考,请回答!
点击查看我的答案
这个解法是以盒的视角穷举的,即站在 nums
中的每个索引的视角,来选择不同的元素放入这个索引位置。
因为刚才讲的全排列问题会考虑顺序的差异,而子集问题不考虑顺序的差异。为了方便理解,我们这里干脆不说「球盒模型」了,说「球桶模型」吧,因为放进盒子的求给人感觉是有顺序的,而丢进桶里的东西给人感觉是无所谓顺序的。
那么,以桶的视角理解,子集问题相当于把 n
个球丢到容量为 n
的桶里,桶可以不装满。
这样,桶的第一个位置可以选择 n
个球中的任意一个,比如选择了球 i
,然后桶的第二个位置可以选择球 i
后面的球中的任意一个(通过固定相对顺序保证不会出现重复的子集),以此类推。
你看代码也能体现出来这种穷举过程:
// 回溯算法框架核心代码
void backtrack(int[] nums, int start) {
for (int i = start; i < nums.length; i++) {
track.addLast(nums[i]);
// 通过 start 参数控制树枝的生长
backtrack(nums, i + 1);
track.removeLast();
}
}
我继续用 算法可视化面板 来论证我的答案,请你把进度条拖到最后让整棵回溯树显示出来,然后把鼠标在每一层节点上横向移动,观察递归树节点和树枝上的值,你可以很直观地看明白,是桶的位置在选择球:
最后一次考你
既然上面说了,我给的子集问题解法是以桶的视角理解的,那么你能不能写出一个以球的视角理解的子集问题的解法?给你十分钟写代码。
如果你有这个时间,一定要亲自动手尝试一下,不要着急看我的答案。你能认真看到这里,肯定可以写出来的,不要怀疑。
点击查看我的思路
从球的视角理解,每个球都有两种选择,要么在桶中,要么不在桶中。这样,我们可以写出下面的代码:
class Solution {
// 用于存储所有子集的结果
List<List<Integer>> res;
// 用于存储当前递归路径的子集
List<Integer> track;
public List<List<Integer>> subsets(int[] nums) {
res = new ArrayList<>();
track = new ArrayList<>();
backtrack(nums, 0);
return res;
}
void backtrack(int[] nums, int i) {
if (i == nums.length) {
res.add(new ArrayList<>(track));
return;
}
// 做第一种选择,元素在子集中
track.add(nums[i]);
backtrack(nums, i + 1);
// 撤销选择
track.remove(track.size() - 1);
// 做第二种选择,元素不在子集中
backtrack(nums, i + 1);
}
}
class Solution {
public:
// 用于存储所有子集的结果
vector<vector<int>> res;
// 用于存储当前递归路径的子集
vector<int> track;
vector<vector<int>> subsets(vector<int>& nums) {
backtrack(nums, 0);
return res;
}
void backtrack(vector<int>& nums, int i) {
if (i == nums.size()) {
res.push_back(track);
return;
}
// 做第一种选择,元素在子集中
track.push_back(nums[i]);
backtrack(nums, i + 1);
// 撤销选择
track.pop_back();
// 做第二种选择,元素不在子集中
backtrack(nums, i + 1);
}
};
class Solution:
# 用于存储所有子集的结果
res = []
# 用于存储当前递归路径的子集
track = []
def subsets(self, nums):
self.res = []
self.track = []
self.backtrack(nums, 0)
return self.res
def backtrack(self, nums, i):
if i == len(nums):
self.res.append(self.track[:])
return
# 做第一种选择,元素在子集中
self.track.append(nums[i])
self.backtrack(nums, i + 1)
# 撤销选择
self.track.pop()
# 做第二种选择,元素不在子集中
self.backtrack(nums, i + 1)
func subsets(nums []int) [][]int {
// 用于存储所有子集的结果
var res [][]int
// 用于存储当前递归路径的子集
var track []int
var backtrack func(nums []int, i int)
backtrack = func(nums []int, i int) {
if i == len(nums) {
subset := make([]int, len(track))
copy(subset, track)
res = append(res, subset)
return
}
// 做第一种选择,元素在子集中
track = append(track, nums[i])
backtrack(nums, i+1)
// 撤销选择
track = track[:len(track)-1]
// 做第二种选择,元素不在子集中
backtrack(nums, i+1)
}
backtrack(nums, 0)
return res
}
var subsets = function(nums) {
// 用于存储所有子集的结果
var res = [];
// 用于存储当前递归路径的子集
var track = [];
// Inner function for backtracking
var backtrack = function(nums, i) {
if (i == nums.length) {
res.push([...track]);
return;
}
// 做第一种选择,元素在子集中
track.push(nums[i]);
backtrack(nums, i + 1);
// 撤销选择
track.pop();
// 做第二种选择,元素不在子集中
backtrack(nums, i + 1);
};
// Start backtracking
backtrack(nums, 0);
return res;
};
我继续用 算法可视化面板 来论证我的答案,请你把进度条拖到最后让整棵回溯树显示出来,然后把鼠标在节点上移动,观察递归树节点和树枝上的值:
这也解释了,为什么所有子集(幂集)的数量是 2^n
,因为每个元素都有两种选择,要么在子集中,要么不在子集中,所以其递归树就是一棵满二叉树,一共有 2^n
个叶子节点。
结论
照应一下开头,把几个结论再重写一遍,你现在应该更理解了。
1、回溯算法穷举的本质思维模式是「球盒模型」,一切回溯算法,皆从此出,别无二法。
你现在就去做 100 道回溯算法的题目,看看有没有意外,有意外你来打我。
2、球盒模型,必然有两种穷举视角,分别为「球」的视角穷举和「盒」的视角穷举,对应的,就是两种不同的代码写法。
暴力穷举就是如此朴实无华且枯燥,看起来花里胡哨,实则只有两种视角。
3、从理论上分析,两种穷举视角本质上是一样的。但是涉及到具体的代码实现,两种写法的复杂度可能有优劣之分。
进一步想想,为啥用「盒」的视角,即让索引取选元素的视角,可以用 swap
的方法把 used
数组给优化掉呢?
因为索引容易处理,如果你按顺序从小到大让每个索引去选元素,那么一个 start
变量作为分割线就能把已选元素和未选元素分开。
反过来,如果你让元素去选索引,那就只能依赖额外的数据结构来记录那些索引已经被选过了,这样就会增加额外的空间复杂度。
所以说,在开头的数学分析中,两种视角在数学上虽然是等价的,但具体到代码实现上,最优复杂度就可能不一样。
好的,最后留个悬念:只有写回溯算法时才会用到「球盒模型」这种思想吗?
你可以读一读 动态规划算法的两种视角,思考一下这个问题。
引用本文的题目
安装 我的 Chrome 刷题插件 点开下列题目可直接查看解题思路: