最近工做中碰到一个需求:咱们的数据表有多个维度,任意多个维度组合后进行 group by 可能会产生一些”奇妙”的反应,因为不肯定怎么组合,就须要将全部的组合都列出来进行尝试。html
抽象一下就是从一个集合中取出任意元素,造成惟一的组合。如 [a,b,c]
可组合为 [a]、[b]、[c]、[ab]、[bc]、[ac]、[abc]
。java
要求以下:git
看到这里,就应该想到高中所学习的排列组合了,一样是从集合中取出元素造成一个另外一个集合,若是集合内元素位置随意,就是组合
,从 b 个元素中取 a 个元素的组合有 种。而若是要求元素顺序不一样也视为不一样集合的话,就是排列
,从 m 个元素取 n 个元素的排列有 种。github
我遇到的这个需求就是典型的组合,用公式来表示就是从元素个数为 n 的集合中列出 种组合。算法
转载随意,文章会持续修订,请注明来源地址:https://zhenbianshu.github.io 。数组
文中算法用 Java 实现。ide
对于这种需求,首先想到的固然是穷举。因为排列的要求较少,实现更简单一些,若是我先找出全部排列,再剔除因为位置不一样而重复的元素,便可实现需求。假设须要从 [A B C D E] 五个元素中取出全部组合,那么咱们先找出全部元素的全排列,而后再将相似 [A B] 和 [B A] 两种集合去重便可。学习
咱们又知道 ,那么咱们先考虑一种状况 ,假设是 ,从 5 个元素中选出三个进行全排列。fetch
被选取的三个元素,每个均可以是 ABCDE 之一,而后再排除掉造成的集合中有重复元素的,就是 5 选 3 的全排列了。编码
代码是这样:
private static Set<Set<String>> exhaustion() { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); Set<Set<String>> result = new HashSet<>(); int count = 3; for (int a = 1; a < m.size(); a++) { for (int b = 0; b < m.size(); b++) { for (int c = 0; c < m.size(); c++) { Set<String> tempCollection = new HashSet<>(); tempCollection.add(m.get(a)); tempCollection.add(m.get(b)); tempCollection.add(m.get(c)); // 若是三个元素中有重复的会被 Set 排重,致使 Set 的大小不为 3 if (tempCollection.size() == count) { result.add(tempCollection); } } } } return result; }
对于结果组合的排重,我借用了 Java 中 HashSet 的两个特性:
能够注意获得,上面程序中 count 参数是写死的,若是须要取出 4 个元素的话就须要四层循环嵌套了,若是取的元素个取是可变的话,普通的编码方式就不适合了。
注: 可变层数的循环能够用 递归
来实现。
穷举毕竟太过暴力,咱们来经过分治思想来从新考虑一下这个问题:
分治的思想总的来讲就是”大事化小,小事化了”,它将复杂的问题往简单划分,直到划分为可直接解决的问题,再从这个直接能够解决的问题向上聚合,最后解决问题。
从 M 个元素中取出 N 个元素整个问题很复杂,用分治思想就能够理解为:
仍是从 5 个元素中取 3 个元素的示例:
用代码实现以下:
public class Combination { public static void main(String[] args) { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); int n = 5; Set<Set<String>> combinationAll = new HashSet<>(); // 先将问题分解成 五取1、五取二... 等的全排列 for (int c = 1; c <= n; c++) { combinationAll.addAll(combination(m, new ArrayList<>(), c)); } System.out.println(combinationAll); } private static Set<Set<String>> combination(List<String> remainEle, List<String> tempCollection, int fetchCount) { if (fetchCount == 1) { Set<Set<String>> eligibleCollections = new HashSet<>(); // 在只差一个元素的状况下,遍历剩余元素为每一个临时集合生成多个知足条件的集合 for (String ele : remainEle) { Set<String> collection = new HashSet<>(tempCollection); collection.add(ele); eligibleCollections.add(collection); } return eligibleCollections; } fetchCount--; Set<Set<String>> result = new HashSet<>(); // 差多个元素时,从剩余元素中取出一个,产生多个临时集合,还须要取 count-- 个元素。 for (int i = 0; i < remainEle.size(); i++) { List<String> collection = new ArrayList<>(tempCollection); List<String> tempRemain = new ArrayList<>(remainEle); collection.add(tempRemain.remove(i)); result.addAll(combination(tempRemain, collection, fetchCount)); } return result;