数组去重是一个老生常谈的话题,在面试中也常常会被问道。对于去重,有两种主流思想:javascript
- 先排序,线性遍历后去重,时间复杂度O(n*log2n);
- 使用哈希,空间换时间,时间复杂度O(n);
上一篇文章,我分析了underscore的函数是如何组织的,咱们可以依照这种方法书写本身的函数库,这篇文章,来看看关于函数去重underscore是如何作的?java
underscore的去重是指数组(Arrays)中uniq
函数,其API以下:面试
uniq_.uniq(array, [isSorted], [iteratee])
别名:unique
说明:返回 array去重后的副本, 使用 === 作相等测试. 若是您肯定 array 已经排序, 那么给 isSorted 参数传递 true值, 此函数将运行的更快的算法. 若是要处理对象元素, 传参 iterator 来获取要对比的属性.
上述API主要想说明几点:算法
a===b
,代表不只要值相等,类型也须要相等uniq
也能够比较对象,前提是须要指定比较的对象属性 咱们简单使用如下_.uniq(array, [isSorted], [iteratee])
,以下:数组
console.log(_.uniq([1,4,2,2,3,3])); console.log(_.uniq([1,2,2,2,3,3],true)); console.log(_.uniq([{ name:1, gender:"male" },{ name:2, gender:"female" },{ name:2, gender:"male" },{ name:4, gender:"male" }],true,"gender"));
结果以下:闭包
underscore去重的核心思想:函数
新建 结果集数组res
,遍历待 去重数组,将每一个遍历值在res
数组中遍历检查,将不存在当前res
中的遍历值压入res
中,最后输出res
数组。
function uniq(array){ var res = []; array.forEach(function(element) { if(res.indexOf(element)<0){ res.push(element); } }, this); return res; } console.log(uniq([1,4,2,2,3,3])); //[1,4,2,3]
其中若是数组是排序的,去重运算效率更高,由于排序可以将相同的数排列在一块儿,方便先后比较。测试
function uniq(array, isSorted) { var res = []; var seen = null; array.forEach(function (element,index) { if (isSorted) { //当数组有序 if(!index || seen !== element) res.push(element); seen = element; } else { if (res.indexOf(element) < 0) { res.push(element); } } }, this); return res; } console.log(uniq([1,2,"2",3,3,3,5],true)); //(5) [1, 2, "2", 3, 5]
对于对象的去重,咱们知道{}==={}为false
,因此使用===
比较对象在实际场景中没有意义。
在这里我举个实际场景的例子:this
我要在小组中选择一名男生(male)和一名女生(female),小组组员状况以下:
var array = [{ name:"Tom", gender:"female" },{ name:"Lucy", gender:"female" },{ name:"Edward", gender:"male" },{ name:"Molly", gender:"female" }]
咱们修改上面的uniq
:spa
function uniq(array, isSorted, iteratee) { var res = []; var seen = []; array.forEach(function (element, index) { if (iteratee) { //判断iteratee是否存在,存在的话,取出真正要比较的属性 var computed = element[iteratee]; if (seen.indexOf(computed) < 0) { seen.push(computed); res.push(element); } } else if (isSorted) { //当数组有序 if (!index || seen !== element) res.push(element); seen = element; } else { if (res.indexOf(element) < 0) { res.push(element); } } }, this); return res; } console.log(uniq([{ name:"Tom", gender:"female" },{ name:"Lucy", gender:"female" },{ name:"Edward", gender:"male" },{ name:"Molly", gender:"female" }],true,"gender"));
结果以下:
underscore的uniq
的实现,基本上使用的上述思想。在附录中我附上了源码和一些注释。
上述我分析了underscore的uniq
函数实现,在这以前我也看过诸如《JavaScript去重的N种方法》...之类的文章,underscore中的uniq
函数实现方法并非最优解,至少从时间复杂度来说不是最优。
那么为何underscore不用Set
对象来解决去重问题,使用indexof
查找的时间复杂度是O(n)
,而hash查询是O(1)
。
我我的认为Set
是ES6中引的对象,underscore是为了考虑兼容性问题。
那为何不用obj
做为Set
的替代方案呢?
这里我猜是underscore的设计者只想用本身内部实现的_.indexOf
函数。此处是个人猜想,你们若是有想法,欢迎你们留言!
下面我附上ES6的实现(你们最熟悉的):
var a = [1,1,2,3,4,4]; var res = [...new Set(a)];
再附上obj
的实现:
function uniq(array,iteratee){ var res = []; var obj = {}; array.forEach(function(element) { var computed = element; if(iteratee) computed = element[iteratee]; if(!obj.hasOwnProperty(computed)) obj[(typeof computed)+"_"+JSON.stringify(computed)] = element; }, this); for(var p in obj){ res.push(obj[p]); } return res; } uniq([1,"1",2,3,4,4]);// (5) [1, "1", 2, 3, 4]
underscore的uniq
函数源码及注释:
_.uniq = _.unique = function(array, isSorted, iteratee, context) { if (array == null) return []; if (!_.isBoolean(isSorted)) { //若是没有排序 context = iteratee; iteratee = isSorted; isSorted = false; } /** ** 此处_.iteratee ** function (key){ * return function(obj){ * return obj[key]; * } ** } ** key就是这里的iteratee(对象的属性),这里使用了闭包 **/ if (iteratee != null) iteratee = _.iteratee(iteratee, context); var result = [];//返回去重后的数组(副本) var seen = []; for (var i = 0, length = array.length; i < length; i++) { var value = array[i];//当前比较值 if (isSorted) { //若是i=0时,或者seen(上一个值)不等于当前值,放入去重数组中 if (!i || seen !== value) result.push(value); seen = value;//保存当前值,用于下一次比较 } else if (iteratee) { var computed = iteratee(value, i, array); if (_.indexOf(seen, computed) < 0) { seen.push(computed); result.push(value); } } else if (_.indexOf(result, value) < 0) { result.push(value); } } return result; };