如何写出一个惊艳面试官的深拷贝?

时间 2019-11-05

标签如何写出一个惊艳面试拷贝栏目快乐工作繁體版

原文原文链接

导读

最近常常看到不少JavaScript手写代码的文章总结，里面提供了不少JavaScript Api的手写实现。前端

里面的题目实现大多相似，并且说实话不少代码在我看来是很是简陋的，若是我做为面试官，看到这样的代码，在我内心是不会合格的，本篇文章我拿最简单的深拷贝来说一讲。node

看本文以前先问本身三个问题：git

你真的理解什么是深拷贝吗？github
在面试官眼里，什么样的深拷贝才算合格？面试
什么样的深拷贝能让面试官感到惊艳？正则表达式

本文由浅入深，带你一步一步实现一个惊艳面试官的深拷贝。数组

本文测试代码：github.com/ConardLi/Co…性能优化

例如：代码clone到本地后，执行 node clone1.test.js查看测试结果。微信

建议结合测试代码一块儿阅读效果更佳。数据结构

深拷贝和浅拷贝的定义

深拷贝已是一个老生常谈的话题了，也是如今前端面试的高频题目，可是令我吃惊的是有不少同窗尚未搞懂深拷贝和浅拷贝的区别和定义。例如前几天给我提issue的同窗：

很明显这位同窗把拷贝和赋值搞混了，若是你还对赋值、对象在内存中的存储、变量和类型等等有什么疑问，能够看看我这篇文章：juejin.im/post/5cec1b… 。

你只要少搞明白拷贝和赋值的区别。

咱们来明确一下深拷贝和浅拷贝的定义：

浅拷贝：

建立一个新对象，这个对象有着原始对象属性值的一份精确拷贝。若是属性是基本类型，拷贝的就是基本类型的值，若是属性是引用类型，拷贝的就是内存地址，因此若是其中一个对象改变了这个地址，就会影响到另外一个对象。

深拷贝：

将一个对象从内存中完整的拷贝一份出来,从堆内存中开辟一个新的区域存放新对象,且修改新对象不会影响原对象

话很少说，浅拷贝就再也不多说，下面咱们直入正题：

乞丐版

在不使用第三方库的状况下，咱们想要深拷贝一个对象，用的最多的就是下面这个方法。

JSON.parse(JSON.stringify());
复制代码

这种写法很是简单，并且能够应对大部分的应用场景，可是它仍是有很大缺陷的，好比拷贝其余引用类型、拷贝函数、循环引用等状况。

显然，面试时你只说出这样的方法是必定不会合格的。

接下来，咱们一块儿来手动实现一个深拷贝方法。

基础版本

若是是浅拷贝的话，咱们能够很容易写出下面的代码：

function clone(target) {
    let cloneTarget = {};
    for (const key in target) {
        cloneTarget[key] = target[key];
    }
    return cloneTarget;
};
复制代码

建立一个新的对象，遍历须要克隆的对象，将须要克隆对象的属性依次添加到新对象上，返回。

若是是深拷贝的话，考虑到咱们要拷贝的对象是不知道有多少层深度的，咱们能够用递归来解决问题，稍微改写上面的代码：

若是是原始类型，无需继续拷贝，直接返回
若是是引用类型，建立一个新的对象，遍历须要克隆的对象，将须要克隆对象的属性执行深拷贝后依次添加到新对象上。

很容易理解，若是有更深层次的对象能够继续递归直到属性为原始类型，这样咱们就完成了一个最简单的深拷贝：

function clone(target) {
    if (typeof target === 'object') {
        let cloneTarget = {};
        for (const key in target) {
            cloneTarget[key] = clone(target[key]);
        }
        return cloneTarget;
    } else {
        return target;
    }
};
复制代码

咱们能够打开测试代码中的clone1.test.js对下面的测试用例进行测试：

const target = {
    field1: 1,
    field2: undefined,
    field3: 'ConardLi',
    field4: {
        child: 'child',
        child2: {
            child2: 'child2'
        }
    }
};
复制代码

执行结果：

这是一个最基础版本的深拷贝，这段代码可让你向面试官展现你能够用递归解决问题，可是显然，他还有很是多的缺陷，好比，尚未考虑数组。

考虑数组

在上面的版本中，咱们的初始化结果只考虑了普通的object，下面咱们只须要把初始化代码稍微一变，就能够兼容数组了：

module.exports = function clone(target) {
    if (typeof target === 'object') {
        let cloneTarget = Array.isArray(target) ? [] : {};
        for (const key in target) {
            cloneTarget[key] = clone(target[key]);
        }
        return cloneTarget;
    } else {
        return target;
    }
};
复制代码

在clone2.test.js中执行下面的测试用例：

const target = {
    field1: 1,
    field2: undefined,
    field3: {
        child: 'child'
    },
    field4: [2, 4, 8]
};
复制代码

执行结果：

OK，没有问题，你的代码又向合格迈进了一小步。

循环引用

咱们执行下面这样一个测试用例：

const target = {
    field1: 1,
    field2: undefined,
    field3: {
        child: 'child'
    },
    field4: [2, 4, 8]
};
target.target = target;
复制代码

能够看到下面的结果：

很明显，由于递归进入死循环致使栈内存溢出了。

缘由就是上面的对象存在循环引用的状况，即对象的属性间接或直接的引用了自身的状况：

解决循环引用问题，咱们能够额外开辟一个存储空间，来存储当前对象和拷贝对象的对应关系，当须要拷贝当前对象时，先去存储空间中找，有没有拷贝过这个对象，若是有的话直接返回，若是没有的话继续拷贝，这样就巧妙化解的循环引用的问题。

这个存储空间，须要能够存储key-value形式的数据，且key能够是一个引用类型，咱们能够选择Map这种数据结构：

检查map中有无克隆过的对象
有 - 直接返回
没有 - 将当前对象做为key，克隆对象做为value进行存储
继续克隆

function clone(target, map = new Map()) {
    if (typeof target === 'object') {
        let cloneTarget = Array.isArray(target) ? [] : {};
        if (map.get(target)) {
            return map.get(target);
        }
        map.set(target, cloneTarget);
        for (const key in target) {
            cloneTarget[key] = clone(target[key], map);
        }
        return cloneTarget;
    } else {
        return target;
    }
};
复制代码

再来执行上面的测试用例：

能够看到，执行没有报错，且target属性，变为了一个Circular类型，即循环应用的意思。

接下来，咱们可使用，WeakMap提代Map来使代码达到画龙点睛的做用。

function clone(target, map = new WeakMap()) {
    // ...
};
复制代码

为何要这样作呢？，先来看看WeakMap的做用：

WeakMap 对象是一组键/值对的集合，其中的键是弱引用的。其键必须是对象，而值能够是任意的。

什么是弱引用呢？

在计算机程序设计中，弱引用与强引用相对，是指不能确保其引用的对象不会被垃圾回收器回收的引用。一个对象若只被弱引用所引用，则被认为是不可访问（或弱可访问）的，并所以可能在任什么时候刻被回收。

咱们默认建立一个对象：const obj = {}，就默认建立了一个强引用的对象，咱们只有手动将obj = null，它才会被垃圾回收机制进行回收，若是是弱引用对象，垃圾回收机制会自动帮咱们回收。

举个例子：

若是咱们使用Map的话，那么对象间是存在强引用关系的：

let obj = { name : 'ConardLi'}
const target = new Map();
target.set(obj,'code秘密花园');
obj = null;
复制代码

虽然咱们手动将obj，进行释放，然是target依然对obj存在强引用关系，因此这部份内存依然没法被释放。

再来看WeakMap：

let obj = { name : 'ConardLi'}
const target = new WeakMap();
target.set(obj,'code秘密花园');
obj = null;
复制代码

若是是WeakMap的话，target和obj存在的就是弱引用关系，当下一次垃圾回收机制执行时，这块内存就会被释放掉。

设想一下，若是咱们要拷贝的对象很是庞大时，使用Map会对内存形成很是大的额外消耗，并且咱们须要手动清除Map的属性才能释放这块内存，而WeakMap会帮咱们巧妙化解这个问题。

我也常常在某些代码中看到有人使用WeakMap来解决循环引用问题，可是解释都是模棱两可的，当你不太了解WeakMap的真正做用时。我建议你也不要在面试中写这样的代码，结果只能是给本身挖坑，即便是准备面试，你写的每一行代码也都是须要通过深思熟虑而且很是明白的。

能考虑到循环引用的问题，你已经向面试官展现了你考虑问题的全面性，若是还能用WeakMap解决问题，并很明确的向面试官解释这样作的目的，那么你的代码在面试官眼里应该算是合格了。

性能优化

在上面的代码中，咱们遍历数组和对象都使用了for in这种方式，实际上for in在遍历时效率是很是低的，咱们来对比下常见的三种循环for、while、for in的执行效率：

能够看到，while的效率是最好的，因此，咱们能够想办法把for in遍历改变为while遍历。

咱们先使用while来实现一个通用的forEach遍历，iteratee是遍历的回掉函数，他能够接收每次遍历的value和index两个参数：

function forEach(array, iteratee) {
    let index = -1;
    const length = array.length;
    while (++index < length) {
        iteratee(array[index], index);
    }
    return array;
}
复制代码

下面对咱们的cloen函数进行改写：当遍历数组时，直接使用forEach进行遍历，当遍历对象时，使用Object.keys取出全部的key进行遍历，而后在遍历时把forEach会调函数的value看成key使用：

function clone(target, map = new WeakMap()) {
    if (typeof target === 'object') {
        const isArray = Array.isArray(target);
        let cloneTarget = isArray ? [] : {};

        if (map.get(target)) {
            return map.get(target);
        }
        map.set(target, cloneTarget);

        const keys = isArray ? undefined : Object.keys(target);
        forEach(keys || target, (value, key) => {
            if (keys) {
                key = value;
            }
            cloneTarget[key] = clone2(target[key], map);
        });

        return cloneTarget;
    } else {
        return target;
    }
}
复制代码

下面，咱们执行clone4.test.js分别对上一个克隆函数和改写后的克隆函数进行测试：

const target = {
    field1: 1,
    field2: undefined,
    field3: {
        child: 'child'
    },
    field4: [2, 4, 8],
    f: { f: { f: { f: { f: { f: { f: { f: { f: { f: { f: { f: {} } } } } } } } } } } },
};

target.target = target;

console.time();
const result = clone1(target);
console.timeEnd();

console.time();
const result2 = clone2(target);
console.timeEnd();
复制代码

执行结果：

很明显，咱们的性能优化是有效的。

到这里，你已经向面试官展现了，在写代码的时候你会考虑程序的运行效率，而且你具备通用函数的抽象能力。

其余数据类型

在上面的代码中，咱们其实只考虑了普通的object和array两种数据类型，实际上全部的引用类型远远不止这两个，还有不少，下面咱们先尝试获取对象准确的类型。

合理的判断引用类型

首先，判断是否为引用类型，咱们还须要考虑function和null两种特殊的数据类型：

function isObject(target) {
    const type = typeof target;
    return target !== null && (type === 'object' || type === 'function');
}
复制代码

if (!isObject(target)) {
        return target;
    }
    // ...
复制代码

获取数据类型

咱们可使用toString来获取准确的引用类型：

每个引用类型都有toString方法，默认状况下，toString()方法被每一个Object对象继承。若是此方法在自定义对象中未被覆盖，toString() 返回 "[object type]"，其中type是对象的类型。

注意，上面提到了若是此方法在自定义对象中未被覆盖，toString才会达到预想的效果，事实上，大部分引用类型好比Array、Date、RegExp等都重写了toString方法。

咱们能够直接调用Object原型上未被覆盖的toString()方法，使用call来改变this指向来达到咱们想要的效果。

function getType(target) {
    return Object.prototype.toString.call(target);
}
复制代码

下面咱们抽离出一些经常使用的数据类型以便后面使用：

const mapTag = '[object Map]';
const setTag = '[object Set]';
const arrayTag = '[object Array]';
const objectTag = '[object Object]';

const boolTag = '[object Boolean]';
const dateTag = '[object Date]';
const errorTag = '[object Error]';
const numberTag = '[object Number]';
const regexpTag = '[object RegExp]';
const stringTag = '[object String]';
const symbolTag = '[object Symbol]';

复制代码

在上面的集中类型中，咱们简单将他们分为两类：

能够继续遍历的类型
不能够继续遍历的类型

咱们分别为它们作不一样的拷贝。

可继续遍历的类型

上面咱们已经考虑的object、array都属于能够继续遍历的类型，由于它们内存都还能够存储其余数据类型的数据，另外还有Map，Set等都是能够继续遍历的类型，这里咱们只考虑这四种，若是你有兴趣能够继续探索其余类型。

有序这几种类型还须要继续进行递归，咱们首先须要获取它们的初始化数据，例如上面的[]和{}，咱们能够经过拿到constructor的方式来通用的获取。

例如：const target = {}就是const target = new Object()的语法糖。另外这种方法还有一个好处：由于咱们还使用了原对象的构造方法，因此它能够保留对象原型上的数据，若是直接使用普通的{}，那么原型必然是丢失了的。

function getInit(target) {
    const Ctor = target.constructor;
    return new Ctor();
}
复制代码

下面，咱们改写clone函数，对可继续遍历的数据类型进行处理：

function clone(target, map = new WeakMap()) {

    // 克隆原始类型
    if (!isObject(target)) {
        return target;
    }

    // 初始化
    const type = getType(target);
    let cloneTarget;
    if (deepTag.includes(type)) {
        cloneTarget = getInit(target, type);
    }

    // 防止循环引用
    if (map.get(target)) {
        return map.get(target);
    }
    map.set(target, cloneTarget);

    // 克隆set
    if (type === setTag) {
        target.forEach(value => {
            cloneTarget.add(clone(value,map));
        });
        return cloneTarget;
    }

    // 克隆map
    if (type === mapTag) {
        target.forEach((value, key) => {
            cloneTarget.set(key, clone(value,map));
        });
        return cloneTarget;
    }

    // 克隆对象和数组
    const keys = type === arrayTag ? undefined : Object.keys(target);
    forEach(keys || target, (value, key) => {
        if (keys) {
            key = value;
        }
        cloneTarget[key] = clone(target[key], map);
    });

    return cloneTarget;
}
复制代码

咱们执行clone5.test.js对下面的测试用例进行测试：

const target = {
    field1: 1,
    field2: undefined,
    field3: {
        child: 'child'
    },
    field4: [2, 4, 8],
    empty: null,
    map,
    set,
};
复制代码

执行结果：

没有问题，里大功告成又进一步，下面咱们继续处理其余类型：

不可继续遍历的类型

其余剩余的类型咱们把它们统一归类成不可处理的数据类型，咱们依次进行处理：

Bool、Number、String、String、Date、Error这几种类型咱们均可以直接用构造函数和原始数据建立一个新对象：

function cloneOtherType(targe, type) {
    const Ctor = targe.constructor;
    switch (type) {
        case boolTag:
        case numberTag:
        case stringTag:
        case errorTag:
        case dateTag:
            return new Ctor(targe);
        case regexpTag:
            return cloneReg(targe);
        case symbolTag:
            return cloneSymbol(targe);
        default:
            return null;
    }
}
复制代码

克隆Symbol类型：

function cloneSymbol(targe) {
    return Object(Symbol.prototype.valueOf.call(targe));
}

克隆正则：

function cloneReg(targe) {
    const reFlags = /\w*$/;
    const result = new targe.constructor(targe.source, reFlags.exec(targe));
    result.lastIndex = targe.lastIndex;
    return result;
}
复制代码

实际上还有不少数据类型我这里没有写到，有兴趣的话能够继续探索实现一下。

能写到这里，面试官已经看到了你考虑问题的严谨性，你对变量和类型的理解，对JS API的熟练程度，相信面试官已经开始对你另眼相看了。

克隆函数

最后，我把克隆函数单独拎出来了，实际上克隆函数是没有实际应用场景的，两个对象使用一个在内存中处于同一个地址的函数也是没有任何问题的，我特地看了下lodash对函数的处理：

const isFunc = typeof value == 'function'
 if (isFunc || !cloneableTags[tag]) {
        return object ? value : {}
 }
复制代码

可见这里若是发现是函数的话就会直接返回了，没有作特殊的处理，可是我发现很多面试官仍是热衷于问这个问题的，并且据我了解能写出来的少之又少。。。

实际上这个方法并无什么难度，主要就是考察你对基础的掌握扎实不扎实。

首先，咱们能够经过prototype来区分下箭头函数和普通函数，箭头函数是没有prototype的。

咱们能够直接使用eval和函数字符串来从新生成一个箭头函数，注意这种方法是不适用于普通函数的。

咱们可使用正则来处理普通函数：

分别使用正则取出函数体和函数参数，而后使用new Function ([arg1[, arg2[, ...argN]],] functionBody)构造函数从新构造一个新的函数：

function cloneFunction(func) {
    const bodyReg = /(?<={)(.|\n)+(?=})/m;
    const paramReg = /(?<=\().+(?=\)\s+{)/;
    const funcString = func.toString();
    if (func.prototype) {
        console.log('普通函数');
        const param = paramReg.exec(funcString);
        const body = bodyReg.exec(funcString);
        if (body) {
            console.log('匹配到函数体：', body[0]);
            if (param) {
                const paramArr = param[0].split(',');
                console.log('匹配到参数：', paramArr);
                return new Function(...paramArr, body[0]);
            } else {
                return new Function(body[0]);
            }
        } else {
            return null;
        }
    } else {
        return eval(funcString);
    }
}
复制代码

最后，咱们再来执行clone6.test.js对下面的测试用例进行测试：

const map = new Map();
map.set('key', 'value');
map.set('ConardLi', 'code秘密花园');

const set = new Set();
set.add('ConardLi');
set.add('code秘密花园');

const target = {
    field1: 1,
    field2: undefined,
    field3: {
        child: 'child'
    },
    field4: [2, 4, 8],
    empty: null,
    map,
    set,
    bool: new Boolean(true),
    num: new Number(2),
    str: new String(2),
    symbol: Object(Symbol(1)),
    date: new Date(),
    reg: /\d+/,
    error: new Error(),
    func1: () => {
        console.log('code秘密花园');
    },
    func2: function (a, b) {
        return a + b;
    }
};
复制代码