JavaScript深入理解系列:深拷贝与浅拷贝

2022-04-17  本文已影响0人  程序员米粉

导读

在平时工作中或者面试中都会接触到对数据的复制,下面来实现一个比较完整的功能,提供全部思路,下面直接进入正文。

定义

回顾一下JavaScript中存在两大数据类型:
浅拷贝.jpg 深拷贝.png

浅拷贝

浅拷贝常见简单用法:

Object.assign

const obj = {
    age: 20,
    array: ['one', 'two'],
    objs: {
        obj1: 'obj1',
        obj2: 'obj2'
    },
    demo: function () {
        console.log('This is demo!')
    }
}
const newObj = Object.assign({}, obj);

Array.prototype.slice

const array = [ 1, 2, 3 ];
const copyArray = array.slice(0);
copyArray[1] = "改变新数组";
console.log(copyArray) // [ 1, '改变新数组', 3 ]
console.log(array) // [ 1, 2, 3 ] 

Array.prototype.concat()

const array = [ 1, 2, 3 ];
const copyArray = array.concat();
copyArray[1] = "改变新数组";
console.log(copyArray) // [ 1, '改变新数组', 3 ]
console.log(array) // [ 1, 2, 3 ] 

ES6拓展运算符

const array = [ 1, 2, 3 ];
const copyArray = [...array];
copyArray[1] = "改变新数组";
console.log(copyArray) // [ 1, '改变新数组', 3 ]
console.log(array) // [ 1, 2, 3 ] 

深拷贝

常见的深拷贝:

JSON.parse(JSON.stringify())

const obj = {
    age: 20,
    array: [ 'one', 'two' ],
    objs: {
        obj1: 'obj1',
        obj2: 'obj2'
    },
    demo: function() {
        console.log('This is demo!');
    },
    undefinedTest: undefined,
    symbolTest:  Symbol('A')
};
const newObj = JSON.parse(JSON.stringify(obj));
console.log(newObj);
// {
//     age: 20,
//     array: [ 'one', 'two' ],
//     objs: { obj1: 'obj1', obj2: 'obj2' }
//  }
// 缺点没有把demo方法/undefinedTest/symbolTest复制,忽略undefined、symbol和函数,所以这个克隆对象不安全,不完善

_.cloneDeep()

const _ = require('lodash'); 
const obj1 = {
    a: 1,
    b: { 
        f: { g: 1 } },
    c: [1, 2, 3]
};
const obj2 = _.cloneDeep(obj1);
console.log(obj1.b.f === obj2.b.f); // false
// 等于false表示新对象和原对象不是同一个内存引用地址

jQuery.extend()

const $ = require('jquery');
const obj1 = {
    a: 1,
    b: { f: { g: 1 } },
    c: [1, 2, 3]
};
const obj2 = $.extend(true, {}, obj1);
console.log(obj1.b.f === obj2.b.f); // false
// 等于false表示新对象和原对象不是同一个内存引用地址

循环递归

既然是深度克隆,那就建一个新对象,然后把需要被克隆对象的每一个值都复制给新对象。

简单版本

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj1: 'obj1',
        obj2: {
            obj2_1: 'obj2_1'
        }
    }
};

function deepClone(data) {
    let cloneData = {};
    for (const key in data) {
        cloneData[key] = data[key];
    }
    return cloneData;
}
const newObj1 = deepClone(obj);
console.log(newObj1);
// {
//   test: '我是文字',
//   age: 20,
//   name: undefined,
//   array: [ 'one', 'two', [ 1, 2 ] ],
//   objs: { obj1: 'obj1', obj2: { obj2_1: 'obj2_1' } }
// }

简单版本版本就完成了。表面上可以打印新对象跟原来的对象一样了。但是我们上述说了,深度克隆取决于新对象和原来的对象是否共用同一个内存的地址。所以我改一下原对象某一个值,是否影响了新对象。

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj1: 'obj1',
        obj2: {
            obj2_1: 'obj2_1'
        }
    }
};

function deepClone(data) {
    let cloneData = {};
    for (const key in data) {
        cloneData[key] = data[key];
    }
    return cloneData;
}
const newObj1 = deepClone(obj);
console.log(newObj1);
// {
//   test: '我是文字',
//   age: 20,
//   name: undefined,
//   array: [ 'one', 'two', [ 1, 2 ] ],
//   objs: { obj1: 'obj1', obj2: { obj2_1: 'obj2_1' } }
// }
obj.age = 18;
obj.objs.obj2 = null; // 改原对象某一个值,看看是否影响新对象。
console.log(newObj1)
// {
//   test: '我是文字',
//   age: 20,
//   name: undefined,
//   array: [ 'one', 'two', [ 1, 2 ] ],
//   objs: { obj1: 'obj1', obj2: null } // obj2: null 数据被改变了
// }

上述我们也看到了,修改了原对象数据【obj.age和obj.objs.obj2】,其中只有obj.objs.obj2数据变了,影响了新对象的数据。表示obj.objs.obj2这个数据,新对象和原对象在内存中还是共用了同一个地址。对于这种对象中还有多层数据的,我们使用递归遍历克隆数据到新对象。总结一下:

那就继续完善一下代码

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj2: {
            obj2_1: 'obj2_1'
        }
    }
};
function deepClone(data) {
    // 非对象直接返回对应的值(可能是普通的值、函数、正则等等)
    if (typeof data !== 'object') return data;
    let cloneData = {};
    for (const key in data) {
        cloneData[key] = deepClone(data[key]);
    }
    return cloneData;
}
const newObj1 = deepClone(obj);
console.log(newObj1);
// {
//     test: '我是文字',
//     age: 20,
//     name: undefined,
//     array: { '0': 'one', '1': 'two', '2': { '0': 1, '1': 2 } },
//     objs: { obj2: { obj2_1: 'obj2_1' } }
//  }
obj.age = 18;
obj.objs.obj2 = null;
console.log(newObj1);
// {
//     test: '我是文字',
//     age: 20,
//     name: undefined,
//     array: { '0': 'one', '1': 'two', '2': { '0': 1, '1': 2 } },
//     objs: { obj2: { obj2_1: 'obj2_1' } }
//   }

原对象改动了数据【obj.objs.obj2】,新对象 newObj1 不受影响。说明方法对象之间没有共用同一个内存地址,但是方法还有很多不完善,例如数组还没完善,那么我们下面继续完善。

兼容数组

上述方法只考虑了数据是object的情况下,在js中数组用typeof方法来判断数组,也是显示object,那么我们继续来完善一下方法:

function deepClone(data) {
    // 非对象直接返回对应的值(可能是普通的值、函数、正则等等)
    if (typeof data !== 'object') return data;
    // Object.prototype.toString.call(data) 和 Array.isArray 都可以用来判断数据是否数组
    // let cloneData = Array.isArray(data) === '[object Array]' ? [] : {};
    let cloneData = Object.prototype.toString.call(data) === '[object Array]' ? [] : {};
    for (const key in data) {
        cloneData[key] = deepClone(data[key]);
    }
    return cloneData;
}

循环引用

我们来看一个例子:

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj2: {
            obj2_1: 'obj2_1'
        }
    }
};
obj.objs = obj;
// 我们把方法改一下这样引用。然后执行方法
const newObj1 = deepClone(obj);
console.log(newObj1);
// 控制台看到
// RangeError: Maximum call stack size exceeded // 代表堆栈溢出

运行一下可以看到下图:

error.png

一般看到这种情况是堆栈溢出,原因是对象属性引用了自身的地址,循环引用了。由于直接和间接引用了自身,在克隆对象的时候,就不断的循环创建一块内存地址来存放数据,导致堆栈溢出。

解决这种情况,其实我们可以首先创建一个公共的内存空间来放这个数据,存储当前的对象和引用对象之间的关系,在需要拷贝的时候,首先去存储的公共内存空间找一下,这个公共空间有没拷贝过数据,有的话不用拷贝了,没有的话再拷贝。这样就避免了,一直循环引用,不断创建新的内存空间,导致堆栈溢出。

根据上述描述,这个公共的存储空间,就需要用到 key - value 这种数据结构形式,obj[objData] = objData; 其中objData是一个对象,由于JavaScript 的对象(Object),本质上是键值对的集合(Hash 结构),但是传统上只能用字符串当作键。这给它的使用带来了很大的限制。所以我们可以考虑ES6中的 map 数据结构

map数据结构:它类似于对象,也是键值对的集合,但是“键”的范围不限于字符串,各种类型的值(包括对象)都可以当作键。也就是说,Object 结构提供了“字符串—值”的对应,Map 结构提供了“值—值”的对应,是一种更完善的 Hash 结构实现。如果你需要“键值对”的数据结构,Map 比 Object 更合适。

Map结构有以下2种方法:


Map与WeakMap:WeakMap相对Map是弱引用(在计算机程序设计中,弱引用与强引用相对,是指不能确保其引用的对象不会被垃圾回收器回收的引用。一个对象若只被弱引用所引用,则被认为是不可访问(或弱可访问)的,并因此可能在任何时刻被回收), 可以看出来WeakMap在性能方面比Map更胜一筹,在浏览器中垃圾回收机制用来清理不会再使用的对象,在某个时刻不用的时候自动被回收了,从而降低内存泄露和数据损坏的可能性。

举个例子:Map

const goodBoy = { 
    name: '程序员米粉', 
    age: 18 
};
const mapObj = new Map();
mapObj.set(goodBoy, '程序员米粉');
goodBoy = null;

上述使用 Map 创建对象,并引用了对象 goodBoy作为键,存在一个强关联关系,虽然把goodBoy置为null,但是mapObj依然对goodBoy还是一个强引用关系,内存还是一直没有释放。

举个例子:WeakMap

const goodBoy = { 
    name: '程序员米粉', 
    age: 18 
};
const mapObj = new WeakMap();
mapObj.set(goodBoy, '程序员米粉');
goodBoy = null;

上述使用 WeakMap 创建对象,并引用了对象 goodBoy作为键,存在弱引用关系,不需要使用的时候,在下一次垃圾回收机制,浏览器会自动回收,内存得到释放。

继续完善一下代码

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj2: {
            obj2_1: 'obj2_1'
        }
    }
};
obj.objs = obj;
function deepClone(data, map = new WeakMap()) {
    // 非对象直接返回对应的值
    if (typeof data !== 'object') return data;
    // Object.prototype.toString.call(data) 和 Array.isArray 都可以用来判断数据是否数组
    // let cloneData = Array.isArray(data) === '[object Array]' ? [] : {};
    let cloneData = Object.prototype.toString.call(data) === '[object Array]' ? [] : {};
    // 内存公共空间是否有复制过的数据,有就直接返回
    if (map.get(data)) return map.get(data);
    // 存在公共空间对象数据
    map.set(data, cloneData);
    for (const key in data) {
        cloneData[key] = deepClone(data[key], map); // 这里记得存 map
    }
    return cloneData;
}
const newObj1 = deepClone(obj);
结论:假设数据量很大的情况下,在考虑性能方面上,优先选用WeakMap,避免过多的消耗,毕竟这也算JavaScript性能优化的一部分,能优化则优化的原则,让我们写的程序达到最优。

兼容各种数据类型

目前只对普通object和array进行了拷贝。还有其它详细的数据类型没有拷贝,我们详细的列出来,一个一个分别归类进行拷贝。归类的前提需要对数据进行类型判断,我们使用 Object.prototype.toString.call 进行判断。

// Boolean 类型,tag 为 "Boolean"
Object.prototype.toString.call(true);            // => "[object Boolean]"

// Number 类型,tag 为 "Number"
Object.prototype.toString.call(1);               // => "[object Boolean]"

// String 类型,tag 为 "String"
Object.prototype.toString.call("");              // => "[object String]"

// Array 类型,tag 为 "String"
Object.prototype.toString.call([]);              // => "[object Array]"

// Arguments 类型,tag 为 "Arguments"
Object.prototype.toString.call((function() {
return arguments;
})());                                           // => "[object Arguments]"

// Function 类型, tag 为 "Function"
Object.prototype.toString.call(function(){});    // => "[object Function]"

// Error 类型(包含子类型),tag 为 "Error"
Object.prototype.toString.call(new Error());     // => "[object Error]"

// RegExp 类型,tag 为 "RegExp"
Object.prototype.toString.call(/\d+/);           // => "[object RegExp]"

// Date 类型,tag 为 "Date"
Object.prototype.toString.call(new Date());      // => "[object Date]"

// 其他类型,tag 为 "Object"
Object.prototype.toString.call(new class {});    // => "[object Object]

...

// 获取数据类型
function getType(data) {
    return Object.prototype.toString.call(data);
}

那我整理一下标识,这些都是平常用,其实还有更多的,有兴趣的话,自己再查详细点文档,这里不展开

// 可遍历的类型
const mapTag = '[object Map]';
const setTag = '[object Set]';
const arrayTag = '[object Array]';
const objectTag = '[object Object]';
const argsTag = '[object Arguments]';

// 不可遍历的类型
const booleanTag = '[object Boolean]';
const dateTag = '[object Date]';
const errorTag = '[object Error]';
const numberTag = '[object Number]';
const regexpTag = '[object RegExp]';
const stringTag = '[object String]';
const symbolTag = '[object Symbol]';
...

上述判断数据类型,出现可遍历属性和不可遍历属性,主要是可遍历属性我们需要用到这些对象原型prototype方法和构造函数constructor,需要遍历这些对象原型上和构造函数上的方法。下面我们就用 constructor这种方式来获取。

function getInit(data) {
    const newCtor = data.constructor;
    return new newCtor();
}

继续改造

const map = new Map();
map.set('flag', '程序员米粉');
const set = new Set();
set.add('程序员米粉');

const obj = {
    test: '我是文字',
    age: 20,
    name: undefined,
    nullFlag: null,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj2: {
            a: 1
        }
    },
    map,
    set
};
// 可遍历类型
const arrayTag = '[object Array]';
const objectTag = '[object Object]';
const mapTag = '[object Map]';
const setTag = '[object Set]';
const argsTag = '[object Arguments]';


// 不可遍历类型
const numberTag = '[object Number]';
const stringTag = '[object String]';
const booleanTag = '[object Boolean]';
const dateTag = '[object Date]';
const symbolTag = '[object Symbol]';
const errorTag = '[object Error]';
const regexpTag = '[object RegExp]';
const funcTag = '[object Function]';
// ....
// 可遍历类型数据标识
const deeptTagList = [ mapTag, setTag, arrayTag, objectTag, argsTag ];
// 获取数据类型
function getType(data) {
    return Object.prototype.toString.call(data);
}
// 初始类型
function getInit(data) {
    const NewCtor = data.constructor;
    return new NewCtor();
}
// 克隆正则
function deepCloneReg(obj) {
    const data = new obj.constructor(obj.source, /\w*$/.exec(targe));
    data.lastIndex = obj.lastIndex;
    return data;
}
// 其它类型
function otherType(obj, type) {
    const NewCtor = obj.constructor;
    switch (type) {
        case boolTag:
        case numberTag:
        case stringTag:
        case errorTag:
        case symbolTag:
        case dateTag:
            return new NewCtor(obj);
        case regexpTag:
            return deepCloneReg(obj);
        default:
            return null;
    }
}
function deepClone(data, map = new WeakMap()) {
    // 非对象直接返回对应的值
    if (typeof data !== 'object' || !data) return data;
    let cloneData = null;
    // 判断数据类型
    const type = getType(data);
    // 判断是否可遍历类型
    if (deeptTagList.includes(type)) {
        cloneData = getInit(data, type);
    }
    // 克隆map || 克隆set
    if (type === mapTag || type === setTag) {
        data.forEach((val, key) => {
            if (type === mapTag) {
                // 克隆map
                cloneData.set(key, deepClone(val, map));
            } else {
                // 克隆set
                cloneData.add(key, deepClone(val, map));
            }
        });
        return cloneData;
    }
    // Object.prototype.toString.call(data) 和 Array.isArray 都可以用来判断数据是否数组
    // let cloneData = Array.isArray(data) === '[object Array]' ? [] : {};
    cloneData = Object.prototype.toString.call(data) === '[object Array]' ? [] : {};
    // 内存公共空间是否有复制过的数据,有就直接返回
    if (map.get(data)) return map.get(data);
    // 存在公共空间对象数据
    map.set(data, cloneData);
    for (const key in data) {
        cloneData[key] = deepClone(data[key], map); // 这里记得存 map
    }
    return cloneData;
}
const newObj1 = deepClone(obj);
console.log(newObj1);
// {
//     test: '我是文字',
//     age: 20,
//     name: undefined,
//     nullFlag: null,
//     array: [ 'one', 'two', [ 1, 2 ] ],
//     objs: { obj2: { a: 1 } },
//     map: Map(1) { 'flag' => '程序员米粉' },
//     set: Set(1) { '程序员米粉' }
//   }

我们拷贝已经完成了80%了,下面我们继续完成没有完成的类型:String、Number、Boolean、Date、Error

// 其它类型
function otherType(data, type) {
    const NewCtor = data.constructor;
    switch (type) {
        case booleanTag:
            return new Boolean(data);
        case numberTag:
            return new Number(data);
        case stringTag:
            return new String(data);
        case errorTag:
            return new Error(data);
        case symbolTag:
            return new Symbol(data); // 这个我偷懒了,感兴趣可以查一下文档,这里不详细写了
        case dateTag:
            return new NewCtor(data);
        case regexpTag:
            return deepCloneReg(data);
        // 还有函数、等等 可以到loadsh工具库看一下
        default:
            return null;
    }
}
// 克隆正则
function deepCloneReg(obj) {
    const data = new obj.constructor(obj.source, /\w*$/.exec(targe));
    data.lastIndex = obj.lastIndex;
    return data;
}

完整版

const map = new Map();
map.set('flag', '程序员米粉');
const set = new Set();
set.add('程序员米粉');

const obj = {
    name: undefined,
    nullFlag: null,
    array: [ 'one', 'two', [ 1, 2 ] ],
    objs: {
        obj2: {
            a: 1
        }
    },
    map,
    set,
    str: '程序员米粉',
    boolean_: true,
    num: 20,
    symbol: Object(Symbol('程序员米粉')),
    date: new Date(),
    reg: /\d+/,
    error: new Error('错误信息'),
    fn: function(a) {
        return a + b;
    }
};
// 可遍历类型
const arrayTag = '[object Array]';
const objectTag = '[object Object]';
const mapTag = '[object Map]';
const setTag = '[object Set]';
const argsTag = '[object Arguments]';

// 不可遍历类型
const numberTag = '[object Number]';
const stringTag = '[object String]';
const booleanTag = '[object Boolean]';
const dateTag = '[object Date]';

const symbolTag = '[object Symbol]';
const errorTag = '[object Error]';
const regexpTag = '[object RegExp]';
const funcTag = '[object Function]';
// ....
// 可遍历类型数据标识
const deeptTagList = [ mapTag, setTag, arrayTag, objectTag, argsTag ];
// 获取数据类型
function getType(data) {
    return Object.prototype.toString.call(data);
}
// 初始类型
function getInit(data) {
    const NewCtor = data.constructor;
    return new NewCtor();
}

// 其它类型
function otherType(data, type) {
    const NewCtor = data.constructor;
    switch (type) {
        case booleanTag:
        case numberTag:
        case stringTag:
        case errorTag:
        case symbolTag:
            return data;
        case dateTag:
            return new NewCtor(data);
        case regexpTag:
            return deepCloneReg(data);
        // 还有函数、等等 可以到loadsh工具库看一下
        default:
            return null;
    }
}
// 克隆正则
function deepCloneReg(obj) {
    const data = new obj.constructor(obj.source, /\w*$/.exec(obj));
    data.lastIndex = obj.lastIndex;
    return data;
}
function deepClone(data, map = new WeakMap()) {
    // 非对象直接返回对应的值
    if (typeof data !== 'object' || !data) return data;
    let cloneData = null;
    // 判断数据类型
    const type = getType(data);
    // 判断是否可遍历类型
    if (deeptTagList.includes(type)) {
        cloneData = getInit(data, type);
    } else {
        // 不可遍历 
        return otherType(data, type);
    }
    // 克隆map || 克隆set
    if (type === mapTag || type === setTag) {
        data.forEach((val, key) => {
            if (type === mapTag) {
                // 克隆map
                cloneData.set(key, deepClone(val, map));
            } else {
                // 克隆set
                cloneData.add(key, deepClone(val, map));
            }
        });
        return cloneData;
    }
    // Object.prototype.toString.call(data) 和 Array.isArray 都可以用来判断数据是否数组
    // let cloneData = Array.isArray(data) === '[object Array]' ? [] : {};
    cloneData = Object.prototype.toString.call(data) === '[object Array]' ? [] : {};
    // 内存公共空间是否有复制过的数据,有就直接返回
    if (map.get(data)) return map.get(data);
    // 存在公共空间对象数据
    map.set(data, cloneData);
    for (const key in data) {
        cloneData[key] = deepClone(data[key], map); // 这里记得存 map
    }
    return cloneData;
}
const newObj1 = deepClone(obj);

最后输出

错误信息.png

基本的全部功能基本实现,有部分更细节的地方,自己可以查阅相关文档或者lodash工具库,例如:克隆Symbol类型、
克隆Function类型、等等,我这边没有添加上。

参考

结语

希望看完这篇文章对你有帮助:

文中如有错误,欢迎在评论区指正,如果这篇文章帮助到了你,欢迎点赞和关注,后续会输出更好的分享。

欢迎关注公众号:【程序员米粉】
公众号分享开发编程、职场晋升、大厂面试经验

上一篇 下一篇

猜你喜欢

热点阅读