PythonPython学习

Python中的引用赋值,深拷贝,浅拷贝

2021-02-01  本文已影响0人  xiaogp

摘要:Python引用赋值深拷贝浅拷贝

总结一下Python中的变量的引用赋值,深拷贝和浅拷贝,先上结论

引用赋值

在python中,使用等号无论是直接的变量赋值,还是参数传递,都是按照引用进行赋值的,等号赋值是指将对象的内存指针赋值
在Python中对于非组合变量(对象中不包含其他对象,只有一层地址关系)的赋值直接使用等号赋值即可,即将一个变量赋值给另一个变量,则两者不仅在数值上相等,而且还是同一对象id相同is判断为True这两个变量都指向这一个数据对象,即这个数据对象有两个引用,只有这两个引用都没了的时候,堆内存中的数据对象才会等待垃圾回收器回收

>>> # 将一个变量赋值给另一个变量
>>> a = 10000
>>> b = a
>>> id(a)
140139864296144
>>> id(b)
140139864296144
>>> a is b
True

如果单独对两个变量赋值,就算赋值的数据对象相同,也只是数据对象的值相等,两个变量在堆内存中是不同的对象

>>> a = 10000
>>> b = 10000
>>> id(a)
140139864296272
>>> id(b)
140139864296048
>>> a is b
False

可变对象,不可变对象对引用赋值的影响

如果变量的值是不可变对象,比如string,int,float,tuple等,其中一个变量重新赋值意味着在内存中要新创建一个数据对象,此时变量间不会相互影响,即不会影响另外一个变量。

>>> a = 10000
>>> b = a
>>> id(a)
140139864296272
>>> id(b)
140139864296272
>>> a = 20000  # 改变a的值
>>> id(a)  # a在堆内存中新创建了一个对象,获得新的id地址
140139864295920
>>> b  # b不变
10000
不可变对象赋值引用改变变量值.png

对于可变对象,调用自身方法使的值改变不会改变内存地址。比如列表list,字典dict,集合set,如果是在原数据对象自身上做修改,比如修改列表中的某个元素,列表的地址不会变,还是原来的那个内存对象,此时调用另一个变量的值也会改变,因为是同一个内存对象的两个引用,因此对于可变对象的引用赋值,变量之间是相互影响的。

>>> a = {"a": 1, "b": 3}
>>> b = a
>>> b["c"] = 9  # 改变其中一个变量,给字典新增一个值
>>> a  # 原始变量也会收到影响
{'a': 1, 'b': 3, 'c': 9}
>>> id(a)
140139842087104
>>> id(b)
140139842087104  # 内存地址未改变,只是新增了一个元素
可变对象赋值引用改变变量值.png
缓存的重用机制

Python会根据对象的读取频繁程度以及内存占用情况,按照一定规则将对象存入缓存。当程序的其他代码使用这些值的时候,会先去缓存中找并且直接引用缓存中的地址,不需要额外创建,这些值包括:[-5, 256]之间的小整数字符串对象

>>> a = -3
>>> b = -3
>>> a is b
True
>>> b = 2234 - 2237
>>> a is b
True

超过256分别赋值就是不同对象了

>>> a = 257
>>> b = 257
>>> a is b
False

字符串是直接读取缓存中地址

>>> a = "aaaabbbbcccc"
>>> b = "aaaabbbbcccc"
>>> a is b
True

除此之外,其他不可变变量如果处在同一个代码块或者同行,也直接获取代码块中缓存的变量,不再另外创建

>>> # 同行
>>> a = 20000; b = 20000
>>> a is b
True
>>> a = 20000
>>> b = 20000
>>> a is b
False

同一个函数代码块

>>> def a():
...     a = -2836755.383274835
...     b = -2836755.383274835
...     print(a is b)
...     print(id(a))
...     print(id(b))
... 
>>> a()
True
140139864296112
140139864296112

深拷贝和浅拷贝

首先深拷贝和浅拷贝是针对组合对象的,组合对象就是这个对象中还包含其他对象,比如list,set,dict等,也就是说这个对象有不止一层内存地址,非组合对象都是直接等号赋值。

对于组合对象list,set,dict(没有tuple)自带copy浅拷贝方法,深拷贝需要导入copy模块,调用deepcopy方法,copy的copy方法对应浅拷贝

# 浅拷贝
>>> a = [1, 2, 3]
>>> b = a.copy()
>>> print(a is b)
False
>>> for i, j in zip(a, b):
...     print(id(i))
...     print(id(j))
...     print(i is j)
... 
93994145530624
93994145530624
True
93994145530656
93994145530656
True
93994145530688
93994145530688
True

浅拷贝后新对象地址不一样,但是内部元素引用一致


>>> a = [1, 2, 3]
>>> import copy
>>> b = copy.deepcopy(a)
>>> print(a is b)
False
>>> for i, j in zip(a, b):
...     print(id(i))
...     print(id(j))
...     print(i is j)
... 
93994145530624
93994145530624
True
93994145530656
93994145530656
True
93994145530688
93994145530688
True

深拷贝新建了一个对象,但是内部元素也是引用的原始地址,原因是内部元素是小整数,小整数在内存中有缓存直接调用,换一下内部元素为可变对象。

>>> a = [[1, 2], [2, 3], [3, 4]]
>>> b = copy.deepcopy(a)
>>> print(a is b)
False
>>> for i, j in zip(a, b):
...     print(id(i))
...     print(id(j))
...     print(i is j)
... 
140139841222048
140139840826496
False
140139841244208
140139840826816
False
140139841244128
140139840826976
False

原型毕露,深拷贝不仅对象,连对象内部的元素都重新创建,在用新数据试下浅拷贝

>>> a = [[1, 2], [2, 3], [3, 4]]
>>> b = copy.copy(a)
>>> print(a is b)
False
>>> for i, j in zip(a, b):
...     print(id(i))
...     print(id(j))
...     print(i is j)
... 
140139841222048
140139841222048
True
140139841244208
140139841244208
True
140139841244128
140139841244128
True

厉害,浅拷贝只是创建新对象,内部元素还是老的引用。


在对比一下组合对象的赋值引用

>>> a = [[1, 2], [2, 3], [3, 4]]
>>> b = a
>>> print(a is b)
True
>>> for i, j in zip(a, b):
...     print(id(i))
...     print(id(j))
...     print(i is j)
... 
140139841222048
140139841222048
True
140139841244208
140139841244208
True
140139841244128
140139841244128
True

可见赋值引用所有地址全部拷贝去了,既不要创建新对象,内部元素也全是来的对象内部元素的引用。

总结

最后再用一个例子对比一下组合对象的三种拷贝方式

>>> a = [[1, 2], [2, 3], [3, 4]]
>>> for line in a:
...     line[1] = 9  # 直接拿到组合变量的内部元素进行修改
... 
>>> a
[[1, 9], [2, 9], [3, 9]]
>>> a = [[1, 2], [2, 3], [3, 4]]
>>> for line in a.copy():  # 生成一个新对象遍历,但是内部元素还是旧元素的引用,内部元素是list,地址没变,只是list的第二个值改了,因此也会对原对象产生影响
...     line[1] = 9
... 
>>> a
[[1, 9], [2, 9], [3, 9]]
>>> a = [[1, 2], [2, 3], [3, 4]]
>>> for line in copy.deepcopy(a):  # 创建新元素遍历,内部元素也是新创建的和之前没有任何关系,所以修改内部元素不会对原来变量造成影响
...     line[1] = 9
... 
>>> a
[[1, 2], [2, 3], [3, 4]]

再来一个例子

>>> a = [[1, 2], [2, 3], [3, 4]]
>>> for line in a:
...     b = line
...     b[1] = 9  # 直接拿到值,调用自身方法修改值
... 
>>> a
[[1, 9], [2, 9], [3, 9]]
>>> a = [[1, 2], [2, 3], [3, 4]]
>>> for line in a:
...     b = line.copy()  # 内嵌list更改内存地址,内嵌list的整数元素是旧引用,但是由于新赋值了9,所有指针全部重新指向9,旧对象和旧元素不变
...     b[1] = 9
... 
>>> a
[[1, 2], [2, 3], [3, 4]]
>>> for line in a:
...     b = copy.deepcopy(line)  # 深拷贝更不用说有,全部重新创建,和之前不搭嘎
...     b[1] = 9
... 
>>> a
[[1, 2], [2, 3], [3, 4]]

彻底懂了吧

上一篇下一篇

猜你喜欢

热点阅读