python自学

python对象和垃圾回收

2018-09-09  本文已影响2人  lethe_zh

1. python对象

python使用对象模型来存储数据,python中万物皆对象。
python对象有三个特性:身份类型

2. 内存管理

python变量无须显式声明,无须指定类型。python中变量第一次赋值时自动声明,解释器会根据右侧操作数决定对象的类型,在对象创建后,该对象的引用会赋值给左侧的变量,该变量会作为该对象的别名(即引用)。
python解释器使用gc模块自动管理内存,其内存管理采用的策略为:引用计数(Reference Counting),标记-清除(Mark—Sweep),分代回收。

2.1 引用计数

python解释器内部用引用计数器记录着所有对象的引用数量,当对象创建时就创建该对象的引用计数并置为1,当引用计数变为0时,该对象会被垃圾回收。

  1. 对象被创建时
    a = 1
  2. 对象另外的别名被创建
    b = a
  3. 对象作为参数传递给函数
    fun(a)
  4. 对象成为容器对象的一个元素
    my_list = [a,]
  1. 一个本地变量离开作用域
  2. 对象的一个别名被显示销毁
    del a
  3. 对象的别名从容器中移除
    my_list.remove(a)
  4. 含有该对象的容器被销毁
    del my_list
from sys import getrefcount

a = ['hello'] #对象list1引用计数为1
b = ['world'] #对象list2引用计数为1
print('a:', getrefcount(a)) #由于对象引用作为入参,因此引用计数加1
print('b:', getrefcount(b))
#循环引用
a.append(b) #对象list2引用计数加1
b.append(a) #对象list1引用计数加1
print('a:', getrefcount(a))
print('b:', getrefcount(b))
del a
del b
#销毁a,b后,任然未释放对象list1和list2的内存,会造成内存泄漏

循环引用发生在两个对象互相引用时(如上图代码),销毁a,b后,两对象的引用计数任然为1,内存并未回收,因此靠引用计数还不够。

2.2 标记-清除

gc模块还使用了类似“标记-清除”的算法来解决可能产生的循环引用。
gc会记录每个对象的引用计数,并用有向图记录对象之间的引用,当遍历a时,a指向b,b的引用计数会减1,同理遍历b时,b指向a,a的引用计数也会减1,最后确保互相引用的对象能够被回收。

2.3 分代

python中通过使用时间来将对象划分成3代。gc会更频繁地处理0代对象,即程序中刚刚创建的,而0代对象经过若干时间周期后仍然存在,则会移动到1代然后才是2代。这些可以通过阈值进行控制。
gc.get_threshold()会返回垃圾回收阈值(700,10,10),700为垃圾回收启动的阈值(即对象的分配次数和释放次数的差值),后面两个10,分别表示每10次0代垃圾回收,会有1次1代垃圾回收,每10次1代垃圾会有1次2代垃圾回收。
gc.get_count()会返回当前垃圾回收状态:

上一篇下一篇

猜你喜欢

热点阅读