python 面试常问的垃圾回收机制

本贴最后更新于 1215 天前,其中的信息可能已经东海扬尘

前言

近期有小伙伴跟我反馈 ,面试有遇到面试官问python内存管理机制相关的问题,因为之前没有特地的去了解过,所以不知道怎么回答。所以今天就专门写了这篇python内存管理机制的文章,来给大家系统的梳理一下内存管理机制的知识点,以及面试中容易被问到的问题。

通过这篇文章帮你们轻松通关面试中python内存管理机制相关的问题。

一、引用计数机制

引用计算机制是咱们python中垃圾回收的主要机制,python解释器会根据对象的引用计数是否为零,来对进行垃圾回收,释放内存。接下来我们先来看看什么是引用计数。

我们先来看一个最简单的python赋值语句

>>> a = 10

这边给变量a赋值了一个数值类型的对象10, 那么在内存中存储的时候,a这个变量指向的是10这个对象,此时10这个对象的引用计算会加1,

>>> b=a

当我们再把a 赋值给变量b时,b引用的也是a这个变量引用的值10,那么这个时候10这个对象的引用计数又会加1。

引用计数增加:

引用计数减少:

引用计数查看

咱们如果要查看对象的引用计数,可以通过内置模块sys提供的getrefcount方法去查看。

import sys
obj =[11,22,33]
print(sys.getrefcount(obj))

注意点:当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用。因此,getrefcount()所得到的结果,会比期望的多1 ;对应一些常用的基本数据看到的引用计数值会比较大(因为python内部引用)

二、数据池和缓存

1、小整数池

a=1000
a1=1000
b = 10
b1 = 10
# a和a1是否为同一个对象?,b和b1是否为同一个对象?

问题:a和a1是否为同一个对象?,b和b1是否为同一个对象?

答案: b和b1是同一个对象,a和a1不是

为什么会出现上述情况呢?

当运行python程序时,Python自动将-5~256的整数进行了缓存,放在一个‘池’(小整数池)中,无论程序中那些变量指向这些范围内的整数或者字符串当你将这些整数赋值给变量时,并不会重新创建对象,而是使用已经创建好的缓存对象。

优点:对于一些常用的整数,直接从‘池’里拿来用,避免频繁的创建和销毁,提升效率,节约内存

2、intern机制

intern机制,也称为字符串驻留池,是针对于字符串内存管理的一种优化处理的机制。

In [4]: s1='abc'
In [5]: s2 ='abc'
In [6]: s2 is s2
Out[6]: True

In [7]: s3='abc?'
In [8]: s4 = 'abc?'
In [9]: s3 is s4
Out[9]: False
#为什么会出现这种情况,同样是字符串为什么上面两次赋值,是同一个对象,下面不是。

****intern机制**的优点是,在创建新的字符串对象时(如果字符串只包含数字、字母、下划线),会先在字符串驻留池里面找是否有已经存在的值相同的对象,如果有,则直接拿过来用(引用),避免频繁的创建和销毁内存,提升效率。

3、缓存机制

1629802242793.png

三、垃圾回收机制

1、引用计数

1558747262244.png

2、标记清除:

首先标记对象(垃圾检测),然后清除垃圾(垃圾回收),首先初始所有对象标记为白色,并确定根节点对象(这些对象是不会被删除),标记它们为黑色(表示对象有效),将有效对象引用的对象标记为灰色(表示对象可达,但它们所引用的对象还没检查),检查完灰色对象引用的对象后,将灰色标记为黑色。重复直到不存在灰色节点为止。最后白色结点都是需要清除的对象。

1558747286938.png

3、分代回收

分代回收是一种以空间换时间的操作方式,Python将内存根据对象的存活时间划分为不同的集合,每个集合称为一个代,Python将内存分为了3“代”,分别为年轻代(第0代)、中年代(第1代)、老年代(第2代),他们对应的是3个链表,它们的垃圾收集频率随着对象存活时间的增大而减小。

1574156896413.png

回帖
请输入回帖内容 ...