python 面试常问的垃圾回收机制

前言

近期有小伙伴跟我反馈，面试有遇到面试官问python内存管理机制相关的问题，因为之前没有特地的去了解过，所以不知道怎么回答。所以今天就专门写了这篇python内存管理机制的文章，来给大家系统的梳理一下内存管理机制的知识点，以及面试中容易被问到的问题。

通过这篇文章帮你们轻松通关面试中python内存管理机制相关的问题。

一、引用计数机制

引用计算机制是咱们python中垃圾回收的主要机制，python解释器会根据对象的引用计数是否为零，来对进行垃圾回收，释放内存。接下来我们先来看看什么是引用计数。

我们先来看一个最简单的python赋值语句


>>> a = 10

这边给变量a赋值了一个数值类型的对象10, 那么在内存中存储的时候，a这个变量指向的是10这个对象，此时10这个对象的引用计算会加1，


>>> b=a

当我们再把a 赋值给变量b时，b引用的也是a这个变量引用的值10，那么这个时候10这个对象的引用计数又会加1。

引用计数增加：

对象被创建
对象被别的变量引用（赋值给一个变量）
对象被作为元素，放在容器中（比如被当作元素放在列表中）

引用计数减少：

对象的别名被显式的销毁
对象的一个别名被赋值给其他对象（例：比如原来的a=10，被改成a=100,那么此时10的引用计数就减少了）
对象从容器中被移除，或者容器被销毁(例：对象从列表中被移除，或者列表被销毁）
一个引用离开了它的作用域（调用函数的时候传进去的参数，在函数运行结束后，该参数的引用即被销毁）

引用计数查看

咱们如果要查看对象的引用计数，可以通过内置模块sys提供的getrefcount方法去查看。


import sys
obj =[11,22,33]
print(sys.getrefcount(obj))

注意点：当使用某个引用作为参数，传递给getrefcount()时，参数实际上创建了一个临时的引用。因此，getrefcount()所得到的结果，会比期望的多1 ；对应一些常用的基本数据看到的引用计数值会比较大（因为python内部引用）

二、数据池和缓存

1、小整数池


a=1000
a1=1000
b = 10
b1 = 10
# a和a1是否为同一个对象？，b和b1是否为同一个对象？

问题：a和a1是否为同一个对象？，b和b1是否为同一个对象？

答案： b和b1是同一个对象，a和a1不是

为什么会出现上述情况呢？

当运行python程序时，Python自动将-5~256的整数进行了缓存，放在一个‘池’（小整数池）中，无论程序中那些变量指向这些范围内的整数或者字符串当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。

优点：对于一些常用的整数，直接从‘池’里拿来用，避免频繁的创建和销毁，提升效率，节约内存

2、intern机制

intern机制，也称为字符串驻留池，是针对于字符串内存管理的一种优化处理的机制。


In [4]: s1='abc'
In [5]: s2 ='abc'
In [6]: s2 is s2
Out[6]: True

In [7]: s3='abc?'
In [8]: s4 = 'abc?'
In [9]: s3 is s4
Out[9]: False
#为什么会出现这种情况，同样是字符串为什么上面两次赋值，是同一个对象，下面不是。

****intern机制**的优点是，在创建新的字符串对象时(如果字符串只包含数字、字母、下划线），会先在字符串驻留池里面找是否有已经存在的值相同的对象，如果有，则直接拿过来用（引用），避免频繁的创建和销毁内存，提升效率。

3、缓存机制

float、int 、list等一些内置的数据类型，会缓存80个对象
元组会根据元组数据的长度，分别缓存元组长度为0-20的对象。
其他的自定义类型一般都是缓存2个对象

三、垃圾回收机制

python的垃圾回收机制用一句话来形容就是：引用计数机制为主，标记-清除和分代收集两种机制为辅的策略

1、引用计数

引用计数：在之前讲对象的引用我们讲到了，每个对象创建之后都有一个引用计数，当引用计数为0的时候，那么此时的的垃圾回收机制会自动把它销毁，回收内存空间。
引用计数存在一个缺点**：**那就是当两个对象出现循环引用的时候，那么这个两个变量始终不会被销毁，这样就会导致内存泄漏。

2、标记清除：

首先标记对象（垃圾检测），然后清除垃圾（垃圾回收)，首先初始所有对象标记为白色，并确定根节点对象（这些对象是不会被删除），标记它们为黑色（表示对象有效）,将有效对象引用的对象标记为灰色（表示对象可达，但它们所引用的对象还没检查），检查完灰色对象引用的对象后，将灰色标记为黑色。重复直到不存在灰色节点为止。最后白色结点都是需要清除的对象。

3、分代回收

分代回收是一种以空间换时间的操作方式，Python将内存根据对象的存活时间划分为不同的集合，每个集合称为一个代，Python将内存分为了3“代”，分别为年轻代（第0代）、中年代（第1代）、老年代（第2代），他们对应的是3个链表，它们的垃圾收集频率随着对象存活时间的增大而减小。

测试派 Give testers a home.