Go 垃圾回收(一)概述

  • 概述 * GC & RC
    • 垃圾回收的由来
    • 逃逸分析的由来 * 垃圾回收,怎么实现?
    • 什么样的是垃圾?
    • 怎么把垃圾找出来?
    • 内存屏障

概述

现代编程语言一般都有垃圾回收功能。这个能极大的减轻程序员的负担,并且减少大部分场景的问题。要知道,c 语言里面最常见的就是踩内存,内存泄漏,野指针等问题。golang 作为一个新新语言,自然垃圾回收功能少不了的。当前 golang 的垃圾回收基于的理论是三色标记法,并且通过合理的使用内存屏障技术,把垃圾回收的 stw 几乎消灭(旁白:这个正确的理解,并不是没有 stw,只是非常非常短了)。

GC & RC

首先,内存稍高级的管理有两个方式,了解两个名次:

  1. GC:垃圾回收管理内存的方式
  2. RC:引用计数管理内存的方式

由于 c 语言自身设计的问题,无法实现 GC,所以 c 程序怎么管理内存呢?引用计数就是最常用的稍高级的管理方式。引用计数怎么用?常用姿势如下:

  1. 使用前,为了保护对象不被销毁,计数 +1
  2. 使用完后,计数 -1,计数减到 0 之后,就可以安全销毁了
obj_ref(obj);
{
    do_something ; 
}
obj_unref(obj);

引用计数 RC 的使用看上面非常简单,但其实是非常有讲究的,这里不深入了。此处还是由 golang 的垃圾回收展开。

golang 的垃圾回收我们经常听到三色标记法,三色指的是白色,灰色,黑色,分别表示三种状态,至于三色标记法的理论此处不表,我们从简单的理解切入。

垃圾回收的由来

首先,我们思考下一个不需要思考的问题:垃圾回收是做什么的?golang 为什么需要垃圾回收?

c 程序跑起来是需要内存的,栈内存由编译器来管理,堆内存由程序员来管理,这个就是 c 程序出内存问题的源头,程序员是人,是人就可能出错,各种编程人员的素质也是参差不齐,实际场景也是各种复杂的情况交织。

所以,我们回归本源问题,我们本质上只是想要一个内存而已,管理它只是迫不得已。内存用完了,程序员最好也不管。程序员只管用,不管回收。这个就会垃圾回收的由来。

逃逸分析的由来

我们再进一步,c 程序还需要程序员自己决定从栈上分配内存,还是堆上分配内存?

那么这个事情是程序员必须要做的吗?并不是,本质上程序只是需要一个对象,决定这个事情也是迫不得已。

golang 解决这个事情,就是对应的”逃逸分析“。逃逸分析解决一个问题,在保证 golang 程序正确性的前提下,在编译阶段决定对象的分配位置,栈上?堆上?

垃圾回收,怎么实现?

底线:golang 只需要保证一个点,回收的一定是不用的垃圾,那么就不会出功能性问题,回收的慢点一定程度都 ok 的。

什么样的是垃圾?

怎么保证回收的一定是垃圾?首先看张图:

关注我公众号, 获取更多干货

先说结论:

  1. 图上黄色的就是垃圾,这个从图里一眼就能看出来。没人用它呀,可不就是垃圾嘛

怎么把垃圾找出来?

现在关键的问题是:这个黄色块怎么找出来的?

方法:从根处扫描,把所有的根扫描完,每个根扫描到底。按照之前的三色标记来说,扫描完了的是黑色,正在扫描的是灰色的,没扫描的是白色的。根扫描完了,那么最后只会剩下两种颜色的,黑色,白色。白色就是没用的垃圾,这种清理掉就没事。

问两个问题

  1. 那么根是什么?
  2. 回收的内存是哪里的内存?

答案

  1. 栈是根,是扫描的起点,还有一些全局变量也是根,是起点
  2. 所谓垃圾只对于堆上内存来说,栈上内存是编译器管理的,堆上内存是业务分配,垃圾回收器回收

下面说另一个关键点:怎么扫描是安全的?

  1. 最简单的思路,我让世界都停止下来(stw),谁都别动,等我把垃圾找出来,你再运行你的程序吧。这就安全了吧。

还真别说,golang 1.0 就是这么干的。这种实现非常简单也易于理解,但是无法适用于生产环境,你一停整个程序,就要暂停业务,一停就几秒,所以前期的 golang 根本就不能用呀。

所以呀,为了能够在线上生产场景使用,而不仅仅是个玩具,那么必须要做到垃圾回收不影响业务代码的运行才行。也就是并发喽(旁白:不并发也行,只要你能想到好办法,能做到:能回收垃圾,又不影响业务)?简单的并发就有要考虑的问题了,先说不安全的例子(扫描和业务并发):

初始场景

关注我公众号, 获取更多干货

业务和扫描并发

关注我公众号, 获取更多干货

最后结果

关注我公众号, 获取更多干货

这白色的就是要被回收的,但我们一看就知道,有一个白色的被引用了,回收就野指针了,被回收掉就垮掉了。

内存屏障

怎么解决这个问题?接下来就是内存屏障出场了。golang 内存屏障也有一个演进过程:

  1. 插入写屏障
  2. 混合写屏障(插入写屏障 + 删除写屏障)

先说屏障的本质

  1. 内存屏障只是对应一段特殊的代码
  2. 内存屏障这段代码在编译期间生成
  3. 内存屏障本质上在运行期间拦截内存写操作,相当于一个 hook 调用

屏障的作用

  1. 通过 hook 内存的写操作时机,阻止一些事情的发生,或者说做好一些标记工作,从而保证垃圾回收的正确性

此篇概述,下一篇详述插入写屏障。


坚持思考,方向比努力更重要。关注公众号:奇伢云存储,获取更多干货。 关注我公众号, 获取更多干货