搞懂垃圾回收的机制,先搞懂垃圾回收的是哪些数据,这些数据在哪块区域,所以我们先看JVM内存区域
线程私有
- 虚拟机栈:生命周期和线程相同,每个方法执行之前会被创建,保存局部变量等。进入方法前入栈和方法执行结束出栈,所以不需要进行GC
- 本地方法栈:为虚拟机栈提供服务支持的,运行Java方法 >>> 虚拟机栈 >>> 本地方栈 。所以不需要进行GC
- 程序计数器:线程执行字节码的行号指示器,Java虚拟机多线程是轮流切换的(上下文切换),每个线程如何知道上一次执行到了什么位置呢,通过程序计数器行号指示器。程序计数器是唯一一个在 Java 虚拟机规范中没有规定任何 OOM 情况的区域,所以这块区域也不需要进行 GC
线程共享
- 本地内存:Java 8 中,本地内存,也是我们通常说的堆外内存,注意到上图中 Java 8 和 Java 8 之前的 JVM 内存区域的区别,在 Java 8 之前有个永久代的概念,永久代实现了 JVM 规范定义的方法区功能,主要存储类的信息,常量,静态变量,即时编译器编译后代码等,这部分由于是在堆中实现的。 Java 8 中就把方法区的实现移到了本地内存中的元空间中,这样方法区就不受 JVM 的控制了,也就不会进行 GC,也因此提升了性能。在 Java 8 以后这一区域也不需要进行GC
- 堆:对象实例和数组都是在堆上分配的,需要GC也主要对这两类数据进行回收
如何识别垃圾
- GC主要发生在堆中,JVM 如何判断堆中对象是否为垃圾呢,使用了"根可达算法"(可达性算法)
- 可达性算法的原理:是以一系列叫做 GC Root 的对象为起点出发,引出它们指向的下一个节点,再以下个节点为起点,引出此节点指向的下一个结点。。。直到所有的结点都遍历完毕,如果相关对象不在任意一个以 GC Root 为起点的引用链中,则这些对象会被判断为「垃圾」,会被 GC 回收
GC Root 是什么玩意呢,包括哪些对象?
- 虚拟机栈中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中 JNI(即一般说的 Native 方法)引用的对象
垃圾回收的主要方法
- 标记清除算法
- 复制算法
- 标记整理
标记清除
- 如下图先根据根可达算法标出可回收对象
- 把可回收对象回收
- 过程简单,但存在内存碎片问题。假如想分配4M连续内存,显然上图可用空间加一起够4M,但是不能满足连续性,要是能把 1M、2M、1M 连接起来就好了。
标记清除整理
- 在标记清除的基础之上增加了"整理"步骤,将所有的存活对象都往一侧紧密排队,再清理掉另一端所有区域,从而解决了磁盘碎片化问题
- 缺点:每一次GC都需要频繁的移动存活的对象,影响效率
复制算法
把堆等分成2块,A和B ,区域 A 负责分配对象,区域 B 不分配,对区域 A 使用以上所说的标记法把存活的对象标记出来,区域 A 中存活的对象都复制到区域 B,最后把 A 区对象全部清理掉释放出空间,这样就解决了内存碎片的问题。
借用网上的图:
- 缺点:浪费空间,100G的空间可用空间只有50G。每次也需要移动对象到另一端,效率不高。