JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）-人工智能-知优网

谈垃圾回收器之前,要先讲讲垃圾回收算法,以及JVM对垃圾的认定策略,JVM垃圾回收器是垃圾回收算法的具体实现,了解了前面的前置知识,有利于对垃圾回收器的理解。

谈废物收回器之前,要先讲讲废物收回算法,以及JVM对废物的确认战略,JVM废物收回器是废物收回算法的详细完结,了解了前面的前置常识,有利于对废物收回器的了解。

什么是废物?

废物,首要是指堆上的方针,那么怎么确认这些方针是能够被收回的呢?

大约思路便是,假如一个方针永久不可能被拜访到,那么便是废物,能够被收回了怎么确认方针永久不会被运用呢?

引证计数法

在方针中添加一个引证计数器，每逢有一个当地引证它时，计数器值就加一；当引证失效时，计数器值就减一；任何时刻计数器为零的方针便是不可能再被运用的。可是，在Java范畴，至少干流的Java虚拟机里边都没有选用引证计数算法来办理内存，首要原因是，这个看似简略的算法有许多例外状况要考虑，必需求合作很多额定处理才干确保正确地作业，比方单纯的引证计数就很难处理方针之间彼此循环引证的问题。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第1张

如图,每一个方针的引证都是1,构成了循环引证,可是并不能被其他方针拜访,这两个方针再无任何引证，引证计数算法也就无法收回它们。

代码验证:

packagecom.courage;
publicclassReferenceCountingGC{
publicObjectinstance=null;
privatestaticfinalint_1MB=1024*1024;
/**
*这个成员特点的仅有含义便是占点内存，以便能在GC日志中看清楚是否有收回过
*/
privatebyte[]bigSize=newbyte[5*_1MB];
publicstaticvoidtestGC(){
//5M
ReferenceCountingGCobjA=newReferenceCountingGC();
//5M
ReferenceCountingGCobjB=newReferenceCountingGC();
objA.instance=objB;
objB.instance=objA;
objA=null;
objB=null;
//假设在这行发生GC，objA和objB是否能被收回？
System.gc();
}
publicstaticvoidmain(String[]args){
testGC();
}
}

履行作用:

[0.004s][warning][gc]-XX:+PrintGCDetailsisdeprecated.Willuse-Xlog:gc*instead.
[0.012s][info][gc,heap]Heapregionsize:1M
[0.015s][info][gc]UsingG1
[0.015s][info][gc,heap,coops]Heapaddress:0x0000000701000000,size:4080MB,CompressedOopsmode:Zerobased,Oopshiftamount:3
......
[0.119s][info][gc,metaspace]GC(0)Metaspace:805K->805K(1056768K)
[0.119s][info][gc]GC(0)PauseFull(System.gc())14M->0M(8M)2.886ms
[0.119s][info][gc,cpu]GC(0)User=0.03sSys=0.00sReal=0.00s
[0.120s][info][gc,heap,exit]Heap
......

为了篇幅,我将部分打印内容省掉了,可见System.gc()后内存占用由14M->0M,将方针这10M释放了。也便是JVM里边并没运用引证计数法来符号废物。

根可达算法

这个算法的根本思路便是经过一系列称为“GC Roots”的根方针作为开端节点集，从这些节点开端，依据引证联系向下查找，查找进程所走过的途径称为“引证链”（Reference Chain），假如某个方针到GC Roots间没有任何引证链相连，或许用图论的话来说便是从GC Roots到这个方针不可达时，则证明此方针是不可能再被运用的。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第2张

在Java技能体系里边，固定可作为GC Roots的方针包含以下几种：

在虚拟机栈（栈帧中的本地变量表）中引证的方针，比方各个线程被调用的办法仓库中运用到的
参数、部分变量、暂时变量等在办法区中类静态特点引证的方针，比方Java类的引证类型静态变量。
在办法区中常量引证的方针，比方字符串常量池（String Table）里的引证。
在本当地法栈中JNI（即一般所说的Native办法）引证的方针。
Java虚拟机内部的引证，如根本数据类型对应的Class方针，一些常驻的反常方针（比方
NullPointExcepiton、OutOfMemoryError）等，还有体系类加载器。
一切被同步锁（synchronized要害字）持有的方针。
反映Java虚拟机内部状况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

废物收回算法

本文介绍了常见的三种废物收回算法（mark-sweep,mark-compact,mark-copy），是java虚拟机各种废物搜集器的算法根底。

废物收回算法思维

当时商业虚拟机的废物搜集器，大大都都遵从了“分代搜集”（Generational Collection）的理论进行规划，分代搜集名为理论，实质是一套契合大大都程序运转实际状况的经历规律，它树立在两个分代假说之上：

1）弱分代假说（Weak Generational Hypothesis）：绝大大都方针都是朝生夕灭的。

2）强分代假说（Strong Generational Hypothesis）：熬过越屡次废物搜集进程的方针就越难以消亡。

这两个分代假说一同奠定了多款常用的废物搜集器的共同的规划准则：搜集器应该将Java堆区分出不同的区域，然后将收回方针依据其年纪（年纪即方针熬过废物搜集进程的次数）分配到不同的区域之中存储清楚明了，假如一个区域中大大都方针都是朝生夕灭，难以熬过废物搜集进程的话，那么把它们会集放在一同，每次收回时只重视怎么保存少量存活而不是去符号那些很多将要被收回的方针，就能以较低价值收回到很多的空间；

假如剩余的都是难以消亡的方针，那把它们会集放在一块，虚拟机便能够运用较低的频率来收回这个区域，这就一同统筹了废物搜集的时刻开支和内存的空间有用运用。

符号-铲除算法 Mark-Sweep

算法分为“符号”和“铲除”两个阶段：首要符号出一切需求收回的方针，在符号完结后，一致收回掉一切被符号的方针，也能够反过来，符号存活的方针，一致收回一切未被符号的方针。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第3张

它的首要缺陷有两个：

第一个是履行功率不稳定，假如Java堆中包含很多方针，并且其间大部分是需求被收回的，这时有必要进行很多符号和铲除的动作，导致符号和铲除两个进程的履行功率都随方针数量添加而下降；

第二个是内存空间的碎片化问题，符号、铲除之后会发生很多不接连的内存碎片，空间碎片太多可能会导致当今后在程序运转进程中需求分配较大方针时无法找到满足的接连内存而不得不提早触发另一次废物搜集动作。

符号-仿制 Mark-Copy

符号-仿制算法常被简称为仿制算法它将可用内存按容量区分为巨细持平的两块，每次只运用其间的一块。当这一块的内存用完了，就将还存活着的方针仿制到别的一块上面，然后再把已运用过的内存空间一次收拾掉。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第4张

假如内存中大都方针都是存活的，这种算法将会发生很多的内存间仿制的开支，但关于大都方针都是可收回的状况，算法需求仿制的便是占少量的存活方针，并且每次都是针对整个半区进行内存收回，分配内存时也就不必考虑有空间碎片的杂乱状况，只需移动堆顶指针，按次序分配即可。这样完结简略，运转高效，不过其缺陷也清楚明了，这种仿制收回算法的价值是将可用内存缩小为了本来的一半，空间糟蹋未免太多了。

符号-紧缩 Mark-Compact

符号-仿制算法在方针存活率较高时就要进行较多的仿制操作，功率将会下降。更要害的是，假如不想糟蹋50%的空间，就需求有额定的空间进行分配担保，以应对被运用的内存中一切方针都100%存活的极点状况，所以在老时代一般不能直接选用这种算法。

符号-紧缩算法其间的符号进程依然与“符号-铲除”算法相同，但后续进程不是直接对可收回方针进行收拾，而是让一切存活的方针都向内存空间一端移动，然后直接收拾掉鸿沟以外的内存:

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第5张

符号-铲除算法与符号-收拾算法的实质差异在于前者是一种非移动式的收回算法，而后者是移动式的。是否移动收回后的存活方针是一项优缺陷并存的危险决议计划：假如移动存活方针，尤其是在老时代这种每次收回都有很多方针存活区域，移动存活方针并更新一切引证这些方针的当地将会是一种极为负重的操作，并且这种方针移动操作有必要全程暂停用户运用程序(STW问题)才干进行。

废物处理器

依据上面的三种废物收回算法,衍生出7种废物收回器:

Serial搜集器

这个搜集器是一个单线程作业的搜集器，但它的“单线程”的含义并不仅仅是阐明它只会运用一个处理器或一条搜集线程去完结废物搜集作业，更重要的是强调在它进行废物搜集时，有必要暂停其他一切作业线程，直到它搜集完毕。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第6张

迄今为止，它依然是HotSpot虚拟机运转在客户端方法下的默许新生代搜集器，有着优于其他搜集器的当地，那便是简略而高效（与其他搜集器的单线程比较），关于内存资源受限的环境，它是一切搜集器里额定内存耗费（Memory Footprint） [1] 最小的；关于单核处理器或处理器中心数较少的环境来说，Serial搜集器因为没有线程交互的开支，专注做废物搜集天然能够取得最高的单线程搜集功率。Serial搜集器关于运转在客户端方法下的虚拟机来说是一个很好的挑选。

ParNew搜集器

ParNew搜集器实质上是Serial搜集器的多线程并行版别，除了一同运用多条线程进行废物搜集之

外，其他的行为包含Serial搜集器可用的一切操控参数（例如：-XX：SurvivorRatio、-XX：

PretenureSizeThreshold、-XX：HandlePromotionFailure等）、搜集算法、Stop The World、方针分配规

则、收回战略等都与Serial搜集器完全共同，在完结上这两种搜集器也共用了适当多的代码。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第7张

ParNew搜集器除了支撑多线程并行搜集之外，其他与Serial搜集器比较并没有太多立异之处，但它

却是不少运转在服务端方法下的HotSpot虚拟机，尤其是JDK 7之前的留传体系中首选的新生代搜集

器，其间有一个与功用、功能无关但其实很重要的原因是：

除了Serial搜集器外，现在只需它能与CMS

搜集器合作作业,另一方面CMS的呈现稳固了ParNew的位置

ParNew搜集器在单中心处理器的环境中绝对不会有比Serial搜集器更好的作用，乃至因为存在线程

交互的开支，该搜集器在经过超线程（Hyper-Threading）技能完结的伪双核处理器环境中都不能百分之百确保逾越Serial搜集器。当然，跟着能够被运用的处理器中心数量的添加，ParNew关于废物搜集时

体系资源的高效运用仍是很有长处的。

Parallel Scavenge搜集器

Parallel Scavenge搜集器也是一款新生代搜集器，它相同是依据符号-仿制算法完结的搜集器，也是能够并行搜集的多线程搜集器……Parallel Scavenge的许多特性从表面上看和ParNew十分类似，那它有什么特别之处呢？

Parallel Scavenge搜集器的特点是它的重视点与其他搜集器不同，CMS等搜集器的重视点是尽可能地缩短废物搜集时用户线程的中止时刻，而Parallel Scavenge搜集器的方针则是到达一个可操控的吞吐量（Throughput）。所谓吞吐量便是处理器用于运转用户代码的时刻与处理器总耗费时刻的比值，即：

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第8张

假如虚拟机完结某个使命，用户代码加上废物搜集一共耗费了100分钟，其间废物搜集花掉1分钟，那吞吐量便是99%。中止时刻越短就越合适需求与用户交互或需求确保服务呼应质量的程序，杰出的呼应速度能提高用户体会；而高吞吐量则能够最高功率地运用处理器资源，赶快完结程序的运算使命，首要合适在后台运算而不需求太多交互的剖析使命。

因为与吞吐量联系密切，Parallel Scavenge搜集器也常常被称作“吞吐量优先搜集器”。

Serial Old搜集器

Serial Old是Serial搜集器的老时代版别，它相同是一个单线程搜集器，运用符号-收拾算法。这个搜集器的首要含义也是供客户端方法下的HotSpot虚拟机运用。假如在服务端方法下，它也可能有两种用处：一种是在JDK 5以及之前的版别中与Parallel Scavenge搜集器调配运用，别的一种便是作为CMS搜集器发生失利时的后备预案，在并发搜集发生Concurrent Mode Failure时运用。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第9张

Parallel Old搜集器

Parallel Old是Parallel Scavenge搜集器的老时代版别，支撑多线程并发搜集，依据符号-收拾算法完结。这个搜集器是直到JDK 6时才开端供给的，在此之前，新生代的Parallel Scavenge搜集器一向处于适当为难的状况，原因是假如新生代挑选了Parallel Scavenge搜集器，老时代除了Serial Old（PSMarkSweep）搜集器以外别无挑选，其他体现杰出的老时代搜集器，如CMS无法与它合作作业。

因为老时代Serial Old搜集器在服务端运用功能上的“连累”，运用Parallel Scavenge搜集器也未必能在全体上取得吞吐量最大化的作用。

相同，因为单线程的老时代搜会集无法充分运用服务器多处理器的并行处理才能，在老时代内存空间很大并且硬件标准比较高档的运转环境中，这种组合的总吞吐量乃至不一定比ParNew加CMS的组合来得优异。直到Parallel Old搜集器呈现后，“吞吐量优先”搜集器总算有了比较当之无愧的调配组合，在重视吞吐量或许处理器资源较为稀缺的场合，都能够优先考虑Parallel Scavenge加Parallel Old搜集器这个组合。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第10张

CMS搜集器

CMS（Concurrent Mark Sweep）搜集器是一种以获取最短收回中止时刻为方针的搜集器。现在很大一部分的Java运用会集在互联网网站或许依据浏览器的B/S体系的服务端上，这类运用一般都会较为重视服务的呼应速度，期望体系中止时刻尽可能短，以给用户带来杰出的交互体会。CMS搜集器就十分契合这类运用的需求。

从姓名（包含“Mark Sweep”）上就能够看出CMS搜集器是依据符号-铲除算法完结的，它的运作进程相关于前面几种搜集器来说要更杂乱一些，整个进程分为四个进程，包含：

1）初始符号（CMS initial mark）

2）并发符号（CMS concurrent mark）

3）从头符号（CMS remark）

4）并发铲除（CMS concurrent sweep）

其间初始符号、从头符号这两个进程依然需求“Stop The World”。初始符号仅仅只是符号一下GCRoots能直接相关到的方针，速度很快；并发符号阶段便是从GC Roots的直接相关方针开端遍历整个方针图的进程，这个进程耗时较长可是不需求中止用户线程，能够与废物搜集线程一同并发运转；而从头符号阶段则是为了批改并发符号期间，因用户程序持续运作而导致符号发生变化的那一部分方针的符号记载，这个阶段的中止时刻一般会比初始符号阶段稍长一些，但也远比并发符号阶段的时刻短；最终是并发铲除阶段，收拾删除去符号阶段判别的现已逝世的方针，因为不需求移动存活方针，所以这个阶段也是能够与用户线程一同并发的。因为在整个进程中耗时最长的并发符号和并发铲除阶段中，废物搜集器线程都能够与用户线程一同作业，所以从总体上来说，CMS搜集器的内存收回进程是与用户线程一同并发履行的。

JVM调优之废物定位、废物收回算法、废物处理器比照（jvm垃圾回收机制算法）开发技能代码第11张

长处：并发搜集、低中止

缺陷：1.对处理器资源十分灵敏

2.无法处理“起浮废物”（Floating Garbage）

3.空间碎片

Garbage First搜集器

Garbage First（简称G1）搜集器是废物搜集器技能发展历史上的里程碑式的作用，它创始了搜集器面向部分搜集的规划思路和依据Region的内存布局方法。G1是一款首要面向服务端运用的废物搜集器。

在G1搜集器呈现之前的一切其他搜集器，包含CMS在内，废物搜集的方针规模要么是整个新生代（Minor GC），要么便是整个老时代（Major GC），再要么便是整个Java堆（Full GC）。而G1跳出了这个樊笼，它能够面向堆内存任何部分来组成收回集（Collection Set，一般简称CSet）进行收回，衡量标准不再是它归于哪个分代，而是哪块内存中寄存的废物数量最多，收收回益最大，这便是G1搜集器的Mixed GC方法。G1创始的依据Region的堆内存布局是它能够完结这个方针的要害。尽管G1也仍是遵从分代搜集理论规划的，但其堆内存的布局与其他搜集器有十分显着的差异：G1不再坚持固定巨细以及固定数量的分代区域区分，而是把接连的Java堆区分为多个巨细持平的独立区域（Region），每一个Region都能够依据需求，扮演新生代的Eden空间、Survivor空间，或许老时代空间。搜集器能够对扮演不同人物的Region选用不同的战略去处理，这样无论是新创建的方针仍是现已存活了一段时刻、熬过屡次搜集的旧方针都能获取很好的搜集作用。

Region中还有一类特别的Humongous区域，专门用来存储大方针。G1以为只需巨细超过了一个Region容量一半的方针即可判定为大方针。每个Region的巨细能够经过参数-XX：G1HeapRegionSize设定，取值规模为1MB～32MB，且应为2的N次幂。而关于那些超过了整个Region容量的超级大方针，将会被寄存在N个接连的Humongous Region之中，G1的大大都行为都把Humongous Region作为老时代的一部分来进行看待，如图3-12所示。

尽管G1依然保存新生代和老时代的概念，但新生代和老时代不再是固定的了，它们都是一系列区域（不需求接连）的动态调集。G1搜集器之所以能树立可猜测的中止时刻模型，是因为它将Region作为单次收回的最小单元，即每次搜集到的内存空间都是Region巨细的整数倍，这样能够有计划地防止在整个Java堆中进行全区域的废物搜集。更详细的处理思路是让G1搜集器去盯梢各个Region里边的废物堆积的“价值”巨细，价值即收回所取得的空间巨细以及收回所需时刻的经历值，然后在后台保护一个优先级列表，每次依据用户设定答应的搜会集止时刻（运用参数-XX：MaxGCPauseMillis指定，默许值是200毫秒），优先处理收回价值收益最大的那些Region，这也便是“Garbage First”姓名的由来。这种运用Region区分内存空间，以及具有优先级的区域收回方法，确保了G1搜集器在有限的时刻内获取尽可能高的搜集功率。