Optimizing Java笔记:高级垃圾回收

原书地址:https://www.safaribooksonline.com/library/view/optimizing-java/9781492039259/

感觉挺不错的一本书,断断续续在读.
来自原书第七章的笔记,记录一些感觉比较重要的概念.
原书这个章节内容比较丰富,笔记只是选择性地进行了一些归纳和简单翻译,建议有兴趣的不妨阅读一下原书.


Tradeoffs and Pluggable Collectors

权衡的可插拔垃圾回收器

在Sun的环境中 GC子系统是可插拔的子系统
GC的运行不能改变程序的语义 但性能上可能会有差异

只有权衡 没有银弹

需要权衡的因素:

  • 停顿时间
  • 吞吐量(GC所占运行时时间)
  • 停顿频率
  • 回收效率
  • 停顿一致性(是否所有停顿时间大致一样)

并发GC原理

在一些特定的系统 比如动画播放,常常有固定的帧率,用来提供有规律的 固定的机会执行GC.
但通用的GC就不会有这样的知识来提高停顿的确定性了

JVM safepoints

安全点
基于协商
有两个主要规则控制:

  • JVM不能强制一个线程进入安全点状态
  • JVM可以阻止一个线程离开安全点状态

一个简化的过程:
1.JVM设置一个全局的”time to safepoint“ flag.
2.每个应用线程独自拉取这个flag 发现被设置了
3.他们停下并且等待再次醒来

这个标志被设置意味着素有线程都必须停下来.

停的快的线程也要等待还没停的线程停止(这个时间可能不会完全被pause time statistics统计到)

通常的app线程使用poll的机制
解释器会在任意两个字节码之间去检查 JIT编译器通常会在退出编译方法的位置插入一个poll

这个有点像CountDownLatch 所有线程到这个位置了才去做GC

自动在safepoint的状态:

  1. 正被monitor block了
  2. 正在执行JNI代码

不可能在safepoint的状态:

  1. 正执行了部分bytecode(解释器模式)
  2. 已经被OS中断了

三色标记

tri-color marking算法
工作原理:

  • GC roots染为灰色
  • 所有的其他对象染成白色
  • 一个标记线程移动到随机的灰色节点上
  • 如果这个节点有白色子节点们 标记线程会先将子节点染成灰色 再将该节点染成黑色
  • 过程一直进行直到没有灰色节点剩余
  • 所有黑色节点已经被证明可达并且必须保持存活
  • 白色节点可被回收

并发收集也频繁利用SATB(snapshot at the beginning)
如果对象在收集开始是可达或者在收集之后被分配的 就认为是存活的
这带来了一些额外的工作 需要应用线程在收集过程中创建的对象染黑 非收集过程中的染白

在这个过程中 应用线程会不断改变对像图
还有一个情况是标记黑色的对象在这个过程中又去指向了白色的对象

解决方式:

  1. 黑色更新指向外部白色对象的时候变为灰色
  2. 不允许黑色指向外部白色对象
  3. 维护一个修改的队列 然后进行第二轮fixup
    以及其他的

CMS

为老年代设计的极其低停顿的收集器
一般和一个轻量修改的年轻代并行收集器一起用(ParNew 而不是Parallel GC)

步骤:

  1. 初始标记(Initial Mark) STW
  2. 并发标记(Concurrent Mark)
  3. 并发预清理(Concurrent Preclean)
  4. 重标记(Remark) STW
  5. 并发清理(Concurrent Sweep)
  6. 并发重置(Concurrent Reset)

将一个长的STW停顿变为两个较短的STW停顿

明显的影响:

  • 应用线程不会像之前一样停的久
  • 单个完整的GC循环会花得更久
  • CMS GC循环的时候应用吞吐量会下降
  • GC会花更多的内存跟踪对象
  • 使用更多的CPU时间用来进行GC
  • CMS不会压缩heap 所以老年代会碎片化

默认情况 CMS会用一半可用线程来处理并发阶段 剩下一半运行Java代码
这时候如果Eden满了…就会触发YGC 但这时候已经没那么多线程了..YGC会更久
YGC之后一些对象可能被提升到老年代了 这两个收集器之间需要一些协调 这也是为什么CMS需要一个稍微不同的Young收集器(ParNew)
另一种情况 如果YGC提升到老年代的对象过多…老年代没有空间…emmmm
就触发了并发模式失败(concurrent mode failure,CMF),JVM只能降级转为使用ParallelOld
为了避免频繁的CMF CMS需要在老年代完全满之前就开始一轮收集循环 默认是75%
另外一个场景会引发CMF的是内存碎片 提升的对象没有连续的内存空间可放
降级的ParallelOld有压缩

使用CMS的主要问题是避免CMF

内部CMS使用一个free list记录内存块来管理可用空间
在Concurrent sweep阶段 连续的可用块会被sweeper线程合并在一起 这样可以提供更大的可用空间块来避免因为内存问题造成的CMF
但这个过程也是并发的 sweeper会锁上free lists.

基本参数

-XX:+UseConcMarkSweepGC

启用CMS(同时激活ParNew)

此外还有60多个参数…

G1

Java6引入 Java7里重写 Java8u40就是可靠和生产可用的
不建议在8u40之前使用他

比CMS更容易优化
对老年代提升更不敏感
在大heap下更好的scale(特别是停顿时间)
能够避免(或大幅降低 回退到)full STW收集

G1和并行GC CMS不同 每代没有专用的 连续空间的内容
此外他也没有沿用半球空间(s0 s1)的布局

G1堆空间和Regions

G1堆基于regions的概念.
默认1M(在更大堆下会更大)
注意G1的堆空间是连续的 只是每代本身不连续

G1的算法允许1 2 4 - 64M 应该为32MB
参考:heapRegionBounds
默认 他期望有2048-4095个regions

G1算法设计

使用并发标记阶段
是一个evacuating(搬空)收集器
提供”基于统计的压缩”(statistical compaction)

如果一个对象占用超过一半一个region的大小 就会被认为是一个巨大(humongous)对象.
直接分配在特殊的humongous regions中.空间连续.

年轻代的概念保留 Eden survivor regions.
但不连续
空间随着整体停顿目标变化.

RSets(remembered sets)
pre-region entries
记录自身对象被外部region对象引用的情况
这个是用来处理ygc时 一部分年轻代对象被老年代引用着
不需要扫描整个heap只要检查这个RSets看看外部有没有老年代的region引用着就好了

RSetscard table都是帮助GC解决浮动垃圾(floating garbage)的问题. dead对象间的引用.

G1阶段

  1. 初始标记(Initial Mark) STW
  2. 并发根扫描(Concurrent Root Scan)
  3. 并发标记(Concurrent Mark)
  4. 重标记(Remark) STW
  5. 清理(Cleanup) STW

基本参数

启用参数

-XX:UseG1GC

G1是基于停顿目标的 允许开发者指定一个期望的停顿最大时间
这只是一个目标 没有保证一定能达成
毕竟回收的的前提是分配 分配过程很多是不可预测的

-XX:MaxFCPauseMillis=200

200ms
实践中 100ms以下的目标是很难达到的

-XX:G1HeapRegionSize=n

必须是2的倍数 1- 64 32 单位是MB

Shenandoah

红帽 openjdk项目
项目wiki:https://wiki.openjdk.java.net/display/shenandoah/Main
还不能用于生产

和G1目的一样 是为了降低大堆下的停顿时间

  1. 初始标记 (Initial Mark) STW
  2. 并发标记(Concurrent Marking)
  3. 最终标记(Final Marking) STW
  4. 并发压缩(Concurrent Compaction)

阶段看上去类似
一些实现机制比如SATB也相似
但有一些根本上的不同
最显著的特点就是在压缩阶段 应用线程依旧可以访问对象
使用了brooks pointer.

每个对象使用了一个额外的字(word)来标记是否在上一个gc阶段发生了重定位(relocated) 并且放置了新的位置

如果对象没被重放置 brooks pointer指向内存里的下一个字

压缩阶段涉及到复制 在这个过程中复制对象 然后将原对象的字指向新的复制的对象 相当于做了一个路由

并发压缩
现在的抽空(evacuation)步骤如下:

  1. 复制对象到TLAB(冒险的)
  2. 使用CAS操作更新brooks pointer到那个冒险的副本
  3. 如果成功 那么压缩线程赢了这次race,之后所有的访问该对象会经过Brooks pointer
  4. 如果失败 压缩对象失败.那个冒险的副本会被取消,赢得的线程设置Brooks pointer.

在提供了该回收器上使用

-XX:+UseShenandoahGC

C4(Azul Zing)

Balanced(IBM J9)

Open J9

Lengacy Hotspot Collectors

一些组合在Java8被废弃 在Java9会被移除

Serial和SerialOld

和Parallel ParallelOld类似 但使用单个线程

Incremental CMS(iCMS)

-XX:+CMSIncrementalMode

一些改进尝试 Java9中被移除