_StriveG Blog

jvm垃圾回收

前言

这篇依旧是深入理解java虚拟机一书的内容,这本书很好,我也看了几篇了,但是每次看,都有不同的理解,不同的收获,建议大家买一本。

java与c++、c这些语言不同的一点就在于,java具有自动管理内存的功能,这其中就包括垃圾回收。下面,就记录下垃圾回收的算法以及垃圾回收器。

如何判断对象已死

引用计数

首先说明,jvm中并没有选择引用计数。

给对象添加一个引用计数器,当被引用时,计数器+1,引用失效时,计数器-1。但是这种存在循环引用的问题。

可达性分析算法

通过一系列”GC Roots”的对象作为起始点,从这个节点开始向下搜索,搜索走过的路径叫做引用链,当一个对象到GC Roots没有任何引用链相连的话,则证明对象是不可用的。

在java中,GC Roots对象包括以下几种:

  • 虚拟机栈(帧栈中的本地变量表)中的应用对象
  • 方法区中类静态属性引用的对象(static)
  • 方法区中常量引用的对象
  • 本地方法栈中(一般说的native方法)引用的对象

自我救赎

在可达性分析中被标记不可达的对象,也不是非死不可。

要宣告一个对象死亡,至少要经历两次标记过程:GC Roots之后,会被第一次标记并且进行筛选,筛选的条件-是否有必要执行finalize方法,当对象没有覆盖finalize方法的时候,或者已经执行过,就不会筛选。(finalize方法只会被系统执行一次),想实现救赎,可以在finalize之中,重新与引用链上的对象建立关联,因为finalize只会被系统执行一次,所以只能救赎一次。

回收方法区

方法区存储的是被虚拟机加载的类信息、常量、静态变量、即使编译后的代码等数据。这部分的回收主要有两部分:废弃常量和无用的类。

废弃常量-没有对象引用的话,就会被移除常量池,进行回收
无用的类,类加载容易,卸载难,满足卸载的条件如下:

  • 该类的所有实例都被回收
  • 加载该类的ClassLoader被回收
  • 对象的java.lang.Class对象没有在任何地方被引用,无法通过反射访问该类的方法

垃圾回收算法

标记-清理算法

首先标记出需要回收的对象,然后清理掉需要回收的对象。

缺点:

  • 标记和回收的过程效率都不高
  • 会产生内存碎片

复制算法

将内存划分为两块内存,使用其中一块,当一块用完时,将存活的对象复制到另一块上面,并将用过的内存空间一次清理掉。

hotspot虚拟机,会将内存分为一块Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor,回收时,将存活的对象复制到另一块Survivor上,然后清理。

但是这样存在问题,无法确定存活的对象小于Survivor的空间,所以需要分配担保(将多余的对象放入其他内存空间,比如老年代)

在对象存活率较高时,要进行较多的复制操作,因此不适合老生代。

标记-整体算法

先标记死亡的对象,然后存活的对象向一端移动,最后清理掉另一端。

分代算法

将内存根据生命周期分为几种,一般为新生代和老生代,然后根据特性,选择不同的回收算法。

总结

新生代适合复制算法。老生代适合标记-清理、标记-整体之类。

HotSpot的算法实现

  • 枚举根节点,这个时候需要停止所有的执行线程(Stop The World)
  • 安全点,程序执行时并非在所有地方都能停顿下来开始gc,直邮到达特定的点(安全点)才能暂停
  • 安全区域,指在一段代码之中,引用关系不会发生变化,所以在这段区域的人和地方都可以停下来gc

垃圾收集器

Serial(old)收集器

串行收集器,新生代和老生代都有,不过新生代用的是复制算法,老生代用的是标记-整理算法。

图为Serial和Serial Old结合使用的图。

ParNew收集器

是Serial收集器的多线程版本,ParNewh和Serial Old结合使用的图如下:

ParNew收集器在cpu核数多的情况下才有优势。

Parallel Scavenge收集器

目标:吞吐量

参数:

  • -XX:MaxGCPauseMillis 控制最大停顿时间
  • -XX:GCTimeRatio 直接设置吞吐量大小

Parallel Old

Parallel的老生代版本,使用多线程和标记-整理算法。

CMS收集器

CMS(Concurrent Mark Sweep)以获取最短停顿时间为目标的收集器。

过程:

  • 初始标记 cms initial mark
  • 并发标记 cms concurrent mark
  • 重新标记 cms remark
  • 并发清除 cms concurrent sweep

缺点:

  • 对cpu资源敏感
  • 无法处理浮动垃圾
  • 大量碎片

G1收集器

G1(garbage first),面向服务端的垃圾收集器。具备以下特点:

  • 并行与并发
  • 分代收集
  • 空间整合
  • 可预测停顿

g1收集器的运作大致可划分为以下几个步骤:

  • 初始标记 initial marking
  • 并发标记 concurrent marking
  • 最终标记 final marking
  • 筛选会后 live data counting and evacuation

内存分配策略

  • 对象优先在Eden分配(新生代)
  • 大对象直接进入老年代
  • 长期存活的对象进入老年代,每个对象都有一个年龄计数器,当躲过一次gc,加一,当大于阀值,则进入老生代
  • 动态对象年龄判断 Survivor空间中相同年龄所有对象大小和大于空间的一半,则大于等于这个年龄的都进去老年代
  • 空间分配担保,在这里需要先介绍两个名词
    • Minor GC 新生代gc
    • Major GC 老生代gc
    • 在进行Minor GC时,会检查老生代的连续内存是否大于新生代所有对象总空间(可能会有对象晋升到老生代,这是一种保守的做法(悲观?)),如果大,就是安全的,不成立,则看HandlePromotionFailure设置值是否允许担保失败,如果允许,就看老生代的连续内存大小是否大于历次晋升的平均大小,如果大于,进行 Minor GC ,但是这时还存在风险(乐观做法)。如果不允许,进行 Major GC。

总结

许多虚拟机参数,这里并没有说明。建议大家买本这个书看,真的,每次都有收获。

最近访客