文章 62
浏览 15135
什么,JVM竟然带颜色??

什么,JVM竟然带颜色??

image.png

背景

最近因为线上出现了一个 jvm 的问题,最终原因是反射过多创建了类对象,而设置的 MetaSpace 过下,导致溢出了,最终虽然结合网上和自己的经验,一段骚操作解决了,不过也萌发了我对 jvm 的理解,虽然在网上听了太多的垃圾回收算法/垃圾回收器,但是回收算法具体是怎么样实现的,刚好最近有幸偶然看了下 JVM 深入理解虚拟机(三)这版书和结合网上技术大牛的讲解,说到了三色标记,基于此写篇博客记录下

三色标记

天空一声巨响,三色标记就闪亮登场,jvm 说,我需要点颜色,give me some color see see ,于是三色标记就出来(开个玩笑,三色标记不是具体的颜色,而是一个形象的抽象,emmm)

三色标记简介

在并发标记的过程中,因为标记期间应用线程还在继续跑,对象间的引用可能发生变化,多标和漏标的情况就有可能发生。漏标的问题主要引入了三色标记算法来解决。

三色标记法是一种垃圾回收法,它可以让 JVM 不发生或仅短时间发生 STW(Stop The World),从而达到清除 JVM 内存垃圾的目的。

三色标记算法是把 Gc roots 可达性分析遍历对象过程中遇到的对象, 按照“是否访问过”这个条件标记成以下三种颜色:

  • 黑色
    表示对象已经被垃圾收集器访问过, 且这个对象的所有引用都已经扫描过。 黑色的对象代表已经扫描过, 它是安全存活的, 如果有其他对象引用指向了黑色对象, 无须重新扫描一遍。 黑色对象不可能直接(不经过灰色对象) 指向某个白色对象。
  • 灰色
    表示对象已经被垃圾收集器访问过, 但这个对象上至少存在一个引用还没有被扫描过。
  • 白色
    表示对象尚未被垃圾收集器访问过。 显然在可达性分析刚刚开始的阶段, 所有的对象都是白色的, 若在分析结束的阶段, 仍然是白色的对象, 即代表不可达

image.png

是不是很笼统,这是个啥???

image.png

举个代码例子

public class ThreeColorRemark {

    public static void main(String[] args) {
        A a = new A();
        //开始做并发标记
        D d = a.b.d;   // 1.读
        a.b.d = null;  // 2.写
        a.d = d;       // 3.写
    }
}

class A {
    B b = new B();
    D d = null;
}

class B {
    C c = new C();
    D d = new D();
}

class C {
}

class D {
}

别急听我细说:
简而言之呢,因为我们都知道,jvm 用的是可达性分析法(还不知道可达性分析法的童鞋自己去百度哈 🙏 )就是垃圾回收器为了更好的解决对象引用、优化 gcRoots 枚举遍历的、优化 STW 的一个措施,就是将定义了三种颜色,假设我们程序员创建了三个对象,A->B(D)->C(A 引用 B,D,B 引用 C,C 孤零零)当 JVM 进行垃圾回收的时候,判断对象是否可达,检测到 A 是有被引用,打标为黑色,然后发现 A 引用了 B,就进行判定 B,发现 B 也有引用 C,打标 B,如果是只有 GC 线程在运行最后遍历完,ABC 都是黑色,D 是白色,但是呢,GC 回收进行标记的时候,用户线程不会中断,所有导致会并发修改,GC 打标了颜色,会因为用户线程重新引用或者取消引用,导致漏标或者多标

就以上面代码来说,原本 A 对象包含了 B,D,但是 D 未 init<> 设置 NULL,最终 D 为白色,但是用户线程执行到 后面的代码,将 A 里面的 D 引用到了 B 里面的 D,将 B 里面的 D 置为 null,所以之前 GC 打标的结果,就会有出入

多标-浮动垃圾

在并发标记过程中,如果由于方法运行结束导致部分局部变量(gcroot)被销毁,这个 gcroot 引用的对象之前又被扫描过(被标记为非垃圾对象),那么本轮 GC 不会回收这部分内存。这部分本应该回收但是没有回收到的内存,被称之为“浮动垃圾”。浮动垃圾并不会影响垃圾回收的正确性,只是需要等到下一轮垃圾回收中才被清除。

另外,针对并发标记(还有并发清理)开始后产生的新对象,通常的做法是直接全部当成黑色,本轮不会进行清除。这部分对象期间可能也会变为垃圾,这也算是浮动垃圾的一部分。

(大白话就是,GC 线程之前标记为非垃圾对象,但是用户线程并发修改了引用对象,导致变为不可达对象,原本应该直接回收,这就变成了浮动垃圾)

漏标-读写屏障

漏标会导致被引用的对象被当成垃圾误删除,这是严重 bug,必须解决,有两种解决方案: 增量更新(Incremental Update) 和原始快照(Snapshot At The Beginning,SATB)。

大白话就是,原本 GC 回收线程标记为白色,不可达对象后,用户线程又重新让其‘自救’,让其有引用,变成了可达对象,也就是代码中 D 对象,这就是漏标

  • 增量更新
    就是当黑色对象插入新的指向白色对象的引用关系时, 就将这个新插入的引用记录下来, 等并发扫描结束之后, 再将这些记录过的引用关系中的黑色对象为根, 重新扫描一次。 这可以简化理解为, 黑色对象一旦新插入了指向白色对象的引用之后, 它就变回灰色对象了。
  • 原始快照
    就是当灰色对象要删除指向白色对象的引用关系时, 就将这个要删除的引用记录下来, 在并发扫描结束之后, 再将这些记录过的引用关系中的灰色对象为根, 重新扫描一次,这样就能扫描到白色的对象,将白色对象直接标记为黑色(目的就是让这种对象在本轮 gc 清理中能存活下来,待下一轮 gc 的时候重新扫描,这个对象也有可能是浮动垃圾)

深入理解 JVM 虚拟机(第三版)

image.png

image.png

image.png


标题:什么,JVM竟然带颜色??
作者:xiaohugg
地址:https://xiaohugg.top/articles/2023/10/20/1697802941972.html

人民有信仰 民族有希望 国家有力量