当前位置: 首页 > news >正文

垃圾回收的三色标记算法

目录

1、介绍

1.1、发展

1.2、基本原理

2、执行过程

2.1、初始标记 (Initial Marking)

2.2、并发标记 (Concurrent Marking)

2.3、重新标记 (Remark)

2.4、垃圾清理阶段

3、并发标记

3.1、浮动垃圾

3.2、漏标


前言

        三色标记(Tri-color Marking)是JVM垃圾回收器中用于追踪存活对象的核心算法,尤其广泛应用于CMS、G1等现代垃圾收集器。

        属于是jvm的垃圾回收算法里面的标记-清除(Mark-Sweep)算法家族的重要演进成果,但它与传统标记-清除有显著区别,演进而非隶属。

如下图所示:

由上图可知,两者的区别和联系。


1、介绍

1.1、发展

        属于增量式状态转换标记,而非一次性全量标记,清除阶段仍基于传统标记-清除的思想。

引用计数(1959)
↓
标记-清除(1960)
↓
标记-整理(1960s)
↓
分代收集(1984)
↓
三色标记(1976)→ 并发标记(1990s)
↓
颜色指针(2010s)

        三色标记算法通过引入中间状态(灰色)和状态转换机制,使标记过程可以暂停和恢复,从而实现了并发标记这一重大突破,这是传统标记-清除算法无法做到的。

        两者在思想上一脉相承,但在实现方式和应用场景上已有本质区别。

1.2、基本原理


        三色标记算法将对象分为三种颜色:黑色 (Black)、灰色 (Gray) 和白色 (White)。每种颜色代表了对象的不同状态。如下图所示:

1.白色 (White):

含义:

        表示未被访问过的对象,即尚未被标记的对象。
变化:

        在初始标记阶段,所有对象都是白色的。


2.灰色 (Gray):

含义:

        表示正在被访问的对象,即已经被标记,但其引用还没有被完全追踪的对象。
变化:

        在并发标记过程中,当一个对象被首次标记时,它会变成灰色。然后,从灰色对象开始,追踪其引用的对象。


3.黑色 (Black):

含义:

        表示完全访问过的对象,即已经被标记并且其所有引用都已被追踪的对象。
变化:

        当一个灰色对象的所有引用都被追踪完毕后,它会变成黑色。


2、执行过程

2.1、初始标记 (Initial Marking)

描述:

        将所有对象标记为白色,并将所有GC Roots(如类静态变量、活动线程栈中的局部变量等)直接引用的对象标记为灰色。


特点:这个阶段需要暂停所有的应用程序线程


2.2、并发标记 (Concurrent Marking)

描述:从标记过的对象开始,递归地追踪其引用的对象,并将其标记。
特点:这个阶段不需要暂停应用程序线程,可以与应用程序并发执行。


标记过程:

          从灰色对象开始,遍历其引用的对象,将它们也标记为灰色(如果它们还未被标记)。同时,将已经遍历过的灰色对象及其引用的所有对象都标记为黑色。

        这个过程会递归进行,直到没有新的灰色对象被标记。


2.3、重新标记 (Remark)

描述:

        由于并发标记过程中可能存在新的对象被创建或引用关系发生变化,因此需要再次检查并标记这些变化。这个过程可能需要STW,但时间通常较短。


特点:这个阶段需要暂停应用程序线程,以确保标记准确无误。
目的:确保垃圾回收完成后没有遗漏的垃圾对象。

2.4、垃圾清理阶段

        清理所有白色对象,即那些未被引用的对象,释放它们占用的内存空间。


3、并发标记


在并发标记过程中,由于用户线程和垃圾回收线程同时运行,可能会产生以下问题:

3.1、浮动垃圾

        在并发标记过程中,用户线程可能会创建新的对象或断开现有对象的引用,导致部分对象被错误地标记为存活(实际上是垃圾),这些对象被称为浮动垃圾。

        浮动垃圾不会影响应用程序的正确性,但会占用内存,直到下一轮GC被清理。

        如下图,A在之前扫描已经完成标记,并且标记为黑色,但是垃圾处理过程共,又取消了对A的对象引用。

类似于A这种称为浮动垃圾:

3.2、漏标

          当灰色对象断开了对白色对象的引用,并且黑色对象重新引用了该白色对象时,可能会发生漏标。

               漏标会导致本应存活的对象被错误地回收,影响应用程序的正确性。

        为了解决漏标问题,JVM采用了读屏障和写屏障技术来记录引用关系的变化,并在并发标记结束后重新扫描这些变化,确保没有漏标对象。

        在E标为灰色的时候,G还未扫描,但是E取消了对G的引用,此时D又引用了G,但是D已经标记为黑色,不会重新扫描。

        这就会引发很严重的问题,G此时是有引用的,但是现在会当成垃圾被处理掉。


总结

        三色标记算法是Java垃圾回收中的一种重要技术,通过将对象分为白色、灰色和黑色三种颜色来有效管理内存中的对象。

        它支持并发垃圾回收,减少了垃圾回收过程中的停顿时间,提高了应用程序的性能和响应能力。

        然而,在并发标记过程中仍然存在浮动垃圾和漏标等挑战,需要通过读屏障、写屏障等技术来解决。

参考文章:

1、谈谈对JVM的理解_谈谈你对jvm的理解-CSDN博客

相关文章:

  • Petalinux开发Linux
  • 最新CDGP单选题(第四章)补充
  • fastjson2 json.tojsonstring 会自动忽略过滤掉 key: null的数据
  • Linux Shell编程之条件语句
  • SGLang 实战介绍 (张量并行 / Qwen3 30B MoE 架构部署)
  • 红黑树详解初版
  • 公链钱包开发:技术逻辑与产品设计实践
  • Asp.Net Core IIS发布后PUT、DELETE请求错误405
  • 飞云分仓操盘副图指标操作技术图文分解
  • Ceph PG unfound/lost 问题排查与解决
  • 101alpah_第5个alpha学习
  • 电子电气架构 --- 如何有助于提安全性并减少事故
  • Spark缓存--cache方法
  • 力扣:多数元素
  • 【C/C++】RPC与线程间通信:高效设计的关键选择
  • 香港国际交易节奏解析:结构性波动背后的信号逻辑
  • 【软件设计师:数据库】13.数据库控制与安全
  • 关于多版本CUDA共存的研究,是否能一台机子装两个CUDA 版本并正常切换使用
  • Vue2:引入公共JS,通过this调用
  • 前端基础之《Vue(15)—组件通信(2)》
  • 国家主席习近平同普京总统签署关于进一步深化中俄新时代全面战略协作伙伴关系的联合声明
  • 视频丨习近平主席出席俄方在机场举行的迎宾仪式
  • 马上评|不再提“智驾”,新能源车企回归理性
  • 紧盯大V、网红带货肉制品,整治制售假劣肉制品专项行动开展
  • 湖北奥莱斯轮胎公司逃避监管排放大气污染物被罚25万元
  • 三大交易所多举措支持科创债再扩容,约160亿证券公司科创债有望近期落地