当前位置：首页 > news >正文

JVM运行时数据区域(Run-Time Data Areas)的解析

news 2025/10/30 2:28:55

#　JVM运行时数据区域(Run-Time Data Areas)的解析

欢迎来到我的博客：TWind的博客

我的CSDN:：Thanwind-CSDN博客

我的掘金：Thanwinde 的个人主页

本文参考于：深入理解Java虚拟机：JVM高级特性与最佳实践

本文的JVM均指HotSpot 虚拟机

0.前言

首先，JMM（Java 内存模型）和JVM运行时数据区域是两个东西（JVM内存模型），前者是一种规范，类似于接口，譬如可见性（visibility）、有序性（ordering ）和原子性（atomicity）

后者则是实打实的对JVM内存的严格划分区域

尽管作为一个八股中经久不衰的考查点，但很少有文章对其进行深度的剖析

虽然我的理解可能也不是很深，但我会尽己所能写出我觉得不该遗漏的地方

1.JDK 1.7

JVM的运行时数据区域在1.7->1.8阶段进行了一次巨大变化，后面的版本直到现在并未有很大的变化，我们就用1.7 和1.8来展示，首先先是1.7：

这里用了一个大致的图像来展现了JDK1.7版本下的JVM内存的大致分布
在这里插入图片描述

大致可以分为：

虚拟机栈
本地方法栈
程序计数器（PC）
堆内存
永久代
直接内存

但实际上，内存的划分比这些更为复杂，这里只是简单的概括

虚拟机栈

显而易见的，虚拟机栈是用来存储虚拟机执行的方法栈帧的

每一条线程都拥有自己的一个栈用于储存自己的栈帧

栈帧在其中以栈的形式存储，其严格的分为：

局部变量表：存储了这个方法的基本类型变量以及引用类型变量的引用，在编译完成后便不会改变
动态链接：包含一个指向当前方法所属类型的运行时常量池（后面会介绍），栈帧会通过这个去找到对应的对象的符号引用和实际引用

[!WARNING]

注意！HotSpot在堆中存储的是对象实例数据+指向对象类型数据的指针！对象类型数据是存储在方法区之中的！
操作数栈：用来存储做运算的数，譬如要计算a+b，就会往里面压入a，压入b，然后执行iadd(字节码)就会弹出两个数相加并把答案压回
返回地址：链接到其执行处，你可以简单的理解为：int a = test（b），这里的test所指的地址也就是返回地址，也就是一个栈帧连接到另一个栈帧上

虚拟机栈有溢出风险：栈帧过多，栈内存过小都会引起栈溢出

我在查资料时看到有一种说法：递归过多会引起局部变量表膨胀导致栈溢出：实际上这是错误的，局部变量表在编译完成后就不会变了，膨胀的说法无从说起

涉及到class文件的信息会在后面再行详细讲解

本地方法栈

本地方法为JVM提供了一个用来操作底层的接口，相对应的，其栈内存的管理，使用完全取决于底层来管理

可以参考https://www.artima.com/insidejvm/ed2/jvm9.html

里面提到了：

When a thread invokes a native method, it enters a new world in which the structures and security restrictions of the Java virtual machine no longer hamper its freedom.

也就是说，虚拟机并不会妨碍其运行，就像是用一个“拓展”方法一样

在这里插入图片描述

程序计数器（PC）

请不要将其与OS中的PC寄存器弄混！

但你也可以将程序计数器理解为OS中的PC寄存器的虚拟机版：JVM理所当然的需要支持多个线程

那么就需要保存每一个线程上次执行到哪里，便于在每个线程之间来回切换

那么就有一小片内存用来保存其位置，这就是程序计数器

其并不会内存泄漏：就保存个位置想必也泄露不了

[!WARNING]

程序计数器并不属于栈，栈郑等等，你要硬说的话其属于线程：线程中的_last_Java_pc变量就是其上次执行到的位置，可参考

https://cr.openjdk.org/~aph/8064357-rev-1/src/share/vm/runtime/javaFrameAnchor.hpp-.html

每个线程的程序计数器相互独立

堆内存

堆内存是JVM中最重要的存储区之一：他存储了几乎所有Java中的对象的实例数据，字符串常量池，静态变量等等

所以，堆是被所有线程所共享的

就拿栈帧来举例：

对于基本类型的数据，一般会直接存储在局部变量表中

但是对于引用类型的数据，就会引到堆内存中：其存储了实例的数据以及指向实例类型数据的指针，程序会通过实例类型数据来正确的加载使用这个类

对象数据会存储在堆内存中，对象的类型数据会存储在永久代之中

堆内存中还存有譬如字符串常量池，引用类型的静态变量（还没有完全迁移过来,目前基本类型还是储存在方法区，引用类型则在堆区，到了1.8后会把所有静态变量都迁移过来，后面会有实验验证，参考https://stackoverflow.com/questions/8387989/where-are-static-methods-and-static-variables-stored-in-java，以及https://openjdk.org/jeps/122，里面提到了JDK8完全迁移了静态变量区到了堆内存中）

但是：

[!CAUTION]

目前来说，在高版本的JDK中，JIT，逃逸分析，栈上分配使得不是所有的对象都会存储在堆内存之中了，需要注意！

JVM大名鼎鼎的GC回收，在1.7版本的主要对象就是堆内存：永久代由于其设计的原因，难以被回收，所以，堆内存该如何去高效率的回收利用就成了一项十分关键的技术

对于1.7来说，主要是采用分代回收技术：将其分为新生代与老年代，分别采用不同的回收策略：但这并不是我们今天的主角，你只需要知道，堆内存相当于JVM的“硬盘”，需要经常清理就对了

字符串常量池

用来存储字符串常量的地方，原本位于永久代，JDK1.7因为大字符串容易引起永久代溢出便被移到了堆内存之中

这个池子本质上是 JVM 运行时常量池（Runtime Constant Pool）里的一个哈希表 StringTable，你可以理解为：引用在运行时常量池中，本体在堆中

具体来说，所有"xxx"双引号之中的字符串会被加入其中，“a” + "b"这种在编译就能确定的字符串也会加入其中

对于手动拼接的：String a = new String(“a”) + new String(“b”),可以调用intern方法将其加入，本质是将其对象整个移入字符串常量池，而不是复制一份

这样能很好的避免保存很多重复的字符串，比如

    public static void main(String[] args)  {String a = "a";String b = "b";String c = a + b;c.intern();System.out.println(c == "ab");}

这里会返回true，原因在于c的引用被“移”到了字符串常量池中，String是引用类型

实际上，Integer，Boolean等类型也存在类似的复用：Integer会存储-128-127的对象复用，Boolean会复用true和false，这称为享元机制

永久代

[!WARNING]

永久代在JDK1.8,即JDK8被移除，取而代之的是元空间

经常文章大言不惭的说：永久代就是方法区

实际上，在Java虚拟机规范上，是这么描述方法区的：

The Java Virtual Machine has a method area that is shared among all Java Virtual Machine threads. The method area is analogous to the storage area for compiled code of a conventional language or analogous to the “text” segment in an operating system process. It stores per-class structures such as the run-time constant pool, field and method data, and the code for methods and constructors, including the special methods (§2.9) used in class and instance initialization and interface initialization.

Java虚拟机具有一个方法区域，该方法区域在所有Java虚拟机线程中共享。该方法区域类似于存储区域的常规语言代码，或类似于操作系统过程中的“文本”段。它存储了每个类结构，例如运行时常数池，字段和方法数据以及方法和构造函数的代码，包括类和实例初始化和接口初始化中使用的特殊方法。

所以，方法区就像一个interface,元空间，永久代就是它的实现

如同翻译所说：方法区存储了每个类结构，例如运行时常数池，字段和方法数据以及方法和构造函数的代码

也就是说，每个类的“骨干”就被存在了方法区之中

对于永久代，也就有了这种思想：类不容易被卸载，所以永久代就像蜂巢一样，把每一个类塞进去

这样当然会很方便去管理，但是，对于去卸载类，扩展类会极其困难

随着发展，人们发现对于方法区的GC是非常重要的，对于无用类的回收也非常重要

而且永久代拥有大小限制，不像元空间那样理论上限就是机器的内存大小

于是，在JDK1.8永久代就被移除替换成了可以拓展，便于GC的元空间了

其中的静态变量也被全部移到了堆内存之中（之前只是引用类型的静态变量被移到了堆内存之中）

举个例子，static int a = 10;属于基本类型，会直接存在永久代之中

但是,static student a = new student();student是你的一个自定义类，这里就属于引用类型:永久代之中存储的就是一个指向堆中的引用

运行时常量池

栈帧的动态链接链到的就是这里

运行时常量池就像一个字典：作为符号引用和实际地址的桥梁：

比如说，x = y x，y都是符号，指什么？

这里就要去运行时常量池查找，将其解析为实际上的在堆中的引用（解析的过程并不像这样简单，这里不涉及）

然后会把引用返回，栈帧会将其加入动态链接来替换掉原来的符号引用，便于后序加速访问

上文提到的字符串常量区中的StringTable就存储在其中，StringTable所指向的实际字符串存储在堆中

类元数据

除开运行时常量池外，永久代还存储着最为重要的信息，类元数据：被虚拟机加载的各种类的类型信息，譬如的结构信息，包括类的名称、父类、方法、字段、接口、注解等以及JIT编译后的代码等

所有的类加载后都会将其信息存储在在其中，更形象的说明是：堆中的类的内容，而且永久代中是类的骨架

这一点可以从java对对象的访问看出：先从栈帧的局部变量表中的引用类型可以看出：reference中有一个指向堆的地址，这个地址存储有对象的实例信息和指向永久代的对象的类型信息，两者相辅相成

直接内存

用于NIO的一块内存，这块内存比较特殊，既能直接用native方法操作，又能通过java堆中的DirectByteBuffer直接访问来操作，这样就避免了来回在Java堆和本机内存中来回的复制数据

最常见的用处，就是用于支持NIO的缓冲区：Native内存能直接放入，Java堆能直接读取，极大的提高了IO性能

直接内存不受JVM限制，大小由本地机器的内存限制

2.class文件分析

这是一个简简单单的Java代码:

public class test1 {public static void main(String[] args)  {String a = "a";String b = "b";User user = new User();}static class User{String name;String password;}
}

编译后，执行 javap -v target/classes/你的类名.class

就能得到一份比较容易看懂的字节码：

Classfile /E:/JavaSourceCode/jvm-test/target/classes/test1.classLast modified 2025-5-8; size 530 bytes	//这里是文件的基本信息，大小，上次修改MD5 checksum 284474226b95abd8838ad253b0d7beb0	//这个文件的M哈希码Compiled from "test1.java"	//源文件信息
public class test1minor version: 0		//次版本号major version: 52		//主版本号，52是JAVA 8flags: ACC_PUBLIC, ACC_SUPER	//类类型：这里是标识是public，ACC_SUPER无用，已废除
Constant pool:		//这个类的常量池，运行后会被搬到自己的运行时常量池（Runtime Constant Pool）#1 = Methodref          #7.#28         // java/lang/Object."<init>":()V#2 = String             #21            // a//拿最简单的String类型举例//这里#2,你可以理解为是这个量的“位置”，后面的#21对应着其实际或与之关联量的位置#3 = String             #23            // b#4 = Class              #29            // test1$User#5 = Methodref          #4.#28         // test1$User."<init>":()V#6 = Class              #30            // test1#7 = Class              #31            // java/lang/Object#8 = Utf8               User#9 = Utf8               InnerClasses#10 = Utf8               <init>#11 = Utf8               ()V#12 = Utf8               Code#13 = Utf8               LineNumberTable#14 = Utf8               LocalVariableTable#15 = Utf8               this#16 = Utf8               Ltest1;#17 = Utf8               main#18 = Utf8               ([Ljava/lang/String;)V#19 = Utf8               args#20 = Utf8               [Ljava/lang/String;#21 = Utf8               a//这里直接对应着上面的#2，直接是对应着字符串常量池里面的“a”：运行时记载/链接时会自动将其放到字符串常量池中#22 = Utf8               Ljava/lang/String;#23 = Utf8               b#24 = Utf8               user#25 = Utf8               Ltest1$User;#26 = Utf8               SourceFile#27 = Utf8               test1.java#28 = NameAndType        #10:#11        // "<init>":()V#29 = Utf8               test1$User#30 = Utf8               test1#31 = Utf8               java/lang/Object
{//这里是类构造器部分，存储着要去构造类的一些必须的信息//你也可以理解为：类的构造函数，所以它的结构和普通方法很像public test1();descriptor: ()V	//方法签名为void，无参flags: ACC_PUBLIC	//public范围Code://代码区，从上往下执行stack=1, locals=1, args_size=1	//这里是类的一些信息：操作数栈大小 ：1，本地变量表大小：1，只用了一个slot（this），后面解释0: aload_0 //压入this1: invokespecial #1  //调用超类构造器加载（对应着常量池第一个）                // Method java/lang/Object."<init>":()V4: return		//返回LineNumberTable:line 9: 0	//对应着Java源代码的第九行，没有偏移量：即是这个类的开始地址LocalVariableTable:	//本地变量表，仅仅是用来便于你看的，不会存储Start  Length  Slot  Name   Signature0       5     0  this   Ltest1;//仅仅只有一个变量，就是thispublic static void main(java.lang.String[]);	//同上，main的构造类descriptor: ([Ljava/lang/String;)V	//返回void，具有一个参数flags: ACC_PUBLIC, ACC_STATIC	//具有public和staticCode:	//代码区，从上往下执行stack=2, locals=4, args_size=10: ldc           #2                  // String a2: astore_1		//从常量池中读a,然后存到slot 1中3: ldc           #3                  // String b5: astore_26: new           #4                  // class test1$User9: dup			//这里是加载User类，通过超类加载器加载10: invokespecial #5                  // Method test1$User."<init>":()V13: astore_3	//存储到槽314: returnLineNumberTable:	//对应着Java代码的每一行line 11: 0line 12: 3line 13: 6line 14: 14LocalVariableTable:	//同上，待会在下面解释slotStart  Length  Slot  Name   Signature0      15     0  args   [Ljava/lang/String;3      12     1     a   Ljava/lang/String;6       9     2     b   Ljava/lang/String;14       1     3  user   Ltest1$User;
}
SourceFile: "test1.java"
InnerClasses:static #8= #4 of #6; //User=class test1$User of class test1

可以看到，字节码相对于汇编，比较好阅读

其中我们看眼大致的看到，对于一个class，会将其大致分成：常量池+方法(构造函数+其他方法)

其中常量池中，#部分完全可以理解成“地址”，下面的code对应的地址都会回归到常量池

所以常量池就像电话簿一样，提供了每一个要用到的地址和信息

类加载后，常量池会被加入到运行时常量池中

这样就链起来了：

一个方法被调用->创建栈帧->执行code->加载对象->根据栈帧中的动态链接来找到自己类的运行时常量池->从运行时常量池中获取到对象在堆中的地址->读取对象进行操作->根据返回地址返回到对应的栈帧

slot意为“槽”，是对于对于本地变量表的，操作数栈一个基本单位，具体来说，本地变量表里面的所有对象都是用“slot”来作为单位来存储的，比如int，string都占一个slot，long，double则占两个slot，对于其他引用类型，比如你自定义的类，只占一个slot（参照上面表中的user，只占1个slot）

slot更像是用来作为一个“索引”来访问，每个对象都对应着一个自己的slot（占用多个slot的对象会以第一个作为自己的索引），可以通过这个索引直接在局部变量表中找到对应的对象，比如astore_1，就是存储到编号为1的slot之中

class文件的大致描述就这样