当前位置：首页 > news >正文

今日八股——JVM篇

news 2025/10/9 5:42:54

JVM 组成

JVM 是什么？

JVM 是 Java Virtual Machine Java 程序的运行环境(Java 二进制字节码的运行环境)

是独立于操作系统的，也就是每次程序都在虚拟机运行。不同于 c 语言的是， Java 语言具有特点：

一次编写，到处运行
自动内存管理，垃圾回收机制。

JVM 组成

什么是程序计数器？

线程私有的(无线程安全问题)，每个线程一份，内部保存字节码的行号。用于记录正在执行的字节码指令的地址。

Java 虚拟机对于多线程是通过线程轮流切换并且分配线程执行时间。在任何的时间点上，一个处理器只处理一个线程，当这个线程时间片用完了后【挂起】。会切换到下一个线程，下一个线程时间片完后，会回来继续执行被挂起的线程。而程序计数器起到了类似于书签的作用，他会记录当前线程下一条要执行的字节码指令的位置，然后接着继续往下执行。

程序计数器是 JVM 规范中唯一一个没有规定出现 OOM 的区域，所以这个空间也不会被 GC。

你能给我详细的介绍 Java 堆吗？

线程共享的区域：主要用来保存对象实例、数组等，当堆中没有空间可分配给实例，也无法再扩展时，则抛出OutOfMemoryError异常。

年轻代被划分为三部分，Eden 区和两个大小严格相同的 Survivor 区，根据 JVM 策略（对象先进入到 Eden 区，经过垃圾收集还存活，复制到 S0 或 S1），经过几次垃圾收集之后，依然存活于 Survivor 的对象将被放到老年代。

老年代主要保存生命周期长的对象，一般是一些老的对象。

元空间保存的类信息、静态变量、常量、编译后的代码。

JDK1.7 和 1.8 的区别：

1.7 中有一个永久代，存储的是类信息、静态变量、常量、编译后的代码。
1.8 移除了永久代，把数据存储到了本地内存的元空间中，防止内存溢出。

什么是虚拟机栈？

每个线程运行所需要的内存称为虚拟机栈，先进后出。
每个栈有多个栈帧(frame)组成，对应着每次方法调用时所占用的内存。
每个线程只能有一个活动栈帧，对应着目前正在执行的方法。

垃圾回收是否涉及栈内存？

垃圾回收主要是指堆内存，当栈帧弹栈以后，内存就会释放。

栈内存分配越大越好吗？

未必，默认的栈内存一般为 1024K

栈帧过大会导致线程数变少。比如机器总内存为 512M，目前能活动的线程就为 512 个，如果把栈内存改为 2048K，那么能活动的栈帧就减半。

方法内的局部变量是否线程安全？

public static void main(String[] args) {StringBuilder sb = new StringBuilder();sb.append(1);sb.append(2);new Thread(() -> {m2(sb);}).start();
}public static void m1() { // 线程安全StringBuilder sb = new StringBuilder();sb.append(1);sb.append(2);System.out.println(sb.toString());
}public static void m2(StringBuilder sb) { // 线程不安全sb.append(3);sb.append(4);System.out.println(sb.toString());
}public static StringBuilder m3() { // 线程不安全StringBuilder sb = new StringBuilder();sb.append(5);sb.append(6);return sb;
}

如果方法内局部变量没有逃离方法的作用范围，他是线程安全的。
如果是局部变量引用了对象，并逃离方法的作用范围，需要考虑线程安全

在以上代码举例中，m2 方法传递了 sb 的引用，方法内的操作会直接修改 main 方法的 sb 内容，多线程环境下，会出现线程安全问题。m3 同样，涉及到返回了 sb 内容，也是属于逃离方法的作用范围。

什么情况下会导致栈内存溢出？

栈帧过多导致栈内存溢出，典型问题：递归调用
栈帧过大导致栈内存溢出

堆栈的区别是什么？

栈内存一般会用来存储局部变量和方法调用，但堆内存是用来存储Java对象和数组的的。
堆会GC垃圾回收，而栈不会。
栈内存是线程私有的，而堆内存是线程共有的。
两者异常错误不同，但如果栈内存或者堆内存不足都会抛出异常。栈空间不足:java.lang.StackOverFlowError。堆空间不足:java.lang.OutOfMemoryError。

能不能解释一下方法区？

方法区(Method Area)是各个线程共亨的内存区域
主要存储类的信息、运行时常量池
虚拟机启动的时候创建，关闭虚拟机时释放
如果方法区域中的内存无法满足分配请求，则会抛出OutOfMemoryError: Metaspace

解释一下常量池

可以看作是一张表，虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息。

运行时常量池

常量池是**.class*** 文件中的，当该类被加载，它的常量池信息就会放入运行时常量池，并把里面的符号地址变为真实地址****。**

你听过直接内存吗？

直接内存：

并不属于 JVM 中的内存结构，不由 JVM 进行管理。是虚拟机的系统内存。
是虚拟机的系统内存，常见于 NIO 操作时，用于数据缓冲区，它分配回收成本较高，但读写性能高。不受 JVM 内存回收管理。

常规 IO 的数据拷贝过程

因为 Java 是无法直接访问系统缓存区的，所以系统会先将磁盘文件数据读到系统缓存区，然后 Java 堆内存在读到 Java 缓冲区中，很显然这是两次数据复制的过程，效率是不高的。

NIO 数据拷贝流程

操作系统划出了一部分直接内存，使得 Java 可以直接读写访问，于是只需要一次磁盘文件数据复制就可以完成拷贝流程，从而提高了效率。

类加载器

什么是类加载器，类加载器有哪些?

类加载器

JVM只会运行二进制文件，类加载器的作用就是将**字节码文件加载到JVM**中，从而让Java程序能够启动起来。

什么是双亲委派模型？

加载某一个类，先委托上一级的加载器进行加载，如果上级加载器也有上级，则会继续向上委托，如果该类委托上级没有被加载，子加载器尝试加载该类。

JVM 为什么采用双亲委派机制？(高频)

(1)通过双亲委派机制可以避免某一个类被重复加载，当父类已经加载后则无需重复加载，保证唯一性。

(2)为了安全，保证类库API不会被修改

比如：

此时执行 main 函数，会出现异常，在类 java.lang.String 中找不到 main 方法。

由于是双亲委派的机制, java.lang.String的在启动类加载器得到加载, 因为在核心jre库中有其相同名字的类文件, 但该类中并没有main方法。这样就能防止恶意篡改核心API库。

说一下类装载的执行过程

类从加载到虚拟机中开始，直到卸载为止，它的整个生命周期包括了：加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中，验证、准备和解析这三个部分统称为连接（linking）。

加载

通过类的全名, 获取类的二进制数据流。
解析类的二进制数据流为方法区内的数据结构 (Java 类模型)
创建 java.lang.Class 类的实例, 表示该类型。作为方法区这个类的各种数据的访问入口

验证

验证类是否符合 JVM 规范，安全性检查。

准备

为类变量分配内存并设置类变量初始值

解析

比如常量池中，查找机器指令的最终方法引用。

将类中的符号引用转换为直接引用。

初始化

对类的静态变量，静态代码块执行初始化操作。

如果初始化一个类的时候, 其父类尚未初始化, 则优先初始化其父类。
如果同时包含多个静态变量和静态代码块, 则按照自上而下的顺序依次执行。

使用

JVM 开始从入口方法开始执行用户的程序代码

调用静态类成员信息（比如：静态字段、静态方法）
使用new关键字为其创建对象实例

ANS

加载：查找和导入class文件
验证：保证加载类的准确性
准备：为类变量分配内存并设置类变量初始值
解析：把类中的符号引用转换为直接引用
初始化：对类的静态变量,静态代码块执行初始化操作
使用：JVM 开始从入口方法开始执行用户的程序代码
卸载：当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象。

垃圾回收

对象什么时候可以被垃圾回收？

回收堆中的内存。如果一个或多个对象没有任何的引用指向他了，那么这个对象就是垃圾，如果定位了垃圾，则有可能被垃圾回收器回收。

如果要定位什么是垃圾，主要有两种方法，一种是引用计数法，一种是可达性分析算法。

引用计数法

一个对象被引用了一次，就在这个对象头上递增一次引用次数，如果这个对象的引用次数为 0，代表这个对象可回收。

当对象间出现了循环引用的话，方法就会失效。

互相引用也会增加引用计数的。目前是 2，当 a、b 置为 null 时，ref–，但是 ref 仍不为零，会导致内存泄露。

可达性分析算法

现在的虚拟机都是通过可达性分析算法确定哪些内容是垃圾。

哪些对象可以作为 GC Root

JVM 垃圾回收算法有哪些？(高频)

标记清除算法

标记清除算法，是将垃圾回收分为2个阶段，分别是标记和清除。

根据可达性分析算法得出的垃圾进行标记
对这些标记为可回收的内容进行垃圾回收

标记整理算法

优缺点同标记清除算法, 解决了标记清除算法的碎片化的问题, 同时, 标记压缩算法多了一步, 对象移动内存位置的步骤, 其效率也有一定的影响。

复制算法

ANS

标记清除算法：垃圾回收分为2个阶段,分别是标记和清除,效率高,有磁盘碎片,内存不连续
标记整理算法：标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
复制算法：将原有的内存空间一分为二，每次只用其中的一块,正在使用的对象复制到另一个内存空间中，然后将该内存空间清空,交换两个内存的角色，完成垃圾的回收;无碎片，内存使用率低

说一下 JVM 中的分代回收

新创建的对象, 都会先分配到eden区
当伊甸园内存不足, 标记伊甸园与 from（现阶段没有）的存活对象
将存活对象采用复制算法复制到 to 中, 复制完毕后, 伊甸园和 from内存都得到释放
经过一段时间后伊甸园的内存又出现不足, 标记eden区域to区存活的对象,将存活的对象复制到from区
当幸存区对象熬过几次回收 (最多15次), 晋升到老年代 (幸存区内存不足或大对象会导致提前晋升)

MinorGC、MixedGC、FullGC 的区别是什么？

MinorGC【young GC】发生在新生代的垃圾回收, 暂停时间短 (STW)
Mixed GC 新生代 +老年代部分区域的垃圾回收, G1 收集器特有
FullGC: 新生代 + 老年代完整垃圾回收, 暂停时间长 (STW), 应尽力避免

说一下 JVM 有哪些垃圾回收器？(高频)

在jvm中, 实现了多种垃圾收集器, 包括:

串行垃圾收集器
并行垃圾收集器
CMS (并发) 垃圾收集器
G1垃圾收集器

串行垃圾回收器

Serial和Serial Old串行垃圾收集器, 是指使用单线程进行垃圾回收, 堆内存较小, 适合个人电脑

Serial 作用于新生代, 采用复制算法
Serial Old 作用于老年代, 采用标记-整理算法

垃圾回收时，只有一个线程在工作，并且java应用中的所有线程都要暂停(STW)，等待垃圾回收的完成。

并行垃圾回收器

Parallel New和Parallel Old是一个并行垃圾回收器，JDK8默认使用此垃圾回收器

Parallel New作用于新生代,采用复制算法
Parallel Old作用于老年代, 采用标记-整理算法

垃圾回收时，多个线程在工作，并且java应用中的所有线程都要暂停(STW)，等待垃圾回收的完成。

CMS(并发)垃圾收集器

CMS全称 Concurrent Mark Sweep，是一款并发的、使用标记-清除算法的垃圾回收器，该回收器是针对老年代垃圾回收的，是一款以获取最短回收停顿时间为目标的收集器，停顿时间短，用户体验就好。其最大特点是在进行垃圾回收时, 应用仍然能正常运行。

G1 垃圾回收器

详细聊一下 G1 垃圾回收器(高频)

应用于新生代和老年代，在JDK9之后默认使用G1
划分成多个区域,每个区域都可以充当 eden, survivor, old, humongous, 其中humongous专为大对象准备
采用复制算法
响应时间与吞吐量兼顾
分成三个阶段：新生代回收、并发标记、混合收集
如果并发失败（即回收速度赶不上创建新对象速度），会触发Full GC

强引用、软引用、弱引用、虚引用的区别

强引用：只有所有 GC Roots 对象都不通过【强引用】引用该对象，该对象才能被垃圾回收

软引用：仅有软引用引用该对象时，在垃圾回收后，内存仍不足时会再次出发垃圾回收

弱引用：仅有弱引用引用该对象时，在垃圾回收时，无论内存是否充足，都会回收弱引用对象

虚引用：必须配合引用队列使用，被引用对象回收时，会将虚引用入队，由 Reference Handler 线程调用虚引用相关方法释放直接内存

ANS

强引用：只要所有 GC Roots 能找到, 就不会被回收
软引用: 需要配合SoftReference使用, 当垃圾多次回收, 内存依然不够的时候会回收软引用对象
弱引用: 需要配合WeakReference使用, 只要进行了垃圾回收, 就会把弱引用对象回收
虚引用: 必须配合引用队列使用,被引用对象回收时, 会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存

JVM 实践

JVM 调优的参数可以在哪里设置参数值？

用的 JVM 调优的参数都有哪些？

设置堆空间大小
虚拟机栈的设置
年轻代中Eden区和两个Survivor区的大小比例
年轻代晋升老年代阈值
设置垃圾回收收集器

设置堆空间大小

设置堆的初始大小和最大大小, 为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间, 通常把最大、初始大小设置为相同的值。

堆空间设置多少合适？

最大大小的默认值是物理内存的1/4, 初始大小是物理内存的1/64
堆太小, 可能会频繁的导致年轻代和老年代的垃圾回收, 会产生stw,暂停用户线程
堆内存大肯定是好的, 存在风险, 假如发生了fullgc, 它会扫描整个堆空间, 暂停用户线程的时间长
设置参考推荐: 尽量大, 也要考察一下当前计算机其他程序的内存使用情况

虚拟机栈的设置

虚拟机栈的设置：每个线程默认会开启1M的内存，用于存放栈帧、调用参数、局部变量等，但一般256K就够用。通常减少每个线程的堆栈，可以产生更多的线程，但这实际上还受限于操作系统。

年轻代中 Eden 区和两个 Survivor 区的大小比例

该值如果不设置，则默认比例为8:1:1。通过增大Eden区的大小来减少YGC发生的次数，但有时我们发现，虽然次数减少了，但Eden区满的时候，由于占用的空间较大，导致释放缓慢，此时STW的时间较长，因此需要按照程序情况去调优。

年轻代晋升老年代阈值

设置垃圾回收收集器

说一下 JVM 调优的工具

命令工具
- jps 进程状态信息
- jstack 查看java进程内线程的堆栈信息
- jmap 查看堆转信息
- jhat 堆转储快照分析工具
- jstat JVM统计监测工具
可视化工具
- jconsole 用于对jvm的内存，线程，类的监控
- VisualVM 能够监控线程, 内存情况