今日八股——JVM篇
JVM 组成
JVM 是什么?
JVM 是 Java Virtual Machine Java 程序的运行环境(Java 二进制字节码的运行环境)
是独立于操作系统的,也就是每次程序都在虚拟机运行。不同于 c 语言的是, Java 语言具有特点:
- 一次编写,到处运行
- 自动内存管理,垃圾回收机制。
JVM 组成
什么是程序计数器?
线程私有的(无线程安全问题),每个线程一份,内部保存字节码的行号。用于记录正在执行的字节码指令的地址。
Java 虚拟机对于多线程是通过线程轮流切换并且分配线程执行时间。在任何的时间点上,一个处理器只处理一个线程,当这个线程时间片用完了后 【挂起】。会切换到下一个线程,下一个线程时间片完后,会回来继续执行被挂起的线程。而程序计数器起到了类似于书签的作用,他会记录当前线程下一条要执行的字节码指令的位置,然后接着继续往下执行。
程序计数器是 JVM 规范中唯一一个没有规定出现 OOM 的区域,所以这个空间也不会被 GC。
你能给我详细的介绍 Java 堆吗?
线程共享的区域:主要用来保存对象实例、数组等,当堆中没有空间可分配给实例,也无法再扩展时,则抛出OutOfMemoryError
异常。
年轻代被划分为三部分,Eden 区和两个大小严格相同的 Survivor 区,根据 JVM 策略(对象先进入到 Eden 区,经过垃圾收集还存活,复制到 S0 或 S1),经过几次垃圾收集之后,依然存活于 Survivor 的对象将被放到老年代。
老年代主要保存生命周期长的对象,一般是一些老的对象。
元空间保存的类信息、静态变量、常量、编译后的代码。
JDK1.7 和 1.8 的区别:
- 1.7 中有一个永久代,存储的是类信息、静态变量、常量、编译后的代码。
- 1.8 移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出。
什么是虚拟机栈?
- 每个线程运行所需要的内存称为虚拟机栈,先进后出。
- 每个栈有多个栈帧(frame)组成,对应着每次方法调用时所占用的内存。
- 每个线程只能有一个活动栈帧,对应着目前正在执行的方法。
垃圾回收是否涉及栈内存?
垃圾回收主要是指堆内存,当栈帧弹栈以后,内存就会释放。
栈内存分配越大越好吗?
未必,默认的栈内存一般为 1024K
栈帧过大会导致线程数变少。比如机器总内存为 512M,目前能活动的线程就为 512 个,如果把栈内存改为 2048K,那么能活动的栈帧就减半。
方法内的局部变量是否线程安全?
public static void main(String[] args) {StringBuilder sb = new StringBuilder();sb.append(1);sb.append(2);new Thread(() -> {m2(sb);}).start();
}public static void m1() { // 线程安全StringBuilder sb = new StringBuilder();sb.append(1);sb.append(2);System.out.println(sb.toString());
}public static void m2(StringBuilder sb) { // 线程不安全sb.append(3);sb.append(4);System.out.println(sb.toString());
}public static StringBuilder m3() { // 线程不安全StringBuilder sb = new StringBuilder();sb.append(5);sb.append(6);return sb;
}
- 如果方法内局部变量没有逃离方法的作用范围,他是线程安全的。
- 如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
在以上代码举例中,m2 方法传递了 sb 的引用,方法内的操作会直接修改 main 方法的 sb 内容,多线程环境下,会出现线程安全问题。m3 同样,涉及到返回了 sb 内容,也是属于逃离方法的作用范围。
什么情况下会导致栈内存溢出?
- 栈帧过多导致栈内存溢出,典型问题:递归调用
- 栈帧过大导致栈内存溢出
堆栈的区别是什么?
- 栈内存一般会用来存储局部变量和方法调用,但堆内存是用来存储Java对象和数组的的。
- 堆会GC垃圾回收,而栈不会。
- 栈内存是线程私有的,而堆内存是线程共有的。
- 两者异常错误不同,但如果栈内存或者堆内存不足都会抛出异常。 栈空间不足:java.lang.StackOverFlowError。 堆空间不足:java.lang.OutOfMemoryError。
能不能解释一下方法区?
- 方法区(Method Area)是各个线程共亨的内存区域
- 主要存储类的信息、运行时常量池
- 虚拟机启动的时候创建,关闭虚拟机时释放
- 如果方法区域中的内存无法满足分配请求,则会抛出OutOfMemoryError: Metaspace
解释一下常量池
可以看作是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等信息。
运行时常量池
常量池是**.class*** 文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址****。**
你听过直接内存吗?
直接内存:
- 并不属于 JVM 中的内存结构,不由 JVM 进行管理。是虚拟机的系统内存。
- 是虚拟机的系统内存,常见于 NIO 操作时,用于数据缓冲区,它分配回收成本较高,但读写性能高。不受 JVM 内存回收管理。
常规 IO 的数据拷贝过程
因为 Java 是无法直接访问系统缓存区的,所以系统会先将磁盘文件数据读到系统缓存区,然后 Java 堆内存在读到 Java 缓冲区中,很显然这是两次数据复制的过程,效率是不高的。
NIO 数据拷贝流程
操作系统划出了一部分直接内存,使得 Java 可以直接读写访问,于是只需要一次磁盘文件数据复制就可以完成拷贝流程,从而提高了效率。
类加载器
什么是类加载器,类加载器有哪些?
类加载器
JVM只会运行二进制文件,类加载器的作用就是将**字节码文件加载到JVM**中,从而让Java程序能够启动起来。
什么是双亲委派模型?
加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,子加载器尝试加载该类。
JVM 为什么采用双亲委派机制?(高频)
(1)通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性。
(2)为了安全,保证类库API不会被修改
比如:
此时执行 main 函数,会出现异常,在类 java.lang.String 中找不到 main 方法。
由于是双亲委派的机制, java.lang.String的在启动类加载器得到加载, 因为在核心jre库中有其相同名字的类文件, 但该类中并没有main方法。这样就能防止恶意篡改核心API库。
说一下类装载的执行过程
类从加载到虚拟机中开始,直到卸载为止,它的整个生命周期包括了:加载、验证、准备、解析、初始化、使用和卸载这7个阶段。其中,验证、准备和解析这三个部分统称为连接(linking)。
- 加载
-
通过类的全名, 获取类的二进制数据流。
-
解析类的二进制数据流为方法区内的数据结构 (Java 类模型)
-
创建 java.lang.Class 类的实例, 表示该类型。作为方法区这个类的各种数据的访问入口
- 验证
验证类是否符合 JVM 规范,安全性检查。
- 准备
为类变量分配内存并设置类变量初始值
- 解析
比如常量池中,查找机器指令的最终方法引用。
将类中的符号引用转换为直接引用。
- 初始化
对类的静态变量,静态代码块执行初始化操作。
- 如果初始化一个类的时候, 其父类尚未初始化, 则优先初始化其父类。
- 如果同时包含多个静态变量和静态代码块, 则按照自上而下的顺序依次执行。
- 使用
JVM 开始从入口方法开始执行用户的程序代码
- 调用静态类成员信息(比如:静态字段、静态方法)
- 使用new关键字为其创建对象实例
ANS
- 加载:查找和导入class文件
- 验证:保证加载类的准确性
- 准备:为类变量分配内存并设置类变量初始值
- 解析:把类中的符号引用转换为直接引用
- 初始化:对类的静态变量,静态代码块执行初始化操作
- 使用:JVM 开始从入口方法开始执行用户的程序代码
- 卸载:当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象。
垃圾回收
对象什么时候可以被垃圾回收?
回收堆中的内存。如果一个或多个对象没有任何的引用指向他了,那么这个对象就是垃圾,如果定位了垃圾,则有可能被垃圾回收器回收。
如果要定位什么是垃圾,主要有两种方法,一种是引用计数法,一种是可达性分析算法。
引用计数法
一个对象被引用了一次,就在这个对象头上递增一次引用次数,如果这个对象的引用次数为 0,代表这个对象可回收。
当对象间出现了循环引用的话,方法就会失效。
互相引用也会增加引用计数的。目前是 2,当 a、b 置为 null 时,ref–,但是 ref 仍不为零,会导致内存泄露。
可达性分析算法
现在的虚拟机都是通过可达性分析算法确定哪些内容是垃圾。
哪些对象可以作为 GC Root
JVM 垃圾回收算法有哪些?(高频)
标记清除算法
标记清除算法,是将垃圾回收分为2个阶段,分别是标记和清除。
- 根据可达性分析算法得出的垃圾进行标记
- 对这些标记为可回收的内容进行垃圾回收
标记整理算法
优缺点同标记清除算法, 解决了标记清除算法的碎片化的问题, 同时, 标记压缩算法多了一步, 对象移动内存位置的步骤, 其效率也有一定的影响。
复制算法

ANS
- 标记清除算法:垃圾回收分为2个阶段,分别是标记和清除,效率高,有磁盘碎片,内存不连续
- 标记整理算法:标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
- 复制算法:将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收;无碎片,内存使用率低
说一下 JVM 中的分代回收
- 新创建的对象, 都会先分配到eden区
- 当伊甸园内存不足, 标记伊甸园与 from(现阶段没有)的存活对象
- 将存活对象采用复制算法复制到 to 中, 复制完毕后, 伊甸园和 from内存都得到释放
- 经过一段时间后伊甸园的内存又出现不足, 标记eden区域to区存活的对象,将存活的对象复制到from区
- 当幸存区对象熬过几次回收 (最多15次), 晋升到老年代 (幸存区内存不足或大对象会导致提前晋升)
MinorGC、MixedGC、FullGC 的区别是什么?
- MinorGC【young GC】发生在新生代的垃圾回收, 暂停时间短 (STW)
- Mixed GC 新生代 +老年代部分区域的垃圾回收, G1 收集器特有
- FullGC: 新生代 + 老年代完整垃圾回收, 暂停时间长 (STW), 应尽力避免
说一下 JVM 有哪些垃圾回收器?(高频)
在jvm中, 实现了多种垃圾收集器, 包括:
- 串行垃圾收集器
- 并行垃圾收集器
- CMS (并发) 垃圾收集器
- G1垃圾收集器
串行垃圾回收器
Serial和Serial Old串行垃圾收集器, 是指使用单线程进行垃圾回收, 堆内存较小, 适合个人电脑
- Serial 作用于新生代, 采用复制算法
- Serial Old 作用于老年代, 采用标记-整理算法
垃圾回收时,只有一个线程在工作,并且java应用中的所有线程都要暂停(STW),等待垃圾回收的完成。
并行垃圾回收器
Parallel New和Parallel Old是一个并行垃圾回收器,JDK8默认使用此垃圾回收器
- Parallel New作用于新生代,采用复制算法
- Parallel Old作用于老年代, 采用标记-整理算法
垃圾回收时,多个线程在工作,并且java应用中的所有线程都要暂停(STW), 等待垃圾回收的完成。
CMS(并发)垃圾收集器
CMS全称 Concurrent Mark Sweep,是一款并发的、使用标记-清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的,是一款以获取最短回收停顿时间为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时, 应用仍然能正常运行。
G1 垃圾回收器
详细聊一下 G1 垃圾回收器(高频)
- 应用于新生代和老年代,在JDK9之后默认使用G1
- 划分成多个区域,每个区域都可以充当 eden, survivor, old, humongous, 其中humongous专为大对象准备
- 采用复制算法
- 响应时间与吞吐量兼顾
- 分成三个阶段:新生代回收、并发标记、混合收集
- 如果并发失败(即回收速度赶不上创建新对象速度),会触发Full GC
强引用、软引用、弱引用、虚引用的区别
- 强引用:只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
- 软引用:仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收
- 弱引用:仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
- 虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
ANS
- 强引用:只要所有 GC Roots 能找到, 就不会被回收
- 软引用: 需要配合SoftReference使用, 当垃圾多次回收, 内存依然不够的时候会回收软引用对象
- 弱引用: 需要配合WeakReference使用, 只要进行了垃圾回收, 就会把弱引用对象回收
- 虚引用: 必须配合引用队列使用,被引用对象回收时, 会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
JVM 实践
JVM 调优的参数可以在哪里设置参数值?
用的 JVM 调优的参数都有哪些?
- 设置堆空间大小
- 虚拟机栈的设置
- 年轻代中Eden区和两个Survivor区的大小比例
- 年轻代晋升老年代阈值
- 设置垃圾回收收集器
设置堆空间大小
设置堆的初始大小和最大大小, 为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间, 通常把最大、初始大小设置为相同的值。
堆空间设置多少合适?
- 最大大小的默认值是物理内存的1/4, 初始大小是物理内存的1/64
- 堆太小, 可能会频繁的导致年轻代和老年代的垃圾回收, 会产生stw,暂停用户线程
- 堆内存大肯定是好的, 存在风险, 假如发生了fullgc, 它会扫描整个堆空间, 暂停用户线程的时间长
- 设置参考推荐: 尽量大, 也要考察一下当前计算机其他程序的内存使用情况
虚拟机栈的设置
虚拟机栈的设置:每个线程默认会开启1M的内存,用于存放栈帧、调用参数、局部变量等,但一般256K就够用。通常减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。
年轻代中 Eden 区和两个 Survivor 区的大小比例
该值如果不设置,则默认比例为8:1:1。通过增大Eden区的大小来减少YGC发生的次数,但有时我们发现,虽然次数减少了,但Eden区满的时候,由于占用的空间较大,导致释放缓慢,此时STW的时间较长,因此需要按照程序情况去调优。
年轻代晋升老年代阈值
设置垃圾回收收集器
说一下 JVM 调优的工具
- 命令工具
- jps 进程状态信息
- jstack 查看java进程内线程的堆栈信息
- jmap 查看堆转信息
- jhat 堆转储快照分析工具
- jstat JVM统计监测工具
- 可视化工具
- jconsole 用于对jvm的内存,线程, 类的监控
- VisualVM 能够监控线程, 内存情况
jps
jstack
jmap
jstat
Java 内存泄露的排查思路
- 获取堆内存快照dump
- VisualVM去分析dump文件
- 通过查看堆信息的情况,定位内存溢出问题
通过jmap指定打印他的内存快照dump(Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中)
ANS
内存泄漏通常是指堆内存, 通常是指一些大对象不被回收的情况
- 通过jmap或设置jvm参数获取堆内存快照dump
- 通过工具, VisualVM去分析dump文件, VisualVM可以加载离线的dump文件
- 通过查看堆信息的情况, 可以大概定位内存溢出是哪行代码出了问题
- 找到对应的代码, 通过阅读上下文的情况, 进行修复即可
CPU 飙高排查方案与思路
使用 top 命令查看占用 cpu 情况
通过top命令查看后
可以查看是哪一个进程占用cpu较高,上图所示的进程为:40940
查看进程中的线程信息
可以根据线程 id 找到有问题的线程,进一步定位到问题代码的源码行号
- 使用top命令查看占用cpu的情况
- 通过top命令查看后, 可以查看是哪一个进程占用cpu较高
- 使用ps命令查看进程中的线程信息
- 使用jstack命令查看进程中哪些线程出现了问题, 最终定位问题
如果这篇文章对你有帮助,请点赞、评论、收藏,创作不易,你的支持是我创作的动力。