当前位置: 首页 > news >正文

Spring Boot 全局异常处理与日志监控实战

Spring Boot 全局异常处理与日志监控实战

    • 1. 背景与目标
    • 2. 设计思路(要点)
    • 3. 项目依赖(Maven)
    • 4. 通用错误响应 DTO
    • 5. 自定义业务异常示例
    • 6. 全局异常处理实现(日志 + 指标)
    • 7. 请求 ID 与 MDC 过滤器(保证每条请求都有 requestId)
    • 8. 日志配置与示例输出
      • application.properties(关键项)
      • logback-spring.xml(pattern 示例)
      • 日志示例(一条报错请求)
    • 9. 将异常计数暴露到监控(Actuator + Micrometer)
    • 10. 常见场景与处理建议
    • 11. 小结与部署建议

代码以 Spring Boot 3 / Java 17 风格示例(可适配 Spring Boot 2.x 做少量改动)
在这里插入图片描述

目标:构建一套健壮的全局异常处理方案,统一错误响应可追踪的日志(requestId/MDC),并把异常上报为监控指标(使用 Micrometer),方便在生产环境定位与统计异常。


1. 背景与目标

生产环境中,异常无处不在。我们要解决三件事:

  • 对外统一 JSON 错误格式,便于前端/客户端解析与展示;
  • 在日志中携带可追溯的 requestId(MDC),便于从日志中串联一条请求的全部操作;
  • 对异常做指标统计(例如按异常类型/状态码计数),能在监控平台(Prometheus/Grafana)上报警与分析。

2. 设计思路(要点)

  • 使用 @RestControllerAdvice + @ExceptionHandler 进行全局捕获;
  • 返回标准 ErrorResponse(包含时间戳、HTTP 状态码、业务错误码、message、path、requestId);
  • 在异常处理器里同时 log.error(...) 并把异常计数交给 MeterRegistry(Micrometer);
  • 通过 OncePerRequestFilter 在每个请求开始时生成 requestId 并放入 SLF4J 的 MDC(MDC.put("requestId", id));
  • 配置 logback-spring.xml%X{requestId} 输出到日志 pattern,建议也输出 JSON(视需求)。

3. 项目依赖(Maven)

<!-- pom.xml 依赖片段 -->
<dependencies><!-- Spring Boot Starter Web --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency><!-- 日志 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-logging</artifactId></dependency><!-- Validation --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-validation</artifactId></dependency><!-- Actuator & Micrometer (Prometheus) --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId></dependency><dependency><groupId>io.micrometer</groupId><artifactId>micrometer-registry-prometheus</artifactId></dependency>
</dependencies>

4. 通用错误响应 DTO

src/main/java/com/example/demo/api/ErrorResponse.java

package com.example.demo.api;import java.time.Instant;
import java.util.Map;public class ErrorResponse {private Instant timestamp;private int status;private String error;private String message;private String path;private String requestId;private Map<String, Object> details; // 可选扩展字段public ErrorResponse() {}public ErrorResponse(int status, String error, String message, String path, String requestId) {this.timestamp = Instant.now();this.status = status;this.error = error;this.message = message;this.path = path;this.requestId = requestId;}// getters & setters omitted for brevity
}

5. 自定义业务异常示例

src/main/java/com/example/demo/exception/BusinessException.java

package com.example.demo.exception;public class BusinessException extends RuntimeException {private final String code;public BusinessException(String code, String message) {super(message);this.code = code;}public String getCode() {return code;}
}

6. 全局异常处理实现(日志 + 指标)

src/main/java/com/example/demo/exception/GlobalExceptionHandler.java

package com.example.demo.exception;import com.example.demo.api.ErrorResponse;
import io.micrometer.core.instrument.MeterRegistry;
import io.micrometer.core.instrument.Counter;
import jakarta.servlet.http.HttpServletRequest;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.slf4j.MDC;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.http.HttpHeaders;
import org.springframework.http.HttpStatus;
import org.springframework.http.ResponseEntity;
import org.springframework.validation.FieldError;
import org.springframework.web.bind.MethodArgumentNotValidException;
import org.springframework.web.bind.annotation.ExceptionHandler;
import org.springframework.web.bind.annotation.RestControllerAdvice;import java.util.stream.Collectors;@RestControllerAdvice
public class GlobalExceptionHandler {private static final Logger log = LoggerFactory.getLogger(GlobalExceptionHandler.class);private final MeterRegistry meterRegistry;// 一个简单的异常计数器前缀(可按异常 class、path、status 维度构造标签)private final Counter genericExceptionCounter;public GlobalExceptionHandler(MeterRegistry meterRegistry) {this.meterRegistry = meterRegistry;this.genericExceptionCounter = Counter.builder("exceptions.total").description("Total number of handled exceptions").register(meterRegistry);}// 业务异常处理@ExceptionHandler(BusinessException.class)public ResponseEntity<ErrorResponse> handleBusiness(BusinessException ex, HttpServletRequest request) {String requestId = MDC.get("requestId");log.warn("BusinessException - requestId={}, path={}, code={}, msg={}",requestId, request.getRequestURI(), ex.getCode(), ex.getMessage());// 增加监控计数(按业务码)meterRegistry.counter("exceptions.by_code", "code", ex.getCode()).increment();ErrorResponse err = new ErrorResponse(HttpStatus.BAD_REQUEST.value(),"Business Error",ex.getMessage(),request.getRequestURI(),requestId);return ResponseEntity.status(HttpStatus.BAD_REQUEST).body(err);}// 参数校验异常@ExceptionHandler(MethodArgumentNotValidException.class)public ResponseEntity<ErrorResponse> handleValidation(MethodArgumentNotValidException ex, HttpServletRequest request) {String requestId = MDC.get("requestId");String msg = ex.getBindingResult().getFieldErrors().stream().map(fe -> fe.getField() + ":" + fe.getDefaultMessage()).collect(Collectors.joining("; "));log.info("Validation failed - requestId={}, path={}, errors={}", requestId, request.getRequestURI(), msg);meterRegistry.counter("exceptions.validation").increment();ErrorResponse err = new ErrorResponse(HttpStatus.BAD_REQUEST.value(),"Validation Error",msg,request.getRequestURI(),requestId);return ResponseEntity.status(HttpStatus.BAD_REQUEST).body(err);}// 通用异常处理@ExceptionHandler(Exception.class)public ResponseEntity<ErrorResponse> handleGeneric(Exception ex, HttpServletRequest request) {String requestId = MDC.get("requestId");log.error("Unhandled exception - requestId={}, path={}", requestId, request.getRequestURI(), ex);// 总量计数genericExceptionCounter.increment();// 按异常类计数标签meterRegistry.counter("exceptions.by_type", "type", ex.getClass().getSimpleName()).increment();ErrorResponse err = new ErrorResponse(HttpStatus.INTERNAL_SERVER_ERROR.value(),"Internal Server Error","服务器繁忙,请稍后重试",request.getRequestURI(),requestId);// 在开发环境可以把 ex.getMessage() 或堆栈信息放到 details 中(生产环境慎用)return ResponseEntity.status(HttpStatus.INTERNAL_SERVER_ERROR).body(err);}
}

说明:

  • 在处理器中我们同时 logmeterRegistry.counter(...).increment(),用于日志与监控;
  • MDC.get("requestId") 用于把请求的 requestId 写入返回体,方便客户端带回查日志。

7. 请求 ID 与 MDC 过滤器(保证每条请求都有 requestId)

src/main/java/com/example/demo/filter/RequestIdFilter.java

package com.example.demo.filter;import jakarta.servlet.FilterChain;
import jakarta.servlet.ServletException;
import jakarta.servlet.http.HttpServletRequest;
import jakarta.servlet.http.HttpServletResponse;
import org.slf4j.MDC;
import org.springframework.stereotype.Component;
import org.springframework.web.filter.OncePerRequestFilter;import java.io.IOException;
import java.util.UUID;@Component
public class RequestIdFilter extends OncePerRequestFilter {private static final String REQUEST_ID_HEADER = "X-Request-Id";@Overrideprotected void doFilterInternal(HttpServletRequest request,HttpServletResponse response,FilterChain filterChain) throws ServletException, IOException {try {String requestId = request.getHeader(REQUEST_ID_HEADER);if (requestId == null || requestId.isBlank()) {requestId = UUID.randomUUID().toString();}MDC.put("requestId", requestId);// 同时将 requestId 放回响应头,便于前端或网关追踪response.setHeader(REQUEST_ID_HEADER, requestId);filterChain.doFilter(request, response);} finally {MDC.remove("requestId");}}
}

说明:

  • 每次请求都会生成(或沿用上游)X-Request-Id,并放到 MDC,日志 pattern 能输出 %X{requestId}
  • 响应中返回该 header,有利于客户端/运维串联。

8. 日志配置与示例输出

application.properties(关键项)

# 暴露 Actuator prometheus 端点
management.endpoints.web.exposure.include=health,info,prometheus,metrics
management.endpoint.prometheus.enabled=true# 日志级别(根据环境调整)
logging.level.root=INFO
logging.level.com.example=DEBUG

logback-spring.xml(pattern 示例)

放在 src/main/resources/logback-spring.xml

<configuration><springProfile name="prod"><appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender"><encoder><!-- 输出包含 requestId --><pattern>%d{yyyy-MM-dd'T'HH:mm:ss.SSSXXX} [%thread] %-5level %logger{36} - %msg - requestId=%X{requestId}%n</pattern></encoder></appender><root level="INFO"><appender-ref ref="STDOUT"/></root></springProfile><springProfile name="!prod"><appender name="STDOUT" class="ch.qos.logback.core.ConsoleAppender"><encoder><pattern>%d{yyyy-MM-dd HH:mm:ss} [%thread] %-5level %logger{36} - %msg - requestId=%X{requestId}%n</pattern></encoder></appender><root level="DEBUG"><appender-ref ref="STDOUT"/></root></springProfile>
</configuration>

日志示例(一条报错请求)

2025-08-10T18:34:10.123+03:00 [http-nio-8080-exec-1] ERROR com.example.demo.exception.GlobalExceptionHandler - Unhandled exception - requestId=2f1a8c7f-1d2b-4f0a-9b2a-123456789abc, path=/api/orders
java.lang.NullPointerException: ...at com.example.demo.service.OrderService.create(OrderService.java:45)...

你会看到 requestId 出现在每条日志,便于用 grep 或日志平台(ELK/EFK)按 requestId 过滤整条调用链。


9. 将异常计数暴露到监控(Actuator + Micrometer)

前文 GlobalExceptionHandler 已经把计数器注册到 Micrometer:

  • exceptions.total
  • exceptions.by_code{code=...}
  • exceptions.by_type{type=...}

在 Prometheus 中抓取 Spring Boot 的 /actuator/prometheus 指标,就能在 Grafana 中根据 exceptions.by_type 做报警规则。例如:如果 exceptions.by_type{type="NullPointerException"} 在 5 分钟内增幅过大,就触发报警。


10. 常见场景与处理建议

  • 参数校验失败(MethodArgumentNotValidException

    • 建议把字段错误拼成单行 message(示例中已实现),并返回 400。
  • 业务异常(自定义 BusinessException

    • 业务异常可携带 code,前端可根据 code 做差异化提示或重试策略;监控中也可以以 code 为标签统计。
  • 第三方超时/HTTP 错误(RestTemplate/WebClient)

    • 在调用处抛出有意义的自定义异常或将原异常包装后抛出;在全局异常处理器中根据异常类型映射为 502/504 等状态,并计数。
  • 链路追踪(可选)

    • 若有分布式追踪需求,可接入 OpenTelemetry/Zipkin/Jaeger,但仍保留 requestId 做本地快速查找。
  • 安全注意

    • 生产环境不要在 API 返回中包含完整堆栈或敏感字段(示例中仅返回通用 message)。可以在开发 profile 下增加 details

11. 小结与部署建议

  • 统一异常处理 可以显著提升前后端协作效率与错误可观察性;
  • MDC + requestId 是生产排查的第一要素,务必保证上游(网关)能传递 X-Request-Id,否则服务端生成并回传;
  • 监控计数(Micrometer)使异常不再是“偶发的黑盒”,可以在 Grafana/Prometheus 上设定阈值与报警;
  • 日志集中化 建议配合 ELK/EFK(或云日志)保存结构化日志(JSON)以便于按 requestIdcodetype 聚合查询;
  • 对外返回 应保持稳定的 JSON 格式与明确的状态码,避免泄露内部实现细节。

http://www.dtcms.com/a/324686.html

相关文章:

  • OneCode 3.0 可视化功能全面分析:从开发者到用户的全场景解析
  • 一周学会Matplotlib3 Python 数据可视化-绘制条形图(Bar)
  • 论文复现与分析内容关于一种实用的车对车(V2V)可见光通信(VLC)传播模型
  • Z20K118库中寄存器及其库函数封装-REGFILE库
  • Windows执行kubectl提示拒绝访问【Windows安装k8s】
  • imx6ull-驱动开发篇17——linux原子操作实验
  • PXE自动化安装部署OpenEuler24.03LTS
  • MySQL中的in和exists的区别
  • mmdetection3d中centerpoint解析
  • FPGA常用资源之IO概述
  • Mybatis学习之动态SQL(八)
  • 使用GLib D-Bus 库创建dbus服务端
  • 安全运维的核心
  • 使用 iFLOW-CLI GitHub Action 和 Qwen3-Coder 给 GitHub 仓库生成幻灯片风格的文档站点
  • 一个基于 Next.js 和 Puppeteer 的 Markdown 转图片服务,支持 Docker 部署和 API 集成
  • AI绘画:生成唐初秦叔宝全身像提示词
  • reuse: for booting my spring project with mvn in Windows command line
  • 理清C语言中内存操作的函数
  • LeetCode_字符串
  • 《C语言》结构体和联合体练习题--1
  • ROS2 学习笔记
  • 基于百度地图API的社区地图展示技术实现
  • 初识STL
  • ADB简介
  • 【redis初阶】--------Set 集合类型
  • Baumer高防护相机如何通过YoloV8深度学习模型实现道路坑洼的检测识别(C#代码UI界面版)
  • Linux操作系统从入门到实战(十六)冯诺依曼体系结构,操作系统与系统调用和库函数概念
  • API 接入终极指南:实时掌握京东商品动态
  • openpnp - 顶部相机如果超过6.5米影响通讯质量,可以加USB3.0信号放大器延长线
  • SpringAI报错:com.github.victools.jsonschema.generator.AnnotationHelper