当前位置: 首页 > news >正文

java如何使用正则提取字符串中的内容

在Java中使用正则表达式提取字符串内容,主要通过java.util.regex包中的PatternMatcher类实现。以下是详细步骤和示例:


1. 基础流程

import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexExample {public static void main(String[] args) {String text = "订单号:ABC123,日期:2023-08-20,金额:¥500.00";// 1. 定义正则表达式String regex = "([A-Z]{3}\\d{3})|(\\d{4}-\\d{2}-\\d{2})|(¥\\d+\\.\\d{2})";// 2. 编译正则表达式Pattern pattern = Pattern.compile(regex);// 3. 创建Matcher对象Matcher matcher = pattern.matcher(text);// 4. 遍历所有匹配项while (matcher.find()) {// 5. 提取完整匹配内容System.out.println("完整匹配: " + matcher.group(0));// 6. 提取分组内容(如果有分组)for (int i=1; i<=matcher.groupCount(); i++) {if (matcher.group(i) != null) {System.out.println("分组 " + i + ": " + matcher.group(i));}}}}
}

2. 关键方法说明

  • Pattern.compile(regex)
    将正则表达式字符串编译为Pattern对象,可复用。

  • matcher.find()
    查找下一个匹配的子序列,返回布尔值。

  • matcher.group(n)

    • group(0):返回完整匹配的字符串
    • group(1)~group(n):返回第n个分组捕获的内容

3. 常见场景示例

场景1:提取所有数字
String text = "苹果5个,香蕉3.5公斤";
Pattern pattern = Pattern.compile("\\d+(\\.\\d+)?");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group()); // 输出 5, 3.5
}
场景2:提取邮箱地址
String text = "联系邮箱:support@example.com 或 admin@test.org";
Pattern pattern = Pattern.compile("\\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\.[A-Z|a-z]{2,}\\b");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group()); // 输出 support@example.com, admin@test.org
}

4. 高级技巧

使用命名分组(Java 7+)
String text = "姓名:张三,年龄:25";
String regex = "姓名:(?<name>\\w+),年龄:(?<age>\\d+)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
if (matcher.find()) {System.out.println(matcher.group("name")); // 张三System.out.println(matcher.group("age"));  // 25
}
非贪婪匹配
String text = "<div>内容1</div><div>内容2</div>";
Pattern pattern = Pattern.compile("<div>(.*?)</div>"); // 使用 ? 实现非贪婪匹配
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group(1)); // 输出 内容1, 内容2
}

5. 注意事项

  1. 特殊字符转义
    .*+ 等需用 \\ 转义(如 \\. 表示匹配字面量点号)。

  2. 性能优化
    频繁使用的正则表达式应缓存Pattern对象,避免重复编译。

  3. 异常处理
    无效正则表达式会抛出PatternSyntaxException,建议用try-catch处理。

  4. 空匹配检查
    使用matcher.find()前需确保有匹配结果,否则matcher.group()会抛出IllegalStateException


通过以上方法,您可以灵活提取字符串中的结构化内容。如果需要更复杂的匹配逻辑,可以结合正则表达式语法(如正向预查、负向预查等)实现。

http://www.dtcms.com/a/336609.html

相关文章:

  • 谈谈对面向对象OOP的理解
  • 深入分析 Linux PCI Express 子系统
  • Highcharts 官方文档与 API 查询技巧解析
  • android aidl相关学习
  • 【昇腾】单张48G Atlas 300I Duo推理卡MindIE+WebUI方式跑14B大语言模型_20250817
  • 在鸿蒙中实现深色/浅色模式切换:从原理到可运行 Demo
  • 母猪姿态转换行为识别:计算机视觉与行为识别模型调优指南
  • redis和cdn的相似性和区别
  • 编程算法实例-最小公倍数
  • Python自学09-常用数据结构之元组
  • 黑马商城day08-Elasticsearch作业(个人记录、仅供参考、详细图解)
  • 嵌入式系统中的签名验证:设计与原理解析(C/C++代码实现)
  • Java基础Object中常见问题解析
  • Redis面试精讲 Day 24:Redis实现限流、计数与排行榜
  • 数字货币的法律属性与监管完善路径探析
  • SCAI采用公平发射机制成功登陆LetsBonk,60%代币供应量已锁仓
  • SpringBoot中,接口加解密
  • C语言课程开发
  • 【前端基础】flex布局中使用`justify-content`后,最后一行的布局问题
  • Java 基础 -- Java 基础知识
  • 2025-08-17 李沐深度学习18——循环神经网络基础
  • Spring Cloud系列—Seata部署
  • 照相机标定-动手学计算机视觉16
  • easya2a: 一键将 LangChain Agent 发布为 A2A 服务
  • Matlab数字图像处理——基于BM4D压缩感知的三维图像信号重构算法
  • 知识点汇集-web
  • 第三十八天(Node.JS)
  • 【LeetCode 热题 100】(八)二叉树
  • 如何使用java写一个agent
  • 说一下分离读写