当前位置：首页 > news >正文

正则表达式和通配符

news 2025/11/4 21:17:09

正则表达式（Regular Expression）和通配符（Glob Pattern）是两种不同的模式匹配语法，虽然看起来相似（都使用 *、? 等符号），但它们的用途、规则和场景完全不同。以下是它们的核心区别和示例：

正则表达式
用于匹配文本内容（如文件内容、字符串），功能强大且灵活，支持复杂逻辑（如分组、回溯、量词）。
工具示例：grep、ripgrep、sed、Perl、编程语言中的正则库。
通配符
用于匹配文件名或路径（如 *.txt），语法简单，主要用于文件操作。
工具示例：fd、find -name、Shell 的文件扩展（如 ls *.txt）。

通配符（用于文件名）：
```
fd "*.txt"        # 匹配 a.txt, file.txt
```
* 直接表示任意字符。
正则表达式（用于文本内容）：
```
rg ".*\.txt$"     # 匹配行尾的 ".txt"
```
- .* 匹配任意字符（包括空）。
- \. 转义点号。
- $ 匹配行尾。

通配符：

fd "file[1-9]"    # 匹配 file1, file2, ..., file9

正则表达式：

rg "file[1-9]"    # 匹配文本中的 "file1" 到 "file9"

正则表达式：
```
rg "^a.*z$"       # 匹配 "abz", "a123z"
```
- ^a 开头是 a。
- .* 中间任意字符。
- z$ 结尾是 z。
通配符（无法直接实现，需近似）：
```
fd "a*z"          # 匹配文件名如 "abz", "a_file_z"
```
* 不保证中间字符的精确控制。

用通配符（Glob）的场景：
- 快速匹配文件名（如 rm *.log）。
- 文件批量操作（如 mv /path/*.jpg ./images）。
- Shell 命令中的路径扩展（如 ls data/*.csv）。
用正则表达式的场景：
- 搜索文件内容（如 rg "\d{3}-\d{4}" 匹配电话号码）。
- 文本替换（如 sed -E 's/^(.*)/Prefix: \1/' file.txt）。
- 编程中的字符串验证（如邮箱格式校验）。

fd 命令：
默认用通配符（-g），需 --regex 启用正则。

fd -g "*.py"          # 通配符模式
fd --regex "[a-z]+"   # 正则模式

ripgrep (rg) 命令：
默认用正则表达式，通配符需转义或通过其他参数实现。
```
rg ".*\.rs$"          # 正则匹配.rs文件内容
```