当前位置：首页 > news >正文

shell之通配符及正则表达式

news 2025/11/7 8:39:26

通配符与正则表达式

通配符（Globbing）

通配符是由 Shell 处理的特殊字符，用于路径或文件名匹配。当 Shell 在命令参数中遇到通配符时，会将其扩展为匹配的文件路径；若没有匹配项，则作为普通字符传递给命令。

Shell 中的通配符列表

通配符	描述	示例
`*`	匹配任意长度的字符（包括 0 个）	`ls *.txt`：匹配所有 `.txt` 文件
`?`	匹配单个任意字符	`ls file?.txt`：匹配 `file1.txt`、`fileA.txt` 等
`[charset]`	匹配字符集中的任意单个字符	`ls [abc].txt`：匹配 `a.txt`、`b.txt`、`c.txt`
`[^charset]`	匹配不在字符集中的任意单个字符	`ls [^0-9].txt`：匹配非数字开头的 `.txt` 文件
`[a-z]`	匹配指定范围内的单个字符（小写字母）	`ls [a-c]file`：匹配 `afile`、`bfile`、`cfile`
`[[:class:]]`	匹配 POSIX 字符类中的字符	`ls [[:digit:]]*`：匹配数字开头的文件

POSIX 字符类（需用 [[:class:]] 表示）：

水平空白字符（[:blank:]）

定义：仅包含在同一行内起分隔作用的空白字符。
包含字符：

空格（）：ASCII 32（十进制），用于单词分隔。
制表符（\t）：ASCII 9，用于文本对齐（水平跳格）

垂直空白字符（[:space:]）

定义：用于换行或分页的空白字符，会导致文本显示位置移动到新行或新页。
包含字符：

换行符（\n）：ASCII 10，用于换行（如 Unix/Linux 系统的行尾符）。
回车符（\r）：ASCII 13，用于回到行首（如 Windows 系统的行尾符为 \r\n）。
换页符（\f）：ASCII 12，用于分页（如打印时换页）。
垂直制表符（\v）：ASCII 11，用于垂直跳格（很少使用）。

字符类	描述	等价写法
`[:alnum:]`	字母或数字	`[A-Za-z0-9]`
`[:alpha:]`	字母（大小写）	`[A-Za-z]`
`[:digit:]`	数字	`[0-9]`
`[:lower:]`	小写字母	`[a-z]`
`[:upper:]`	大写字母	`[A-Z]`
`[:space:]`	空白字符（空格、制表符、换行符等）	—
`[:punct:]`	标点符号	—

通配符实例文件自己chuang

匹配以 menu0 开头的文件

ls menu0*  # 输出：menu01.sh menu02.sh menu03.sh menu04.sh

匹配以 m 开头且后接单个字符的文件

ls m?  # 输出：m1 m2 m3（假设存在这些文件）

匹配以 m 或 n 开头的文件

ls [mn]*  # 匹配 `m*` 和 `n*` 的文件

匹配字母开头的文件（不区分大小写）

ls [a-Z]*  # 注意：`[a-Z]` 实际包含 ASCII 字符范围，可能包含非字母（如 `[`、`\` 等），推荐用 `[[:alpha:]]`
ls [[:alpha:]]*  # 正确匹配所有字母开头的文件

匹配数字开头的文件

ls [[:digit:]]*  # 等价于 `ls [0-9]*`

匹配字母或数字开头的文件

ls [[:alnum:]]*  # 匹配 `[0-9A-Za-z]*`

正则表达式（Regular Expression, RE）

正则表达式是用于文本内容匹配的模式，常用于 grep、sed、awk 等工具中，针对文件内容而非文件名。

正则表达式基础概念

作用：通过特殊字符组合，实现字符串的搜索、替换、删除等操作。
优势：简化文本处理逻辑，减少代码量。
分类：
- 基本正则表达式（BRE）：支持基础元字符，需转义部分符号（如 {}）。
- 扩展正则表达式（ERE）：支持更多元字符（如 +、?），无需转义 {} 等符号。

基本正则表达式（BRE）元字符

元字符	描述	示例
^	匹配行首	`grep ^root /etc/passwd`：匹配以 `root` 开头的行
`$`	匹配行尾	`grep bash$ /etc/passwd`：匹配以 `bash` 结尾的行
`.`	匹配单个任意字符	`grep r.t /etc/passwd`：匹配 `r` 和 `t` 之间有一个字符的行（如 `rot`、`rxt`）
`*`	匹配前一个字符 0 次或多次	`grep r.*t /etc/passwd`：匹配 `r` 和 `t` 之间有任意字符的行
`[]`	匹配字符集中的任意单个字符	`grep r[a-z]t /etc/passwd`：匹配 `r` 和 `t` 之间为小写字母的行
`[^]`	匹配不在字符集中的任意单个字符	`grep r[^a-z]t /etc/passwd`：匹配 `r` 和 `t` 之间为非小写字母的行
`\{n,m\}`	匹配前一个字符 `n` 到 `m` 次（需转义）	`grep 'r\{3\}t' /etc/passwd`：匹配 `r` 重复 3 次后接 `t` 的行

POSIX 字符类（在正则中同样适用）：

grep [[:digit:]]\{3,4\} /etc/passwd  # 匹配 3-4 位数字

扩展正则表达式（ERE）元字符

需通过 egrep 或 grep -E 使用，无需转义特殊符号。

元字符	描述	示例与匹配结果
`+`	匹配前一个字符 1 次或多次（至少出现 1 次）。	`egrep 'r+t' /etc/passwd` 匹配 `rt`、`rrt`、`rrrt` 等（`r` 至少出现 1 次后接 `t`）。
`?`	匹配前一个字符 0 次或 1 次（可选出现）。	`egrep 'colou?r' /etc/passwd` 匹配 `color` 或 `colour`（`u` 可选:u可出现0次或者1次）。
`{n}`	匹配前一个字符恰好 n 次。	`egrep 'r{3}t' /etc/passwd` 匹配 `rrrt`（`r` 连续出现 3 次）。
`{n,}`	匹配前一个字符至少 n 次。	`egrep 'r{2,}t' /etc/passwd` 匹配 `rrt`、`rrrt`、`rrrrrt` 等（`r` 至少出现 2 次）。
`{n,m}`	匹配前一个字符 n 到 m 次之间（包含 n 和 m）。	`egrep 'r{2,4}t' /etc/passwd` 匹配 `rrt`、`rrrt`、`rrrrt`（`r` 出现 2-4 次）。
`(pattern1\|pattern2)`	匹配多个模式中的任意一个（使用竖线 `\|` 分隔）。	`egrep '^(root\|admin)' /etc/passwd` 匹配以 `root` 或 `admin` 开头的行。

正则表达式工具对比

工具	正则类型	说明
`grep`	基本正则表达式（BRE）	需转义 `{}` 等符号
`egrep`	扩展正则表达式（ERE）	直接使用 `+`、`?`、`{}` 等符号
`fgrep`	不支持正则	按字面匹配字符串

正则表达式实例

匹配以 bash 结尾的行

grep bash$ /etc/passwd  # 基本正则
egrep bash$ /etc/passwd  # 扩展正则（等价）

匹配 3-4 位数字

grep '[[:digit:]]\{3,4\}' /etc/passwd  # BRE，需转义 {}
egrep '[[:digit:]]{3,4}' /etc/passwd  # ERE，无需转义

匹配以空白字符开头、非空白字符后跟的行

grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg  # BRE，`\+` 表示 `+`
egrep "^[[:space:]]+[^[:space:]]" /etc/grub2.cfg  # ERE，直接用 `+`

匹配包含 Failed 或 FAILED 的行（不区分大小写）

grep -i 'failed' /var/log/secure  # 基本正则，`-i` 忽略大小写
egrep -i 'failed|FAILED' /var/log/secure  # 扩展正则，匹配任意模式

通配符与正则表达式对比

特性	通配符	正则表达式
处理者	Shell（路径扩展）	命令（如 `grep`）
作用对象	文件名或路径	文本内容
元字符差异	`*`、`?`、`[]`	`.*`、`+`、`()` 等
典型场景	`ls .txt`、`rm data_`	`grep "pattern" file`、`sed -e "s/regex/replace/"`

7.4 练习与答案（扩展）

练习 1：显示 `/etc/passwd` 中以不区分大小的 `h` 开头的行

grep -i ^h /etc/passwd  # `-i` 忽略大小写，`^h` 匹配行首

练习 2：显示 `/etc/passwd` 中以 `sh` 结尾的行

grep sh$ /etc/passwd  # `$` 匹配行尾

练习 3：显示 `/etc/fstab` 中以 `#` 开头、后跟一个或多个空白字符和非空白字符的行

grep "^#[[:space:]]\+[^[:space:]]" /etc/fstab  # BRE，`\+` 表示一个或多个空白字符
egrep "^#[[:space:]]+[^[:space:]]" /etc/fstab  # ERE，直接用 `+`

练习 4：查找 `/etc/rc.d/rc.local` 中包含以 `to` 开始并以 `to` 结尾的字串的行

grep "to.*to" /etc/rc.d/rc.local  # `.*` 匹配任意字符

练习 5：查找 `/etc/passwd`中包含sbin行，或者以s开头，以n结尾的单词的行

1、grep -w 'sbin' /etc/passwd  # `\<` 和 `\>` 表示单词边界-w 会强制 grep 仅匹配独立的完整单词，而非单词的一部分。具体规则：
单词边界：单词必须被非单词字符（如空格、标点符号、换行符）包围。
单词字符：通常指字母、数字和下划线（即 [A-Za-z0-9_]）。选项 / 元字符	功能	示例匹配
-w	匹配完整单词，自动添加单词边界检查	grep -w 'foo' → 匹配 foo，但不匹配 foobar
\< 和 \>	正则表达式中的单词边界元字符	grep '\<foo\>' → 同上，但需手动添加元字符2、grep -Eo '\bs[a-z]*n\b' /etc/passwd  # 仅匹配小写字母
-o 是只显示匹配内容
\b：显式定义单词边界grep -Ew 's[a-z]*n' /etc/passwd注意：如果你要匹配以s开头，以n结尾单词的行，根据grep版本的问题，.*进行贪婪匹配，会尽可能多的去匹配，达不到预期的效果，所以我们把任意字符改为任意数量的小写字母。

练习 6：查找 `ifconfig` 结果中 1-255 之间的整数

ifconfig | egrep -w "[1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]"

练习 7：显示 `/var/log/secure` 中包含 `Failed` 或 `FAILED` 的行

grep -i 'failed' /var/log/secure  # 简化写法，匹配大小写

练习 8：在 `/etc/passwd` 中取出默认 Shell 为 `bash` 的行

grep '/bin/bash$' /etc/passwd  # 匹配行尾的 `/bin/bash`

练习 9：以长格式列出 `/etc/` 下以 `ns` 开头、`.conf` 结尾的文件

ls -l /etc/ns*.conf  # 通配符直接用于文件名匹配

练习 10：高亮显示 `passwd` 文件中用户名和加密密码

grep -o '^[^:]*:[^:]*' /etc/passwd  # 匹配冒号分隔的字段相当于匹配用户名和加密密码

总结

通配符：专注于文件名匹配，由 Shell 处理，语法简单（如 *、?）。
正则表达式：用于文本内容匹配，支持复杂模式（如 ^、$、.*），需结合工具（grep、egrep）使用。
关键区别：作用对象不同（文件名 vs. 文本内容），元字符语法有差异。

查看全文

http://www.dtcms.com/a/214490.html

NL2SQL代表，Vanna

区块链DApp的开发技术方案

数据保护在Web3应用中的重要性及其实现

【Webtrees 手册】第 4 章 - 编辑指南

【深度学习】6. 卷积神经网络，CNN反向传播，感受野，池化变种,局部连接机制，可视化实例

redis五种数据结构详解(java实现对应的案例)

鸿蒙OSUniApp 实现的短信验证码登录功能#三方框架 #Uniapp

ROS架构

【无标题】前端如何实现分页？

‌AT2659S射频前端芯片技术解析：L1频段低噪声高增益GNSS信号放大

前端移动端上传图片pc端如何实时获取

（请关注）Oracle性能调优、优化总结调优参考直接应用，性能提升实用案例

C++23 std::start_lifetime_as：用于隐式生存期类型的显式生存期管理函数 (P2590R2)

Ini配置文件读写,增加备注功能

CentOS中安装Docker Compose

[特殊字符] next-intl 服务端 i18n getTranslations 教程

使用json传递信息时接收不到的问题

计算机图形学：（四）欧拉角与四元数

el-date-picker 前端时间范围选择器

【四种JavaScript 实现页面底部回到顶部功能的实现方式】

单例模式，饿汉式，懒汉式，在java和spring中的体现

Dify中的预定义模型插件开发例子：以siliconflow为例

PT_THREAD 的嵌套协程示例

Tomcat 使用与配置全解

EasyDarwin的配置与使用

无限debugger

SDL2常用函数：SDL_RendererSDL_CreateRendererSDL_RenderCopySDL_RenderPresent

LVGL（lv_keyboard键盘）

Essential Studio for JavaScript：首款专用于LOB应用开发的JavaScript框架

node.js配置变量

通配符与正则表达式

通配符（Globbing）

Shell 中的通配符列表

通配符实例文件自己chuang

正则表达式（Regular Expression, RE）

正则表达式基础概念

基本正则表达式（BRE）元字符

扩展正则表达式（ERE）元字符

正则表达式工具对比

正则表达式实例

通配符与正则表达式对比

7.4 练习与答案（扩展）

练习 1：显示 /etc/passwd 中以不区分大小的 h 开头的行

练习 2：显示 /etc/passwd 中以 sh 结尾的行

练习 3：显示 /etc/fstab 中以 # 开头、后跟一个或多个空白字符和非空白字符的行

练习 4：查找 /etc/rc.d/rc.local 中包含以 to 开始并以 to 结尾的字串的行

练习 5：查找 /etc/passwd中包含sbin行，或者以s开头，以n结尾的单词的行

练习 6：查找 ifconfig 结果中 1-255 之间的整数

练习 7：显示 /var/log/secure 中包含 Failed 或 FAILED 的行

练习 8：在 /etc/passwd 中取出默认 Shell 为 bash 的行

练习 9：以长格式列出 /etc/ 下以 ns 开头、.conf 结尾的文件

练习 10：高亮显示 passwd 文件中用户名和加密密码

总结

相关文章：