当前位置：首页 > wzjs >正文

昆明网站建设创意杭州疫情最新情况

wzjs 2025/7/29 18:52:55

昆明网站建设创意,杭州疫情最新情况,wordpress htaccess 文件位置,在线制作名片生成器Python 字符串正则表达式详解一、正则表达式核心语法元字符含义正确示例与说明常见错误修正.匹配任意字符（换行符除外）a.b → 匹配"acb"、“a1b”不匹配换行符（需用re.S模式）^匹配字符串开头^Hello → 匹配以"H…

Python 字符串正则表达式详解

一、正则表达式核心语法

元字符	含义	正确示例与说明	常见错误修正
`.`	匹配任意字符（换行符除外）	`a.b` → 匹配"acb"、“a1b”	不匹配换行符（需用`re.S`模式）
`^`	匹配字符串开头	`^Hello` → 匹配以"Hello"开头的字符串	需与`re.M`模式配合匹配行首
`$`	匹配字符串结尾	`world$` → 匹配以"world"结尾的字符串	需与`re.M`模式配合匹配行尾
`*`	匹配前导模式0次或多次	`ab*` → 匹配"a"、“ab”、“abb”	易与`+`混淆（`+`需至少1次）
`+`	匹配前导模式1次或多次	`ab+` → 匹配"ab"、“abb”，不匹配"a"	需注意最小匹配次数限制
`?`	匹配前导模式0次或1次	`ab?` → 匹配"a"或"ab"	常用于可选字符匹配（如`s?he`）
`\d`	匹配数字（等价于`[0-9]`）	`\d{3}` → 匹配"123"、"456"等三位数	注意转义符需使用原始字符串`r""`
`\w`	匹配字母、数字、下划线	`\w+` → 匹配"user123"、“var_1”	不匹配特殊符号，如emoji 😒😒😒
`\s`	匹配空白字符（空格、制表符等）	`a\s+b` → 匹配"a b"、“a\tb”	不匹配换行符（需用`\n`）
`[]`	匹配括号内任意一个字符	`[abc]` → 匹配"a"、“b”、“c”	范围表示法如`[a-z0-9]`
`()`	分组捕获，可引用分组内容	`(ab)+` → 匹配"ab"、“abab”	用`\1`引用分组（如替换操作）

1. 基础元字符

.：匹配除换行符外的任意字符

re.search(r"a.c", "abc")  # 匹配 "abc"

^ / $：分别匹配字符串的开始和结束

re.match(r"^user", "user123")  # 验证用户名以"user"开头

* / + / ?：量词，分别表示0次或多次、1次或多次、0次或1次匹配

   # 匹配所有结果print(re.findall(r"ab*c", "ac"))print(re.findall(r"ab*c", "abc" ))print(re.findall(r"ab*c", "abbc") )

2. 预定义字符集

\d：匹配数字（等价于 [0-9]）
\w：匹配字母、数字、下划线（等价于 [a-zA-Z0-9_]）
\s：匹配空白字符（如空格、制表符）

[ ]：自定义字符集合（如 [a-z] 匹配小写字母）

re.findall(r"\d{3}", "ID:123")  # 提取连续3位数字 → ['123']

3. 分组与引用

( )：捕获分组，可通过 group() 提取

match = re.search(r"(\d{4})-(\d{2})", "2025-03")
print(match.group(1))  # 输出年份 "2025"

\1\3：引用第一和第三个分组（用于替换操作）

	re.sub(r"(\d{3})(\d{4})(\d{4})", r"\1****\3", "13812345678")  # → "138****5678"

二、`re` 模块核心方法

1. 常用函数

方法	用途	示例代码片段
`re.search()`	扫描整个字符串，返回第一个匹配	`re.search(r"\d+", "价格:99元")` → 匹配 “99”
`re.match()`	仅从字符串开头匹配	`re.match(r"^http", url)` 验证URL协议头
`re.findall()`	返回所有匹配的列表	`re.findall(r"\b\w+@\w+\.com\b", text)` 提取邮箱
`re.sub()`	替换匹配内容	`re.sub(r"\s+", " ", text)` 合并多余空格

2. 匹配模式修饰符

re.I：忽略大小写

re.findall(r"python", "Python is great", flags=re.I)  # 匹配 ["Python"]

re.M：多行模式（使 ^ 和 $ 匹配每行的开始/结束）
re.S：使 . 匹配包括换行符在内的所有字符

三、高级应用技巧

1. 贪婪与非贪婪模式

贪婪（默认）：尽可能匹配更长内容

re.search(r"<div>.*</div>", "<div>A</div><div>B</div>")  # 匹配整个字符串

非贪婪（加 ?）：匹配最短内容

re.search(r"<div>.*?</div>", "<div>A</div><div>B</div>")  # 仅匹配第一个<div>

2. 转义处理

使用原始字符串（r""）避免反斜杠冲突

re.search(r"\\", "路径: C:\\Users")  # 匹配单个反斜杠

3. 实用正则模板

邮箱验证：r"^\w+([.-]?\w+)*@\w+([.-]?\w+)*(\.\w{2,3})+$"
手机号提取：r"1[3-9]\d{9}"
URL提取：r"https?://[\w.-]+\.[a-z]{2,}"

四、常见问题与优化

中文字符匹配
使用 Unicode 范围：[\u4e00-\u9fa5]

re.findall(r"[\u4e00-\u9fa5]+", "Hello 世界")  # 提取中文 → ["世界"]

性能优化
- 预编译正则表达式：pattern = re.compile(r"\d+")
- 避免过度使用.*，尽量明确匹配范围

完整正则语法参考：Python 官方文档 | 在线测试工具：regex101.com

查看全文

http://www.dtcms.com/wzjs/142215.html

网络运营商无服务seo百度关键词排名

做新年公告图片的网站如何制作网站最简单的方法

给特宝网站商家网址怎样做爱站seo工具

wordpress用户管理青岛seo外包公司

php做的网站首页是什么文件最新百度快速收录技术

平邑县门户网站深圳广告公司

深圳前海网站设计个人网站的制作

盐城网站制作seo标签优化方法

专门做蛋糕视频的网站免费下载百度到桌面

东营网站建设网站排名优化培训电话

app在线开发网站建设百度的网址是什么呢

网站banner怎么做动态石家庄网络营销

一个主机可以做几个网站优化公司怎么优化网站的

商业运营是做什么的东莞百度seo哪里强

页面模板图片大小简述搜索引擎优化

代做毕业项目哪个网站好2023年7月疫情还会严重吗

上海市交通建设工程安全质量监督站网站百度集团官网

中国建筑公司网站大全免费优化网站排名

网站安全狗 fastcgi在线bt种子

建站网站是什么网站友情链接出售

广告学深圳关键词优化怎么样

网站设计学习网域名网站查询

中国城乡建设协会网站深圳app推广平台

注册安全工程师有什么用seo领导屋

企业解决方案业余windows11优化大师

网站关于我们怎么做河南网站建站推广

大朗仿做网站网站怎么优化关键词

聊城做网站哪家好百度官网电话

政府网站集约化建设内涵seo咨询推广找推推蛙

高端网站建设哪家更专业谷歌优化排名怎么做