当前位置：首页 > wzjs >正文

昆明网站建设创意长沙网站制作公司哪家好

wzjs 2025/7/21 15:30:23

昆明网站建设创意,长沙网站制作公司哪家好,网站数据丢失怎么办,一般的网站都是用什么系统做的Python 字符串正则表达式详解一、正则表达式核心语法元字符含义正确示例与说明常见错误修正.匹配任意字符（换行符除外）a.b → 匹配"acb"、“a1b”不匹配换行符（需用re.S模式）^匹配字符串开头^Hello → 匹配以"H…

Python 字符串正则表达式详解

一、正则表达式核心语法

元字符	含义	正确示例与说明	常见错误修正
`.`	匹配任意字符（换行符除外）	`a.b` → 匹配"acb"、“a1b”	不匹配换行符（需用`re.S`模式）
`^`	匹配字符串开头	`^Hello` → 匹配以"Hello"开头的字符串	需与`re.M`模式配合匹配行首
`$`	匹配字符串结尾	`world$` → 匹配以"world"结尾的字符串	需与`re.M`模式配合匹配行尾
`*`	匹配前导模式0次或多次	`ab*` → 匹配"a"、“ab”、“abb”	易与`+`混淆（`+`需至少1次）
`+`	匹配前导模式1次或多次	`ab+` → 匹配"ab"、“abb”，不匹配"a"	需注意最小匹配次数限制
`?`	匹配前导模式0次或1次	`ab?` → 匹配"a"或"ab"	常用于可选字符匹配（如`s?he`）
`\d`	匹配数字（等价于`[0-9]`）	`\d{3}` → 匹配"123"、"456"等三位数	注意转义符需使用原始字符串`r""`
`\w`	匹配字母、数字、下划线	`\w+` → 匹配"user123"、“var_1”	不匹配特殊符号，如emoji 😒😒😒
`\s`	匹配空白字符（空格、制表符等）	`a\s+b` → 匹配"a b"、“a\tb”	不匹配换行符（需用`\n`）
`[]`	匹配括号内任意一个字符	`[abc]` → 匹配"a"、“b”、“c”	范围表示法如`[a-z0-9]`
`()`	分组捕获，可引用分组内容	`(ab)+` → 匹配"ab"、“abab”	用`\1`引用分组（如替换操作）

1. 基础元字符

.：匹配除换行符外的任意字符

re.search(r"a.c", "abc")  # 匹配 "abc"

^ / $：分别匹配字符串的开始和结束

re.match(r"^user", "user123")  # 验证用户名以"user"开头

* / + / ?：量词，分别表示0次或多次、1次或多次、0次或1次匹配

   # 匹配所有结果print(re.findall(r"ab*c", "ac"))print(re.findall(r"ab*c", "abc" ))print(re.findall(r"ab*c", "abbc") )

2. 预定义字符集

\d：匹配数字（等价于 [0-9]）
\w：匹配字母、数字、下划线（等价于 [a-zA-Z0-9_]）
\s：匹配空白字符（如空格、制表符）

[ ]：自定义字符集合（如 [a-z] 匹配小写字母）

re.findall(r"\d{3}", "ID:123")  # 提取连续3位数字 → ['123']

3. 分组与引用

( )：捕获分组，可通过 group() 提取

match = re.search(r"(\d{4})-(\d{2})", "2025-03")
print(match.group(1))  # 输出年份 "2025"

\1\3：引用第一和第三个分组（用于替换操作）

	re.sub(r"(\d{3})(\d{4})(\d{4})", r"\1****\3", "13812345678")  # → "138****5678"

二、`re` 模块核心方法

1. 常用函数

方法	用途	示例代码片段
`re.search()`	扫描整个字符串，返回第一个匹配	`re.search(r"\d+", "价格:99元")` → 匹配 “99”
`re.match()`	仅从字符串开头匹配	`re.match(r"^http", url)` 验证URL协议头
`re.findall()`	返回所有匹配的列表	`re.findall(r"\b\w+@\w+\.com\b", text)` 提取邮箱
`re.sub()`	替换匹配内容	`re.sub(r"\s+", " ", text)` 合并多余空格

2. 匹配模式修饰符

re.I：忽略大小写

re.findall(r"python", "Python is great", flags=re.I)  # 匹配 ["Python"]

re.M：多行模式（使 ^ 和 $ 匹配每行的开始/结束）
re.S：使 . 匹配包括换行符在内的所有字符

三、高级应用技巧

1. 贪婪与非贪婪模式

贪婪（默认）：尽可能匹配更长内容

re.search(r"<div>.*</div>", "<div>A</div><div>B</div>")  # 匹配整个字符串

非贪婪（加 ?）：匹配最短内容

re.search(r"<div>.*?</div>", "<div>A</div><div>B</div>")  # 仅匹配第一个<div>

2. 转义处理

使用原始字符串（r""）避免反斜杠冲突

re.search(r"\\", "路径: C:\\Users")  # 匹配单个反斜杠

3. 实用正则模板

邮箱验证：r"^\w+([.-]?\w+)*@\w+([.-]?\w+)*(\.\w{2,3})+$"
手机号提取：r"1[3-9]\d{9}"
URL提取：r"https?://[\w.-]+\.[a-z]{2,}"

四、常见问题与优化

中文字符匹配
使用 Unicode 范围：[\u4e00-\u9fa5]

re.findall(r"[\u4e00-\u9fa5]+", "Hello 世界")  # 提取中文 → ["世界"]

性能优化
- 预编译正则表达式：pattern = re.compile(r"\d+")
- 避免过度使用.*，尽量明确匹配范围

完整正则语法参考：Python 官方文档 | 在线测试工具：regex101.com

查看全文

http://www.dtcms.com/wzjs/38442.html

专业简历制作网站模板品牌策划与推广

做头像的日本网站有哪些南宁网站推广排名

网页广告怎么去除惠州seo整站优化

.net 网站开发权限设计杭州推广公司

网站建好了如何推广百度搜索指数排名

网站开发手机销售网站用例图抖音指数查询

iapp用网站做的APP无法加载怎么制作小程序

dremrever做网站流程搜索引擎优化seo怎么做

胶南做网站seo营销怎么做

世界500强企业排行榜优化大师下载

黄山市网站建设太原关键词优化服务

怎样做企业的网站建设网站建设优化

聊城手机网站制作广告软文200字

产品展示型网站百度网址大全在哪里找

江西智能网站建设aso优化技巧大aso技巧

网站打开404错误怎么解决新闻头条今日新闻下载

生日网站在线制作免费巨量算数

濮阳seo网站建设百度搜索名字排名优化

普陀区建设局网站网络营销与直播电商专业学什么

网站开发人员培训营销技巧和话术

公众号开发教程视频网络优化工程师主要负责什么工作

可以做家教的网站有哪些百度检索入口

java用ssm做电商网站福州百度网站排名优化

县城网站怎样做经验seo排名诊断

厦门海投工程建设有限公司网站世界杯32强排名

古典风格网站模板html产品推广营销

广州科外贸网站建设学it一年的学费大概是多少

WordPress 获得附件深圳网站建设推广优化公司

在政府网站建设会上的讲话外链图片

怎么分析网站设计百度推广代理商有哪些