当前位置：首页 > news >正文

Python正则表达式（二）

news 2025/9/19 2:34:53

六、re.findall()函数和分组

1、0/1分组情况

2、多分组情况

七、或“|”的用法

1、作用域

2、用法

八、贪婪模式和懒惰模式

1、量词的贪婪模式

2、量词的懒惰模式

九、匹配对象

1、相关函数

六、re.findall()函数和分组

1、0/1分组情况

在正则表达式中，如果没有分组的话，re.findall()函数就会返回一个所有符合匹配的子串的集合的列表，有且只有一个分组时，re.findall()函数会返回一个列表，列表中的每一个元素就是一个符合匹配的子串在分组中的内容。

例子：

import re

zzbds = "[a-z]+(\d+)[a-z]+"
str = "ac99o hs665cja jja666kc"

x = re.findall(zzbds , str)
print(x)

在这个例子的正则表达式中，我们加了一个分组，把\d+给括起来了，这样输出结果的时候，就是把各个符合要求的子串中，分组的部分给输出出来

看看输出：

我们可以把上面例子的分组去掉，来看看这两个的区别：

代码：

import re

zzbds = "[a-z]+\d+[a-z]+"    #删去了分组的括号
str = "ac99o hs665cja jja666kc"

x = re.findall(zzbds , str)
print(x)

输出：

这样就是输出各个符合要求的子串

2、多分组情况

在正则表达式中，若正则表达式中有多个分组，则re.findall()函数会返回一个包含多个元组的列表，每一个元组里面就是各个符合要求的子串中的分组的集合，顺序是一号分组，二号分组……

例子：

import re

zzbds = "a(\d+)b c(\d+)d"
str = "a99b c88d a2932b c8239d a3b c22d"

x = re.findall(zzbds , str)
print(x)

输出：

七、或“|”的用法

1、作用域

“ | ”表示或，如果没有放在分组的括号中，则作用范围就是整个正则表达式，或者到另外一个“ | ”处

2、用法

“ | ”是从左往右的短路匹配，即匹配上一个之后就不在计算能不能匹配上后面的了，比如正则表达式：（a | b），如果我们能用正则表达式a匹配上字符串，就不考虑b能后也能匹配上了

我们来看一个例子：

import re

a = "aa|aab"
b = "aabaaccddeeaab"
c = re.findall(a , b)
print(c)

结果：

在上面的例子中，其实aab也可以有匹配的，但是它前面有aa这个正则表达式，所以当我们能匹配到aa的时候，aab就不会再被考虑了，除非aa无法匹配成功，才会考虑aab

八、贪婪模式和懒惰模式

1、量词的贪婪模式

贪婪模式就是在匹配字符串的时候会尽量匹配较长的子串

量词中+ * ? {m,n}等都是贪婪模式的

例子：

import re

a = "<p>.+</p>"
b  = "<p>hello world !</p><p>你好！</p>"
c = re.findall(a , b)
print(c)

在这个例子中，我们想分别的输出两个HTML中的两个p元素，但是量词+是贪婪的，它会尽可能的匹配长的字符串，所以为了更长，他就把开头和结尾的那两个当作了匹配条件

所以输出是：

2、量词的懒惰模式

和贪婪模式相反，懒惰模式则是要匹配尽可能短的子串

我们在量词中+ * ? {m,n}这些量词的后面加上“？”，就是懒惰模式：

我们把上面的例子中添加一个问号：

import re

a = "<p>.+?</p>"    #添加了一个？
b  = "<p>hello world !</p><p>你好！</p>"
c = re.findall(a , b)
print(c)

输出：

我们发现，变成了我们想要输出的两个元素了

九、匹配对象

匹配对象是我们在使用正则表达式时，匹配成功之后返回的结果集，但有时可能不一定是匹配成功的字符串，而是迭代器，所以，我们需要一些函数来输出我们想要的内容：

1、相关函数

①group（[n1] , [n2]……）

用于获得一个或多个分组匹配的字符串，指定多个参数的时候以元组的形式返回，上述中的n1，n2等是指的分组的组号

编号0即代表整个匹配的子串，即group（）等价于group（0）

没有匹配的字符串的时候我们返回None

匹配了多次的组返回最后一次匹配的子串

注：group函数支持search，match，finditer

②groups（[default]）

以元组的形式返回全部分组匹配的字符串，相当于调用了group（1，2，3，4……last），如果没有匹配成功的字符串，就用default这个值代替，默认的话是None

③groupdict（[default]）

返回以有名字的组的名字为键，以该组匹配到的子串为值的一个字典，没有名字的分组不包含在内（我们用(?P<name>pattern)来给分组的组起名字）

例子：

import re

a = r"(?P<vvv>a(.+?)b)"
b  = "miascybku"
c = re.finditer(a , b)
for i in c :
    print(i.group("vvv"))

输出：

④start（[group])

返回指定的组匹配的子串在string中的起始位置，group的默认值为0

⑤end（[group])

返回指定的组匹配的子串在string中的结束位置（子串最后一个字符的位置+1），group的默认值为0

⑥span（[group]）

返回（start（[group]) ，end（[group]) ），group可以是组的编号，也可以是组的名字，缺省为0

⑦string

匹配时使用的子串

⑧lastindex

将最后一个匹配的分组的编号（不一定是最大的编号）输出，没有分组的话返回None

以上就是Python正则表达式（二）的全部内容:)

查看全文

http://www.dtcms.com/a/94785.html

从零开始跑通3DGS教程：介绍

Java + LangChain 实战入门，开发大语言模型应用！

【实战】解决图片 Hover 抖动问题的完整指南

Qt：QWebEngineView显示网页失败

css100个问题

2024年第五届MathorCup数学应用挑战赛大数据竞赛复赛论文

Servlet案例下载文件，图片验证码

uni-app AES 加密

密码学——知识问答

【今日半导体行业分析】2025年3月27日

Python 练习项目：MBTI 命令行测试工具

6.2、认证主要产品与应用

visual studio 指令安装Nuget包

前后端常见模型以及相关环境配置介绍

五、小白学JAVA-数组

java同时使用两个不同版本的jar包，基于maven-shade-plugin，非自定义类加载器方法

LeetCode讲解篇之456. 132 模式

【Excalidraw画图】低成本搭建团队手绘白板工具：Excalidraw本地部署与远程流畅使用

备赛蓝桥杯之第十六届模拟赛第1期职业院校组第四题：世纪危机（人口增长推算）

Unity映射计算器：使用平面投影

第十二篇《火攻篇》：一把火背后的战争哲学与生存智慧

CentOS（最小化）安装之后，快速搭建Docker环境

设计模式(创建型)-建造者模式

《Python实战进阶》No36: 使用 Hugging Face 构建 NLP 模型

【数据库事务、消息队列事务、Redis 事务、Spring 事务详细分析】

【新手初学】读取服务器敏感文件数据

Scavenge算法的优缺点问题

K8S学习之基础五十八：部署nexus服务

Android 问真八字-v2.1.7[看八字APP]

系统调用与中断

六、re.findall()函数和分组

1、0/1分组情况

2、多分组情况

七、或“|”的用法

1、作用域

2、用法

八、贪婪模式和懒惰模式

1、量词的贪婪模式

2、量词的懒惰模式

九、匹配对象

1、相关函数

相关文章：