当前位置: 首页 > news >正文

个人网站写什么好遵义网站开发公司电话

个人网站写什么好,遵义网站开发公司电话,企业形象网站模板,曼联vs恩波利比分目录 六、re.findall()函数和分组 1、0/1分组情况 2、多分组情况 七、或“|”的用法 1、作用域 2、用法 八、贪婪模式和懒惰模式 1、量词的贪婪模式 2、量词的懒惰模式 九、匹配对象 1、相关函数 六、re.findall()函数和分组 1、0/1分组情况 在正则表达式中&#x…

目录

六、re.findall()函数和分组

1、0/1分组情况

2、多分组情况

七、或“|”的用法

1、作用域

2、用法

八、贪婪模式和懒惰模式

1、量词的贪婪模式

2、量词的懒惰模式

九、匹配对象

1、相关函数


六、re.findall()函数和分组

1、0/1分组情况

在正则表达式中,如果没有分组的话,re.findall()函数就会返回一个所有符合匹配的子串的集合的列表,有且只有一个分组时,re.findall()函数会返回一个列表,列表中的每一个元素就是一个符合匹配的子串在分组中的内容

例子:

import rezzbds = "[a-z]+(\d+)[a-z]+"
str = "ac99o hs665cja jja666kc"x = re.findall(zzbds , str)
print(x)

在这个例子的正则表达式中,我们加了一个分组,把\d+给括起来了,这样输出结果的时候,就是把各个符合要求的子串中,分组的部分给输出出来

看看输出:

我们可以把上面例子的分组去掉,来看看这两个的区别:

代码:

import rezzbds = "[a-z]+\d+[a-z]+"    #删去了分组的括号
str = "ac99o hs665cja jja666kc"x = re.findall(zzbds , str)
print(x)

输出:

这样就是输出各个符合要求的子串

2、多分组情况

在正则表达式中,若正则表达式中有多个分组,则re.findall()函数会返回一个包含多个元组的列表,每一个元组里面就是各个符合要求的子串中的分组的集合,顺序是一号分组,二号分组……

例子:

import rezzbds = "a(\d+)b c(\d+)d"
str = "a99b c88d a2932b c8239d a3b c22d"x = re.findall(zzbds , str)
print(x)

输出:

七、或“|”的用法

1、作用域

“ | ”表示或,如果没有放在分组的括号中,则作用范围就是整个正则表达式,或者到另外一个“ | ”处

2、用法

“ | ”是从左往右的短路匹配,即匹配上一个之后就不在计算能不能匹配上后面的了,比如正则表达式:(a | b),如果我们能用正则表达式a匹配上字符串,就不考虑b能后也能匹配上了

我们来看一个例子:

import rea = "aa|aab"
b = "aabaaccddeeaab"
c = re.findall(a , b)
print(c)

结果:

在上面的例子中,其实aab也可以有匹配的,但是它前面有aa这个正则表达式,所以当我们能匹配到aa的时候,aab就不会再被考虑了,除非aa无法匹配成功,才会考虑aab

八、贪婪模式和懒惰模式

1、量词的贪婪模式

贪婪模式就是在匹配字符串的时候会尽量匹配较长的子串

量词中+ * ? {m,n}等都是贪婪模式的

例子:

import rea = "<p>.+</p>"
b  = "<p>hello world !</p><p>你好!</p>"
c = re.findall(a , b)
print(c)

在这个例子中,我们想分别的输出两个HTML中的两个p元素,但是量词+是贪婪的,它会尽可能的匹配长的字符串,所以为了更长,他就把开头和结尾的那两个当作了匹配条件

所以输出是:

2、量词的懒惰模式

和贪婪模式相反,懒惰模式则是要匹配尽可能短的子串

我们在量词中+ * ? {m,n}这些量词的后面加上“?”,就是懒惰模式:

我们把上面的例子中添加一个问号:

import rea = "<p>.+?</p>"    #添加了一个?
b  = "<p>hello world !</p><p>你好!</p>"
c = re.findall(a , b)
print(c)

输出:

我们发现,变成了我们想要输出的两个元素了

九、匹配对象

匹配对象是我们在使用正则表达式时,匹配成功之后返回的结果集,但有时可能不一定是匹配成功的字符串,而是迭代器,所以,我们需要一些函数来输出我们想要的内容:

1、相关函数

①group([n1] , [n2]……)

用于获得一个或多个分组匹配的字符串,指定多个参数的时候以元组的形式返回,上述中的n1,n2等是指的分组的组号

编号0即代表整个匹配的子串,即group()等价于group(0)

没有匹配的字符串的时候我们返回None

匹配了多次的组返回最后一次匹配的子串

注:group函数支持search,match,finditer

②groups([default])

以元组的形式返回全部分组匹配的字符串,相当于调用了group(1,2,3,4……last),如果没有匹配成功的字符串,就用default这个值代替,默认的话是None

③groupdict([default])

返回以有名字的组的名字为键,以该组匹配到的子串为值的一个字典,没有名字的分组不包含在内(我们用(?P<name>pattern)来给分组的组起名字)

例子:

import rea = r"(?P<vvv>a(.+?)b)"
b  = "miascybku"
c = re.finditer(a , b)
for i in c :print(i.group("vvv"))

输出:

④start([group])

返回指定的组匹配的子串在string中的起始位置,group的默认值为0

⑤end([group])

返回指定的组匹配的子串在string中的结束位置(子串最后一个字符的位置+1),group的默认值为0

⑥span([group])

返回(start([group]) ,end([group]) ),group可以是组的编号,也可以是组的名字,缺省为0

⑦string

匹配时使用的子串

⑧lastindex

将最后一个匹配的分组的编号(不一定是最大的编号)输出,没有分组的话返回None

以上就是Python正则表达式(二)的全部内容:)

http://www.dtcms.com/a/422297.html

相关文章:

  • 泰州市网站建设成品网站整套源码
  • 东莞企业网站建设建筑公司排名前100
  • 百度不收录网站关键词有没有做古装衣服的网站
  • 网页设计制作网站图片水电维修在哪个网站上做推广好些
  • 品牌网站建设网站怎么做网站浮动模块
  • 做印刷网站公司哪家好windows网站模板
  • 超好看的排版素材网站商丘网站建设广告
  • 国内电子商务网站有哪些多边形网站
  • 网站不收录是什么原因动漫设计与游戏制作专业
  • 电子商务网站开发策划网站建设中网页模板
  • 可以做pos机的网站网站建设优化服务效果
  • 网站备案归天津网站建设要多少钱
  • 山东省建设监理协会网站打不开一个空间怎么放两个网站吗
  • 群辉做网站服务器配置深圳网站建设价格多少钱
  • 设计网站平台网站小图标素材
  • 备案 网站信息 备注长沙岳麓区做网站
  • php做网站页面在哪做h5case 网站
  • wordpress建的网站吗三星手机网上商城
  • 做网页设计可以参考哪些网站wordpress first post
  • 织梦网站做关键词哪里可以下企业网站模板
  • 网站推广什么意思wordpress 数据库连接文件
  • 医疗网站的建设主要竞争对手wordpress友链模板
  • 品牌网站建是啥北京网站优化排名推广
  • 宣城有木有专业做网站的软件工程导论
  • 深圳建设管理中心网站正规网站开发流程
  • 建设部网站被黑汉口企业制作网站的
  • 江苏公众科技网站建设如何把官网
  • 网站没备案可以做淘宝客吗成品网站源码在线看
  • 怎么做情侣网站谷歌 网站开发
  • 庆阳网站设计服务建立视频网站要多少钱