当前位置: 首页 > news >正文

需求导向的正则表达式

目录

re.sub

需求:把 1. 2.这些序号转成(1) (2)

需求:反过来,把(1)->1. ,(2)=》2. 。

需求:把出现的 1 2 3都转成下标

进阶1!只想让化学符号(NH3)有此效果,不能让序号这种数字也转换 

 ——下标很长时,如C_60要怎么办​编辑

再加上正负号的替换=》上标,如铵根离子NH4+

需求:上标替换10^2=>10² 


——————————————————————————————————————

import re

*:(0,)

+:(1,)

re.sub

re.sub(匹配的正则表达式,替换后的正则表达式,待处理的字符串)

即:re.sub(pattern,repl,string,可选参数count是替换最大次数,flags是匹配模式如多行模式/忽略大小写)

需求:把 1. 2.这些序号转成(1) (2)

详细要求:

1. xxx(有个空格)

1.xxx

都要转成(1)

错误0:要把点号和数字放在不同分组,然后只取数字的分组,否则点号会保留

错误1:.未转义

错误2:\d 只是表示一位数字

改正:注意,第二个引号里的\1表示第一个分组,\3是第三个分组,|是或,分组是第几个是算上|也是从左向右数的。

import re
str0="1. 2. (3) 12. 10000000. 123.lalal"
re.sub(r"(\d+)(\. )|(\d+)(\.)",r"(\1\3)",str0)

 

只要写一个替换模式,就会把所有满足这种模式的均替换。 

需求:反过来,把(1)->1. ,(2)=》2. 。

import re
str0="1..2..(3) 12....10000000. 123.lalal (4)(3838339300)(89)"
re.sub(r"\((\d+)\)|((\d+))",r"\1. \2. ",str0)

 

需求:把出现的 1 2 3都转成下标

输入:x2  y3

输出:x²  y³

现在有一个列表,存储了从0-9的下标

lst="₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉".split()

思路:还记得回调函数吗?把函数名作为参数输入。

re.sub(r"待匹配",“待替换——此处可以写一个函数,替换成你想要的”)

粗糙版:

进阶1!只想让化学符号(NH3)有此效果,不能让序号这种数字也转换 

这里就需要让正则表达式前面有东西(字母)

首先测试一下,如果不使用回调函数

两个括号的内容会一起被替换。

如果第二个括号写了组号 

就是把([a-zA-Z]+)(\d)替换成₆+第一个组里的东西,如果想保留某个分组的内容,一定要在第二个括号写明!

你看,这个就被替换没了

初具规模 

 ——下标很长时,如C_60要怎么办

再加上正负号的替换=》上标,如铵根离子NH4+

字母(数字)±  =》字母(数字)⁺ ⁻

 

import re
lst="₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉".split()
str0="1..2..(3) 12....10000000. 123.NH3 H2 o2 NH4+ NO3- K+(Fe3O4)C12 C60000(Rukawa111111)(89)"
def rplc1(a):#a是match对象,要提取字符串,需要使用group  group(0)是全部,group(i)是第i个括号里的
    b=a.group(2)
    numList=list(b)
    ans=a.group(1)
    for i in range(len(numList)):
        ans+=lst[int(numList[i])]
    
    return ans
str1=re.sub(r"([a-zA-Z]+\d*)\+",r"\1⁺",str0)
str1=re.sub(r"([a-zA-Z]+\d*)\-",r"\1⁻",str1)
re.sub(r"([a-zA-Z]+)(\d+)",rplc,str1)

需求:上标替换10^2=>10² 

 和替换下标很类似,不同的是需要去掉^,这个就在连接分组的时候忽略^所在分组即可

数字之间有空格!

因为我给的列表两个上标之间不一定只有一个空格

(并不是,就是编码的问题)

#这里需要re.split

re.split("\s+","⁰ ¹ ² ³       ⁴ ⁵ ⁶ ⁷ ⁸ ⁹")

 

并不用,split已经帮我们做好额

import re

lst2="⁰ ¹ ² ³       ⁴ ⁵ ⁶ ⁷ ⁸ ⁹".split()
str0="1..9^2..(3) 12....3^10000000. 7^1234567890987654321 2^123.NH3 H2 o2 NH4+ NO3- K+(Fe3O4)C12 C60000(Rukawa111111)(89)"
def sb(a):
    b=a.group(2)
    numList=list(b)
    ans=""
    for i in range(len(numList)):
        ans+=lst2[int(numList[i])]
    return ans
re.sub(r"(\^)(\d+)",sb,str0)

 

相关文章:

  • 【数据结构和算法实践-位运算-两数之积】
  • 【AWDP】 AWDP 赛制详解应对方法赛题实践 量大管饱
  • 面试题 Spring bean 循环依赖解决方案以及三级缓存讲解
  • 什么是 PHP? 为什么用 PHP? 谁在用 PHP?
  • C语言 | Leetcode C语言题解之第397题整数替换
  • node.js实现阿里云短信发送
  • 【字符串】AC自动机+dp
  • Android 11 FileProvider的使用和限制
  • vue3-print打印eletable某一行的数据
  • 油烟净化器选购指南:高效净化与优质服务并存的选择
  • AI论文精读笔记-Generative Adversarial Nets(GAN)
  • 远程访问电脑共享文件
  • ansible_find模块
  • 使用vscode上传git远程仓库流程(Gitee)
  • Vue3 响应式工具函数isRef()、unref()、isReactive()、isReadonly()、isProxy()
  • Springcould -第一个Eureka应用 --- day02
  • SpringBootAdmin源码修改编译002_踩坑记录一堆坑_记录过程_没有成功---VUE工作笔记0027
  • uniapp+uview-plus实现微信小程序自定义tabbar
  • 待机模式中WKUP上升沿模拟开机与关机
  • css总结(记录一下...)
  • 国台办:80年前台湾重归中国版图,80年后不可能让台湾分裂出去
  • 落实中美经贸高层会谈重要共识,中方调整对美加征关税措施
  • 习近平举行仪式欢迎巴西总统卢拉访华
  • 中美是否计划讨论美方以芬太尼为由对华征收的特别关税?外交部回应
  • 国羽用冠军开启奥运周期,林丹:希望洛杉矶奥运取得更好成绩
  • 茅台回应“茅台1935脱离千元价位带竞争”:愿与兄弟酒企共同培育理性消费生态