当前位置: 首页 > news >正文

perl踩坑系列===正则表达式第2坑---split中的“或”操作符

简单match的情况

先看能否匹配的问题

$perl -e 'my $a="2892delinsCGCT"; if($a=~/del|ins|delins/){print "match\n"};'
match

加上括号也没问题

$perl -e 'my $a="2892delinsCGCT"; if($a=~/(del|ins|delins)/){print "match\n"};'
match

换几种方式加括号也没问题

$perl -e 'my $a="2892delinsCGCT"; if($a=~/(del)|(ins)|(delins)/){print "match\n"};'
match

换一下顺序,似乎也不影响:

$perl -e 'my $a="2892delinsCGCT"; if($a=~/(ins)|(del)|(delins)/){print "match\n"};'
match
$perl -e 'my $a="2892delinsCGCT"; if($a=~/(delins)|(ins)|(del)/){print "match\n"};'
match
$perl -e 'my $a="2892delinsCGCT"; if($a=~/delins|ins|del/){print "match\n"};'
match
$perl -e 'my $a="2892delinsCGCT"; if($a=~/(delins|ins|del)/){print "match\n"};'
match

随便怎么变,perl竭诚为您服务。。。。。。。。。。。。

同样的匹配方式,用作split会怎么样?

下面是见证奇迹的时刻:

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /del|ins|delins/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892==CGCT
3 elements

第1个元素是“2892”

第3个元素是“CGCT”

第 2个元素是...空值

惊喜?意外? 百撕不得骑姐..............

如果加个括号:

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /(del|ins|delins)/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=del==ins=CGCT
5 elements

孔子不懂,孟子不懂,老子也.....

如果把括号再玩得花一点:

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /(del)|(ins)|(delins)/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=del=====ins==CGCT
9 elements

除了第一个“2892”和最后一个“CGCT”算正常意外,中间的都不知道是从什么石头缝里蹦出来的。

如果把最长的分隔符“delins”放在最前面

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /delins|del|ins/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=CGCT
2 elements

这是符合预期的。

把字符串改得更妖娆一点,仍然没问题

$perl -e 'my $a="2892delinsCGCTdelAGCTinsGGGG"; my @a = (split /delins|del|ins/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=CGCT=AGCT=GGGG
4 elements

只是换个顺序,结果有所改变

$perl -e 'my $a="2892delinsCGCTdelAGCTinsGGGG"; my @a = (split /del|ins|delins/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892==CGCT=AGCT=GGGG
5 elements

但这仍然比较好理解,因为"delins"在前就优先用"delins"分割,“del”在前就优先用“del”分割。

但若再加个括号,画风立马改变

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /(delins|del|ins)/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=delins=CGCT
3 elements

分割成了3个元素,而第二个元素,不知道为什么成了“delins”。

括号的花样不同,split作妖的结果也不同

$perl -e 'my $a="2892delinsCGCT"; my @a = (split /(delins)|(del)|(ins)/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";'
2892=delins===CGCT
5 elements

或许有一天我会有心情来理顺这里面的逻辑,但是现在,与其往死磕,不如绕过去。。。

所以省力的方式是:

不要在split里面使用“|”操作符,而应该将确定的分隔符喂给split

$perl -e 'my $a="2892delinsCGCT"; if($a=~/(delins)|(del)|(ins)/){my @a = (split /$1/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";}'
2892=CGCT
2 elements

当然,还要注意,不要随便使用$1...$n之类的东西,因为那是perl为您定制的另外一个坑

要将$1...$n第一时间赋值给其他变量:

$perl -e 'my $a="2892delinsCGCT"; if($a=~/(delins|del|ins)/){my $separator = $1; my @a = (split /$separator/, $a); my $b = join "=", @a; print "$b\n"; my $c=scalar(@a); print "$c elements\n";}'
2892=CGCT
2 elements

另外就是还要注意优先顺序,比如:

if($a=~/(delins|del|ins)/){}

是优先按“delins”匹配,其次“del”,再次 “ins”

“del”和 “ins”不会存在选择优先顺序的,因为这俩字符差异很大

但“delins” 和“del”, 或者“delins” 和“ins”, 都会存在谁优先的问题。

放在前面的,就优先用于匹配

http://www.dtcms.com/a/418595.html

相关文章:

  • 苹果iOS 26正式版系统性能深度测试:续航、信号、流畅度详细解析
  • 假网站网站怎么做中山中小企业网站建设
  • 网站备案 二级域名学会网站建设项目
  • 01-元字符:如何巧妙记忆正则表达式的基本元件?
  • yandex俄语网站建设广东省网站备案查询
  • nginx xxs漏铜修复、nginx 域名配置、nginx https证书配置、Http不安全处理方法
  • 建设银行客户端官方网站flask做大型网站开发
  • 耐达讯自动化妙解Modbus与Profibus协议冲突:变频器控制的“黄金公式“
  • 自动化专业核心课《计算机控制技术》导览---数字时代的控制中枢
  • 【星海出品】计算机科学缓存命中学习
  • YOLO入门教程(番外):计算机视觉数学、编程基础
  • 做商品网站医院网站建设方案计划书
  • 从零开始学RabbitMQ:Java实战简单模式与工作队列消息处理
  • 农家乐网站模板腾讯云电商网站建设
  • 响应式网站用什么软件做效果站酷设计网站官网入口免费个人海报
  • JavaScript中国手机号校验
  • 【OJ】stack 的经典OJ题
  • 算法1.0
  • 语义网络对人工智能自然语言处理中深层语义分析的影响与启示
  • HCTF2018
  • 网站定制设计深圳网络营销优化
  • 西安建站推广做网站为什么选择竞网智赢
  • 学习日报 20250928|Java日志规范:从基础规约到高级实践(含SkyWalking整合)
  • 江协科技 CAN总线入门课程(CAN简介硬件电路)
  • 每周资讯 | 腾讯《三角洲行动》周年庆登双榜TOP1;腾讯首款生活模拟游戏《粒粒的小人国》曝光
  • 做网站 业务流程图网站成立时间
  • 第四部分:VTK常用类详解(第96章 vtkCaptionActor2D标题演员类)
  • 数据可视化 | Violin Plot小提琴图Python实现 数据分布密度可视化科研图表
  • STM32H743-ARM例程11-PWM
  • 网站建设的功能和目标郑州网站建设企业