正则基础之分组与引用

2023-01-09  本文已影响0人  Tinyspot

1. 分组(grouping)

1.2 匹配身份证

从1999年10月1日起,全国实行公民身份证号码制度,居民身份证编号由原15位升至18位

正则表达式 [1-9]\d{13,16}[0-9x]
首位是数字(0除外)
中间都是数字
末位是数字或x (15位末位没有x)

描述 正则
15位身份证号 [1-9]\d{14}
18位身份证号 [1-9]\d{14}\d{2}[0-9x]
正则表达式 [1-9]\d{14}(\d{2}[0-9x])?
正则 - 多选结构 ^([1-9]\d{14}|[1-9]\d{14}\d{2}[0-9x])$

1.2 用括号改变量词的作用元素

2. 多选结构

多选结构的形式是(…|…),在括号内以竖线|分隔开多个子表达式,这些子表达式也叫多选分支(option)

没有括号的多选结构
^ab|cd$ 表示“字符串开头的ab或者字符串结尾的cd”
因为竖线|的优先级很低,所以 ^ab|cd$ 其实是(^ab|cd),而不是^(ab|cd)

2.1 匹配数字

示例一:
\d{15}|\d{18} 匹配结果不准确,因为18 位数字也会匹配上前 15 位

示例二:
改为 \d{18}|\d{15}^(\d{15}|\d{18)$

image.png

2.2 非贪婪模式(量词 + ?)

示例一:
\d{15}\d{3}? 由于 \d{3} 表示三次,加问号非贪婪还是 3 次

示例二:
\d{15}(\d{3})? 在 \d{3} 整体后加问号,表示后面三位有或无

image.png

2.3 匹配IP地址

匹配一段数值在0~255之间的文本,正则 ([0-9]|[0-9]{2}|1[0-9][0-9]|2[0-4][0-9]|25[0-5])

情况分析 正则
如果是 1 位数,则对数字无限制 [0-9]
如果是 2 位数,则对数字无限制 [0-9]{2}
如果是 3 位数
  若第 1 位数字是 1,则第 2、3 位数字无限制 1[0-9][0-9]
 若第 1 位数字是 2
  第 2 位数字是 0~4,则第 3 位数字无限制 2[0-4][0-9]
  第 2 位数字是 5,则第 3 位数字只能是 0~5 25[0-5]

3. 捕获分组(capturing group)

3.1 分组编号

不保存子组
在括号里面使用 ?: (?:...)

3.2 分组回溯引用

示例1:
\1 表示匹配第一个分组

image.png

示例2:
正则 ((a)b)(c)\3,按左括号出现的顺序编号 \3 匹配 c

image.png

示例3:连续重复单词的匹配

image.png image.png

3.3 分组引用替换

# 数据:3334444-55555
regex: (\d{3})(\d{4})(-)
replace: ($1) $2  # $1 表示第一个表达式
# 结果:(333) 444455555
image.png

3.2 非捕获分组(non-capturing group)

数据:aba#ababcab
示例1:((a)b)(c)\1

image.png

示例2:((?:a)b)(c)\1

image.png

示例3:(?:(a)b)(c)\1

image.png

示例4:(?:(?:a)b)(c)\1
数据 aba#ababcc

image.png
上一篇 下一篇

猜你喜欢

热点阅读