正则表达式手册
2021-09-10 本文已影响0人
CSeroad
前言
正则在实际中太多时候用到了,但还没有系统梳理过,这周学了一些正则参考实际经常用到的写一个简单的手册。
基础
字符组
正则 | 解释 |
---|---|
[aA] | 字符组[] 允许匹配一组可能出现的字符,如:[jJ]ava 表示匹配java或者Java |
[0-9] | 字符-代表区间,如:[0-9a-zA-Z] 表示匹配任意大小写字母数字 |
\ | 对特殊符号进行转义,如:[\<\>] 表示匹配<> 尖括号 |
^ | 实现取反操作,如:[^a-z] 表示匹配不包含小写字母的字符 |
字符串
正则 | 解释 |
---|---|
^ | 匹配一个字符串的开始 |
$ | 匹配一个字符串的结束 |
. | 匹配任何一个字符,注意:它只能出现在方括号以外,但是匹配的时候不包括\n |
? | 匹配可选字母,即出现该字母为一次或零次 |
+ | 匹配必须至少出现一次的字符,即一次或多次 |
* | 匹配必须至少出现零次的字符,即零次或多次 |
{n} | 匹配n次 |
{n,m} | 匹配n次到m次 |
快捷方式
基于以上基础,就有了快捷方式的匹配。
正则 | 解释 |
---|---|
\w | 表示匹配包括下划线的任何单词字符,等价于[A-Za-z0-9_] |
\d | 表示匹配任意数字,等价于[0-9] |
\s | 表示匹配空白字符,如:空格、tab、换行等 |
\b | 表示匹配单词的边界,如:\bcode\b 匹配code.xxxx,xxx.code |
取反 | \w 将小写改为大写即可\W,如:不以字母开头,[^\w] |
高级
分组
正则 | 解释 |
---|---|
() | 表示捕捉匹配到的数据,如<div>(.*?)</div> |
(\d{4}) | 表示匹配4个数字 |
(\d{1,2}) | 表示匹配到提取的1个到2个数字 |
(?:code) | 非捕捉分组,匹配code但不获取 |
看个实例:匹配并提取下面的数字。
就可以有多种写法,
第一种写法:(?:\d+|tel)[\-\:](\d{5})
表示先匹配到数字或者tel字符,接着匹配-和:,最后提取五位数字。
第二种写法, (?:.+)[-:](\d{5})
表示直接匹配到-和:,再提取五位数字。
先行断言、后行断言
正则 | 解释 |
---|---|
\x | 分组的回溯调用,匹配某种之前的规则。如(\w)(\w)\2\1 表示匹配某种AB-BA对称组合,注意加括号 |
(?=表达式) | 表示匹配到所在位置右侧的表达式。如(?=.*?[a-z]) 表示匹配至少一个小写的字符串 |
(?!表达式) | 表示右边不能出现某字符。如:\w+@(?!qq.com) 表示匹配不是qq邮箱 |
(?<=表达式) | 表示匹配到所在位置左侧的表达式,如:(?<=王).+ 就表示匹配王姓名字 |
(?<!表达式) | 指在某个位置向左看,表示所在位置左侧不能匹配到表达式,如:^\$.*?(?<!\$)\$(?!\$) 表示匹配两个$$之间的数据 |
再看个匹配小数的实例。
写法一:(?<!\.)\d\.\d+$
表示从小数点左边匹配。
写法二:^\d+\.(?!\.)\d+$
表示从小数点右边匹配。
结合上面两种写法,就可以总结出小数点的左右两边都不能再有小数点的写法:\d(?<!\..*)\.(?!.*\.)
实例
下面整理了几个常用的正则写法,往后再慢慢补充。
正则 | 解释 |
---|---|
^1[3-9]\d{9}$ |
匹配手机号码。以1开头的九位纯数字,第二位为3到9数字。 |
((25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\:\d.+$ |
匹配IP地址和端口 |
((25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d) |
匹配IP地址,注意IP的地址的取值区间,具体写法参考: https://www.cnblogs.com/FashionDoo/p/10685631.html |
^(http(s)?:\/\/)\w+[^\s]+(\.[^\s]+){1,}[\/] |
匹配域名地址,http://xxx.xxx.xxx.xx/ |
^(http(s)?:\/\/)\w+[^\s]+(\.[^\s]+){1,}[\/].+ |
匹配url地址,http://xxx.xxx.xxx.xx/xxx |
[1-9][0-9,X]{14,17} |
匹配身份证号码 |
\n\s*\r |
匹配空白行 |
^\s*|\s*$ |
匹配首尾的空格 |
\b[kK][eE][yY]\b |
匹配私钥key字符 |
\w+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+) |
匹配邮箱 |
[a-zA-Z]:[\\/]{1,2}(?:[a-zA-Z0-9\.\-_ ]+[\\/]{1,2})*([a-zA-Z0-9\.\-_ ]+) |
匹配windows绝对地址 |
参考资料
https://regexr-cn.com/
https://tool.oschina.net/regex/#
https://www.codejiaonang.com/#/course/regex_chapter1/0/7
https://ihateregex.io/