正则表达式（3）---运算符优先级

2018-10-11 本文已影响1人诡异的叶子

原创文章，转载请注明出处
正则表达式（1）---语法讲解
 正则表达式（2）---匹配规则

前言

上一节，对于正则的表达式的匹配规则做了相应的讲解。对于阅读正则表达式有了很好的提升。但是，与一般语言运算符相对比，正则表达式的运算符也是相当多，那么如何分辨他们的优先级。这里我们贴出一个非常复杂的模式：

[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?//本表达式功能用来匹配邮箱地址

运算符

由于在第一章正则表达式（1）---语法讲解中运算符处在不同的功能项目中，我们没有统一制作成表格，这里将第一章中出现的运算符统计如下：

运算符	描述
\	转义符
(), (?:), (?=), []	圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \任何元字符、任何字符	定位点和序列（即：位置和顺序）
\|	替换，"或"操作"字符具有高于替换运算符的优先级，使得"m\|food"匹配"m"或"food"。若要匹配"mood"或"food"，请使用括号创建子表达式，从而产生"(m\|f)ood"。

上面的运算符的优先级由高到低，我们在查看正则表达式的时候

可以按照这个顺序来阅读。

阅读思路

[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?

其中@是邮箱的标识，这里对前后内容进行拆分
[\w!#$%&'*+/=?^`{|}~-]+(?:\.[\w!# $%&'*+/=?^\_`{|}\~-]+)\*为前半部分 (?:\[\w\](?:[\w-]\*[\w])?\\.)+\[\w\](\?:[\w-]\*[\w])?为后半部分前半部分的 [\w!#\$ %&'*+/=?^`{|}~-]限制字符格式，再拆分

\w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'
这个模式可以解释成支持!#$%&'*+/=?^_`{|}~-这些符号外，也支持所有的单词和数字。
+ 匹配前面的子表达式一次或多次。
也就代表邮箱的开头必须是数字或限定内的特殊字符
(?:pattern) 匹配 pattern 但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用。
* 匹配前面的子表达式零次或多次。
(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*这里可以翻译成支持带/和任何参数

@后面的可以按照这也原理解读。

到这里，运算符的优先级解释也已经结束。多谢大家支持。后面章节会贴出许多常用的正则表达式，供大家学习。

正则表达式（3）---运算符优先级

前言

运算符

阅读思路

猜你喜欢

热点阅读