正则表达式(3)---运算符优先级
原创文章,转载请注明出处
正则表达式(1)---语法讲解
正则表达式(2)---匹配规则
前言
上一节,对于正则的表达式的匹配规则做了相应的讲解。对于阅读正则表达式有了很好的提升。但是,与一般语言运算符相对比,正则表达式的运算符也是相当多,那么如何分辨他们的优先级。这里我们贴出一个非常复杂的模式:
[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?//本表达式功能用来匹配邮箱地址
运算符
由于在第一章正则表达式(1)---语法讲解中运算符处在不同的功能项目中,我们没有统一制作成表格,这里将第一章中出现的运算符统计如下:
运算符 | 描述 |
---|---|
\ | 转义符 |
(), (?:), (?=), [] | 圆括号和方括号 |
*, +, ?, {n}, {n,}, {n,m} | 限定符 |
^, $, \任何元字符、任何字符 | 定位点和序列(即:位置和顺序) |
| | 替换,"或"操作"字符具有高于替换运算符的优先级,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",请使用括号创建子表达式,从而产生"(m|f)ood"。 |
上面的运算符的优先级由高到低,我们在查看正则表达式的时候
可以按照这个顺序来阅读。
阅读思路
[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?
其中@是邮箱的标识,这里对前后内容进行拆分
[\w!#$%&'*+/=?^`{|}~-]+(?:\.[\w!#%&'*+/=?^`{|}~-]限制字符格式,再拆分
-
\w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'
这个模式可以解释成支持!#$%&'*+/=?^_`{|}~-这些符号外,也支持所有的单词和数字。 -
+ 匹配前面的子表达式一次或多次。
也就代表邮箱的开头必须是数字或限定内的特殊字符 -
(?:pattern) 匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用。
-
* 匹配前面的子表达式零次或多次。
(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*这里可以翻译成支持带/和任何参数
@后面的可以按照这也原理解读。
到这里,运算符的优先级解释也已经结束。多谢大家支持。后面章节会贴出许多常用的正则表达式,供大家学习。