JavaScript 正则表达式 RegExp
2017-11-08 本文已影响53人
sylvia_yue
作为一个用了就忘,再用再看的知识点,仅以此总结表达敬意——to 正则表达式 ( ̄▽ ̄)"
正则表达式——维基百科:
正则表达式(Regular Expression,简写为 regex 、regexp 或 RE),一个正则表达式通常被称为一个模式(pattern),为用来描述或者匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。
正则表达式在线验证工具:https://www.regexpal.com/
1.定义正则表达式
1)直接量语法:/pattern/attributes
2)创建 RegExp 对象的语法:new RegExp(pattern, attributes);
2.参数
- pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
- attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。
3.返回值
new RegExp(pattern); R如果 pattern 是正则表达式而非字符串,则创建一个与指定的 RegExp 模式和标志相同的新的 RegExp 对象;
若不用 new 运算符,而是将 RegExp() 作为函数调用,当 pattern 是正则表达式,它只返回 pattern ,不创建一个新的 RegExp 对象。
4.抛出
SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。
TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
5.修饰符
i 执行对大小写不敏感的匹配。
g 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m 执行多行匹配。
6.方括号——查找某个范围内的字符
[abc] 查找方括号之间的任何字符。(字母、数字、符号、中文均可)
[^abc] 查找任何不在方括号之间的字符。(字母、数字、符号、中文均可)
[0-9] 查找任何从 0 至 9 的数字。
[a-z] 查找任何从小写 a 到小写 z 的字符。
[A-Z] 查找任何从大写 A 到大写 Z 的字符。
[A-z] 查找任何从大写 A 到小写 z 的字符。
[adgk] 查找给定集合内的任何字符。
[^adgk] 查找给定集合外的任何字符。
(red|blue|green) 查找任何指定的选项。(可匹配单词)
7.元字符(Metacharacter)——拥有特殊含义的字符
. 查找单个字符,除了换行和行结束符。
\w 查找单词字符。(数字、字母、下划线)
\W 查找非单词字符。(除数字、字母、下划线的字符,包括中文、特殊符号、空格等)
\d 查找数字。
\D 查找非数字字符。
\s 查找空白字符。
\S 查找非空白字符。
\b 匹配单词边界。
\B 匹配非单词边界。
\0 查找 NUL 字符。
\n 查找换行符。
\f 查找换页符。
\r 查找回车符。
\t 查找制表符。
\v 查找垂直制表符。
\xxx 查找以八进制数 xxx 规定的字符。
\xdd 查找以十六进制数 dd 规定的字符。
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符。
8.量词
n+ => 匹配任何包含至少一个 n 的字符串。
n* => 匹配任何包含零个或多个 n 的字符串。
n? => 匹配任何包含零个或一个 n 的字符串。
n{X} => 匹配包含 X 个 n 的序列的字符串。 a{2} aa
n{X,Y} => 匹配包含 X 至 Y 个 n 的序列的字符串。a{2,4} aa aaa aaaa
n{X,} => 匹配包含至少 X 个 n 的序列的字符串。a{2} aa aaa aaaa aaaaa...
n$ => 匹配任何结尾为 n 的字符串。
^n => 匹配任何开头为 n 的字符串。
?=n => 匹配任何其后紧接指定字符串 n 的字符串。
?!n => 匹配任何其后没有紧接指定字符串 n 的字符串。
9.RegExp 对象属性
global => RegExp 对象是否具有标志 g。 regObj.global
ignoreCase => RegExp 对象是否具有标志 i。 regObj.ignoreCase
lastIndex => 一个整数,标示开始下一次匹配的字符位置。(重要事项:不具有标志 g 和不表示全局模式的 RegExp 对象不能使用 lastIndex 属性。) regObj.lastIndex
multiline => RegExp 对象是否具有标志 m。 regObj.multiline
source => 正则表达式的源文本。 regObj.source => pattern
10.RegExp 对象方法
compile => 编译正则表达式。用于改变 RegExp 对象
exec => 检索字符串中指定的值。返回找到的值,并确定其位置。
test => 检索字符串中指定的值。返回 true 或 false。
11.支持正则表达式的 String 对象的方法
search => 检索与正则表达式相匹配的值。(返回匹配其实值的位置)
match => 找到一个或多个正则表达式的匹配。(返回匹配的值)
replace => 替换与正则表达式匹配的子串。 (返回替换后的整个字符串)
split => 把字符串分割为字符串数组。(separator,howmany) 用separator来分割,
howmany => 定数组最大长度,多余的丢掉,不设置,则不考虑数组长度。
参考:http://www.w3school.com.cn/js/js_obj_regexp.asp
https://zh.wikipedia.org/wiki/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F