2023-02-23 js中正则表达式的贪婪模式和惰性模式
2023-02-22 本文已影响0人
追寻1989
贪婪模式——在匹配成功的前提下,尽可能多的去匹配
惰性模式——在匹配成功的前提下,尽可能少的去匹配
使用正则表达式中的贪婪、惰性的量词可以控制表达式匹配过程,我们知道量词?、*、+的意义,可以指定相关模式出现的次数,默认的情况下我们使用的是贪婪量词,它的匹配过程是从整个字符串开始查看,如果不匹配就去掉最后一个,再看看是否匹配,如此循环一直到匹配或字符串空为止,如:
str = "abbbaabbbaaabbb1234";
reg = /.*bbb/g;//*是贪婪量词
reg.test(str);
这个匹配过程将从整个字符串开始:
reg.test("abbbaabbbaaabbb1234");//false ,则去掉最后一个字符4再继续
reg.test("abbbaabbbaaabbb123");//false ,则去掉最后一个字符3再继续
reg.test("abbbaabbbaaabbb12");//false ,则去掉最后一个字符2再继续
reg.test("abbbaabbbaaabbb1");//false ,则去掉最后一个字符1再继续
reg.test("abbbaabbbaaabbb");//true ,结束
// 因此
str.match(reg); // ['abbbaabbbaaabbb']
在贪婪量词的后面加多一个?就变成了惰性量词,它的匹配过程相反,是从前面第一个开始,不匹配则加一个,如此循环直到字符串结束,以上面的为例子。
str = "abbbaabbbaaabbb1234";
reg = /.*?bbb/g;//*?是惰性量词
reg.test(str);
它的匹配过程如下:
reg.test("a");//false, 再加一个
reg.test("ab");//false, 再加一个
reg.test("abb");//false, 再加一个
reg.test("abbb");//true, 匹配了,保存这个结果,再从下一个开始
reg.test("a");//false, 再加一个
reg.test("aa");//false, 再加一个
reg.test("aab");//false, 再加一个
reg.test("aabb");//false, 再加一个
reg.test("aabbb");//true, 匹配了,保存这个结果,再从下一个开始
...
// 因此
str.match(reg); // ['abbb', 'aabbb', 'aaabbb']
加深印象,再来个示例剖析:
- 贪婪模式
str = "abbb{{aabbb}}aaa{{bbb}}1234";
reg = /{{(.*)}}/g;
str.match(reg); // ['{{aabbb}}aaa{{bbb}}']
它的匹配过程如下:
// 匹配左侧 {{
reg.test("abbb{{aabbb}}aaa{{bbb}}1234");//false ,则去掉第一个字符a再继续
reg.test("bbb{{aabbb}}aaa{{bbb}}1234");//false ,则去掉第一个字符b再继续
reg.test("bb{{aabbb}}aaa{{bbb}}1234");//false ,则去掉第一个字符b再继续
reg.test("b{{aabbb}}aaa{{bbb}}1234");//false ,则去掉第一个字符b再继续
reg.test("{{aabbb}}aaa{{bbb}}1234");//false ,已满足左侧条件但还不满足右侧条件,继续匹配
// 匹配右侧 }}
reg.test("abbb{{aabbb}}aaa{{bbb}}1234");//false ,则去掉最后一个字符4再继续
reg.test("abbb{{aabbb}}aaa{{bbb}}123");//false ,则去掉最后一个字符3再继续
reg.test("abbb{{aabbb}}aaa{{bbb}}12");//false ,则去掉最后一个字符2再继续
reg.test("abbb{{aabbb}}aaa{{bbb}}1");//false ,则去掉最后一个字符1再继续
reg.test("abbb{{aabbb}}aaa{{bbb}}");//true ,满足右侧条件,保存满足两个条件区间的 {{aabbb}}aaa{{bbb}} 这个结果,结束
// 因此
str.match(reg); // ['{{aabbb}}aaa{{bbb}}']
- 惰性模式
str = "abbb{{aabbb}}aaa{{bbb}}1234";
reg = /{{(.*)}}/g;
str.match(reg); // ['{{aabbb}}aaa{{bbb}}']
它的匹配过程如下:
reg.test("a");// false, 再加一个
reg.test("ab");// false, 再加一个
reg.test("abb");// false, 再加一个
reg.test("abbb");// false, 再加一个
reg.test("abbb{");// false, 再加一个
reg.test("abbb{{");// false, 已满足左侧条件但还不满足右侧条件,再加一个
reg.test("abbb{{a");// false, 再加一个
reg.test("abbb{{aa");// false, 再加一个
reg.test("abbb{{aab");// false, 再加一个
reg.test("abbb{{aabb");// false, 再加一个
reg.test("abbb{{aabbb");//false, 再加一个
reg.test("abbb{{aabbb}");// false, 再加一个
reg.test("abbb{{aabbb}}");// true,满足右侧条件,保存满足两个条件区间的 {{aabbb}} 这个结果,再从下一个开始
reg.test("a");//false, 再加一个
reg.test("aa");//false, 再加一个
reg.test("aaa");//false, 再加一个
reg.test("aaa{");//false, 再加一个
reg.test("aaa{{");//false, 已满足左侧条件但还不满足右侧条件,再加一个
reg.test("aaa{{b");//false, 再加一个
reg.test("aaa{{bb");//false, 再加一个
reg.test("aaa{{bbb");//false, 再加一个
reg.test("aaa{{bbb}");//false, 再加一个
reg.test("aaa{{bbb}}");// true,满足右侧条件,保存满足两个条件区间的 {{bbb}} 这个结果,再从下一个开始
...依次推类
// 因此
str.match(reg); // ['{{aabbb}}', '{{bbb}}']
贪婪与惰性模式区别如下:
一、从语法角度看
贪婪模式用于匹配优先量词修饰的子表达式,匹配优先量词包括:{m,n}
、{m,}
、?
、*
和 +
。
惰性模式用于匹配忽略优先量词修饰子表达式,匹配忽略优先量词包括:{m,n}?
、{m,}?
、??
、*?
和 +?
。
二、从应用角度看
两者均影响被量词修饰的子表达式匹配行为,贪婪模式在匹配成功的前提下尽可能多地匹配,而惰性模式则在匹配成功的前提下尽可能少匹配。惰性模式只被部分NFA引擎支持。
三、从匹配原理看
能达到同样匹配结果的情况下,通常贪婪模式效率较高。
惰性模式都可通过修改量词修饰的子表达式转换为贪婪模式。
贪婪模式可以与固化分组结合,提升匹配效率,而惰性模式不行。