正则-捕获及其特性

2019-06-14  本文已影响0人  子心_

正则捕获 ->exec
每一次捕获的时候都是先进行默认的匹配,如果没有匹配成功的,捕获的结果是null;只有匹配的内容我们才能捕获到。
捕获的内容格式:捕获到的内容是一个数组,数组中的第一项是当前大正则捕获的内容,index捕获的内容在字符串中开始的索引位置,input是捕获的原始字符串

var reg = /\d+/;
var str = "chuanga2018xxiyun2019";
var res = reg.exec(str);
console.log(res); //-> ["2018", index: 7, input: "chuanga2018xxiyun2019"]

正则捕获的特点:

1)懒惰性:每一次执行exec只捕获第一个匹配的内容,在不进行任何处理的情况下,再执行多次捕获,捕获的还是第一个匹配的内容。
lastIndex:是正则每一次捕获在字符串中开始查找的位置,默认值是0

var reg = /\d+/;
var str = "xunyuna2019najy2011";
console.log(res.lastIndex); //-> 0
var res = reg.exec(str);
console.log(res); 
// -> ["2019", index: 7, input: "xunyuna2019najy2011"]

2)贪婪性:正则的每一次捕获都是按照匹配最长的结果捕获的,例如:2符合正则2018页符合正则,我们默认捕获的是2018

var reg = /\d+/g; // 出现一到多个0-9之间的数字
var str = "xunyuna2019najy2011muyang2099";
console.log(reg.exec(str)); //-> ["2019"...]

自己编写程序获取正则捕获的所有内容(一定不要忘记加g)

var reg = /\d+/g;
var str = "xunyuna2019najy2011muyang2099";
var ary = [];
var res = reg.exec(str);
while(res) {
  ary.push(res[0]);
  res = reg.exec(str)
}
console.log(ary);

解决正则捕获的问题

1)解决正则捕获的懒惰性:在正则的末尾加一个修饰符“g”

global(g): 全局匹配
ignoreCase(i): 忽略大小写匹配
multiline(m): 多行匹配
var reg = /\d+/g;
var str = "xunyuna2019najy2011muyang2099"
console.log(reg.lastIndex); //-> 0
console.log(reg.exec(str)); //-> ["2019", index: 7, input: "xunyuna2019najy2011muyang2099", groups: undefined]
console.log(reg.lastIndex); // -> 11
console.log(reg.exec(str)); // -> ["2011", index: 15, input: "xunyuna2019najy2011muyang2099", groups: undefined]

原理:加了全局修饰符g,正则每一次捕获结束后,我们的lastIndex的值都变为了最新的值,下一次捕获从最新的位置开始查找,这样就可以把所有需要捕获的内容都捕获到了。

2)解决正则捕获的贪婪性->在量词元字符后面添加一个?即可

?在正则中有很多作用:
    1. 放在一个普通的元字符后面代表0-1次 /\d?/->一个数字可能出现也可能不出现
    2. 放在一个量词的元字符后面是取消捕获时的贪婪性

var reg = /\d+?/g;
var str = "xunyuna2019najy2011muyang2099";
console.log(reg.exec(str)); //-> [""2", index: 7, input: "xunyuna2019najy2011muyang2099", groups: undefined"]

var ary = [], res = reg.exec(str);
while (res) {
  ary.push(res[0]);
  res = reg.exec(str);
}
console.log(ary);
//["0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]
若没有第一步的console.log(reg.exec(str)); 将打印出["2","0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]

字符串中的match方法->把所有和正则匹配的字符都获取到

var reg = /\d+?/g;
var str = "xunyuna2019najy2011muyang2099";
var ary = str.match(reg);
console.log(ary);
// ["2", "0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]

注意:虽然在当前的情况下match比我们的exec更加的简便一点,但是match中存在一些自己处理不了的问题:在分组捕获的情况下,match只能捕获到大正则匹配的内容,而对于小正则捕获的内容是无法获取的。

上一篇下一篇

猜你喜欢

热点阅读