正则-捕获及其特性

2019-06-14 本文已影响0人子心_

正则捕获 ->exec
每一次捕获的时候都是先进行默认的匹配，如果没有匹配成功的，捕获的结果是null；只有匹配的内容我们才能捕获到。
捕获的内容格式：捕获到的内容是一个数组，数组中的第一项是当前大正则捕获的内容，index捕获的内容在字符串中开始的索引位置，input是捕获的原始字符串

var reg = /\d+/;
var str = "chuanga2018xxiyun2019";
var res = reg.exec(str);
console.log(res); //-> ["2018", index: 7, input: "chuanga2018xxiyun2019"]

正则捕获的特点：

1）懒惰性：每一次执行exec只捕获第一个匹配的内容，在不进行任何处理的情况下，再执行多次捕获，捕获的还是第一个匹配的内容。
lastIndex:是正则每一次捕获在字符串中开始查找的位置，默认值是0

var reg = /\d+/;
var str = "xunyuna2019najy2011";
console.log(res.lastIndex); //-> 0
var res = reg.exec(str);
console.log(res); 
// -> ["2019", index: 7, input: "xunyuna2019najy2011"]

2）贪婪性：正则的每一次捕获都是按照匹配最长的结果捕获的，例如：2符合正则2018页符合正则，我们默认捕获的是2018

var reg = /\d+/g; // 出现一到多个0-9之间的数字
var str = "xunyuna2019najy2011muyang2099";
console.log(reg.exec(str)); //-> ["2019"...]

自己编写程序获取正则捕获的所有内容（一定不要忘记加g）

var reg = /\d+/g;
var str = "xunyuna2019najy2011muyang2099";
var ary = [];
var res = reg.exec(str);
while(res) {
  ary.push(res[0]);
  res = reg.exec(str)
}
console.log(ary);

解决正则捕获的问题

1）解决正则捕获的懒惰性：在正则的末尾加一个修饰符“g”

global(g): 全局匹配
ignoreCase(i): 忽略大小写匹配
multiline(m): 多行匹配
var reg = /\d+/g;
var str = "xunyuna2019najy2011muyang2099"
console.log(reg.lastIndex); //-> 0
console.log(reg.exec(str)); //-> ["2019", index: 7, input: "xunyuna2019najy2011muyang2099", groups: undefined]
console.log(reg.lastIndex); // -> 11
console.log(reg.exec(str)); // -> ["2011", index: 15, input: "xunyuna2019najy2011muyang2099", groups: undefined]

原理：加了全局修饰符g，正则每一次捕获结束后，我们的lastIndex的值都变为了最新的值，下一次捕获从最新的位置开始查找，这样就可以把所有需要捕获的内容都捕获到了。

2）解决正则捕获的贪婪性->在量词元字符后面添加一个?即可

?在正则中有很多作用：
1. 放在一个普通的元字符后面代表0-1次 /\d?/->一个数字可能出现也可能不出现
2. 放在一个量词的元字符后面是取消捕获时的贪婪性

var reg = /\d+?/g;
var str = "xunyuna2019najy2011muyang2099";
console.log(reg.exec(str)); //-> [""2", index: 7, input: "xunyuna2019najy2011muyang2099", groups: undefined"]

var ary = [], res = reg.exec(str);
while (res) {
  ary.push(res[0]);
  res = reg.exec(str);
}
console.log(ary);
//["0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]
若没有第一步的console.log(reg.exec(str)); 将打印出["2","0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]

字符串中的match方法->把所有和正则匹配的字符都获取到

var reg = /\d+?/g;
var str = "xunyuna2019najy2011muyang2099";
var ary = str.match(reg);
console.log(ary);
// ["2", "0", "1", "9", "2", "0", "1", "1", "2", "0", "9", "9"]

注意：虽然在当前的情况下match比我们的exec更加的简便一点，但是match中存在一些自己处理不了的问题：在分组捕获的情况下，match只能捕获到大正则匹配的内容，而对于小正则捕获的内容是无法获取的。