正则的捕获
2017-03-08 本文已影响0人
阿九是只大胖喵
exec
: 正则捕获
每一次捕获的时候,都是先进行默认的匹配,如果没有匹配成功的,捕获的结果是null;只有有匹配的内容,我们才能捕获到,捕获到的内容是一个数组。
捕获的内容格式
- 捕获的内容是一个数组。
数组中的第一项是当前大正则捕获的内容。
index
: 捕获内容在字符串中开始的索引位置。
input
: 捕获的原始字符串。
var reg = /\d+/;
var str = "derrickrose";
var res = reg.exec(str);
console.log(res); // null
var str = "derrick20rose21";
var res = reg.exec(str);
console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
console.log(reg.lastIndex); // 0
// 第二次通过exec捕获的内容还是第一个内容
var res = reg.exec(str);
console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
console.log(reg.lastIndex); // 0, 说明第二次捕获的时候也是从字符串索引0处开始查找的
正则捕获的特点
-
懒惰性 -> 每一次执行exec,只捕获第一个匹配的内容,在不经过任何处理的情况下,在执行多次捕获后,匹配的还是第一个内容。
lastIndex
: 是正则每一次捕获在字符串中开始查找的位置,默认值是0。 - 如何解决懒惰型?-> 在正则的末尾加一个修饰符 "g"。
修饰符: g, i, m:
global(g)
: 全局匹配。
ignoreCase(i)
: 忽略大小写匹配。
multiline(m)
: 多行匹配。
原理: 加了全局修饰符"g",正则每一次捕获结束后,lastIndex的值都变为了最新的值,下一次捕获从最新的位置开始查找,这样就可以把所有需要捕获的内容都获取到了。
var reg = /\d+/g;
var str = "derrick20rose21";
console.log(reg.lastIndex); // 0
console.log(reg.exec(str)); // ["20..
console.log(reg.lastIndex); // 9
console.log(reg.exec(str)); // ["21..
console.log(reg.lastIndex); // 15
console.log(reg.exec(str)); // null
- 自己编写程序,获得正则的所有内容,注意,一定不要忘记加 "g"。
var reg = /\d+/g;
var str = "derrick20rose21";
var ary = [];
var res = reg.exec(str);
while (res) {
ary.push(res[0]);
res = reg.exec(str);
}
console.log(ary);
- 贪婪性:正则每一次捕获都是按照都是按照最长的结果来捕获的,例如2符合正则,20也符合正则,但是默认的捕获的是20。
var reg = /\d+/g; // -> 出现1到第一个0-9之间的数字
var str = "derrick20rose21";
console.log(reg.exec(str)); // ["20".....]
- 如何解决正则的贪婪性 -> 在量词元字符后面添加一个 ? 即可。
? 在正则中有很多的作用:
放在一个普通的元字符后面,代表出现0-1次 /\d?/ 出现0-1次数字 -> 数字可能出现也可能不出现。
放在一个量词元字符后面是取消捕获时候的贪婪性。
var reg = /\d+?/g;
var str = "derrick20rose21";
console.log(reg.exec(str)); // ["2".....]
var ary = [];
var res = reg.exec(str);
while (res) {
ary.push(res[0]);
res = reg.exec(str);
}
console.log(ary);
字符串中的match
方法 -> 把所以和正则匹配的字符都获取到。
var reg = /\d+?/g;
var str = "derrick20rose21";
var ary = str.match(reg);
console.log(ary);
虽然在当前的情况下,match比exec更加简洁,但是match中存在一些自己处理不了的问题: 在分组捕获到情况下,match只能捕获到大正则匹配的内容,而对于小正则捕获的内容是无法获取的。
分组捕获
正则分组:
- 改变优先级
- 分组引用
// \2 代表和第二个分组出现一模一样的内容
// \1 代表和第一个分组出现一模一样的内容
// 一模一样: 和对应的分组中的内容的值都要一样
var reg = /^(\w)\1(\w)\2$/;
console.log(reg.test("zzff")); // -> true
console.log(reg.test("z0f_")); // -> false
-
分组捕获 -> 正则在捕获的时候,不仅仅把大正则匹配的内容捕获到,而且还可以把小分组匹配的内容捕获到。
(?:)
在分组中,?: 的意思是只匹配不捕获。
var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;
var str = "122726188803810391";
console.log(reg.exec(str)); // -> ary = ["122726188803810391",...]
// 数组中的第一项ary[0]: 大正则匹配的内容
// ary[1]: -> 第一个分组捕获的内容
// ary[2]: -> 第二个分组捕获的内容
// ...
console.log(str.match(reg)); // -> match 和 exec获取的结果是一样的
var reg = /derrick(\d+)/g;
var str = "derrick20rose30derrick40";
// 用exec执行三次,每一次不仅仅把大正则匹配的获取到,而且还可以获取第一个分组匹配的内容
console.log(reg.exec(str));
console.log(reg.exec(str));
console.log(reg.exec(str));
// 而match只能捕获大正则匹配的内容
console.log(str.match(reg));