正则的捕获

2017-03-08  本文已影响0人  阿九是只大胖喵

exec: 正则捕获
每一次捕获的时候,都是先进行默认的匹配,如果没有匹配成功的,捕获的结果是null;只有有匹配的内容,我们才能捕获到,捕获到的内容是一个数组。

捕获的内容格式

  1. 捕获的内容是一个数组。
    数组中的第一项是当前大正则捕获的内容。
    index: 捕获内容在字符串中开始的索引位置。
    input: 捕获的原始字符串。
    var reg = /\d+/;
    var str = "derrickrose";
    var res = reg.exec(str);
    console.log(res); // null

    var str = "derrick20rose21";
    var res = reg.exec(str);
    console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
    console.log(reg.lastIndex); // 0

    // 第二次通过exec捕获的内容还是第一个内容
    var res = reg.exec(str);
    console.log(res); // [0:"20", index:7, input: "derrick20rose21"]
    console.log(reg.lastIndex); // 0, 说明第二次捕获的时候也是从字符串索引0处开始查找的

正则捕获的特点

  1. 懒惰性 -> 每一次执行exec,只捕获第一个匹配的内容,在不经过任何处理的情况下,在执行多次捕获后,匹配的还是第一个内容。
    lastIndex: 是正则每一次捕获在字符串中开始查找的位置,默认值是0。
  2. 如何解决懒惰型?-> 在正则的末尾加一个修饰符 "g"。
    修饰符: g, i, m:
    global(g): 全局匹配。
    ignoreCase(i): 忽略大小写匹配。
    multiline(m): 多行匹配。

原理: 加了全局修饰符"g",正则每一次捕获结束后,lastIndex的值都变为了最新的值,下一次捕获从最新的位置开始查找,这样就可以把所有需要捕获的内容都获取到了。

    var reg = /\d+/g;
    var str = "derrick20rose21";

    console.log(reg.lastIndex); // 0
    console.log(reg.exec(str)); // ["20..
    console.log(reg.lastIndex); // 9
    console.log(reg.exec(str)); // ["21..
    console.log(reg.lastIndex); // 15
    console.log(reg.exec(str)); // null
  1. 自己编写程序,获得正则的所有内容,注意,一定不要忘记加 "g"。
    var reg = /\d+/g;
    var str = "derrick20rose21";
    var ary = [];
    var res = reg.exec(str);
    while (res) {
        ary.push(res[0]);
        res = reg.exec(str);
    }
    console.log(ary);
  1. 贪婪性:正则每一次捕获都是按照都是按照最长的结果来捕获的,例如2符合正则,20也符合正则,但是默认的捕获的是20。
    var reg = /\d+/g; // -> 出现1到第一个0-9之间的数字
    var str = "derrick20rose21";
    console.log(reg.exec(str)); // ["20".....]
  1. 如何解决正则的贪婪性 -> 在量词元字符后面添加一个 ? 即可。
    ? 在正则中有很多的作用:
    放在一个普通的元字符后面,代表出现0-1次 /\d?/ 出现0-1次数字 -> 数字可能出现也可能不出现。
    放在一个量词元字符后面是取消捕获时候的贪婪性。
    var reg = /\d+?/g;
    var str = "derrick20rose21";
    console.log(reg.exec(str)); // ["2".....]
    var ary = [];
    var res = reg.exec(str);
    while (res) {
        ary.push(res[0]);
        res = reg.exec(str);
    }
    console.log(ary);

字符串中的match方法 -> 把所以和正则匹配的字符都获取到。

    var reg = /\d+?/g;
    var str = "derrick20rose21";
    var ary = str.match(reg);
    console.log(ary);

虽然在当前的情况下,match比exec更加简洁,但是match中存在一些自己处理不了的问题: 在分组捕获到情况下,match只能捕获到大正则匹配的内容,而对于小正则捕获的内容是无法获取的。


分组捕获
正则分组:

  1. 改变优先级
  2. 分组引用
    // \2 代表和第二个分组出现一模一样的内容
    // \1 代表和第一个分组出现一模一样的内容
    // 一模一样: 和对应的分组中的内容的值都要一样
    var reg = /^(\w)\1(\w)\2$/;
    console.log(reg.test("zzff")); // -> true
    console.log(reg.test("z0f_")); // -> false
  1. 分组捕获 -> 正则在捕获的时候,不仅仅把大正则匹配的内容捕获到,而且还可以把小分组匹配的内容捕获到。
    (?:) 在分组中,?: 的意思是只匹配不捕获。
    var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;
    var str = "122726188803810391";
    console.log(reg.exec(str)); // -> ary = ["122726188803810391",...]
    // 数组中的第一项ary[0]: 大正则匹配的内容
    // ary[1]: -> 第一个分组捕获的内容
    // ary[2]: -> 第二个分组捕获的内容
    // ...
    console.log(str.match(reg)); // -> match 和 exec获取的结果是一样的

    var reg = /derrick(\d+)/g;
    var str = "derrick20rose30derrick40";
    // 用exec执行三次,每一次不仅仅把大正则匹配的获取到,而且还可以获取第一个分组匹配的内容
    console.log(reg.exec(str));
    console.log(reg.exec(str));
    console.log(reg.exec(str));

    // 而match只能捕获大正则匹配的内容
    console.log(str.match(reg));
上一篇下一篇

猜你喜欢

热点阅读