JavaScript RegExp 对象
一、匹配规则
1).
可以匹配任意字符,即'js.'
可以匹配'jsp'
/'jsx'
/'js!'
2)\d
可以匹配一个数字,即'00\d'
可以'007'
,但无法匹配'00A'
'\d\d\d'
可以匹配'010'
3)\w
可以匹配一个字母或者数字,即'\w\w'
可以匹配'js'
4)\s
表示空白字符
)\S
表示非空白字符
)\t
表示制表符
)\r
表示回车符
4)*
表示任意个字符(包括0个)
5)+
表示至少一个字符
6)用?
表示0个或1个字符
7)用{n}表示n个字符
8)用{n,m}表示n-m个字符
二、案例分析
分析一:
\d{3}\s+\d{3,8}
\d{3}
表示匹配3个数字,例如'010'
\s+
表示匹配至少一个空白字符,例如 ''
/'\t\t'
等
\d{3,8}
表示匹配3到8个数字,例如 '1234567'
综合起来,上面的正则表达式可以匹配以任意个空格隔开的带区号的电话号码;
\d{3}\-\d\{3,8}
可以匹配'010-12345'
这样的号码,由于'-'
是特殊字符,需要用\
转义
分析二:
[0-9a-zA-Z\_]
可以匹配一个数字、字母或者下划线;
[0-9a-zA-Z\_]+
可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'a100'
,'0_Z'
,'js2015'
[a-zA-Z\_\$][0-9a-zA-Z\_\$]*
可以匹配由字母或下划线、$开头,后接任意个由一个数字、字母或者下划线、$组成的字符串,也就是JavaScript允许的变量名
[a-zA-Z\_\$][0-9a-zA-Z\_\$]{0,19}
更加精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)
A|B
可以匹配A或B,所以(J|j)ava(S|s)cript
可以匹配JavaScript
,Javascript
,javaScript
或者javaScript
^
表示行的开头,^\d
表示必须以数字开头
$
表示行的结束,\d$
表示必须以数字结束,^js$
变成了整行匹配,只能匹配js
RegExp
创建正则表达式的方法:
1)使用/正则表达式/写出来;
2)通过new RegExp('正则表达式')创建一个RegExp对象;
var re1 = /ABC\-001/;
var re2 = new RegExp(/ABC\\-001/);
console.log(re1); // /ABC\-001/
console.log(re2); // /ABC\\-001/
test()方法
// test()方法用于测试给定的字符串是否符合条件
var re = /^\d{3}\-\d{3,8}$/;
console.log(re.test('010-12345')); // true
console.log(re.test('010-1234x')); // false
console.log(re.test('010 12345')); // false
切分字符串split
var str1 = 'a b c';
var str2 = 'a,b c';
var str3 = 'a,b;;c d';
console.log(str1.split(' ')); // ["a", "b", "", "", "c"]
console.log(str1.split(/\s+/)); // ["a", "b", "c"]
console.log(str2.split(/[\s\,]+/)); // ["a", "b", "c"]
console.log(str3.split(/[\s\,\;]+/)); // ["a", "b", "c", "d"]
分组exec
如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来,exec()方法在匹配成功后,会返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串;exec()方法在匹配失败时会返回null;
var re = /^(\d{3})-(\d{3,8})$/;
console.log(re.exec('010-12345')); // ['010-12345', '010', '12345']
console.log(re.exec('010 12345')); // null
贪婪匹配 +?
正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符;
// \d+采用贪婪匹配,直接把后面的0全部匹配了,结果0*只能匹配空字符串了
var re = /^(\d+)(0*)$/;
console.log(re.exec('102300')); // ['102300', '102300', '']
// 让\d+采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0匹配出来,加个?就可以让\d+采用非贪婪匹配
var re = /^(\d+?)(0*)$/;
console.log(re.exec('102300')); // ['102300', '1023', '00']
全局搜索 g
var r1 = /test/g;
// 等价于:
var r2 = new RegExp('test', 'g');
var s = 'JavaScript, VBScript, JScript and ECMAScript';
var re=/[a-zA-Z]+Script/g;
// 使用全局匹配:
re.exec(s); // ['JavaScript']
re.lastIndex; // 10
re.exec(s); // ['VBScript']
re.lastIndex; // 20
re.exec(s); // ['JScript']
re.lastIndex; // 29
re.exec(s); // ['ECMAScript']
re.lastIndex; // 44
re.exec(s); // null,直到结束仍没有匹配到
search() 方法
用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串;返回第一个与 regexp 相匹配的子串的起始位置,如果没有找到任何匹配的子串,则返回 -1,默认不执行全局匹配;
match() 方法
找到一个或多个与 regexp 匹配的方法,但这个方法在很大程序上有赖于 regexp 是否有标志g,如果没有标志g,那么match() 方法就只能执行一次匹配,如果没有找到任何匹配的广本,match() 方法将返回null;
如果有标志g,则 match() 方法将执行全局检索,找到所有匹配子字符串,若没有找到任何匹配的子串,则返回 null;
replace()方法
如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串,否则,它只替换第一个匹配子串;
name = '"a", "b"';
document.write(name.replace(/"([^"]*)"/g, "'$1'")); // 'a','b'