正则表达式

2019-06-21 本文已影响0人 lyp82nkl

前言

如何学习：30分钟入门正则表达式
本文参（zhao）考（chao）RegExp 对象，该笔记只为速查

定义

正则表达式（regular expression）是用于匹配字符串中字符组合的模式。在 JavaScript中，正则表达式也是对象，其体系参照 Perl 5 建立。

创建正则表达式的方法

使用一个正则表达式字面量

var re = /xxx/

调用 RegExp 对象的构造函数

var re = new RegExp('xxx')

两种方法主要区别是：第一种方法在引擎编译代码时，就会新建正则表达式，第二种方法在运行时新建正则表达式，所以前者的效率较高。而且，前者比较便利和直观，所以实际应用中，基本上都采用字面量定义正则表达式。

正则表达式的实例属性

修饰符（只读）
RegExp.prototype.ignoreCase：返回一个布尔值，表示是否设置了i修饰符。用于忽略字符串大小写。
RegExp.prototype.global：返回一个布尔值，表示是否设置了g修饰符。用于全局匹配。
RegExp.prototype.multiline：返回一个布尔值，表示是否设置了m修饰符。用于设置匹配为多行模式。
其他属性
RegExp.prototype.lastIndex：返回一个数值，表示下一次开始搜索的位置。该属性可读写，但是只在进行连续搜索时有意义，详细介绍请看后文。
RegExp.prototype.source：返回正则表达式的字符串形式（不包括反斜杠），该属性只读。

实例方法

1. RegExp.prototype.test()

test 方法返回布尔值，表示当前模式是否能匹配参数字符串

/a/.test('and') // true

2. RegExp.prototype.exec()

exec方法，用来返回匹配结果
如果发现匹配，就返回一个数组，成员是匹配成功的子字符串，否则返回null

/a/.exec('adbca')

如果正则表示式包含圆括号（即含有“组匹配”），则返回的数组会包括多个成员。第一个成员是整个匹配成功的结果，后面的成员就是圆括号对应的匹配成功的组。也就是说，第二个成员对应第一个括号，第三个成员对应第二个括号，以此类推。整个数组的length属性等于组匹配的数量再加1。

String.prototype.match()：返回一个数组，成员是所有匹配的子字符串。
String.prototype.search()：按照给定的正则表达式进行搜索，返回一个整数，表示匹配开始的位置。
String.prototype.replace()：按照给定的正则表达式进行替换，返回替换后的字符串。
String.prototype.split()：按照给定规则进行字符串分割，返回一个数组，包含分割后的各个成员。

字面量字符和元字符

元字符
点字符（.)

匹配除回车（\r）、换行(\n) 、行分隔符（\u2028）和段分隔符（\u2029）以外的所有字符。
位置字符

^ 表示字符串的开始位置
$ 表示字符串的结束位置

选择符（|）
表示“或关系”
转义符
匹配元字符本身可以在它们前面加反斜杠
构造函数需要两次转义
特殊字符

\cX 表示Ctrl-[X]，其中的X是A-Z之中任一个英文字母，用来匹配控制字符。
[\b] 匹配退格键(U+0008)，不要与\b混淆。
\n 匹配换行键。
\r 匹配回车键。
\t 匹配制表符 tab（U+0009）。
\v 匹配垂直制表符（U+000B）。
\f 匹配换页符（U+000C）。
\0 匹配null字符（U+0000）。
\xhh 匹配一个以两位十六进制数（\x00-\xFF）表示的字符。
\uhhhh 匹配一个以四位十六进制数（\u0000-\uFFFF）表示的 Unicode 字符。

字符类

字符类（class）表示有一系列字符可供选择，只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内，比如[^xyz] 表示x、y、z之中任选一个匹配。

脱字符（^）：需在字符类第一位
表示除了字符类之中的字符，其他字符都可以匹配。只有[^]，就表示匹配一切字符，包括换行符。相比之下，点号作为元字符（.）是不包括换行符的。
连字符（-）

[0-9.,]
[0-9a-fA-F]
[a-zA-Z0-9-]
[1-31] // 不代表1到31，只代表1到3

预定义模式：某些常见模式的简写方式

\d 匹配0-9之间的任一数字，相当于[0-9]。
\D 匹配所有0-9以外的字符，相当于[^0-9]。
\w 匹配任意的字母、数字和下划线，相当于[A-Za-z0-9_]。
\W 除所有字母、数字和下划线以外的字符，相当于[^A-Za-z0-9_]。
\s 匹配空格（包括换行符、制表符、空格符等），相等于[ \t\r\n\v\f]。
\S 匹配非空格的字符，相当于[^ \t\r\n\v\f]。
\b 匹配词的边界。
\B 匹配非词边界，即在词的内部

重复类

模式的精确匹配次数，使用大括号（{}）表示。{n}表示恰好重复n次，{n,}表示至少重复n次，{n,m}表示重复不少于n次，不多于m次。

量词符：设定某个模式出现的次数

? 问号表示某个模式出现0次或1次，等同于{0, 1}。
* 星号表示某个模式出现0次或多次，等同于{0,}。
+ 加号表示某个模式出现1次或多次，等同于{1,}。

贪婪模式

var s = 'aaa';
s.match(/a+/) // ["aaa"]

贪婪模式改为非贪婪模式

*?：表示某个模式出现0次或多次，匹配时采用非贪婪模式。
+?：表示某个模式出现1次或多次，匹配时采用非贪婪模式。

字符串去空格(replace)

var str = '  #id div.class  ';
str.trim() // "#id div.class"
str.replace(/^\s+|\s+$/g, '') // "#id div.class"
$&：匹配的子字符串。
$`：匹配结果前面的文本。
$’：匹配结果后面的文本。
$n：匹配成功的第n组内容，n是从1开始的自然数。
$$：指代美元符号$。

正则表达式题目

题目1： \d，\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?

下面是一些常见的元字符：

. 匹配除 \n 以外的任何字符（注意元字符是小数点）。
[abcde] 匹配 abcde 之中的任意一个字符
[a-h] 匹配 a 到 h 之间的任意一个字符
[^fgh] 不与 fgh 之中的任意一个字符匹配
\w 匹配大小写英文字符及数字 0 到 9 之间的任意一个及下划线，相当于 [a-zA-Z0-9_]
\W 不匹配大小写英文字符及数字 0 到 9 之间的任意一个，相当于 [^a-zA-Z0-9_]
\s 匹配任何空白字符，相当于 [ \f\n\r\t\v]
\S 匹配任何非空白字符，相当于 [^\s]
\d 匹配任何 0 到 9 之间的单个数字，相当于 [0-9]
\D 不匹配任何 0 到 9 之间的单个数字，相当于 [^0-9]
[\u4e00-\u9fa5] 匹配任意单个汉字（这里用的是 Unicode 编码表示汉字的 )

下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数，并且 0<n<m) ：

*匹配 0 到多个元字符，相当于 {0,}
? 匹配 0 到 1 个元字符，相当于 {0,1}
{n} 匹配 n 个元字符
{n,} 匹配至少 n 个元字符
{n,m} 匹配 n 到 m 个元字符
+匹配至少 1 个元字符，相当于 {1,}
\b 匹配单词边界
^ 字符串必须以指定的字符开始
$ 字符串必须以指定的字符结束

[a-zA-Z0-9] 包含所有英文小写字母a-z和大写字母A-Z，以及数字0-9
x{3} 量词，表示x出现3次

题目2：写一个函数trim(str)，去除字符串两边的空白字符

function trim(str){
   if(typeof str === 'string'){
    return str.replace(/^\s+|\s+$/g,'');
}else{
   return '不是字符串';
}
}

题目3：写一个函数isEmail(str)，判断用户输入的是不是邮箱

function isEmail(str){
   var email = /^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/；
   return email.test(str);
}

题目4：写一个函数isPhoneNum(str)，判断用户输入的是不是手机号

 function isPhoneNum(str){
   var num = /^1[0-9]{10}$/;
   return num.test(str);
}

题目5：写一个函数isValidUsername(str)，判断用户输入的是不是合法的用户名（长度6-20个字符，只能包括字母、数字、下划线）

function isVaildUsername(str){
 return /^\w{6,20}$/.test(str);
}

题目6：写一个函数isValidPassword(str), 判断用户输入的是不是合法密码（长度6-20个字符，只包括大写字母、小写字母、数字、下划线，且至少至少包括两种）

function isValidPassword(str){
if(!/^\w{6,20}$/.test(str)){
        return false;
}
if(/^\d{6,20}$/.test(str)){
    return false;
}
if(/^[a-z]{6,20}$/.test(str)){
    return false;
}
if(/^[A-Z]{6,20}$/.test(str)){
    return false;
}
if(/^_{6,20}$/.test(str)){
    return false;
}
return true;
}

题目7：写一个正则表达式，得到如下字符串里所有的颜色

var reg = /#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})(?=;)/g;
var subj = "color: #121212; background-color: #AA00ef;     width: 12px; bad-colors: f#fddee "
console.log( subj.match(re) )  // ['#121212', '#AA00ef']

题目8：下面代码输出什么? 为什么? 改写代码，让其输出[""hunger"", ""world""]

var str = 'hello  "hunger" , hello "world"';
var pat =  /".*"/g;
str.match(pat);

意思是：匹配以"开头"结束，且引号中为任意个除换行符和回车以外的任意字符，全局匹配。
默认是贪婪模式，会尽可能多匹配，所以结果为

[""hunger" , hello "world""]

而要想得到[""hunger"", ""world""]的结果可以将正则改为如下代码：
可以加上？变成非贪婪模式尽可能少匹配

 var pat =  /".*?"/g;

正则表达式

前言

定义

创建正则表达式的方法

正则表达式的实例属性

实例方法

1. RegExp.prototype.test()

2. RegExp.prototype.exec()

字面量字符和元字符

字符类

预定义模式：某些常见模式的简写方式

重复类

量词符：设定某个模式出现的次数

贪婪模式

贪婪模式改为非贪婪模式

字符串去空格(replace)

正则表达式题目

题目1： \d，\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?

下面是一些常见的元字符：

下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数，并且 0<n<m) ：

题目2：写一个函数trim(str)，去除字符串两边的空白字符

题目3：写一个函数isEmail(str)，判断用户输入的是不是邮箱

题目4：写一个函数isPhoneNum(str)，判断用户输入的是不是手机号

题目5：写一个函数isValidUsername(str)，判断用户输入的是不是合法的用户名（长度6-20个字符，只能包括字母、数字、下划线）

题目6：写一个函数isValidPassword(str), 判断用户输入的是不是合法密码（长度6-20个字符，只包括大写字母、小写字母、数字、下划线，且至少至少包括两种）

题目7：写一个正则表达式，得到如下字符串里所有的颜色

题目8：下面代码输出什么? 为什么? 改写代码，让其输出[""hunger"", ""world""]

猜你喜欢

热点阅读

正则表达式

前言

定义

创建正则表达式的方法

正则表达式的实例属性

实例方法

1. RegExp.prototype.test()

2. RegExp.prototype.exec()

字面量字符和元字符

字符类

预定义模式：某些常见模式的简写方式

重复类

量词符：设定某个模式出现的次数

贪婪模式

贪婪模式改为非贪婪模式

字符串去空格(replace)

正则表达式题目

题目1： \d，\w,\s,[a-zA-Z0-9],\b,.,*,+,?,x{3},^,$分别是什么?

下面是一些常见的元字符：

下面是一些常见的限定符 ( 下表中 n 和 m 都是表示整数，并且 0<n<m) ：

题目2： 写一个函数trim(str)，去除字符串两边的空白字符

题目3： 写一个函数isEmail(str)，判断用户输入的是不是邮箱

题目4： 写一个函数isPhoneNum(str)，判断用户输入的是不是手机号

题目5： 写一个函数isValidUsername(str)，判断用户输入的是不是合法的用户名（长度6-20个字符，只能包括字母、数字、下划线）

题目6： 写一个函数isValidPassword(str), 判断用户输入的是不是合法密码（长度6-20个字符，只包括大写字母、小写字母、数字、下划线，且至少至少包括两种）

题目7： 写一个正则表达式，得到如下字符串里所有的颜色

题目8： 下面代码输出什么? 为什么? 改写代码，让其输出[""hunger"", ""world""]

猜你喜欢

热点阅读

题目2：写一个函数trim(str)，去除字符串两边的空白字符

题目3：写一个函数isEmail(str)，判断用户输入的是不是邮箱

题目4：写一个函数isPhoneNum(str)，判断用户输入的是不是手机号

题目5：写一个函数isValidUsername(str)，判断用户输入的是不是合法的用户名（长度6-20个字符，只能包括字母、数字、下划线）

题目6：写一个函数isValidPassword(str), 判断用户输入的是不是合法密码（长度6-20个字符，只包括大写字母、小写字母、数字、下划线，且至少至少包括两种）

题目7：写一个正则表达式，得到如下字符串里所有的颜色

题目8：下面代码输出什么? 为什么? 改写代码，让其输出[""hunger"", ""world""]