正则表达式的学习与应用场景
在工作中我们经常遇到这样的需求:
1.给你一个字符串,把字符串里面的链接、数字、电话等显示不同的颜色;
2.给你一个包含自定义表情的文字,找出里面的表情,替换成本地的表情图片;
3.根据用户的输入内容,判断是否是微信号、手机号、邮箱、纯数字等;
提示:
对于1和2的情景,我们使用正则表达式+富文本 便可以轻松应对。
对于3,我们只需根据正则表达式的规则,封装好自己的正则库,就可以做到一劳永逸了!
1.什么是正则表达式:
正则表达式,又称正规表示法,是对字符串操作的一种逻辑公式。正则表达式可以检测给定的字符串是否符合我们定义的逻辑,也可以从字符串中获取我们想要的特定部分。它可以迅速地用极简单的方式达到字符串的复杂控制。
2.正则表达式的基本符号:
常用的元字符
. 匹配除换行符外带的任意字符,一个点只能匹配一个
\w 匹配字母数字下划线或者汉字
\s 表示空白字符( space),它和[ \t\n\r]等价(分别是空格制表符换行符回车符)
\d 匹配数字(只能表示一位数字,可以替换为[0-9])
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
\num num是一个正整数,表示num之前的字符重复出现相同的个数,例如(.)\1,表示两个连续的相同字符
常用的反义代码:
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符,和[ \t\n\r]等价,当然,也可以[^\s]
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
^[a-zA-Z]+[a-zA-Z/d-_]{5,19}$
常用的限定符:
* 重复零次或多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
懒惰限定符:
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}重复n到m次,但尽可能少重复
{n,}重复n次以上,但尽可能少重复
[] 表示字符串列举的意思
() 表示分组,就是括号里面的作为一个整体
例如: [abc]表示a或者b或者c,他只能匹配一个
常用模式的列举
[0-9] 表示数字 等价于 \d
[a-z] 表示小写字母
[A-Z]表示大写字母
在列举上面加上^ 即可表示非,比如[^0-9]表示非数字
\D 表示非数字
\w 单词字符[_a-zA-Z0-9]
\W表示非单词字符,除掉字母数字下划线的内容
注意点:
1 可以没有下限,但是不能没有上限!例如 ab{,5}是错误的!(左边为下限,右为上限)
2 转义符\ .和.的区别 . \\.
3 在方括号里面使用”^”表示不希望出现的字符时候,”^”应放在方括号的第一个位置
例如:”%[^a-zA-Z]%”
匹配年月日
(0?[1-9]|[12][0-9]|3[01])[-/.](0?[1-9]|1[012])[-/.](19|20)?\\d\\d
3.正则表达式的使用案例
1.判断一个字符串的长度是符合密码规定:密码(6-18位)
//以前
if(6<=string.length&&string.length<=18){
}
正则
^.{6,18}$
2.固定电话:0区号加八位数字
^0\\d{2}\-?\\d{8}
3.增强的密码:包括一个一个以上的大写字母及小写字母
^.*[A-Z]+.*[a-z]+.*$|^.*[a-z]+.*[a-z]+.*[A-Z]+.*$
当遇到的规则比较多的时候,我们拆分规则,然后分别匹配,例如
- (BOOL)validatePassword
{
NSString * length = @"^\\w{6,18}$"; //长度
NSString * number = @"^\\w*\\d+\\w*$"; //数字
NSString * lower = @"^\\w*[a-z]+\\w*$"; //小写字母
NSString * upper = @"^\\w*[A-Z]+\\w*$"; //大写字母
return [self validateWithRegExp: length] && [self validateWithRegExp: number] && [self validateWithRegExp: lower] && [self validateWithRegExp: upper];
}
在iOS中有三种方式来使用正则表达式:
1.谓词匹配
2.rangeOfString:option
3.使用正则表达式类
下面是三个使用案例:
1.利用NSPredicate(谓词)匹配
匹配邮箱
NSString*email=@“xxxx@163.com”;
NSString*regex =@"[A-Z0-9a-z._%+-]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4}";
NSPredicate*predicate = [NSPredicatepredicateWithFormat:@"SELF MATCHES %@", regex];
BOOLisValid = [predicate evaluateWithObject:email];
2.利用rangeOfString:option:直接查找
NSString*searchText =@"/// xxxxxxt.test";
NSRangerange = [searchText rangeOfString:@"(?:[^,])*\\."options:NSRegularExpressionSearch];
if(range.location!=NSNotFound) {
NSLog(@"%@", [searchText substringWithRange:range]);
}
3.使用正则表达式类
NSString*searchText =@"// xxxxxxt.test";
NSError*error = NULL;
NSRegularExpression*regex = [NSRegularExpressionregularExpressionWithPattern:@"(?:[^,])*\\."options:NSRegularExpressionCaseInsensitiveerror:&error];
NSTextCheckingResult*result = [regex firstMatchInString:searchText options:0range:NSMakeRange(0, [searchText length])];
if(result) {
NSLog(@"%@\n", [searchText substringWithRange:result.range]);
}
正则表达式是很多语言都支持的,并且很多语言之间正则表达式的写法都是通用的,只要你记住这些规则,稍加练习,便可以处理某些问题事半功倍!
另外,推荐一个大牛写的一个处理正则表达式的一个库(RegexKitLite),特别的牛,由于年代久远(7 8年前了),当时写的还仅支持MRC,所以使用的时候要标记一下:-fno-objc-arc