I Found You! 正则表达式!
2015-04-05 本文已影响3833人
伯恩的遗产
一、正则表达式的作用:
-
给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”)
-
可以通过正则表达式,从字符串中获取我们想要的特定部分(内容和范围)
二、初窥正则表达式:
问题:判断一个字符串中是否包含字母
-
在使用
正则表达式
之前,我们是这么做的:NSString *string = @"5347858h7"; BOOL flag = YES; for (int i = 0; i<string.length; i++) { unichar c = [string characterAtIndex:i]; if (!(c >= '0' && c <= '9')) { flag = NO; break; } } if (flag) { NSLog(@"不包含字母"); } else { NSLog(@"包含了字母"); }
-
自从有了
正则表达式
,我们是这么做的:NSString *string = @"5347858h7"; NSString *pattern = @"[a-zA-Z]"; NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil]; NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)]; if (results.count = 0) { NSLog(@"不包含字母"); } else { NSLog(@"包含了字母"); }
很好很强大,世界如此美妙!
三、OC中正则表达式的使用步骤:
-
编写正则表达式的样式:
NSString *string = @"5347858h7";
-
初始化正则表达式:
NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil];
-
匹配字符串并返回结果:
NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)];
-
输出结果:
for (NSTextCheckingResult *result in results) { NSLog(@"范围:%@ 结果:%@", NSStringFromRange(result.range), [string substringWithRange:result.range]); }
四、正则表达式语法:
正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。
1.示例
表达式 | 说明 |
---|---|
/^\s*$/ | 匹配空行 |
/\d{2}-\d{5}/ | 验证由两位数字、一个连字符再加 5 位数字组成的 ID 号 |
/<\s(\S+)(\s[^>])?>[\s\S]<\s/\1\s*>/ | 匹配 HTML 标记 |
2.常用字符以及他们的作用
- 元字符
字符 | 说明 |
---|---|
. | 匹配除换行符以外的任意字符 |
\s | 匹配任意的空白符 |
\w | 匹配字母或数字或下划线或汉字 |
\d | 匹配数字 |
\b | 匹配单词的开始或结束 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
- 重复
字符 | 说明 |
---|---|
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
- 字符
字符 | 说明 |
---|---|
[] | 在某个位置匹配方括号里的任意一个字符 |
[a-z] | 在某个位置匹配某个范围的字符 |
按位或字符 | 分支,即“或者” |
() | 括号,用于分组,括号中属于一个整体 |
- 反义字符
字符 | 说明 |
---|---|
\S | 匹配任意不是空白符的字符 |
\W | 匹配任意不是字母,数字,下划线,汉字的字符 |
\D | 匹配任意非数字的字符 |
\B | 匹配不是单词开头或结束的位置 |
[^a] | 匹配除了a以外的任意字符 |
[^abcdef] | 匹配除了abcdef这几个字母以外的任意字符 |
-
贪婪与懒惰
- 贪婪:
当正则表达式中包含能接受重复的限定符时,默认是匹配尽可能多的字符。
例如:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。 -
懒惰:
懒惰匹配,也就是匹配尽可能少的字符。只要在重复字符后面加上一个问号‘?’,就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。
例如:a.*?b,它将匹配最短的以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab(第一到第三个字符)和ab(第四到第五个字符)。
声明:
-
以上内容属于本人整理的笔记,如有错误的地方希望能告诉我,大家共同进步。
-
以上内容有些段落或语句可能是本人从其他地方Copy而来,如有侵权,请及时告诉我。