I Found You! 正则表达式!

2015-04-05 本文已影响3833人伯恩的遗产

一、正则表达式的作用：

给定的字符串是否符合正则表达式的过滤逻辑（称作“匹配”）
可以通过正则表达式，从字符串中获取我们想要的特定部分(内容和范围)

二、初窥正则表达式：

问题：判断一个字符串中是否包含字母

在使用正则表达式之前，我们是这么做的：

NSString *string = @"5347858h7";
    
BOOL flag = YES;
for (int i = 0; i<string.length; i++) {
   unichar c = [string characterAtIndex:i];
   if (!(c >= '0' && c <= '9')) {
       flag = NO;
       break;
   }
}
    
if (flag) {
   NSLog(@"不包含字母");
} else {
   NSLog(@"包含了字母");
}

自从有了正则表达式，我们是这么做的：

NSString *string = @"5347858h7";

NSString *pattern = @"[a-zA-Z]";
NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil];

NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)];

if (results.count = 0) {
   NSLog(@"不包含字母");
} else {
   NSLog(@"包含了字母");
}

很好很强大，世界如此美妙！

三、OC中正则表达式的使用步骤：

编写正则表达式的样式：
```
NSString *string = @"5347858h7";    
```

初始化正则表达式：

NSRegularExpression *regex = [[NSRegularExpression alloc] initWithPattern:pattern options:0 error:nil];

匹配字符串并返回结果：

NSArray *results = [regex matchesInString:string options:0 range:NSMakeRange(0, string.length)];

输出结果：

for (NSTextCheckingResult *result in results) {
    NSLog(@"范围：%@ 结果：%@", NSStringFromRange(result.range), [string substringWithRange:result.range]);
}

四、正则表达式语法：

正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。

1.示例

表达式	说明
/^\s*$/	匹配空行
/\d{2}-\d{5}/	验证由两位数字、一个连字符再加 5 位数字组成的 ID 号
/<\s(\S+)(\s[^>])?>[\s\S]<\s/\1\s*>/	匹配 HTML 标记

2.常用字符以及他们的作用

元字符

字符	说明
.	匹配除换行符以外的任意字符
\s	匹配任意的空白符
\w	匹配字母或数字或下划线或汉字
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束

重复

字符	说明
*	重复零次或更多次
+	重复一次或更多次
？	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

字符

字符	说明
[]	在某个位置匹配方括号里的任意一个字符
[a-z]	在某个位置匹配某个范围的字符
按位或字符	分支，即“或者”
()	括号，用于分组，括号中属于一个整体

反义字符

字符	说明
\S	匹配任意不是空白符的字符
\W	匹配任意不是字母，数字，下划线，汉字的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[^a]	匹配除了a以外的任意字符
[^abcdef]	匹配除了abcdef这几个字母以外的任意字符

贪婪与懒惰
- 贪婪：
当正则表达式中包含能接受重复的限定符时，默认是匹配尽可能多的字符。
例如：a.*b，它将会匹配最长的以a开始，以b结束的字符串。如果用它来搜索aabab的话，它会匹配整个字符串aabab。这被称为贪婪匹配。
懒惰：

懒惰匹配，也就是匹配尽可能少的字符。只要在重复字符后面加上一个问号‘?’，就意味着匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。
例如：a.*?b，它将匹配最短的以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab（第一到第三个字符）和ab（第四到第五个字符）。

声明：

以上内容属于本人整理的笔记，如有错误的地方希望能告诉我，大家共同进步。
以上内容有些段落或语句可能是本人从其他地方Copy而来，如有侵权，请及时告诉我。

I Found You! 正则表达式!

一、正则表达式的作用：

二、初窥正则表达式：

三、OC中正则表达式的使用步骤：

四、正则表达式语法：

声明：

猜你喜欢

热点阅读