新人第005天---正则表达式
正则表达式是个好东西,在匹配文档过程中很有效,所以花了点时间学习了一下。做一些笔记。
https://deerchao.net/tutorials/regex/regex.htm#howtouse
这篇写的好,讲得比较细致,把里面的重点摘出来使用。
一些实用的正则表达式工具和资料:
在线regex测试工具:http://www.regexpal.com/
正则表达式语法:https://msdn.microsoft.com/zh-cn/library/az24scfc.aspx
《精通正则表达式》《正则表达式必知必会》
笔记内容
1.字符匹配:
匹配任意内容: . (匹配除\n之外的任意字符)
匹配文字:\w 匹配非文字:\W
匹配数字:\d 匹配非数字:\D
匹配任意空白符(空格,tab,换行符,全角空格):\s
匹配非空白符:\S
匹配标点符号:\p{P}
2.定位点:
匹配单词边界:\b 匹配非单词边界:\B
字符串开始、结束:^ $
正字符组:[ ]正字符组指定一个字符列表,其中的任何一个字符可出现在输入字符串中以便进行匹配。 此字符列表可以单独指定和/或作为范围指定
负字符组:[^]
3.数量匹配:
数量匹配说明图4.分组构造
构建子表达式:(exp)
捕获子表达式:
\1(这个数字代表子表达式的初始数字);
命名为name的exp: (?<name>exp)或(?'name'exp)
捕获该表达式:\k<name> \k'name'或(?(name)yes|no)(表示:name表达式匹配成功则执行yes表达式,失败则执行no表达式)
(?<duplicateWord>\w+)\s\k<duplicateWord>\W(?<nextWord>\w+)
零宽度正预测先行断言(向后匹配):(?=) \b\w+(?=\sis\b) 负预测:(?!) \b(?!un)\w+\b
零宽度正回顾先行断言(向前匹配):(?<=) (?<=\b20)\d{2}\b 负预测:(?<!) (?<!(Saturday|Sunday) )\b\w+ \d{1,2}, \d{4}\b
5.转义符:
( )需要被转义
6.贪婪&懒惰匹配
贪婪&懒惰匹配规则图匹配:aabab
a.?b —>aab
a.b —>aabab
运用:
在线regex测试工具:http://www.regexpal.com/
1.匹配全文中的IP地址
((2[0-4]\d|25[0-5]|[01]?\d\d?).){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)
2.匹配可嵌套的HTML结构
<div[>]*>[<>](((?'Open'<div[^>]>)[<>]*)+((?'-Open'</div>)[<>])+)(?(Open)(?!))</div>
3.匹配手机号码
/**
- 移动号码段:139、138、137、136、135、134、150、151、152、157、158、159、182、183、187、188、147
- 联通号码段:130、131、132、136、185、186、145
- 电信号码段:133、153、180、189
**/
/((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}/g —js写法
4.搜索重复的单词(this this 或者go go 等内容)
(\b\w+\b)\s+\1
\b(?<Word>\w+)\b\s+\k<Word>\b
regex工具输出结果
未完待续。。