正则表达式

2017-07-14 本文已影响0人六六的建斌

普通字符作为原子

通用字符作为原子：\w \s \d 等各代表的意思

原子表：[ ]取里面的任意一个字符. ^加在原子前面，表示非。取非原子的其他原子值

元字符：正则表达式里面具有一些特殊含义的字符。比如重复前面n次字符

. :除换行符外的任意字符

^: 若不在原子表中，代表匹配开始位置

$: 匹配结束位置

*: 前面原子重复出现一次0次或多次

?: 前面原子出现0或1次 +：前面原子1或多次

{n}:恰好出现n次 {n，m}至少n次，至多m次

模式修正符：可以在不改变正则表达式的前提下，改变表达式的含义

I:代表忽略大小写

M:代表多行匹配

S 让点.匹配包括换行符*

在匹配的时候在函数里面加上（ptr，sritn，re.I）

贪婪模式尽可能多的匹配，.*

懒惰模式：尽可能少的匹配 .*? 注意有问号是懒惰模式

正则表达式函数：re.search match findall 等

函数是正则表达式的实现功能，

全局匹配函数：

re.compile(正则表达式).findall(数据)

小知识：在浏览器中输入 ctrl+F 可以显示输入框

上一篇下一篇

猜你喜欢

热点阅读