正则表达式

2017-07-14  本文已影响0人  六六的建斌

普通字符作为原子

通用字符作为原子:\w \s    \d    等各代表的意思

原子表:[  ]取里面的任意一个字符.    ^加在原子前面,表示非。取非原子的其他原子值

元字符:正则表达式里面具有一些特殊含义的字符。比如重复前面n次字符

. :除换行符外的任意字符

^: 若不在原子表中,代表匹配开始位置

$:                                       匹配结束位置

*:     前面原子重复出现一次0次 或多次

?:    前面原子出现0或1次        +:前面原子1或多次

{n}:恰好出现n次    {n,m}至少n次,至多m次

模式修正符:可以在不改变正则表达式的前提下,改变表达式的含义

I:代表忽略大小写

M:代表多行匹配

S  让点.匹配包括换行符*

在匹配的时候在函数里面加上(ptr,sritn,re.I)

贪婪模式 尽可能多的匹配,.*

懒惰模式:尽可能少的匹配  .*?    注意有问号是懒惰模式

正则表达式函数:re.search  match findall 等

函数是正则表达式的实现功能,

全局匹配函数:

re.compile(正则表达式).findall(数据)

小知识:   在浏览器中输入 ctrl+F  可以显示输入框

上一篇 下一篇

猜你喜欢

热点阅读