小猪的Python学习之旅 —— 3.正则表达式

2017-12-27 本文已影响174人 coder_pig

re模块

Python中通过re模块使用正则表达式，该模块提供的几个常用方法：

re.match(pattern, string, flags=0)

参数：匹配的正则表达式，要匹配的字符串，标志位(匹配方法)
尝试从字符串的开头进行匹配，匹配成功会返回一个匹配的对象，
类型是：<class '_sre.SRE_Match'>
group与groups

re.search(pattern, string, flags=0)

注意：match方法和search的最大区别：match如果开头就不和正则表达式匹配，
直接返回None，而search则是匹配整个字符串！！

re.findall(pattern, string, flags=0)

re.finditer(pattern, string, flags=0)

re.sub(pattern, repl, string, count=0, flags=0)

re.split(pattern, string, maxsplit=0, flags=0)

对于会多次用到的正则表达式，我们可以调用re的compile()方法编译成
Pattern对象，调用的时候直接Pattern对象.xxx即可，从而提高运行效率。

多个标志可通过按位OR(|)进行连接，比如：re.I|re.M

修饰符	描述
re.I	使匹配对大小写不敏感
re.L	做本地化识别（locale-aware）匹配
re.M	多行匹配，影响 ^ 和 $
re.S	使 . 匹配包括换行在内的所有字符
re.U	根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X	该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

为了告诉编译器这个string是个raw string(原字符串)，不要转义反斜杠！
比如在raw string里\n是两个字符，''和'n'，不是换行！

字符	作用
`^`	字符串开头
`$`	字符串结尾
`\b`	单词边界，即单词和空格间的位置，比如'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'
`\B`	非单词边界，和上面的\b相反
`\A`	匹配字符串的开始位置
`\Z`	匹配字符串的结束位置

用()表示的就是要提取的分组，一般用于提取子串，
比如：^(\d{3})-(\d{3,8})$：从匹配的字符串中提取出区号和本地号码

字符	作用
验证通过后回复加群即可获得加群链接(不要把机器人玩坏了！！！)～～～欢迎各种像我一样的Py初学者，Py大神加入，一起愉快地交流学♂习，van♂转py。上一篇下一篇猜你喜欢再论专注今天暴风雪中 01-21热闹不等于吵闹 06-08论不积跬步无以至千里 07-20中国古典诗词离当代人有多远 09-02纪念抗战胜利70周年：回望历史勿忘国耻 01-20电影制片人是做什么的 01-10幽灵恐怖事件热点阅读早餐里见世界谏言：全国的扫黑反腐 08-22浅谈对“天津爆炸事故”的看法和感想 07-04元芳你怎么看下一句 07-03陪伴是最长情的告白下一句 01-21你知道fighting是什么意思？告诉你fighting的意思 06-23深度好文：生命的意义不单是幸福 06-20深度好文：人最怕深交后的陌生爱情文章亲情文章友情文章心情文章励志文章节日文章校园文章百家杂谈会员管理最近更新美文美图网站地图 © 2014-2018 美文阅读网版权所有

字符

作用