python正则表达式
2018-04-12 本文已影响0人
作者or过客
正则表达式的用途
正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串
在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为re
import re #导入re模块来使用正则表达式
result=re.match('正则表达式','要匹配的字符串')
result.group()
下面是一个示范
import re
result=re.match('baidu','baidu.com')
res=result.group()
print(res)
输出结果为:baidu
表示字符
字符 | 用法 |
---|---|
. | 匹配任意一个字符除了\n |
[ ] | 匹配[ ]中列举的字符 |
\d | 匹配数字,即0-9 |
\D | 匹配非数字 |
\s | 匹配空白 |
\S | 匹配非空白 |
\w | 匹配单词字符,a-z,A-Z,0-9,_ |
\W | 匹配非单词字符 |
python中字符串前面加上r表示原生字符串,来解决反斜杠带来的困扰
import re
ab='E:\\a\\b'
ret=re.match('E:\\a',ab).group()#报错不能运行
ret=re.match('E:\\\\a',ab).group()
print(ret)#输出结果为E:\a
- 每一门语言都有相应的正则表达式,在数据量大的情况下就需要用正则表达式来进行匹配,来获取想要获取的内容