23.re模块正则

2019-12-26 本文已影响0人哈哈大圣

1). 概述

re模块为正则表达式功能模块
模块导入方式

import re

2). 元字符

元字符	说明
`.`	默认匹配除`\n`之外的任意一个字符，若指定`flag DOTALL`,则匹配任意字符，包括换行
`^`	匹配字符开头，若指定`flags MULTILINE`,这种也可以匹配上`(r"^a","\nabc\neee",flags=re.MULTILINE)`
`$`	匹配字符结尾，若指定`flags MULTILINE` `,`re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group()`匹配到foo1
`*`	匹配``号前的字符0次或多次， `re.search('a','aaaabac')` 结果`aaaa`
`+`	匹配前一个字符1次或多次，`re.findall("ab+","ab+cd+abb+bba")` 结果`['ab', 'abb']`
`?`	匹配前一个字符1次或0次,`re.search('b?','alex').group()` 匹配b 0次
`{m}`	匹配前一个字符m次,`re.search('b{3}','alexbbbs').group()` 匹配到`bbb`
`{n,m}`	匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
`	`	匹配`	`左或`	`右的字符，`re.search("abc	ABC","ABCBabcCD").group()` 结果'ABC'
`(...)`	分组匹配,`re.search("(abc){2}a(123	45)", "abcabca456c").group()` 结果为'abcabca45'
`[]`	或匹配，满足里面
`\A`	只从字符开头匹配，`re.search("\Aabc","alexabc")` 是匹配不到的，相当于`re.match('abc',"alexabc")` 或`^`
`\Z`	匹配字符结尾，同`$`
`\d`	匹配数字0-9
`\D`	匹配非数字
`\w`	匹配`[A-Za-z0-9]`
`\W`	匹配非`[A-Za-z0-9]`
`\s`	匹配空`白字符`、`\t`、`\n`、`\r` , `re.search("\s+","ab\tc1\n3").group()` 结果 `\t'
`(?P<name>...)`	分组匹配 `re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city")` 结果`{'province': '3714', 'city': '81', 'birthday': '1993'}`

3). 匹配方法

compile:编辑匹配的模式
match:从头开始匹配,就是要求从头要满足条件才有返回值
search:匹配包含，匹配一个
re.findall:把所有匹配到的字符放到以列表中的元素返回
split:以匹配到的字符当做列表分隔符
sub:匹配字符并替换
fullmatch:全部匹配

4). 匹配方法案例

通用模板

s = "dfjie8sdjfe3"
match = re.search("[0-9]", s) #只匹配一个
if not match:    # 先要进行判断
    print("match is None")
if match:
    print(match.group())  # 得到值

search方法 + groups分组匹配

a = re.search("([a-z]+)([0-9]+)","abc123").groups()
print(a)

split：以匹配到的内容进行分割,可指定分割次数

a = re.split("\d+","dkfj3kd3kdf334dfldf3ldfd4",maxsplit=2)
print(a)

模糊替换匹配,可指定次数

a = re.sub("\d+","LOVE","kdjfiekdfie83df7jdf3",count=2)

全部匹配，否则返回None: 验证邮箱

a = re.fullmatch("\w+@(sina|qq|163|outlook|icloud)\.(com|cn)","lingchangdage@sina.com").group()

pattern

pattern = re.compile("\w+@\w+\.(com|cn|edu)")  #相当于提前把匹配规则写好
pattern.fullmatch("liuchengdaga@sina.com")  #直接使用匹配的规则
pattern.search("liuchengdaga@sina.com")

flags标志符用于添加特定的条件

a = re.search("a", "A", re.I) # 忽略大小写
b = re.search("foo.$", "foo1\nfoo2\n", re.MULTILINE) # 多行模式，匹配一行的结尾
c = re.search(".", "\n", re.S)  # S可以让通配符匹配换行符
d = re.search(".+#这个是注释，要加X "
                "a","aa",re.X)  # X可以为符号添加注释

23.re模块正则

1). 概述

2). 元字符

3). 匹配方法

4). 匹配方法案例

猜你喜欢

热点阅读

23.re模块 正则

1). 概述

2). 元字符

3). 匹配方法

4). 匹配方法案例

猜你喜欢

热点阅读

23.re模块正则