2018-08-03 python学习re模块方法

2018-08-03  本文已影响0人  随雪而世
import re

1.compile(正则字符串) 将正则表达式字符串转换成正则表达式对象

转换成正则表达式对象后,可以通过对象调用相关的方法

    re_obct = re.compile(r'\w{6,12}')
    print(re_obct.fullmatch('ahsjjs'))
    print(re.fullmatch(r'\w{6,12}', 'ahjhjs'))

2.fullmatch(正则表达式, 字符串) 完全匹配,从字符串开头匹配到结尾

返回值是匹配对象, 如果匹配失败返回None

match = re.fullmatch('\w{3}', 'h3s')
print(match)
# a.获取匹配到的结果
print(match.group())
# b.获取匹配到的范围
print(match.span())
# c.获取匹配到的开始下标和结束下标
print(match.start(), match.end())
# d.获取被匹配的字符串(原字符串)
print(match.string)

# 应用:判断一个字符串是否是某种字符串(判断账号、密码是否符合要求等)

3.match(正则表达式, 字符串) 不完全匹配,从字符串开头开始匹配,匹配到正则表达式对应的范围为止

返回值是匹配对象, 如果匹配失败返回None

match = re.match(r'\w{3}', 'h3shhhhsbs')
print(match)
print(match.group())
print(match.string)

# 应用: 判断一个字符串是否以某种字符串开头

4.search(正则表达式, 字符串) 在指定的字符串中查找某种字符串(以正则表达式来描述),如果有过个满足条件的,只匹配第一个

返回值是匹配对象,如果找不到符合要求的返回None

print(re.search(r'\d{2,}[a-z]', 'sh23n--8a7a7m0899'))

# 应用:判断一个字符串中是否包含某种字符串

5.findall(正则表达式, 字符串) 去获取指定字符串中满足正则条件的所有的子串

# 返回值是列表,列表中是符合要求的字符串。没有满足要求的子串就返回[]
result = re.findall(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
print(result)

# 注意:在通过正则表达式获取子串的时候,可以通过在正则表达式中添加括号,来约束获取的内容(只捕获括号中匹配到的内容)
#      匹配的时候还是按原正则表达式去查找

# 应用:字符串提取

6.finditer(正则表达式, 字符串) 用法和findall一样,只是返回值的类型不一样

返回一个迭代器,迭代器中的内容是匹配对象

注意:()捕获部分无效

result = re.finditer(r'[a-zA-Z](\d+)', '12a123buy=236ok98s')
for match in result:
    print(match)

# print('ahsj27jkkaj7js8jsj'.split('sj'))

7.split(正则表达式, 字符串) 按正则表达式匹配到的字符串进行切割

返回值是列表,列表元素就切割后被分段的字符串

result = re.split(r'[\[\]*\-]', 'a[hsj27]jkkaj*7js8-jsj')
print(result)

8.sub(正则表达式,新字符串, 原字符串) 在原字符串中查找符合正则的子串,替换成新的字符串

返回值是替换后的字符串

"""将指定字符串中所有'sb'替换成'*'"""
str1 = '你好sb,你全家都是sb,傻叉,你是不是傻,手机上叉'
result = re.sub(r'sb|傻叉|傻', '*', str1)
print(str1, result)
上一篇下一篇

猜你喜欢

热点阅读