正则表达式
2018-01-18 本文已影响0人
郭大侠
正则表达式即用来进行字符串匹配。获取符合自己期望的信息
常规匹配:
泛匹配:使用.*来表示中间任意字符
对group进行划分:注意()内的字符需是同一类型
贪婪模式和非贪婪模式:.*与.*?(从左到右泛匹配时匹配到何时停止)
有换行的情况:.*无法匹配换行符,添加参数re.S之后可以匹配任意的字符
转义:使用\来转义
search与match方法的差别
注意search仍然可以用^和$来表示开头和结尾,但是必须要和content首尾相同,否则无法匹配。
*与?一个表示匹配0或多个之前的字符,另一个表示匹配0或多个之前的片段。
re.sub方法:
re.sub
替换字符串中每一个匹配的子串后返回替换后的字符串。
r表示保留原生字符。\1表示group1。
体会下换行符strip(剥去)方法:
去除换行符使用compile将正则表达式保存为模式,方便多次使用