正则表达式

2018-01-18 本文已影响0人郭大侠

正则表达式即用来进行字符串匹配。获取符合自己期望的信息

常规匹配：

泛匹配：使用.*来表示中间任意字符

对group进行划分：注意（）内的字符需是同一类型

贪婪模式和非贪婪模式：.*与.*?(从左到右泛匹配时匹配到何时停止)

有换行的情况：.*无法匹配换行符，添加参数re.S之后可以匹配任意的字符

转义：使用\来转义

search与match方法的差别

注意search仍然可以用^和$来表示开头和结尾，但是必须要和content首尾相同，否则无法匹配。

*与?一个表示匹配0或多个之前的字符，另一个表示匹配0或多个之前的片段。

re.sub方法：

re.sub

替换字符串中每一个匹配的子串后返回替换后的字符串。

r表示保留原生字符。\1表示group1。

体会下换行符

strip（剥去）方法：

去除换行符

使用compile将正则表达式保存为模式，方便多次使用