Python爬虫学习pythonPythoner集中营

Python爬虫-re(正则表达式)模块常用方法

2016-06-02  本文已影响2164人  SSBun

最近在学习使用Python来写爬虫,既然是学习爬虫,那肯定少不了筛选数据的神器-正则表达式,当然了强大的Python中也有正则表达式(正则表达式30分钟入门教程)的模块,那就是re,下面就来了解一些我们常用的正则方法:


re.match

import re 
str = "my name is BZ, what's your name ?"
value = re.match(r"(\w+)\s", text)
if value:
     print(m.group(0))
else:
     print('not match')

re.search


re.sub


re.split


re.findall


re.compile

import re
text = "my name is BZ, what's your name ?"
regex = re.compile(r'\w*BZ\w*')
print regex.findall(text) #查找所有包含'BZ'的单词
print regex.sub(lambda m: '[' + m.group(0) + ']', text) #将字符串中含有`BZ`的单词用`[]`括起来。

flag的几种不同意义:

上一篇 下一篇

猜你喜欢

热点阅读