re.sub
2019-07-17 本文已影响0人
青铜搬砖工
re.sub比replace好用太多了
比如,去掉下面的a标签
import re
test_str = '''
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li>
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li>
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li>
'''
result = re.sub('<a.*?>|</a>','',test_str)
print(result)
结果如下
<li data-view="7”>
沧海一卢笑
</li>
<li data-view="7”>
沧海一卢笑
</li>
<li data-view="7”>
沧海一卢笑
</li>
先使用sub处理一下然后在提取数据可能会达到事半功倍的效果.