re.sub

2019-07-17  本文已影响0人  青铜搬砖工

re.sub比replace好用太多了
比如,去掉下面的a标签

import re
test_str = '''
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
'''
result = re.sub('<a.*?>|</a>','',test_str)
print(result)

结果如下

<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 

先使用sub处理一下然后在提取数据可能会达到事半功倍的效果.

上一篇下一篇

猜你喜欢

热点阅读