Python爬虫正则表达式匹配网页元素

2017-10-26  本文已影响42人  西凉0

要匹配网页中  li bookrecno="123456789"  的这串数字,用这个试了就是不行:

gzlib_bookrecnos = re.findall(r'li bookrecno="(\d*?)"', gzlib_page, re.S)

在空格处加上.*?就ok啦!~~撒花~~

gzlib_bookrecnos = re.findall(r'li.*?bookrecno="(\d*?)"', gzlib_page, re.S)

上一篇 下一篇

猜你喜欢

热点阅读