Python爬虫正则表达式匹配网页元素
2017-10-26 本文已影响42人
西凉0
要匹配网页中 li bookrecno="123456789" 的这串数字,用这个试了就是不行:
gzlib_bookrecnos = re.findall(r'li bookrecno="(\d*?)"', gzlib_page, re.S)
在空格处加上.*?就ok啦!~~撒花~~
gzlib_bookrecnos = re.findall(r'li.*?bookrecno="(\d*?)"', gzlib_page, re.S)