python 爬虫

2019-08-19  本文已影响0人  98Future

Beautiful Soup

如果包含Chinese characters, apply decode() method.

Urllib vs Request

下载图片:

An unordered list starts with the <ul> tag. 

值得注意的1. 我没有用lxml,而是html5lib

2.  img['src'] 这个似乎是一个html component

爬百度百科:

但是爬的速度特别慢,因为它是先download下来html文件再寻找东西。

上一篇下一篇

猜你喜欢

热点阅读