爬虫,数据分析那些事

正则表达式2-urllib实战

2018-01-28  本文已影响12人  whong736

urllib实战

import urllib.request

#将爬取得网页,保存到本地
urllib.request.urlretrieve("http://www.pufei.net/shaonianrexue/", filename="/Users/vincentwen/Documents/Documents/PythonCode/pufei.html")

#urlcleanup清除urlretrieve产生的缓存清除
urllib.request.urlcleanup()



file = urllib.request.urlopen("http://www.pufei.net/shaonianrexue/")

#查看信息
file.info()

#获取抓取的结果返回码
file.getcode()

#获取当前爬取的网址
file.geturl()


上一篇下一篇

猜你喜欢

热点阅读