爬虫三步
2019-04-24 本文已影响0人
江湖有爱
#创建目录文件夹
new_flie = '动态图'
if not os.path.exists(new_flie):
os.mkdir(new_flie)
#关键三步:获取页面,获取关键信息,下载保存
def getHtml():#请求页面
html = requests.get(url)
def getImg():#获取图片
html = requests.get(url)#打开页面
#使用正则或xpath获取图片信息
def download(filename,img):#下载保存
try:
i = requests.get(img, timeout=(3, 7))
with open('./' + new_flie + '/{}'.format(filename), 'wb') as f:
f.write(i.content)
f.close()
print(filename)
except:
print('error','URL打不开',img)