爬虫三步

2019-04-24 本文已影响0人江湖有爱

#创建目录文件夹
new_flie = '动态图'
if not os.path.exists(new_flie):
    os.mkdir(new_flie)
#关键三步：获取页面，获取关键信息，下载保存
def getHtml():#请求页面
    html = requests.get(url)
def getImg():#获取图片
    html = requests.get(url)#打开页面
   #使用正则或xpath获取图片信息
def download(filename,img):#下载保存
    try:
        i = requests.get(img, timeout=(3, 7))
        with open('./' + new_flie + '/{}'.format(filename), 'wb') as f:
            f.write(i.content)
            f.close()
            print(filename)
    except:
        print('error','URL打不开',img)

爬虫三步

猜你喜欢

热点阅读