利用Python抓取网络图片的步骤:

2017-08-02  本文已影响0人  薛_乔_毓

1、根据给定的网址获取网页源代码
2、利用正则表达式把源代码中的图片地址过滤出来
3、根据过滤出来的图片地址下载网络图片

#coding:utf-8

import urllib
import re

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
image = re.compile(reg)
imglist = image.findall(html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x = x + 1

html = getHtml("[http://tieba.baidu.com/p/2460150866](http://tieba.baidu.com/p/2460150866)")
getImg(html)
上一篇下一篇

猜你喜欢

热点阅读