利用python抓取图片

2016-07-22  本文已影响63人  iOS收藏家

本人使用的Mac 自带python 使用python --version 可以查看python的版本信息

安装pipsudo easy_install pip

安装BeautifulSoup sudo pip install BeautifulSoup

然后再桌面创建一个search.py文件 在此之前我还创建了一个search的文件夹用来存储图片
下面是我写的python文件

#!/usr/bin/python
#-*- coding: utf-8 -*-
#encoding=utf-8

import urllib2
import urllib
import os
from BeautifulSoup import BeautifulSoup

def getAllImageLink():
    html = urllib2.urlopen('http://www.ugirls.com/Index/Search/Magazine-48.html').read()#网页地址
    soup = BeautifulSoup(html)
    
    liResult = soup.findAll('ul',attrs={"class":"latest_list"})#获取class是latest_list 的ul
    numberIndex = 0
    file_Object = open('/Users/cc/Desktop/search/search.txt','w+')#打开文件进行写操作
    for ul in liResult:
        imageEntityArray = ul.findAll('img')#找到img标签
        for image in imageEntityArray:
            link = image.get('data-original')#图片地址
            imageName = 'image' + str(numberIndex)#随便生成方法名
            numberIndex = numberIndex + 1
            filesavepath = '/Users/cc/Desktop/search/%s.jpg' % imageName#保存地址
            file_Object.write('{"src"'+':"'+link+'"}\n')#每行按照字典形式写入文件
            urllib.urlretrieve(link,filesavepath)#直接下载远程数据到本地
            print filesavepath
    file_Object.close();#关闭文件

def sayHello():#定义函数
    file_Object = open('/Users/cc/Desktop/search/search.txt','r')#打开文件 进行读取
    while True:
        line = file_Object.readline()#按行读取
        if line:
            dic = eval(line)#转化为字典
            print dic['src']#打印字典中的key 对应的值
            pass
        else:
            break
    file_Object.close()

if __name__ == '__main__':
    getAllImageLink()#调用getAllImageLink函数
    sayHello()#调用sayHello() 函数

然后利用终端输入命令python search.py就可以运行了下面是我运行后的截图:

Search.png
上一篇 下一篇

猜你喜欢

热点阅读