Web前端之路程序员进击的Python

编程第一课, 获取小姐姐图片这件小事儿

2018-11-13  本文已影响428人  zhaoolee

这件事要从我看到的一篇博客说起


随便点开一个链接: https://ws1.sinaimg.cn/large/0065oQSqly1fubd0blrbuj30ia0qp0yi.jpg

emm... 阿弥陀佛...

想存图? 祭出神器 requests !

轻车熟路, Python几行代码搞定

import requests
import json
import os

def getData():
    try:
        gank_content = requests.get("http://gank.io/api/data/福利/1000/1").content
    except:
        print("获取信息失败")

    gank_json = json.loads(gank_content.decode("utf-8"))
    print(gank_json["error"])
    if (gank_json["error"] == False):
        return gank_json["results"]
    return []

def saveImg(img_info_list):
    if os.path.exists("./gank_images/"):
        pass
    else:
        os.makedirs("./gank_images/")
    for img_info in img_info_list:

        try:
            img_data = requests.get(img_info["url"]).content
            file_name = img_info["url"].split("/")[-1]
            path_name = "./gank_images/"+file_name
            if (os.path.exists(path_name) == False):
                with open (path_name, "wb+") as e:
                    e.write(img_data)
                    print(path_name, "保存成功!")
        except:
            print(img_info["url"], "保存失败")
            pass

def main():
    img_info_list = getData()
    saveImg(img_info_list)


if __name__ == '__main__':
    main()

老规矩, 得不义之财要散财,把爬到的图片, 给大学宿舍群的小伙伴分享一下



好吧! gank原来是敏感词, 换个名字重新上传


小结:

  • 学爬虫也就那么回事儿, 刚接触爬虫那会儿, 最有意思的项目, 就是去斗鱼, 爬小姐姐的头像, https://www.jianshu.com/p/7055653f6c69
  • 博主认为, 学习爬虫应该是编程的第一堂课, 爬虫足够有趣, 而且足够简单, 容易培养学习兴趣, 且用途广泛~
  • 关于上面提到的学习.zip, 里面存放了代码和爬下来的600多张图片,我在百度网盘也存了一份, 感兴趣可以关注公众号jikeweikan, 回复学习, 获取代码和图片,祝学运昌隆~
上一篇 下一篇

猜你喜欢

热点阅读