编程第一课, 获取小姐姐图片这件小事儿

2018-11-13 本文已影响428人 zhaoolee

第一张图片, 用来做简书的封面, 目的是吸引你点进来, 正文在下面~

这件事要从我看到的一篇博客说起

博客里面提到了一辆很稳的"干货"车 http://gank.io
这辆运"干货"的车有两个方向盘, "左转"向小姐姐图, "右转"向技术干货, 老司机们是直接左转的...
博主进站"左转"后, 在"干货"车的主页底部发现了开放的api
然后博主处理了一下大致是这个样子 : https://gank.io/api/data/福利/1000/1

随便点开一个链接: https://ws1.sinaimg.cn/large/0065oQSqly1fubd0blrbuj30ia0qp0yi.jpg

emm... 阿弥陀佛...

想存图? 祭出神器 requests !

轻车熟路, Python几行代码搞定

import requests
import json
import os

def getData():
    try:
        gank_content = requests.get("http://gank.io/api/data/福利/1000/1").content
    except:
        print("获取信息失败")

    gank_json = json.loads(gank_content.decode("utf-8"))
    print(gank_json["error"])
    if (gank_json["error"] == False):
        return gank_json["results"]
    return []

def saveImg(img_info_list):
    if os.path.exists("./gank_images/"):
        pass
    else:
        os.makedirs("./gank_images/")
    for img_info in img_info_list:

        try:
            img_data = requests.get(img_info["url"]).content
            file_name = img_info["url"].split("/")[-1]
            path_name = "./gank_images/"+file_name
            if (os.path.exists(path_name) == False):
                with open (path_name, "wb+") as e:
                    e.write(img_data)
                    print(path_name, "保存成功!")
        except:
            print(img_info["url"], "保存失败")
            pass

def main():
    img_info_list = getData()
    saveImg(img_info_list)


if __name__ == '__main__':
    main()

老规矩, 得不义之财要散财,把爬到的图片, 给大学宿舍群的小伙伴分享一下

好吧! gank原来是敏感词, 换个名字重新上传

小结:

学爬虫也就那么回事儿, 刚接触爬虫那会儿, 最有意思的项目, 就是去斗鱼, 爬小姐姐的头像, https://www.jianshu.com/p/7055653f6c69

博主认为, 学习爬虫应该是编程的第一堂课, 爬虫足够有趣, 而且足够简单, 容易培养学习兴趣, 且用途广泛~

关于上面提到的学习.zip, 里面存放了代码和爬下来的600多张图片,我在百度网盘也存了一份, 感兴趣可以关注公众号jikeweikan, 回复学习, 获取代码和图片,祝学运昌隆~

编程第一课, 获取小姐姐图片这件小事儿

这件事要从我看到的一篇博客说起

想存图? 祭出神器 requests !

轻车熟路, Python几行代码搞定

小结:

猜你喜欢

热点阅读