python入门018～python3借助requests类库3

2019-07-10 本文已影响7人编程小石头666

今天我们来做一个简单的python爬虫示例，让大家看看python爬取数据的方便之处。

先来看下我们实现的效果

本节知识点

1，python导入三方类库的学习
2，requests类库的简单使用
3，爬取网页数据

一，先把实现代码贴出来给大家

# -*- coding:UTF-8 -*-
import requests
if __name__ == '__main__':
    target = 'http://gitbook.cn/'
    req = requests.get(url=target)
    print(req.text)

这就是本节的全部代码，是不是很简单，这就是python的魅力所在。用最少的代码做最多的事。

二，创建一个python类，把上面的代码复制进去。

如创建一个叫 pachong的类，如下图

创建好以后，把上面第一步的代码复制进去，这时候会报红。

要解决这个报红，我们就要学会导入三方类库。

三，导入类库

其实导入三方类库也很简单，有下面两种方式。

如上面两种方式，我们便可以轻松的导入类库了。

四，运行代码

运行完后，就可以爬取到网页数据了，如下图。

到这里我们就轻松的实现了网页数据的爬取，我们后面要做的就是使用正则表达式，从上图的数据中，过滤出自己需要的数据。