python_爬虫爬虫流量热赞

爬虫046_requests基础

2023-03-11  本文已影响0人  为宇绸缪

1、为什么要重点学习requests模块,而不是urllib

2、requests的作用与安装

作用:发送网络请求,返回响应数据

命令: pip install requests

requests模块发送简单的get请求、获取响应

需求:通过requests向百度首页发送请求,获取百度首页的数据

import requests

# 目标url
url = 'https://www.baidu.com'

# 向目标url发送get请求
response = requests.get(url)

# 打印响应内容
print(response.text)

response的常用属性:

思考:text是response的属性还是方法呢?

3.1 response.text 和response.content的区别

获取网页源码的通用方式:

  1. response.content.decode()
  2. response.content.decode("UTF-8")
  3. response.text

以上三种方法从前往后尝试,能够100%的解决所有网页解码的问题

所以:更推荐使用response.content.deocde()的方式获取响应的html页面

上一篇下一篇

猜你喜欢

热点阅读