2019-05-04

2019-05-04  本文已影响0人  suntwo

title: python3爬虫
date: 2019-03-03 09:15:29
tags:


requests库的使用

我们使用python3编写爬虫可以使用requests和urllib库,这两个都是python的第三方库,不过requests库更加的简单,因此我选用requests来进行爬虫的学习,在学习之前我们需要先配置自己的环境。

³äº�ç�¾åº¦</a> <a href=http://ir.baidu.com>About Baidu</a> </p> <p id=cp>©2017 Baidu <a href=http://www.baidu.com/duty/>使ç�¨ç�¾åº¦å��å¿
读</a>  <a href=http://jianyi.baidu.com/ class=cp-feedback>æ��è§�å��é¦�</a> äº¬ICPè¯�030173å�·  <img src=//www.baidu.com/img/gs.gif> </p> </div> </div> </div> </body> </html>

 ```
  1. 因此这段代码的作用便是将百度页面的源代码输出来
  1. 使用post方法传递参数

    观察以下代码

    import requests
    url="https://baidu.com"
    data={
        'a':'sun',
        'b':'one'
        }
    data=requests.post(url,data=data)
    print(data.text)
    

    可以看到使用post方法和get的第二种方式有点类似,都是先创建一个字典,然后将需要传递的参数写入字典中,但是我们在请求时使用的是requests.post(),并且使用data=data的方式传递参数,这个data参数和params一样是固定的。

  1. post和get方法的不同

    使用get方法传递参数其实是不安全的,浏览器会将get传递的参数在网址中显示出来,并且get方法传递的参数的大小是有限制的。

 使用post方法传递参数是不限制数据的大小,并且不会再浏览器的网址上显示出我们要传递的参数,因此是比较安全的,我们传递的大部分数据都是使用post方式提交的,比如表单中的数据。
上一篇 下一篇

猜你喜欢

热点阅读