HTTP协议

2018-04-09  本文已影响1人  我是来捕鱼的

Http是一个客户端终端和服务器端请求和应答的标准。

一、请求方法:

  1. GET:向指定的资源发出“显示”请求。使用GET方法应该只用在读取数据,而不应当被用于产生“副作用”的操作中,例如在Web Application中。其中一个原因是GET可能会被网络蜘蛛等随意访问。参见安全方法
  2. POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。
  3. OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用'*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。HEAD:与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
  4. PUT:向指定资源位置上传其最新内容。
  5. DELETE:请求服务器删除Request-URI所标识的资源。
  6. TRACE:回显服务器收到的请求,主要用于测试或诊断。
  7. CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。

二、状态码

所有HTTP响应的第一行都是状态行,依次是当前HTTP版本号3位数字组成的状态代码,以及描述状态的短语,彼此由空格分隔。

常见状态码、状态描述、说明:

三、Requests Headers(请求头)

Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8

Accept请求报头域用于指定客户端接受哪些类型的信息。eg:Accept:image/gif,表明客户端希望接受GIF图象格式的资源;Accept:text/html,表明客户端希望接受html文本。

Cookie:d_c0="AACAWNtZswqPTnJ8dFXqaygiq82ekPD5_-xxxx

Cookie(复数形态Cookies),中文名称为“小型文本文件”或“小甜饼”[1],指某些网站为了辨别用户身份而储存在用户本地终端(Client Side)上的数据(通常经过加密)

User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36

用户是通过什么工具来请求的,这是区别爬虫跟浏览器的第一个方面,通常爬虫都会将url的User-Agent更改为留其浏览器的用户代理。
Chrome下在地址栏输入about:version即可查看

Referer:https://www.zhihu.com/people/pa-chong-21/activities

是通过哪个页面到当前页面的

上一篇 下一篇

猜你喜欢

热点阅读