HTTP协议
1.HTTP协议用于客户端和服务端之间的通信
HTTP协议规定,请求从客户端发出,最后服务器端响应该请求并返回。
图解:请求报文的构成 图解:响应报文的构成2.HTTP是不保存状态的协议
HTTP是一种不保存状态,即无状态协议。HTTP自身不对请求和响应之间的通信状态进行保存。也就是说在HTTP这个级别,协议对于发送过的请求或响应都不做持久化处理,为了更快的处理大量事务,确保协议的可伸缩性,而特意把HTTP设计成如此简单的。引入Cookie技术,有了Cookie技术再用HTTP协议通信,就可以管理状态了。有关Cookie的详细内容稍后讲解。
3.请求URI定位资源
GET http://hackr.jp/index.htm HTTP/1.1
GET /index.htm HTTP/1.1
Host:hackr.jp
*代替URI 对服务器本身发起请求
OPTIONS *HTTP/1.1
GET POST PUT HEAD DELETE OPTIONS:询问支持的方法 TRACE:追踪路径
TRACE方法是让Web服务器端将之前的请求通信返回给客户端的方法
发送请求时,在Max-Forwards首部字段中填入数值,每经过一个服务器端就将该数字减1,当数值刚好减到0时,就停止继续传输,最后接收到请求的服务器则返回状态码200 OK的响应
客户端通过TRACE 方法可以查询发送出去的请求是怎样被加工修改/篡改的。这是因为,请求想要连接到源目标服务器可能会通过代理中转,TRACE方法就是用来确认连接过程中发生的一系列操作。
但是,TRACE方法本来就不怎么常用,再加上它容易引发XST(Cross-Site Tracing,跨站追踪)攻击,通常就更不会用到了。
CONNECT:要求用隧道协议连接代理
CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL(Secure Sockets Layer,安全套接层)和TLS(Transport Layer Security,传输层安全)协议把通信内容加密后经网络隧道传输。
CONNECT 代理服务器名:端口号 HTTP版本
CONNENT proxy.hackr.jp:8080 HTTP/1.1
Host:proxy.hackr.jp
HTTP/1.1 200 OK (之后进入网络隧道)
4.持久连接
为解决上述TCP连接的问题,HTTP/1.1和一部分的HTTP/1.0想出了持久连接(HTTP Persistent Connections,也称为HTTP keep-alive 或HTTP connection reuse) 的方法。持久连接的特点是,只要任意一端没有明确提出断开连接,则保持TCP连接状态。
持久性连接的好处在于减少了TCP连接的重复建立和断开所造成的额外开销,减轻了服务端的负载。另外减少开销的那部分时间,使HTTP请求和响应能够更早的结束,这样Web页面的显示速度也就相应提高了。
在HTTP/1.1中,所有的连接默认都是持久性连接,但在HTTP1.0内并未标准化。虽然有一部分服务器通过非标准的手段实现了持久连接,但服务器端不一定能够支持持久连接。毫无疑问,除了服务器端,客户端也需要支持持久连接
5.管线化
持久性连接使得多请求以管线化方式发送成为可能。从前发送请求后需要等待并收到响应,才能发送下一个请求,管线化技术出现后,不用等待响应亦可直接发送下一个请求。
这样就能够做到同时并行发送多个请求,而不需要一个接一个地等待响应了。
5.使用Cookie的状态管理
Cookie技术通过在请求和响应报文中写入Cookie信息来控制客户端的状态
Cookie会根据从服务器端发送的响应报文内的一个叫做Set-Cookie的首部字段信息,通知客户端保存Cookie。当下次客户端再往该服务器发送请求时,客户端会自动在请求报文中加入Cookie值后发送出去。
服务端发现客户端发送过来的Cookie后,会去检查究竟是从哪一个客户端发来的连接请求,然后对比服务器上的记录,最后得到之前的状态信息。
图解请求报文:
GET /reader/HTTP/1.1
Host:hackr.jp
响应报文(服务器端生成Cookie信息)
HTTP/1.1 200 OK
Date Thu,12 Jul 2012 07:12:20 GMT
Server :Apache
<Set-Cookie :sid=123456;path=/expires=Wed,=>10-Oct-12 07:12:20 GMT>
Content-Type:text/plain;charset=UTF-8
请求报文
GET /image/HTTP/1.1
Host:hackr.jp
Cookie:sid=123456