第4篇:HTTP 消息
本系列翻译自:https://developer.mozilla.org/en-US/docs/Web/HTTP
注:翻译水平有限,如果有不理解或者纰漏之处,还请参考火狐原文 :https://developer.mozilla.org/en-US/docs/Web/HTTP/Messages;
HTTP 消息是关于客户端和服务端如何交互数据的信息;有两类消息:客户端发送请求到服务端,及来自服务端的响应;
HTTP 消息是由文本信息参照ASCII编码而组成的,并且是多行组成。在HTTP/1.1以及早期的版本,消息是开放的,而在HTTP/2中,曾经可读的消息现在被划分为HTTP框架,提供优化和性能的改进。Web开发人员或网站管理员很少亲自编写这些文本HTTP消息:软件、Web浏览器、代理或Web服务器,执行此操作。它们通过配置文件(代理或服务器)、API(浏览器)或其他接口提供HTTP消息。
HTTP/2的是一种不需要对api或者配置文件做任何更改的二进制框架机制,它对用户是透明的。
HTTP requests和responses都是由大致相同的结构组成:
- 起始行描述了请求是否被处理,处理的结果是成功还是失败,起始行永远是单行;
- 一系列可选的header头也是构成请求的一部分,或者描述消息体;
- 一个空白行揭示了所有元信息已经被发送出去。
- 一个可选的正文包含了类似于表单的请求,或者是响应的文档。
HTTP消息的起始行和HTTP头统称为请求头,而其有效负载称为主体。
- image.png
HTTP Requests
Start line:起始行
HTTP请求是客户端发送的消息,用于在服务器上发起动作。起始行包含三个要素:
1. 一个HTTP方法,一个动词(如GET
/PUT
POST
)或名词(如HEAD
或 OPTIONS
),这用于描述要执行的动作。例如,GET表明资源被获取或POST意味着数据被推送到服务器。
2. 请求的目标,通常用 URL或者指定绝对路径、协议、端口、域名;请求的格式取决于不同的请求方法,可以是:
- 一个绝对路径,后面跟着一个“?”和query串,这是最常见的形式,称作 origin form 被GET, POST, HEAD,和OPTIONS方法使用。
POST / HTTP 1.1
GET /background.png HTTP/1.0
HEAD /test.html?query=alibaba HTTP/1.1
OPTIONS /anypage.html HTTP/1.0 - 一个完整的URL,被称为绝对形式 absolute form,主要用户get请求连接到代理。
GET http://developer.mozilla.org/en-US/docs/Web/HTTP/Messages HTTP/1.1
- URL的权威组件,由域名和可选的端口构成(用':'隔开),被称作权威形式 authority form,它仅仅用CONNECT建立HTTP隧道;
CONNECT developer.mozilla.org:80 HTTP/1.1
- 星号形式 asterisk form,一个简单的星号(“*”)与OPTIONS一起使用,代表整个服务器。
OPTIONS * HTTP/1.1
3. HTTP版本,定义了消息的结构,以及指示如何响应。
Headers 头
- image.png
HTTP headers 是从请求中继承了一个HTTP头的基本结构:一个不区分大小写的字符串,后跟一个冒号(“:”)和一个值,其结构取决于头。一行组成,可以相当长。
请求头有很多,分为这么几组:
-
General headers 通用头:比如
Via
,作为整体在消息中其作用。 -
Request headers 请求头,如
User-Agent
,Accept-Type
,通过指定进一步修改请求(如Accept-Language
),通过上下文(如Referer
),或有条件的限制(如If-None
))。 -
Entity headers 实体头,比如
Content-Length
,显然,如果请求中没有主体,就不会发送这样的报头。
Body 请求正文
Request 的最后一部分是请求正文,并不是所有的请求都有请求正文,如GET/HEAD/DELETE就没有,但是像POST因为是需要更新资源,所以一般会有请求正文。
请求正文大概被分为这么两种:
-
单个资源(Single-resource)体,由一个单独的文件组成,由两个头定义:
Content-Type
andContent-Length
. -
多个资源体(Multiple-resource bodies), 由multipart 类型的请求正文组成,一般是HTTP表单。
HTTP Responses
Start line:起始行
response的起始行被称为状态行,包含了以下信息:
如 HTTP/1.1 404 Not Found.
Headers 头部
HTTP headers 响应的HTTP头遵循与其他头一样的结构:一个不区分大小写的字符串,后跟一个冒号(“:”)和一个value,其结构取决于头的类型,一行显示。
响应头分为这么几组:
-
General headers, 比如
Via
. -
Response headers, 比如
Vary
和Accept-Ranges
-
Entity headers, 比如
Content-Length
, 应用于请求正文. 显然,在请求中没有正文时,不会发送这样的标头。 - image.png
Body 响应体
response 的最后一部分是响应体 。不是所有的response 都有响应体 :比如201或204,就没有。
响应体分为这么几种:
-
Single-resource bodies, 由单个文件的已知长度组成,被两个头所定义:
Content-Type
和Content-Length
. -
Single-resource bodies, , 由单个文件的未知长度组成, 由
Transfer-Encoding
指定编码,并设置到chunked
. -
Multiple-resource bodies, 由multipart 类型的响应体组成, 这种比较少见.
HTTP/2 Frames
HTTP/1.x 的messages 有一些缺点:
-
Headers没有被压缩
-
Headers are often very similar from one message to the next one, yet still repeated across connections.
-
No multiplexing can be done. Several connections need opening on the same server: and warm TCP connections are more efficient than cold ones.
(注:以上两点把握不太准,自行参考)
HTTP / 2引入了一个额外的步骤:将HTTP/1.x消息分为帧,数据和header头分离,这样就可以对header进行压缩了,几个流可以组合在一起,称为多路复用,可以使用更有效的底层tcp连接。 - image.png
HTTP框架现在对Web开发人员来说是开放的。这是在HTTP / 1.1消息和底层传输协议之间的HTTP 2中的一个额外步骤。Web开发人员使用HTTP帧的API时不需要更改;在浏览器和服务器中都可用时。