工作生活

独上高楼-HTTP协议(1):从RFC开始

2019-07-04  本文已影响0人  唔六

这是一系列文章的开始,工作了这么久,发现很多人对http和web有不少的误解。大家都在希望web交互的更快,使用webGL来充实内容,使用各类hybrid框架来实现一统所有平台的意愿,却很少有人去深刻理解http的诞生、成长。

从90年代开始,http作为web的附庸而逐渐成长,这么多年过去了,http的应用领域已经不仅仅局限在web,各种http的变体充斥在各个角落。在这个技术快速迭代的年代,就越需要理解技术的本质。每个技术从业者应该多问以下问题:

放在web领域,也应该问下自己:

介绍

在1999年的RFC 2616是这样描述http的设计目的:

HTTP has been in use by the World-Wide Web global information initiative since 1990.

http从诞生之初,就已经与万维网有不可割舍的血缘关系。因为当时万维网的特性,形成了我们耳熟能详的特性

近二十年来,HTTP/1.1标准的内涵不挺的外延,甚至需要6个RFC来描述整个HTTP协议,他们是:

http 2.0已经蓬勃兴起, google的QUIC(笑称http 3.0)也在实验阶段,他们可能在安全、传输等方面有较大的优化,但是他们并没有给http赋予新的内涵:

HTTP is a generic interface protocol for information systems. It is designed to hide the details of how a service is implemented by presenting a uniform interface to clients that is independent of the types of resources provided. RFC7230

HTTP是一种通用的信息传递协议。对http来讲,Web世界将只是很少的一部分。

从RFC7230开始

先从几个问题开始:

  1. 什么决定了服务端和客户端

  2. 为什么必须要使用空行隔开headerbody

  3. URI是什么?

实际上,这篇RFC解决了七十多个问题,每一个问题都可以写一篇较长的文章来讲,这里分析一下这三个问题:

message格式决定服务端和客户端

标准规定,如果发出的是 response格式的消息,那么就属于server,反之,就是client

仅仅使用数据格式来决定的地位, 为什么不用tcp特性来决定服务端还是客户端问题?

google使用的QUIC是基于UDP实现的HTTP标准(有一定差异)。这就没有办法来通过请求行为来判断是服务端还是客户端,更重要的是,在web世界,各种代理、网关等充斥在各个角落,客户端和服务端的角色经常发生变化,因此,使用格式来决定地位是一个相对不错的解决方案。

这也就是requestresponse消息头不一样的绝对原因(讲道理,可以设计的一样)。

思考HTTP的时候,希望可以脱离那句话来想象:

HTTP是基于TCP的应用层协议

自定义消息头

常见的请求如下:

GET / HTTP/1.0
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5)
Accept: */*

body

常见回复如下:

HTTP/1.0 200 OK 
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
  <body>Hello World</body>
</html>

headerbody中间存在一个empty line。这是因为,标准允许服务端或者客户端自定义消息头,为了区分headerbody,标准通过设置空行来进行区分。在某些需求下,你可以将内容写在header区域,防止body内内容被防火墙或者杀毒软件干掉。

为什么不设置固定的header或者body

http在设计之初,就用于传输各种多媒体信息,因此从一开始,headerbody的内容就没办法进行固定。从目前来看,HTTP承载最多的也是各种信息资源的传递。所以,在这个角度:

http传输某种资源不会是最优的方案,但是一定可以传输任意资源

HTTP灵魂: 资源定位

HTTP发明者Tim Berners-Lee有句名言:

Web users ultimately want to get at data quickly and easily. They don't care as much about attractive sites and pretty design.

对于创始人来说:更快的获取数据是web的唯一使命。

使用URI来描述资源,就是能够简化获取资源的步骤。

那么,URI的结构是什么?URI将永远不变吗?

上一篇 下一篇

猜你喜欢

热点阅读