http缓存机制及原理

2021-03-09  本文已影响0人  明明你也一样

无缓存,原始模型

缺点:

有缓存,无更新

缺点:

有缓存,Expires 更新机制

浏览器和服务器约定文件过期时间,浏览器第一次请求 a.jpg 时服务器会发送完整的文件,但是服务器在发送文件的时候还附带发送一些额外信息——过期时间,用 Expires 字段来控制,时间是 GMT 格式的标准时间,如 Expires: Fri, 01 Jan 2021 00:00:00 GMT

优点:

缺点:

有缓存,Expires + Last-Modified 更新机制

为了解决上个方案的问题,服务器和浏览器协商,制定了一种方案,服务器每次返回 a.js 的时候,还要告诉浏览器 a.js 在服务器上的最近修改时间 Last-Modified (GMT标准格式)。

优点:

缺点:

添加 Cache-Contorl 相对时间控制

为了兼容已经实现了上述方案的浏览器,同时加入新的缓存方案,服务器除了告诉浏览器 Expires ,同时告诉浏览器一个相对时间 Cache-Control:max-age=10秒。意思是在10秒以内,使用缓存到浏览器的 a.js 资源。
浏览器先检查 Cache-Control,如果有,则以 Cache-Control 为准,忽略 Expires。如果没有 Cache-Control,则以 Expires 为准。可以看出 Cache-Control 对缓存的控制粒度更细。具体参看Cache-Control MDN

添加 Etag 文件内容对比

为了解决文件修改时间只能精确到秒带来的问题,我们给服务器引入 Etag 响应头。也就是说 a.js 内容变了,Etag 才变。内容不变,Etag 不变,可以理解为 Etag 是文件内容的唯一 ID。
同时引入对应的请求头 If-None-Match,每次浏览器请求服务器的时候,都带上If-None-Match字段,该字段的值就是上次请求 a.js 时,服务器返回给浏览器的 Etag。

不缓存 index.html 的原因

http 缓存机制存在一个问题——浏览器无法主动得知服务器上的 a.js 资源变化。

不管用 Expires 还是 Cache-Control,他们都只能够控制缓存是否过期,但是在缓存过期之前,浏览器是无法得知服务器上的资源是否变化的。只有当缓存过期后,浏览器才会请求服务器。

想象一些我们浏览网页的场景,我们一般都是输入网址,访问一个 html 文件,html文件中会引入 js、css 、图片等资源。

我们不让 html 文件缓存,那么每次访问浏览器都会请求服务器,所以浏览器每次都能拿到最新的 html 资源。资源更新的时候,比如 a.js 文件产生变动,我们只需更改 a.js 文件资源的版本号:

<script src="http://test.com/a.js?version=0.0.1"></script>

或者在文件末尾添加 hash 值:

<script src="http://test.com/jQuery-edb203c114.10.2.js"></script>

这样,通过设置 html 不缓存,html 引用资源内容变化则改变资源路径的方式,就解决了无法及时得知资源更新的问题。使用webpack打包的话,借助插件可以很容易处理。

与 http 缓存相关的头信息

Expires

响应头,代表该资源的过期时间。

如果在Cache-Control响应头设置了 "max-age" 或者 "s-max-age" 指令,那么 Expires 头会被忽略。

Cache-Control

请求/响应头,通用消息头字段,被用于在http请求和响应中,通过指定指令来实现缓存机制。

缓存指令是单向的,这意味着在请求中设置的指令,不一定被包含在响应中。

If-Modified-Since / Last-Modified

请求头/响应头,资源最近修改时间,分别用于浏览器和服务器。

Etag

响应头,资源标识,由服务器告诉浏览器。

If-None-Match

请求头,缓存资源标识,值为 Etag ,由浏览器告诉服务器。

上一篇下一篇

猜你喜欢

热点阅读