浏览器缓存机制
浏览器缓存分为强缓存和协商缓存。
强缓存
浏览器加载资源时,会先根据本地缓存资源 header 中的信息(expires和cahe-control)判断是否命中强缓存,如果命中则直接使用缓存中的资源,不会再向服务器发送请求。
Expires
该字段是 HTTP1.0 时的规范,他指定一个过期时间,比如 expires: Sat, 07 Mar 2020 08:47:27 GMT。在此时间之前都不过期。不过这种方式有一个明显的缺点,当服务器与客户端时间偏差较大时,就会导致缓存混乱。所以 HTTP1.1 引入了Cache-Control来克服Expires头的限制。
Cache-Control
Cache-Control 是 HTTP1.1 时出现的 header 信息,主要是利用该字段的 max-age 值来进行判断,它是一个相对时间,例如Cache-Control:max-age=3600,代表着资源的有效期是 3600 秒。Cache-Control除了该字段外,还有下面几个比较常用的设置值:
no-cache:需要进行协商缓存,强制要求缓存发送请求到服务器确认是否使用缓存(即这次请求不走强缓存,中间代理服务器缓存也不管)。
no-store:禁止使用缓存,每一次都要重新请求数据(强缓存和协商缓存都不走)。
public:可以被所有的用户缓存,包括终发送请求的客户端和 CDN 等中间代理服务器。
private:只能被终端用户的浏览器缓存,不允许 CDN 等中继缓存服务器对其缓存。
Cache-Control 与 Expires 可以在服务端配置同时启用,同时启用的时候 Cache-Control 优先级高。
协商缓存
当强缓存没有命中的时候,浏览器会发送请求到服务器,服务器根据 header 中的信息来判断是否命中缓存。如果命中,则返回 304告诉浏览器资源未更新,可使用本地的缓存。
这里的 header 中的信息指的是 Last-Modify/If-Modify-Since 和 ETag/If-None-Match.
Last-Modify/If-Modify-Since
浏览器第一次请求资源的时候,服务器返回的 header 中会加上Last-Modify,标识该资源的最后修改时间。
当浏览器再次请求该资源时,request 的请求头中会包含 If-Modify-Since,该值为缓存之前返回的 Last-Modify。服务器收到 If-Modify-Since 后,根据资源的最后修改时间判断是否命中缓存。
如果命中缓存,则返回 304,并且不会返回资源内容。
缺点:
短时间内资源发生了改变,Last-Modified 并不会发生变化。
周期性变化。如果这个资源在一个周期内修改回原来的样子了,我们认为是可以使用缓存的,但是 Last-Modified 可不这样认为,因此便有了 ETag。
ETag/If-None-Match
与 Last-Modify/If-Modify-Since 不同的是,Etag/If-None-Match 返回的是一个校验码。ETag 可以保证每一个资源是唯一的,资源变化都会导致 ETag 变化。服务器根据浏览器上送的 If-None-Match 值来判断是否命中缓存。
Last-Modified 与 ETag 是可以一起使用的,服务器会优先验证 ETag,一致的情况下,才会继续比对Last-Modified,最后才决定是否返回 304。
缓存的位置和查找的顺序
资源会缓存到内存和硬盘中。
memory cache | disk cache |
---|---|
一般js、字体、图片会存在内存当中 | 一般非脚本会存在硬盘当中,如css等 |
因为CSS文件加载一次就可渲染出来,我们不会频繁读取它,所以它不适合缓存到内存中,但是js之类的脚本却随时可能会执行,如果脚本在磁盘当中,我们在执行脚本的时候需要从磁盘取到内存中来,这样IO开销就很大了,有可能导致浏览器失去响应。
查找的顺序
查找时先在内存中查找,如果有,直接加载。
如果内存中不存在,则在硬盘中查找,如果有直接加载。
如果硬盘中也没有,那么就进行网络请求。
总结
当浏览器再次访问一个已经访问过的资源时,它会这样做:
1.看看是否命中强缓存,如果命中,就直接使用缓存了。
2.如果没有命中强缓存,就发请求到服务器检查是否命中协商缓存。
3.如果命中协商缓存,服务器会返回 304 告诉浏览器使用本地缓存。
4.否则,返回最新的资源。