缓存机制

2018-01-03 本文已影响0人 209bd3bc6844

又上图看出缓存的大致分类
存储策略, 过期策略, 协商策略

HTTP缓存机制

我们先看看关于http header中与缓存有关的key。

key	描述	存储策略	过期策略	协商策略
Cache-Control	指定缓存机制，覆盖其它设置	✔️	✔️
Pragma	http1.0字段,指定缓存机制	✔️
Expires	http1.0字段,指定缓存的过期时间		✔️
Last-Modified	资源最后一次的修改时间			✔️
ETag	唯一标识请求资源的字符串			✔️

强缓存和协商缓存：

浏览器在加载资源时，先根据这个资源的一些http header判断它是否命中强缓存，强缓存如果命中，浏览器直接从自己的缓存中读取资源，不会发请求到服务器。比如某个css文件，如果浏览器在加载它所在的网页时，这个css文件的缓存配置命中了强缓存，浏览器就直接从缓存中加载这个css，连请求都不会发送到网页所在服务器，控制台看请求为200(from cache) 。from cache分为两种from memory cache 和 from disk cache。from memory cache代表使用内存中的缓存，from disk cache则代表使用的是硬盘中的缓存，浏览器读取缓存的顺序为memory –> disk。
当强缓存没有命中的时候，浏览器一定会发送一个请求到服务器，通过服务器端依据资源的另外一些http header验证这个资源是否命中协商缓存，如果协商缓存命中，服务器会将这个请求返回，但是不会返回这个资源的数据，而是告诉客户端可以直接从缓存中加载这个资源，于是浏览器就又会从自己的缓存中去加载这个资源,返回304。
强缓存与协商缓存的共同点是：如果命中，都是从客户端缓存中加载资源，而不是从服务器加载资源数据；区别是：强缓存不发请求到服务器，协商缓存会发请求到服务器。
当协商缓存也没有命中的时候，浏览器直接从服务器加载资源数据。

本地缓存/强缓存

Cache-Control：它藐视一切其他设置, 只要其他设置与其抵触, 一律覆盖之。

Cache-directive	说明
public	可以被所有的用户缓存，包括终端用户和CDN等中间代理服务器。
private	只能被客户端缓存，不允许CDN等中继缓存服务器对其缓存。
no-cache	必须先与服务器确认返回的响应是否被更改，然后才能使用该响应来满足后续对同一个网址的请求。因此，如果存在合适的验证令牌 (ETag)，no-cache 会发起往返通信来验证缓存的响应，如果资源未被更改，可以避免下载。(可以被缓存，但必须验证资源的有效性)
no-store	所有内容都不会被缓存到缓存或 Internet 临时文件中（这才是强制的不缓存）
must-revalidation/proxy-revalidation	如果缓存的内容失效，请求必须发送到服务器/代理以进行重新验证
max-age=xxx (xxx is numeric)	缓存的内容将在 xxx 秒后失效, 这个选项只在HTTP 1.1可用, 并如果和Last-Modified一起使用时, 优先级较高
min-fresh	缓存的资源至少要保持指定时间的新鲜期

默认Cache-Control为public。

Pragma
http1.0字段, 通常设置为Pragma:no-cache, 作用同Cache-Control:no-cache，当我们浏览器控制台勾选☑️ 上disable cache时, 浏览器自动带上了pragma字段。
Expires
即到期时间, 以服务器时间为参考系, 其优先级比 Cache-Control:max-age 低,。

如果没有设置到期时间之类的，文件的缓存时间应该为多少呢？？
header中有一个参数叫Last-Modified ，这个是由服务器自动加上的，如果有这个参数，那么浏览器每次都会重新计算本地的cache。如果浏览器返回一个304的编码就表示资源没有改变，那么浏览器就可以使用本地的cache。
就如参考文档中说的，对于IE来说，如果没有设置expirse header的时候，IE的缓存时间就是一个session的时间，如果用户打开一个新的IE窗口的时候，他们就会获取最新的静态资源。但是对于 firefox来说它就不是这样了，它是依赖last—modified的时间的（HTTP 1.1 spec RFC2616）。

也就是说firefox的失效时间=现在时间+0.1*（time-last-modified ）,就是他将在它上一次修改时间的十分之一的时间差的时候失效。

为什么这么做呢？我们可以想象一个文件越久没有修改，那么它就越稳定，所以缓存的时间也就越长。只是这个时间差要除以下10。

比如一个文件上次修改时间为100天之前，那么那10天后才会失效。

协商缓存

ETag和If-None-Match/If-Match
服务器资源的唯一标识符, 浏览器可以根据ETag值缓存数据, 节省带宽. 如果资源已经改变, etag可以帮助防止同步更新资源的相互覆盖. ETag 优先级比 Last-Modified 高.
Etag由服务器端生成，客户端通过If-Match或者说If-None-Match这个条件判断请求来验证资源是否修改。常见的是使用If-None-Match.请求一个文件的流程可能如下：
====第一次请求===
1.客户端发起 HTTP GET 请求一个文件；
2.服务器处理请求，返回文件内容和一堆Header，当然包括Etag(例如"2e681a-6-5d044840")(假设服务器支持Etag生成和已经开启了Etag).状态码200
====第二次请求===
1.客户端发起 HTTP GET 请求一个文件，注意这个时候客户端同时发送一个If-None-Match头，这个头的内容就是第一次请求时服务器返回的Etag：2e681a-6-5d044840
2.服务器判断发送过来的Etag和计算出来的Etag匹配，因此If-None-Match为False，不返回200，返回304，客户端继续使用。或者If-Match为true，返回200。

那什么时候是本地缓存什么时候是协商缓存呢?
如果浏览器和服务器都有缓存的话
我们浏览器会先看本地的是否过期。那么缓存服务器什么时候起作用呢？
不是说有了缓存之后，浏览器的每次请求都会请求本地缓存。主要看重新请的的方式是什么
浏览器缓存刷新

在地址栏中输入网址后按回车或点击转到按钮
浏览器以最少的请求来获取网页的数据，浏览器会对所有没有过期的内容直接使用本地缓存，从而减少了对浏览器的请求。所以，Expires，max-age标记只对这种方式有效。
按F5或浏览器刷新按钮
~~浏览器会在请求中附加必要的缓存协商，但不允许浏览器直接使用本地缓存，它能够让 Last-Modified、ETag发挥效果，但是对Expir，es无效。~~

F5 or Control + R = Reload the current page // 本地缓存没过期就使用本地缓存
Control+Shift+R or Shift + F5 = Reload your current page, ignoring cached content

按Ctrl+F5或按Ctrl并点击刷新按钮
这种方式就是强制刷新，总会发起一个全新的请求，不使用任何缓存。

cache_docs
彻底理解浏览器的缓存机制

服务器缓存

常见的服务器缓存为CDN缓存。
CDN：内容分发网络，源站内容分发至最接近用户的节点，使用户可就近取得所需内容。
CDN缓存，不仅可以缓存img，js，css之类的，还可以缓存一些MP4之类的大文件。可以加快用户的访问。就相当于离你很近的源服务器。如果源服务器的资源需要改动，那么需要同步到CDN服务器，CDN刷新：是指URL刷新 & 目录刷新，也可以设置CND隔一段时间自动刷新。
http请求头的Age表明了命中了服务器缓存。

H5缓存

前端本地缓存
 localStorage缓存机制

localStorage缓存在pc端并没有得到广泛使用，因为PC上因为localstorage兼容性不好，而且网速较快，因此实用价值不大
移动端单页面应用(webapp)，因为localstorage兼容性好，网速慢，所以值得尝试

浏览器并发限制