浏览器原理-浏览器缓存和本地存储篇
原文地址
浏览器原理-浏览器缓存和本地存储篇
github
大家好,我是林一一,这是一篇关于浏览器 缓存原理 和 本地存储 的文章,后续回持续推出关于,浏览器原理的文章。
一、浏览器的缓存篇
思维导图
思维导图.png所谓浏览器的缓存,就是浏览器通过
HTTP
请求网络资源后将资源留在本地的一种行为。在页面上点击返回和前进的按钮
就是利用浏览器的缓存。
- 浏览器的缓存分为两种
强缓存
和协商缓存
。 - 浏览器缓存资源的位置放置四个地方
Service Worker, Memory Cache, Disk Cache, Push Cache
。Service Worker
优先级最高到Push Cache
。
浏览器请求资源过程
先本地再服务器(先强缓存再协商缓存)
- 浏览器请求资源时会先去判断本地缓存资源的
header
是否有命中强缓存,如果命中强缓存则直接请求本地的资源,不向服务器发送请求。 - 如果没有命中强缓存或强缓存失效以后就会发送
HTTP
请求服务器,这个过程采用的就是协商缓存
简单的说浏览器的缓存请求分为有无
HTTP
请求两种。
强缓存
所谓的强缓存是我们没有发送
HTTP
请求,而是直接从本地缓存中获取资源的一种行为。成功后返回状态码 200。
- 浏览器是根据响应头的
headers
字段判断Expires/http1.0
,Cache-Control/http1.1
,来执行强缓存的过程。 - 没有或失效的强缓存,浏览器会向服务器发送请求资源。
Expires
http1.0 中一个页面的缓存字段,是一个格林时间。这个时间是浏览器强缓存资源失效的时间
Expires: Wed, 22 Nov 2021 08:41:00 GMT
上面的表示缓存的资源会在
2021年11月22号8点41分
过期。
- 缺点:浏览器是根据本地的时间判断资源是否过期的,但是本地的时间可以被修改,所以在
HTTP1.1
时Expires
被放弃了。
Cache-Control
强缓存.jpgHTTP1.1 中页面的缓存字段。 如果
Expires和Cache-Control
都存在,那么Cache-Control
的优先级更高。
-
Cache-Control
的属性值有很多,其中属性max-age
表示,一个相对的缓存时间
Cache-Control: max-age = 3600
表示距离上次请求的一小时内可以直接使用本地的缓存。不需要再次请求。
- 属性
public
表示可以被浏览器或代理服务器缓存。 - 属性
private
表示只能被浏览器缓存。 - 属性
no-cache
需要发送请求到服务器确认是否被缓存,这需要使用到协商缓存。 - 属性
no-store
表示禁止使用缓存,每一次都需要请求服务器。
协商缓存
所谓协商缓存是指:浏览器携带
缓存的标识 tag
向服务器发送请求,服务器更具携带过来的标识判断是否使用缓存的这个过程就是协商缓存
。
- 浏览器请求服务器返回的结果有两种,一种
304
表示服务器的资源还没有更新直接使用浏览器本地的缓存即可。另一种返回200
,表示服务器资源更新且携带新的资源返回给浏览器。 - 缓存标识
tag
分成两种Last-Modified/If-Modified-Since
和ETag/If-None-Match
,Etag / If-None-Match
的优先级高于Last-Modified
。
Etag / If-None-Match
Etag.jpg- Etag 时服务器响应请求时 返回的一个唯一标识。这个标识只能由服务器产生。
etag: W/"5357d2b3f63545926812b95658505315"
- If-None-Match 时浏览器再次请求服务器时,会携带
Etag
标识值发送给服务器,服务器会将这个值和在服务器中的Etag
比较,两个值相等那么返回304
,如果不相等就返回200
将新的资源返回。
Last-Modified/If-Modified-Since
- Last-Modified,指的是返回请求的资源文件最后在服务器被修改的时间。
Last-Modified: Wed, 23 Nov 2021 08:41:00 GMT
- If-Modified-Since,是浏览器再次请求资源时,会携带上一次返回的
Last-Modified
的时间发送给服务器。服务器将上一次最后修改的时间 和现在的最后修改的时间做对比。如果大于If-Modified-Since
的值,服务器就会返回新的资源 200,否则返回304
。
缓存位置
浏览器缓存位置.jpg上面提到过缓存的位置
Service Worker, Memory Cache, Disk Cache, Push Cache
。Service Worker
优先级最高到Push Cache
- Service Worker 运行在浏览器的独立线程可以实现浏览器的缓存功能,传输协议需要使用
HTTPS
。 - Memory Cache 是将资源缓存在内存中。
- Disk Cache 是将资源缓存在磁盘中
- Push Cache(推送缓存)是 HTTP/2 中,存活在会话
session
中,存活的时间很短。
二、浏览器的本地缓存篇
浏览器的本地缓存主要分为 5 种,
localStorage, sessionStorage, cookie, WebSql, indexedDB
。
cookie
cookie 是服务器生成的,保存到浏览器的一个本地文件中。前端可以通过
Set-Cookie
设置 cookie,前端可以设置多个Set-Cookie
。
- cookie 可以设置过期的时间也可以不设置时间,浏览器关闭后就会失效。
Set-Cookie: BDSVRTM=7; path=/
Set-Cookie: H_PS_PSSID=34130_34099_33969_31253_33848_33607_26350; path=/; domain=.baidu.com
-
cookie 产生原因:是用来做
状态存储
的,因为 http 是无状态的,不能记录数据状态,cookie 可以记录数据的状态。比如用户的id,密码,浏览过的页面等。 - cookie 的优点:1. 记住数据的状态,密码等。2. 弥补的 HTTP 的无状态。
-
cookie 的缺点:1. 容量缺陷,只能存储
4kb
大小;2.安全问题,cookie是以文本的形式在浏览器和服务器之前传递信息,很有可能会被修改。3. 请求的Cookie文件容易被删除。 4. 性能消耗大,cookie 是紧跟域名的,域名下的任意地址被修改都携带cookie到服务器。造成性能浪费。
localStorage
localStorage
存值的方式和 cookie 类似,都会存放在同一个域名下,localStorage 可以长期存储,没有时间的限制。可以通过localStorage.setItem()/getItem()
存取值。
- localStorage 优点:1.扩展了 cookie 的存储大小,可以存放 5M 大小,不同浏览器不同;2.只存储在浏览器不会和服务器之间有通信解决了cookie 的安全问题和性能消耗问题。
-
localStorage 缺点:1.需要手动删除保存的数据;2.只支持字符串类型,JSON 类型需要通过
JSON.stringify()
转化。 - localStorage 使用场景:利用 localStorage 可以存放一些稳定的资源和base64的图片等
sessionStorage
sessionStorage 和 localStorage 一致,唯一大的区别在于 sessionStorage 是会话级别的存储
- 会话级别的
sessionStorage
也就是在浏览器页面关闭后,这个存储也就消失了。 - sessionStorage 的场景:sessionStorage 可以用于保存一些临时的数据,防止页面消失后数据就没了,比如表单填写和用户的浏览器记录等。
indexedDB
浏览器提供的非关系型数据库,indexedDB 提供大量的接口提供查询功能,还能建立查询。
- 以键值对的形式存储值,包括 js 对象
- indexedDB 是异步的,存入数据不会导致页面卡顿。
- indexedDB 支持事务,事务是一系列操作过程中发生了错误,数据库会回退到操作事务之前的状态。
- 同源限制,不同源的数据库不能访问。
- 存储空间没有限制。
webSQL
已废弃,旨在通过 js 语句操控 sql 语句完成对数据的读写。
参考
《图解HTTP》