秒杀系统设计中的数据处理
前两篇文章,从业务端和技术端分析了秒杀系统的构建中我们可以采用的思路。收到部分同学的留言,问了一些细节上的问题,今天会集中整理一下这些问题,作为秒杀系列的一个收尾。
昨天提到了商品详情页要做静态化的问题。实际上,页面上还是有一些动态数据,例如购买人数,购买比例这样的动态数据(见下图),那么问题就来了,在秒杀条件下,这种频繁更新的动态数据一旦数据更新不及时,会有大量的前端请求,透传到后端来,会不会导致超卖呢?
这是一个很好的问题,我这里的答案是,不会的,最终的一致性不是靠前端来完成的。在读的场景下,为了保证系统的整体性能,我们是可以允许一定的“脏数据”,这里的不一致性的影响是很有限的,只会让少量一些原本已经没有库存的下单请求误认为还有库存而已。在达到CAP的过程中,需要有所平衡和取舍,这里就是通过一致性来换取高可用性做平衡,来解决这种高并发的数据读取问题。
从这个问题,我们可以引申出一个我们秒杀系统中读写数据的原则
读数据: 不做强一致性校验,数据通过分层校验来修正。
写数据: 写数据进行强一致性校验,通过限流保护来保证写数据的成功性。
根据这个原则,在秒杀功能中,我们会分层对数据流进行不同的处理方式:
1. 通过CDN,把大量静态不需要检验的数据放在系统之外的地方;减少不必要的流量到服务器端。
2. 预加载用户静态信息,在前端读系统中检验一些基本信息,如用户是否具有秒杀资格、商品状态是否正常、秒杀是否已经结束等;过滤大量无效请求。
3. 在写数据系统中再校验一些如是否是非法请求,写的数据一致性如检查库存是否充足等;
4. 最后在数据库层保证数据最终准确性,避免超卖。
处理并发锁的一个思路
昨天的文章其实已经提到了两个解决的办法,1. 应用层对数据提交排队,走队列,降低并发度。 2. 水平分库,物理上进行分流。
今天再提供一个野路子:
1. 将秒杀产品数据记录A,拆分为10条,A1, A2... A10。
2. 库存数分担到这10条记录中。
3. 订单服务有一个随机函数Rom(),生成订单记录前,根据函数结果决定从某一条记录中扣除库存。
4. 秒杀结束后,通过程序,对订单记录进行一个批量处理,对订单数据进行整合。
这个思路的出发点是以最小的代价降低单条行锁的压力,保证高压下写操作的成功率。当然,这背后是要建立一套产品和订单的归并映射逻辑。
扫描二维码或手动搜索微信公众号【架构栈】: ForestNotes
欢迎转载,带上以下二维码即可