2,学习高并发架构
1,原文: https://www.jianshu.com/p/fb46ac667c2a
前言:
高并发经常会发生在有大活跃用户量,用户高聚集的业务场景中,如:秒杀活动,定时领取红包等。
为了让业务可以流畅的运行并且给客户一个好的交互体验,我们需要根据业务场景预估达到的并发量等因素,来设计适合自己业务场景的高并发处理方案。
服务器架构
业务从发展的初期到逐渐成熟,服务器架构也是从相对单一到集群,再到分布式服务,
一个可以支持高并发的服务少不了好的服务架构,需要有负载均衡,数据库主从集群,nosql缓存需要主从集群,静态文件需要上传cdn,这些都是让业务程序流畅运行的强大后盾。
服务器
负载均衡(如: nginx,阿里云SLB)
资源监控
分布式
数据库:
主从分离,集群
DBA表优化,索引优化,等
分布式
nosql
redis
主从分离,集群
mongodb
主从分离,集群
memcache
主从分离,集群
cdn
html
css
js
image
并发测试
高并发相关的业务,需要进行并发的测试,通过大量的数据分析评估出整个架构可以支撑的并发量
测试高并发可以使用第三方服务器或者自己测试服务器,利用测试工具进行并发请求测试,分析测试数据得到可以支撑并发量的评估,这个可以作为一个预警参考,俗话说知己知彼百战不殆;
第三方服务
阿里云性能测试
并发测试工具:
Apache Jmeter
Visual Studio 性能负载测试
Microsoft Web Application Stress Tool
实战方案
通用方案:
日用户流量大,但是比较分散,偶尔会有用户高聚的情况;
场景: 用户签到,用户中心,用户订单,等
服务器架构图:
image
说明:
场景中的这些业务基本都是用户进入APp 后悔操作到的,除了活动日,这些业务的用户量都不会高聚集,同时这些业务相关的表都是大数据表,业务多是查询操作,所以需要减少用户直接命中DB 的查询;优先查询缓存,如果缓存不存在,在进行DB 查询,将查询结果缓存起来。
跟新用户相关缓存需要分布式存储,比如使用用户ID进行进行hash 分组,把用户分布到不同的缓存中,这样一个缓存的集合的总量不会很大,不会影响效率。
方案如:
用户签到获取积分
计算出用户分布的key,redis hash查找出用户今日签到信息
如果查询到签到信息 ,返回签到信息
如果没有查询到,DB 查询今日是否签到过,如果有签到过,就把签到信息同
步到redis 缓存
如果DB中也没有查询到今日的签到记录,就进行签到逻辑,操作DB 添加今日的签到记录,添加到积分(这整个DB操作是一个事务)
缓存签到信息到redis,返回签到信息
注意 这里会有并发情况下的逻辑处理,如: 一天签到多次,发放多次积分给用户
用户订单
这里我们只缓存用户第一页的订单信息,一页40条数据,用户一般也只会看第一页的订单数据
用户访问订单列表,如果是第一页读取缓存,如果不是读DB
计算出用户分布的key,redis,hash中查找用户订单信息
如果查询到用户订单信息,返回订单信息,
如果不存在就进行DB查询第一页的订单数据,然后缓存redis,返回订单信息,
用户中心
计算出用户分布的key,redis hash中查找用户订单信息
如果查询到用户信息,返回用户信息
如果不存在进行用户DB查询,然后缓存redis, 返回用户信息
其他业务
上面的例子多是针对用户存储缓存,如果是公用的缓存数据需要注意一些问题,如下
注意: 公用的缓存数据根据需要考虑并发下的可能会导致大量命中DB 的查询,可以使用管理后台更新缓存,或者DB 查询的锁住操作
以上例子是一个相对简单的高并发架构,并发量不是很高的情况可以很好的支撑,但是随着业务的壮大,用户并发量增加,我们的架构也会进行不断的优化和演变,比如对业务进行服务化,每个业务都有自己的并发架构,自己的均衡服务器,分布式数据库,nosql主从集群,如: 用户服务,订单服务;
消息队列
秒杀,秒抢等活动业务,用户在瞬间涌入产生高并发请求
场景: 定时领取红包,等
服务架构图:
说明:
场景中的定时领取是一个高并发的业务,像秒杀活动用户会在到点的时间涌入,DB瞬间就会接收到一记暴击,hold不住会宕机,然后影响整个业务,
像这种不是只有查询的操作并且会有高并发的插入或者更新数据的业务,前面提到的通用方案就无法支撑,并发的时候直接命中DB;
设计这块业务的时候就会使用消息队列的,可以将参与用户的信息添加到消息队列中,然后再写多个线程程序去消耗队列,给队列中的用户发红包;
方案如:
定时领取红包
一般习惯使用 redis的list
当用户参与活动,将用户参与信息push 到队列中,
然后写个多线程程序去pop数据,进行发放红包的业务
这样可以支持高并发下的用户可以正常的参与活动,并且避免数据库服务器宕机的危险
附加:
通过消息队列可以做很多的服务。
如: 定时短信发送业务,使用sset(sorted set),发送时间戳作为排序依据,短信数据队列根据时间升序,然后写个程序定时循环去读取sset队列中的第一条,当前时间是否超过发送时间,如果超过就进行短信发送;
一级缓存
高并发请求连接缓存服务器超出服务器能够接收的请求连接量,部分用户出现建立连接超时无法读取到数据的问题;
因此需要个方案当高并发时候可以减少命中缓存服务器;
这时候就出现了一级缓存的方案,一级缓存就是使用站点服务器缓存去存储数据,注意只存储部分请求量最大的数据,并且缓存的数据量要控制,不能过分的使用站点服务器内存而影响了站点应用程序的正常运行,一级缓存需要设置秒单位的过期时间,具体时间根据业务场景设定。目的是当有高并发请求的时候可以让数据的获取命中到一级缓存,而不用连接缓存nosql数据服务器,减少nosql 数据服务器的压力
比如APP首屏商品数据接口,这些数据是公共的不会针对用户自定义,而且这些数据不会频繁的更新,像这种接口的请求量比较大的可以加入一级缓存;
服务器架构图:
image
合理的规范和使用nosql 缓存数据库,根据业务拆分缓存数据库的集群,这样基本可以很友好支持业务,一级缓存毕竟是使用站点服务器缓存所以还是要善用;
静态化数据:
高并发请求数据不变化的情况下如果可以不请求自己的服务器获取数据那就可以减少服务器的资源压力。
对于更新频繁度不高,并且数据允许短时间内的延迟,可以通过数据静态化成JSON,XML,HTML等数据文件上传CDN,在拉取数据的时候优先到CDN拉取,如果没有获取到数据再从缓存,数据库中获取,当管理人员操作后台编辑数据再重新生成静态文件上传同步到CDN, 这样在高并发的时候可以是数据的获取命中在CDN服务器上。
CDN节点同步有一定的延迟性,所以找一个靠谱的CDN 服务商也很重要
其他方案:
对于更新频繁度不高的数据,APP,PC浏览器,可以缓存数据到本地,然后每次请求接口的时候上传当前缓存数据的版本号,服务端接收到版本号判断版本号与最新数据的版本号是否一致,如果不一样就进行最新数据的查询并返回最新数据和最新版本号,如果一样就返回状态码告知数据已经更新。 减少服务器压力,资源,宽带。