007-2271-不出局

接口级故障的应对方法

2019-03-20  本文已影响10人  短暂瞬间

第79篇

极客时间《从0开始学架构》课程笔记。

什么是接口级故障?

异地多活方案主要是应对影响大但发生概率较小的系统级故障,而发生概率更高但故障影响较小的故障就是接口级的故障。
接口级故障的典型表现:业务出现问题,但不是系统宕机或网络中断,比如响应慢、访问超时、访问异常、无法连接数据库等。

接口级故障原因

接口级故障的应对方法

核心思想:优先保证核心业务、优先保证绝大部分用户

应对方法一:降级

定义:系统将某些业务或者接口的功能降低,可以是只提供部分功能,也可以是完全停掉所有功能。核心思想就是丢车保帅,优先保证核心业务。

两种降级方式:

  1. 系统后门降级
  1. 独立降级系统

应对方法二:熔断

定义:当本系统依赖的外部系统接口出现响应慢的情况时,立即返回错误,避免本系统被拖慢或拖死。降级的目的是应对系统自身的故障,而熔断的目的是应对依赖的外部系统故障的情况。

实现关键:需要一个统一的API调用层,由API掉用层进行采样或统计;需确定一个熔断阈值。

应对方法三:限流

定义:从用户访问压力的角度着手,只允许系统能够承受的访问量进来,超出系统访问能力的请求将被丢弃。

常见的两类限流方式:

  1. 基于请求限流
  1. 基于资源限流

应对方法四:排队

定义:限流的一个变种,限流是直接拒绝用户,排队则是让用户等待一段时间。如12306网站抢票排队。

实现方式:

上一篇 下一篇

猜你喜欢

热点阅读