Polly 故障处理(一): 重试策略
在微服务架构下,我相信大家都应该遇到类似以下问题:
- 某些接口异常,最终造成应用程序池奔溃;
- 某些接口不稳定、偶尔超时,数据获取异常;
- 某些服务不稳定,调用方连接不上;
- 某些服务异常,最终主服务挂掉(雪崩效应);
当然在实际情况下,可能有时我们只需要确保提供给用户的服务是可用状态,不出现 "Service Unavailable" 这样的画面基本上也可以。至于接口偶尔异常,可能对某些类型的项目来说并不太关键,用户可能通过重新请求、刷新页面就可以解决,当然我们还可以在代码层面做兼容,满满的try/catch、for/while 循环解决重试来保证更高的可靠性。
不管这么样,任何异常情况都不是我们期望的,但它却永远存在,”投机取巧“ 终将不是谨慎的做法,随着一个项目关联的微服务越来越多,以上问题会表现得越突出,所以选择一个好的故障处理库或框架变得尤为重要。
这里介绍一个轻量的故障处理库 Polly ,Polly 是一个.NET弹性和瞬态故障处理库,它允许我们以非常顺畅和线程安全的方式来执行诸如重试、断路器、超时、隔离、缓存、后退等策略, 能为我们在微服务架构提供更稳定的服务。当然,目前的 Service Mesh 显得更高大上,而且更强大,它更偏向从运维层面解决以上问题。不过这些都得看项目的需要来决策。
PollyPolly 的使用相对比较简单,当然还是得看项目结构。我们的主项目在调用微服务接口时使用了AOP,类似这种情况下,所以调用微服务的接口都是统一入口,所以我们只需要在AOP内加上 Polly 的一些策略,其他代码不用做任何修改,就可以解决一些问题了。
安装:
Install-Package Polly
使用步骤说明:
- 定义策略
- 执行方法
我们项目中的 Polly 部分代码如下:
public void Intercept(IInvocation invocation)
{
// some code
try
{
// 创建一个策略,如果 invocation.Proceed 的执行出现 Grpc.Core.RpcException 异常,并且 StatusCode == Grpc.Core.StatusCode.Unavailable,则重试一次
var policy = Policy
.Handle<Grpc.Core.RpcException>(t => t.Status.StatusCode == Grpc.Core.StatusCode.Unavailable)
.Retry(); // 默认一次
// 将策略应用到 invocation.Proceed 方法上
policy.Execute(invocation.Proceed);
}
catch (Exception ex)
{
// some code
Console.WriteLine($"{ ex.Message},{ex.StackTrace}");
}
}
策略条件定义
策略的执行需要依赖于条件,Polly 支持对异常与结果进行策略条件定义。
异常
// 指定某个异常
Policy
.Handle<SomeExceptionType>();
// 指定某个异常条件
Policy
.Handle<SomeExceptionType>(ex => ex.xxx == "xxx")
// 指定多个异常
Policy
.Handle<SomeExceptionType1>()
.Or<SomeExceptionType2>()
// 指定多个可能异常条件
Policy
.Handle<SomeExceptionType1>(ex => ex.xxx1 == "xxx")
.Or<SomeExceptionType2>(ex => ex.xxx2 == "xxx")
返回结果
// 指定某个结果
Policy
.HandleResult<ResponseMessage>(r => r.xxx == "xxx")
// 指定多个可能的结果
Policy
.HandleResult<ResponseMessage>(r => r.xxx1 == "xxx")
.OrResult<ResponseMessage>(r => r.xxx2 == "xxx")
重试策略(Retry )
// 指定异常下重试一次
Policy
.Handle<SomeExceptionType>()
.Retry();
// 指定异常下重试3次
Policy
.Handle<SomeExceptionType>()
.Retry(3);
// 指定异常下无限重试
Policy
.Handle<SomeExceptionType>()
.RetryForever();
// 每次重试之间等待指定的时间间隔
Policy
.Handle<SomeExceptionType>()
.WaitAndRetry(new[]
{
TimeSpan.FromSeconds(1),
TimeSpan.FromSeconds(3),
TimeSpan.FromSeconds(7)
});
Retry 可以指定一个要执行的 Action。Action 参数:exception 当前异常信息,retryCount 当前执行第几次,context 当前执行上下文信息。
测试代码:
private static int times = 0;
public static void TestPolicy()
{
var policy = Policy
.Handle<Exception>()
.Retry(3, (exception, retryCount, context) => // 出异常会执行以下代码
{
Console.WriteLine($"exception:{ exception.Message}, retryCount:{retryCount}, id:{context["id"]}, name:{context["name"]}");
});
try
{
// 通过 new Context 传递上下文信息
var result = policy.Execute(Test, new Context("data", new Dictionary<string, object>() { { "id", "1" }, { "name", "beck" } }));
Console.WriteLine($"result:{result}");
}
catch (Exception ex)
{
Console.WriteLine(ex.Message);
}
}
private static string Test()
{
// 每执行一次加1
times++;
// 前2次都抛异常
if (times < 3)
{
throw new Exception("exception message");
}
return "success";
}
测试结果:
retry