微服务的一些划分思想
1. 服务的粒度划分需要把控好。我的习惯是先按照领域来分不会错,随着项目的进展慢慢进行更细粒度的拆分。
比如互联网金融 P2P 业务,一开始可以分为:
a. 三方合作服务 PartnerInvestService:对接合作的三方理财平台的流量
b. 普通投资服务 NormalInvestService:最普通形态的资产的主流程
c. 预约投资产品服务 ReserveInvestService:需要预约投资的资产的主流程
d. 周期性计划产品服务 AutoInvestService:会定期自动复投的理财产品主流程
e. 投资人交易服务 TradeService:专门负责处理投资人的交易行为,比如投资
f. 借款人交易服务 LoanService:专门负责处理借款人的交易行为,比如还款
g. 用户服务 UserService:处理用户的注册登录等
h. 资产服务 ProjectService:处理资产和标的相关
i. 账户账务服务 AccountService:处理用户的账户各个子账户和账务记录
j. 营销活动服务 ActivityService:处理各种活动、用户的积分体系
k. 会员体系服务 VipService:处理用户的会员成长体系
l. 银行存管服务 BankService:专门用于对接银行存管系统
m. 电子签章服务 DigSignService:专门用于对接三方数字签章系统
n. 消息推送服务 MessageService:专门用于对接三方短信通道和推送 SDK
2. 服务一定是立体的,不是在一个层次上的,如上,我们的服务有三个层次:
a. 聚合业务服务:高层次的串起来整个流程的具有完整业务形态的业务服务。和
基础业务服务不同的是,这里是在完整描述一方面的业务,这个业务往往是由
各种基础业务拼装组合起来的。和不同外部合作方的不同合作形式,给用户提
供的产品的不同服务形态,都决定了聚合业务服务会有业务流程上的差异化,
如果把此类服务下放到基础业务服务中,那么基础业务服务会有各种 if-else
逻辑(根据产品类型、用户类型进行各种 if-else),随着业务的合作不合作,
需求变动,基础业务服务会腐化得很厉害,为了避免这个情况,我们把变动的
多的聚合业务逻辑放到独立的业务服务中。
一般而言,聚合业务服务因为代表了独立的业务流程,它们之间是不会进行相互调用的,但是它们一定会调用大量的各类基础业务服务。在第一点里说的标有蓝色字体的 a~d 这些服务都是此类服务。这个层次的服务的业务逻辑更多是在表达业务流程的复杂性和差异性,不会涉及到具体怎么处理账户信息、账务信息、用户信息,不会涉及到怎么处理具体的投资人和借款人的交易。比如对于预约这类业务形态,它关注的是先要预约资产,然后再由系统进行自动投资,底层完全依赖于投资人交易服务来做整个交易的过程。
b. 基础业务服务:某一个领域业务相关的服务。此类服务之间是允许相互调用
的,比如投资人交易服务和借款人交易服务免不了需要和用户服务、资产服
务、账户账务服务进行通讯做相关的用户信息查询、标的信息查询、记账等业
务操作。之所以投资人交易服务和借款人交易服务定位为基础业务服务是因
为,它们处理的是还是某一个具体方面的业务,并不是全流程,在这个抽象层
次上,业务不是那么容易变动的,对于复杂的各种业务形态(比如预约交易、
自动复投交易、等额本息交易)会在这些服务之上形成聚合业务服务。
在第一点里的 e~k 这些服务都是此类服务。在这个层次的服务虽然拥有大量的业务逻辑,但是其实已经享受到了很大层度的公共基础服务的重用了,而且和自己业务耦合较弱的额外逻辑往往没有在本服务中堆积,由更多专职的基础业务服务来承担了这部分逻辑。
c. 公共基础服务:负责某一个方面的基础业务(没有什么领域业务逻辑在里面),可以是自治的处理某一个方面的基础业务,也可以和外部通讯实现某一个方面的功能,服务之间是不会相互调用的,但是会被聚合业务服务和基础业务服务调用。在第一点里的 l~n 这些服务都是此类服务。如果以后和外部的合作有变动,因为我们已经定义了对外的服务契约,可以轻易替换这个服务来更换合作的第三方,系统其余的地方几乎不需要修改。所有的三方对接都建议独立出公共基础服务,如果同一个业务对接多个三方渠道,比如推送对接了极光和个推,甚至公共基础服务还可以由一个抽象聚合的推送服务,下面再路由到具体的极光推送和个推推送服务。
3. 每一个服务对接的底层数据表是独立的没有交叉关联的,也就是数据结构是不直接对外的,需要使用其他服务的数据一定通过访问接口进行。好处也就是面向对象设计中封装的好处:
a. 可以很方便地重构底层的数据结构甚至是数据源,只要接口不变,外部不会感知到。
b. 性能有问题的情况下需要加缓存、分表、拆库、归档是比较方便的事情,毕竟数据源没有外部依赖。
说白了就是我的数据我做主,我想怎么搞外面管不着,在重构或是做一些高层次技术架构的时候,没有底层数据被依赖,这太重要了。当然,坏处或是麻烦的地方就是跨服务的调用使得数据操作无法在一个数据库事务中完成,这并不是什么大问题,
一是因为我们这种拆分方式并不会让粒度太细,大部分的业务逻辑是在一个业务服务里完成的
二是后面会提到跨服务的调用不管是通过 MQ 进行的还是直接调用进行的,都会有补偿来实现最终一致性。
4. 考虑到跨机器跨进程调用服务稳定性方面的显著差异。在方法内部进行方法调用,我们需要考虑调用出现异常的情况,但是几乎不需要考虑超时的情况,几乎不需要考虑请求丢失的情况,几乎不需要考虑重复调用的情况,对于远程服务调用,这些点都需要去重点考虑,否则系统整体就是基本可用,测试环境不出问题,但是到了线上问题百出的状态。这就要求对于每一个服务的提供和调用多问几个上面的问题,细细考虑到因为网络问题方法没有执行多次执行或部分执行的情况:
a. 我们在对外提供服务的时候,不但要告知用户服务提供的业务能力,还要告知用户服务的特性
比如是否是幂等的(对于订单类型的操作服务,相同的订单相同的操作强烈建议是幂等的,这样调用方可以放心进行重试或补偿);
是否需要外部进行补偿(在这里你可能说为什么需要外部进行补偿,服务就不能自己补偿吗,对于内部的子逻辑服务当然可以自己补偿,但是有的时候因为网络原因请求就没有到服务端,服务端一无所知这个调用当然无从去补偿);
是否有频控的限制;
是否有权限的限制;
降级后的处理方式等等。
b. 反过来,我们调用其它服务也需要多问几句目标服务的特性,针对性进行设计相应的补偿逻辑、一致性处理逻辑和降级逻辑。我们必须考虑到有些时候并不是服务端的问题,而是请求根本没有到达服务端。
c. 服务本身往往也会有复杂的逻辑,作为客户端的身份调用大量外部的服务,所
以服务端和客户端的角色不是固定不变的,当我们的服务内部有许多客户端来
调用服务端的时候,对于每一个子逻辑我们都需要仔细考虑每一个环节。否则会出现的情况就是,这个服务是部分逻辑幂等的或是部分逻辑是具备最终一致性的。
如果你说,这么多服务,我在实现的时候很难考虑到这些点,我完全不去考虑分布式事务、幂等性、补偿,行不行?也不是不可以,那么业务在线上跑的时候一定会是千疮百孔的,如果整个业务的处理对可靠性方面的要求不高或是业务不面向用户不会受到投诉的话,这部分业务的是可以暂时不考虑这些点,但是诸如订单业务这种核心的不允许有不一致性的业务还是需要全面考虑这些点的。
5. 考虑到跨机器跨进程调用服务数据传输方面的显著差异。对于本地的方法调用,如果参数和返回值传的是对象,那么对于大部分的语言来说,传的是指针(或指针的拷贝),指针指向的是堆中分配的对象,对象在数据传输上的成本几乎忽略不计,也没有序列化和反序列化的开销。对于跨进程的服务调用,这个成本往往不能忽略不计。
如果我们需要返回很多数据,往往接口的定义需要进行特殊的改造:
a. 通过使用分页的形式,一次返回固定的少量数据,客户端按需拉取更多数据。
b. 可以在参数中传类似于 EnumSet 的数据结构,让客户端告知服务端我需要什
么层次的数据,比如 GetUserInfo 接口可以提供给客户端 BasicInfo、VIPInfo、
InvestData、RechargeData、WithdrawData,客户端可以按需从服务端拿
BasicInfo|VipInfo。
6. 这里还引申出方法粒度的问题,比如我们可以定义 GetUserInfo 通过传入不用的参数来返回不同的数据组合,也可以分别定义 GetUserBasicInfo、GetUserVIPInfo、GetUserInvestData 等等细粒度的接口,接口的粒度定义取决于使用者会怎么来使用数据,更趋向于一次使用单种类型数据还是复合类型的数据等等。
7. 然后我们需要考虑接口升级的问题,接口的改动最好是兼容之前的接口,如果接口需要淘汰下线,需要先确保调用方改造到了新接口,确保调用方流量为 0 观察一段时间后方能从代码下线老接口。一旦服务公开出去,要进行接口定义调整甚至下线往往就没有这么容易了,不是自己说了算了。所以对外 API 的设计需要慎重点。
8. 最后不得不说,在整个公司都搞起了微服务后,跨部门的一些服务调用在商定 API 的时候难免会有一些扯皮的现象发生,到底是我传给你呢还是你自己来拉,这个数据对我没用为什么要在我这里留一下呢?抛开非技术层面的事情不说,这些扯皮也是有一些技术手段来化解的:
a. 明确服务职责,也就明确了服务应该感知到什么不应该感知到什么。
b. 跨部门的服务交互的接口定义可以定的很轻,采用只有一个订单号的接口或
MQ 通知+数据回拉的策略(谁数据多谁提供数据接口,不用把数据一次性推
给下游)。
c. 数据提供方可以构建一套通用数据接口,这样可以满足多个部门的需求,无需
做定制化的处理。甚至在接口上可以提供落地和不落地两种性质的透传。
可能看到这里觉得很头晕,为什么微服务需要额外考虑这么多东西,实现的复杂度一下子上升了。我们需要换一个角度来考虑这个事情:
-
我们不需要在一开始的时候对所有逻辑都进行严密的考虑,先覆盖核心流程核心逻辑。因为跨服务成为了服务的提供方和使用方,相当于除了我自己,还有很多其它人会来关系我的服务能力,大家会提出各种问题,这对设计一个可靠的方法是有好处的。
-
即使在不跨服务调用的时候我们把所有逻辑堆积在一起,也不意味着这些逻辑一定是事务性的,实现严密的,跨服务调用往往是一定程度放大了问题产生的可能性。
-
我们还有服务框架呢,服务框架往往会在监控跟踪层次和运维系统结合在一起提供很多一体化的功能,这将封闭在内部的方法逻辑打散暴露出来,对于有一个完善的监控平台的微服务系统,在排查问题的时候你往往会感叹这是一个远程服务调用就好了。
-
最大的红利还是之前说的,当我们以清晰的业务逻辑形成了一个立体化的服务体系之后,任何需求可以解剖为很少量的代码修改和一些组合的服务调用,而且你知道我这么做是不会有任何问题的,因为底层的服务 ABCDEFG 都是经过历史考验的,这种爽快感体验过一次就会大呼过瘾。
但是,如果服务粒度划分的不合理,层次划分的不合理,底层数据源有交叉,没考虑到网络调用失败,没考虑到数据量,接口定义不合理,版本升级过于鲁莽,整个系统会出各种各样的扩展问题性能问题和 Bug,这是很头痛的,这也就需要我们有一个完善的服务框架来帮助我们定位各种不合理,后面会再具体介绍服务治理这块。