在之前的一篇博文中,cap框架可以方便我们实现非实时、异步场景下的最终一致性,而有些用例总是无法避免的需要在实时、同步场景下进行,可以借助saga事务来解决这一困扰。在一些博文和仓库中也搜寻到了.net下实现saga模式的解决方案masstransit,这就省得自己再造轮子了。
分布式事务
分布式系统中,分布式事务是一个不能避免的问题,如何保证不同节点间的数据一致性。举个常见的例子,下订单、减库存、扣余额,三者在单个节点时,可以借助本地事务,实现要么成功要么失败。而当三者处于不同节点时,又参杂了如网络环境、节点自身环境、服务环境等各种因素,使得三个节点想要实现要么成功、要么失败就增加了许多困难。
cap理论和base理论很好的诠释了这一问题,也有了许多的解决分布式事务的方案,如2pc、3pc、tcc、本地消息表、saga等一系列解决方案,面对不同场景、不同要求等可选择不同的解决方案。
数据一致性 | 容错性 | 复杂性 | 性能 | 维护成本 | |
---|---|---|---|---|---|
2pc | 强 | 低 | 中 | 低 | 低 |
3pc | 强 | 低 | 高 | 低 | 中 |
tcc | 弱 | 高 | 高 | 中 | 高 |
本地消息表 | 弱 | 高 | 低 | 中 | 中 |
mq事务 | 弱 | 高 | 低 | 高 | 中 |
saga事务 | 弱 | 高 | 高 | 中 | 高 |
在之前提到过一个基于本地消息表的cap框架,借助最终一致性很方便的解决了异步非实时请求下的分布式事务,而对于大部分场景虽然可以直接或者妥协方式使用着异步非实时,如同步实时场景的下订单且减库存变更到异步非实时场景的下订单后发事件减库存,但是总有那么一些场景,不得不去考虑同步实时请求下的分布式事务。
saga模式
saga模式又叫做长时间运行事务(long-running-transaction), 由普林斯顿大学的 hector garcia-molina和kenneth salem 1987年发表的论文《sagas》。核心思想是将长事务拆分为多个本地短事务,通过保证所有短事务的成功或失败来决定整体的成功或失败,由saga事务协调器协调管理,所有节点执行成功,则成功,如有节点失败,则反向执行前置节点的补偿操作。
- 每个saga事务由一系列幂等的有序子事务(sub-transaction) ti 组成。
- 每个ti 都有对应的幂等补偿动作ci,补偿动作用于撤销ti造成的结果。
执行过程
当正常执行时,依照t1、t2、t3三个短事务正常执行下去,直到最后一个tn事务执行完毕,宣告整个事务的成功。
而当执行到某个tj出现故障时,则反向补偿之前的tj-1..t1,每个对应的补偿操作cj-1...c1,其中tj事务由于在执行阶段就已失败,所以tj对应的补偿动作cj不需要执行,即也确定了最后一个tn事务可以不设置补偿动作cn。
恢复策略
- 向前恢复(forward recovery):对于ti事务的执行,部分场景下可能因为数据库的连接、网络的波动等导致短暂的失败,对ti事务重试执行,以确保整个事务的执行,如执行t1, t2, t3,当执行t3失败时,不直接宣告失败,对t3执行重试以排除部分不稳定因素,如在若干次重试无效后,再考虑向后恢复。
- 向后恢复(backward recovery):按照执行顺序方式作为向前的指向,则向后为反向补偿,对已执行过的节点顺序倒退执行各ti的补偿动作ci,也就是把走过的路往回走,对执行过的操作执行业务上的反操作,如正向流程执行减库存则补偿操作时执行加库存。
协作方式
对于服务与服务间的协作,我们通常有两种模式:orchestration(编排式) 和 choreography(协同式),在saga模式中也有着这两种的实现。
- 编排式(orchestrator):把 saga 的决策和执行顺序逻辑集中在一个 saga 编排器类中。saga 编排器发出命令式消息给各个 saga 参与方,指示这些参与方服务完成具体操作(本地事务)。
- 协同式(choreography):把 saga 的决策和执行顺序逻辑分布在 saga 的每个参与方中,它们通过交换事件的方式来进行沟通。
编排式与协同式的差异仅在于服务之间的协作方式,每个参与服务的接口定义却没有任何区别。
编排式(orchestrator)
编排式的 saga 需要开发人员定义一个编排器类,用于编排一个saga中多个参与服务执行的流程。如果整个业务流程正常结束,业务就成功完成,一旦这个过程的任何环节出现失败,saga编排器类就会以相反的顺序调用补偿操作,重新进行业务回滚。
对于每个参与的服务而言,需要做的事情是
- 订阅并处理命令消息
- 执行命令后返回响应消息
- 设计执行逻辑和补偿逻辑
以提交订单为例,假设场景是分布式系统下,进程间以消息传递进行通信:
1、事务发起方的主业务逻辑请求预先定义好的saga编排器类(内部编排了执行顺序)。
2、saga编排器类向mq发送减库存事件,库存服务订阅事件、执行处理并返回mq处理结果。
3、saga编排器类向mq发送减余额事件,支付服务订阅事件、执行处理并返回mq处理结果。
4、saga编排器类向mq发送创建订单命令,订单服务订阅事件并按照命令创建订单。
5、主业务逻辑接收并处理saga编排器类处理结果。
6、整个过程由saga 编排器类对接收到的回复进行判决,来决定是继续执行还是悬崖勒马。
协同式(choreography)
没有集中式的编排类,而是各参与方间相互订阅,一个服务订阅另一个服务的事件。
先由事务发起方执行逻辑并发布一个事件,该事件被一个或多个服务进行订阅,这些服务执行本地数据库操作并发布(或不发布)新的事件,该部分需要保证本地数据库的操作成功且写入mq的消息也成功,可考虑使用本地消息表或是基于mq事务。当最后一个服务执行本地事务并且不发布任何事件或者发布的事件没有被任何saga参与者订阅意味着事务结束,则整个业务流程的分布式事务完成。如果某一服务出现故障,那么则反向发布事件,执行补偿操作,以此回滚。
以提交订单为例,假设场景是分布式系统下,进程间以消息传递进行通信:
1、事务发起方执行主业务逻辑发送提交订单命令。
2、库存服务订阅事件、扣减库存并发布已扣减事件。
3、订单服务订阅库存已扣减事件,创建订单并发布订单已创建事件。
4、支付服务订阅订单已创建事件,执行支付并发布订单已支付事件。
5、主业务逻辑订阅订单已支付事件并处理。
当某服务内执行时如存在异常,则反向发布事件,如订单创建失败,则发布ordercreatedfailed事件,库存服务订阅该事件并执行补偿操作。
相比而言,编排式中参与服务无需向协同式中订阅上游服务的事件,减少了服务间对事件协议的依赖,而只需要关心集权的编排器类发送的消息。
masstransit courier
masstransit courier是一种用于创建和执行带有故障补偿的分布式事务的机制,它可以用于满足本地事务的需求,也可以在分布式系统中实现分布式事务。
courier实现了routing slip模式,通过有序组合一系列的activity,得到一个routing slip。每个activity都有 execute 和 compensate 两个方法(最后一个可以只有一个execute方法)。compensate即为补偿操作。
补偿服务
当开启一个事务前,需要做一些准备,准备一个事务id,记录整个事务执行情况,各tj事务执行情况,当前请求上下文参数,入参参数记录等,以方便执行补偿操作时需要用到。如当tj事务执行失败时,需要对cj-1到c1执行补偿操作,此时各补偿操作需要一些正向执行t1,tj-1的请求参数或执行结果,因此都需要记录下来。
在courier中,通过routing slip来完成这些记录,创建一个guid,记录请求上下文参数信息,可以绑定几个内置事件,在各阶段到来时会发送事件,如有需要可以订阅。
var builder = new routingslipbuilder(newid.nextguid()); builder.addsubscription(context.receivecontext.inputaddress, routingslipevents.completed | routingslipevents.faulted | routingslipevents.compensationfailed); builder.addvariable("requestid", context.requestid); builder.addvariable("responseaddress", context.responseaddress); builder.addvariable("faultaddress", context.faultaddress); builder.addvariable("request", context.message); //组合一系列activity var routingslip = builder.build(); await context.execute(routingslip).configureawait(false);
服务建立
弄了个demo,建立了三个服务,此处我使用编排式来完成,但无论是选用编排式还是协同式,都借助rabbitmq实现消息传递。
每个服务都安装了masstransit相关的包
masstransit.aspnetcore masstransit.rabbitmq
将saga编排器类放置在orderservice中了,对于编排器类的放置,个人认为是应该看用例的主服务是谁而放置,想过放在bff去协调三个服务,但是总是感觉不是bff的职责范围。
服务配置
在各服务中对masstransit配置,如下在orderservice中对masstransit需要使用到的rabbitmq配置,对需要进行多个服务协作的用例配置routing slip,对消息队列侦听订阅需要的事件并配置相应的activity处理。
services.addmasstransit(x => { var currentassembly = assembly.getexecutingassembly(); x.addactivities(currentassembly); x.addconsumers(currentassembly); x.addrequestclient<createordercommand>(); x.usingrabbitmq((context, cfg) => { // 配置rabbitmq cfg.host(configuration["rabbitmqconfig:hostip"], ushort.parse(configuration["rabbitmqconfig:hostport"]), configuration["rabbitmqconfig:virtualhost"], h => { h.username(configuration["rabbitmqconfig:username"]); h.password(configuration["rabbitmqconfig:password"]); }); //配置routing slip cfg.receiveendpoint("createordercommand", ep => { ep.configureconsumer<createorderrequestproxy>(context); ep.configureconsumer<createorderresponseproxy>(context); }); // 配置订阅队列及handler处理 cfg.receiveendpoint("createorder_execute", ep => { ep.executeactivityhost<createorderactivity, createordermodel="">(context); }); }); }); services.addmasstransithostedservice();
服务编排
构建routing slip,此处依据用例的需求,对需要协作的服务编排,组合一系列的activity。
task buildroutingslip(routingslipbuilder builder, consumecontext<createordercommand> request) { builder.addactivity("reducestock", new uri("..."), new {}); builder.addactivity("deductbalance", new uri("..."), new {}); builder.addactivity("createorder", new uri("..."), new { }); return task.completedtask; }
执行请求
当请求进入后,通过requestclient发送createordercommand,同步等待执行结果,再由编排器类负责协调预设好的activity,发送事件到消息队列,经各activity订阅处理最终返回结果。
[route("[controller]")] public class ordercontroller : controllerbase { private readonly irequestclient<createordercommand> _createorderclient; public ordercontroller(irequestclient<createordercommand> createorderclient) { _createorderclient = createorderclient; } [httpget("createorder")] public async task<commoncommandresponse<createorderresult>> createorder() { var result = await _createorderclient.getresponse <commoncommandresponse<createorderresult>>(new createordercommand() { // ... }); return result.message; } }
各服务中对于activity设置侦听队列以及请求信息,调用execute执行逻辑,当出现异常时返回到mq通知编排器类,在对之前执行的activity执行compensate。如在createorderactivity中执行异常,由编排器类执行补偿,reducestockactivity调用compensate,执行增加库存逻辑
public class reducestockactivity : iactivity<reducestockmodel, reducestocklog> { public async task<executionresult> execute(executecontext<reducestockmodel> context) { var argument = context.arguments; // 扣减库存 await task.delay(100); return context.completed(new reducestocklog() { productid = argument.productid, amount = 1 }); } public async task<compensationresult> compensate(compensatecontext<reducestocklog> context) { // 增加库存 await task.delay(100); return context.compensated(); } }
执行成功
用例请求执行后,先由controller发送请求,再由库存服务扣减库存,支付服务扣减余额,最后由订单服务创建订单,当创建失败时,执行补偿操作,库存服务增加库存,支付服务增加余额。
执行补偿
用例请求执行后,先由controller发送请求,再由库存服务扣减库存,支付服务扣减余额,最后由订单服务创建订单,当创建失败时,执行补偿操作,库存服务增加库存,支付服务增加余额。
在整个事务失败后,先会返回异常,再由编排器执行补偿操作,实现最终的数据一致性。masstransit也提供了重试机制以实现向前恢复,避免因数据库连接超时、网络波动等问题造成的失败。
参考文献
masstransit中的 request/response 与 courier 功能实现最终一致性 - 丁松松松
到此这篇关于aspnetcore&masstransit courier实现分布式事务的文章就介绍到这了,更多相关aspnetcore分布式事务内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论