news 2025/12/23 7:26:40

分布式事务弃用 Seata?记一次基于 RocketMQ 最终一致性的落地实战,复杂场景下的“弃笨从简”之道

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
分布式事务弃用 Seata?记一次基于 RocketMQ 最终一致性的落地实战,复杂场景下的“弃笨从简”之道

💣 开篇:为什么我们决定“弃用” Seata?

在上一阶段的项目复盘中,我们发现订单中心的数据库 CPU 飙升,且大量事务处于 Lock Wait 状态。
排查发现,罪魁祸首竟然是不仅被视为“银弹”,也被广泛使用的Seata AT 模式

Seata AT 的痛点(高并发场景):

  1. 全局锁(Global Lock):二阶段提交(2PC)为了保证隔离性,持锁时间 = RPC 调用时间 + 业务执行时间。长链路下,这就是性能毒药。
  2. 吞吐量瓶颈:TC(事务协调者)集群在高并发下容易成为单点瓶颈。
  3. 死锁风险:复杂链路下的全局锁与本地锁极易死锁。

架构哲学的反思:
在微服务架构中,99% 的业务场景(如下单、支付、积分)其实不需要强一致性(CP),只需要最终一致性(AP)
于是,我们决定**“弃重从轻”**,全面切换到基于RocketMQ 事务消息的最终一致性方案。


🏗️ 架构演进:从“同步等待”到“异步确保”

我们的目标业务场景:用户下单 -> 扣减库存 -> 发放积分

1. 核心方案:RocketMQ 事务消息机制

RocketMQ 的“事务消息”是解决分布式事务的神器。它将消息发送拆分为两个阶段,确保本地事务执行消息发送的原子性。

交互时序图 (Sequence Diagram):

订单服务(Producer)RocketMQ积分服务(Consumer)阶段一:半消息机制1. 发送 Half 消息 (对消费者不可见)2. 发送成功 (ACK)3. 执行本地事务 (创建订单)4. Commit (提交消息)5. 投递消息 (消费者可见)6. 增加积分 (本地事务)4. Rollback (回滚消息/删除)alt[本地事务成功][本地事务失败]异常兜底:回查机制7. 回查本地事务状态 (Check)8. 再次 Commit/Rollbackopt[如果 Commit/Rollback 丢失]订单服务(Producer)RocketMQ积分服务(Consumer)

💻 落地实战:代码里的魔鬼细节

不要以为有了 RocketMQ 就万事大吉,“最终一致性”的难点在于 Consumer 端

Step 1: 生产者端 (Producer) - 保证“发”与“做”的原子性

我们需要实现RocketMQLocalTransactionListener接口。

@Component@RocketMQTransactionListenerpublicclassOrderTransactionListenerimplementsRocketMQLocalTransactionListener{@AutowiredprivateOrderServiceorderService;/** * 执行本地事务:插入订单数据 */@OverridepublicRocketMQLocalTransactionStateexecuteLocalTransaction(Messagemsg,Objectarg){try{// 解析消息中的订单信息OrderDTOorder=JSON.parseObject(newString((byte[])msg.getPayload()),OrderDTO.class);// 1. 核心业务:创建订单 (数据库操作)orderService.createOrder(order);// 2. 成功,通知 MQ 提交消息returnRocketMQLocalTransactionState.COMMIT;}catch(Exceptione){log.error("创建订单失败",e);// 3. 失败,通知 MQ 回滚 (Consumer 永远收不到这条消息)returnRocketMQLocalTransactionState.ROLLBACK;}}/** * 事务回查:防止网络丢包导致 MQ 不知道你是成功还是失败 */@OverridepublicRocketMQLocalTransactionStatecheckLocalTransaction(Messagemsg){OrderDTOorder=JSON.parseObject(newString((byte[])msg.getPayload()),OrderDTO.class);// 查询数据库,看订单到底有没有创建成功booleanexists=orderService.checkOrderExists(order.getOrderId());returnexists?RocketMQLocalTransactionState.COMMIT:RocketMQLocalTransactionState.ROLLBACK;}}
Step 2: 消费者端 (Consumer) - 幂等性是生命线

这是最关键的一步!
MQ 保证消息至少投递一次,意味着网络抖动时 Consumer 可能收到重复消息。如果积分加了两次,就是资损!

幂等性设计流程图:

graph TD Start(收到 MQ 消息) --> CheckRedis{1. 查询 Redis/去重表} CheckRedis -- "Key 已存在" --> Ignore[直接丢弃/返回成功] CheckRedis -- "Key 不存在" --> DoBiz[2. 执行业务: 加积分] DoBiz --> DBTx{3. 数据库事务提交?} DBTx -- "成功" --> SaveKey[4. 写入去重 Key (Redis/DB)] DBTx -- "失败" --> Retry[抛出异常/等待重试] SaveKey --> End(消费完成 ACK)

消费者代码示例:

@Service@RocketMQMessageListener(topic="order-topic",consumerGroup="point-group")publicclassPointConsumerimplementsRocketMQListener<String>{@AutowiredprivatePointServicepointService;@OverridepublicvoidonMessage(Stringmessage){OrderDTOorder=JSON.parseObject(message,OrderDTO.class);StringbizKey="POINT_ADD_"+order.getOrderId();// 1. 幂等性检查 (这里演示简单版,生产环境建议用去重表)if(redisTemplate.hasKey(bizKey)){log.info("重复消息,忽略: {}",bizKey);return;}// 2. 执行业务 (加积分)try{pointService.addPoints(order.getUserId(),order.getAmount());// 3. 标记为已处理redisTemplate.opsForValue().set(bizKey,"1",24,TimeUnit.HOURS);}catch(Exceptione){// 4. 抛出异常,利用 RocketMQ 的重试机制thrownewRuntimeException("消费失败,等待重试");}}}

🛡️ 异常兜底:最终一致性的“最终”有多远?

如果 Consumer 一直失败怎么办?(例如积分服务挂了,或者代码有 Bug)。

  1. 重试机制:RocketMQ 默认重试 16 次(从 1s 到 2h 不等)。绝大多数网络抖动都能在重试中恢复。
  2. 死信队列 (DLQ):如果 16 次重试后依然失败,消息进入死信队列。
  3. 人工/定时任务干预
  • 我们需要开发一个监控服务,订阅 DLQ。
  • 一旦发现死信,发送告警(钉钉/邮件)。
  • 人工排查 Bug,或通过脚本重新投递消息。

💡 架构总结:何时用 Seata,何时用 MQ?

没有最好的架构,只有最合适的架构。

对比维度Seata (AT 模式)RocketMQ 事务消息
一致性强弱强一致性(刚性事务)最终一致性(柔性事务)
并发性能低 (受限于全局锁)极高(异步解耦)
代码侵入性极低 (注解即可)高 (需写 Listener 和 幂等逻辑)
适用场景后台管理系统、配置变动、对一致性要求极高的资金转账电商下单、秒杀、支付回调、日志记录

博主建议:
在核心的高并发链路中,请大胆地**“弃笨从简”。虽然 MQ 方案写起来麻烦(要处理幂等、回查、死信),但它换来的是系统的高可用性无限的扩展能力**。这笔交易,绝对划算。


Next Step:
您是否想了解 Consumer 端**“基于本地消息表”的 100% 可靠幂等方案(比 Redis 更稳)?或者需要一份死信队列告警**的 Python 脚本?
在评论区回复“幂等”“脚本”,我为您安排下一期干货!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/21 11:05:15

为什么90%的人用不好Open-AutoGLM?,破解美妆教程检索失败的底层逻辑

第一章&#xff1a;Open-AutoGLM在美妆教程检索中的核心价值在当前内容爆炸的数字时代&#xff0c;用户对个性化、精准化美妆教程的需求日益增长。Open-AutoGLM 作为一款基于生成语言模型的开放检索增强框架&#xff0c;能够深度理解自然语言查询意图&#xff0c;并结合多模态数…

作者头像 李华
网站建设 2025/12/21 11:04:23

【限时揭秘】:Open-AutoGLM背后的多模态大模型推理技术

第一章&#xff1a;Open-AutoGLM与多模态大模型的演进之路 近年来&#xff0c;随着深度学习技术的不断突破&#xff0c;多模态大模型逐渐成为人工智能领域的研究热点。Open-AutoGLM作为新一代开源多模态语言模型&#xff0c;融合了文本、图像、音频等多种模态信息处理能力&…

作者头像 李华
网站建设 2025/12/21 11:02:21

3大关键步骤,快速上手Open-AutoGLM实现自动化新闻处理

第一章&#xff1a;Open-AutoGLM 新闻资讯聚合Open-AutoGLM 是一个基于开源大语言模型的智能新闻聚合系统&#xff0c;专为开发者和技术爱好者设计&#xff0c;能够自动抓取、分类并摘要来自多个技术社区和新闻源的最新资讯。该系统融合了自然语言理解与自动化调度能力&#xf…

作者头像 李华
网站建设 2025/12/21 11:02:10

多云与混合云环境下的测试策略设计与实践

多云与混合云测试概述 随着云计算技术的深入应用&#xff0c;多云与混合云部署模式已成为企业数字化转型的主流选择。根据Gartner最新预测&#xff0c;到2026年&#xff0c;超过75%的企业将采用多云或混合云策略来优化工作负载性能并控制成本。这种分布式架构为软件测试带来了…

作者头像 李华
网站建设 2025/12/21 10:54:30

探索式测试:在代码世界“冒险”

一、引言&#xff1a;当测试成为一场“思维探险” 在软件测试的传统认知中&#xff0c;测试常被视为按部就班的验证过程——执行用例、记录结果、提交缺陷。然而&#xff0c;随着敏捷开发与DevOps的普及&#xff0c;一种更具动态性的测试方法正悄然改变行业生态&#xff1a;探…

作者头像 李华