当前位置：首页 > news >正文

DDD - 可能会用到的分布式事务

news 2025/10/22 18:13:58

一、分布式事务的概念：

分布式事务是指跨越多个独立的资源或服务（例如多个数据库、微服务、消息队列等）执行的事务操作，其目标是确保整个事务在多个系统中保持原子性和一致性，即要么所有操作全部成功提交，要么全部回滚，从而避免部分操作成功导致数据不一致。

关键概念

原子性、一致性、隔离性、持久性（ACID）
在单个数据库中的事务通常满足ACID原则，分布式事务则需要在多个系统中同时保证这些特性。
分布式环境的挑战
- 不同系统可能位于不同网络节点，存在通信延迟、网络故障等问题。
- 各系统之间没有共享内存，协调各节点的操作需要额外的协议和机制。
协调协议
为了实现跨多个节点的事务一致性，常用的协调协议有：
- 两阶段提交协议（2PC）：
  第一阶段是准备阶段（Prepare Phase），协调者向所有参与者发送准备提交请求；第二阶段是提交阶段（Commit Phase），如果所有参与者都确认可以提交，则协调者通知大家提交，否则通知回滚。
- 三阶段提交协议（3PC）：
  在2PC基础上引入一个预提交阶段，进一步降低因协调者故障导致的不确定状态，从而提高系统的容错性。

直观例子

假设一个电商系统中，用户下单涉及三个独立的服务：

订单服务：记录订单信息
库存服务：扣减商品库存
支付服务：处理用户支付

在分布式事务中，为了确保订单、库存和支付三项操作要么全部成功，要么全部失败，需要：

通过2PC协议，由一个协调者负责协调这三个服务。
在第一阶段，各个服务进行本地事务的准备工作，预留资源但不提交。
如果所有服务都返回成功，协调者在第二阶段通知所有服务提交操作；如果有一个服务准备失败，协调者通知所有服务回滚。

这样，无论哪个服务出现问题，整个下单操作都会保证数据一致性，不会出现只有部分服务更新成功的情况。

分布式事务的核心在于如何在多个独立系统间协调操作，确保整个事务操作的原子性和一致性。通过像两阶段提交这样的方法，可以在分布式环境下尽可能保证ACID特性，但同时也会带来性能和复杂度上的挑战。理解分布式事务有助于设计健壮的分布式系统，并在需要严格数据一致性的场景下正确处理跨服务的数据更新。

二、如何实现分布式事务：

分布式事务的实现通常需要协调多个独立系统或服务中的本地事务，使它们共同满足ACID（原子性、一致性、隔离性、持久性）的要求。最常见的实现方式是两阶段提交协议（2PC）。下面通过一个简单的例子说明如何实现分布式事务。

例子：电商订单处理

假设在一个电商系统中，下单操作涉及三个独立的服务，每个服务都有自己的数据库：

订单服务：负责记录订单信息。
库存服务：负责扣减相应商品的库存。
支付服务：负责处理用户支付。

为了保证整个下单操作要么全部成功（订单创建、库存扣减、支付完成），要么全部失败（任何一步失败都需要回滚），我们可以采用两阶段提交协议来实现分布式事务。

两阶段提交协议（2PC）流程

阶段一：准备阶段（Prepare Phase）

协调者（Transaction Coordinator）：由一个专门的协调者负责整个事务的管理。
步骤：
1. 协调者向所有参与服务发送“准备提交”（Prepare）的请求。
2. 各服务收到请求后，在本地开始事务，并执行各自的业务逻辑，但不提交结果。
3. 每个服务检查是否可以提交本地事务。如果可以，则返回一个“准备就绪”（Ready）的响应；如果遇到问题，则返回“拒绝”（Abort）的响应。

阶段二：提交阶段（Commit Phase）

决策：
- 如果所有参与者都返回“准备就绪”，协调者则向所有参与者发送“提交事务”（Commit）的命令，各参与者正式提交本地事务。
- 如果有任何一个参与者返回拒绝，协调者则向所有参与者发送“回滚事务”（Rollback）的命令，各参与者撤销之前的操作。

示例过程

下单请求发起：
用户下单，订单服务、库存服务和支付服务各自启动一个本地事务，并接到协调者的准备请求。
准备阶段：
- 订单服务检查订单数据是否完整，并预先锁定相关记录，返回“准备就绪”。
- 库存服务检查库存是否充足，并预留库存，返回“准备就绪”。
- 支付服务检查支付信息，预授权用户账户，返回“准备就绪”。
协调者决策：
协调者收到所有服务的“准备就绪”响应后，判断整个事务可以提交。
提交阶段：
协调者向所有参与服务发送“提交”命令。
- 订单服务提交订单记录。
- 库存服务正式扣减库存。
- 支付服务完成支付处理。

如果在准备阶段中，任何一个服务返回“拒绝”（比如库存不足或支付失败），协调者会通知所有服务回滚事务，从而保证整个下单操作不会部分成功。

总结

**两阶段提交（2PC）**是实现分布式事务的常用机制，主要分为准备阶段和提交阶段。
通过协调者统一管理各参与者的本地事务，2PC确保了跨服务操作的原子性，即要么所有服务的事务都提交，要么全部回滚，保持数据一致性。
这个例子展示了电商系统中订单、库存和支付服务如何协同工作，确保整个下单操作的完整性。

这种实现方式虽然能保证数据一致性，但也存在性能开销和单点故障问题，因此在大规模分布式系统中，有时会采用其他机制（如三阶段提交、最终一致性方案、Saga模式等）来权衡一致性和性能。

三、上面提到的协调者是由什么来做？

协调者在分布式事务中起到“指挥官”的作用，负责协调所有参与者（各个服务或数据库）共同完成或回滚事务。关于协调者的具体实现方式，有以下几点说明：

协调者的角色
- 协调者负责在分布式事务中发出“准备”、“提交”或“回滚”的指令。
- 它收集所有参与者在准备阶段的响应，根据这些响应决定整个事务是提交还是回滚。
实现方式
- 协调者可以由专门的分布式事务管理器或中间件实现。例如，一些数据库集群或企业级事务处理系统会内置这样的协调机制。
- 在微服务架构中，协调者通常作为一个独立的服务或者一个组件存在，专门负责管理分布式事务。
- 现代分布式系统也可能采用更灵活的模式（如 Saga 模式），在这种情况下，协调逻辑可能嵌入到各个服务的业务流程中，而不依赖单一的协调者。
实例说明
例如，在采用两阶段提交（2PC）的分布式事务中，协调者可以是一个专门的事务管理服务，它：
- 发送准备请求到所有参与者；
- 收集各参与者的反馈（准备就绪或拒绝）；
- 根据反馈决定是否发送提交或回滚指令；
- 确保所有参与者最终达成一致，保持数据一致性。

四、分布式事务为什么会存在性能开销和单点故障问题？

在分布式事务中，多个服务或数据库需要协调一致地执行一个整体操作，这就不可避免地引入了额外的复杂性和开销，具体原因如下：

性能开销
- 通信延迟：分布式事务要求多个节点之间进行消息传递，如在两阶段提交协议中，协调者需要向所有参与者发送“准备”请求，并等待它们的响应。网络通信的延迟会显著影响整体事务的完成时间。
- 资源锁定：为了保证一致性，各个参与者在事务执行过程中可能需要对数据加锁，防止其他事务同时修改这些数据。锁定资源会导致其他操作等待，从而降低系统吞吐量。
- 额外的协调与日志记录：分布式事务管理器需要记录每个节点的状态和操作日志，以便在发生错误时进行回滚。这些额外的操作本身也会带来计算和 I/O 的开销。
单点故障问题
- 协调者风险：在传统的两阶段提交中，协调者（Transaction Coordinator）负责整体的事务协调。如果协调者节点出现故障，整个事务可能陷入不确定状态，因为其他参与者可能处于锁定状态，无法决定提交或回滚。
- 依赖集中化：如果协调者没有冗余或备份机制，整个分布式事务系统就会依赖于这个单一的节点，导致其成为整个系统的瓶颈和单点故障（SPOF）。

分布式事务需要在多个独立节点之间保证数据一致性，这要求进行频繁的通信、协调和资源锁定，从而导致性能开销；同时，由于依赖于一个协调者进行全局管理，协调者一旦失效，就可能影响整个系统的正常运行，形成单点故障问题。为了应对这些问题，实际系统中常常采用改进的协议（如三阶段提交、Saga模式）以及冗余设计来降低风险。

附加Saga模式：

Saga 模式是一种处理分布式事务的方法，它通过将一个长事务拆分为一系列相互独立的本地事务来实现。每个本地事务完成后，会产生一个“补偿事务”（Compensating Transaction），用于在后续步骤出现问题时撤销前面的操作。这样，不需要像传统的两阶段提交（2PC）那样锁定资源，也不会因为单一协调者故障而导致整个事务挂起。

主要特点

事务拆分
一个全局事务被拆分成多个独立的本地事务，每个本地事务在各自服务中独立执行，并在成功后提交。
补偿机制
如果在执行后续本地事务过程中发生失败，系统会依次执行对应的补偿事务，撤销之前已经成功提交的操作，从而达到最终一致性（Eventual Consistency）。
异步与解耦
Saga 模式通常通过异步消息传递实现各个事务之间的协调，降低了系统耦合度和网络延迟对事务的影响。

举例说明

假设一个电商系统中，下单操作涉及三个服务：

订单服务：记录订单信息
库存服务：扣减库存
支付服务：完成支付

使用 Saga 模式的流程如下：

步骤1：订单服务创建订单，成功后提交本地事务，并发布“订单已创建”事件。
步骤2：库存服务接收到该事件，执行扣减库存的本地事务，并提交。如果库存不足导致失败，则需要执行补偿事务，比如取消订单服务中已创建的订单（撤销操作）。
步骤3：支付服务接收到订单和库存操作都成功的消息后，执行支付本地事务。如果支付失败，则需要先执行支付补偿（如退款），再执行库存补偿（恢复库存），最后再执行订单补偿（取消订单）。

通过这种方式，每个服务都独立执行本地事务，而补偿事务则用于“回滚”那些已经成功执行但后来发现整体事务无法完成的操作，从而保证系统最终达到一致性。

Saga 模式通过将全局事务拆分为多个独立的本地事务，并为每个本地事务设计补偿逻辑，避免了分布式锁和两阶段提交带来的性能和单点故障问题。它适用于需要长时间运行且无法保证即时一致性的分布式系统，例如电商、银行、预订系统等场景。

查看全文

http://www.dtcms.com/a/23066.html