当前位置: 首页 > news >正文

如何利用数据库事务,来防止数据不一致的问题

要利用数据库事务从根源上防止数据不一致的问题,核心在于将一组逻辑上“不可分割”的、连续的数据库操作,“打包”成一个“要么全部成功,要么全部失败”的“原子”工作单元。一个设计良好的数据库事务通过其内在的“原子性、一致性、隔离性和持久性”四大核心属性,为复杂的数据操作提供了一道坚不可摧的“保险”。这套机制主要通过以下方式保障数据一致性:将多个独立操作“打包”成一个“原子”单元、通过“要么全成功,要么全失败”的机制保障操作的“完整性”、利用“隔离性”防止并发操作的“相互干扰”、在操作成功后通过“持久性”确保数据的“永久保存”、以及在失败时通过“回滚”机制恢复到“原始状态”

其中,将多个独立操作“打包”成一个“原子”单元是事务机制最根本的价值。例如一次“转账”操作,在逻辑上虽然包含了“从A账户扣款”和“向B账户存款”这两个独立的步骤,但通过事务,数据库会将这两个步骤视为一个单一的、不可再分的整体来执行,从而从根本上杜绝了因程序中途崩溃而导致的“钱扣了,但没到账”的、灾难性的数据不一致状态。

一、问题的“根源”、当操作不再“原子”

在探讨解决方案之前,我们必须首先深刻地理解“数据不一致”这个问题的“根源”究竟在哪里。

让我们来想象一个最经典的、未使用事务的“银行转账”业务场景:我们需要从“张三”的账户向“李四”的账户转账100元。这个业务逻辑在程序代码中会被分解为至少三个独立的数据库操作步骤。首先程序查询张三的账户余额,确保其大于等于100元。其次程序执行更新操作,将张三的账户余额减去100元。最后程序执行更新操作,将李四的账户余额加上100元。在单用户、一切顺利的情况下,这个流程看起来是完美无缺的。然而,在真实世界的、充满了“意外”的运行环境中,灾难就隐藏在这些“步骤”之间的“间隙”里。

假设当程序成功地执行完第二步(扣除了张三的100元)之后,就在即将执行第三步之前的那一刻发生了“意外”——可能是应用程序服务器突然断电;可能是数据库服务器突然宕机;也可能是网络连接突然中断。此时,因为意外,第三步“向李四账户存款”的操作将永远不会被执行。当系统恢复后我们会发现一个灾难性的结果:张三的账户确实被扣除了100元;但李四的账户却分文未增。银行的总账上凭空就“消失”了100元。这个状态就是最典型的“数据不一致”。数据库中的数据已经不再反映业务世界的“真实”状态,其数据的“完整性”和“可信度”遭到了致命的破坏。

这个问题的根本原因在于我们将一个在“业务逻辑”上本应是“不可分割”的、“原子的”操作(即“转账”),错误地分解为了多个在“物理执行”上是“可被中断”的、独立的数据库操作

二、解决方案的“基石”、数据库事务与ACID

为了解决上述问题,数据库系统为我们提供了一个极其强大也极其重要的“武器”——数据库事务

一个事务是一个由数据库所保证的、能够将一系列操作都捆绑在一起作为一个“单一逻辑单元”来执行的机制。这个机制通过其四个核心的、神圣不可侵犯的属性来保障数据的一致性。这四个属性就是著名的“ACID”特性。

第一个核心属性是原子性,这也是事务最基础的属性。它保证了被一个事务所包裹的所有操作都遵循“要么全部成功,要么全部失败”的“全有或全无”原则。在我们的“转账”案例中,如果我们将“扣款”和“存款”这两个操作都放入同一个事务中,那么即便在“扣款”成功后系统发生了崩溃,当系统恢复时数据库也会自动地检测到这个“未完成”的事务,并将其所做的所有修改(即那次“扣款”)都自动地“回滚”掉,使数据恢复到事务开始前的那个“一致”的状态。

第二个核心属性是一致性,这也是事务的“最终目标”。它保证了一个事务的执行必须使数据库从一个有效的、符合所有业务规则的“一致性状态”,转变到另一个有效的“一致性状态”。一致性是由数据库的“完整性约束”(例如非空约束、唯一约束、外键约束)和事务的“原子性”共同来保障的。原子性是在“意外”发生时确保一致性不被破坏的技术手段。

第三个核心属性是隔离性,它是用于解决“并发”操作所带来的不一致问题的关键属性。它规定并发执行的多个事务之间其效果应与将这些事务一个接一个地、串行地执行的效果是相同的。这意味着当事务A正在对某行数据进行修改但尚未“提交”时,并发的事务B不应该能够“看到”A所做的这些“未确认”的、临时的修改。隔离性通过复杂的“锁”机制或“多版本并发控制”机制来防止“脏读”、“不可重复读”和“幻读”等并发问题的产生。

第四个核心属性是持久性,它为我们的数据提供了“最终的安全承诺”。它保证了只要一个事务被成功地“提交”,那么它对数据库所做的所有修改就都是“永久性”的。即便在提交完成后的下一毫秒整个数据库系统就发生了“断电”或“宕机”,在系统重启后这些已被提交的数据也必然能够被恢复。这通常是通过“预写式日志”等机制来实现的。

三、在“代码”中“实践”事务

理解了事务的理论基础后,我们还需要学会在应用程序的代码中正确地使用它。

几乎所有的关系型数据库都提供了用于“手动”控制事务的标准查询语言命令:START TRANSACTION标志着一个新事务的开始;COMMIT用于在事务中的所有操作都成功执行后“提交”事务,使其所有的修改“永久生效”;ROLLBACK则用于在事务执行的过程中发生任何错误时“回滚”事务,即“撤销”该事务已经做出的所有修改。

基于上述命令,我们可以将我们最初那个“不安全”的转账代码重构为一个“安全”的版本。

Java

Connection conn = ...; // 获取数据库连接
conn.setAutoCommit(false); // 1. 关闭自动提交,开启手动事务try {// 2. 执行第一步:从张三账户扣款statement.executeUpdate("UPDATE accounts SET balance = balance - 100 WHERE name = '张三'");// 3. 执行第二步:向李四账户存款statement.executeUpdate("UPDATE accounts SET balance = balance + 100 WHERE name = '李四'");// 4. 如果所有操作都成功,则提交事务conn.commit();System.out.println("转账成功!");} catch (SQLException e) {// 5. 如果在try块中,发生了任何数据库相关的错误try {// 立即回滚事务conn.rollback();System.out.println("转账失败,事务已回滚。");} catch (SQLException ex) {// ... 处理回滚失败的异常 ...}
} finally {// 6. 最终,恢复自动提交模式,并关闭连接conn.setAutoCommit(true);conn.close();
}

手动地编写上述这样包含了复杂异常处理嵌套的事务控制代码是繁琐且极易出错的。因此,所有现代的主流后端开发框架(例如Java的Spring框架)都提供了更高级、更简洁的“声明式事务”管理机制。开发者通常只需要在一个业务方法的上方添加一个简单的“注解”,框架就会在“幕后”自动地为这个方法生成所有必需的、健壮的“事务开始、提交、回滚”的逻辑。

四、深入“隔离”、理解“隔离级别”

在并发场景下,事务的“隔离性”并非一个“非黑即白”的绝对概念。为了在“数据一致性”的“严格程度”与“系统并发”的“性能”之间做出一个“权衡”,数据库标准定义了四种不同的“隔离级别”。

最低的隔离级别是读未提交,一个事务可以读取到另一个并发事务“尚未提交”的、临时的、可能会被回滚的“脏数据”,这种级别在实践中极少被使用。读已提交级别可以避免“脏读”,一个事务只能读取到其他并发事务“已经提交”的数据,但可能会在一个事务的多次查询中因为其他事务的提交而读到不同的结果,即“不可重复读”,这是许多数据库的默认隔离级别。

可重复读级别保证了在一个事务的整个生命周期中多次读取同一行数据其结果都是完全一致的,这可以避免“不可重复读”,但可能会因为其他事务的“插入”操作而导致“幻影”行即“幻读”的出现,这是MySQL数据库的默认隔离级别。可串行化是最高的隔离级别,它通过最严格的锁定来强制所有并发的事务都“完全串行”地执行,可以避免所有的并发异常,但其并发性能也最低。

在选择隔离级别时,需要根据具体的业务场景对其“数据一致性”的“容忍度”来进行审慎的选择。对于绝大多数的应用场景,数据库“默认”的隔离级别就已经足够健壮。

常见问答 (FAQ)

Q1: 是不是所有的数据库操作,都应该放在事务里?

A1: 不是。对于那些只包含“单条”查询的、只读的操作,完全没有必要为其开启一个事务。事务主要是为了保障那些包含了“多条、连续的、写入类”操作的“复合逻辑单元”的原子性和一致性。

Q2: “事务”能解决“N+1查询”问题吗?

A2: 不能。N+1查询是一个“性能”问题,它源于“过多”的数据库查询次数。而事务主要是一个“数据一致性”的保障机制,两者解决的是不同维度的问题。

Q3: 什么是“脏读”?

A3: “脏读”是指在一个事务(A)中,读取到了另一个并发事务(B)“已经修改,但尚未提交”的数据。如果事务B随后因为某种原因而进行了“回滚”,那么事务A所读取到的那个数据就成了一个从未在数据库中真实存在过的“脏”数据。

Q4: “分布式事务”和我们讨论的“数据库事务”有什么不同?

A4: 我们本文讨论的“数据库事务”是指在一个“单一”数据库实例内部保障数据一致性的机制。而“分布式事务”则是指在一个需要跨越“多个”独立的、分布式的数据库或服务来共同完成一个业务操作的、更复杂的场景下,保障所有参与方“要么都成功,要么

http://www.dtcms.com/a/347624.html

相关文章:

  • 云原生概述
  • [e3nn] 归一化 | BatchNorm normalize2mom
  • 自然语言处理——06 迁移学习(上)
  • MATLAB实现CNN-LSTM-Attention 时序和空间特征结合-融合注意力机制混合神经网络模型的风速预测
  • 云计算-K8s 运维:Python SDK 操作 Job/Deployment/Pod+RBAC 权限配置及自定义 Pod 调度器实战
  • Kubernetes相关问题集(四)
  • 「数据获取」《贵港统计年鉴》(2008-2023)(2016、2017缺失)(获取方式看绑定的资源)
  • 开发指南134-路由传递参数
  • 【KO】前端面试七
  • 科研笔记:博士生手册
  • n8n热门的开源 AI 工作流平台实操
  • git实战(7)git常用命令速查表
  • C++实现常见的排序算法
  • STM32窗口看门狗(WWDG)深度解析:精准守护嵌入式系统的实时性
  • day39-keepalived
  • How to Use Managed Identity with ACS?
  • 全面解析主流AI模型:功能对比与应用推荐
  • douyin_search_tool:用python开发的抖音关键词搜索采集软件
  • 低功耗全双工远距离无线对讲解决方案
  • 【数位DP】D. From 1 to Infinity
  • 数据库字段类型深度解析:从关系型到 NoSQL 的全面指南
  • Placement new是什么
  • CUDA和torch的安装
  • 【LeetCode】363. 矩形区域不超过 K 的最大数值和 (二分 + 前缀和)
  • 拓扑排序|hash
  • 深入剖析Spring Boot应用启动全流程
  • MySQL GPG 密钥更新问题解决文档
  • Centos7.9 Docker26容器化部署 MySql9.4 一主一从的同步复制部署
  • 【51单片机非精准延时演示来回流水灯效果】2022-11-10
  • 【机器学习深度学习】自然语言与多模态大模型