微服务面试(分布式事务、注册中心、远程调用、服务保护)
1.分布式事务
分布式事务,就是指不是在单个服务或单个数据库架构下,产生的事务,例如:
- 跨数据源的分布式事务
- 跨服务的分布式事务
- 综合情况
我们之前解决分布式事务问题是直接使用Seata框架的AT模式,但是解决分布式事务问题的方案远不止这一种。
1.1.CAP定理
解决分布式事务问题,需要一些分布式系统的基础知识作为理论指导,首先就是CAP定理
。
1998年,加州大学的计算机科学家 Eric Brewer 提出,分布式系统有三个指标:
- Consistency(一致性)
- Availability(可用性)
- Partition tolerance (分区容错性)
它们的第一个字母分别是 C、A、P。Eric Brewer认为任何分布式系统架构方案都不可能同时满足这3个目标
,这个结论就叫做 CAP 定理。
为什么呢?
1.1.1.一致性
Consistency(一致性):用户访问分布式系统中的任意节点,得到的数据必须一致
。
比如现在包含两个节点,其中的初始数据是一致的:
当我们修改其中一个节点的数据时,两者的数据产生了差异:
要想保住一致性,就必须实现node01 到 node02的数据 同步:
1.1.2.可用性
Availability (可用性):用户访问分布式系统时,读或写操作总能成功
。
只能读不能写,或者只能写不能读,或者两者都不能执行,就说明系统弱可用或不可用。
1.1.3.分区容错
Partition,就是分区,就是当分布式系统节点之间出现网络故障导致节点之间无法通信
的情况:
如上图,node01和node02之间网关畅通,但是与node03之间网络断开。于是node03成为一个独立的网络分区;node01和node02在一个网络分区
。
Tolerance,就是容错,即便是系统出现网络分区,整个系统也要持续对外提供服务
。
1.1.4.矛盾
在分布式系统中,网络不能100%保证畅通,也就是说网络分区的情况一定会存在
。而我们的系统必须要持续运行,对外提供服务。所以分区容错性(P)是硬性指标
,所有分布式系统都要满足。而在设计分布式系统时要取舍的就是一致性(C)和可用性(A)
了。
假如现在出现了网络分区,如图:
由于网络故障,当我们把数据写入node01时,可以与node02完成数据同步,但是无法同步给node03。现在有两种选择
:
- 允许用户任意读写,
保证可用性
。但由于node03无法完成同步,就会出现数据不一致的情况。满足AP - 不允许用户写,可以读,直到网络恢复,分区消失。这样就
确保了一致性
,但牺牲了可用性。满足CP
可见,在分布式系统中,A和C之间只能满足一个
。
1.2.BASE理论
既然分布式系统要遵循CAP定理,那么问题来了,我到底是该牺牲一致性还是可用性呢
?如果牺牲了一致性,出现数据不一致该怎么处理?
人们在总结系统设计经验时,最终得到了一些心得
:
Basically Available (基本可用)
:分布式系统在出现故障时,允许损失部分可用性
,即保证核心可用
。Soft State(软状态)
:在一定时间内,允许出现中间状态
,比如临时的不一致
状态。Eventually Consistent(最终一致性)
:虽然无法保证强一致性,但是在软状态结束后,最终达到数据一致
。
以上就是BASE理论。
简单来说,BASE理论就是一种取舍
的方案,不再追求完美,而是最终达成目标
。因此解决分布式事务的思想也是这样,有两个方向
:
AP
思想:各个子事务分别执行和提交,无需锁定数据
。允许出现结果不一致,然后采用弥补措施恢复,实现最终一致即可
。例如AT模式
就是如此CP
思想:各个子事务执行后不要提交,而是等待彼此结果,然后同时提交或回滚
。在这个过程中锁定资源,不允许其它人访问
,数据处于不可用
状态,但能保证一致性
。例如XA
模式
1.3.AT模式的脏写问题
我们先回顾一下AT模式的流程,AT模式也分为两个阶段:
第一阶段是记录数据快照
,执行并提交事务
:
第二阶段根据阶段一的结果来判断:
- 如果每一个分支事务都
成功
,则事务已经结束
(因为阶段一已经提交),因此删除
阶段一的快照
即可 - 如果有
任意
分支事务失败
,则需要根据快照恢复
到更新前数据
。然后删除快照
这种模式在大多数情况下(99%)并不会有什么问题,不过在极端情况下,特别是多线程并发访问AT模式的分布式事务时,有可能出现脏写
问题,如图:
解决思路就是引入了全局锁
的概念。在释放DB锁之前,先拿到全局锁。避免同一时刻有另外一个事务来操作当前数据
。(db锁的等待时长非常长,而事务2的全局锁的等待时长只有300毫秒,所以一般最后事务1一定会拿到全局锁和db锁
,不会想回等待进入死锁)
具体可以参考官方文档:
https://seata.apache.org/zh-cn/docs/dev/mode/at-mode/
全局锁能够限制的是都被seata统一管理的
,如果有一个操作不是seata提哦难过一管理的,是其他操作的,那么全局锁就会失效
,需要人工介入