当前位置：首页 > news >正文

数据库（一）：分布式数据库

news 2025/11/4 11:33:11

定义

分布式数据库（Distributed Database） 是指：

数据分布在多个物理位置，但对用户透明，表现为一个统一逻辑数据库的系统。

结构模式（三层模式扩展）

层次	作用	对应实体
用户层	提供统一视图，屏蔽底层节点分布	前端应用、中间件
全局模式	系统级逻辑结构定义，数据如何分布与复制	分布式数据库中间件，如TiDB、OceanBase
局部模式	各个子系统或节点的具体逻辑结构定义	每个节点的局部数据库
物理模式	各节点的实际数据文件和存储方式	存储引擎（如RocksDB、InnoDB）

核心技术与模式分类

数据分片（Sharding）

定义：将数据按某种规则划分到不同节点上。

水平分片（Horizontal Partitioning）：
- 按行划分，例如按用户ID区间划分；
- 常见于用户量大时。
垂直分片（Vertical Partitioning）：
- 按列划分，例如将用户表的基本信息和敏感信息分开放；
- 常见于字段多、模块职责分离时。
混合分片（Hybrid Partitioning）：
- 同时按行列进行分片。

常考点：“将用户表按地区分布于不同节点，这是哪种分片？” 答：水平分片

数据复制（Replication）

定义：将同一份数据拷贝存储于多个节点。

主从复制（Master-Slave）
- 一个主节点写，多从节点读；
- 优点：读性能高；
- 缺点：写入瓶颈、主节点故障影响大。
多主复制（Multi-Master）
- 多个节点可以同时读写；
- 优点：高可用；
- 缺点：一致性难以维护。
同步复制 / 异步复制
- 同步：强一致性，牺牲写性能；
- 异步：高性能，但存在数据丢失风险。

一致性模型（Consistency Models）

强一致性（Strong Consistency）：
- 所有节点读取到的都是最新数据；
- 通常需要 Paxos、Raft 等共识协议支持。
最终一致性（Eventual Consistency）：
- 系统经过一段时间后达到一致；
- 常见于高可用系统（如 DNS、Cassandra）。
因果一致性（Causal Consistency）：
- 保证操作的因果关系顺序；
- 强于最终一致性，弱于强一致性。

CAP 理论（重点）

元素	含义
C	一致性（Consistency）
A	可用性（Availability）
P	分区容忍性（Partition Tolerance）

CAP 不可同时满足三者，只能同时满足其中两项：

CP：一致性 + 分区容忍（如 HBase）
AP：可用性 + 分区容忍（如 Cassandra）
CA：理论上只能用于单机数据库

典型架构模式

模式类型	描述	示例系统
同构集中式	所有节点结构相同、集中部署	MySQL 主从集群
同构分布式	节点结构相同，分布在不同位置	OceanBase、TiDB
异构分布式	各节点可能使用不同数据库系统	中间件统一封装不同数据库
混合云分布式	云 + 本地的混合数据库部署模式	云数据库 + 本地缓存

查询处理与优化机制

全局查询优化器：分析跨节点的SQL执行计划；
数据定位服务：确定某个数据在哪个分片或节点；
两阶段提交（2PC）/三阶段提交（3PC）：保障分布式事务一致性；
分布式事务协调器（如 XA / TCC / SAGA）；

http://www.dtcms.com/a/201273.html

相关文章：

【通用智能体】Lynx ：一款基于终端的纯文本网页浏览器

【计网】作业5

【C++模板与泛型编程】实例化

龙虎榜——20250519

C++ 函数对象、仿函数与 Lambda 表达式详解

Python中的整型（int）和浮点数（float）

vue3 vite 路由

打卡第二十二天

C++：判断闰年

turf的pointsWithinPolygon排查

C++(2)关键字+数据类型 +数据类型输入

Linux云计算训练营笔记day11【Linux CentOS7（cat、less、head、tail、lscpu、lsblk、hostname、vim、which、mount、alias）】

技术决策缺乏团队参与，如何增强执行力？

YoloV9改进策略：卷积篇|风车卷积|即插即用

windows服务器部署jenkins工具（一）

接口排查不能靠猜：实战中如何用抓包工具精准定位问题（含 Charles 使用示例）

【实战教程】如何添加git仓库的子模块

V4L2应用程序开发-01数据采集流程

MCP与通讯模式：理论与实战体验

【集成电路】集成电路导论知识点

MFC 编程中 OnInitDialog 函数

电子电路原理第十六章(负反馈)

Mergekit——任务向量合并算法Ties解析

电机控制杂谈（25）——为什么对于一般PMSM系统而言相电流五、七次谐波电流会比较大？

嵌入式51单片机：C51

【Python-Day 15】深入探索 Python 字典 (下)：常用方法、遍历、推导式与嵌套实战

`asyncio.gather()` 是什么

Chrome插件学习笔记

专题五：floodfill算法（太平洋大西洋水流问题）

POJ3107树的重心