当前位置：首页 > news >正文

数据库主键选择策略分析

news 2025/9/2 9:49:54

为什么不推荐使用数据库自增主键？

分库分表问题：
- 自增ID在分库分表场景下会导致ID冲突
- 需要额外机制(如步长设置)来保证全局唯一，增加系统复杂度
安全性问题：
- 自增ID容易暴露业务量(如订单号连续)
- 可能被恶意爬取数据
分布式系统限制：
- 依赖数据库实现，在分布式系统中可能成为性能瓶颈
- 高并发场景下获取ID可能产生竞争
数据迁移困难：
- 不同数据库的自增机制可能不兼容
- 合并数据时容易产生冲突

为什么不推荐使用UUID作为主键？

存储空间大：
- UUID通常需要32个字符(16字节)，比长整型(8字节)占用更多空间
- 导致索引占用更多内存，降低查询性能
无序性问题：
- UUID是无序的，导致B+树索引频繁分裂
- 插入性能下降，产生更多磁盘碎片
可读性差：
- 对人类不友好，难以记忆和识别
索引效率低：
- 较大的键值导致索引层级增加
- 范围查询效率降低

雪花算法(Snowflake)存在的问题

时钟回拨问题：
- 依赖系统时钟，时钟回拨会导致ID重复
- 需要额外处理逻辑，增加系统复杂度
分布式环境配置：
- 需要确保workerId在集群中唯一
- 动态扩容时workerId分配可能成为问题
ID长度限制：
- 标准的64位雪花ID可能在某些场景下不够用
- 扩展位数会影响兼容性
时间戳依赖：
- 如果系统运行时间超过69年(时间戳部分耗尽)，需要特殊处理
数据倾斜问题：
- 短时间内大量生成ID可能导致数据热点

主键选择建议

单机系统：
- 可以考虑自增主键，简单高效
分布式系统：
- 推荐使用改进版的雪花算法(如美团的Leaf、百度的UidGenerator)
- 也可以考虑Redis生成ID或数据库号段模式
- 将序列号进行修改防止数据倾斜(如将时间戳最后一位赋值给序列号最后一位)；
特殊需求场景：
- 需要隐藏业务信息的可以使用哈希ID
- 需要可读性的可以使用业务编号+随机数组合
NoSQL系统：
- 可以充分利用各数据库特有的ID生成机制
- 如MongoDB的ObjectId

每种方案都有其适用场景，应根据具体业务需求、数据规模和系统架构来选择最合适的主键策略。

http://www.dtcms.com/a/361809.html

相关文章：

【高级】系统架构师 | 2025年上半年综合真题

Linux系统结构（概要）

实现一个线程池管理器

数字后端tap cell：新老工艺tap cell区别

人工智能视频画质增强和修复软件Topaz Video AI v7.1.1最新汉化，自带星光模型

网络编程5-数据库、sqlite3数据库

多级渐远纹理（Mipmap）：原理、生成、采样与 OpenGL 实践

2025 金融行业证书怎么选？从能力适配到职业方向的理性梳理

7-ATSAM3X8-DAC输出

网络与信息安全有哪些岗位：（13）安全服务工程师 / 顾问

机器学习——损失函数

leetcode-python-1796字符串中第二大的数字

LeetCode82删除排序链表中的重复元素 II

wpf之样式

嵌入式解谜日志之Linux操作系统—共享内存

Python备份实战专栏第5/6篇：Docker + Nginx 生产环境一键部署方案

基于多种分词算法的词频统计的中文分词系统的设计与实现

信创之-麒麟v10服务器安装tengine（已完成）

推荐系统中Redis 数据存储：二进制序列化协议选型与优化

linux连接服务器sftp无法输入中文

基于SpringBoot的教务管理系统(源码+文档)

C/C++ Linux系统编程：进程通讯完全指南，管道通讯、共享内存以及消息队列

零基础从头教学Linux（Day 25）

vue3使用Eslint

B样条曲线在节点u处添加节点的操作方法

心率监测系统优化方案全解析

火语言 RPA：轻松生成界面应用，让开发触手可及

求欧拉回路：Hierholzer算法图解模拟

计算机网络技术（四）完结

算法题-02