当前位置：首页 > news >正文

Python 字典为什么查询高效

news 2025/8/3 9:46:52

Python 字典（dict）之所以查询效率非常高（平均时间复杂度为 O(1)），主要归功于其底层实现——哈希表（Hash Table）。

1. 核心：哈希表（Hash Table）

字典本质上是一个哈希表。哈希表是一种通过键（key） 直接映射到值（value） 存储位置的数据结构。

工作流程：

哈希函数（Hash Function）：
- 当你向字典中插入一个键值对（如 d['name'] = 'Alice'）时，Python 会先对键 'name' 调用其 __hash__() 方法，得到一个整数，称为哈希值（hash value）
- 这个哈希值是确定性的：同一个键，每次计算得到的哈希值都相同。
- 不可变类型（如 str, int, tuple）都有 __hash__ 方法，因此可以作为字典的键；而可变类型（如 list, dict）没有，所以不能作为键。
索引计算（Indexing）：
- 哈希值通常是一个很大的整数，不能直接用作数组下标。
- Python 会将哈希值通过一个函数（通常是取模运算）映射到哈希表的槽位（slot） 索引上。例如：index = hash(key) % table_size。
存储/查找：
- Python 直接访问计算出的索引位置，将值存储进去（插入）或读取出来（查找）。
- 由于数组的索引访问是 O(1) 操作，所以字典的查找/插入/删除平均也是 O(1)。

2. 处理哈希冲突（Collision）

不同的键可能产生相同的哈希值（或映射到同一索引），这称为哈希冲突。Python 字典使用了两种主要技术来解决：

a. 开放寻址法（Open Addressing）

Python 字典主要使用基于开放寻址的哈希表。
当目标槽位已被占用时，它会按照一定的探测序列（如线性探测、二次探测）寻找下一个空闲槽位。
Python 使用了一种优化的探测方式，能有效减少“聚集”（clustering）问题。

b. 键值对存储结构

Python 字典的底层结构设计巧妙，它将哈希值、键、值作为一个整体存储。
在查找时，即使索引位置被占用，Python 会先比较哈希值，如果不同则直接跳过；如果相同，再比较键是否相等（==）。
这种“先比哈希，再比键”的方式大大加快了查找速度，尤其是在哈希冲突较多时。

3. 动态扩容（Resizing）

哈希表的大小是固定的，但字典是动态的。
当字典中元素过多，导致装载因子（元素数 / 槽位数）过高时，哈希冲突概率上升，性能下降。
Python 会在装载因子达到一定阈值（如 2/3）时，自动扩容：创建一个更大的哈希表，并将所有键值对重新哈希到新表中。

http://www.dtcms.com/a/311783.html

相关文章：

数据结构---概念、数据与数据之间的关系（逻辑结构、物理结构）、基本功能、数据结构内容、单向链表（该奶奶、对象、应用）

SpringBoot3.x入门到精通系列：2.2 依赖注入与IoC容器

Spring AI MCP 服务端

边缘智能网关在水务行业中的应用—龙兴物联

沿街晾晒识别准确率↑32%：陌讯多模态融合算法实战解析

P2415 集合求和

Docker 镜像打包为 ZIP 文件便于分享和转发

linux ext4缩容home，扩容根目录

【Kubernetes】Secret配置管理，安全管理敏感配置

Effective C++ 条款17：以独立语句将newed对象置入智能指针

Python 程序设计讲义（50）：Python 的可迭代对象与迭代器

Flutter基础知识

SpringBoot与TurboGears2跨栈、整合AI服务、智能客服路由系统整合实战

SpringCloud学习第一季-4

第15届蓝桥杯Python青少组中/高级组选拔赛（STEMA）2024年3月10日真题

17、原坐标变换和逆变换在实战中用法

无人机数字图传技术的前沿探索与应用

【昇腾推理PaddleOCR】生产级部署方式

机器学习实战：KNN算法全解析 - 从原理到创新应用

LangChain框架入门05：输出解析器使用技巧

SpringBoot 服务器配置

Json简单的实现

【Android】RecyclerView实现新闻列表布局（1）适配器使用相关问题

【Leetcode】2561. 重排水果

【Django】-6- 登录用户身份鉴权

知识随记-----Qt 实战教程：使用 QNetworkAccessManager 发送 HTTP POST

面试小总结

解决技术问题思路

STM32学习记录--Day6

Spring 中 Bean 的生命周期