当前位置：首页 > news >正文

【Python】S1 基础篇 P5 字典模块指南

news 2025/9/10 8:14:39

字典的本质与底层实现
- 基础语法结构
使用字典
- 访问字典中的值
- 添加键值对
- 修改字典中的值
- 删除键值对
- 使用 get() 来访问值
遍历字典
- 遍历所有键值对
- 遍历字典中的所有键
- 遍历字典中的所有值
嵌套
- 字典列表
- 在字典中存储列表

在这里插入图片描述

字典（Dictionary）是Python中灵活且强大的内置数据结构之一。作为一个映射类型（mapping type），它以键值对的形式存储数据，为复杂的真实物体场景提供了理想的建模解决方案。总结来说，字典不仅提供了高效的数据存储方式，更是构建复杂应用架构的基础。

字典的本质与底层实现

在 Python 中，字典是基于哈希表（Hash Table）实现的数据结构，提供 $O (1)$ 时间复杂度的查找、插入和删除操作。字典使用键（key）来索引值（value），其中键必须是不可变类型，而值可以是任意 Python 对象。

基础语法结构

字典用放在花括号 {} 中的一系列键值对表示，每个键值对通过冒号 : 连接，多个键值对之间用逗号 , 分隔。

# 基本字典结构
person = {'name': '张三','age': 28,'city': '北京','active': True
}

字典的键必须是不可变类型（如字符串、数字、元组），而值可以是任意 Python 对象。这种设计确保了键的唯一性和哈希计算的稳定性。

使用字典

Python 字典是一种关联数组，实现了键到值的映射关系。作为可变数据类型，字典支持动态添加、修改和删除操作。字典中的键值对是无序的，通过键来快速访问对应的值，这种访问方式比列表的索引访问更加语义化和灵活。

键值对体现了现实世界中实体与属性的关联关系。当指定一个键时，Python 的哈希算法会快速定位并返回与之关联的值。这种映射机制使得字典成为数据建模和配置管理的理想选择。

# 复合数据类型的字典
employee = {'id': 'E001','name': '李明','skills': ['Python', 'Django'],'contact': {'email': 'li@company.com', 'phone': '138xxxx'}
}

访问字典中的值

字典提供了直接通过键访问值的机制。使用方括号语法 dict[key] 是最直接的访问方式，但需要确保键的存在性，否则会抛出 KeyError 异常。

print(employee['name'])  # 输出: 李明
print(employee['contact']['email'])  # 访问嵌套字典

添加键值对

字典的动态特性允许在运行时添加新的键值对。新添加的键值对会根据哈希值存储在适当的位置，不影响现有数据的访问性能。

employee['department'] = '技术部'
employee['hire_date'] = '2023-01-15'

修改字典中的值

字典是可变对象，支持原地修改操作。修改操作不会改变字典的内存地址，只是更新了特定键对应的值。

employee['name'] = '李明华'  # 修改现有值
employee['skills'].append('FastAPI')  # 修改列表类型的值

删除键值对

Python 提供了多种删除字典键值对的方法，每种方法适用于不同的使用场景：

# del 语句 - 直接删除
del employee['hire_date']# pop() 方法 - 删除并返回值
old_name = employee.pop('name')# popitem() 方法 - 删除并返回最后插入的键值对（Python 3.7+）
last_item = employee.popitem()

使用 get() 来访问值

直接使用方括号语法访问字典值时，如果键不存在会引发 KeyError 异常。get() 方法提供了安全的访问机制，是异常处理的优雅替代方案。

get() 方法接受两个参数：第一个参数是要查找的键（必需），第二个参数是键不存在时的默认返回值（可选，默认为 None）。这种设计模式在处理不确定数据源时特别有用。

# 安全访问，避免 KeyError
department = employee.get('department', '未分配')
bonus = employee.get('bonus', 0)# 处理嵌套字典的安全访问
email = employee.get('contact', {}).get('email', '未提供')

遍历字典

字典遍历是数据处理中的基本操作。Python 提供了多种遍历方式，每种方式返回不同的视图对象（view objects），这些视图对象反映字典的实时状态，具有内存高效的特点。

遍历所有键值对

items() 方法返回字典的键值对视图，是最常用的遍历方式。它允许同时访问键和值，适用于需要完整信息的处理场景。

user_scores = {'Alice': 95, 'Bob': 87, 'Charlie': 92}for name, score in user_scores.items():grade = 'A' if score >= 90 else 'B' if score >= 80 else 'C'print(f"{name}: {score} ({grade})")

遍历字典中的所有键

当只需要处理字典的键时，keys() 方法是最佳选择。它返回键的视图对象，常用于条件检查、键的变换或过滤操作。

config = {'debug': True, 'port': 8000, 'host': 'localhost'}# 检查配置项
required_keys = ['host', 'port']
for key in config.keys():if key in required_keys:print(f"必需配置 {key}: {config[key]}")

按特定顺序遍历字典中的所有键

虽然现代 Python 保持插入顺序，但有时需要按特定逻辑排序。sorted() 函数结合 keys() 方法可以实现各种排序需求。

sales = {'Q1': 45000, 'Q3': 52000, 'Q2': 38000, 'Q4': 61000}# 按键名排序
for quarter in sorted(sales.keys()):print(f"{quarter}: {sales[quarter]}")# 按值排序键
for quarter in sorted(sales.keys(), key=lambda x: sales[x], reverse=True):print(f"{quarter}: {sales[quarter]}")

遍历字典中的所有值

values() 方法返回值的视图对象，适用于值的统计分析、聚合计算等操作。由于不包含键信息，主要用于数值计算和数据分析场景。

需要注意的是，直接提取值可能包含重复项。在需要唯一值的场景下，应结合集合（set）进行去重处理，这是数据处理中的常见模式。

departments = {'Alice': '技术部','Bob': '销售部', 'Charlie': '技术部','David': '市场部'
}# 统计部门分布
all_depts = list(departments.values())
unique_depts = set(departments.values())print(f"总人数: {len(all_depts)}")
print(f"部门数: {len(unique_depts)}")
print(f"各部门: {', '.join(unique_depts)}")

嵌套

在复杂的应用场景中，单层字典往往无法满足数据建模需求。嵌套结构通过将字典作为值存储在其他字典中，或将字典存储在列表中，构建了多维数据模型。这种层次化的数据组织方式更贴近现实世界的复杂关系，是企业级应用中数据架构设计的基础。

嵌套不仅提供了数据的逻辑分组，还支持更精细的数据访问控制和处理策略。正如现实世界中，复杂问题往往涉及多个相互关联的维度，嵌套字典为这种多维关系提供了自然的表达方式。

字典列表

字典列表是将多个结构相似的字典组织成列表的数据模式，适用于表示同类实体的集合，如用户列表、产品目录、订单记录等。这种结构结合了列表的有序性和字典的语义化访问特点。

employees = [{'id': 'E001', 'name': '张三', 'dept': '技术部', 'salary': 8000},{'id': 'E002', 'name': '李四', 'dept': '销售部', 'salary': 7000},{'id': 'E003', 'name': '王五', 'dept': '技术部', 'salary': 9000}
]# 部门薪资统计
tech_employees = [emp for emp in employees if emp['dept'] == '技术部']
avg_tech_salary = sum(emp['salary'] for emp in tech_employees) / len(tech_employees)
print(f"技术部平均薪资: {avg_tech_salary}")

字典列表支持复杂的查询和聚合操作，是数据分析和报表生成的重要数据结构。通过列表推导式和内置函数的组合，可以实现高效的数据处理管道。

在字典中存储列表

当需要将一个键关联到多个值时，在字典中嵌套列表是最直接的解决方案。这种模式广泛应用于分组、分类和一对多关系的建模中。

project_teams = {'电商平台': {'manager': '张经理','developers': ['李开发', '王前端', '赵后端'],'technologies': ['Python', 'React', 'PostgreSQL'],'milestones': ['需求分析', '系统设计', '开发实现', '测试上线']},'APP开发': {'manager': '刘经理', 'developers': ['孙移动', '周UI'],'technologies': ['React Native', 'Node.js'],'milestones': ['原型设计', '开发实现', '测试发布']}
}# 技术栈统计
all_technologies = set()
for project in project_teams.values():all_technologies.update(project['technologies'])print(f"公司技术栈: {sorted(all_technologies)}")# 人员分配分析  
total_developers = sum(len(project['developers']) for project in project_teams.values())
print(f"总开发人员: {total_developers}人")