当前位置: 首页 > news >正文

Python中的集合(set)

  Python中的集合(set)是一种无序且元素唯一的数据结构,适用于成员检测、去重和数学集合运算。

1、创建集合

直接创建:
使用花括号 {},元素间用逗号分隔。

s = {1, 2, 3}  # {1, 2, 3}

空集合:
必须用 set(),因为 {} 表示空字典。

empty_set = set()

从可迭代对象转换:
如列表、字符串等。

s = set([1, 2, 2, 3])  # {1, 2, 3}(去重)
s = set("hello")        # {'h', 'e', 'l', 'o'}

2、集合的特性

  • 元素唯一性:自动去重,重复元素会被忽略。
  • 无序性:元素没有固定顺序,不支持索引访问。
  • 可哈希性:集合的元素必须是不可变类型(如数字、字符串、元组),集合本身是可变对象,不可作为其他集合的元素或字典的键。若需不可变集合,使用frozenset。

3、常用操作与方法

修改集合

  • 添加元素:add() 添加单个元素;update() 合并多个元素。
s.add(4)             # {1, 2, 3, 4}
s.update([5, 6])     # {1, 2, 3, 4, 5, 6}
  • 移除元素:
    remove(e):删除指定元素,元素不存在时报错。
    discard(e):安全删除,元素不存在不报错。
    pop():随机删除一个元素(因集合无序)。
    clear():清空集合。

集合运算

  • 并集:union() 或 | 运算符。
a = {1, 2}; b = {2, 3}
a.union(b)        # {1, 2, 3}
a | b             # {1, 2, 3}
  • 交集:intersection() 或 & 运算符。
a.intersection(b) # {2}
a & b             # {2}
  • 差集:difference() 或 - 运算符。
a.difference(b)   # {1}
a - b             # {1}
  • 对称差集(不同时存在的元素):symmetric_difference() 或 ^ 运算符。
a.symmetric_difference(b) # {1, 3}
a ^ b                     # {1, 3}

关系判断

  • 子集/超集:issubset() 和 issuperset()。
a = {1, 2}; b = {1, 2, 3}
a.issubset(b)    # True
b.issuperset(a)  # True
  • 无交集:isdisjoint()。
a = {1}; b = {3}
a.isdisjoint(b)  # True

4、集合推导式

类似列表推导式,生成集合:

s = {x for x in 'abracadabra' if x not in 'abc'}  # {'d', 'r'}

5、应用场景

  • 去重:快速去除列表中的重复项。
lst = [1, 2, 2, 3]
unique = list(set(lst))  # [1, 2, 3](顺序可能丢失)
  • 成员检测:in 操作时间复杂度为 O(1),效率高于列表。
  • 集合运算:如数据对比、交集分析等。

6、注意事项

  • 无序性:遍历顺序不确定,不能依赖索引。
  • 不可哈希元素:集合不能包含列表、字典等可变类型。
  • 性能优势:适合频繁查找和去重,但不适合需要维护顺序的场景(此时可用 list 或 collections.OrderedDict)。

  通过掌握集合的特性和方法,可以在数据处理中高效实现去重、快速查找和集合运算,提升代码简洁性和性能。

相关文章:

  • 勿看 计算机操作系统——第三节堆栈的使用
  • 对接点餐接口过程中有哪些注意事项?
  • windows 下,将bat程序,注册为系统服务;
  • 飞书只有阅读权限的文档下载,飞书文档下载没有权限的文件
  • 为什么String要定义成不可变的?
  • 蓝桥杯—最少操作数
  • winstart.wsf 病毒清理大作战
  • Vue动态添加或删除DOM元素:购物车实例
  • Spring Boot 三层架构【清晰易懂】
  • Python技术难点及详细解决方案
  • uv - Guides 指南 [官方文档翻译]
  • Rabbitmq消息被消费时抛异常,进入Unacked 状态,进而导致消费者不断尝试消费(下)
  • 图像对比分析并生成报告
  • GitHub开源的容器管理面板-Dpanel
  • 有时序协议与无时序协议区别(以RTU协议和TCP协议为例)RTU协议规定了严格时序要求:两个数据帧之间间隔时间必须在特定的范围内
  • (基本常识)C++中const与引用——面试常问
  • Linux 安装 Redis
  • C#中的Lambda表达式‌
  • VS2022的第一个Qt程序——实战《加载并显示图像》
  • 零门槛部署DeepSeek本地整合包一键即用
  • 24 手表网站/百度搜索收录入口
  • 旅游网站怎么自己做/网络口碑营销名词解释
  • 网页与网站/seo课程培训
  • seo 网站优化/西安百度快速排名提升
  • 聚美优品网站建设策划书/泰安百度推广代理商
  • 权威的顺德网站建设/百度快速排名工具