当前位置: 首页 > news >正文

Python中的集合(set)

  Python中的集合(set)是一种无序且元素唯一的数据结构,适用于成员检测、去重和数学集合运算。

1、创建集合

直接创建:
使用花括号 {},元素间用逗号分隔。

s = {1, 2, 3}  # {1, 2, 3}

空集合:
必须用 set(),因为 {} 表示空字典。

empty_set = set()

从可迭代对象转换:
如列表、字符串等。

s = set([1, 2, 2, 3])  # {1, 2, 3}(去重)
s = set("hello")        # {'h', 'e', 'l', 'o'}

2、集合的特性

  • 元素唯一性:自动去重,重复元素会被忽略。
  • 无序性:元素没有固定顺序,不支持索引访问。
  • 可哈希性:集合的元素必须是不可变类型(如数字、字符串、元组),集合本身是可变对象,不可作为其他集合的元素或字典的键。若需不可变集合,使用frozenset。

3、常用操作与方法

修改集合

  • 添加元素:add() 添加单个元素;update() 合并多个元素。
s.add(4)             # {1, 2, 3, 4}
s.update([5, 6])     # {1, 2, 3, 4, 5, 6}
  • 移除元素:
    remove(e):删除指定元素,元素不存在时报错。
    discard(e):安全删除,元素不存在不报错。
    pop():随机删除一个元素(因集合无序)。
    clear():清空集合。

集合运算

  • 并集:union() 或 | 运算符。
a = {1, 2}; b = {2, 3}
a.union(b)        # {1, 2, 3}
a | b             # {1, 2, 3}
  • 交集:intersection() 或 & 运算符。
a.intersection(b) # {2}
a & b             # {2}
  • 差集:difference() 或 - 运算符。
a.difference(b)   # {1}
a - b             # {1}
  • 对称差集(不同时存在的元素):symmetric_difference() 或 ^ 运算符。
a.symmetric_difference(b) # {1, 3}
a ^ b                     # {1, 3}

关系判断

  • 子集/超集:issubset() 和 issuperset()。
a = {1, 2}; b = {1, 2, 3}
a.issubset(b)    # True
b.issuperset(a)  # True
  • 无交集:isdisjoint()。
a = {1}; b = {3}
a.isdisjoint(b)  # True

4、集合推导式

类似列表推导式,生成集合:

s = {x for x in 'abracadabra' if x not in 'abc'}  # {'d', 'r'}

5、应用场景

  • 去重:快速去除列表中的重复项。
lst = [1, 2, 2, 3]
unique = list(set(lst))  # [1, 2, 3](顺序可能丢失)
  • 成员检测:in 操作时间复杂度为 O(1),效率高于列表。
  • 集合运算:如数据对比、交集分析等。

6、注意事项

  • 无序性:遍历顺序不确定,不能依赖索引。
  • 不可哈希元素:集合不能包含列表、字典等可变类型。
  • 性能优势:适合频繁查找和去重,但不适合需要维护顺序的场景(此时可用 list 或 collections.OrderedDict)。

  通过掌握集合的特性和方法,可以在数据处理中高效实现去重、快速查找和集合运算,提升代码简洁性和性能。

http://www.dtcms.com/a/90347.html

相关文章:

  • 勿看 计算机操作系统——第三节堆栈的使用
  • 对接点餐接口过程中有哪些注意事项?
  • windows 下,将bat程序,注册为系统服务;
  • 飞书只有阅读权限的文档下载,飞书文档下载没有权限的文件
  • 为什么String要定义成不可变的?
  • 蓝桥杯—最少操作数
  • winstart.wsf 病毒清理大作战
  • Vue动态添加或删除DOM元素:购物车实例
  • Spring Boot 三层架构【清晰易懂】
  • Python技术难点及详细解决方案
  • uv - Guides 指南 [官方文档翻译]
  • Rabbitmq消息被消费时抛异常,进入Unacked 状态,进而导致消费者不断尝试消费(下)
  • 图像对比分析并生成报告
  • GitHub开源的容器管理面板-Dpanel
  • 有时序协议与无时序协议区别(以RTU协议和TCP协议为例)RTU协议规定了严格时序要求:两个数据帧之间间隔时间必须在特定的范围内
  • (基本常识)C++中const与引用——面试常问
  • Linux 安装 Redis
  • C#中的Lambda表达式‌
  • VS2022的第一个Qt程序——实战《加载并显示图像》
  • 零门槛部署DeepSeek本地整合包一键即用
  • SpringBoot集成MybatisPlus
  • 编程实现自我指涉(self-reference)
  • 计算机网络--传输层(2)
  • <template>标签的作用,在构建可复用 UI 片段时如何应用?
  • Next.js 严重漏洞:攻击者可绕过中间件授权检查
  • Day28-代码随想录-平衡二叉树110+二叉树的所有路径257
  • 责任链模式-java
  • tkinter日历程序的设计
  • 【vue】warning:Avoid mutating a prop directly
  • 53.第二阶段x86游戏实战2-c++实现自动打怪2