当前位置：首页 > news >正文

PyTorch torch.unique() 基础与实战

news 2025/10/29 8:11:05

在深度学习的数据处理中经常需要统计或筛选 张量（Tensor） 中的唯一值，比如去重、统计类别数量、计算唯一标签数等。
PyTorch 提供了一个非常方便的函数 —— torch.unique()，可以轻松完成这些操作。

本文将带你深入了解 torch.unique() 的用法、参数、返回值以及实际应用场景。

文章目录

- 一、什么是 `torch.unique()`？
- 二、函数语法
- 三、参数说明
- 四、基本用法
- - 🎯 示例 1：基础去重
  - 🎯 示例 2：不排序
- 五、返回索引与计数
- - 🎯 示例 3：`return_inverse`
  - 🎯 示例 4：`return_counts`
  - 🎯 示例 5：同时返回多个结果
- 六、按维度去重（dim 参数）
- - 🎯 示例 6：按行去重
  - 🎯 示例 7：按列去重
- 七、`torch.unique()` 与 NumPy 对比
- 八、实际应用场景
- - 1. 分类问题中统计类别数量
  - 2. 计算样本分布（类别频率）
  - 3. 在图像分割中统计像素类别
- ⚠️ 九、注意事项
- 📚 参考资料

一、什么是 `torch.unique()`？

torch.unique() 是 PyTorch 中的一个去重函数，用于返回张量中所有的唯一元素（unique elements）。

它类似于 Python 的 set() 或 NumPy 的 np.unique()，但专为 GPU 加速的张量操作 设计。

二、函数语法

torch.unique(input, sorted=True, return_inverse=False, return_counts=False, dim=None)

三、参数说明

参数	类型	说明
`input`	`Tensor`	输入张量
`sorted`	`bool`	是否对结果排序（默认 `True`）
`return_inverse`	`bool`	是否返回原张量中每个值在唯一值列表中的索引
`return_counts`	`bool`	是否返回每个唯一值的出现次数
`dim`	`int` 或 `None`	按指定维度去重，默认对整个张量去重

四、基本用法

🎯 示例 1：基础去重

import torchx = torch.tensor([1, 2, 2, 3, 3, 3])
unique_x = torch.unique(x)
print(unique_x)

输出：

tensor([1, 2, 3])

✅ 结果去除了重复值，并自动排序。

🎯 示例 2：不排序

x = torch.tensor([3, 2, 1, 3, 2])
unique_x = torch.unique(x, sorted=False)
print(unique_x)

输出：

tensor([3, 2, 1])

当 sorted=False 时，结果的顺序与首次出现的顺序一致。

五、返回索引与计数

🎯 示例 3：`return_inverse`

return_inverse=True 会返回一个索引张量，表示原张量中每个元素在唯一值（即新张量）中的位置。

x = torch.tensor([2, 1, 2, 3])
u, inv = torch.unique(x, return_inverse=True)print(u)
print(inv)

输出：

tensor([1, 2, 3])
tensor([1, 0, 1, 2])

解释：

唯一值为 [1, 2, 3]
原数组 [2, 1, 2, 3] 中：
- 第一个元素 2 → 索引 1
- 第二个元素 1 → 索引 0
- 第三个元素 2 → 索引 1
- 第四个元素 3 → 索引 2

🎯 示例 4：`return_counts`

return_counts=True 会返回每个唯一值出现的次数。

x = torch.tensor([1, 2, 2, 3, 3, 3])
u, counts = torch.unique(x, return_counts=True)print(u)
print(counts)

输出：

tensor([1, 2, 3])
tensor([1, 2, 3])

表示：

值 1 出现 1 次
值 2 出现 2 次
值 3 出现 3 次

🎯 示例 5：同时返回多个结果

你可以同时返回 unique 值、inverse 索引和计数：

x = torch.tensor([1, 2, 2, 3, 3, 3])
u, inv, counts = torch.unique(x, return_inverse=True, return_counts=True)
print(u)
print(inv)
print(counts)

输出：

tensor([1, 2, 3])
tensor([0, 1, 1, 2, 2, 2])
tensor([1, 2, 3])

六、按维度去重（dim 参数）

默认情况下，torch.unique() 会将张量展开成一维后去重。
但如果你希望在特定维度上去重（如按行或按列），可以使用 dim 参数。

🎯 示例 6：按行去重

x = torch.tensor([[1, 2],[1, 2],[3, 4]])unique_rows = torch.unique(x, dim=0)
print(unique_rows)

输出：

tensor([[1, 2],[3, 4]])

表示第 1、2 行重复，只保留一个。

🎯 示例 7：按列去重

x = torch.tensor([[1, 1, 3],[2, 2, 4]])unique_cols = torch.unique(x, dim=1)
print(unique_cols)

输出：

tensor([[1, 3],[2, 4]])

七、`torch.unique()` 与 NumPy 对比

功能	PyTorch (`torch.unique`)	NumPy (`np.unique`)
默认排序	✅ 是	✅ 是
支持 GPU	✅ 是	❌ 否
返回 inverse 索引	✅ 是	✅ 是
返回 counts	✅ 是	✅ 是
按维度去重	✅ 是（`dim`）	❌ 不直接支持
性能	高（GPU 支持）	仅 CPU

八、实际应用场景

1. 分类问题中统计类别数量

labels = torch.tensor([0, 1, 0, 2, 2, 1, 3])
classes = torch.unique(labels)
print(f"共有 {len(classes)} 个类别: {classes.tolist()}")

输出：

共有 4 个类别: [0, 1, 2, 3]

2. 计算样本分布（类别频率）

labels = torch.tensor([0, 1, 0, 2, 2, 1, 3])
u, counts = torch.unique(labels, return_counts=True)
for c, cnt in zip(u.tolist(), counts.tolist()):print(f"类别 {c}: {cnt} 个样本")

输出：

类别 0: 2 个样本
类别 1: 2 个样本
类别 2: 2 个样本
类别 3: 1 个样本

3. 在图像分割中统计像素类别

例如在语义分割任务中，计算 mask 图像中有多少个不同的像素类别：

mask = torch.randint(0, 5, (256, 256))  # 随机生成类别标签
num_classes = len(torch.unique(mask))
print(f"图像中共有 {num_classes} 个类别")

⚠️ 九、注意事项

torch.unique()** 默认会对结果排序**，如果在意性能，可以设置 sorted=False。
对高维张量使用 dim 去重时，必须保证该维度的所有元素形状一致。
对大张量使用 return_counts 或 return_inverse 时可能会消耗更多显存。

📚 参考资料

PyTorch 官方文档 – torch.unique

NumPy 官方文档 – numpy.unique

查看全文

http://www.dtcms.com/a/540654.html

【图像处理基石】图像滤镜的算法原理：从基础到进阶的技术解析

信宜网站建设网站开发配置表格

提示词（Prompt）——指令型提示词在大模型中的调用（以 Qwen 模型为例）

python-88-实时消费kafka数据批量追加写入CSV文件

提示词（Prompt）——链式思维提示词（Chain-of-Thought Prompting）在大模型中的调用（以 Qwen 模型为例）

用三个面中心点求解长方体位姿：从几何直觉到线性代数实现

网站备案ip查询网站做网站首页ps分辨率多少

免费建一级域名网站千锋教育广州校区

CSS3属性（三）

开源底盘+机械臂机器人：Lekiwi驱动链路分析

通过 useEventBus 和 useEventCallBack 实现与原生 Android、鸿蒙、iOS 的事件交互

iOS 26 iPhone 使用记录分析多工具组合构建全方位设备行为洞察体系

【Unity】HTModuleManager（三）Markdown语法的Unity编辑器方言

如何将安卓手机备份到电脑？7种方法

基于SpringBoot+Vue的购物商城（支付宝沙盒支付、物流快递API、WebSocket及时通讯、协同过滤算法、Echarts图形化分析）

MYSQL-超全基础以及用法--仅个人的速记笔记（1）

31、LangChain开发框架（八）-- LangChain 数据分析智能体实战

建设局域网网站盐城市亭湖区城乡建设网站

6.2 大数据方法论与实践指南-任务元数据

MongoDB中全文索引基础篇

SSM浪漫烘焙屋z73z2(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上，文末可获取，系统界面在最后面。

网站网域名查询外贸推广的几种方式以及效果排行

彩票网站做代理网站建设与管理规定

系统商（ERP、OMS、WMS 等）打通物流 API 数据的重要一环

kubectl 学习心得：从入门到实践的 K8s 命令行掌控之旅

非线性笔记革命：Trilium+cpolar如何让知识管理突破时空限制？

华为ENSP——OSPF多区域配置实验

快指点击器 1.1.9 | 支持多点操作、自动化脚本，操作记录等功能，快速解放双手

Termux 安装 Joplin Server ，全平台同步Joplin笔记

笔记：现代操作系统：原理与实现（6）

文章目录

一、什么是 torch.unique()？

二、函数语法

三、参数说明

四、基本用法

🎯 示例 1：基础去重

🎯 示例 2：不排序

五、返回索引与计数

🎯 示例 3：return_inverse

🎯 示例 4：return_counts

🎯 示例 5：同时返回多个结果

六、按维度去重（dim 参数）

🎯 示例 6：按行去重

🎯 示例 7：按列去重

七、torch.unique() 与 NumPy 对比

八、实际应用场景

1. 分类问题中统计类别数量

2. 计算样本分布（类别频率）

3. 在图像分割中统计像素类别

⚠️ 九、注意事项

📚 参考资料

相关文章：

一、什么是 `torch.unique()`？

🎯 示例 3：`return_inverse`

🎯 示例 4：`return_counts`

七、`torch.unique()` 与 NumPy 对比