Deep Metric Learning(深度度量学习)
“Deep Metric Learning(深度度量学习)” 是深度学习中一个非常重要的分支,核心目标是——
让神经网络学习一个“度量空间”(embdeding),在这个空间里相似的样本更靠近,不相似的样本更远离。
一、核心思想
在普通分类任务中,神经网络的输出是类别(例如 softmax 分类),
而在 深度度量学习(Deep Metric Learning, DML) 中,
网络学习的不是“类别标签”,而是一个 embedding 向量空间。
在这个空间中:
相同类别的样本 → 向量距离很小(靠得近)
不同类别的样本 → 向量距离很大(分得远)
例如:
雷达信号A(同一辐射源) → 向量 [0.1, 0.3, 0.5] 雷达信号B(同一辐射源) → 向量 [0.12, 0.28, 0.52] 雷达信号C(不同辐射源) → 向量 [0.8, 0.6, 0.9]
那么 A、B 的欧氏距离小,C 离得远,这说明模型学到了“相似度语义”。
二、常用损失函数
深度度量学习的关键是“构造训练样本间的关系约束”,
常见的几种损失函数如下:
损失函数 | 训练样本结构 | 作用 |
---|---|---|
Contrastive Loss | 成对样本 (pair: 正样本对/负样本对) | 让相似样本距离近,不相似样本距离远 |
Triplet Loss | 三元组 (anchor, positive, negative) | 让 anchor 比 negative 更接近 positive |
N-pair Loss / Multi-Similarity Loss | 多样本扩展版本 | 提高训练稳定性与效率 |
Proxy-NCA / ArcFace / CosFace | 类别中心代理 | 结合分类思路进行度量学习 |
三、应用场景
应用领域 | 示例 | DML作用 |
---|---|---|
人脸识别 | FaceNet, ArcFace | 学习人脸嵌入表示,相似脸靠近 |
图像检索 | 商品搜索、图像匹配 | 学习相似度空间,便于最近邻搜索 |
语音识别 | 说话人验证 | 说话人特征 embedding |
轨迹匹配 / 雷达信号分选 | AIS轨迹关联、脉冲聚类 | 学习“同源信号”的嵌入特征,使同一源更接近 |
推荐系统 | 用户-物品相似度学习 | embedding空间中的距离表示兴趣相似性 |
四、与聚类(Clustering)的关系
深度度量学习 ≈ 学习“特征空间的几何结构”,
聚类 ≈ 在这个空间里“分组”。
二者常常结合使用:
用 DML 学习 embedding;
然后在 embedding 上做 K-Means / HDBSCAN / Spectral Clustering;
实现 无监督信号分选(如雷达去交织)。
五、在雷达信号去交织任务中的应用示例
在雷达信号分选中,可以:
使用神经网络编码每个脉冲序列 → 得到 embedding;
使用 Triplet Loss 训练,使同源雷达的脉冲 embedding 相似;
推理阶段用 HDBSCAN / KMeans 在 embedding 空间聚类;
实现基于深度度量学习的“深度聚类去交织”。
深度度量学习适用于未知型号的雷达嘛?
深度度量学习(Deep Metric Learning, DML)+ 聚类方法 非常适合处理 未知型号的雷达信号。
1. 原因分析
不依赖特定型号标签
传统分类方法(softmax 分类)需要预先知道所有雷达型号,并且训练集里必须覆盖它们。
DML 学习的是 相似度空间,即“同源脉冲靠近,不同源脉冲远离”,不需要知道型号具体名称。
支持新/未见雷达
未见型号的脉冲在 embedding 空间里会自然形成新的聚类。
聚类算法(如 HDBSCAN、KMeans)能自动识别新的雷达源。
泛化能力强
通过学习脉冲的几何、时序和统计特征,网络可以捕捉雷达信号的“固有模式”,而非依赖具体型号。
适合半监督或完全无监督的去交织任务。
2. 工作流程(针对未知型号)
特征编码
网络输入脉冲序列(TOA, PRI, DOA, PW 等),输出 embedding 向量。
度量学习训练
使用已知脉冲源训练 Triplet Loss / Contrastive Loss,让同源脉冲靠近。
网络学到 通用相似性度量,而不是依赖固定型号标签。
聚类识别未知雷达
将新数据映射到 embedding 空间。
聚类算法自动分组:即使是未知型号,也会被划入单独簇。
结果验证/后处理
可以对聚类结果做统计验证、置信度评估。
若后续得到新型号标签,可微调网络,无需完全重训。
3. 总结
适用场景:未知型号、雷达型号变化频繁、半监督或无监督雷达去交织。
优势:
不依赖型号标签
自动识别新雷达源
泛化能力强
与传统分类方法相比,更灵活、更适合动态雷达环境