IEEE TRANSACTIONS 论文《MTSNN: 一种跨机器异构故障类别的少样本细粒度诊断框架》
一、论文概述
本论文发表于IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT(2025年卷74),标题为《MTSNN: A Few-Shot Fine-Grained Diagnosis Framework for Cross-Machine Fault Diagnosis With Heterogeneous Fault Categories》。作者团队来自东莞理工学院和华南理工大学,提出了一种名为元传输脉冲神经网络(MTSNN) 的新框架,用于解决机械设备在跨机器场景下的少样本细粒度故障诊断问题。论文的核心贡献在于克服了传统深度学习故障诊断方法的三大局限性:对大量标注数据的依赖、泛化能力不足以及对粗粒度故障诊断的偏重。
二、研究背景与动机
在工业大数据和物联网技术驱动的背景下,智能故障诊断(IFD)技术对于机械设备的预测性维护至关重要。然而,现有基于深度学习的方法在实际应用中面临以下挑战:
-
数据依赖性强:模型训练需要大量高质量标注数据,而工业环境中故障样本稀缺。
-
跨机器泛化能力差:大多数方法专注于同一数据集内的诊断,难以处理不同机器间的异构故障类别转移。
-
细粒度诊断关注不足:传统方法多针对粗粒度故障分类,忽略了故障类型、位置和严重程度的精细区分。
为此,论文提出MTSNN框架,旨在实现跨机器、少样本、细粒度的故障诊断,支持异构故障类别的知识迁移。
三、论文核心创新点详解
本论文的创新点主要体现在以下几个方面,这些创新共同解决了传统故障诊断方法在少样本、跨机器和细粒度场景下的局限性。
3.1 整体框架创新:MTSNN 的元传输架构
MTSNN 首次将脉冲神经网络(SNN) 与元学习(Meta-Learning) 相结合,用于解决跨机器故障诊断中的异构类别问题。其核心创新在于:
-
跨机器知识迁移:支持从源机器到目标机器的诊断知识转移,即使故障类别不完全重叠(异构故障)。
-
少样本适应:通过 episodic 训练策略模拟少样本条件,使模型能够从少量样本中快速学习。
-
细粒度诊断:不仅识别故障是否存在,还能区分故障的类型、位置和严重程度,实现更精细的分类。
框架的整体架构如图1所示,它集成了特征提取器(CSNN)和元学习损失函数,形成端到端的诊断流程。
3.2 特征提取器创新:卷积脉冲神经网络(CSNN)
CSNN 结合了 CNN 的空间特征提取能力和 SNN 的时序处理优势,其创新点包括:
-
SNN 的生物学启发性:采用泄漏积分点火(LIF)模型模拟神经元行为,公式为:
τmdtdV(t)=−(V(t)−Vrest)+I(t)
其中 V(t)是膜电位,τm是时间常数,I(t)是输入电流。当电位超过阈值 Vth时,神经元发放脉冲。
-
低能耗和抗噪声:SNN 的脉冲机制仅在有事件时激活,降低了计算能耗,并对工业噪声具有鲁棒性。
-
时序特征保留:直接处理一维振动信号,避免了传统 2D-CNN 将信号转换为图像时丢失的时间细粒度信息。
CSNN 的结构包括卷积层、批量归一化(BN)层和 LIF 层的交替堆叠,最后通过全连接层输出特征。这种设计优于传统 CNN,尤其在样本不平衡时表现更稳定(如论文中表 I 所示,1DACNN 在样本减少时准确率下降最小)。
3.3 损失函数创新:元原型对比损失(Meta-Prototype Contrastive Loss)
损失函数是 MTSNN 的训练核心,创新性地整合了三种损失组件:
-
原型学习损失(PL Loss)