【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting
系统概述如下:
(a) 一个基于卷积神经网络(ConvNet)的识别模型,该模型包含特征提取器和分类器;
(b) 一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的,我们为这些类别准备了大量训练数据。在测试阶段,权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量(分类器框内的绿色矩形),并为新类别生成相应的分类权重向量(分类器框内的蓝色矩形)。这样,卷积神经网络就能同时识别基础类别和新类别。
这篇文章的核心内容是关于一种新型的动态少样本视觉学习系统,该系统能够在测试时快速学习新类别,同时不会忘记其训练时学到的初始类别(称为基础类别)。文章提出了两个主要的技术创新:基于注意力的少样本分类权重生成器和基于余弦相似性的卷积神经网络(ConvNet)分类器。这些创新使得系统能够在不牺牲基础类别准确性的情况下,显著提高少样本识别的性能。
背景知识
文章首先指出,尽管深度卷积神经网络(ConvNets)在图像分类任务中取得了显著成果,但它们需要大量的训练样本和计算资源。相比之下,人类视觉系统能够仅通过少数几个样本快速学习新概念,这种能力启发了机器学习中的少样本学习研究领域。
研究方法
文章提出了一个少样本视觉学习系统,目标是在测试时能够高效地从少量训练数据中学习新类别,同时不遗忘初始训练的基础类别。为此,作者提出了两个技术上的创新: