当前位置：首页 > news >正文

深度学习·GFSS

news 2025/8/18 12:08:11

GFSS General Few-Shot Segmentation

任务实现方式与zero-shot有所不同
本篇论文只涉及同一个模态(图像)，训练过程中，novel class有几个图像提供，提供k个就称之为k-shot。
先从图像中提取class prototype，然后这个原型向量作为查询，与图像的patch嵌入计算相似度，然后得到最后的掩码矩阵。

在这里插入图片描述

RD

先对patch嵌入和原型作逐元素乘法，然后赋予其特定权重。权重就是二者的相似度分数。
从VIT中提取多个patch嵌入，拼接在一起，经过线性层作为key，value。
拼接多个VIT layer的RD和类别原型向量，经过线性层作为query。

局限

依赖ViT单模态能力、计算成本高、对小样本噪声敏感。

http://www.dtcms.com/a/336552.html

相关文章：

C语言字符串操作汇总

线程相关知识

NokoPrint：安卓平台上的便捷无线打印解决方案

存储引擎 InnoDB

【Python】Python 面向对象编程详解

k8s-单主机Master集群部署+单个pod部署lnmp论坛服务（小白的“升级打怪”成长之路）

集成电路学习：什么是SIFT尺度不变特征变换

oom 文件怎么导到visualvm分析家

双指针和codetop2(最短路问题BFS)

闭区间是否存在一个开区间包含之

ESP32S3在圆形240x240 1.8寸GC9A01 SPI显示屏显示双眼睛表情

寻找数组的中心索引

ai测试（六）

[Java恶补day50] 174. 地下城游戏

数据结构03（Java）--（递归行为和递归行为时间复杂度估算，master公式）

数学建模 13 SVM 支持向量机

原子操作及基于原子操作的shared_ptr实现

PYTHON让繁琐的工作自动化-PYTHON基础

【撸靶笔记】第五关：GET - Double Injection - Single Quotes - String

基于STM32单片机智能RFID刷卡汽车位锁桩设计

Qt同步处理业务并禁用按钮

linux系统------kubenetes单机部署

LeetCode 分类刷题：2962. 统计最大元素出现至少 K 次的子数组

5G虚拟仿真平台

[激光原理与应用-292]：理论 - 波动光学 - 驻波的本质是两列反向传播的相干波通过干涉形成的能量局域化分布

安全多方计算（MPC）简述

Compose笔记(四十六)--Popup

Houdini 粒子学习笔记

服装外贸管理软件全流程优化解决方案

学习记录（二十）-Overleaf如何插入参考文献