当前位置：首页 > news >正文

ATPrompt方法：属性嵌入的文本提示学习

news 2025/11/6 18:27:54

ATPrompt方法：属性嵌入的文本提示学习

让视觉-语言模型更好地对齐图像和文本（包括未知类别）。
在这里插入图片描述

一、问题场景：传统方法的局限

假设你有一个模型，能识别图像中的物体并关联到文本标签（如“狗”“猫”）。

传统方法：
用“软提示”（可学习的文本标签）和“硬类别标记”（如“[DOG]”）训练模型，让图像和已知类别（如“金毛犬”“波斯猫”）对齐。
局限：遇到未知类别（如“薮猫”“爱尔兰猎狼犬”）时，模型无法关联，因为没学过这些标签。
ATPrompt的目标：
让模型通过通用属性（如“体型大/小”“毛发颜色”“耳朵形状”）作为桥梁，理解未知类别。
例子

http://www.dtcms.com/a/214696.html

相关文章：

本周 edu教育邮箱注册可行方案

车载通信网络 --- 传统车载网络及其发展

【C++高级主题】异常处理(四)：auto_ptr类

C++异步日志系统

力扣 155.最小栈

sqli-labs第二十七关——Trick with selectunion

Queue 与 Deque 有什么区别？

人工智能第一币AISPF，首发BitMart交易所

C++笔记-哈希表

etcd之etcd curl命令(七)

《反事实棱镜：折射因果表征学习的深层逻辑》

AI时代新词-私有数据与AI结合的技术：隐私保护与数据利用的平衡

多头注意力 vs 单头注意力：计算量与参数量区别

游戏行业DDoS防护：基于IP信誉库的实时拦截方案

【数据集】基于ubESTARFM法的100m 地温LST数据集（澳大利亚）

批量转存夸克网盘内容并分享实操教程

002大模型-提示词工程，少样本提示，角色扮演，思维链

Axure元件动作七：移动、旋转、启用/禁用效果、置于顶层/底层详解

2025-05-26 什么是“AI 全栈”

离线安装Microsoft 照片【笔记】

通配符滥用详解：Linux命令行的潜在风险

【逆向 | CTF】攻防世界 Reversing-x64Elf-100 二次解密

第1章第1节：安全运维基础思维与体系建设-安全运维的定义与核心目标

题目 3331: 蓝桥杯2025年第十六届省赛真题-LQ 图形

遥感四十号 02 组卫星发射成功遥感科普：电磁环境探测

esp8266 点灯科技远程控制继电器

C/C++---类型转换运算符

嵌入式开发STM32 -- 江协科技笔记

Engineering a direct k-way Hypergraph Partitioning Algorithm【2017 ALENEX】

springboot启动流程