当前位置: 首页 > news >正文 ATPrompt方法:属性嵌入的文本提示学习 news 来源:原创 2025/6/9 23:03:09 ATPrompt方法:属性嵌入的文本提示学习 让视觉-语言模型更好地对齐图像和文本(包括未知类别)。 一、问题场景:传统方法的局限 假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。 传统方法: 用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。 局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。 ATPrompt的目标: 让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。 例子 相关文章: 本周 edu教育邮箱注册可行方案 车载通信网络 --- 传统车载网络及其发展 【C++高级主题】异常处理(四):auto_ptr类 C++异步日志系统 力扣 155.最小栈 sqli-labs第二十七关——Trick with selectunion Queue 与 Deque 有什么区别? 人工智能第一币AISPF,首发BitMart交易所 C++笔记-哈希表 etcd之etcd curl命令(七) 《反事实棱镜:折射因果表征学习的深层逻辑》 AI时代新词-私有数据与AI结合的技术:隐私保护与数据利用的平衡 多头注意力 vs 单头注意力:计算量与参数量区别 游戏行业DDoS防护:基于IP信誉库的实时拦截方案 【数据集】基于ubESTARFM法的100m 地温LST数据集(澳大利亚) 批量转存夸克网盘内容并分享实操教程 002大模型-提示词工程,少样本提示,角色扮演,思维链 Axure元件动作七:移动、旋转、启用/禁用效果、置于顶层/底层详解 2025-05-26 什么是“AI 全栈” 离线安装Microsoft 照片【笔记】 长春电商网站建设哪家专业/百度关键词推广一年多少钱 网站卖给别人后做违法信息/什么是seo如何进行seo 网站怎么做描文本/百度指数的主要功能有 刘涛做代言的那个网站/公司网址怎么制作 百度网站的设计风格/最新国内新闻10条 网上营销渠道/网站seo关键词
ATPrompt方法:属性嵌入的文本提示学习 让视觉-语言模型更好地对齐图像和文本(包括未知类别)。 一、问题场景:传统方法的局限 假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。 传统方法: 用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。 局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。 ATPrompt的目标: 让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。 例子