当前位置: 首页 > news >正文

ATPrompt方法:属性嵌入的文本提示学习

ATPrompt方法:属性嵌入的文本提示学习

让视觉-语言模型更好地对齐图像和文本(包括未知类别)。
在这里插入图片描述

一、问题场景:传统方法的局限

假设你有一个模型,能识别图像中的物体并关联到文本标签(如“狗”“猫”)。

  • 传统方法
    用“软提示”(可学习的文本标签)和“硬类别标记”(如“[DOG]”)训练模型,让图像和已知类别(如“金毛犬”“波斯猫”)对齐。
    局限:遇到未知类别(如“薮猫”“爱尔兰猎狼犬”)时,模型无法关联,因为没学过这些标签。

  • ATPrompt的目标
    让模型通过通用属性(如“体型大/小”“毛发颜色”“耳朵形状”)作为桥梁,理解未知类别。
    例子

相关文章:

  • 本周 edu教育邮箱注册可行方案
  • 车载通信网络 --- 传统车载网络及其发展
  • 【C++高级主题】异常处理(四):auto_ptr类
  • C++异步日志系统
  • 力扣 155.最小栈
  • sqli-labs第二十七关——Trick with selectunion
  • Queue 与 Deque 有什么区别?
  • 人工智能第一币AISPF,首发BitMart交易所
  • C++笔记-哈希表
  • etcd之etcd curl命令(七)
  • 《反事实棱镜:折射因果表征学习的深层逻辑》
  • AI时代新词-私有数据与AI结合的技术:隐私保护与数据利用的平衡
  • 多头注意力 vs 单头注意力:计算量与参数量区别
  • 游戏行业DDoS防护:基于IP信誉库的实时拦截方案
  • 【数据集】基于ubESTARFM法的100m 地温LST数据集(澳大利亚)
  • 批量转存夸克网盘内容并分享实操教程
  • 002大模型-提示词工程,少样本提示,角色扮演,思维链
  • Axure元件动作七:移动、旋转、启用/禁用效果、置于顶层/底层详解
  • 2025-05-26 什么是“AI 全栈”
  • 离线安装Microsoft 照片【笔记】
  • 长春电商网站建设哪家专业/百度关键词推广一年多少钱
  • 网站卖给别人后做违法信息/什么是seo如何进行seo
  • 网站怎么做描文本/百度指数的主要功能有
  • 刘涛做代言的那个网站/公司网址怎么制作
  • 百度网站的设计风格/最新国内新闻10条
  • 网上营销渠道/网站seo关键词