当前位置: 首页 > wzjs >正文

文化墙优化神马排名软件

文化墙,优化神马排名软件,镇江vi设计,免费商城网站模板1、背景 Open-Vocabulary 是一个比较火的话题,目前我找到最好的学习资料是 VALSE2024 上李冠彬老师的课程《开放词汇视觉感知》,视频链接:https://www.bilibili.com/video/BV1uf421d7Vk/ 三个多小时的课程系统的介绍了基于开放词汇的图像分类…

1、背景

Open-Vocabulary 是一个比较火的话题,目前我找到最好的学习资料是 VALSE2024 上李冠彬老师的课程《开放词汇视觉感知》,视频链接:https://www.bilibili.com/video/BV1uf421d7Vk/ 三个多小时的课程系统的介绍了基于开放词汇的图像分类、目标检测、分割等任务。

开放词汇可以理解为是一种特殊的 zero-shot learning。 Zero-shot 是在别的类别(base)训练模型,可以识别没见过的类别(unseen),这里有一个严格的限制:unseen类别在训练时一定是不可见的。

开放词汇可以理解为更加宽松的zero-shot,预训练的多模态大模型(如ChatGPT,CLIP等)见多识广,能够在下游任务泛化。开放词汇的实现方法是:来自vision-language model (VLM) 的 text encoder 见过了很多的图像和文本,有很强的能力将它们对齐,也有很强的能力将 unseen的目标关联到对应的类别编码上。

2、研究动机与方法

在地震、洪水应急响应任务中,需要快速解译遥感图像。没有时间对大量数据进行标注与训练,这样研究开放词汇遥感图像语义分割就尤为重要。这个工作主要有两个贡献:

  • 数据集:构建了LandDiscover50K,包含 51,846 张图像、40 个类别,覆盖多种遥感场景。
  • 模型:提出GSNet框架,融合遥感领域先验(RSI specialist)和通用视觉语言模型(CLIP)的能力,通过 Dual-Stream Image Encoder (DSIE)、Query-Guided Feature Fusion(QGFF)和 Residual Information Preservation Decoder (RIPD)实现精准分割。

LandDiscover50K 数据集是现有多个遥感图像语义分割数据集的集成,这里不过多介绍。作者提出的 GSNet 还是受了CVPR2024的 CAT-SEG启发,不同之处是加了一个遥感图像编码器分支。GSNet 主要框架如下图所示,视觉特征编码器包括CLIP和RSI backbone,一方面利用通用特征,另一方也利用遥感图像的特有特征。

wechat_2025-05-27_160229_989

QGFF 实现图像和文本特征的融合,即计算图像和每个类的相似性。接着图像特征再与融合结果进一步精炼,通过一系列上采样与卷积,得到分割的输出结果。

实验部分可以参考作者论文,这里不过多介绍。

http://www.dtcms.com/wzjs/494565.html

相关文章:

  • 力洋深圳做网站公司怎么快速刷排名
  • 免费做网站哪个好小程序运营推广公司
  • 企业为什么选择网站建设网站搜索工具
  • 浙江省建设厅官方网站傻瓜式自助建站系统
  • 一家专门做特产的网站爱网
  • 做网站电话号码线上宣传方案
  • 成都网站建设与开发黄金网站app大全
  • 做外贸的在哪些网站找工作腾讯会议开始收费
  • 做模特的网站免费关键词优化工具
  • 上海网站开发月薪多少钱seo排名教程
  • 怎么用ajax做电商网站江苏网络推广公司
  • 电商网站建设任务分解结构百度推广咨询
  • 站酷网入口三只松鼠搜索引擎营销案例
  • 网站建设在线视频seo优化步骤
  • 传媒公司制作网站完整的社群营销方案
  • 南通网站定制公司谷歌浏览器下载
  • 网站建网站建设企业高端大气网站建设
  • 设计免费素材网站有哪些站长之家seo查询
  • 网站运营存在的问题培训网登录入口
  • 做网站北京公司sem是什么工作
  • 棠下手机网站建设电话长尾词在线挖掘
  • 网站和网址的区别西安计算机培训机构哪个最好
  • 做网站怎样让字体滚动谷歌优化怎么做
  • 土豆做视频在线观看网站seo关键词优化要多少钱
  • 做团购网站怎样赚钱搜索引擎营销的概念
  • 茶叶网站建设网页设计制作中文搜索引擎网站
  • 惠州有没有做网站明天上海封控16个区
  • 网站建设用dw西安竞价托管代运营
  • 招聘网站开发百度投放广告流程
  • 网站建设视频教程百度云b2b平台营销