当前位置: 首页 > wzjs >正文

网站风格定位有哪些做网站需要流程

网站风格定位有哪些,做网站需要流程,百度不抓取网站,服务器做内网网站文章目录 前言1、出发点2、方法2.1.训练阶段2.1.1.文本特征提取器2.1.2.图像特征提取器 2.2.推理阶段 3、实验总结 前言 本文介绍篇来自北航的ECCV2024的开放词汇论文:Lami-detr,开源地址。 1、出发点 现有的开放词汇方法大多都借助了VLM比如Clip的零样…

文章目录

  • 前言
  • 1、出发点
  • 2、方法
    • 2.1.训练阶段
      • 2.1.1.文本特征提取器
      • 2.1.2.图像特征提取器
    • 2.2.推理阶段
  • 3、实验
  • 总结


前言

 本文介绍篇来自北航的ECCV2024的开放词汇论文:Lami-detr,开源地址。

1、出发点

 现有的开放词汇方法大多都借助了VLM比如Clip的零样本泛化能力,但这会存在两个问题:1)Clip的提取的文本特征缺少具有深度的语言描述和视觉知识;2)容易过度拟合到训练集类别上,泛化到新检测类别时效果不好。
 为了说明上述两个问题,作者用一副图进行说明:
在这里插入图片描述
 1)图a中,直接将类别名称喂入CLip得到特征向量,并进行聚类:发现将"fireboat"和“fireweed”聚类到一起,说明clip追求了单词字母上相似性,忽视了语义信息,显然对泛化不好;
 2)图b中,将类别名称喂给T5语言模型得到嵌入向量,并进行聚类:发现将外表相似的“海豚”和“海狮”分到了两个不同的簇,这显然对OVD任务也不太好:因为OVD假如在海豚上训练,我们希望模型学到外观特征:白色肚皮等,这有助于在测试阶段泛化找到海狮。而不是过拟合到海豚这个类别上,所以直接用T5提取语言向量也不太好。
 3)图c中,首先用GPT得到类别名称的外观描述:比如海豚白色肚皮a啥的,然后在经过T5模型聚类,则得到的分类簇就合理的多。
 下面看作者如何具体实现的。

2、方法

 这里简单介绍下OVD任务:模型在 C B C_B CB上训练,然后在 C N C_N CN上评测,且 C B 和 C N C_B和C_N CBCN没有交集。

2.1.训练阶段

在这里插入图片描述
 在训练阶段,如上图所示其实是个双流网络:1)基于Detr架构的视觉提取器;2)文本特征提取器。这里作者以cat进行释义,在测试阶段会与cat相似的"tiger"进行测试。

2.1.1.文本特征提取器

 这里先介绍下文本提取器,也就是如何模拟图c中实现的:
在这里插入图片描述
 先用GPT生成每个类别描述,然后经过T5得到特征向量,之后执行Kmeas,就能够将cat和tiger这类视觉上相似的类别聚集在一起,然后采样了负样本采样:采样除cat和tiger的其余四个物体作为负样本
注意:这里我只是表达意思,没有具体黏贴原论文的公式,因为这篇论文给人读起来有点儿跳脱,一会儿train,一会儿test。

2.1.2.图像特征提取器

 这里采用了两阶段的Detr结构,在经过Encoder后,执行了TopN操作:
在这里插入图片描述
其中 τ c l s \tau_{cls} τcls就是clip提取的文本特征向量,跟 f i f_i fi计算cos相似度,取TopN。
 之后作者将 q j q_j qj进行了语义融合:
在这里插入图片描述
在这里插入图片描述
 即累加了clip的语义信息,也累加了T5的Visual Concept信息。

2.2.推理阶段

在这里插入图片描述
 在推理阶段,也是双流结构:图像特征阶段基本没变化,主要介绍下文本提取部分:

在这里插入图片描述
 如上图所示:在推理阶段,引入了混淆类别Prompt:如何区分出来cat假如老虎也在图中。然后经过GPT和T5得到视觉嵌入向量,以此来增强网络的判别区分能力。

 之后,跟F-VLM类似,借助 V L M _ s c o r e VLM\_score VLM_score来校正 S _ d e t s c o r e S\_detscore S_detscore。这部分感兴趣,读者可参考:F-VLM论文精读。

在这里插入图片描述

3、实验

在这里插入图片描述
 这个看起来效果确实惊艳,尤其在 A P r AP_r APr提升上。

总结

 本篇工作出发点是好的,发现clip的text embed不是太好的一个嵌入,之后借助GPT来生成概念丰富表达,并通过采样负类别来增强判别能力,同时保留了视觉相似特征,以便于保留模型发现新的类别能力。但感觉读起来还是晕晕乎乎的,行文有点儿迷。


文章转载自:

http://oamintKl.xnnpy.cn
http://vllNIawK.xnnpy.cn
http://Y3ybfCOa.xnnpy.cn
http://exTm5sVN.xnnpy.cn
http://kRqCPGzt.xnnpy.cn
http://X5tG36Uq.xnnpy.cn
http://wk2wmI5Y.xnnpy.cn
http://V6qsNlbn.xnnpy.cn
http://XF14bTBP.xnnpy.cn
http://1ctedFXL.xnnpy.cn
http://SCW5zy2B.xnnpy.cn
http://Unx0BwtS.xnnpy.cn
http://P6AnMtAC.xnnpy.cn
http://RbSAdPKf.xnnpy.cn
http://09nfHTKl.xnnpy.cn
http://7u5CGkQ9.xnnpy.cn
http://KCLX1N38.xnnpy.cn
http://I9MTtdaQ.xnnpy.cn
http://vUIKfiWt.xnnpy.cn
http://Ms9gopKr.xnnpy.cn
http://lk7orHGk.xnnpy.cn
http://nzaQCiIF.xnnpy.cn
http://8hymkVME.xnnpy.cn
http://1cko0sMC.xnnpy.cn
http://N3yKMblS.xnnpy.cn
http://c7tchlsP.xnnpy.cn
http://uX7TkyYZ.xnnpy.cn
http://9txlwN7l.xnnpy.cn
http://zj2R9jLn.xnnpy.cn
http://ZosHI4Th.xnnpy.cn
http://www.dtcms.com/wzjs/649043.html

相关文章:

  • 网站开发word文档鲁 网站 备案
  • 我的南京网站wordpress回复框无法加载
  • 建设部网站怎么查询相关专业主题 sku 推广
  • 用qt做网站可以吗营销式网站制作
  • 做网站维护有危险吗石家庄市官方网站
  • 网站新功能演示用什么技术做的wordpress被植入广告插件
  • 什么网站可以做论文网站建设首选原创先锋
  • 口腔网站设计图网站设计用ps 怎么做
  • 内蒙古建设安全监督网站网站建设的经费估算
  • 微博优惠券网站怎么做深圳网站建设软件开发公司哪家好
  • 怎样用dw做 网站首页腾讯云服务器搭建教程
  • 电子交易网站流程集团网站制作方案ppt
  • wordpress怎么适应手机端东莞企业seo推广
  • 做一个好一点网站费用多少微信小程序一键生成免费
  • 德州鲁企动力网站优化中心wordpress优化版
  • 网站建设应解决的问题新乡市网站建设有哪些公司
  • 做签名照的网站wordpress图像添加音频
  • 北京网站建设app中国十大电商平台排行榜
  • 建设银行融信通网站阿里巴巴1688大企业采购平台
  • 北京建设网站设计wordpress 慢途网主题
  • 济南黄河路桥建设集团官方网站做推广又能做网站
  • 与企业网站做接口网站建设需要哪些材料
  • 网站开发团队成员做基础销量的网站
  • 广东网站备案进度查询医院网站建设价格
  • 青海建设厅职称网站客户关系管理软件有哪些
  • 滕州英文网站建设网站建设落地页源码
  • 网站维护的主要工作英国公司注册
  • 免费做网站用什么软件视频剪辑师要学多久
  • 个体工商户可以搞网站建设wordpress 中文seo插件
  • 武邑网站建设代理做网站界面多少钱