当前位置: 首页 > wzjs >正文

长沙做信息seo网站百度手机app下载安装

长沙做信息seo网站,百度手机app下载安装,怎么做网站设计方案,做电影网站用什么虚拟主机文章目录 整体架构 LW-DETR全称Light-Weight DETR,是百度团队提出的第二代面向实时检测算法,比yolo v8的速度和精度更好 整体架构 LW-DETR 由一个ViT编码器(Vision Transformer Encoder)、一个投影器(Projector&#…

文章目录

    • 整体架构

LW-DETR全称Light-Weight DETR,是百度团队提出的第二代面向实时检测算法,比yolo v8的速度和精度更好

整体架构

LW-DETR 由一个ViT编码器(Vision Transformer Encoder)、一个投影器(Projector)和一个DETR解码器(DETR Decoder)组成。

(知乎观点)LW-DETR之所以这么用ViT,灵感是来源于kaiming团队的ViTDet,但是,ViT的结构显然是同质的,每一层之间的特征的关联性是很大的,即浅层的特征在深层特征中能够得到很好的保留,那么多层特征拼接的做法除了符合某种“思维惯性”,看不出来什么必要性。

另外,考虑到检测任务的图像尺寸一般是大于分类的,此时ViT中的全局自注意力操作便会是显著的计算瓶颈,为了解决这一问题,作者团队便采用了窗口注意力机制,同时,为了保证窗口之间的交互,窗口注意力之后又添加了其他可进去全局关联的模块,这一设计也是借鉴了ViTDet。

编码器

Encoder 采用ViT 作为检测编码器。原始的ViT包含一个分块层和Transformer编码层。Transformer编码层在最初的ViT中包含一个对所有token(patch)的全局自注意力层和一个FFN层。全局自注意力计算成本较高,其时间复杂度与token(patch)数量的平方成正比。通过在Transformer编码层使用窗口自注意力来降低计算复杂度。作者提出将多级特征图、编码器中间层和最终特征图进行聚合,形成更强的编码特征图。

投影器(连接编解码器)

在ViT之后,又接了一个YOLOv8的C2f模块将ViT输出的特征图做一次映射。需要说明的是,LW-DETR的ViT会输出多层特征,如下图所示,将多层特征沿着通道拼接,再由C2f模块来做一次映射之后,进入decoder。

解码器

解码器和rt-detr一样,由Transform的decoder层组成,只不过由原来的6层减少到了3层,缩短了一半的时间。

采用混合查询选择策略 (和rt-detr类似)来形成对象查询,它是内容查询和空间查询的组合。内容查询是可学习的嵌入,类似于DETR。空间查询基于两阶段方法:首先从Projector的最后一层中选择前K个特征,然后预测边界框,并将相应的框转换为嵌入作为空间查询。

http://www.dtcms.com/wzjs/495168.html

相关文章:

  • 网页制作图片怎么居中优化网站排名方法教程
  • 哈尔滨专门做网站秦皇岛百度推广
  • 南昌网站优化国内外搜索引擎大全
  • 做资料网站违法谷歌海外广告投放
  • 做网站编辑需要经验吗全国最新疫情实时状况地图
  • 网站建设经费申请报告培训机构推荐
  • 高端html5网站建设企业网站有什么
  • 哪个网站可以做练习题seo难不难学
  • 怎么做潮牌网站关键词查询网
  • 国内做国外代购在哪个网站吉林关键词优化的方法
  • 阿里云 建设网站现在做网络推广好做吗
  • 商务网站建设实训心得体会国内十大软件测试培训机构
  • 郑州seo关键词推广网站优化外包推荐
  • 百度网站收录seo流量增加软件
  • 比价网站开发网页设计与制作教程
  • 盱眙建设局网站商品促销活动策划方案
  • 监管网站建设情况搜狗营销
  • 做美容一般在哪个网站团购比较好手机怎么搭建属于自己的网站
  • 加强网站建设 基本措施深圳靠谱网站建设公司
  • 找工作的网站seo最好的工具
  • ecshop生成网站地图url重复简单的html网页制作
  • 微信群二维码大全网站竞价托管的注意事项
  • 免费网站建设视频北京官网优化公司
  • wordpress支付宝微信福州seo顾问
  • 电子商务网站建设实验心得站群seo技巧
  • 石排网站仿做百度指数查询官网入口
  • sogou网站提交查关键词
  • 静态网站开发实验报告域名查询ip网站
  • 电子商务做网站百度快照功能
  • 代理网站有什么用seo关键词排名软件流量词