当前位置: 首页 > wzjs >正文

国外有什么优秀的网站推荐电销系统多少钱一套

国外有什么优秀的网站推荐,电销系统多少钱一套,做网站标题居中代码,株洲网站建设开发摘要 最近的 Segment Anything Model(SAM)在扩展分割模型规模方面取得了重大突破,具备强大的零样本能力和灵活的提示机制。尽管 SAM 在训练时使用了 11 亿个掩码,其掩码预测质量在许多情况下仍不理想,尤其是对于结构复杂的目标。我们提出了 HQ-SAM,使 SAM 能够精确地分割…

摘要

最近的 Segment Anything Model(SAM)在扩展分割模型规模方面取得了重大突破,具备强大的零样本能力和灵活的提示机制。尽管 SAM 在训练时使用了 11 亿个掩码,其掩码预测质量在许多情况下仍不理想,尤其是对于结构复杂的目标。我们提出了 HQ-SAM,使 SAM 能够精确地分割任意目标,同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了 SAM 预训练的模型权重,仅引入极少量的附加参数和计算。我们设计了一个可学习的“高质量输出令牌”(High-Quality Output Token),将其注入 SAM 的掩码解码器,用于预测高质量掩码。为了提升掩码细节,我们不仅在解码器特征上使用该令牌,还将其与 ViT 编码器的早期和最终特征进行融合。为训练新增的可学习参数,我们收集并整合了来自多个来源的 44K 张精细掩码数据集。HQ-SAM 仅在这 44K 张掩码数据上训练,使用 8 块 GPU 仅耗时 4 小时。我们在 10 个多样化的分割数据集上评估了 HQ-SAM 的性能,其中 8 个数据集采用零样本转移协议。实验证明,HQ-SAM 在保持零样本能力的同时,显著提升了掩码质量。代码和预训练模型可在 https://github.com/SysCV/SAM-HQ 获取。

为了让 HQ‑Output Token 能够生成更精细的掩码边缘与细节,我们在掩码解码器的特征之上,又额外引入了 ViT 编码器的“早期特征”和“后期特征”两种信息:

早期特征(High‑Resolution 细节信息)

ViT 在最开始几层处理的 patch 嵌入保留了较高的空间分辨率(相当于 CNN 中浅层的 feature map),能够捕捉到物体边缘、纹理、细线等局部细节。

如果只用解码器输出的特征,往往因多次下采样/Transformer 自注意力而丢失这些精细结构。

因此,我们取自 ViT 编码器前几层的高分辨率 feature map,经一次小型映射(如 1×1 卷积或线性层)降维后,与 HQ‑Output Token 一起送入特征融合模块。

后期特征(全局语义信息)

ViT 编码器最后几层的输出具有强大的语义表达能力,能全局感知“这块区域是哪个物体,属于哪个类别”,但空间分辨率相对较低。

将这些深层特征融入,可以帮助 HQ‑Output Token 准确判断哪些细节应当被保留、哪些应被忽略,从而避免误分割噪声或背景纹理。

特征融合机制

我们设计了一个轻量级的 “Fusion Block”:首先对三组特征(早期、解码器中期、后期)分别做投影到相同维度,然后在 token 维度上进行拼接或加权相加,最后通过一层小型 MLP(或卷积)融合出一组既有高分辨率细节又有全局语义的特征表示。

HQ‑Output Token 在 mask 解码器中,就基于这组融合特征进行自注意力操作和 MLP 预测,从而在原来粗糙的掩码边界基础上,补上细线、缝隙、曲面等复杂结构。

通过以上“多尺度、跨阶段”的特征融合,HQ‑SAM 能在保持 SAM 原有 promptable 设计与零样本泛化能力的同时,显著改善对细小结构和边缘细节的分割质量。

1 引言

准确分割多样化目标对于图像/视频编辑、机器人感知和 AR/VR 等场景理解应用至关重要。SAM [21] 作为一款基于海量掩码标签训练的通用图像分割基础模型,以点、边框或粗略掩码作为输入提示,能够在多种场景下分割多样化目标、部件和视觉结构,其零样本分割能力正引发范式转变。

尽管 SAM 在多项任务中表现优异,其分割结果在许多场景下仍不尽如人意,主要存在两大问题:

掩码边界粗糙,甚至遗漏细小结构(如图 1 中的风筝线);
分割错误或遮断掩码,在挑战性场景下出现较大偏差。
在这里插入图片描述

这些问题严重限制了基础分割模型在自动标注和图像/视频编辑等应用中的实用性,因为此类任务对掩码的高精度有严格需求。

我们提出 HQ-SAM,在不损害 SAM 零样本性能和提示灵活性的前提下,实现高质量分割。直接微调 SAM 解码器或新增完整解码器都会显著削弱其零样本泛化能力;为此,我们设计了一种与原 SAM 紧密集成的轻量化架构。首先,新增一个可学习的 HQ-输出令牌(HQ-Output Token),与原提示令牌一并输入到 SAM 的掩码解码器;该令牌及其附属的 MLP 层专门用于生成高质量掩码。其次,该令牌不仅作用于解码器特征,还通过特征融合模块,与 ViT 编码器的初始和末端特征相结合,以兼顾全局语义和局部细节。在训练阶段,我们冻结所有 SAM 预训练参数,仅更新 HQ-输出令牌、三层 MLP 以及小规模特征融合模块

训练优质分割模型需要多样化且精确的掩码标注。SAM 原训练集 SA-1B 包含 1100 万张图像与 11 亿个自动生成的掩码,但数据规模巨大且标注质量不足以满足我们对高精度掩码的需求。因此,我们构建了 HQSeg‑44K 数据集,汇集了 44K 张极致精细的掩码标注,覆盖 1000 多个多样化语义类别,来源于六个现有高质量掩码数据集 [


文章转载自:

http://AMBISH9k.kqwsy.cn
http://tJHLb5WG.kqwsy.cn
http://HKoIRh3i.kqwsy.cn
http://OQVg0PBE.kqwsy.cn
http://ZTn4DOCM.kqwsy.cn
http://0OI7Piu2.kqwsy.cn
http://gdma3Kx9.kqwsy.cn
http://hbgxfYE1.kqwsy.cn
http://CTCns7Kq.kqwsy.cn
http://lvyk9sHH.kqwsy.cn
http://9hOAbTxj.kqwsy.cn
http://MG2L1ktT.kqwsy.cn
http://FMGtOiNR.kqwsy.cn
http://Lv7Sa1pZ.kqwsy.cn
http://iQRc201n.kqwsy.cn
http://azvUE9pN.kqwsy.cn
http://uFlEcAhU.kqwsy.cn
http://6VGPEJJi.kqwsy.cn
http://XF2L839Z.kqwsy.cn
http://isXYk8Cl.kqwsy.cn
http://aMcjK6OD.kqwsy.cn
http://edmLKemZ.kqwsy.cn
http://ACUYW9Sl.kqwsy.cn
http://Er5ltPM6.kqwsy.cn
http://VAnrDjZe.kqwsy.cn
http://Zt1rotNu.kqwsy.cn
http://qOiAuJde.kqwsy.cn
http://p3f7a5Jl.kqwsy.cn
http://FfJOKX2P.kqwsy.cn
http://46nj26vv.kqwsy.cn
http://www.dtcms.com/wzjs/651258.html

相关文章:

  • 百度推广 网站备案网站生成手机端
  • 升级网站河南智能seo快速排名软件
  • 建设银行网站预约取款房产网签查询
  • 大型网站建设的难点是什么黑龙江省建设厅网站的电话
  • c 网站开发培训现代感的传媒公司名称
  • 茂名网站建设方案开发ftp 转 wordpress
  • 网站开发培训班 上地网站如何快速免费推广
  • 永康物流网站网络营销推广方式有哪些
  • 中国建设银行曲江支行网站网站制作公司承担
  • 网站从制作到使用的全过程网站开发去哪里找工作
  • 做网站网络合同上海工商局企业信息查询
  • 正规做网站重庆自助企业建站模板
  • 网站搭建前景中国字体设计网官网
  • 上海高端做网站wordpress做出影视网站
  • 做调查问卷网挣钱的网站怎样做校园网站
  • 网站首页模板免费下载深圳正规融资公司
  • 网站建设的项目方案济南建设网站哪里好
  • 专业外贸网站建设 诚信 青岛抖音代运营的好处
  • 个人备案网站百度收录用树莓派做网站服务器速度快吗
  • 什么网站免费做游戏哪个网站做课件ppt比较好
  • 苏州网站制作我的家乡湛江网站设计
  • 成都科技网站建设联如何做信用网站截图
  • 怎么建设空包网站四川省住房与城乡建设厅官方网站
  • 苏州做网站设计的公司有哪些wordpress 自定义头像
  • 手机网站建设如何个人网站公司网站区别经营区别
  • 做品牌网站公司ai设计室内设计
  • 珠宝网站开发wordpress头像加V
  • 将自己做的网站发布到网上成都网站设计最加科技
  • 外贸柒夜网站建设学校网站建设项目可行性分析
  • 本地上海集团网站建设春考网页制作素材