当前位置: 首页 > news >正文

Github跑通GenSAM历程-GenSAM介绍与问题记录

GenSAM介绍

GenSAM(Generalizable SAM)是一种比较新的图像分割模型,旨在通过通用任务描述自动生成和优化视觉提示,消除对特定样本的依赖。模型引入了一种名为“跨模态思维链提示”(CCTP)的机制,能够根据给定的通用文本提示推理出适合特定图像的前景和背景热图。

由于GenSAM采用了TTA(测试时自适应)的机制,结合渐进式掩码生成(PMG)方法,可以逐步调整输入图像的权重,从而引导模型在粗到细的方式中对目标进行聚焦,重要的是,GenSAM在推理过程中不会更新网络参数,因此避免了额外的训练需求 。

问题记录

由于GenSAM是很新的项目,对于它的相关教程和博客还很少,也是我改bug配环境比较头疼的一个项目,不过好在最后还是成功复现了,下面是对一些典型问题的解决方案:

问题:GenSAM项目地址

解决:挂梯子,找到Github的jyLin8100/GenSAM:AAAl 2024 论文代码:放宽 SAM 中特定于图像的提示要求:用于分割伪装对象的单个通用提示

问题:无法访问CHAMELEON数据集,CHAMELEON数据集由于不知名原因从官网Strony nie znaleziono - Katedra Grafiki, Wizji Komputerowej i Systemów Cyfrowych上撤下

解决:在该Github项目的issue中给出了下载链接TestDataset.zip - Google 云端硬盘

问题:ValueError: 'llava' is already used by a Transformers config, pick another name.

解决:参考LLaVA的Github,看到issue部分"ValueError: 'llava' is already used by a Transformers config, pick another name. · Issue #968 · haotian-liu/LLaVA",我自己成功解决的方式修改了transformer的版本,具体而言,pip install transformers==4.34.0可以解决

问题:需要vit-b-16.pt的预训练模型

解决:参考ResNet系列和ViT系列预训练模型权重文件下载-CSDN博客

问题:torch.cuda.OutOfMemoryError: CUDA out of memory. 

解决:参考YOLOv11小白的进击之路(七)训练输出日志解读以及训练OOM报错解决办法_yolov11训练日志-CSDN博客

问题:AttributeError: 'DotDict' object has no attribute 'adaptive_recursive'

解决:在yaml最后一行加上adaptive_recursive=true

问题:UnidentifiedImageError(msg) PIL.UnidentifiedImageError: cannot identify image file '../autodl-tmp/data/Dataset/Dataset/dataset/img/.DS_Store

解决:在数据集目录执行 find . -name ".DS_Store" -type f -delete

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dtcms.com/a/116128.html

相关文章:

  • go程序启动工具——cobra
  • 【力扣hot100题】(063)搜索二维矩阵
  • 项目开发流程总结
  • MySQL完整版基础
  • RabbitMQ概述和安装
  • leetcode每日一题:最大整除子集
  • 87.在线程中优雅处理TryCatch返回 C#例子 WPF例子
  • ResNet改进(19):基于PyTorch的ResNet改进方案详解:Mish激活+SPP模块+MixUp数据增强
  • Perl 条件语句
  • spring-cloud-alibaba使用说明
  • LabVIEW 在故障诊断中的算法
  • 堆结构——面试算法题高频汇总
  • Nginx “Access-Control-Allow-Origin” 安全配置
  • 数据库的操作
  • VScode 画时序图(FPGA)
  • 开源RuoYi AI助手平台的未来趋势
  • 软件学报 区块链论文 截止2025年4月 录用汇总 附pdf下载
  • 【力扣hot100题】(061)N皇后
  • 修改maya小部件操作器(manipulator,那个带有箭头和圆环的小部件坐标轴)
  • R语言——绘制生命曲线图(细胞因子IL5)
  • 【力扣hot100题】(060)分割回文串
  • PyTorch 深度学习 || 7. Unet | Ch7.1 Unet 框架
  • 【学习笔记17】Windows环境下安装RabbitMQ
  • 云服务器数据安全实践:基于 Rsync + 宝塔计划任务构建全站自动备份系统
  • Nginx 常见面试题
  • MySQL——DQL的单表查询
  • Kafka 的选举机制
  • Python高级爬虫之JS逆向+安卓逆向1.1节-搭建Python开发环境
  • Leetcode 311 Sparse Matrix Multiplication 稀疏矩阵相乘
  • [特殊字符] LeetCode 1123. 最深叶节点的最近公共祖先 | DFS后序遍历题解