当前位置: 首页 > news >正文

硕士毕设-语义分割-4-通过grounding-sam生成效果很好的pesudo

零: 项目说明

是这样的一个事情,经过与deepseek的一番讨论和交流,DeepSeek为我设计了一个30天高强度学习计划,重点聚焦弱监督/无监督语义分割在野外场景的应用,结合理论与实践,并最终导向可落地的开源项目。

主要想法是做基于大模型的弱监督语义分割,主要步骤如下:

  • 自动生成标注:大模型生成图像级标签边框涂鸦点标注等几种弱监督标注类型的标注:
  • 生成伪标签:采用基于类激活图(CAM, Class Activation Mapping)的方法 + CRF后处理,利用分类网络生成伪标签pseudo
  • 训练分割模型:将伪标签作为监督信号,训练U-NetDeepLabv3+等分割网络。

代码在这里:不断改进中:
https://github.com/Tipriest/30Days-for-segmentation


一: 使用grounding-dino model标注地形所在的范围框

1.1 单个正向词汇的标注效果

  1. 原始图片:
    image.png

  2. 给定关键词lawn

  3. grounding-dino模型的标注框
    image.png

  4. sam模型的分割效果
    image.png

1.2单个正向词汇+单个反向词汇的标注效果

  1. 原始图片:
    image.png

  2. 给定关键词yellow brick road without curb

  3. grounding-dino模型的标注框
    image.png

  4. sam模型的分割效果
    image.png

1.3 对于相对复杂的地形图片的标注效果

下面的这张图片中,有两个不连通的黄色砖路:
image.png
prompt给的是yellow brick road without curb,使用grounding dino的标注效果如下图所示
可以看到,这里只标注了一个黄色砖路:
image.png

使用SAM识别的效果如下所示
image.png

如果提示词给的是curb的话,对于这种复杂一些的图片,效果如下所示:
这是原图像:
image.png

这个是标注之后的图像
image.png

这个是sam的结果
image.png

http://www.dtcms.com/a/101398.html

相关文章:

  • 【图论】最短路径问题总结
  • 伴伴租赁系统-物品售卖-二手回收-物品租赁-支持微信/支付宝小程序/app/h5
  • 通过Spring Boot集成WebSocket进行消息通信
  • Java开发者指南:深入理解HotStuff新型共识算法
  • 图文档的安全管理软件有哪些?
  • pyproj 库中 Geod 类讲解
  • RK3568使用gpio子系统完成led驱动程序编写
  • f103.delay,teitou
  • docker-compose部署prometheus+grafana+node_exporter+alertmanager规则+邮件告警
  • DevOps部署平台
  • 【数论2】
  • 【ArcGIS操作】ArcGIS 进行空间聚类分析
  • 全星研发管理APQP软件系统:驱动汽车产品研发全周期,打造高效合规的质量管理引擎
  • TDengine 中的关联查询
  • Java康威生命游戏(Conway‘s Game of Life)
  • opencv图像处理之指纹识别
  • Java并发编程笔记
  • unity3d端监听 uri scheme
  • 解决Docker端口映射后外网无法访问的问题
  • Leetcode-100 回溯法-单词搜索
  • c#中的virtual方法
  • redis错误分析 forceUnlock的问题说明
  • #基于Django实现机器学习医学指标概率预测网站
  • 双塔模型2之如何选择正确的正负样本
  • Matlab基础知识与常见操作【无痛入门】
  • GPT Workspace体验
  • # 基于 OpenCV 的选择题自动批改系统实现
  • 预测地震的方法,如何使用AI和量子传感器发挥作用?
  • 基于PySide6与CATIA API的装配体位置管理工具开发实践
  • 使用Python爬虫获取淘宝App商品详情