当前位置: 首页 > news >正文

YOLO12改进-模块-引入边缘 - 可学习局部显著核模块LLSKM 引导网络捕捉小目标的点、边缘等显著特征,提升检测敏感性与多尺度适应性。

         红外小目标检测(ISTD)面临目标尺寸小对比度低尺度变化大等挑战,传统模型驱动方法(如基于人类视觉系统的局部显著核)能有效提取 “中心减邻域” 特征(如高斯状强度模式、边缘),但参数固定缺乏适应性;数据驱动的 CNN 虽能自动学习特征,但对小目标敏感性不足且模型复杂。LLSKM(Learnable Local Saliency Kernel Module)旨在融合两者优势,将传统显著核的 “中心减邻域” 原理嵌入神经网络,通过可学习参数和注意力机制提升检测性能。

上面是原模型,下面是改进模型

1. 可学习局部显著核模块LLSKM 介绍 

        “中心减邻域” 原理:模拟人类视觉系统对显著目标的感知机制,通过中心像素与邻域像素的差异(如拉普拉斯高斯核 LoG)突出目标的点或边缘特征,核心公式为中心权重与邻域权重的差值运算。

        可学习参数与注意力机制:将传统固定参数(如抑制因子 θ)替换为可学习参数,通过全局通道注意力模块动态调整不同通道的特征响应,使核函数自适应输入数据的显著特征(如自动区分边缘或点状目标)。

      

LLSKM(Learnable Local Saliency Kernel Module)有 Recip 和 Diff 两种结构 :

Recip 结构(图 a)

         输入与卷积处理:输入特征图X尺寸为C×H×W(C为通道数,H为高度,W为宽度 )。通过两个并行路径处理,Wsum​是加权卷积(Weighted CNN),对输入特征图进行加权求和操作;W是邻域卷积(Neighbor CNN),负责提取邻域特征 。

         通道注意力机制:输入特征图X经通道注意力(Channel Attention)模块处理,得到权重系数θa​ 。通道注意力模块包含平均池化(AP)、卷积(Conv)、批量归一化(BN)、ReLU 激活函数、又一组卷积和 BN 操作,最后经 Sigmoid 激活得到权重系数,范围在[0,1] 。

         输出计算:Wsum​的输出减去W的输出,并与θa​进行逐元素相乘,最后得到输出Y 。

Diff 结构(图 b)

         输入与卷积处理:同样输入特征图X尺寸为C×H×W 。Wsum​加权卷积和W普通卷积(Vanilla CNN)并行处理输入,此外增加了Wc​中心卷积(Central CNN)处理输入 。

         通道注意力机制:输入特征图X经通道注意力模块得到权重系数θc​ ,通道注意力模块结构与 Recip 类似 。

         输出计算:Wsum​的输出减去W的输出,再加上θc​与Wc​输出的逐元素乘积,得到输出Y 。这种结构引入中心增强项,改善了 Recip 结构中中心特征丢失的问题 。

2. YOLOv12与LLSKM的结合          

          LLSKM 与 YOLOv8 结合,能借助 LLSKM 增强对红外小目标等的显著特征捕捉,提升 YOLOv8 在小目标检测场景中的敏感性与准确性;

3. LLSKM代码部分

https://github.com/tgf123/YOLOv8_improve/blob/master/YOLOV12.md

 4. 将LLSKM引入到YOLOv12中

第一: 先新建一个change_model,将下面的核心代码复制到下面这个路径当中,如下图如所示。YOLOv12\ultralytics\change_model。

            ​​​​​​ ​​​​​​​​​​​​​​    

第二:在task.py中导入

 ​​​      ​​​​​​​ ​​​​​​​​​​​​​​       

第三:在task.py中的模型配置部分下面代码

        ​​​​​​​​​​​​​​ ​​​​​​​​​​​​​​   

第四:将模型配置文件复制到YOLOV12.YAMY文件中

 ​​​​​​​​​​​​​​  

     ​​​​​​​ ​​​​​​​​​​​​​​ ​​​​​​​ ​​​​​​​​​​​​​第五:运行代码


from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorldif __name__=="__main__":# 使用自己的YOLOv12.yamy文件搭建模型并加载预训练权重训练模型model = YOLO(r"E:\Part_time_job_orders\YOLO_NEW\YOLOv12_all\ultralytics\cfg\models\12\yolo12_LLSKM.yaml")# .load(r'E:\Part_time_job_orders\YOLO_NEW\YOLOv12\yolo12n.pt')  # build from YAML and transfer weightsresults = model.train(data=r'E:\Part_time_job_orders\YOLO\YOLOv12\ultralytics\cfg\datasets\VOC_my.yaml',epochs=300,imgsz=640,batch=64,# cache = False,# single_cls = False,  # 是否是单类别检测# workers = 0,# resume=r'D:/model/yolov8/runs/detect/train/weights/last.pt',amp = True)

相关文章:

  • 为网页LOGO视频增加电影质感表现
  • 论文阅读的三个步骤
  • 【语法】C++的继承
  • 篮球足球体育球员综合资讯网站模板
  • hutools工具类中isNotEmpty与isNotBlank区分
  • 关闭正点原子atk-qtapp-start.service
  • 企业办公协同平台安全一体化生态入住技术架构与接口标准分析报告
  • Day16(贪心算法)——LeetCode45.跳跃游戏II763.划分字母区间
  • 机器学习实操 第一部分 机器学习基础 第6章 决策树
  • 高定电视,一场关于生活方式的觉醒
  • 基于 ARM 的自动跟拍云台设计
  • 第六章 QT基础:7、Qt中多线程的使用
  • Vue常用的修饰符有哪些有什么应用场景(含deep seek讲解)
  • 嵌入式设备异常掉电怎么办?
  • 第三方软件测试报告如何凭借独立公正与专业权威发挥关键作用?
  • CA校验主辅小区配置及UE能力
  • 通过 Node.js 搭配 Nodemailer 实现邮箱验证码发送
  • 分治而不割裂—分治协同式敏捷工作模式
  • Plant Simulation MultiPortalCrane Store 小案例
  • 【网络编程】socket编程和TCP协议
  • 解放日报社论:只争朝夕、不负重托,加快建成具有全球影响力的科技创新高地
  • 80后共青团云南省委副书记许思思已任迪庆州委副书记
  • 在循环往复的拍摄中,重新发现世界
  • 深圳一季度GDP为8950.49亿元,同比增长5.2%
  • 暴涨96%!一季度“中国游中国购”持续升温,还有更多利好
  • 商务部:将积极会同相关部门加快推进离境退税政策落实落地