当前位置: 首页 > news >正文

关于图片分类任务的猜想 | 撰写论文 paper

关于图片分类任务的猜想 | 撰写论文 paper

    • 背景
    • Yolo 是一次巨大的飞跃
    • 过滤无关的特征
    • Yolo 的问题

背景

在计算视觉领域,有几个关键的演变。
1)CNN 卷积的出现,这是一个大的创新
2)从卷积到 AlexNet ,是更大网络上的使用卷积,从此卷积带来的在平移旋转等情况下,依然可以准确的识别特征,被证明有明显的优势,但这不是很大的创新
3)从 AlexNet 到 ResNet,是进一步的扩大网络,因此更大参数的网络可以被训练,从而进一步的丰富了网络拟合特征的能力,但这不是很大的创新
4)从 ResNet 到 Yolo,是一次明显的创新,可以说,Yolo 的创新可以和 CNN 的贡献相媲美。

Yolo 是一次巨大的飞跃

Yolo 是识别物体的轮廓,在卷积的基础上使用框体去分析轮廓。而轮廓,并且往往是基于色块的轮廓,是物体的主要特征基于颜色识别轮廓,基于轮廓识别物体。
在这里插入图片描述

过滤无关的特征

在物体图片分类任务中,最主要的是识别轮廓,很多生产工作领域,其图片尤其适合用轮廓做区分。比如人物证件照,有一个背景,然后是人物的轮廓,在人物轮廓内包含了子轮廓,比如鼻子、眼睛等。

猜想:如果我们用一个算法,将图片处理为等高线类似的图片,再次进入 CNN 进行分类,那么效果会非常好。 原因是:无关的特征已经被过滤。

比如,在一个复杂的地形,我们想要找到最短的上到山顶的路线,那么就是看等高线地图,而不是看原始的地图,在原始的地图中,我们会被很多因素干扰。
在这里插入图片描述

Yolo 的问题

Yolo 的创新在于识别轮廓,而其依赖的训练数据需要标注轮廓。有没有一种算法能基于非标注的数据,首先的识别出轮廓?然后基于轮廓完成分类,能不能超越现在的最好的算法?

关键的问题,在于过滤无关的特征,让关注的特征凸显出来,这样即便数据量很少,也会有非常准确的效果。

这是一个猜想。

http://www.dtcms.com/a/113320.html

相关文章:

  • .net多贸易公司借入借出归还设备进销存管理系统软件租金计算库存管理
  • M芯片,能运行普通应用程序的原架构虚拟机
  • Java的Selenium元素定位-xpath
  • LeetCode热题100记录-【二叉树】
  • 【Deep Reinforcement Learning Hands-On Third Edition】【第1章:什么是强化学习】
  • 《海空重力测量理论方法及应用》之一重力仪系统组成及工作原理(下)
  • qt designer 软件主题程序设计
  • Python精进系列:从 __name__ 开始了解 python 常见内置变量
  • synchronized 锁升级机制详解
  • ROS2 多机时间同步(Chrony配置简明指南)
  • docker本地部署anythingllm
  • C++重载运算符的本质
  • 将 DataFrame 中某一列的列表拆分成多个独立的列的方式
  • Linux上位机开发实践(做一专多能的方案提供者)
  • 从情感分析到朴素贝叶斯法:基于朴素贝叶斯的情感分析如何让DeepSeek赋能你的工作?
  • 【Kubernetes】RBAC(基于角色的访问控制)如何设置?如何管理 Kubernetes 的权限?
  • MCP 极简入门 - 三分钟 Cline + Smithery 运行 time 服务
  • HTTP/2:新一代网络协议的变革与优势
  • 借 DCMM 东风,提升数据管理价值生产力
  • BugKu Simple_SSTI_2
  • 【UE5 C++课程系列笔记】31——创建Json并保存为文件
  • 横扫SQL面试——TopN问题
  • 团体设计程序天梯赛L2-025 # 分而治之
  • Maven使用
  • 3535 数组分割
  • Python 数据库选型指南(架构师视角)
  • BUUCTF-web刷题篇(12)
  • 智能体和RPA都需要程序思维,如何使用影刀的变量?
  • HarmonyOS-ArkUI Ability进阶系列-UIAbility与各类Context
  • Python解决“数字插入”问题