当前位置: 首页 > news >正文

《计算机视觉度量:从特征描述到深度学习》-- 大模型特征提取到特征检索

        本周是2025年8月的最后一个周,进入2024年以后,大模型技术的发展可以用一日千里来形容。各种大模型的出现,文字,视频,图片,语音等等。衍生出针对不同行业和不同场景的大模型方案。同样,博主也逐渐开始针对工业检测领域,开发行业大模型。距离上次的博客和模型更新已经过去了快半年,主要原因是博主工作生活太忙。最近利用下班时间,做一些更新。预告博主会在近期,发布针对工业检测7B的大模型软件,之前1.5B的模型继续保留,建议大家更新后切换成更大的模型方案,效果提升明显。

        本次更新主要对最近大模型的开发,做一些总结。

第一点:大模型的知识储备>单个人工的知识储备

第二点:大模型对数据的特征提取能力>人类已知的数据特征提取方法

第三点:目前人工对所有模型的使用,还停留的数据检索阶段

        以上三点的支撑,主要基于个人开发过程中遇到的问题,并解决问题,做出的一些总结。有一定的引导意义,但是不一定绝对。从2017年深度学习方法被大家知晓以后,模型经历了,卷积网络,深度卷积网络,大模型。三个不同的阶段,技术一致在朝更大更深的网络结构发展。是为了让模型有更加深的数据理解能力,从而提取更加精准的数据特征。

        同样在技术发展过程中,应用也在不断的跟进。工业行业比较多的是分类,分割,和目标检测。这些方法都有一个共性方法,就是微调。

 微调:微调的本质是,基于大数据训练和总结的预训练模型,修改部分权重参数的,完成对单一行业的模型定制。在很多实践的验证下,不用修改预训练模型的权重,在预训练模型后端加入一个回归的小模型,效果提升更明显。这也体现出模型的结果输出,实际上是一种特征检索,把图片数据转化为特征数据,并针对不同特征,输出不同的结果。同样反之,如果不同的数据,拥有同样的特征,那输出的结果也会一样。

        从这个特征检索角度理解大模型原理,就会简单很多。大模型针对的是更大的数据训练和更强的特征提取能力。但是针对个人和深入行业的使用,不可能进行微调。但是可以做到特征检索。

特征检索:特征检索的使用和开发,目前已经普遍,也是大模型使用过程很重要的应用方法。例如我们日常中和GPT的聊天。包括各种关键词引导,还有Anget,RAG等技术。都是通过模型对数据特征的二次检索整合才完成准确的输出。同样在大模型开发过程中,特征检索会替代微调方案,进入到生产和生活中。采用特征检索会更加灵活,时效性会更高,同样也更容易让人理解。想了解具体的内容,可以在DY或者SPH上搜索‘军哥讲视觉’,查看工业大模型的演示效果。

        最后期待工业大模型新版本的发布,也欢迎大家反馈问题

http://www.dtcms.com/a/350988.html

相关文章:

  • 身份管理与安全 (Protect identities)
  • 一文丝滑使用Markdown:从写作、绘图到转换为Word与PPT
  • HIDL的Car Audio架构简单梳理
  • Spark 节点 IDO 正式开启 —引领 PayFi 新时代
  • 解析蛋白质三维结构-Bio3D R包
  • Elasticsearch精准匹配与全文检索对比
  • 矩阵微积分的链式法则(chain rule)
  • 一步一步在Kubernetes集群部署NVIDIA KAI Scheduler
  • 数据挖掘 7.1~7.4 Clustering聚类
  • Spark云原生流处理实战与风控应用
  • 【贪心】11 盛最多水的容器(双指针解法)
  • 解决Windows更新后WPF程序报TypeLoadException异常的问题
  • 论文Review 激光3DGS GS-SDF | IROS2025 港大-MARS!| 激光+3DGS+NeRF会得到更好的几何一致性和渲染结果!?
  • OceanStor Pacific 9926全闪分布式存储,海量数据大容量场景的救星来咯[特殊字符]!
  • 列表里的对象,按对象的某个属性值排序
  • 如何利用ArcGIS探究环境与生态因子对水体、土壤、大气污染物等影响实践技术
  • 深入了解linux系统—— 线程互斥
  • 软件开发|Shiro框架以及集成Spring Boot
  • AI算力提升7.5倍!英伟达发布新一代机器人超级计算机Jetson Thor,驱动物理AI革命
  • SMOTE过采样实现过程详解
  • 论文阅读 2025-8-26 一些半监督学习的工作
  • JVM-(11)JVM-定位OOM问题
  • 论文学习日志——忆阻器与神经网络——part1
  • Python大型数组计算完全指南:从基础到分布式系统实践
  • Zookeeper(分布式RPC调用和分布式文件储存)
  • [小练习]100行不到使用Java Socket网络编程实现定向聊天
  • 从双重检查锁定的设计意图、锁的作用、第一次检查提升性能的原理三个角度,详细拆解单例模式的逻辑
  • 基于SpringBoot的网上点餐系统
  • OpenTenBase核心技术解密:突破OLTP与OLAP边界的分布式数据库革新
  • Flask模块如何使用