《计算机视觉度量:从特征描述到深度学习》-- 大模型特征提取到特征检索
本周是2025年8月的最后一个周,进入2024年以后,大模型技术的发展可以用一日千里来形容。各种大模型的出现,文字,视频,图片,语音等等。衍生出针对不同行业和不同场景的大模型方案。同样,博主也逐渐开始针对工业检测领域,开发行业大模型。距离上次的博客和模型更新已经过去了快半年,主要原因是博主工作生活太忙。最近利用下班时间,做一些更新。预告博主会在近期,发布针对工业检测7B的大模型软件,之前1.5B的模型继续保留,建议大家更新后切换成更大的模型方案,效果提升明显。
本次更新主要对最近大模型的开发,做一些总结。
第一点:大模型的知识储备>单个人工的知识储备
第二点:大模型对数据的特征提取能力>人类已知的数据特征提取方法
第三点:目前人工对所有模型的使用,还停留的数据检索阶段
以上三点的支撑,主要基于个人开发过程中遇到的问题,并解决问题,做出的一些总结。有一定的引导意义,但是不一定绝对。从2017年深度学习方法被大家知晓以后,模型经历了,卷积网络,深度卷积网络,大模型。三个不同的阶段,技术一致在朝更大更深的网络结构发展。是为了让模型有更加深的数据理解能力,从而提取更加精准的数据特征。
同样在技术发展过程中,应用也在不断的跟进。工业行业比较多的是分类,分割,和目标检测。这些方法都有一个共性方法,就是微调。
微调:微调的本质是,基于大数据训练和总结的预训练模型,修改部分权重参数的,完成对单一行业的模型定制。在很多实践的验证下,不用修改预训练模型的权重,在预训练模型后端加入一个回归的小模型,效果提升更明显。这也体现出模型的结果输出,实际上是一种特征检索,把图片数据转化为特征数据,并针对不同特征,输出不同的结果。同样反之,如果不同的数据,拥有同样的特征,那输出的结果也会一样。
从这个特征检索角度理解大模型原理,就会简单很多。大模型针对的是更大的数据训练和更强的特征提取能力。但是针对个人和深入行业的使用,不可能进行微调。但是可以做到特征检索。
特征检索:特征检索的使用和开发,目前已经普遍,也是大模型使用过程很重要的应用方法。例如我们日常中和GPT的聊天。包括各种关键词引导,还有Anget,RAG等技术。都是通过模型对数据特征的二次检索整合才完成准确的输出。同样在大模型开发过程中,特征检索会替代微调方案,进入到生产和生活中。采用特征检索会更加灵活,时效性会更高,同样也更容易让人理解。想了解具体的内容,可以在DY或者SPH上搜索‘军哥讲视觉’,查看工业大模型的演示效果。
最后期待工业大模型新版本的发布,也欢迎大家反馈问题