当前位置：首页 > news >正文

AI的外挂知识库，RAG检索增强生成技术

news 2025/7/16 5:39:10

什么是RAG，它有什么用，RAG的全称是Retrieval-Augmented Generation的缩写，翻译成中文是检索增强生成，目的是为了补充大模型所缺少的数据与信息而开发的技术，它可以解决AI在处理问题时，自身缺少相关数据与信息的问题

那么为什么要有RAG技术，因为AI所有的知识与认知，都来源于学习训练时的数据，一旦学习训练完成，那么AI的知识与认知就将止步于训练所提供的数据，当前任何一个AI都还没有自我学习与进化的能力，无法在发布后自行的更新知识与认知，所以一旦训练停止，AI的认知也就不会再发生变化，除非我们再次对AI进行更多的训练。一旦我们的问题涉及到训练数据以外的数据时，它就无法进行回答，因为它自身缺少相应的数据与信息

这里插一句，最近看到一些人反馈，deepseek的回答没有发布时那么好了，觉得deepseek是被这段时间的中文互联网信息给污染了，这很明显是对当前的大模型不了解得出的结论，因为当前所有的大模型都还不具备自我学习进化的能力，所以它也不可能被污染，回答没有那么好的原因可能是对程序进行了调整导致的

我们又如何使用RAG技术呢，通过建立知识库的方式我们可以为AI提供一个外挂的信息源，将相关的文件上传到知识库，再对知识库内的文件进行向量化，向量化后的知识库，就可以成为AI的知识库，一旦AI要解决问题它就可以到这个知识库来查找信息，再将找到的信息拿去理解与分析，这样就补足了AI在处理问题时，自身缺乏相关数据与信息的问题

比如我有写技术文档的习惯，但这些文档只在我的电脑内，这时我如果要对这些文档进行一个总结，用常规的方式将会耗费大量的时间与精力，要快速得到结果，通过RAG技术我只需要将这些文档上传到知识库，再将这些文档向量化后提供给AI，那么AI就可以很快根据我的要求对我的文档进行总结，这就是技术带来的生产效率的提升

RAG看起来不错，补齐了AI自身缺失相关的信息问题，那么它本身有什么问题吗，当然有，RAG的问题和当前大模型的问题一致，就是可以理解的信息类型太过单一，基本只能理解文本信息，无法对生活工作中常见的表格、图片、图表、声音、视频等信息进行有效理解，一旦知识库里有这些信息，在处理问题时它往往会忽略掉这些信息，导致获取的信息不完整不准确，从而得出错误结论，RAG对多类型信息的理解需要等待相应的算法的完善，才能实现更好的效果，而且RAG还存在召回数据量过少的问题，这导致了其无法对大量数据有全面整体的认知，这是一个比较严重的问题有待解决