当前位置: 首页 > news >正文

大语言模型(LLM)应用开篇 | RAG方法论概述 | 构建知识库探索

大型语言模型应用开篇 | RAG技术 | 构建知识库探索

  • 1、大语言模型(LLM)应用开篇
  • 2、RAG技术
    • 2.1 基于RAG实现知识库问答系统的基本步骤
    • 2.2 RAG与其他技术的关系与区别

1、大语言模型(LLM)应用开篇

  现在是2025年,DeepSeek凭借卓越的技术实力脱颖而出,Agent(智能体)工作流和专业垂直领域大模型的微调成为了最热门的研究方向之一。

  大语言模型的幻觉(hallucination):指通用大语言模型(LLM)在生成内容时,产生看似合理但实际上不准确或不符合事实的信息。这种现象是当前LLM面临的重要挑战之一。

  幻觉产生的原因

  • 大模型的生成机制,大语言模型基于大量数据训练,并通过预测下一个词的概率来生成文本,因此可能会产生语法通顺但事实不准确的内容。
  • 训练数据的质量问题:如果训练数据中包含错误或过时的信息,模型可能会学习并传播这些错误,导致幻觉现象的出现。

  缓解 LLM 幻觉的方法,也是大模型的应用方式:

  • 检索增强生成(RAG):通过从专业知识库中检索相关信息,结合用户提问,让大模型基于准确的数据生成符合事实的内容,从而减少幻觉现象。
  • 微调(Finetune):利用专业知识库对大模型进行重新训练,优化其在特定领域的理解和生成能力,使其能够更准确地回答专业问题。

  几个专业名词

  • Eval:大模型评估(Evaluation),指对大模型性能、能力或效果的系统性测试与分析,是目前业界的一大难点。

  • Agent:智能体,垂直大模型的应用程序,能够解决某一方面的专业问题。

2、RAG技术

  RAG(Retrieval-Augmented Generation)(检索,增强,生成):从外部知识库中检索相关信息,作为用户提问的上下文信息,一起输入到LLM中,使LLM生成符合事实内容的方法技术。可以类比为:开卷考试。
  其中:

  • 检索:查询数据库
  • 增强:扩充提示词
  • 生成:结合LLM生成文本内容

2.1 基于RAG实现知识库问答系统的基本步骤

  1. 创建知识库:
    • 收集数据:收集PDF、MD等不同格式的数据
    • 数据清洗:去除噪声、重复项和无关信息
    • 文本分割:将文本分割成较小的片段chunks
    • 文本向量化:使用文本嵌入(Embedding)模型。将文本片段转成向量形式
    • 构建向量数据库
  2. 设计检索模块:
    • 问题向量化:使用文本嵌入模型,将用户的提问转成向量形式
    • 相似度检索:计算问题向量和文本片段向量的向量相似度(使用余弦相似度),找到相应的文本片段向量
    • 上下文结合:将相应的文本片段向量和问题向量结合成为提示词(prompt
  3. 生成内容:将提示词输入LLM中,生成相应的文本内容

2.2 RAG与其他技术的关系与区别

  RAG 与 LangChain 的关系与区别:
  使用 LangChain 技术可以构建以大语言模型为核心的工作流,可以使用 LangChain 技术实现 RAG 系统 。区别: RAG 是一个方法论,LangChain 是一个框架,LangChain 可以实现 RAG 系统,也可以实现其他围绕 LLM 的工作流系统。

   RAG 与 LlamaIndex 的关系与区别:
  LlamaIndex 可以将用户提供的文档转化为结构化索引,支持快速语义搜索,为 RAG 提供高质量的外部知识输入。

相关文章:

  • 【环路补偿】环路补偿的九种类型-mathcad计算书免费下载
  • 怎么对asp.web api进行单元测试?
  • LLM模型微调方法
  • 高压NPN
  • 【大模型基础_毛玉仁】5.2 模型编辑经典方法
  • 记一次系统单点登录、模拟web系统登录方式的开发过程,使用AES加密
  • JavaScript中的Web Workers
  • Eplan许可管理与其他PLM工具的集成
  • Activity 避免销毁重建的方案
  • 跨境电商封号的根源分析:AI反检测技术的应对策略
  • 大模型(LLMs)微调面
  • TF-IDF——自然语言处理——红楼梦案例
  • nginx配置页面缓存,前端每次打包生成新的js文件
  • docker安装mongoDB
  • 卷积神经网络的传播及参数用法
  • 【React】基于 React+Tailwind 的 EmojiPicker 选择器组件
  • 第R9周:阿尔兹海默症诊断(优化特征选择版)
  • 小林coding-10道Java集合面试题
  • 基础认证-单选题(三)
  • 湖南(源点咨询)市场调研 商业综合体定位调研分享(上篇)
  • 美国考虑让移民上真人秀竞逐公民权,制片人称非现实版《饥饿游戏》
  • 价格周报|本周猪价继续下探,机构预计今年猪价中枢有支撑
  • 技术派|威胁F-35、击落“死神”,胡塞武装防空战力如何?
  • 外交部部长助理兼礼宾司司长洪磊接受美国新任驻华大使递交国书副本
  • 昔日千亿房企祥生集团约2.03亿元债权被拍卖,起拍价8000万元
  • 媒体:中国女排前队长朱婷妹妹被保送浙大受质疑,多方回应