当前位置: 首页 > news >正文

个体商户建自己的网站做销售小广告怎么能弄干净

个体商户建自己的网站做销售,小广告怎么能弄干净,东莞网站推广排行,网站上传附件目录格式大语言模型的局限性与RAG基本框架和工作流实例 Restrictions of LLMs and Use Cases of RAG Fundamental Framework & Workflow By JacksonML 1. 大语言模型的局限性 大语言模型(Large Language Model, LLMs) 在获取准确的判断和最新的知识方面存…

大语言模型的局限性与RAG基本框架和工作流实例

Restrictions of LLMs and Use Cases of RAG Fundamental Framework & Workflow

By Jackson@ML

1. 大语言模型的局限性

大语言模型(Large Language Model, LLMs) 在获取准确的判断和最新的知识方面存在一定的局限性。如果仅依赖大语言模型,那么得出的结果,可能不尽如人意,甚至可能有错误比较离奇的现象。

1) 幻觉

幻觉(Hallucination) 的产生形成了貌似正确但实际存在错误的输出结果。幻觉的问题,出自大语言模型过分自信地生成了不正确的响应。

举个例子,来让大语言模型做个判断即可。

示例,肉夹馍是陕西省的民间美食,用腊汁肉夹到白吉馍中间,人吃人爱。但LLM(使用DeepSeek R1)仍然生成了一个虚构的、具有很强误导性的补全。

提示词:
What is Rou Jia Mo? Does it taste well? (肉夹馍是什么?它的味道如何?)

答案(节选,出现幻觉):

在这里插入图片描述
很显然,“肉夹馍”介绍不充分,同时,配料表的原料(比如酱油(浅色与深色的),绍兴酒)都不是陕西肉夹馍所必须的,且腊汁肉制作配料多达二十多种,也未列出。

尤其是对“馍”的介绍,过于简单,无法体现肉夹馍的香醇可口、外酥内柔的美味。

2) 知识截断

Knowledge Cutoff(知识截断),是指大语言模型反悔的答案与最新最真实的数据不符。由于基础模型(Foundation Model, FM) 在预训练时都有一个知识截断的日期,因此,模型的知识仅限于模型预训练或微调时的数据。

同样做两个试验对比一下。

示例一,利用DeepSeek R1来提问前几天发生的欧国联足球锦标赛决赛:

提示词:
“谁赢得了2025年欧国联足球锦标赛冠军?冠亚军争夺战比分是多少?”

回答:

在这里插入图片描述
此项赛事发生在3天前(比赛时间是北京时间2025年6月9日凌晨2:45),而笔者撰稿时,现在时间则是北京时间2025年6月11日23:00。

DeepSeek在这两天多时间内,已经输入和学习了很多关于本届欧国联足球锦标赛的数据,因此提供信息较为准确。

示例二,对于第三届全国翻译技术大赛第六场培训的问答

提示词:
“2025年6月11日,第三届全国翻译技术大赛举行培训,请问培训主题是什么?由谁主讲?”

回答:
“服务器繁忙,请稍后再试。“

反复利用提示词问了几遍,回答都是一样的答案。看来,DeepSeek未能获取任何相关知识,只能给出默认答案 “服务器繁忙,请稍后再试”

可以看到,示例二发生在笔者写本文的一小时前,因此,大语言模型不可能这么快地得到训练,从而具备知识。这时候,就出现了 “知识截断”

2. RAG

1)基本概念

Retrieval Augmented Generation(增强检索生成,RAG) 本身并不是一门纯粹的技术。
但是,RAG可以将基于大语言模型的应用程序链接到外部数据源和应用程序,一方面克服知识的局限性,另一方面,也会对大语言模型的输出进行矫正和完善。

如果希望大语言模型能访问它在预训练和微调过程中 “学到” 的“记忆“之外的数据,就可以使用RAG来满足。

由于这些数据并没有包含在原始训练数据中,比如:公司内部的私有数据。通过允许模型访问额外信息(或特定信息),而无须持续进行全部数据的微调。

2) RAG基本框架

RAG为大语言模型提供了外部知识源(或知识库)的访问能力,可将这些知识以上下文形式,嵌入原始提示词中以增强提示,并将这些信息一并发送给大语言模型。

RAG知识增强基本框架如下图所示。
在这里插入图片描述

除了该框架外,RAG运行时参考流程如下图。

在这里插入图片描述

3)RAG工作流程

关键查询参考流程如下图:
在这里插入图片描述

4) 提示工程要求

在RAG优化的工作流中,提示工程(Prompt Engineering)有以下关键组件:

  • 1) 系统说明(仅使用上下文回答)
  • 2) 上下文分隔符标记
  • 3) 显式问题格式
  • 4) 访幻觉保护措施

在RAG实现检索增强后,如果想要实现基于上下文推理的应用程序,还需要进一步探索的丰富组件,并且,按照项目开发和测试流程,才能最终完成该应用程序。


AI技术好文陆续推出,敬请关注、收藏和点赞👍。
您的认可,我的动力! 😃

http://www.dtcms.com/a/410279.html

相关文章:

  • 设计模式(C++)详解——迭代器模式(2)
  • perl踩坑系列=====正则表达式捕获
  • MQ-2烟雾传感器详解——从工作原理到实际应用
  • Ubuntu启动终端时默认窗口最大化
  • 整站seo排名郑州经济技术开发区政务服务中心
  • 求一些做里番的网站php网站建设实训引言
  • 嵌入用户idea到大模型并针对Verilog语言生成任务的微调实验报告
  • 【AI算力系统设计分析】1000PetaOps 算力云计算系统设计方案(大模型训练推理专项版)
  • JAVA露营基地预约户外露营预约下单系统小程序
  • ✨WPF编程基础【1.2】:XAML中的属性
  • 【MySQL】性能优化与核心机制深度解析
  • 珠海 网站建设和推广网站建设服务方案ppt模板下载
  • JUC:AQS源码分析(三)
  • 极简文件列表
  • CSS Grid 网格布局完整指南:从容器到项目,实战详解
  • 百度手机模板网站阿里云WordPress主题
  • 批量获取oracle的AWR报告方法
  • docker jenkins gitlab 流水线构建
  • MySQL 配置调优参数:从基础到生产级优化指南
  • 旅游网站设计模板cdr里做网站超级链接
  • TypeScript + React + Ant Design 前端架构入门:搭建一个 Flask 个人博客前端
  • 小九源码-springboot051-智能推荐旅游平台
  • 网站建设面试问题网站建设 学习 长沙
  • 【云原生】openebs-device+cstor存储方案部署
  • 破译古籍密码,HisDoc-DETR论文解读
  • Kafka 面试题及详细答案100道(66-80)-- 运维与部署
  • 衡阳网站优化公司个人网站可以做音乐吗
  • 怎么iis设置网站太原网站建设外包
  • UVa1008/LA2240 A Vexing Problem
  • 如何利用Yarn定位数据倾斜问题?