当前位置: 首页 > news >正文

RAG-大模型课程《李宏毅 2025》作业1笔记

原视频链接:HW1 - Retrieval Augmented Generation with Agentic System_哔哩哔哩_bilibili

1、什么是RAG

2、为什么用RAG

3、什么是agent系统

1、什么是RAG
  • Retrieval - augmented generation (RAG) ·检索增强生成
  • RAG是一种让大语言模型(LLMs)利用外部知识回答查询的方法,在一种简单的RAG实现中,用户的问题会首先被输入到“检索系统”或“已知知识库”中以收集相关信息。

2、为什么要用RAG
  • 可解决大语言模型知识截止(模型预训练的数据有截止时间)
  • 直接训练模型成本高(RAG不需要训练模型)
  • 提升答案可靠性(比如企业内部文库)

3、作业中的agent

大语言模型,作为一个个“角色”配合完成复杂任务的框架

Agent目前没有统一agent定义,可以查看上篇内容

例子:

  • 用户问题:美国独立战争第一枪在哪里打响的?
  • maneger:决定把问题(如果有RAG ,则与RAG信息一起) 传给哪个“分类专家”——从科学、历史、数学中,选择了历史专家。
  • 事实检测:通过网络搜索,检查历史专家答题结果,确认回答正确。

作业代码链接:ML2025 Homework 1 | Kaggle

http://www.dtcms.com/a/322400.html

相关文章:

  • 从“人拉肩扛”到“智能协同”——AGV重构消防智能仓储价值链
  • 我用C++和零拷贝重构了文件服务器,性能飙升3倍,CPU占用降低80%
  • 202506 电子学会青少年等级考试机器人二级理论综合真题
  • Spark02 - SparkContext介绍
  • 304 引发的 SEO 难题:缓存策略与内容更新如何两全?
  • 【ref、toRef、toRefs、reactive】ai
  • 比较useCallback、useMemo 和 React.memo
  • kafka架构原理快速入门
  • Opencv[七]——补充
  • 基于HTML的政策问答
  • java组件安全vulhub靶场
  • HTML金色流星雨
  • 服务器硬件电路设计之I2C问答(二):I2C总线的传输速率与上拉电阻有什么关系?
  • ELK常见的问题
  • 华为实验:DHCP 典型配置
  • 《汇编语言:基于X86处理器》第12章 复习题和练习
  • Openlayers基础教程|从前端框架到GIS开发系列课程(19)地图控件和矢量图形绘制
  • Elasticsearch `_search` API Query DSL、性能开关与实战范式
  • 如何优雅的使用进行参数校验
  • Nginx 功能扩展与二次开发实践
  • 黑马SpringAI项目-聊天机器人
  • axios 发请求
  • 束搜索(Beam Search):原理、演进与挑战
  • ubuntu 端口占用 但是找不到进程 与docker 容器镜像相关
  • 【网络与爬虫 52】Scrapyd-k8s集群化爬虫部署:Kubernetes原生分布式爬虫管理平台实战指南
  • 【新启航】飞机起落架外筒深孔型腔的测量方法 - 激光频率梳 3D 轮廓检测
  • 基于遗传优化的智能灌溉系统控制策略matlab仿真
  • python学智能算法(三十六)|SVM-拉格朗日函数求解(中)-软边界
  • docker的开源跨平台替代Vagrant
  • Zread:把 GitHub 仓库“一键变说明书”的体验与实战指南