当前位置: 首页 > news >正文

【极速版 -- 大模型入门到进阶】大模型如何学会使用对应的工具 (第二弹)

文章目录

    • 🌊 Toolformer 要达到的效果是什么
    • 🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢
    • 🌊 Toolformer 怎么学会使用外部工具:自监督学习使用工具


以 Toolformer 为例,讲解大模型如何学会使用外部工具 API 来增强表现

🌊 Toolformer 要达到的效果是什么

  • 如下示例,对于用户的问题,使用工具 API 并结合 API 返回的结果进行回答
    在这里插入图片描述

🌊 【搜索操作和搜索结果】怎么结合到大模型的生成过程和结果中去的呢

  • 不熟悉大模型如何生成输出的宝,可以先 👉 快速了解大型语言模型

  • 对于这个问题,我们还是以文字接龙的思路来理解,具体而言分为两步

    • 第一步:【搜索、点进、收藏 …】作为一些特殊的文字符号参与接龙

    • 第二步: 没有被【收藏】的条目忽略,根据剩余内容生成【回答】

🌊 Toolformer 怎么学会使用外部工具:自监督学习使用工具

  • 第一步:自动产生 “怎么塞 API” 的学习资料。这个资料是很粗糙的,直接由另一个语言模型根据 prompt 生成(in-context learning);可能是乱塞一气,并没有产生有益作用的调用

  • 第二步:评估训练资料的可用性,删选有用的 “API 塞入”

  • 第三步:根据可用的资料,训练调整大模型


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

相关文章:

  • PyTorch量化技术教程:第四章 PyTorch在量化交易中的应用
  • 【漏洞复现】Apache Tomcat partial PUT文件上传反序列化漏洞复现(CVE-2025-24813)
  • 【JavaScript 简明入门教程】为了Screeps服务的纯JS入门教程
  • 第12章:优化并发_《C++性能优化指南》notes
  • P1722 矩阵Ⅱ - 洛谷
  • 26考研——查找_树形查找_二叉排序树(BST)(7)
  • JavaScript 改变 HTML 内容
  • Spring JdbcTemplate 万字详解(通俗易懂)
  • 数据库——MySQL基础
  • 解决Ubuntu服务器多网口使用情况下外网老掉线问题
  • 容联云创始人孙昌勋:金融大模型应用,做出场景化应用比技术的先进更重要
  • Photoshop 2025安装教程包含下载安装包,2025最新版图文安装教程
  • 跨层封装简单介绍
  • 简单的括号匹配
  • stack和queue
  • Hadoop/Spark 生态
  • 【区块链安全 | 第六篇】NFT概念详解
  • MFC中字符串string类型和CString类型互转方法
  • SpringMVC拦截器
  • 简单聊聊Oracle和MySQL数据库的区别和使用场景
  • 山东滕州一车辆撞向公交站台撞倒多人,肇事者被控制,案件已移交刑警
  • 五一假期上海境外来沪消费4.55亿元,同比增长211.6%
  • 郭旭涛转任河北省科协党组书记、常务副主席,曾任团省委书记
  • “子宫肌瘤男性病例”论文后:“宫颈癌、高危产妇”论文也现男性病例,作者称“打错了”
  • 罗志田:文学革命的社会功能与社会反响
  • 香港金紫荆广场举行五四升旗礼