当前位置: 首页 > news >正文

【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • 🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力
    • 🌊 LLM 如何生成输出:简而言之就是文字接龙
    • 🌊 GPT 之前 ...:模型规模和数据规模概览
    • 🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习
    • 🌊 ChatGPT 使用:人类向 chatgpt 靠近
    • 🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 …:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 …
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

http://www.dtcms.com/a/86226.html

相关文章:

  • Modern C++面试题及参考答案
  • Smith3.0 4.0的阻抗匹配操作方法
  • Apache Doris学习
  • 让 MGR 不从 Primary 的节点克隆数据?
  • 字节DAPO算法:改进DeepSeek的GRPO算法-解锁大规模LLM强化学习的新篇章(代码实现)
  • NLP高频面试题(十一)——RLHF的流程有哪些
  • odata 搜索帮助
  • CS2 demo manager 安装
  • git 合并多次提交 commit
  • Problem: 73. 矩阵置零
  • Unity网络开发快速回顾
  • 人工智能在现代科技中的应用和未来发展趋势
  • Java问题小记——入职心得
  • 风控笔记4——市场风险管理
  • 【Python入门速学】2.4. 逻辑运算符
  • SQL Server查询计划操作符(7.3)——查询计划相关操作符(11)
  • 人工智能之数学基础:瑞利商与特征值的关系
  • JAVA组件的利用漏洞 Shlr搜索引擎 shiro身份 Log4j日志
  • 常见中间件漏洞(tomcat)
  • 深入解析 Spring IOC AOP:原理、源码与实战
  • 屏幕刷新机制(一):机制
  • 用tensorboard支持pytorch训练可视化
  • JAVA学习*Object类
  • gbase8s cdc协议解析
  • 多源最短路径算法(竞赛)
  • 第45章:配置更新与应用热重载策略
  • VMware上对CentOS7虚拟机进行磁盘扩容、缩容
  • Uthana,AI 3D角色动画生成平台
  • Python第六章08:元组操作练习题
  • C++ 学习笔记(四)—— 类和对象