当前位置: 首页 > news >正文

【极速版 -- 大模型入门到进阶】快速了解大型语言模型

文章目录

    • 🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力
    • 🌊 LLM 如何生成输出:简而言之就是文字接龙
    • 🌊 GPT 之前 ...:模型规模和数据规模概览
    • 🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习
    • 🌊 ChatGPT 使用:人类向 chatgpt 靠近
    • 🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


🌊 大模型作为一种生成式人工智慧,厉害在哪儿?-> 通用能力

🌊 LLM 如何生成输出:简而言之就是文字接龙

🌊 GPT 之前 …:模型规模和数据规模概览

  • 之前都是从网络上各类文字资料学习 …
  • 之后开启下一个阶段:【督导式学习】由人类告诉 GPT 我们想要的答案是什么,这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段:预训练、督导式学习、强化学习

  • Reinforcement Learning from Human Feedback (RLHF):原理复杂概念简单;模型要有一定能力(偶有佳作),进入 RLHF才有意义

🌊 ChatGPT 使用:人类向 chatgpt 靠近

  • 讲清需求

  • 提供足够的信息,也可以上传档案

  • 提供范例: in-context learning (注意,是没有训练,没有改变参数的)

  • 鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))

  • 使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考:https://youtu.be/ZlD220t Mpl?feature=shared)

  • 拆解任务后执行 (可以让 chatgpt 自己拆解)

  • 让它反思 (例如:告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)


参考资料:面向每个人的生成式AI, 【李宏毅 LLM 大模型】

相关文章:

  • Modern C++面试题及参考答案
  • Smith3.0 4.0的阻抗匹配操作方法
  • Apache Doris学习
  • 让 MGR 不从 Primary 的节点克隆数据?
  • 字节DAPO算法:改进DeepSeek的GRPO算法-解锁大规模LLM强化学习的新篇章(代码实现)
  • NLP高频面试题(十一)——RLHF的流程有哪些
  • odata 搜索帮助
  • CS2 demo manager 安装
  • git 合并多次提交 commit
  • Problem: 73. 矩阵置零
  • Unity网络开发快速回顾
  • 人工智能在现代科技中的应用和未来发展趋势
  • Java问题小记——入职心得
  • 风控笔记4——市场风险管理
  • 【Python入门速学】2.4. 逻辑运算符
  • SQL Server查询计划操作符(7.3)——查询计划相关操作符(11)
  • 人工智能之数学基础:瑞利商与特征值的关系
  • JAVA组件的利用漏洞 Shlr搜索引擎 shiro身份 Log4j日志
  • 常见中间件漏洞(tomcat)
  • 深入解析 Spring IOC AOP:原理、源码与实战
  • 一周文化讲座|“我的生命不过是温柔的疯狂”
  • “养胃骗局”大公开,真正有用的方法究竟是?
  • 《求是》杂志发表习近平总书记重要文章《锲而不舍落实中央八项规定精神,以优良党风引领社风民风》
  • 科普|男性这个器官晚到岗,可能影响生育能力
  • 缅甸内观冥想的历史漂流:从“人民鸦片”到东方灵修
  • 当代科技拟召开债券持有人会议 ,对“H20科技2”进行四展