当前位置：首页 > news >正文

【极速版 -- 大模型入门到进阶】快速了解大型语言模型

news 2025/10/14 15:46:58

文章目录

- 🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力
- 🌊 LLM 如何生成输出：简而言之就是文字接龙
- 🌊 GPT 之前 ...：模型规模和数据规模概览
- 🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习
- 🌊 ChatGPT 使用：人类向 chatgpt 靠近
- 🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

🌊 大模型作为一种生成式人工智慧，厉害在哪儿？-> 通用能力

🌊 LLM 如何生成输出：简而言之就是文字接龙

🌊 GPT 之前 …：模型规模和数据规模概览

之前都是从网络上各类文字资料学习 …
之后开启下一个阶段：【督导式学习】由人类告诉 GPT 我们想要的答案是什么，这一阶段并不需要大量资料 (上万的资料就可以)

🌊 ChatGPT 有三个训练阶段：预训练、督导式学习、强化学习

Reinforcement Learning from Human Feedback (RLHF)：原理复杂概念简单；模型要有一定能力(偶有佳作)，进入 RLHF才有意义

🌊 ChatGPT 使用：人类向 chatgpt 靠近

讲清需求
提供足够的信息，也可以上传档案
提供范例: in-context learning (注意，是没有训练，没有改变参数的)
鼓励 chatgpt 想一想 (例如使用下面的魔法咒语表 🔮 Chain of Thought (CoT))
使用外挂 (例如 +搜索引擎, 具体怎么学习呢 -> 参考：https://youtu.be/ZlD220t Mpl?feature=shared)
拆解任务后执行 (可以让 chatgpt 自己拆解)
让它反思 (例如：告诉它请检查上述答案是否正确)

🌊 ChatGPT 跟真实环境互动 (例如可以操控机器臂)

参考资料：面向每个人的生成式AI, 【李宏毅 LLM 大模型】

http://www.dtcms.com/a/86226.html

相关文章：

Modern C++面试题及参考答案

Smith3.0 4.0的阻抗匹配操作方法

Apache Doris学习

让 MGR 不从 Primary 的节点克隆数据？

字节DAPO算法：改进DeepSeek的GRPO算法-解锁大规模LLM强化学习的新篇章（代码实现）

NLP高频面试题（十一）——RLHF的流程有哪些

odata 搜索帮助

CS2 demo manager 安装

git 合并多次提交 commit

Problem: 73. 矩阵置零

Unity网络开发快速回顾

人工智能在现代科技中的应用和未来发展趋势

Java问题小记——入职心得

风控笔记4——市场风险管理

【Python入门速学】2.4. 逻辑运算符

SQL Server查询计划操作符（7.3）——查询计划相关操作符（11）

人工智能之数学基础:瑞利商与特征值的关系

JAVA组件的利用漏洞 Shlr搜索引擎 shiro身份 Log4j日志

常见中间件漏洞（tomcat）

深入解析 Spring IOC AOP：原理、源码与实战

屏幕刷新机制（一）：机制

用tensorboard支持pytorch训练可视化

JAVA学习*Object类

gbase8s cdc协议解析

多源最短路径算法（竞赛）

第45章：配置更新与应用热重载策略

VMware上对CentOS7虚拟机进行磁盘扩容、缩容

Uthana，AI 3D角色动画生成平台

Python第六章08：元组操作练习题

C++ 学习笔记（四）—— 类和对象