《大模型导论》笔记——大模型概述
关键术语:
- token, 文本中的最小单位
- prompt,模型训练过程,给模型提供输入的上下文信息
- embedding,词向量,词嵌入,一种将高纬度离散数据映射到低纬度连续向量空间的技术
大模型开发流程:
- 确定项目目标
- 数据准备,上传数据集
- 模型设计
- 模型训练,调试
- 模型部署
- 模型应用,通过 url 地址调用
未来发展方向
- AI agent,大模型驱动,独立决策,不需要人为干预,自动调用工具完成给定目标的智能程序。需要具备三大关键能力:1. 决策能力 planning ,拆解复杂任务 2. 记忆能力 memory,能够记录任务对话中的上下文,保证信息连贯和准确 3. 使用工具的能力 tool
- Embodied Intelligence ,具备自主决策和行动能力的机器人是人工智能的终极形态