- AI发展:基于规则,统计学习,大模型,类人学习
- 核心三要素:数据、算法、算力
- 2017年开始的transformer--gpt
- ai大模型定义:使用transformer架构,参数量较大,与训练、微调机制;涌现效应,参数达到一定规模后,模型准确率大幅度提升;参数量起步在6B以上
- 典型类型:
- 自然语言处理,nlp大模型
- 计算机视觉,cv大模型,如工业质检
- 多模态,看图说话
- 科学计算,AI4S大模型,如气象预测、基因分析
- 预测大模型,回归预测、异常检测,如制造业的工艺预测等
- 以算法为中心到以数据为中心,是AI大模型带来的重大范式转移。模型训练关键因素:数据规模+质量
- 算法理论基础:业务抽象成数据模型的表达式
- 建模(建立关系表达--算法),训练(参数),微调,推理
- 算法模型理论体系:白盒设计+黑盒设计
- 白盒:要求更加深入了解业务逻辑,直接设计算法模型
- 黑盒:大量训练数据和标签,训练黑盒模型
- 选择原则:“能说清楚的”用白盒,“说不清楚”需要从数据中学习的,用黑盒
- 神经网络
- 范畴:人工智能>机器学习〉深度学习
- 人工智能:专家系统、复杂系统、定理证明、事实与规则
- 机器学习:人工设计、可解释,数据规模较小;随机森林、决策树、贝叶斯学习、SVN向量机
- 深度学习:数据中学习,黑盒,数据规模较大;NN 、CNN、 RNN
- 三大学习范式:自监督学习、监督学习、强化学习。可分别形容为:自习课、常规授课(人类标注数据)、习题课(用环境活模型作为监督信号)
- 训练和推理:
- 开发态:AI训练,不断数据、学习,形成模型/算法
- 部署态:AI推理,利用已训练好的规则,完成具体任务
- AI计算用NPU(神经网络处理单元)/GPU(图像处理器)而不是CPU(中央处理器)?能够处理计算密集型、高并发任务。
- 通用人工智能三大里程碑:
- 超级应用
- 科学人工智能(AI4S)
- 机器人工智能:ai+机器人






