当前位置: 首页 > news >正文

2.1 AI与大模型介绍

AI 的总体发展历程

阶段

时间

核心技术特点
早期 AI(符号主义)1950s–1980s规则系统、专家系统人工编规则,推理逻辑强,通用性差
统计机器学习1980s–2010sSVM、KNN、决策树、Naive Bayes模型从数据中学习,泛化更强
深度学习崛起2012–至今CNN、RNN、Transformer端到端、自动提特征,突破图像/语音/NLP
大模型时代2020–至今GPT、BERT、Diffusion、多模态预训练+微调,通用智能趋势

从机器学习到深度学习


机器学习(Machine Learning)

机器学习是从数据中学习模型的技术。典型流程:

  • 人工提取特征(Feature Engineering)
  • 输入特征给模型(如 SVM、逻辑回归、随机森林)
  • 模型学习输入与输出的映射关系

示例模型:

  • 监督学习:KNN、SVM、决策树、随机森林
  • 无监督学习:K-Means、PCA
  • 强化学习:Q-Learning

局限:

  • 需要手工设计特征(如图像的边缘、颜色直方图)
  • 对复杂结构数据(图像、语音、语言)学习能力差


深度学习(Deep Learning)

深度学习是以神经网络为核心的学习方式,它能够自动从原始数据中提取特征

技术转折点:

  • 2012 年 AlexNet 赢得 ImageNet 图像识别比赛,误差骤降,深度学习进入主流
  • 利用 GPU、大数据训练多层神经网络
  • 后续演变出 CNN、RNN、LSTM、Transformer 等模型

核心优势:

  • 不再依赖人工特征设计
  • 能直接处理图像、语音、文本等原始数据
  • 越大越强,规模化带来性能跃迁

机器学习与深度学习对比

项目机器学习(ML)深度学习(DL)
特征提取人工提取自动学习
模型复杂度中等极高(百万~十亿参数)
数据需求相对较少需要大规模数据
硬件依赖高(依赖 GPU/TPU)
应用范围结构化数据图像、语音、NLP 等非结构化数据

从深度学习到大模型


深度学习瓶颈

问题描述
任务特定模型只能解决一个任务,迁移性弱
监督学习依赖强训练需要大量标注数据
推理能力差缺乏常识和复杂推理
模型小、单一模型参数百万级,能力受限

大模型时代的三大转变

项目深度学习时代大模型时代
模型规模百万到千万参数数十亿到数千亿(甚至万亿)
训练方式监督学习自监督 + 大数据预训练
模型能力专用通用(多任务、多模态)

大模型的核心特点

特点描述
通用性强一个模型可以应对 NLP 多个任务,甚至图像、语音等模态
Few-shot / Zero-shot 能力无需训练或仅需少量样本就能解决新任务
可拓展性模型越大越强,性能近似线性增长(Scaling Laws)
多模态能力支持文本、图像、音频、视频等输入输出(GPT-4o、Gemini)
工具化能力能调用外部工具(如搜索、计算器、API)

大模型引发的变革

AI 2.0(深度学习)AI 3.0(大模型)
训练任务特定模型训练通用基础模型
依赖标签使用自监督数据
小模型拼接多系统单一大模型解决多任务
专家调参自动对齐、人类反馈训练

AGI

什么是 AGI

AGI(Artificial General Intelligence,人工通用智能) 指的是一种:

  • 能像人类一样完成任意智能任务
  • 能进行跨任务迁移、推理与学习
  • 具有持续学习、自我反思、动机与规划能力 的智能系统。

简单说:AGI ≠ 只能对话/写代码/生成图像,而是能像人一样通用地理解世界和解决问题


大模型与 AGI 的关系图谱

方面大模型(LLMs)AGI
通用性高,跨任务能力强极高,任意任务都能适应
推理能力有限(依赖上下文)强,能自主构建知识链
学习能力静态模型,需微调持续学习,自适应变化
记忆能力上下文窗口临时记忆长期记忆 + 知识持久化
意图/动机无真正意图有目标、有自我决策能力
工具能力通过函数调用拓展工具内化、灵活使用
自我反思有元认知(知道自己知道什么)

大模型是AGI的阶段

我们可以用一个“进化图”来表示:

人工智能 → 机器学习 → 深度学习 → 大模型 → 智能体(Agent)→ AGI
  • 大模型是“逼近 AGI”过程中的基础能力载体
  • 如果说 AGI 是目标,那么 大模型 + Agent 架构 + 工具能力 + 记忆系统 是通往它的路径

AIGC

AIGC 是什么

AIGC(AI-Generated Content),即 “人工智能生成内容”,指的是通过 AI(尤其是生成式模型)自动生产文本、图像、音频、视频、代码等数字内容 的过程。

  • AIGC = AI Generated Content
  • 属于 内容创作方式的一种范式变革
  • 相对传统内容(人创作)与 PGC(专业内容)/UGC(用户内容)

AIGC 的典型内容类型

类型示例常用模型
文本生成写文章、写诗、摘要、对话GPT-4, Claude, GLM
图像生成插画、头像、壁纸、设计图DALL·E, Midjourney, SD
音频生成背景音乐、配音、拟人声音MusicLM, TTS 模型
视频生成动态广告、数字人、短片Sora (OpenAI), Runway
代码生成自动补全、脚本生成Copilot, CodeWhisperer
3D生成模型、数字资产DreamFusion, GET3D

AIGC 背后的技术基础

技术层代表
模型架构Transformer, Diffusion Model
训练范式自监督预训练、RLHF、人类对齐
多模态融合文本 + 图像、语音 + 视频
工具链Prompt 编写、API调用、模型微调
基础设施GPU、TPU、vLLM、LoRA、推理加速器

AIGC 与大模型、AGI 的区别和联系

概念定义关系
AIGCAI 生成的内容是大模型的 直接应用产物
大模型基础语言/图像模型为 AIGC 提供核心能力(如 GPT)
AGI通用人工智能AIGC 是它可掌握的“技能”之一,但远非全部

比喻理解:

  • 大模型是“发动机”
  • AIGC是“发动机驱动下的应用(车)”
  • AGI是“驾驶员”——能开车、会换挡、能理解上下文目的地
http://www.dtcms.com/a/545563.html

相关文章:

  • 厦门网站建设阿里流量型网站 cms
  • 【笔试真题】- 科大讯飞研发岗-2025.09.27
  • 20.15 多模态系统测试实战:跨模态对齐实现98%准确率的关键方案
  • GXDE 2025 Edition RC 开始测试
  • 网站设计标注图怎么做广东阳江发布最新消息
  • Java中使用Collator实现对象List按照中文姓名属性进行A-Z的排序实现
  • Oracle AWR 报告中的SQL来自哪儿?
  • 企业网站建设的作用创意设计之都
  • 蓝牙钥匙 第1次 蓝牙技术演进全景透视:从1.0到5.3,物联网时代的互联基石
  • Java、Python、C# 和 C++ 在函数定义语法上的主要区别
  • 安装网站程序报价单模板英文
  • mmcv的安装
  • OpenCV(十五):绘制矩形和圆
  • 网站建设基本流程视频关于动漫制作专业
  • 【React】节流会在react内失效??
  • ARM SMMU v3架构规范中文版
  • 北京58网站建设云南手工活外发加工网
  • 宁波本地模板网站建设平台百度论坛首页官网
  • 小模型是AI Agent的未来
  • Flink DataStream「上下文与状态处理」实战指南
  • MLP(Multilayer Perceptron,多层感知机)怎么解决异或问题
  • 惠普DL380服务器安装系统以后无法读取到系统盘启动解决方案(其他品牌服务器类似解决思路)
  • 做个网站的价格长荣建设深圳公司网站
  • 公司要做个网站吗成都短视频运营
  • Linux C/C++ 学习日记(37):协程(六):总结
  • NVIDIA Jetson Orin NX安装graspnet失败解决方案
  • 网站后台有些不显示自己怎么做外贸网站
  • 有几个网站可以做代发的制作小诗集
  • 迷你电脑主机哪个牌子好?有哪些源头OEM/ODM定制厂商
  • 微信小程序开发案例 | 通讯录小程序(下)