当前位置: 首页 > news >正文

【腾讯云架构师技术沙龙2025.03.22】

大模型技术演进与行业影响分析

日期:2025年3月22日
主讲人:李建忠
《DeepSeek实战驱动行业智变—AI应用寒武纪》
整理:飞书语音转化+DeepSeek分析汇总


一、技术演进:从快思考到慢思考

1. 早期争议与能力局限(2022-2023)

  • 争议焦点:大语言模型(LLM)是否具备推理能力?
  • 学界观点:2023年上半年,国内一线学者认为大模型本质是统计学习(概率模型),缺乏深度推理能力。

2. 系统一 vs 系统二

  • 快思考(系统一):直觉式反应,占比人类日常思考95%,早期大模型主要依赖此模式(如即时响应Prompt)。
  • 慢思考(系统二):逻辑推理与规划(如架构设计),需长时间深度思考,2023年9月前大模型在此能力薄弱。

3. 强化学习的突破(2024Q4)

  • OpenAI O1:2024年9月推出,数学家陶哲轩评价其数学推理能力“接近初阶博士生水平”。
  • DeepSeek R1:2024年12月开源,与O1同步实现推理能力跃升,开源方案获全球实验室复现认可。

二、技术创新与开源革命

1. 核心技术创新

技术作用意义
MLA(多头潜在注意力)减少93%显存查询,提升推理效率算力受限下的性能突破
MoE(混合专家网络)DeepSeek V3集成256个专家(远超GPT-4)降低训练/推理负载,适配国产算力生态
软硬协同优化底层汇编级代码优化(如PDX协议)探索软件定义硬件,倒逼芯片厂商适配

2. 开源战略

  • 开源程度:模型、代码、数据全量开源(MIT协议),打破闭源垄断。
  • 全球影响:欧洲、中东模型厂商加速拥抱,推动行业裂变式创新。

3. 成本革命

  • 推理成本:单次响应低至0.5分人民币,与搜索引擎(Google 0.2美分)持平。
  • 类比意义:类比2011年小米手机引爆移动互联网,AI应用将迎寒武纪爆发。

三、行业生态重构

1. 算力格局变化

  • 预训练侧:英伟达CUDA生态仍主导(90分 vs 国产芯片6,7分)。
  • 推理侧:国产芯片(昇腾等)缩小差距,开源模型推动算力需求向推理转移。

2. 模型厂商收敛

  • 趋势:自研模型厂商减少至“三五家”,中小厂商转向微调/蒸馏方案。

四、AI产品范式转换

1. 技术史周期规律

  • 连接→计算交替演进
    电报(连接1.0)→ 计算机(计算1.0)→ 互联网(连接2.0)→ AI(计算2.0)
  • AGI预测:2035-2040年接近人类智能(库兹韦尔“奇点”理论)。

2. 范式立方体

维度内容大模型颠覆力
技术轴连接(信息流通) vs 计算(智能生成)计算2.0重构生产力工具
需求轴信息/搜索 > 娱乐/社交 > 商业搜索与生产力颠覆快,娱乐依赖人类情感
模态轴文本→图像→视频→3D多模态生成逐步成熟

3. 行动网络与智能体

  • 核心能力:推理→规划→执行(如OpenAI Minus)。
  • 未来场景
    • 智能体主动服务(异步/伴随式交互)。
    • 广告、电商需适配“智能体需求”(如品牌推荐逻辑变化)。

五、人类价值壁垒

  • AI优势:效率与知识(内啡肽型价值)。
  • 人类壁垒:情感、创造力与生命意识(多巴胺型价值),生死观衍生爱恨情仇。

核心结论

  1. 技术:强化学习+开源推动推理范式革命,国产算力窗口期打开。
  2. 成本:推理成本平民化,AI应用爆发临界点已至。
  3. 产品:从“人类中心”转向“智能体中心”,行动网络重构互联网逻辑。
  4. 哲学:AI超越人类脑力,但情感与生命意识仍是独有护城河。
http://www.dtcms.com/a/89001.html

相关文章:

  • 前端面试常见的计算机网络内容梳理
  • RocketMQ 面试备战指南
  • Podman 学习总结
  • Can Large Language Models be Anomaly Detectors for Time Series? 解读
  • C#中Interlocked.Exchange的作用
  • vmware虚拟机快照、克隆、迁移区别说明
  • sonar代码检测研究及平台搭建
  • Vue+SpringBoot:整合JasperReport作PDF报表,并解决中文不显示问题
  • 统计可重复列表中的TOP N
  • 路由工程师大纲-3:结合AI技术进行路由策略优化的知识链体系
  • P1102 A-B 数对
  • github_本地项目上传到远程
  • python 模拟登录
  • 阶跃星辰 Step-Video-TI2V 图生视频模型深度解析
  • 自由学习记录(47)
  • 10分钟读完《有限与无限的游戏》
  • 两个手机都用流量,IP地址会一样吗?深入解析
  • 【计算机网络】TCP协议技术细节全解析:与UDP的核心差异深度对比
  • 餐饮管理系统的设计与实现(代码+数据库+LW)
  • 新书速览|云原生Kubernetes自动化运维实践
  • 2024年数维杯数学建模B题生物质和煤共热解问题的研究解题全过程论文及程序
  • Linux运维篇-系统io调优
  • 《基于Python的财务数据可视化与决策支持系统开发》开题报告
  • 如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介
  • 2. 初识go-zero
  • Linux系统还可以在做一层虚拟化安装虚拟机吗
  • 基于Python的超导体金属研制探索与展望
  • 嵌入式c学习八
  • ASP.NET Core部署Docker教程
  • CentOS 7上配置虚拟用户的FTP服务