当前位置: 首页 > news >正文

DeepSeek R2难产:近期DeepSeek-V3.1 发布更新并开源,成功实现迈向 Agent 时代的第一步

DeepSeek R2难产:近期DeepSeek-V3.1 发布更新并开源,成功实现迈向 Agent 时代的第一步

要说 AI 模型的江湖,这一年简直就是 “大模型修罗场”。前脚 R2 传出难产的风声,后脚 DeepSeek 就甩出了一张大招牌:DeepSeek-V3.1。这波操作不仅没有掉队,反倒像是提前踩进了 Agent 时代的门槛。作为一只长年蹲在模型圈子里的猫头虎,看完更新细节后,忍不住来跟大家聊聊这次升级到底藏着什么乾坤。
在这里插入图片描述

文章目录

  • DeepSeek R2难产:近期DeepSeek-V3.1 发布更新并开源,成功实现迈向 Agent 时代的第一步
    • 🚀 V3.1 的核心升级
    • 🛠️ Agent 能力:更像一个“工具人”了
      • 编程智能体
      • 搜索智能体
    • ⏳ 思考效率:省字、省钱、省时间
    • 📂 模型开源与生态
    • 💰 价格调整:9月6日起执行
    • 🦉 我的几点思考
    • 📌 总结


🚀 V3.1 的核心升级

这次 V3.1 最大的亮点,可以总结为三板斧:

  1. 混合推理架构
    传统模型要么全程“深度思考”,要么直接“无脑快答”。V3.1 干脆把这两种模式合体,用户可以在需要时切换成“深度思考”模式,不需要时就走“快答流”。

  2. 思考效率暴击提升
    相比 R1-0528,V3.1-Think 在保持精度的情况下,输出 token 数量减少了 20%-50%。换句话说,省字又省钱,还不掉链子。

  3. Agent 能力进化
    通过后训练(Post-Training)优化,V3.1 在编程、搜索、任务执行这些典型 Agent 场景下有了肉眼可见的飞跃。

官方 App 和网页端已经同步升级,DeepSeek API 也对接好了:

  • deepseek-chat = 非思考模式
  • deepseek-reasoner = 思考模式

API 还顺手拉通了 Anthropic API 格式,开发者能把 V3.1 直接塞进 Claude Code 框架里,简直不要太丝滑。
在这里插入图片描述


🛠️ Agent 能力:更像一个“工具人”了

编程智能体

图片

从表格能看出来,V3.1 在 SWE 代码修复测试Terminal-Bench 终端任务里跑得更快,轮次更少。对于一个想在代码场景里立足的 Agent,这就是实打实的生产力提升。

搜索智能体

图片

搜索相关的测试更能说明问题。browsecomp(复杂搜索任务)和 HLE(专家级难题)测试里,V3.1 已经甩开了 R1-0528。多步推理和信息检索能力被显著放大,这就意味着它更适合当“知识助手”。


⏳ 思考效率:省字、省钱、省时间

图片

上图一目了然:在 AIME 2025、GPQA、liveCodeBench 等基准测试里,V3.1-Think 的表现基本持平 R1-0528,但消耗的 token 明显少了。

这其实是个很现实的升级:

  • 对开发者来说,API 费用更可控。
  • 对用户来说,回答更简洁,没那么“碎碎念”。

📂 模型开源与生态

DeepSeek 这次继续保持“开源精神”:

  • Base 模型(新增 840B tokens 训练)

    • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
    • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
  • 后训练模型

    • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
    • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

不过要注意:

  • V3.1 用了 UE8M0 FP8 Scale 精度,跟 V3 存在一定不兼容。
  • 分词器和 chat template 也改了,需要部署的朋友别拿老版本文档硬套。

💰 价格调整:9月6日起执行

图片

最现实的部分来了:2025 年 9 月 6 日起,API 调用价格调整。夜间优惠取消,按新表收费。不过 DeepSeek 也扩容了 API 服务,算是涨价+提速的组合拳。


🦉 我的几点思考

  1. R2 难产,V3.1 接棒
    从市场节奏来看,DeepSeek 并没有因为 R2 的停滞而停摆,反倒巧妙地用 V3.1 稳住了用户心智。

  2. Agent 时代的试探
    这次升级不是单纯的推理性能迭代,而是明确地往“智能体化”方向走。能写代码、能搜索、能调用工具,说明 DeepSeek 已经在搭建下一代 AI 工作流的底层砖瓦。

  3. 生态和价格的平衡
    开源+价格调整,看似矛盾,但背后其实是 “控成本+扩规模” 的必然选择。


📌 总结

DeepSeek-V3.1 不是那种让人一眼惊艳的“天花板式”模型,但它非常实用:

  • 效率更高,花钱更少
  • Agent 能力更强,适配更多场景
  • 开源透明,开发者门槛低

在这个人人喊着做 Agent 的时代,DeepSeek 用 V3.1 稳稳迈出了一步。也许真正的“R2 神话”还在路上,但 V3.1 已经足够让人期待下一步了。


🦉 我的观点:别再纠结 R2 了,V3.1 已经开始布下一盘更大的棋。


http://www.dtcms.com/a/343022.html

相关文章:

  • 信息收集4----(收集网站指纹信息)
  • CSS 3D动画,围绕旋转动画Demo
  • 常见 Linux 网络命令梳理
  • AGV 技术落地场景解析:从制造业到仓储物流,看自动导引车的行业应用
  • 【Ruoyi解密-02.登录流程:】登录-找密码不抓瞎
  • 封装FTPSClient连接ftps服务器
  • 一个成熟的运维及售后岗位应掌握的知识体系详解
  • Linux动态库制作和使用
  • Manus AI 与多语言手写识别:技术、应用与未来
  • Nginx + Vue/React 前端 + API:防止路径混淆漏洞与跨域问题实战分享
  • [Mysql数据库] Mysql安全知识
  • Oracle ADG 切换方式详解:Switchover 与 Failover 操作指南
  • 〖领码方案〗前端 PageData 完整解决方案 第四版
  • 深度解析Structured Outputs:让AI输出严格遵循JSON Schema的结构化响应
  • 【日常学习】2025-8-21 了解些测试名词
  • 【GPT入门】第52课 openwebui安装与使用
  • Zynq中级开发七项必修课-第三课:S_AXI_GP0 主动访问 PS 地址空间
  • 通信算法之317:基于Xilinx FPGA平台的符号同步算法(接收序列与本地序列互相关-不共轭乘)
  • ODDR实现多bit单边沿采样数据转为多bit双沿采样数据
  • 前端-Vue笔记(核心语法)
  • linux内核 - 内存分配机制介绍
  • MySQL 8.4.6 LTS 安装教程 windows
  • 如何在mac玩windows游戏?3个工具推荐,不用换电脑!
  • MiniGPT-4
  • 在Excel和WPS表格中合并多个单元格这样最快
  • 第14章 结构和其他数据形式
  • 数据分类分级的关键难点以及应对之道
  • Go1.25的源码分析-src/runtime/runtime1.go(GMP)g
  • U盘安装 CentOS Stream 10 实战复盘:三大常见问题与解决方法
  • 通义千问VL-Plus:当AI“看懂”屏幕,软件测试的OCR时代正式终结!