DeepSeek发布V3.1-Terminus版本,模型性能与Agent能力全面升级
9月22日晚,DeepSeek团队在官方社群宣布,其线上模型已全面升级至 DeepSeek-V3.1-Terminus。目前,deepseek-chat 与 deepseek-reasoner 两大核心模型均已同步更新,官方也邀请用户进行测试并反馈问题。
据介绍,此次版本升级在保留原有能力的基础上,重点针对用户反馈进行了优化:
语言一致性 —— 显著缓解了中英文混杂及偶发异常字符的情况,提升跨语言任务的稳定性;
Agent能力 —— 进一步增强了 Code Agent 与 Search Agent 的表现,智能体任务的执行效率与可靠性都有明显提升。
事实上,DeepSeek自年初以来便频频引发业界关注。作为开源大模型的代表,DeepSeek-R1 在数学计算、代码生成、自然语言推理等方面的表现已达到国际一流水平。今年9月17日,相关研究成果还登上了《Nature》封面,成为全球焦点。该论文首次揭示了 DeepSeek-R1 所采用的大规模推理模型训练方法。值得注意的是,团队在研发过程中采用了强化学习来代替传统的人类示例标注,从而降低了训练成本并简化了复杂性。
而在8月21日,DeepSeek刚刚发布 DeepSeek-V3.1,首次引入“混合推理架构”,使模型能够在思考模式与非思考模式间灵活切换,不仅提升了推理效率,也增强了智能体的工具使用能力。当时,DeepSeek还宣布采用了 UE8M0 FP8 Scale 参数精度,这一设计与新一代国产芯片深度适配,引发了产业链企业股价的集体上涨。
如今的 V3.1-Terminus 版本,可以视为对上一版本的进一步迭代与打磨,重点在于实际用户体验的优化与智能体生态的拓展。这不仅展现了DeepSeek在开源大模型领域的持续投入,也意味着国产AI在全球竞争中正稳步推进。
在实际应用层面,国内开发者若希望便捷接入包括DeepSeek在内的多模态大模型,不妨关注 PoloAPI平台(www.poloapi.com)。该平台汇聚了海量主流大模型API接口,覆盖文本、图像、音频等多模态任务,能帮助企业和个人快速调用最新的AI能力,大幅降低接入与运维成本。对于正在探索AI应用落地的开发者而言,这是一个高效、可靠的选择。