智谱 AI 重磅发布 GLM-4.5:开源 SOTA,专为下一代智能体应用打造
今天,智谱 AI (Zhipu AI) 正式推出新一代旗舰模型 GLM-4.5,这是一款专为复杂智能体(Agent)应用设计的强大基础模型。该模型已在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循友好的 MIT License,全面拥抱开源社区。
核心亮点速览
- 开源SOTA,国产最强:在推理、代码、智能体等综合能力上,GLM-4.5 达到全球顶尖、国产第一、开源第一的水平。在真实代码智能体的人工评测中,表现为国内最佳。
- 先进MoE架构:采用混合专家(MoE)架构,提供两个版本:
- GLM-4.5: 总参数量 3550 亿,激活参数 320 亿。
- GLM-4.5-Air: 总参数量 1060 亿,激活参数 120 亿。
- 双模智能:原生支持两种模式——用于复杂推理和工具调用的“思考模式”,以及用于即时响应的“非思考模式”。
- 极致性价比:
- 成本极低:API 调用价格低至输入 0.8 元/百万 tokens、输出 2 元/百万 tokens。
- 速度极快:高速版生成速度最高可达 100 tokens/秒。
- 无缝集成与体验:API 已上线 AIGC开放平台,可一键兼容 Claude Code 框架。用户也可在 https://xiaojingai.com 免费体验。
一、综合性能:全球第三,开源第一
GLM-4.5 首次在单个模型中原生融合了顶级的推理、编码和智能体能力,旨在满足 AGI 时代复杂智能体应用的严苛需求。
在 MMLU Pro、AIME24、MATH 500、SWE-Bench 等 12 个全球最具代表性的评测基准综合比拼中,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的卓越成绩。
这背后是庞大的数据训练支撑:模型在 15 万亿 token 的通用数据上预训练,并在 8 万亿 token 的代码、推理、智能体等专业数据上进行深度优化,最后通过强化学习进一步提升其核心能力。更多技术细节可参考官方技术博客(https://z.ai/blog/glm-4.5
)。
二、更高参数效率:更小体量,更强性能
GLM-4.5 展现了卓越的参数效率。其参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但在多项基准测试中表现却更为出色。
在衡量代码能力的权威榜单 SWE-Bench Verified 上,GLM-4.5 系列模型位于性能/参数比的帕累托前沿,这意味着在同等规模下,GLM-4.5 实现了当前最佳的性能表现。
三、真实场景测试:榜单之外的硬实力
真实场景的表现比榜单分数更具说服力。在模拟真实编程开发任务的测试中,我们将 GLM-4.5 与 Claude-4-Sonnet、Kimi-K2 等模型进行了直接对比。
测试结果表明,GLM-4.5 展现出强劲的竞争优势,特别是在工具调用的可靠性和任务完成度方面表现突出。在大多数场景中,它已具备平替 Claude-4-Sonnet 的能力。
四、原生智能体能力:从全栈开发到一句话应用
GLM-4.5 强大的原生智能体能力使其能够胜任复杂的全栈开发任务,从前端交互网页到后端数据库管理,再到调用外部 API,均可轻松应对。甚至可以实现“一句话”快速生成功能完善的应用程序。
五、如何快速上手 GLM-4.5
1. 免费在线体验
- 小镜AI:访问 https://xiaojingai.com
2. 开发者 API 调用 (聚合多种模型)
- 访问 https://open.xiaojingai.com/register?aff=xeu4 注册。
- 该平台除了 GLM-4.5,还提供 ChatGPT-4o、GPT-4.5、Claude Sonnet 4、Gemini 2.5 Pro 等多种顶级模型 API。
3. 获取体验指南
- 如需详细的使用指南,可私信联系用户“桂花饼”获取。