Kimi 入驻 GitCode|Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力
月之暗面 Kimi 正式入驻 GitCode,Kimi K2 Thinking 模型在 GitCode 首发上线。
👉 模型开源地址:
https://ai.gitcode.com/MoonshotAI/Kimi-K2-Thinking

作为基于“模型即 Agent”理念打造的新一代思考型智能体,它原生掌握“边思考,边使用工具”的能力,在多项基准测试中表现出色,全面提升了 Agent 和推理能力。
强大性能:多项测试达到 SOTA 水平

01|推理性能全面提升
Kimi K2 Thinking 在多项权威基准测试中展现了卓越的性能。在涵盖 100 多个专业领域的“人类最后的考试”(Humanity‘s Last Exam)中,Kimi K2 Thinking 在允许使用工具的情况下取得了 44.9% 的成绩,创造了该测试的新纪录。

-
人文类题目推理过程示例:
Kimi K2 Thinking 经过 5 轮搜索和推理,每轮层层深入最终推出答案:

在专门评估 AI Agent 网络浏览能力的 BrowseComp 测试中,人类平均成绩仅为 29.2%,而 Kimi K2 Thinking 则以 60.2% 的优异成绩显著超越人类表现。

同时,在 SWE-bench Verified 测试中,它也取得了 71.3% 的好成绩,展现出强大的编码能力。
核心技术:超长工具链与高效推理
01|连续工具调用能力
Kimi K2 Thinking 最引人注目的特点之一是其强大的连续工具调用能力。该模型无需人类干预,即可自主实现 200-300 轮的工具调用和持续稳定的多轮思考,能够通过数百个步骤进行连贯推理,解决复杂问题。
02|高效架构设计
Kimi K2 Thinking 采用混合专家模型(MoE)架构,总参数量高达 1 万亿,但每次推理仅激活约 320 亿参数,实现了效果与效率的平衡。该模型支持 256K 的上下文长度,为处理长文档和复杂任务提供了强大支持。
03|原生INT4量化技术
通过在后训练阶段采用量化感知训练,Kimi K2 Thinking 实现了原生 INT4 推理,将生成速度提升了约 2 倍,同时内存占用减半,且无明显精度损失。这一优化不仅提升了推理效率,也增强了对国产加速计算芯片的兼容性。
全面能力提升
01|Agentic 编程能力
Kimi K2 Thinking 在编程能力上有显著提升,能够处理 HTML、React 以及组件丰富的前端任务,将创意转化为功能齐全、响应式的产品。
在 Agentic Coding 场景中,模型能在调用各种工具的同时进行思考,流畅地融入软件代理中,执行复杂、多步骤的开发工作流。
-
Agentic Coding 示例:
Kimi K2 Thinking 在处理 HTML、React 以及组件丰富的前端任务时性能有明显提升,能将创意转变为功能齐全、响应式的产品。
复刻 Word 文字编辑器

创造体素艺术(voxel art)作品

02|自主搜索与浏览能力
在长程规划和自主搜索能力的驱动下,Kimi K2 Thinking 可借助上百轮的“思考→搜索→浏览网页→思考→编程”动态循环,持续提出并完善假设、验证证据、进行推理,并构建逻辑一致的答案。
这种边主动搜索边持续思考的能力,使模型能够将模糊且开放式的问题分解为清晰、可执行的子任务。
-
搜索与思考示例:
Kimi K2 Thinking 经过两轮搜索和思考,先根据股票回购的已知信息找到制造快艇的公司,随后于美国证券交易委员会(SEC)官网上找到股票回购公告信息,得出准确答案:

通用能力升级
01|创意写作
Kimi K2 Thinking 能將粗略的灵感转化为清晰、动人的叙述,轻松驾驭微妙文风差异,并在长篇大论中保持风格连贯性。
02|学术研究
在学术研究和专业领域,模型在分析深度、信息准确性和逻辑结构方面均有显著提升,尤其擅长处理学术论文、技术摘要等对信息完整性要求高的内容。
03|情感交互
在回应个人或情感类问题时,Kimi K2 Thinking 的回答更富同理心,能提供细致入微的观点和切实可行的建议。
-
辅助阅读英文技术论文示例:

开源生态与获取方式
Kimi K2 Thinking 模型已在 GitCode 平台开源,开发者可访问 GitCode 平台免费体验。这一举措将进一步推动开源 AI 社区的发展,为开发者提供强大的工具,促进AI技术的创新与应用。
作为一款在推理能力、工具使用和编程能力等方面全面升级的开源模型,Kimi K2 Thinking 无疑将为开源 AI 社区注入新的活力,推动 AI 应用向更高水平发展。
👉 模型开源地址:
https://ai.gitcode.com/MoonshotAI/Kimi-K2-Thinking
