当前位置：首页 > news >正文

阿里发布新一代通义千问 Qwen3模型

news 2025/11/1 1:35:16

近日，阿里巴巴发布了新一代通义千问 Qwen3 模型，一举登顶全球最强开源模型。

这是国内首个“混合推理模型”，将“快思考”与“慢思考”集成进同一个模型，大大节省算力消耗。

旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。

Qwen3模型具备两种差异化的思考模式，为用户提供了灵活的交互选择：

深度思考模式：该模式下，模型采用逐步推导的方式，通过多层级的逻辑分析与推理，审慎得出最终答案。这种模式尤其适用于处理需要深度剖析、复杂推理的任务场景，能够确保答案的准确性与逻辑性。

快速响应模式：此模式侧重效率优先，模型可在短时间内输出答案，适用于解决内容明确、无需深度分析的简单问题，满足用户对即时反馈的需求。

通过这两种模式的有机结合，用户可以根据任务特性精准调控模型的推理深度。例如，面对复杂的专业问题时，可借助深度思考模式进行细致推演；处理常规性、简单问题时，则启用快速响应模式获取即时解答。这一设计赋予Qwen3强大的"思考预算"调控能力，用户能够依据任务需求合理分配计算推理资源，在成本控制与推理效果之间达成最优平衡，充分发挥模型在不同场景下的性能优势。

查看全文

http://www.dtcms.com/a/168959.html