阿里发布新一代通义千问 Qwen3模型
近日,阿里巴巴发布了新一代通义千问 Qwen3 模型,一举登顶全球最强开源模型。
这是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,大大节省算力消耗。
旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。
Qwen3模型具备两种差异化的思考模式,为用户提供了灵活的交互选择:
深度思考模式:该模式下,模型采用逐步推导的方式,通过多层级的逻辑分析与推理,审慎得出最终答案。这种模式尤其适用于处理需要深度剖析、复杂推理的任务场景,能够确保答案的准确性与逻辑性。
快速响应模式:此模式侧重效率优先,模型可在短时间内输出答案,适用于解决内容明确、无需深度分析的简单问题,满足用户对即时反馈的需求。
通过这两种模式的有机结合,用户可以根据任务特性精准调控模型的推理深度。例如,面对复杂的专业问题时,可借助深度思考模式进行细致推演;处理常规性、简单问题时,则启用快速响应模式获取即时解答。 这一设计赋予Qwen3强大的"思考预算"调控能力,用户能够依据任务需求合理分配计算推理资源,在成本控制与推理效果之间达成最优平衡,充分发挥模型在不同场景下的性能优势。