火山引擎发布豆包大模型 1.6 与视频生成模型 Seedance 1.0 pro
6 月 11 日,在火山引擎 FORCE 原动力大会上,字节跳动旗下火山引擎正式发布豆包大模型 1.6、豆包・视频生成模型 Seedance 1.0 pro、豆包・语音播客模型,豆包・实时语音模型也在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型矩阵。截至 2025 年 5 月底,豆包大模型日均 tokens 使用量超过 16.4 万亿,较去年 5 月刚发布时增长 137 倍。
豆包大模型 1.6:推理、多模态与复杂任务处理的革新
全新发布的豆包大模型 1.6 系列由三个模型组成,为企业提供多样化选择。
- doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持 256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,在推理效率与效果间达到精妙平衡。
- doubao-seed-1.6-thinking:豆包大模型 1.6 系列在深度思考方面的强化版本,在代码、数学、逻辑推理等基础能力上进一步提升,支持 256K 上下文。其在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上的表现已跻身全球前列,能够深入分析问题,对各类复杂任务给出高质量解答。
- doubao-seed-1.6-flash:豆包大模型 1.6 系列的极速版本,支持深度思考、多模态理解、256K 上下文,延迟极低,TOPT 仅需 10ms,视觉理解能力比肩友商旗舰模型。该版本在追求速度的同时,没有牺牲模型对文本、图像等多模态信息的理解能力,能够快速响应业务请求,满足对时效性要求极高的场景。
在推理速度、准确度与稳定性上,豆包大模型 1.6 实现了显著提升。以高考数学测评为例,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是 144 分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型 1.6 理科成绩显著提升了 154 分,文科提升了 90 分,充分展现其在复杂知识推理与问题解决上的进步。在多模态理解方面,此前豆包 1.5 的多模态能力在 60 个公开评测基准中取得 38 项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。而豆包大模型 1.6 在此基础上更进一步,图形界面操作能力让其具备 “行动力”,可自动操作浏览器完成酒店预订,识别购物小票并整理成 Excel 表格等任务,将多模态理解与实际操作相结合,更好地处理真实世界问题。
豆包・视频生成模型 Seedance 1.0 pro:视频生成技术的新标杆
全新发布的豆包・视频生成模型 Seedance 1.0 pro 具备三大特性,代表着视频生成技术的新高度。
- 无缝多镜头叙事:通过先进的语义理解和镜头语言规划技术,Seedance 1.0 pro 能够根据输入的文本或图片信息,生成逻辑连贯、情节流畅的多镜头视频。模型能够精准把握不同镜头之间的转场时机和方式,实现自然流畅的镜头切换,避免了传统视频生成模型在多镜头叙事时容易出现的情节断裂、场景突兀等问题 。
- 多动作及随心运镜:该模型支持多种复杂的人物动作及灵活的运镜效果。在人物动作生成方面,它能够分析动作时序与空间关系,生成自然流畅的人物交互动作,使人物的运动轨迹、受力反馈更加契合现实规律。在运镜上,支持 360 度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言,极大地丰富了视频的视觉表现形式,为创作者提供了更多创意表达的可能性。
- 稳定运动与真实美感:在视频生成过程中,Seedance 1.0 pro 能够保证主体运动的稳定性,即使在复杂的动作和运镜下,也能确保视频主体清晰、稳定,不会出现抖动、模糊等现象。同时,模型生成的视频画面具有极高的自然度和真实美感,通过专业级光影布局和色彩调和,生成的视频画面极具视觉冲击力,接近实拍效果。
根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一,彰显了其在视频生成技术领域的领先地位。
目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等丰富的模型品类,正全方位推进智能提升和应用落地,凭借不断革新的技术为企业的智能化转型和创新发展持续赋能。