当前位置：首页 > news >正文

火山引擎发布豆包大模型 1.6 与视频生成模型 Seedance 1.0 pro

news 2025/9/20 4:40:03

6 月 11 日，在火山引擎 FORCE 原动力大会上，字节跳动旗下火山引擎正式发布豆包大模型 1.6、豆包・视频生成模型 Seedance 1.0 pro、豆包・语音播客模型，豆包・实时语音模型也在火山引擎全量上线，豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型矩阵。截至 2025 年 5 月底，豆包大模型日均 tokens 使用量超过 16.4 万亿，较去年 5 月刚发布时增长 137 倍。

豆包大模型 1.6：推理、多模态与复杂任务处理的革新

全新发布的豆包大模型 1.6 系列由三个模型组成，为企业提供多样化选择。

doubao-seed-1.6：All-in-One 的综合模型，是国内首个支持 256K 上下文的思考模型，支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式，其中自适应思考模式可根据提示词难度自动决定是否开启思考，在推理效率与效果间达到精妙平衡。
doubao-seed-1.6-thinking：豆包大模型 1.6 系列在深度思考方面的强化版本，在代码、数学、逻辑推理等基础能力上进一步提升，支持 256K 上下文。其在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上的表现已跻身全球前列，能够深入分析问题，对各类复杂任务给出高质量解答。
doubao-seed-1.6-flash：豆包大模型 1.6 系列的极速版本，支持深度思考、多模态理解、256K 上下文，延迟极低，TOPT 仅需 10ms，视觉理解能力比肩友商旗舰模型。该版本在追求速度的同时，没有牺牲模型对文本、图像等多模态信息的理解能力，能够快速响应业务请求，满足对时效性要求极高的场景。

在推理速度、准确度与稳定性上，豆包大模型 1.6 实现了显著提升。以高考数学测评为例，有媒体针对今年的高考全国新一卷数学单科做了测评，豆包的成绩是 144 分，全国第一。而在高考前，在针对海淀区模拟全卷的测评中，相比去年的模型，豆包大模型 1.6 理科成绩显著提升了 154 分，文科提升了 90 分，充分展现其在复杂知识推理与问题解决上的进步。在多模态理解方面，此前豆包 1.5 的多模态能力在 60 个公开评测基准中取得 38 项最佳成绩，已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。而豆包大模型 1.6 在此基础上更进一步，图形界面操作能力让其具备 “行动力”，可自动操作浏览器完成酒店预订，识别购物小票并整理成 Excel 表格等任务，将多模态理解与实际操作相结合，更好地处理真实世界问题。

豆包・视频生成模型 Seedance 1.0 pro：视频生成技术的新标杆

全新发布的豆包・视频生成模型 Seedance 1.0 pro 具备三大特性，代表着视频生成技术的新高度。

无缝多镜头叙事：通过先进的语义理解和镜头语言规划技术，Seedance 1.0 pro 能够根据输入的文本或图片信息，生成逻辑连贯、情节流畅的多镜头视频。模型能够精准把握不同镜头之间的转场时机和方式，实现自然流畅的镜头切换，避免了传统视频生成模型在多镜头叙事时容易出现的情节断裂、场景突兀等问题。
多动作及随心运镜：该模型支持多种复杂的人物动作及灵活的运镜效果。在人物动作生成方面，它能够分析动作时序与空间关系，生成自然流畅的人物交互动作，使人物的运动轨迹、受力反馈更加契合现实规律。在运镜上，支持 360 度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言，极大地丰富了视频的视觉表现形式，为创作者提供了更多创意表达的可能性。
稳定运动与真实美感：在视频生成过程中，Seedance 1.0 pro 能够保证主体运动的稳定性，即使在复杂的动作和运镜下，也能确保视频主体清晰、稳定，不会出现抖动、模糊等现象。同时，模型生成的视频画面具有极高的自然度和真实美感，通过专业级光影布局和色彩调和，生成的视频画面极具视觉冲击力，接近实拍效果。

根据第三方权威榜单 Artificial Analysis 最新结果，Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型，登顶全球竞技场第一，彰显了其在视频生成技术领域的领先地位。

目前，豆包大模型已涵盖多模态、视频、图像、语音、音乐等丰富的模型品类，正全方位推进智能提升和应用落地，凭借不断革新的技术为企业的智能化转型和创新发展持续赋能。

查看全文

http://www.dtcms.com/a/244432.html