【Coze】【视频】育儿书籍工作流
今天为大家演示一个育儿主题的 Coze 视频自动化工作流。本工作流围绕“育儿书籍”内容展开,结合大语言模型生成文案、AI 分镜脚本设计、图像生成、语音合成和自动字幕,最终输出一条适用于短视频平台的育儿教育视频。整个流程通过多个智能节点自动协作,形成从输入到成片的完整内容生成链条,让没有剪辑基础的用户也能轻松完成专业级别的视频内容创作。
文章目录
- 工作流介绍
- 核心模型
- Node节点
- 工作流程
- 大模型应用
- 生成育儿内容脚本
- 生成图文分镜与字幕结构
- 提取奇数组字幕时间轴
- 处理偶数组时间轴并偏移结束时间
- 使用方法
- 应用场景
- 开发与应用
工作流介绍
本工作流名为「育儿书籍」,目标是根据用户提供的育儿类标题,自动生成与之匹配的讲解文案、分镜设计、AI 图像、语音播报与视频元素,并以草稿链接形式输出,可直接在剪映中进行二次编辑。本流程结合图文、语音、字幕、动画等多模态 AI 能力,极大提升育儿内容视频制作的效率与质量。
核心模型
本工作流调用了多个大语言模型节点,核心以 DeepSeek-R1 和豆包·1.5·Pro·32k 为主要模型,分别用于内容生成、分镜脚本生成以及音频时间线处理。模型设定细致,Prompt 设计针对育儿知识高度定制,确保输出的内容具备专业性与表达规范。
模型名称 | 说明 |
---|---|
DeepSeek-R1 | 用于文案生成和分镜脚本,擅长结构化分段和图像提示语输出,适配短视频内容生产 |
豆包·1.5·Pro·32k | 用于处理字幕时间线匹配,精准调整字幕展示与音频节奏的一致性 |
Node节点
整个流程通过串联多个 Node 节点共同完成自动化视频内容的生成。从开始节点的用户输入,到结束节点输出草稿链接,中间涵盖了大模型推理、语音合成、图像生成、视频合成与剪辑元素控制等多个模块,形成完整闭环。
节点名称 | 说明 |
---|---|
开始 | 输入标题和背景音乐,作为整个内容生产的入口 |
生成文案大模型 | 基于标题生成一段育儿知识文案,限定格式与字数 |
分镜大模型 | 将文案分句,生成分镜脚本与图像提示语 |
图像生成 | 根据分镜脚本生成矢量图图像,作为画面主体 |
抠图节点 | 保留图像前景人物,实现背景替换能力 |
底图画板 | 制作背景图与前景元素排版,实现画面融合 |
语音合成 | 将字幕文案转为语音内容,支持选配音色 |
音频时间线节点 | 提取语音时长信息,用于匹配字幕与画面节奏 |
字幕时间轴大模型 | 处理字幕时间线索引,分为两段处理不同的字幕展示逻辑 |
字幕合成 | 根据文本与时间轴合成带入场动画的字幕层 |
音频数据合成 | 将音频链接与时间线合并,生成用于剪映导入的音频轨道数据 |
结束 | 输出最终工作草稿链接,供用户进入剪映继续编辑 |
工作流程
整个工作流从用户输入标题与背景音乐开始,依次调用多个智能模块,自动完成文案生成、分镜脚本拆解、图像与语音的生成、字幕与音频时间线对齐,最终将所有内容组合为可直接导入剪映的视频草稿。流程高度模块化,每个阶段负责不同内容处理任务,通过引用变量进行上下游数据传递,实现自动化串联。
流程序号 | 流程阶段 | 工作描述 | 使用节点 |
---|---|---|---|
1 | 用户输入 | 用户填写育儿标题,设定背景音乐链接 | 开始(Start) |
2 | 文案生成 | 基于输入标题生成一段结构化育儿知识文案,适配短视频需求 | 生成文案大模型 |
3 | 分镜拆解 | 将文案句子切分为字幕,生成对应图像提示词和两段字幕内容 | 分镜大模型 |
4 | 图像生成 | 根据每句字幕的图像提示词生成矢量图风格插画 | 图像生成 |
5 | 抠图 | 保留图像中的关键主体元素,输出透明背景图 | 抠图(cutout) |
6 | 底图合成 | 将图像元素合并排版,生成完整画面结构 | 底图画板 |
7 | 分字幕提取 | 获取字幕中 cap1、cap2 内容,形成语音合成文本列表 | 分镜大模型输出字段 |
8 | 语音合成 | 根据字幕内容生成配音音频,指定角色音色 | speech_synthesis |
9 | 链接提取 | 从语音输出结构中提取每段语音链接 | get_url → objs_to_str_list |
10 | 获取时间线 | 分析语音长度并生成每段对应时间轴 | audio_timelines |
11 | 时间轴处理(奇) | 生成字幕第二段对应时间索引(奇数组) | 第二段字母时间轴 |
12 | 时间轴处理(偶) | 对偶数组中的“end”字段进行偏移更新 | 第一段字母时间轴 |
13 | 合成字幕图层 | 按照字幕文本与时间轴生成动画字幕层 | caption1_infos |
14 | 合成音频轨道 | 结合语音链接与时间轴生成完整剪辑音频轨道 | audio_infos |
15 | 输出草稿链接 | 输出包含图像、字幕、配音的剪映草稿链接 | 结束(End) |
大模型应用
生成育儿内容脚本
该节点是整个工作流的内容起点,负责根据用户提供的标题,生成符合育儿主题的短视频讲解文案。模型角色设定为“育儿早教专家”,Prompt 限定了输出的结构、句式、长度,确保生成文案专业、清晰、具备实用性,适配下游分镜与语音合成任务。
节点名称 | Prompt信息 | 说明 |
---|---|---|
生成文案大模型 | # 角色 你是一位资深的育儿经验分享及启蒙早教专家,精通育儿领域知识,善于用通俗易懂且生动有趣的语言,为家长们传授实用的育儿经验和儿童启蒙知识。依据用户提供的标题:{{title}}生成适合剪映插件制作育儿带书视频的文案。 ## 技能 #### 技能 1: 生成育儿文案 1.当用户提供一句话时,精准把握这句话的主题,,紧密围绕育儿经验分享以及启蒙早教范畴,生成一段约 250 字的文案。 2.文案内容要逻辑严谨、重点突出,详细包含具体的方法、实用的建议等信息。 3.生成的文案中,每句话约20字,且由2个分句构成。 ## 限制: 仅围绕育儿经验分享以及启蒙早教相关内容进行回复,坚决拒绝回答无关话题。 生成的文案需语言通顺、表意清晰,符合正常语言表达习惯。 文案篇幅严格控制在 200字左右。 文案中每句话20字左右,严格由2个分句构成,不得修改。 | 通过结构化 Prompt 精准控制输出内容,生成适用于视频解说的育儿类文案,为工作流提供主干内容 |
生成图文分镜与字幕结构
该节点将育儿文案拆分为字幕句子,生成用于画面创作的分镜图像提示词,同时提取分字幕 cap1、cap2 内容,提供给语音合成与字幕时间线节点。Prompt 对输出格式结构要求极高,保证数据可直接用于后续流程调用。
节点名称 | Prompt信息 | 说明 |
---|---|---|
分镜大模型 | # 角色 你是一位专业的育儿早教视频分镜描述专家,擅长将育儿早教文案转化为生动、形象且具有指导意义的视频分镜描述,助力制作高质量的育儿带书视频。 ## 技能 ### 技能 1: 制作育儿早教视频分镜描述 1.接收用户提供的育儿早教文案内容后,按照句号换行符将文章切分,每一段切分后的内容直接作为一个字幕文案“cap”,禁止提炼或者简化。 2.针对每个字幕文案“cap”,充分发挥创意,创作与之紧密相关的分镜图像提示词“desc_promopt” 4.针对每个字幕文案“cap”,通过“,将其拆分为两个分字幕,记为“cap1”,“cap2” 3.最终以 Array Object 格式输出: [{“cap”:“对应字幕文案”,“cap1”:“字幕1”,“cap2”:“字幕2”,“desc_promopt”:“图像提示词”}] ### 技能2: 数据处理 将每个分镜头的"cap1"以及"cap2"依此输出,存入output1。 ## 限制 -分镜图像提示词必须与对应字幕文案紧密相关,字幕文案必须是对用户提供的育儿早教文章切分后的原始内容。 -输出严格遵循 Array Object 格式要求,不得随意改变结构。 -输出的分字幕cap1、cap2中,不包含标点符号,如“,”、“。” -仅输出前4个分镜。 | 精确控制字幕结构与图像生成提示词,保障图文逻辑连贯、数据结构稳定,核心为后续模块提供素材基准 |
提取奇数组字幕时间轴
该模型负责从语音分析后的时间线中提取奇数索引的字幕时间区间(如第1、3、5段),用于第二段字幕展示。确保字幕分段在时间上的合理衔接。
节点名称 | Prompt信息 | 说明 |
---|---|---|
第二段字母时间轴 | 你是一个数据处理大模型,帮我将{{timelines}}的timelines中的奇数索引组的数组提出,以相同格式输出。 | 针对字幕区间做奇数提取处理,保证双行字幕中第二行时间分配准确 |
处理偶数组时间轴并偏移结束时间
该模型处理偶数组时间轴(第0、2、4段),并将其“end”值更新为对应奇数索引的“end”,用于第一段字幕的展示时间配置,保证字幕上下两行节奏协调。
节点名称 | Prompt信息 | 说明 |
---|---|---|
第一段字母时间轴 | # 角色 你是一个专业的数据处理专家,擅长对特定格式的数据进行精准处理和转换,能够按照用户需求对数据进行灵活调整并以规范格式输出。 ## 技能 ### 技能 1: 处理数据 1.接收用户输入的 {{timelines}} 数据。 2.从输入数据的 timelines 中,将偶数索引组中的"end"数据替换为对应索引加 1的奇数索引组中的"end"数据。 3.移除奇数索引组数据。 4.以与输入数据相同的格式输出处理后的结果。 ## 限制: -仅处理与上述数据处理任务相关的内容,拒绝回答无关话题。 -输出结果必须保持与输入数据相同的格式,不能随意更改结构。 | 用于更新字幕时间配置,使字幕间过渡自然,精确控制双行字幕的时间间隔 |
使用方法
开始节点
字段名 | 含义 | 数据类型 |
---|---|---|
input | 用户输入的育儿标题 | str.String |
bgm | 视频背景音乐地址 | str.String |
结束节点
字段名 | 含义 | 数据类型 |
---|---|---|
draft_url | 创建的剪映草稿链接地址 | 创建草稿 - draft_url |
应用场景
本工作流专为「育儿知识视频」内容创作者打造,通过自动化流程显著降低视频制作门槛,适用于个人育儿博主、育儿品牌、自媒体机构等场景。特别适合希望将育儿图书、心得、亲子教育理念快速转化为可发布视频内容的用户。全流程涵盖文字、语音、图像和时间轴推理,适配当前主流短视频平台内容标准。
应用场景 | 使用目标 | 典型用户 | 展示内容 | 实现效果 |
---|---|---|---|---|
育儿书籍讲解 | 将育儿图书内容转为简短视频,适配短视频平台 | 亲子博主、KOL | 精炼文案、AI 分镜、配音字幕、画面动画 | 快速生成育儿类短视频内容 |
育儿干货传播 | 将经验或技巧整理为科普视频,提高转发与传播效率 | 机构号、母婴平台 | 实用建议、重点图示、语音解析 | 提升内容专业性与观看体验 |
品牌教育输出 | 以视频形式输出育儿理念、亲子活动推广 | 早教机构、儿童品牌 | 品牌理念、知识传播、家长指引 | 降低内容制作成本,增强品牌专业形象 |
开发与应用
更多 AIGC 与 Agent工作流 相关研究学习内容请查阅:
AIGC 与 Agent 工作流应用汇总
更多内容桌面应用开发和学习文档请查阅:
AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用