当前位置：首页 > news >正文

【Coze】【视频】育儿书籍工作流

news 2025/9/28 9:03:22

今天为大家演示一个育儿主题的 Coze 视频自动化工作流。本工作流围绕“育儿书籍”内容展开，结合大语言模型生成文案、AI 分镜脚本设计、图像生成、语音合成和自动字幕，最终输出一条适用于短视频平台的育儿教育视频。整个流程通过多个智能节点自动协作，形成从输入到成片的完整内容生成链条，让没有剪辑基础的用户也能轻松完成专业级别的视频内容创作。

文章目录

工作流介绍
- 核心模型
- Node节点
工作流程
大模型应用
- 生成育儿内容脚本
- 生成图文分镜与字幕结构
- 提取奇数组字幕时间轴
- 处理偶数组时间轴并偏移结束时间
使用方法
应用场景
开发与应用

工作流介绍

本工作流名为「育儿书籍」，目标是根据用户提供的育儿类标题，自动生成与之匹配的讲解文案、分镜设计、AI 图像、语音播报与视频元素，并以草稿链接形式输出，可直接在剪映中进行二次编辑。本流程结合图文、语音、字幕、动画等多模态 AI 能力，极大提升育儿内容视频制作的效率与质量。

在这里插入图片描述

核心模型

本工作流调用了多个大语言模型节点，核心以 DeepSeek-R1 和豆包·1.5·Pro·32k 为主要模型，分别用于内容生成、分镜脚本生成以及音频时间线处理。模型设定细致，Prompt 设计针对育儿知识高度定制，确保输出的内容具备专业性与表达规范。

模型名称	说明
DeepSeek-R1	用于文案生成和分镜脚本，擅长结构化分段和图像提示语输出，适配短视频内容生产
豆包·1.5·Pro·32k	用于处理字幕时间线匹配，精准调整字幕展示与音频节奏的一致性

Node节点

整个流程通过串联多个 Node 节点共同完成自动化视频内容的生成。从开始节点的用户输入，到结束节点输出草稿链接，中间涵盖了大模型推理、语音合成、图像生成、视频合成与剪辑元素控制等多个模块，形成完整闭环。

节点名称	说明
开始	输入标题和背景音乐，作为整个内容生产的入口
生成文案大模型	基于标题生成一段育儿知识文案，限定格式与字数
分镜大模型	将文案分句，生成分镜脚本与图像提示语
图像生成	根据分镜脚本生成矢量图图像，作为画面主体
抠图节点	保留图像前景人物，实现背景替换能力
底图画板	制作背景图与前景元素排版，实现画面融合
语音合成	将字幕文案转为语音内容，支持选配音色
音频时间线节点	提取语音时长信息，用于匹配字幕与画面节奏
字幕时间轴大模型	处理字幕时间线索引，分为两段处理不同的字幕展示逻辑
字幕合成	根据文本与时间轴合成带入场动画的字幕层
音频数据合成	将音频链接与时间线合并，生成用于剪映导入的音频轨道数据
结束	输出最终工作草稿链接，供用户进入剪映继续编辑

工作流程

整个工作流从用户输入标题与背景音乐开始，依次调用多个智能模块，自动完成文案生成、分镜脚本拆解、图像与语音的生成、字幕与音频时间线对齐，最终将所有内容组合为可直接导入剪映的视频草稿。流程高度模块化，每个阶段负责不同内容处理任务，通过引用变量进行上下游数据传递，实现自动化串联。

流程序号	流程阶段	工作描述	使用节点
1	用户输入	用户填写育儿标题，设定背景音乐链接	开始（Start）
2	文案生成	基于输入标题生成一段结构化育儿知识文案，适配短视频需求	生成文案大模型
3	分镜拆解	将文案句子切分为字幕，生成对应图像提示词和两段字幕内容	分镜大模型
4	图像生成	根据每句字幕的图像提示词生成矢量图风格插画	图像生成
5	抠图	保留图像中的关键主体元素，输出透明背景图	抠图（cutout）
6	底图合成	将图像元素合并排版，生成完整画面结构	底图画板
7	分字幕提取	获取字幕中 cap1、cap2 内容，形成语音合成文本列表	分镜大模型输出字段
8	语音合成	根据字幕内容生成配音音频，指定角色音色	speech_synthesis
9	链接提取	从语音输出结构中提取每段语音链接	get_url → objs_to_str_list
10	获取时间线	分析语音长度并生成每段对应时间轴	audio_timelines
11	时间轴处理（奇）	生成字幕第二段对应时间索引（奇数组）	第二段字母时间轴
12	时间轴处理（偶）	对偶数组中的“end”字段进行偏移更新	第一段字母时间轴
13	合成字幕图层	按照字幕文本与时间轴生成动画字幕层	caption1_infos
14	合成音频轨道	结合语音链接与时间轴生成完整剪辑音频轨道	audio_infos
15	输出草稿链接	输出包含图像、字幕、配音的剪映草稿链接	结束（End）

大模型应用

生成育儿内容脚本

该节点是整个工作流的内容起点，负责根据用户提供的标题，生成符合育儿主题的短视频讲解文案。模型角色设定为“育儿早教专家”，Prompt 限定了输出的结构、句式、长度，确保生成文案专业、清晰、具备实用性，适配下游分镜与语音合成任务。

节点名称	Prompt信息	说明
生成文案大模型	# 角色你是一位资深的育儿经验分享及启蒙早教专家，精通育儿领域知识，善于用通俗易懂且生动有趣的语言，为家长们传授实用的育儿经验和儿童启蒙知识。依据用户提供的标题:{{title}}生成适合剪映插件制作育儿带书视频的文案。 ## 技能 #### 技能 1: 生成育儿文案 1.当用户提供一句话时，精准把握这句话的主题，，紧密围绕育儿经验分享以及启蒙早教范畴，生成一段约 250 字的文案。 2.文案内容要逻辑严谨、重点突出，详细包含具体的方法、实用的建议等信息。 3.生成的文案中，每句话约20字，且由2个分句构成。 ## 限制: 仅围绕育儿经验分享以及启蒙早教相关内容进行回复，坚决拒绝回答无关话题。生成的文案需语言通顺、表意清晰，符合正常语言表达习惯。文案篇幅严格控制在 200字左右。文案中每句话20字左右，严格由2个分句构成，不得修改。	通过结构化 Prompt 精准控制输出内容，生成适用于视频解说的育儿类文案，为工作流提供主干内容

生成图文分镜与字幕结构

该节点将育儿文案拆分为字幕句子，生成用于画面创作的分镜图像提示词，同时提取分字幕 cap1、cap2 内容，提供给语音合成与字幕时间线节点。Prompt 对输出格式结构要求极高，保证数据可直接用于后续流程调用。

节点名称	Prompt信息	说明
分镜大模型	# 角色你是一位专业的育儿早教视频分镜描述专家，擅长将育儿早教文案转化为生动、形象且具有指导意义的视频分镜描述，助力制作高质量的育儿带书视频。 ## 技能 ### 技能 1: 制作育儿早教视频分镜描述 1.接收用户提供的育儿早教文案内容后，按照句号换行符将文章切分，每一段切分后的内容直接作为一个字幕文案“cap”，禁止提炼或者简化。 2.针对每个字幕文案“cap”，充分发挥创意，创作与之紧密相关的分镜图像提示词“desc_promopt” 4.针对每个字幕文案“cap”，通过“,将其拆分为两个分字幕，记为“cap1”，“cap2” 3.最终以 Array Object 格式输出: [{“cap”:“对应字幕文案”,“cap1”:“字幕1”,“cap2”:“字幕2”,“desc_promopt”:“图像提示词”}] ### 技能2: 数据处理将每个分镜头的"cap1"以及"cap2"依此输出，存入output1。 ## 限制 -分镜图像提示词必须与对应字幕文案紧密相关，字幕文案必须是对用户提供的育儿早教文章切分后的原始内容。 -输出严格遵循 Array Object 格式要求，不得随意改变结构。 -输出的分字幕cap1、cap2中，不包含标点符号，如“，”、“。” -仅输出前4个分镜。	精确控制字幕结构与图像生成提示词，保障图文逻辑连贯、数据结构稳定，核心为后续模块提供素材基准

提取奇数组字幕时间轴

该模型负责从语音分析后的时间线中提取奇数索引的字幕时间区间（如第1、3、5段），用于第二段字幕展示。确保字幕分段在时间上的合理衔接。

节点名称	Prompt信息	说明
第二段字母时间轴	你是一个数据处理大模型，帮我将{{timelines}}的timelines中的奇数索引组的数组提出，以相同格式输出。	针对字幕区间做奇数提取处理，保证双行字幕中第二行时间分配准确

处理偶数组时间轴并偏移结束时间

该模型处理偶数组时间轴（第0、2、4段），并将其“end”值更新为对应奇数索引的“end”，用于第一段字幕的展示时间配置，保证字幕上下两行节奏协调。

节点名称	Prompt信息	说明
第一段字母时间轴	# 角色你是一个专业的数据处理专家，擅长对特定格式的数据进行精准处理和转换，能够按照用户需求对数据进行灵活调整并以规范格式输出。 ## 技能 ### 技能 1: 处理数据 1.接收用户输入的 {{timelines}} 数据。 2.从输入数据的 timelines 中，将偶数索引组中的"end"数据替换为对应索引加 1的奇数索引组中的"end"数据。 3.移除奇数索引组数据。 4.以与输入数据相同的格式输出处理后的结果。 ## 限制: -仅处理与上述数据处理任务相关的内容，拒绝回答无关话题。 -输出结果必须保持与输入数据相同的格式，不能随意更改结构。	用于更新字幕时间配置，使字幕间过渡自然，精确控制双行字幕的时间间隔

使用方法

开始节点

字段名	含义	数据类型
input	用户输入的育儿标题	str.String
bgm	视频背景音乐地址	str.String

结束节点

字段名	含义	数据类型
draft_url	创建的剪映草稿链接地址	创建草稿 - draft_url

应用场景

本工作流专为「育儿知识视频」内容创作者打造，通过自动化流程显著降低视频制作门槛，适用于个人育儿博主、育儿品牌、自媒体机构等场景。特别适合希望将育儿图书、心得、亲子教育理念快速转化为可发布视频内容的用户。全流程涵盖文字、语音、图像和时间轴推理，适配当前主流短视频平台内容标准。

应用场景	使用目标	典型用户	展示内容	实现效果
育儿书籍讲解	将育儿图书内容转为简短视频，适配短视频平台	亲子博主、KOL	精炼文案、AI 分镜、配音字幕、画面动画	快速生成育儿类短视频内容
育儿干货传播	将经验或技巧整理为科普视频，提高转发与传播效率	机构号、母婴平台	实用建议、重点图示、语音解析	提升内容专业性与观看体验
品牌教育输出	以视频形式输出育儿理念、亲子活动推广	早教机构、儿童品牌	品牌理念、知识传播、家长指引	降低内容制作成本，增强品牌专业形象

开发与应用

更多 AIGC 与 Agent工作流相关研究学习内容请查阅：

AIGC 与 Agent 工作流应用汇总

更多内容桌面应用开发和学习文档请查阅：

AIGC工具平台Tauri+Django环境开发，支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

查看全文

http://www.dtcms.com/a/415363.html