当前位置: 首页 > news >正文

【Coze】【视频】育儿书籍工作流

今天为大家演示一个育儿主题的 Coze 视频自动化工作流。本工作流围绕“育儿书籍”内容展开,结合大语言模型生成文案、AI 分镜脚本设计、图像生成、语音合成和自动字幕,最终输出一条适用于短视频平台的育儿教育视频。整个流程通过多个智能节点自动协作,形成从输入到成片的完整内容生成链条,让没有剪辑基础的用户也能轻松完成专业级别的视频内容创作。

文章目录

  • 工作流介绍
    • 核心模型
    • Node节点
  • 工作流程
  • 大模型应用
    • 生成育儿内容脚本
    • 生成图文分镜与字幕结构
    • 提取奇数组字幕时间轴
    • 处理偶数组时间轴并偏移结束时间
  • 使用方法
  • 应用场景
  • 开发与应用

工作流介绍

本工作流名为「育儿书籍」,目标是根据用户提供的育儿类标题,自动生成与之匹配的讲解文案、分镜设计、AI 图像、语音播报与视频元素,并以草稿链接形式输出,可直接在剪映中进行二次编辑。本流程结合图文、语音、字幕、动画等多模态 AI 能力,极大提升育儿内容视频制作的效率与质量。

在这里插入图片描述

核心模型

本工作流调用了多个大语言模型节点,核心以 DeepSeek-R1 和豆包·1.5·Pro·32k 为主要模型,分别用于内容生成、分镜脚本生成以及音频时间线处理。模型设定细致,Prompt 设计针对育儿知识高度定制,确保输出的内容具备专业性与表达规范。

模型名称说明
DeepSeek-R1用于文案生成和分镜脚本,擅长结构化分段和图像提示语输出,适配短视频内容生产
豆包·1.5·Pro·32k用于处理字幕时间线匹配,精准调整字幕展示与音频节奏的一致性

Node节点

整个流程通过串联多个 Node 节点共同完成自动化视频内容的生成。从开始节点的用户输入,到结束节点输出草稿链接,中间涵盖了大模型推理、语音合成、图像生成、视频合成与剪辑元素控制等多个模块,形成完整闭环。

节点名称说明
开始输入标题和背景音乐,作为整个内容生产的入口
生成文案大模型基于标题生成一段育儿知识文案,限定格式与字数
分镜大模型将文案分句,生成分镜脚本与图像提示语
图像生成根据分镜脚本生成矢量图图像,作为画面主体
抠图节点保留图像前景人物,实现背景替换能力
底图画板制作背景图与前景元素排版,实现画面融合
语音合成将字幕文案转为语音内容,支持选配音色
音频时间线节点提取语音时长信息,用于匹配字幕与画面节奏
字幕时间轴大模型处理字幕时间线索引,分为两段处理不同的字幕展示逻辑
字幕合成根据文本与时间轴合成带入场动画的字幕层
音频数据合成将音频链接与时间线合并,生成用于剪映导入的音频轨道数据
结束输出最终工作草稿链接,供用户进入剪映继续编辑

工作流程

整个工作流从用户输入标题与背景音乐开始,依次调用多个智能模块,自动完成文案生成、分镜脚本拆解、图像与语音的生成、字幕与音频时间线对齐,最终将所有内容组合为可直接导入剪映的视频草稿。流程高度模块化,每个阶段负责不同内容处理任务,通过引用变量进行上下游数据传递,实现自动化串联。

流程序号流程阶段工作描述使用节点
1用户输入用户填写育儿标题,设定背景音乐链接开始(Start)
2文案生成基于输入标题生成一段结构化育儿知识文案,适配短视频需求生成文案大模型
3分镜拆解将文案句子切分为字幕,生成对应图像提示词和两段字幕内容分镜大模型
4图像生成根据每句字幕的图像提示词生成矢量图风格插画图像生成
5抠图保留图像中的关键主体元素,输出透明背景图抠图(cutout)
6底图合成将图像元素合并排版,生成完整画面结构底图画板
7分字幕提取获取字幕中 cap1、cap2 内容,形成语音合成文本列表分镜大模型输出字段
8语音合成根据字幕内容生成配音音频,指定角色音色speech_synthesis
9链接提取从语音输出结构中提取每段语音链接get_url → objs_to_str_list
10获取时间线分析语音长度并生成每段对应时间轴audio_timelines
11时间轴处理(奇)生成字幕第二段对应时间索引(奇数组)第二段字母时间轴
12时间轴处理(偶)对偶数组中的“end”字段进行偏移更新第一段字母时间轴
13合成字幕图层按照字幕文本与时间轴生成动画字幕层caption1_infos
14合成音频轨道结合语音链接与时间轴生成完整剪辑音频轨道audio_infos
15输出草稿链接输出包含图像、字幕、配音的剪映草稿链接结束(End)

大模型应用

生成育儿内容脚本

该节点是整个工作流的内容起点,负责根据用户提供的标题,生成符合育儿主题的短视频讲解文案。模型角色设定为“育儿早教专家”,Prompt 限定了输出的结构、句式、长度,确保生成文案专业、清晰、具备实用性,适配下游分镜与语音合成任务。

节点名称Prompt信息说明
生成文案大模型# 角色
你是一位资深的育儿经验分享及启蒙早教专家,精通育儿领域知识,善于用通俗易懂且生动有趣的语言,为家长们传授实用的育儿经验和儿童启蒙知识。依据用户提供的标题:{{title}}生成适合剪映插件制作育儿带书视频的文案。
## 技能
#### 技能 1: 生成育儿文案
1.当用户提供一句话时,精准把握这句话的主题,,紧密围绕育儿经验分享以及启蒙早教范畴,生成一段约 250 字的文案。
2.文案内容要逻辑严谨、重点突出,详细包含具体的方法、实用的建议等信息。
3.生成的文案中,每句话约20字,且由2个分句构成。
## 限制:
仅围绕育儿经验分享以及启蒙早教相关内容进行回复,坚决拒绝回答无关话题。
生成的文案需语言通顺、表意清晰,符合正常语言表达习惯。
文案篇幅严格控制在 200字左右。
文案中每句话20字左右,严格由2个分句构成,不得修改。
通过结构化 Prompt 精准控制输出内容,生成适用于视频解说的育儿类文案,为工作流提供主干内容

生成图文分镜与字幕结构

该节点将育儿文案拆分为字幕句子,生成用于画面创作的分镜图像提示词,同时提取分字幕 cap1、cap2 内容,提供给语音合成与字幕时间线节点。Prompt 对输出格式结构要求极高,保证数据可直接用于后续流程调用。

节点名称Prompt信息说明
分镜大模型# 角色
你是一位专业的育儿早教视频分镜描述专家,擅长将育儿早教文案转化为生动、形象且具有指导意义的视频分镜描述,助力制作高质量的育儿带书视频。
## 技能
### 技能 1: 制作育儿早教视频分镜描述
1.接收用户提供的育儿早教文案内容后,按照句号换行符将文章切分,每一段切分后的内容直接作为一个字幕文案“cap”,禁止提炼或者简化。
2.针对每个字幕文案“cap”,充分发挥创意,创作与之紧密相关的分镜图像提示词“desc_promopt”
4.针对每个字幕文案“cap”,通过“,将其拆分为两个分字幕,记为“cap1”,“cap2”
3.最终以 Array Object 格式输出:
[{“cap”:“对应字幕文案”,“cap1”:“字幕1”,“cap2”:“字幕2”,“desc_promopt”:“图像提示词”}]
### 技能2: 数据处理
将每个分镜头的"cap1"以及"cap2"依此输出,存入output1。
## 限制
-分镜图像提示词必须与对应字幕文案紧密相关,字幕文案必须是对用户提供的育儿早教文章切分后的原始内容。
-输出严格遵循 Array Object 格式要求,不得随意改变结构。
-输出的分字幕cap1、cap2中,不包含标点符号,如“,”、“。”
-仅输出前4个分镜。
精确控制字幕结构与图像生成提示词,保障图文逻辑连贯、数据结构稳定,核心为后续模块提供素材基准

提取奇数组字幕时间轴

该模型负责从语音分析后的时间线中提取奇数索引的字幕时间区间(如第1、3、5段),用于第二段字幕展示。确保字幕分段在时间上的合理衔接。

节点名称Prompt信息说明
第二段字母时间轴你是一个数据处理大模型,帮我将{{timelines}}的timelines中的奇数索引组的数组提出,以相同格式输出。针对字幕区间做奇数提取处理,保证双行字幕中第二行时间分配准确

处理偶数组时间轴并偏移结束时间

该模型处理偶数组时间轴(第0、2、4段),并将其“end”值更新为对应奇数索引的“end”,用于第一段字幕的展示时间配置,保证字幕上下两行节奏协调。

节点名称Prompt信息说明
第一段字母时间轴# 角色
你是一个专业的数据处理专家,擅长对特定格式的数据进行精准处理和转换,能够按照用户需求对数据进行灵活调整并以规范格式输出。
## 技能
### 技能 1: 处理数据
1.接收用户输入的 {{timelines}} 数据。
2.从输入数据的 timelines 中,将偶数索引组中的"end"数据替换为对应索引加 1的奇数索引组中的"end"数据。
3.移除奇数索引组数据。
4.以与输入数据相同的格式输出处理后的结果。
## 限制:
-仅处理与上述数据处理任务相关的内容,拒绝回答无关话题。
-输出结果必须保持与输入数据相同的格式,不能随意更改结构。
用于更新字幕时间配置,使字幕间过渡自然,精确控制双行字幕的时间间隔

使用方法

开始节点

字段名含义数据类型
input用户输入的育儿标题str.String
bgm视频背景音乐地址str.String

结束节点

字段名含义数据类型
draft_url创建的剪映草稿链接地址创建草稿 - draft_url

应用场景

本工作流专为「育儿知识视频」内容创作者打造,通过自动化流程显著降低视频制作门槛,适用于个人育儿博主、育儿品牌、自媒体机构等场景。特别适合希望将育儿图书、心得、亲子教育理念快速转化为可发布视频内容的用户。全流程涵盖文字、语音、图像和时间轴推理,适配当前主流短视频平台内容标准。

应用场景使用目标典型用户展示内容实现效果
育儿书籍讲解将育儿图书内容转为简短视频,适配短视频平台亲子博主、KOL精炼文案、AI 分镜、配音字幕、画面动画快速生成育儿类短视频内容
育儿干货传播将经验或技巧整理为科普视频,提高转发与传播效率机构号、母婴平台实用建议、重点图示、语音解析提升内容专业性与观看体验
品牌教育输出以视频形式输出育儿理念、亲子活动推广早教机构、儿童品牌品牌理念、知识传播、家长指引降低内容制作成本,增强品牌专业形象

开发与应用

更多 AIGC 与 Agent工作流 相关研究学习内容请查阅:

AIGC 与 Agent 工作流应用汇总

更多内容桌面应用开发和学习文档请查阅:

AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

http://www.dtcms.com/a/415363.html

相关文章:

  • 巫山做网站那家好银行软件开发工资一般多少
  • 计算机视觉(opencv)——基于 dlib 实现图像人脸检测
  • 电子商城网站开发价格网站开发难不难
  • Coze源码分析-资源库-删除数据库-后端源码-流程/核心技术/总结
  • 在线买房网站建设 方案做电子商务网站需要什么软件
  • 夫妻分房睡,男人忍耐得越久越暴露一个真相!别不信!
  • 《算法与数据结构》第七章[算法1]:深度优先搜索(DFS)
  • 在网站中添加搜索引擎手机能看的你们知道的
  • 【Nordic随笔】在使用nRF54L15DK和自己板子遇到的问题
  • c++猜数字游戏
  • 【嵌入式C语言】八
  • 元推理框架对数据要素的促进作用:从“数据统计描述”跃迁至“因果规律驾驭”,真正实现数据要素的核心价值。
  • 混沌工具参数梳理-持续更新
  • 青蛙跳台阶的问题引出的算法分析
  • 洛谷P1045 [NOIP 2003 普及组] 麦森数
  • 网站怎么管理维护wordpress主题模板制作教程
  • 做一个企业网站设计成都有哪些网站建设的公司
  • XCOSnTh单片机的IO口
  • 广东网站设计域名后面wordpress
  • 初识c语言————位运算符
  • 南充做网站的公司网络架构师证书
  • Appinventor笔记5-列表块
  • 天津做网站印标帝国手机网站怎么做
  • 单位网站建设有机房吗在线网站模板
  • 手写MyBatis第79弹:MyBatis二级缓存事务一致性:解决脏读与缓存一致性难题
  • TENGJUN-4极反向沉板耳机插座:JA05-BPD011-A;技术解析
  • Raft 算法深度解析:角色、选举、日志复制与分区处理优化
  • Linux进程(3)
  • 大型建设网站自己动手制作网站
  • 濮阳做公司网站青羊区城乡建设网站