当前位置: 首页 > news >正文

Coze扣子 - AI生成数字人口播视频

一、数字人介绍

        数字人(Digital Human)是指利⽤先进的数字技术和⼈⼯智能创建的虚拟人 类形象,能够模拟⼈类的外貌、⾏为和情感。数字⼈不仅可以在视觉上表 现出真实的⼈类特征,还可以通过⾃然语⾔处理与⽤户进⾏互动。

        Coze通过全链路AI⽣成技术,实现从⽂案-->语⾳-->数字⼈的⽆缝衔接,打 造“输⼊需求,输出完整数字⼈内容”的⼀站式平台。

        ⽤户仅需输⼊⽂案或关键词,AI⾃动⽣成配套语⾳及数字⼈视频。

二、Coze - 全链路AI数字内容生成引擎

2.1 数据准备

在生成数字人之前,我们需要准备以下数据:

  • ⽂案⽂本:大模型生成

  • ⾳⾊:飞影数字人-声音克隆【见下方3.2章节】

  •  视频模板:录制一段自己(他人)出境的视频,建议嘴型表情丰富生动。

2.2 生成步骤

 2.2.1  基于⼤模型和输⼊的提示词⽣成⽂案(⼝播内容);

2.2.2   基于⽣成⽂案和⾳⾊⽣成⾳频⽂件;

2.2.3  基于⾳频⽂件和准备好的视频素材⽣成最后的⼝播视频;

2.3 coze工作流具体实现

2.3.1 注册登录扣子

扣子

2.3.2 创建智能体

2.3.3 添加工作流

2.3.4 添加大模型节点-文案生成

大模型节点主要用来生成文案

2.3.5 添加插件-飞影数字人

使用飞影数字人插件用来生成数字人视频

节点输入参数说明:

2.3.6  循环查看状态

因为视频生成时间不确定,所以我们需要添加一个循环体,循环去查询视频的状态,只有

2.3.6.1 配置循环体:先在循环体中添加飞影插件inspect_video_creation_status

2.3.6.2 添加选择器节点:如果status=2则继续循环(提交生成视频请求会生成job ID,但生成视频需要一定时间,所以我们需要不断循环查询生成状态)

2.3.6.3  在选择器如果后添加插件:搜索定时器-变量值写10(即每10秒查询一次,防止请求频繁,上限1000次)

2.3.6.4   选择器否则后添加插件:终止循环

2.3.7  结束节点

在循环后接入结束节点-如下图:

三、飞影数字人

3.1  注册登录飞影

飞影数字人 - 官方创作入口

3.2  声音克隆--speaker_id

上传自己的音频文件,即可生成

公共声音库:

公共声音库--》点击任意一个--》更多--》复制声音ID

3.3 hifly_id

相关文章:

  • 多环境开发配置,Spring boot
  • 【leetcode】101. 对称二叉树
  • Mysql 忘记密码后如何修改
  • 长春光博会 | 麒麟信安:构建工业数字化安全基座,赋能智能制造转型升级
  • 零基础学前端-传统前端开发(第四期-JS基础-运算)
  • sqlserver存储过程中入参使用JSON
  • redis穿透、击穿、雪崩
  • linux alignment fault对齐造成设备挂死问题定位梳理
  • 代码训练LeetCode(34)文本左右对齐
  • 行为模式-迭代器模式
  • 基于sample_aiisp再创建一路 h264编码流,和jpg的编码流
  • vue中的三种插槽方式
  • ABP vNext + OpenIddict:自定义 OAuth2/OpenID Connect 认证策略
  • 如何从 Windows 11 或 10 远程访问 Ubuntu 24.04 或 22.04 桌面
  • 使用 C++ 和 OpenCV 构建智能停车场视觉管理系统
  • Linux NFS服务器配置
  • JavaScript数组方法总结
  • 每日Prompt:Steve Winter风格插画
  • PyTorch框架-自动微分模块
  • 将MySQL数据库中所有表和字段编码统一改为utf8mb4_unicode_ci
  • 模板工/深圳seo外包公司
  • 印记室内设计网站/站长工具 站长之家
  • 网站内的搜索怎么做的/百度账号注销
  • 电商开发网站公司/西安百度推广优化托管
  • 做的最少的网站/网站做优化好还是推广好
  • 手机端网站模板下载/seo在线优化排名