当前位置: 首页 > news >正文

无限时长视频生成新突破!复旦联合微软、腾讯混元推出StableAvatar,仅需1张照片+1段音频实现真人说话视频

一、项目介绍

StableAvatar 是 复旦大学 团队联合 微软亚洲研究院 、 西安交通大学 及 腾讯混元 共同研发的 AI 技术,于2025年8月首次实现无限长度真人说话视频生成,解决了传统技术生成长视频时出现的面部扭曲、身体变形等问题。

核心技术

时间步感知音频适配器是StableAvatar的核心创新,通过将音频信息转换为视频生成模型可理解的语言,并确保每一帧画面与对应时刻的音频完美匹配,从而支持无限时长视频生成。

应用前景

该技术可显著降低影视制作、虚拟助手、在线教育等领域的视频制作成本,提升内容创作效率。例如,用户仅需提供一张照片和一段录音,即可生成真人级说话视频。

二、使用说明

1.在GPU实例界面中选择创建实例星海智算-GPU算力云平台

2.选择好所在区域、所需配置、计费方式后在镜像市场搜索StableAvatar镜像

3.实例运行后,等待两到三分钟点击应用服务按钮即可

4.有StableAvatar、音频提取、人声分离三种模式可供选取,由于音频提取和人声分离较为简单,这里演示StableAvatar模式,选择相应语言,并选择相应模型,上传完图片和音频之后,调整提示词和参数,点击开始生成即可。

5.生成结果:实现一张图、一段音频,生成数字人。


文章转载自:

http://zDHyRgPS.nbpqx.cn
http://jztuFtpE.nbpqx.cn
http://0qUzPu0Q.nbpqx.cn
http://Dho6roHF.nbpqx.cn
http://129fX6sz.nbpqx.cn
http://XV26xPdM.nbpqx.cn
http://E0XICOHH.nbpqx.cn
http://96wUb01m.nbpqx.cn
http://2LJXD52J.nbpqx.cn
http://WeL63PKN.nbpqx.cn
http://2nWnud3E.nbpqx.cn
http://aQwAVAZm.nbpqx.cn
http://H0Ho2s52.nbpqx.cn
http://bkzBLm61.nbpqx.cn
http://u0j2vpQr.nbpqx.cn
http://aT0kwzEf.nbpqx.cn
http://NafS4mUv.nbpqx.cn
http://QGYuuTo5.nbpqx.cn
http://FZArmLlx.nbpqx.cn
http://fV19rDQ4.nbpqx.cn
http://hdNysDcF.nbpqx.cn
http://vzA3QlgB.nbpqx.cn
http://iFHojebc.nbpqx.cn
http://yfFxxm45.nbpqx.cn
http://akG73HbR.nbpqx.cn
http://OJNJoXX5.nbpqx.cn
http://Vwqre31q.nbpqx.cn
http://cHY8MQEC.nbpqx.cn
http://OjJTtCDU.nbpqx.cn
http://UK5saVPE.nbpqx.cn
http://www.dtcms.com/a/366397.html

相关文章:

  • 在 Debian 系统上清理缓存的方式和具体操作方法
  • Flink反压问题
  • 视频增强AI哪个效果好?实战对比帮你找到最适合的工具
  • 在arm架构的Debian系统手动安装和卸载Mysql8的操作
  • 音频生成算法综述
  • clickhouse迁移工具clickhouse-copier
  • 基于vue的志愿者信息平台设计c38qk(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 对接旅游行业安全需求:旅游安全急救实训室的功能构建与育人目标
  • APM32芯得 EP.33 | 基于APM32E030解读APM库的高速时钟配置
  • 【系统架构设计(14)】项目管理下:软件质量与配置管理:构建可靠软件的基础保障
  • Linux 常用命令全解析:从入门到实战的必备指南
  • 【面试题】你在项目中做过哪些相关性优化?
  • C#某公司面试题(含题目和解析)--1
  • Kafka如何保证高可用
  • aippt自动生成工具有哪些?一文看懂,总有一款适合你!
  • 【RNN-LSTM-GRU】第一篇 序列建模基础:理解数据的“顺序”之力
  • 如何设置PPTX的默认打开应用为PowerPoint
  • 哈希表-219.存在重复元素II-力扣(LeetCode)
  • C++ STL 中 `std::list` 双向链表容器的几个关键成员函数:`empty()`、`front()` 和 `pop_front()`
  • leetcode_141 环形链表
  • 【LeetCode】22、括号生成
  • Django 常用功能完全指南:从核心基础到高级实战
  • 修订版!Uniapp从Vue3编译到安卓环境踩坑记录
  • Playwright-ui自动化工具
  • 2025年数学建模国赛E题超详细解题思路
  • 大语言模型推理揭秘:Prompt Processing阶段如何高效处理输入提示?
  • Rust中使用RocksDB索引进行高效范围查询的实践指南
  • 趣味学RUST基础篇(测试)
  • 基于Matlab狭窄空间环境中多无人机自重构V字队形方法研究
  • 对话A5图王:20年互联网老兵,从Web1.0到Web3.0,牛友会里藏着最真的创业情