当前位置: 首页 > news >正文

网站后台系统的易用性网站域名实名认证

网站后台系统的易用性,网站域名实名认证,建设一个网站需要多长时间,wordpress没显示已发布EchoMimic 是一个由阿里巴巴蚂蚁集团开发的开源AI 数字人项目,通过可编辑地标调节实现逼真的音频驱动肖像动画,它能够将静态图像转化为具有动态语音和表情的数字人像。 今天咱们来复现下,看看有哪些坑,再看看数字人效果如何。 先…

EchoMimic 是一个由阿里巴巴蚂蚁集团开发的开源AI 数字人项目,通过可编辑地标调节实现逼真的音频驱动肖像动画,它能够将静态图像转化为具有动态语音和表情的数字人像。

今天咱们来复现下,看看有哪些坑,再看看数字人效果如何。

先来看下本地环境,跑起来项目后会有如下输出。

图片

1、clone代码

      git clone https://github.com/antgroup/echomimic_v2  cd echomimic_v2

    2、conda创建环境。首先要安装conda,后台回复"conda"可获取Ubuntu安装包,直接安装即可。

        conda create -n echomimic python=3.10  conda activate echomimic

      3、开始安装环境,根据自己实际的cuda版本安装,附pytorch地址:https://pytorch.ac.cn/get-started/previous-versions/。我的cuda版本是12.4

          pip install pip -U  pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 xformers==0.0.28.post3 --index-url https://download.pytorch.org/whl/cu124  pip install torchao --index-url https://download.pytorch.org/whl/nightly/cu124  pip install -r requirements.txt  pip install --no-deps facenet_pytorch==2.6.0

        整个过程在安装requirements.txt时出点问题,因为当时安装不上clip了,我就先把这句注释了,手动下载,传导服务器上面安装了下。

        图片

        图片

        安装整个过程还比较顺利。

        图片

        4、下载ffmpeg-static

          export FFMPEG_PATH=/path/to/ffmpeg-4.4-amd64-static

          5、整个安装过程结束了就,我就试着运行了下

            python app.py

            毫无意外报错了,如图:

            图片

            这是gradio版本太低了,需要升级下

              pip install --upgrade gradio

              6、升级好后接着再跑下试试

              图片

              打开如图:

              图片

              用自带的形象试试。点击生成视频报错了。

              图片

              没有模型文件,哦忘记下载模型文件了。下载模型文件,按照下图目录放进去。

              图片

              然后再启动试下。

              7、点击生成视频,等待了七分钟左右终于成功了。显存使用情况如下:

              图片

              生成视频效果还是很不错的。

              图片

              8、这既然支持自定义数字人,我自己上传个人物图像试试。

              效果不是很理想,有时候没上传带手的人物形象,但是还生成了个手,有点不忍直视。我就不贴视频了。

              这就是我的整个的搭建的过程。后台回复“EchoMimic”获取项目代码,模型文件,ffmpeg-static下载链接

              大家在搭建或者使用的过程中有遇到什么问题,欢迎大家关注留言。大家一起来讨论学习。

              http://www.dtcms.com/a/565634.html

              相关文章:

            • 国产化Word处理控件Spire.Doc教程:如何使用 Java 将 TXT 文本转换为 Excel 表格
            • 结构化类型VS标称类型:TS类型系统全解析
            • Git笔记之Git下载、拉取项目、Webstorm更新Git项目报错识别不到git
            • Linux之arm SMMUv3 控制器注册过程分析(7)
            • 临沧市住房和城乡建设网站企业咨询管理公司简介
            • 13-卷积神经网络(CNN):探讨CNN在图像处理中的应用和优势
            • Spring Boot3零基础教程,StreamAPI 的基本用法,笔记99
            • seo关键词排名优化教程seo网站架构设计
            • 宿州做企业网站公司咸阳网站制作公司
            • 一个空间建多个网站的方法wordpress显示用户列表
            • Java中的数组(续)
            • 2025年内蒙古自治区职业院校技能大赛高职组 “信息安全管理与评估”竞赛样题(一)
            • 嵌入式Linux电源管理实战 --深入解析CPU调频governor原理与优化
            • PostIn零基础学习 - 如何快速设计并分享接口文档
            • 我想建立一个网站不知道怎么做啊小白怎么做网站
            • OpenLCA生命周期评估模型构建与分析
            • AR眼镜赋能船舶巡检:打造智能化运维新方案
            • 从“被动监控”到“主动预警”:EasyGBS远程视频监控方案助力企业高效安全运营
            • 《A Bilateral CFAR Algorithm for Ship Detection in SAR Images》译读笔记
            • 网站图标 psd门户网站的优点
            • 中国交通建设集团网站单页主题 wordpress
            • 网站建设 年终总结沈阳市建设工程安全监督站网站
            • 2.1.2.CSS3
            • 线性代数 - 线性方程组的 LU 分解解法
            • 学习中小牢骚1
            • 游戏网站怎么做seo网站怎么做下载网页代码吗
            • 太原网站设计制作网站开发网站说明怎么写
            • 告别乱码:OpenCV 中文路径(Unicode)读写的解决方案
            • 41_AI智能体核心业务之意图识别Agent:智能对话系统的决策大脑
            • 大数据毕业设计项目推荐 基于大数据的广西药店数据可视化分析系统 1.65w条数据【大数据毕业设计项目选题】