当前位置: 首页 > wzjs >正文

百拓公司做网站怎么样优秀品牌设计公司

百拓公司做网站怎么样,优秀品牌设计公司,搜索引擎优化的英文缩写是什么,wordpress 迅虎开发一、EchoMimicV2的简单介绍 EchoMimicV2是EchoMimicV1的升级版本,旨在通过音频驱动生成更加自然和流畅的半身人类动画。它能够让用户仅通过简单的音频输入,生成与声音内容相匹配的动画效果,使虚拟人物看起来更加生动。 作者:由蚂蚁…

一、EchoMimicV2的简单介绍

EchoMimicV2是EchoMimicV1的升级版本,旨在通过音频驱动生成更加自然和流畅的半身人类动画。它能够让用户仅通过简单的音频输入,生成与声音内容相匹配的动画效果,使虚拟人物看起来更加生动。

  • 作者:由蚂蚁集团推出的开源数字人项目。
  • github链接:https://github.com/antgroup/echomimic_v2
  • 主要功能
    • 音频驱动的动画生成:利用音频剪辑驱动人物的面部表情和身体动作,实现音频与动画的同步。
    • 半身动画制作:从仅生成头部动画扩展到生成包括上半身的动画。
    • 简化的控制条件:减少动画生成过程中所需的复杂条件,让动画制作更为简便。
    • 手势和表情同步:基于手部姿势序列与音频的结合,生成自然且同步的手势和面部表情。
    • 多语言支持:支持中文和英文驱动,根据语言内容生成相应的动画。
  • 应用场景
    EchoMimicV2适用于虚拟主播、在线教育、娱乐和游戏等多个场景。例如,在在线教育场景中,它可以通过录制好的讲解音频和教师的人物形象,生成与之同步的动态教学视频,为远程教学提供更加生动的视觉体验。

二、EchoMimicV2的环境配置

  1. 工程下载
    git clone https://github.com/antgroup/echomimic_v2
    cd echomimic_v2
    
  2. 虚拟环境安装与激活
    conda create -n echomimic_v2 python=3.10
    conda activate echomimic_v2
    
  3. 环境自动安装
    要求:CUDA >= 11.7, Python == 3.10
    sh linux_setup.sh
    
  4. 下载 ffmpeg-static
    下载链接:https://www.johnvansickle.com/ffmpeg/old-releases/ffmpeg-4.4-amd64-static.tar.xz
    下载后解压,文件层级如下:
    echomimic_v2/
    └── ffmpeg-4.4-amd64-static/├── manpages/├── model/├── ffmpeg├── ffprobe├── GPLv3.txt├── qt-faststart├── readme.txt└── autogen.sh
    
    终端虚拟环境中,设置环境变量。注意该环境变量的设置仅限于当前终端
    export FFMPEG_PATH=./ffmpeg-4.4-amd64-static
    
  5. 模型的下载
    该项目使用过程中需要下载4组模型:EchoMimicV2、sd-vae-ft-mse、sd-image-variations-diffusers、audio_processor。
    可以从huggingface上下载,但需要翻墙,且下载速度慢。可选择modelscope进行下载,由于模型比较大,实际操作建议设置下载路径,下载到数据盘中。下面是我实际设置的路径【/opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2】,自己使用时修改为想要存放的路径即可。
    pip install modelscope
    modelscope download --model BadToBest/EchoMimicV2  --local_dir /opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2
    modelscope download --model zhuzhukeji/sd-vae-ft-mse --local_dir /opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2/sd-vae-ft-mse
    modelscope download --model gqy2468/sd-image-variations-diffusers --local_dir /opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2/sd-image-variations-diffusers
    
    对于 audio_processor的下载,直接访问下载链接即可。
    下载结束后,在路径【/opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2】下的结构如图:
    /opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2/
    ├── denoising_unet.pth
    ├── reference_unet.pth
    ├── motion_module.pth
    ├── pose_encoder.pth
    ├── sd-image-variations-diffusers
    │   └── ...
    ├── sd-vae-ft-mse
    │   └── ...
    └── audio_processor└── tiny.pt
    
    然后在工程的目录下创建文件夹【pretrained_weights】然后创建软连接
    mkdir pretrained_weights
    ln -s /opt/ai-platform/lldataset/240/modelscope/modelscope/hub/echomimi_v2/* pretrained_weights
    ls -l pretrained_weights    ## 查看信息
    
    在这里插入图片描述
    补充,当我们删除【pretrained_weights】,仅仅删除了软连接,不会影响到连接路径下的文件。
  6. 工程的运行
    python app.py
    
    在这里插入图片描述

三、EchoMimicV2的数字人的生成


3.1 生成流程

在这里插入图片描述

  • 1 图片的上传:本地文件上传、现场拍照、剪切板粘贴
  • 2 音频的上传:本地文件上传(格式为wav)、现场录制
  • 3 姿态输入:测试阶段,使用工程默认的姿态。
  • 4 点击视频生成。
    生成视频时,终端如下图,可以看到整个生成过程基本需要22分钟。
    在这里插入图片描述
    生成视频时,查看gpu只用情况如下图,需要月15G显存。
    在这里插入图片描述

3.2 注意事项

在工程路径【./echomimic_v2/assets/halfbody_demo】下,给出了官方示例的图片、音频、动作。

  1. 图片的拍摄
    官方demo图片】可以查看到官方提供的图片尺寸的长宽比为1:1,且人在画幅中所占比例如图。 所以我们提供自己的照片时,也尽量保持和demo图片相似的状态。
    在这里插入图片描述
    实际测试1】个人在实际测试中,上传了一个头肩的图片如下图,生成的效果不忍直视
    在这里插入图片描述
    生成的数字人如下图:
    在这里插入图片描述
    实际测试2】选取张合适的照片
    在这里插入图片描述
    生成的数字人如下图:
    在这里插入图片描述

  2. 音频的上传
    该工程上传的音频,支持的是 wav格式。而实际中更多的格式为MP3。这里提供一个简单的转换的代码

    from pydub import AudioSegmentdef convert_mp3_to_wav(mp3_file_path, wav_file_path):"""将 MP3 文件转换为 WAV 格式:param mp3_file_path: MP3 文件的路径:param wav_file_path: 输出 WAV 文件的路径"""try:# 加载 MP3 文件audio = AudioSegment.from_mp3(mp3_file_path)# 导出为 WAV 格式audio.export(wav_file_path, format="wav")print(f"转换完成,WAV 文件已保存到 {wav_file_path}")except Exception as e:print(f"转换失败:{e}")# 示例用法mp3_file_path = "data/3月25日.MP3"  # 替换为你的 MP3 文件路径wav_file_path = "data/3月25日.wav"   # 替换为你希望保存的 WAV 文件路径convert_mp3_to_wav(mp3_file_path, wav_file_path)
    

四、EchoMimicV2的数字人使用体验

【记录日期】2025.3.25
【使用体验】配置的版本为当前最新的版本。但实际使用效果的体验,只能说测试玩玩,体验下当前开源数字人技术,想要能够使用还差较大距离


文章转载自:

http://ooQDatnC.Lpzqx.cn
http://dAZNYnHc.Lpzqx.cn
http://yaytsRZv.Lpzqx.cn
http://WesTGdSB.Lpzqx.cn
http://RW87c3rL.Lpzqx.cn
http://hryt65JV.Lpzqx.cn
http://PJQKz8kc.Lpzqx.cn
http://2caRoEEW.Lpzqx.cn
http://1mESSvEi.Lpzqx.cn
http://OPBbCfaL.Lpzqx.cn
http://OikK3PoH.Lpzqx.cn
http://EoZavzHW.Lpzqx.cn
http://j4LoHXR9.Lpzqx.cn
http://wbHefWPZ.Lpzqx.cn
http://cAtNddYq.Lpzqx.cn
http://1wlXu4oN.Lpzqx.cn
http://khsUYy7T.Lpzqx.cn
http://K3IQo6vh.Lpzqx.cn
http://eeQOOspC.Lpzqx.cn
http://IrsfIqqo.Lpzqx.cn
http://JAkCIYRc.Lpzqx.cn
http://zSiiwv8x.Lpzqx.cn
http://PwJx9nIu.Lpzqx.cn
http://ZOC8qevY.Lpzqx.cn
http://U1FzS7vL.Lpzqx.cn
http://jJnfty3v.Lpzqx.cn
http://g0rYONAc.Lpzqx.cn
http://Ou6wjOrf.Lpzqx.cn
http://A49nOJPV.Lpzqx.cn
http://0o7ppBoS.Lpzqx.cn
http://www.dtcms.com/wzjs/633285.html

相关文章:

  • 构建一个网站需要什么seo教程搜索引擎优化入门与进阶
  • 清河做网站哪家好谷歌排名优化
  • 廊坊手机模板建站中国网站建设公司排行榜
  • 上海网站定制设计淘宝做网站退款
  • 租用海外服务器的网站有域名吗网站首页文案模板
  • 有哪些网站是做背景图片素材的绵阳网站改版
  • 域名手机网站源码外贸英文网站建设价格
  • 贵阳网站建设制作价格站长工具seo综合查询权重
  • 专业网站设计如何提升网页品质个人承接网站开发
  • 内网网站搭建设网站后台免费模板下载
  • 做网页引用别的网站的视频网站搜索引擎提交入口
  • 美工好的网站网站推广招商
  • 做国外服务器网站网站建设开拓该行业的难点疑
  • 影响网站打开速度的因素联合年检怎么做网站上
  • 淘宝客领券网站怎么做树莓派用来做网站
  • 商城网站建设定制网站建设网站是否有管理员权限
  • 如何做优惠券网站wordpress弹出登陆
  • 网站怎样优化关键词好网页设计模板html代码素材
  • 阿里巴巴网站优化怎么做wordpress实现论坛功能
  • 建网站新科网站建设wordpress轻社区模板
  • 福建省建设职业注册资格管理中心网站网页制作教程软件
  • 做网站建设要学多久东莞市镇街建设项目监理招标网站
  • 织梦的网站关键词站长工具综合查询2020
  • wordpress只显示首页网站seo的关键词排名怎么做的
  • 网站设计分析报告做手机网站和pc如何做
  • 网站跳出率 查询湖人排名最新
  • 重庆专业的网站建设慈溪外贸公司网站
  • 做违规网站景区微网站 建设方案
  • 网页设计是网站建设与管理的内容吗做游戏直播那个网站好
  • 思帽西宁网站建设湖北响应式网站制作