当前位置: 首页 > news >正文

SECERN AI提出3D生成方法SVAD!单张图像合成超逼真3D Avatar!

SECERN AI提出的3D生成方法SVAD通过视频扩散生成合成训练数据,利用身份保留和图像恢复模块对其进行增强,并利用这些经过优化的数据来训练3DGS虚拟形象。SVAD在新的姿态和视角下保持身份一致性和精细细节方面优于现有最先进(SOTA)的单张图像方法,同时具备实时渲染能力。

相关链接

  • 论文:https://arxiv.org/pdf/2505.05475

  • 代码:https://yc4ny.github.io/SVAD

论文介绍

由于从单一视角重建完整 3D 信息本身就存在困难,因此从单幅图像创建高质量的可动画 3D 人体形象在计算机视觉领域仍然是一项重大挑战。当前的方法面临一个明显的局限性:3D 高斯扩散 (3DGS) 方法虽然能生成高质量的结果,但需要多个视角或视频序列;而视频扩散模型虽然可以从单幅图像生成动画,但在一致性和身份保留方面却存在困难。

我们提出了 SVAD,这是一种新颖的方法,它利用现有技术的互补优势来解决这些局限性。我们的方法通过视频扩散生成合成训练数据,并通过身份保留和图像恢复模块对其进行增强,并利用这些精炼数据来训练 3DGS 形象。综合评估表明,SVAD 在保持身份一致性和精细细节方面优于最先进的 (SOTA) 单幅图像方法,同时还具备实时渲染功能。通过我们的数据增强流程,我们克服了传统 3DGS 方法通常需要的对密集单目或多视角训练数据的依赖。

大量的定量和定性比较表明,我们的方法在多个指标上均优于基线模型。通过有效地结合扩散模型的生成能力与 3DGS 的高质量结果和渲染效率,工作建立了一种基于单幅图像输入生成高保真虚拟形象的新方法。

方法概述

SVAD 的整体流程。 扩散模型从单幅输入图像开始,生成基于姿势的动画,并使用身份保存模块和图像恢复模块进行优化。优化后的输出随后用于训练 3DGS 虚拟人物,从而生成高保真、可动画化的 3D 虚拟人物,并在不同姿势和视角下保持细节的一致性。

SVAD 训练的 3D 虚拟形象。SVAD 仅需一张图像即可生成高质量的 3D 虚拟形象。训练后的虚拟形象可以从任意视角、以任意姿势进行渲染。

SVAD 训练的 3D 虚拟形象。SVAD 仅需一张图像即可生成高质量的 3D 虚拟形象。训练后的虚拟形象可以从任意视角、以任意姿势进行渲染。

实验结果

对人物快照数据集和人类数据集扫描渲染图进行定性评估。SVAD 仅通过单幅图像输入即可生成高质量、可动画化的 3D 虚拟形象。

结论

论文介绍了一种新颖的合成数据生成方法SVAD,该方法用于从单幅图像创建高保真、可动画化的 3D 人体头像。通过结合扩散模型的生成能力和 3D 高斯分布的渲染效率,SVAD 生成的头像能够在不同的姿势和视角下保持一致的身份。通过全面的实验证明了我们的方法达到了 SOTA 的性能。

局限性和未来工作: 该方法面临几个局限性。首先,训练帧的背景分割不准确会产生漂浮伪影。其次,由于视频扩散模型在生成精细合成数据方面的局限性,提出的方法难以处理复杂的服装纹理和宽松的服装。最后,计算需求带来了实际挑战——视频扩散步骤需要大量资源,每个头像生成的完整流程需要 5-6 小时。未来的工作将侧重于改进对不同服装类型的处理并优化计算性能。

相关文章:

  • day27 python 装饰器
  • 低空经济发展现状与前景
  • 使用lvm进行磁盘分区
  • 致敬经典 << KR C >> 之打印输入单词水平直方图和以每行一个单词打印输入 (练习1-12和练习1-13)
  • 基于Spring Boot和Vue的在线考试系统架构设计与实现(源码+论文+部署讲解等)
  • DeerFlow试用
  • 基于单片机的防盗报警器设计与实现
  • RT Thread FinSH(msh)调度逻辑
  • 计算机网络体系结构深度解析:从理论到实践的全面梳理
  • UE中的各种旋转
  • 视频下载器 2.3.9 | 自动识别并下载网页视频,界面简洁无广告带私密空间
  • AIStarter Windows 版本迎来重磅更新!模型插件工作流上线,支持 Ollama / ComfyUI 等多平台本地部署模型统一管理
  • c/c++的opencv的轮廓匹配初识
  • 使用 CodeBuddy 开发一款富交互的屏幕录制与注释分享工具开发纪实
  • A级、B级弱电机房数据中心建设运营汇报方案
  • 学习笔记:黑马程序员JavaWeb开发教程(2025.4.6)
  • 如何防止SQL注入攻击?
  • 使用ts-node搭建typescript运行环境
  • 现货黄金跌破 3160 美元,市场行情剧烈波动​
  • Node.js 实战三:Token 认证、Session 管理与中间件设计实战
  • 德州国资欲退出三东筑工,后者大股东系当地房企东海集团
  • 再现五千多年前“古国时代”:凌家滩遗址博物馆今开馆
  • 俄副外长:俄美两国将举行双边谈判
  • A股三大股指涨跌互现:银行股领涨,两市成交12915亿元
  • 书法需从字外看,书法家、学者吴本清辞世
  • 中美日内瓦经贸会谈联合声明