当前位置: 首页 > news >正文

【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔(四)

An evaluation of SVBRDF Prediction from Generative Image
Models for Appearance Modeling of 3D Scenes
输入3D场景的几何和一张参考图像,通过扩散模型和SVBRDF预测器获取多视角的材质maps,这些maps最终合并成场景的纹理地图集,并支持在任意视角、任意光照条件下进行重新渲染。样例图如下:
在当前时代的技术背景下,生成与几何匹配的3D场景,以及根据RGB图像恢复SVBRDF都已经能够做到【1】。结合这两个技术可以使得我们根据一个几何快速生成多个视角的RGB图像,并估计出SVBRDF来。但是这么做仍面临一些问题。第一,从单个视角的图像中预测SVBRDF,会出现和其他视角下预测的SVBRDF不一致的问题,从而产生错误的纹理地图集。第二,根据模型去生成RGB图像时,不同模态下的模型(我理解为视角)也会导致生成的RGB图像在多个视角下不一致,所以也会间接影响到SVBRDF的多视角下的一致性估计。作者采用了一个标准的U-Net和相关的复杂设计解决这一问题。具体怎么解决的,请看下文对文章overview的介绍。
【1】真的吗,挠头。实际上diffuse类型材质的恢复还是可以的,如果带有glossy材质,我认为仍然面临着巨大问题,因为高频的反光、阴影、焦散的效果会和几何直接过分耦合,特别是单图输入且带有强光照时,高光会导致被照射的区域过曝,这部分的像素对恢复该区域的纹理无法提供有效信息,所以glossy材质的场景恢复出来的SVBRDF必然会在maps中表现出不均匀的情况,其中与高光相关的区域会出现明显的burn in artifacts,在重新渲染时,会明显看到光照在同一类型材质上的形状非常不稳定。
SVBRDF texturing pipeline overview。Step1. 先用一个image diffusion model以深度图、轮廓图为条件生成一系列的不同视角的场景图。其中,第一张生成的场景图要求必须是尽可能完整的,意思是尽可能地看到场景全貌,剩下不同视角的场景图在生成时,会进行额外的处理:首先将完整的场景图进行重新投影到不同的视角上,然后再结合不同视角的深度、轮廓图进行条件重绘,投影时因为遮挡出现的孔洞会在重绘的过程中修复。这样能确保生成过程的一致性【2】。Step2. 然后再继续根据每个不同视角的图像估计SVBRDF。Step3.重新渲染。整个流程见下图:
【2】这种重新投影会影响物理上的一致性,因为不同视角下的光照效果是不一样的,重投影无法弥补这一点。作者也意识到了这一点,见4.1节Scope of the study。不过确实可以提供一定的先验,让扩散模型借助自身强大的数据分布来消除这种误差。
作者主要是对现有的一些主流SVBRDF估计方法再神经网络架构选择和输入通道选择上进行了实验,结构设计见下图,虚线部分代表引入的额外的条件。
http://www.dtcms.com/a/273684.html

相关文章:

  • Jenkins 项目类型及配置项
  • FPGA实现SDI转LVDS视频发送,基于GTP+OSERDES2原语架构,提供工程源码和技术支持
  • 资源分享-FPS, 矩阵, 骨骼, 绘制, 自瞄, U3D, UE4逆向辅助实战视频教程
  • 飞算 JavaAI 深度体验:开启 Java 开发智能化新纪元
  • 【拓扑空间】示例及详解4
  • python的社区残障人士服务系统
  • 了解环网式 CAN 转光纤中继器
  • BPE(Byte Pair Encoding)分词算法
  • leetcode-hot100(283.移动零)
  • 政安晨【零基础玩转开源AI项目】ACE-Step —— 迈向音乐生成基础模型的重要一步:AI自动谱曲与自动演唱的免费开源框架部署实践
  • RLHF:人类反馈强化学习 | 对齐AI与人类价值观的核心引擎
  • python实现DoIP基本通信(收发报文)
  • 第十二章:网络编程
  • Typescript -字面量类型
  • Linux的基础I/O
  • 买小屏幕的时候注意避坑
  • [Java 17] 无模版动态生成 PDF:图片嵌入与动态表格渲染实战
  • Linux磁盘限速(Ubuntu24实测)
  • 算法学习笔记:17.蒙特卡洛算法 ——从原理到实战,涵盖 LeetCode 与考研 408 例题
  • cnpm exec v.s. npx
  • C语言常见面试知识点详解:从入门到精通
  • 亿级流量下的缓存架构设计:Redis+Caffeine多级缓存实战
  • Web安全 - 基于 SM2/SM4 的前后端国产加解密方案详解
  • Flutter优缺点
  • Java学习第三十二部分——异常
  • 【爬虫】- 爬虫原理及其入门
  • 【批量文件查找】如何从文件夹中批量搜索所需文件复制到指定的地方,一次性查找多个图片文件并复制的操作步骤和注意事项
  • 基于Python的豆瓣图书数据分析与可视化系统【自动采集、海量数据集、多维度分析、机器学习】
  • 从Excel到PDF一步到位的台签打印解决方案
  • 学习笔记(34):matplotlib绘制图表-房价数据分析与可视化