当前位置: 首页 > news >正文

论文解读:Drivestudio——OmniRe: Omni Urban Scene Reconstruction

基础信息

标题:OmniRe: Omni Urban Scene Reconstruction

链接:https://arxiv.org/abs/2408.16760

代码:https://github.com/ziyc/drivestudio

项目主页https://ziyc.github.io/omnire/

被引量:16(2023)


论文质量:较高

参考价值:较高


论文内容

介绍了一个名为OmniRe的系统,用于从设备日志中高效创建高保真动态真实世界场景的数字孪生。该系统能够对城市场景中的各种动态物体(包括车辆、行人、骑自行车者等)进行准确的、全长度的重建,并支持模拟(约60hz),包括有人参与的场景,如行人行为模拟和人车交互。OmniRe在Waymo数据集上的广泛评估表明,其在定量和定性方面均大幅优于现有的最先进方法,并且该方法在5个额外的流行驾驶数据集上展示了其在常见城市场景中的泛化能力。

数字孪生尚无业界公认的标准定义,其中一个定义是指在数字世界建立一个与真实世界系统的运行性能完全一致,且可实现实时仿真的仿真模型。

主要贡献

研究问题与价值

研究了如何高效地从设备日志中创建高保真动态真实世界场景的数字孪生,特别是针对城市场景中的多样化动态物体(如车辆、行人、骑自行车者等)。现有方法在处理这些动态物体时存在局限性,尤其是在模拟人类行为和人车交互方面。文章指出,尽管神经辐射场(NeRFs)和高斯泼溅(Gaussian Splatting)等技术在重建3D场景方面取得了进展,但它们主要关注车辆,缺乏对所有动态前景的全面框架,这限制了它们在下游应用(如模拟人类行为)中的使用。

文章提出了一种全面的框架,能够对城市场景中的各种动态物体进行准确的重建,包括车辆、行人和骑自行车者等。这种全面性使得OmniRe能够支持复杂的模拟任务,如行人行为模拟和人车交互,这是现有方法所不具备的。

  1. 高保真重建:OmniRe通过构建基于3D高斯绘制的动态神经场景图,实现了对动态场景的高保真重建。这种方法能够处理刚性物体(如车辆),并使用刚体变换表示随时间的运动,而且对于所有的刚体节点,优化他们每一帧的位姿,还能处理非刚性物体(如行人),用SMPL模型来对人体进行重建,通过人体关节和姿态进行建模,并且能够实现关节级控制,这对于模拟人类行为至关重要。

SMPL模型是指一种用于三维人体建模的方法,全称是Skinned Multi-Person Linear Model。它是一种基于顶点偏移的参数化人体模型,能够精确表示自然人体姿势中的各种身体形状和动作。SMPL模型由23个关节点和1个根节点构成,含有6890个顶点和144种面片,能够通过调整形状参数和姿态参数来实现对人体的精确建模。

  1. 技术贡献:提出了一种新颖的人体姿态估计流程,专门用于处理多摄像头设置和严重野外遮挡的驾驶日志。这种流程能够准确提取SMPL参数,从而实现对人类运动的精确建模。此外,OmniRe还通过实验验证了其在城市驾驶场景中的泛化能力,并在多个流行驾驶数据集上展示了其有效性。

  2. OmniRe在Waymo数据集上的广泛评估表明,其方法不仅在定量和定性方面优于现有方法,而且在5个额外的流行驾驶数据集上展示了良好的泛化能力。这表明OmniRe能够适应不同的城市场景,具有广泛的应用前景。例如,OmniRe在处理极端动态遮挡、夜间场景和恶劣天气条件下的表现尤为突出,证明了其在各种复杂场景中的鲁棒性。

方法关键

  1. 动态场景高斯建图

场景图由以下节点组成:

(1) 表示远离自车的远景天空的SkyNode。使用单独的可优化环境贴图来适应观察方向的天空颜色,将天空图像Csky与由组成的高斯渲染的图像C_G合成,我们获得最终渲染为:C = C_G + (1 - O_G) C_{\text{sky}},其中O_G表示高斯的不透明度掩码。

(2) 表示静态场景背景的Background Node,如建筑物、道路和植被。背景节点由一组静态高斯$$G^{bg}$$表示。这些高斯是通过累积LiDAR点和某论文中的策略随机生成的附加点来初始化的。

(3) 一组表示如汽车或卡车等刚性可移动对象的Rigid Nodes。表示车

相关文章:

  • css3基于伸缩盒模型生成一个小案例
  • 鸿蒙接入flutter环境变量配置windows-命令行或者手动配置-到项目的创建-运行demo项目
  • MATLAB Simulink在Autosar和非Autosar工程下的开发流程
  • AI智能分析网关V4助力工厂/工地/车间/能源矿山场景玩手机行为精准检测与安全生产智能化监管
  • Python(1) 做一个随机数的游戏
  • LeetCode 648 单词替换题解
  • 第九届御网杯网络安全大赛初赛WP
  • [Java][Leetcode middle] 45. 跳跃游戏 II
  • 开发与AI融合的Windsurf编辑器
  • Linux学习心得问题整理(一)
  • MySQL——数据类型表的约束
  • 设计模式深度解析:AI大模型下的策略模式与模板方法模式对比解析
  • Kafka Go客户端--Sarama
  • OpenCV进阶操作:风格迁移以及DNN模块解析
  • 基于STM32、HAL库的TDA7719TR音频接口芯片驱动程序设计
  • 基于Win在VSCode部署运行OpenVINO模型
  • MySQL 8.0 OCP 1Z0-908 题目解析(2)
  • 基于STM32、HAL库的ADAU1701JSTZ音频接口芯片驱动程序设计
  • Windows部署LatentSync唇形同步(字节跳动北京交通大学联合开源)
  • 仓颉Magic亮相GOSIM AI Paris 2025:掀起开源AI框架新热潮
  • 我的科学观|梅彦昌:科技创新关键在于能否跑得快,而不是有没有钱
  • 济南市委副秘书长吕英伟已任历下区领导
  • 世界期待中美对话合作带来更多确定性和稳定性
  • 男子发寻母视频被警方批评教育,律师:发寻亲信息是正当行为
  • 中国潜水救捞行业协会发布《呵护潜水员职业健康安全宣言》
  • 水豚“豆包”出逃已40天,扬州茱萸湾景区追加悬赏