当前位置: 首页 > news >正文

DriveDreamer4D

本文提出DriveDreamer4D框架,通过整合自动驾驶世界模型的先验知识来改进4D驾驶场景表征。我们的方法将自动驾驶世界模型[81]作为生成引擎,合成新轨迹视频数据以增强真实驾驶数据集的密度和训练效果。特别地,我们提出新轨迹生成模块(NTGM)来生成多样化的结构化交通条件,DriveDreamer4D运用这些条件独立调控复杂驾驶环境中前景与背景元素的运动动力学。这些条件会随着车辆机动进行同步的视角投影,确保合成数据符合时空约束。随后提出表亲数据训练策略(CDTS),将时序对齐的真实数据与合成数据融合用于训练4D高斯溅射(4DGS),并通过正则化损失保证感知一致性。

据我们所知,DriveDreamer4D是首个利用视频生成模型提升自动驾驶4D场景重建质量的框架,为变道、加速和减速等场景提供丰富的多视角数据。如图1所示,实验结果表明DriveDreamer4D显著提升了新轨迹视角的生成保真度,与PVG[9]、S3Gaussian[28]和Deformable-GS[74]相比,FID指标分别实现32.1%、46.4%和16.3%的相对提升。同时,该框架增强了前景与背景元素的时空一致性,在NTA-IoU指标上分别提升22.6%、43.5%和15.6%。综合用户研究显示,相较于三个基线模型,DriveDreamer4D的平均胜率超过80%。

本研究的主要贡献包括:
(1)提出首个利用世界模型先验知识推进自动驾驶4D场景重建的框架DriveDreamer4D;
(2)设计NTGM模块自动生成结构化条件,使框架能创建具有复杂机动且保持时空一致性的新轨迹视频,并引入CDTS策略融合时序对齐的真实与合成数据训练4DGS,通过正则化损失保持感知一致性;
(3)通过全面实验验证DriveDreamer4D显著提升新轨迹视角的生成质量及驾驶场景元素的时空一致性。

http://www.dtcms.com/a/358051.html

相关文章:

  • YOLOv11 训练参数全解析:一文掌握 epochs、batch、optimizer 调优技巧
  • MySQL-事务(下)-MySQL事务隔离级别与MVCC
  • 检索优化-混合检索
  • 捡捡java——2、基础07
  • 使用git bash ,出现Can‘t get terminal settings: The handle is invalid. 的解决方法与思路
  • 数字人分身系统源码搭建与定制开发:核心技术解析与实践路径
  • 基于 Spring Boot3 的ZKmall开源商城分层架构实践:打造高效可扩展的 Java 电商系统
  • Kubernetes Dashboard 和 Rancher 功能对比以及详细安装步骤
  • MySQL数据库迁移到KingbaseES完整指南
  • 计算机视觉与深度学习 | ORB-SLAM3算法原理与Matlab复现指南
  • WebStorm无法识别@下的文件,但是可以正常使用
  • Redis 缓存热身(Cache Warm-up):原理、方案与实践
  • Linux命令学习:make,make install,modprobe,lsmod
  • CNB刷新EO缓存和插件化
  • Spring Cache实现简化缓存功能开发
  • 2025年职业发展关键证书分析:提升专业能力的路径选择
  • 漏洞挖掘-信息收集教程
  • CVPR深度学习论文创新合集拆解:模型训练速度算提升
  • 【CUDA进阶】MMA分析Bank Conflict与Swizzle(下)
  • 50.【.NET8 实战--孢子记账--从单体到微服务--转向微服务】--新增功能--二期功能规划
  • 基于 MyBatis-Plus 拦截器实现锁定特殊数据(二)
  • CTE 的主要优势_以MySQL为例
  • 函数返回对象时的临时对象与移动赋值探析——深入理解优化策略
  • Time-MOE添加MLP分类头进行分类任务
  • 智能消防栓闷盖终端:让城市消防管理更智慧高效
  • 开源 C++ QT Widget 开发(八)网络--Http文件下载
  • JavaScript 属性标识符详解
  • 197-200CSS3响应式布局,BFC
  • Ruoyi-vue-plus-5.x第一篇Sa-Token权限认证体系深度解析:1.4 Sa-Token高级特性实现
  • GitCode全方位解析:开源新星的崛起与极致实战指南