当前位置: 首页 > news >正文

ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes 数据集构建

paper link: paperlink

Abstract: 这个数据集是个RGB-D视频数据集,在707个不同空间中获取了1513个扫描的场景,250w个视图,并且标注了相机位姿,表面重建,语义分割。本数据集共有20人扫描+500名工作者进行标注。

数据集获取框架

硬件设备: 使用Structure Sensor + ipad Air 2 进行收集,RGB 1296*968, Depth 640*480,默认启用白平衡+自动曝光。

相机校准:可以使用Srructure Sensor的Calibrate 软件进行校准。得到深度相机和彩色相机的关系。

用户界面:创建了ScannerApp进行数据集的采集,(但目前已经很久没更新了,sdk里有些类已经弃用了)

存储:128GB可以存储数小时的拍摄场景,用户可以随时点击“上传”按钮将扫描数据上传到处理服务器。

表面重建: BundleFusion 进行重建,1cm的 voxel resolution,VoxelHashing( 通过 VoxelHashing 实现体素融合 (Volumetric Integration)),marching cubes 在分辨率为4mm *4mm *4mm的voxel下进行高分辨率网格提取。对网格进行自动清理和简化(合并距离较近的顶点,删除重复的网格面和孤立的网格部分,对网格进行多分辨率的下采样,生成高中低分辨率的网格模型)

  • 使用 BundleFusion 计算每帧扫描数据的位姿。
  • 使用 VoxelHashing 构建 TSDF 表达的全局稠密体素网格。
  • 使用 Marching Cubes 提取高分辨率的三角网格。
  • 对网格进行清理、去噪和下采样,生成高、中、低分辨率的版本。

方向:自动将所有相机姿态对齐到一个共同的坐标系中,Z轴向上向量,xy平面和地面对齐。

验证:会自动丢弃较短、残差重建误差较大或对齐帧百分比较低的扫描序列。然后,也会手动检查并丢弃存在明显错位的重建。

准备复现一下,上述的效果,如果效果好,我再继续写

Semantic Annotation

总包。。待续


文章转载自:

http://G34nJdtB.xjwtq.cn
http://qlAx5jgI.xjwtq.cn
http://uRMymxMm.xjwtq.cn
http://VAYhLlo3.xjwtq.cn
http://qztOIC2f.xjwtq.cn
http://Kj0ftqaR.xjwtq.cn
http://jrt4TAlI.xjwtq.cn
http://LTxJ3BHy.xjwtq.cn
http://GnqGXn6C.xjwtq.cn
http://sSTcudto.xjwtq.cn
http://LxCFpRDx.xjwtq.cn
http://WZoRd2n1.xjwtq.cn
http://18wDF1Al.xjwtq.cn
http://KyA5ty8B.xjwtq.cn
http://Pa8wylMO.xjwtq.cn
http://AaqS0MNV.xjwtq.cn
http://20RaYjPy.xjwtq.cn
http://zB7NoKGZ.xjwtq.cn
http://35I1fmSv.xjwtq.cn
http://uzMyvYKn.xjwtq.cn
http://Iiut0541.xjwtq.cn
http://2lmmJogO.xjwtq.cn
http://Tdzk29k4.xjwtq.cn
http://C3z9Ivk6.xjwtq.cn
http://51yngHve.xjwtq.cn
http://325jG1K4.xjwtq.cn
http://oYxE1y2c.xjwtq.cn
http://DiL7dCLv.xjwtq.cn
http://DBDeYpLl.xjwtq.cn
http://ALmnnvei.xjwtq.cn
http://www.dtcms.com/a/373284.html

相关文章:

  • c++primer 个人学习总结--高级主题
  • 【AI】AI 评测入门(二):Prompt 迭代实战从“能跑通”到“能落地”
  • 经验分享:如何让SAP B1数据库性能提升50%
  • kaggle_吃鸡_数据预处理随机森林
  • Excel随机金额或数字分配方法
  • cocos异步加载问题
  • Spring Boot 多数据源配置
  • 信奥赛csp初赛高频考点真题分类解析之:基本运算
  • langchain 输出解析器 Output Parser
  • [数据结构] 栈 · Stack
  • 大语言模型的链式思维推理:从理论到实践
  • C语言快速排序
  • 软件可靠性失效严重程度分类与深度解析
  • 如何让dify分类器更加精准的分类?
  • C# Web API 前端传入参数时间为Utc
  • Python爬虫实战:研究3D plotting模块,构建房地产二手房数据采集和分析系统
  • sglang pytorch NCCL hang分析
  • langchain 缓存 Caching
  • Spark生态全景图:图计算与边缘计算的创新实践
  • 最长上升/下降子序列的长度(动态规划)
  • 自动驾驶中的传感器技术38——Lidar(13)
  • 计算机组成原理:计算机的分类
  • Spark SQL解析查询parquet格式Hive表获取分区字段和查询条件
  • 辨析——汇编 shell C语言
  • 免费的SSL和付费SSL 证书差异
  • 全新 Navicat On-Prem Server 3 正式上线,数据库云管理能力全面跃升
  • 华大 MCU 串口 PWM 控制方案完整笔记
  • 档案管理软件
  • Qoder 使用说明书,公测期免费体验
  • 实现自己的AI视频监控系统-第四章-基于langchain的AI大模型与智能体应用2