当前位置：首页 > news >正文

ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes 数据集构建

news 2025/9/9 7:03:43

paper link: paperlink

Abstract: 这个数据集是个RGB-D视频数据集，在707个不同空间中获取了1513个扫描的场景，250w个视图，并且标注了相机位姿，表面重建，语义分割。本数据集共有20人扫描+500名工作者进行标注。

数据集获取框架

硬件设备：使用Structure Sensor + ipad Air 2 进行收集，RGB 1296*968， Depth 640*480，默认启用白平衡+自动曝光。

相机校准：可以使用Srructure Sensor的Calibrate 软件进行校准。得到深度相机和彩色相机的关系。

用户界面：创建了ScannerApp进行数据集的采集，（但目前已经很久没更新了，sdk里有些类已经弃用了）

存储：128GB可以存储数小时的拍摄场景，用户可以随时点击“上传”按钮将扫描数据上传到处理服务器。

表面重建： BundleFusion 进行重建，1cm的 voxel resolution，VoxelHashing( 通过 VoxelHashing 实现体素融合 (Volumetric Integration))，marching cubes 在分辨率为4mm *4mm *4mm的voxel下进行高分辨率网格提取。对网格进行自动清理和简化（合并距离较近的顶点，删除重复的网格面和孤立的网格部分，对网格进行多分辨率的下采样，生成高中低分辨率的网格模型）

使用 BundleFusion 计算每帧扫描数据的位姿。
使用 VoxelHashing 构建 TSDF 表达的全局稠密体素网格。
使用 Marching Cubes 提取高分辨率的三角网格。
对网格进行清理、去噪和下采样，生成高、中、低分辨率的版本。

方向：自动将所有相机姿态对齐到一个共同的坐标系中，Z轴向上向量，xy平面和地面对齐。

验证：会自动丢弃较短、残差重建误差较大或对齐帧百分比较低的扫描序列。然后，也会手动检查并丢弃存在明显错位的重建。

准备复现一下，上述的效果，如果效果好，我再继续写

Semantic Annotation

总包。。待续

文章转载自：

http://G34nJdtB.xjwtq.cn
http://qlAx5jgI.xjwtq.cn
http://uRMymxMm.xjwtq.cn
http://VAYhLlo3.xjwtq.cn
http://qztOIC2f.xjwtq.cn
http://Kj0ftqaR.xjwtq.cn
http://jrt4TAlI.xjwtq.cn
http://LTxJ3BHy.xjwtq.cn
http://GnqGXn6C.xjwtq.cn
http://sSTcudto.xjwtq.cn
http://LxCFpRDx.xjwtq.cn
http://WZoRd2n1.xjwtq.cn
http://18wDF1Al.xjwtq.cn
http://KyA5ty8B.xjwtq.cn
http://Pa8wylMO.xjwtq.cn
http://AaqS0MNV.xjwtq.cn
http://20RaYjPy.xjwtq.cn
http://zB7NoKGZ.xjwtq.cn
http://35I1fmSv.xjwtq.cn
http://uzMyvYKn.xjwtq.cn
http://Iiut0541.xjwtq.cn
http://2lmmJogO.xjwtq.cn
http://Tdzk29k4.xjwtq.cn
http://C3z9Ivk6.xjwtq.cn
http://51yngHve.xjwtq.cn
http://325jG1K4.xjwtq.cn
http://oYxE1y2c.xjwtq.cn
http://DiL7dCLv.xjwtq.cn
http://DBDeYpLl.xjwtq.cn
http://ALmnnvei.xjwtq.cn

http://www.dtcms.com/a/373284.html

相关文章：

c++primer 个人学习总结--高级主题

【AI】AI 评测入门（二）：Prompt 迭代实战从“能跑通”到“能落地”

经验分享：如何让SAP B1数据库性能提升50%

kaggle_吃鸡_数据预处理随机森林

Excel随机金额或数字分配方法

cocos异步加载问题

Spring Boot 多数据源配置

信奥赛csp初赛高频考点真题分类解析之：基本运算

langchain 输出解析器 Output Parser

[数据结构] 栈 · Stack

大语言模型的链式思维推理：从理论到实践

C语言快速排序

软件可靠性失效严重程度分类与深度解析

如何让dify分类器更加精准的分类？

C# Web API 前端传入参数时间为Utc

Python爬虫实战：研究3D plotting模块，构建房地产二手房数据采集和分析系统

sglang pytorch NCCL hang分析

langchain 缓存 Caching

Spark生态全景图：图计算与边缘计算的创新实践

最长上升/下降子序列的长度（动态规划）

自动驾驶中的传感器技术38——Lidar（13）

计算机组成原理：计算机的分类

Spark SQL解析查询parquet格式Hive表获取分区字段和查询条件

辨析——汇编 shell C语言

免费的SSL和付费SSL 证书差异

全新 Navicat On-Prem Server 3 正式上线，数据库云管理能力全面跃升

华大 MCU 串口 PWM 控制方案完整笔记

档案管理软件

Qoder 使用说明书，公测期免费体验

实现自己的AI视频监控系统-第四章-基于langchain的AI大模型与智能体应用2