mmdetection3d中centerpoint解析
原文发表在知乎,mmdetection3d中centerpoint解析,请移步~
看了大半年的大模型,具身智能相关的多模态模型,这些模型都比较大,动辙几十亿参数量,相关的技术领域感觉也摸索的差不多了,简单回想一下就是transformer,self/cross attention,siglip/clip,peft/lora,huggingface,deepspeed,VLA/action expert/diffusion等等关键词,时间长了真有点审美疲劳,想换换口味,所以最近想着把以前工作中用到的激光雷达目标检测,语义分割类的小模型回顾一下,希望能够温故而知新,顺便在这里记录一下笔记。
下面有很多注释是cursor帮我写的,强烈建议各位程序员将大模型相关编程工具熟练的用起来,在读代码过程中,基本可以做到不用搜索引擎,cursor可以总结的很好。在写代码过程中,cursor可以极大的提升效率,帮我写好代码,对我的要求就是我能看懂,根据自身需要做简单修改即可。最近GPT5也出来了,在AI时代,一方面效率的提升会减少相关岗位的需求,造成失业,但另一方面,个人的效率也可以得到极大的提升,单兵作战能力可以很强。我觉得,个人效率的提升也依赖个人在相关技术领域扎实的基础,而不是网上所说的一个产品经理都可以独立来做技术。我们要争取成为那个背后运用AI的人,而不是被AI替代的人,一点不成熟的思考,与各位共勉!
centerpoint模型是2020年左右发表的模型,核心就是通过将3D物体表示为中心点,在中心点上回归物体的各种属性,例如位置,长宽高,旋转角等。在mmdetection3d框架中有它的实现,我们在项目中也是基于此实现进行的优化修改,所以下面所讲是针对我们的代码进行的,可能与默认官方的实现有少量不同,但应该99%都是一样的。