当前位置: 首页 > news >正文

mmdetection3d中centerpoint解析

原文发表在知乎,mmdetection3d中centerpoint解析,请移步~


看了大半年的大模型,具身智能相关的多模态模型,这些模型都比较大,动辙几十亿参数量,相关的技术领域感觉也摸索的差不多了,简单回想一下就是transformer,self/cross attention,siglip/clip,peft/lora,huggingface,deepspeed,VLA/action expert/diffusion等等关键词,时间长了真有点审美疲劳,想换换口味,所以最近想着把以前工作中用到的激光雷达目标检测,语义分割类的小模型回顾一下,希望能够温故而知新,顺便在这里记录一下笔记。

下面有很多注释是cursor帮我写的,强烈建议各位程序员将大模型相关编程工具熟练的用起来,在读代码过程中,基本可以做到不用搜索引擎,cursor可以总结的很好。在写代码过程中,cursor可以极大的提升效率,帮我写好代码,对我的要求就是我能看懂,根据自身需要做简单修改即可。最近GPT5也出来了,在AI时代,一方面效率的提升会减少相关岗位的需求,造成失业,但另一方面,个人的效率也可以得到极大的提升,单兵作战能力可以很强。我觉得,个人效率的提升也依赖个人在相关技术领域扎实的基础,而不是网上所说的一个产品经理都可以独立来做技术。我们要争取成为那个背后运用AI的人,而不是被AI替代的人,一点不成熟的思考,与各位共勉!

centerpoint模型是2020年左右发表的模型,核心就是通过将3D物体表示为中心点,在中心点上回归物体的各种属性,例如位置,长宽高,旋转角等。在mmdetection3d框架中有它的实现,我们在项目中也是基于此实现进行的优化修改,所以下面所讲是针对我们的代码进行的,可能与默认官方的实现有少量不同,但应该99%都是一样的。

http://www.dtcms.com/a/324677.html

相关文章:

  • FPGA常用资源之IO概述
  • Mybatis学习之动态SQL(八)
  • 使用GLib D-Bus 库创建dbus服务端
  • 安全运维的核心
  • 使用 iFLOW-CLI GitHub Action 和 Qwen3-Coder 给 GitHub 仓库生成幻灯片风格的文档站点
  • 一个基于 Next.js 和 Puppeteer 的 Markdown 转图片服务,支持 Docker 部署和 API 集成
  • AI绘画:生成唐初秦叔宝全身像提示词
  • reuse: for booting my spring project with mvn in Windows command line
  • 理清C语言中内存操作的函数
  • LeetCode_字符串
  • 《C语言》结构体和联合体练习题--1
  • ROS2 学习笔记
  • 基于百度地图API的社区地图展示技术实现
  • 初识STL
  • ADB简介
  • 【redis初阶】--------Set 集合类型
  • Baumer高防护相机如何通过YoloV8深度学习模型实现道路坑洼的检测识别(C#代码UI界面版)
  • Linux操作系统从入门到实战(十六)冯诺依曼体系结构,操作系统与系统调用和库函数概念
  • API 接入终极指南:实时掌握京东商品动态
  • openpnp - 顶部相机如果超过6.5米影响通讯质量,可以加USB3.0信号放大器延长线
  • SpringAI报错:com.github.victools.jsonschema.generator.AnnotationHelper
  • 北京-4年功能测试2年空窗-报培训班学测开-第七十二天
  • Langchain入门:构建一个本地RAG应用
  • 《Go小技巧易错点100例》第三十七篇
  • 深度解析Linux设备树(DTS):设计原理、实现框架与实例分析
  • 阿里云ECS云服务器临时升级带宽方法
  • JP3-4-MyClub后台前端(三)
  • 胖虎的菜品
  • 一劳永逸解决Mayplotlib绘图中中文字体显示乱码的问题
  • 嵌入式软件分层架构的设计原理与实践验证(有限状态机理解及结构体封装理解)