小鹏自动驾驶的 BEV(鸟瞰图)占用网络在技术架构和实际应用中展现出多项行业领先优势,具体可归纳为以下七个维度:
- 2K 分辨率与 5cm³ 精度:行业首个量产的 2K 纯视觉占用网络,通过超过 200 万个网格重构 3D 空间,建模精度达 5cm³/ 体素,比行业平均水平高 3 倍小鹏汽车。这一精度可清晰识别静态障碍物的每一个细节,例如施工锥桶、井盖等,甚至能区分道路上的裂缝和坑洼。
- 1.8 个足球场级感知范围:感知半径扩展至约 180 米(相当于 1.8 个足球场大小),可提前检测远距离潜在危险,如路口突然窜出的行人或车辆,为决策系统预留更多反应时间小鹏汽车。
- 50 + 目标物实时识别:支持同时追踪车辆、行人、自行车、交通标志等 50 多个目标物,并预测其运动轨迹。例如在路口场景中,系统可精准识别多方向来车的速度和距离,动态调整通行策略。
- 动态障碍物预判能力:通过时间序列 BEV 特征融合(结合过去多帧数据),实现对交通流的预判。例如在高速场景中,系统可提前识别远处车辆的变道意图,主动调整自身车道保持策略小鹏社区。
- 去激光雷达降本增效:BEV 占用网络通过纯视觉方案实现高精度感知,去除激光雷达后,传感器成本降低约 58%(激光雷达曾占小鹏 P5 智驾系统成本的 58%)。以 MONA M03 MAX 为例,其 13.98 万元的定价将高阶智驾下放到大众市场,硬件成本占比从 22% 降至 14%。
- 量产成熟度与规模化验证:XNet 作为国内唯一量产的 BEV 感知架构,已在小鹏 G6、MONA M03 等车型中大规模应用,支持全国 50 城无图城市 NOA(Navigate on Autopilot),覆盖复杂城市路况的泛化能力经过千万公里级数据验证小鹏汽车。
- 毫秒级决策响应:通过 Transformer 架构优化和模型剪枝,XNet 在英伟达 Orin 芯片上的 GPU 利用率从 122% 降至 9%,实现实时处理(例如变道决策仅需 0.03 秒)。在汇入主路等场景中,系统可在毫秒级内完成路径规划和动态避障小鹏社区。
- 端到端全链路优化:从摄像头数据输入到控制指令输出,采用全栈自研的端到端架构,减少中间环节的数据损耗和延迟。例如在暴雨场景中,视觉去雨算法与 BEV 感知协同工作,确保图像识别和 3D 重建的实时性小鹏社区。
- 自动化数据标注与训练:自研的自动标注系统将效率提升 4.5 万倍,仅需 17 天即可完成传统方法需 200 人年的标注任务,并通过云端大模型持续迭代优化小鹏汽车。例如 XNGP 5.3.5 版本通过学习用户习惯,变道效率较上一代提升 40%小鹏社区。
- 用户数据反哺算法:依托百万级用户的真实驾驶数据,系统可快速覆盖长尾场景。例如在识别 “马车”“移动餐车” 等异形目标时,通过增量学习将识别延迟缩短 0.2 秒。
- 摆脱高精地图依赖:通过实时 BEV 感知生成 “动态高精地图”,无需依赖传统高精地图的鲜度和覆盖率,可在全国任意城市道路实现无图城市 NOA。例如在北京西二环的实测中,系统成功应对连续弯道和加塞场景,接管率低于行业平均水平。
- 多传感器融合冗余:在纯视觉方案基础上,部分车型(如 G7 Ultra)仍保留激光雷达作为安全冗余,提升极端场景下的可靠性。例如暴雨中激光雷达穿透率达 85%,与视觉数据融合后可有效识别低反射率目标。
- 复杂场景通过率:城市 NOA 在广州、上海等典型城市的实测中,无保护左转成功率达 92%,窄路会车(3.2 米宽道路)横向误差控制在 ±8cm,优于蔚来、理想等竞品。
- 安全与效率平衡:通过 “场景预加载” 技术,系统可在进入路口前 30 米生成 6 套备选轨迹,兼顾安全性与通行效率。例如在四元桥故障车场景中,系统选择借道公交车道行驶 200 米,决策逻辑接近人类驾驶员。
小鹏 BEV 占用网络通过超精细建模、多目标追踪、纯视觉降本、实时算力优化、数据闭环进化五大核心技术,构建了从感知到决策的全链路优势。其不仅实现了高阶智驾的规模化落地,更通过持续迭代推动行业向 “无图化、泛化能力、端到端” 的终极形态迈进。未来,随着图灵 AI 芯片和 VLA 大模型的部署,小鹏 BEV 网络的能力将进一步提升,为用户带来更安全、更智能的驾驶体验小鹏汽车。