自动驾驶导航信号使用方式调研
1 总结
本文调研在给定导航信号后,如何在端到端架构下,利用导航信息引导轨迹生成。
目前主流的方案可以分为2种。一种是将导航作为“前置引导”深度融入轨迹生成过程(导航前置型);另一种则是将导航作为“后置评价”标准来筛选最优轨迹(导航后置型)。
但是两者并不是割裂的,可以结合使用,导航前置可以缩小搜索范围,节省算力,提高Precision;导航后置可以进一步约束轨迹形态,提高轨迹质量。
2 导航前置型
2.1 导航路径型
- 核心思想:用导航路径信息和自车特征融合作为query,和场景特征(如BEV)交互,从而融合自车状态/场景/导航目标,再解码得到轨迹。
- 优势:显式使用导航路径点信息,引导车辆行驶
- 劣势:模型对导航路径点坐标敏感,在路径点坐标误差大时,车辆可能驶入错误车道
- 代表方案:UniAD
The planning head is a Transformer decoder. We design a planning query to predict the future trajectory. To incorporate the guidance from the route plan, we sample N reference points from the planned route and project them to the ego-vehicle coordinate. These reference points are then encoded by an MLP and added to the ego-vehicle’s state (velocity, acceleration, etc.) embedding to form the final planning query. The planning query then interacts with the occupancy forecast features via cross-attention to be aware of the future dynamic environment.
具体做法:
- 采用Dijskra算法计算到达目标的最短路径,然后沿着该路径均匀采样10个参考点
The planned route is composed of 10 reference points uniformly sampled along the path length.
- 对参考点进行编码,得到route_embedding;然后对自车状态(包含物理尺寸,速度,加速度等)也进行编码,得到ego_state_embedding。这2个同维度的embedding直接相加得到planning query。这一步融合了“我现在是什么状态”和“我将要去哪里”。
…and added to the ego state embedding to form the final planning query.
- 将planning query和OCC(4维:时间,X,Y,Z)进行交互,关注导航路径附近的障碍物/车道线信息,从而输出丰富context的特征,采用prediction head进行解码,就得到了轨迹(6个点,间隔0.5s,未来3s轨迹)。
For the planning task, we set the prediction horizon to 3 seconds with 6 predicted waypoints.
2.2 导航指令型
- 核心思想:用导航指令信息和自车特征进行融合,和场景特征(如向量化场景表征)交互,再解码得到轨迹。
- 优势:将导航视为“意图”,而不是要遵行的路径点,更加鲁棒
- 劣势:没有显式的路径点进行引导,可能存在指令理解偏差
- 代表方案:VAD
具体做法:
- 将导航路径简化为指令。通过分析在导航路径上的关键决策点,生成离散的控制指令(比如左转/右转/执行)。这一步避免依赖精确的导航路径点,从而更加鲁棒。
For each sample, we provide a high-level command from a sparse set of waypoints indicating the intended maneuver, e.g., turn left/right, go straight, or lane change. Specifically, we define 4 discrete commands, i.e., Follow Lane, Go Straight, Turn Left, and Turn Right.
- 将指令映射为对应的指令嵌入。
To incorporate the command, we first define a set of learnable embeddings {c(1), c(2), …, c(K)} for K commands. For a given command k, we obtain its embedding c(k).
- 将指令嵌入和自车状态进行融合,实现上就是相加。
We also introduce a learnable ego query q(ego) to represent the ego vehicle. The initial planning query q(plan) is formed by adding the command embedding to the ego query: q(plan) = q(ego) + c(k).
- 融合后和障碍物/车道线进行cross attention,然后解码得到轨迹。
This command-guided query then serves as the input to the planning decoder, which is a standard Transformer decoder. It iteratively interacts with the instance queries (representing other agents) and map queries (representing lanes) through self-attention and cross-attention layers to refine its representation and finally predict the trajectory.
3 导航后置型
3.1 神经网络型
- 核心思想:通过轨迹生成网络输出多条轨迹,然后采用轨迹评估网络对其进行评分。其中导航信息强约束神经网络。
- 代表公司:Tesla
Tesla AI Day 2021 演讲: 在运动规划环节,Ashok Elluswamy 指出,他们使用神经网络来预测“jerk”(加加速度)、“intervention”(被接管的可能性)等,这些都作为代价函数的一部分。整个评价体系是深度学习驱动的。
注意:特斯拉的导航信息可能在轨迹生成网路中存在弱引导作用。
3.2 规则型
-
核心思想:针对输出的多条轨迹,采用综合了效率/安全等代价的函数进行整体评测。
-
代表公司:华为,小鹏(应该并非最新方案)
-
小鹏:CN113232873A《一种自动驾驶的路径规划方法、装置、设备及存储介质》
-
华为:CN1138055724A -《一种运动规划的方法和装置》
【0065】 “可选地,在S102之后,该方法还包括:对所述多条候选轨迹进行评估,以从所述多条候选轨迹中选择出目标轨迹。”
【0066】 “具体地,所述多个性能指标可以包括:所述候选轨迹的安全性指标、舒适性指标和效率指标中的至少一种。”
【0067】 “例如,所述安全性指标可以用于表征所述车辆按照所述候选轨迹行驶时的碰撞风险。”
【0068】 “例如,所述舒适性指标可以用于表征所述车辆按照所述候选轨迹行驶时的乘客乘坐体验,例如,乘客感受到的冲击、颠簸等。”
【0069】 “例如,所述效率指标可以用于表征所述车辆按照所述候选轨迹行驶时的通行效率,例如,到达目的地所需的时间。”
其中,效率指标中的一项即为“轨迹终点和导航路径的贴合程度”