dp+e2e论文词汇积累自查
文章目录
- 查询query
- 注意力机制
- 密集稠密光栅化表示 intensive dense rasterized representation
- 矢量化表示fully vectorized representation
查询query
query:在 Transformer 结构里,query 本质上是一个“信息槽位(slot)”,它不是直接等于一个目标或地图元素,而是一个可以在注意力机制里“去拉取相关特征”的向量。
agent query
代表“某个潜在交通参与者的槽位”,比如一辆车、一个行人、一个骑车的人。
在 BEV 特征图里,这个 query 会去 attend(注意)到和该 agent 位置、外观、运动相关的特征,把它们聚合成一个高维表示,方便后续预测轨迹。
map query
代表“某个地图元素的槽位”,比如一段车道、一条停止线、一个路口。
它会从 BEV 特征图或其他 map 特征中,把和它对应的地图形状、拓扑、边界信息提取出来,存到这个向量里。
注意力机制
注意力机制本质上是一种特征选择与加权机制。
它模仿人类的“注意”行为——当你看一张图时,你不会把所有区域看得一样仔细,而是根据当前的目标或任务,把注意力集中在最相关的地方。
密集稠密光栅化表示 intensive dense rasterized representation
密集BEV表示 会直接输出整个二维特征图,然后靠卷积+NMS去找目标;矢量化表示 是直接通过 query 得到实例级的特征,不需要全图密集处理。