agentformer论文阅读
参考了这篇博文:https://zhuanlan.zhihu.com/p/512764984
主要有这几个部分
a.map_encoder
i. 对地图进行CNN
b.ContextEncoder
i.time encoder – 将时间信息用transformer和position emb进行融合,加入到特征中
ii.agent-aware attention – self和self attention other和other attention
c.self.future_encoder
i.未来轨迹编码为潜在变量(latent variable)
ii.生成条件分布 q(z|x) 其中:x是未来轨迹,z是潜在变量
iii.使用了transformer decoder
d.self.future_decoder
i. 主要是使用了自回归的方式,自回归就是一遍一遍循环,每次循环前将之前已经有的轨迹放入,所以生成下一个点之前都会考虑之前的轨迹情况
e.self.inference
i. sample会有多个轨迹,也是以自回归的方式。但是目前看来sample的形式只有dropout来区分
自回归的方式生成轨迹