怎么理解自动驾驶技术中的agent
一、核心概念定义
术语 | 定义 | 典型示例 |
---|---|---|
Agent | 具有动态性与交互性的道路参与者,其行为需被预测并影响自车决策。 | 行驶车辆、行人、自行车、临时停止的出租车 |
静态障碍物 | 固定不动且无自主行为的物体,仅需几何避让,无需行为预测。 | 路灯、路沿、建筑物、消防栓 |
静止物体 | 当前速度为零的物体,可能是临时停止的 Agent 或真正的静态障碍物(需二次判断)。 | 等红灯的车辆(Agent)、倒塌的树(静态障碍物) |
🔍 关键区别:
- 动态性:Agent 会运动或具有运动潜力;静态障碍物永久固定。
- 交互性:Agent 的行为与自车存在博弈;静态障碍物只需绕行。
二、感知模块(Perception)的输出与处理
1. Detection(检测)阶段
- 输出:场景中所有可识别物体的边界框 + 类别标签(包括 Agent、静态障碍物、背景物体)。
- 不区分动态/静态:检测仅识别物体存在性(如“车辆”“行人”“电线杆”)。
2. 关键后续处理
步骤 | 功能 | 区分 Agent 的关键作用 |
---|---|---|
分类 | 确认物体类别(车/人/树等) | 初步筛选:车辆、行人等属于候选 Agent。 |
跟踪(Tracking) | 跨帧关联目标,计算运动状态(速度、轨迹) | 核心依据:动态物体 → Agent;静止物体 → 静态障碍物或临时 Agent。 |
地图融合 | 结合高精地图过滤已知静态物体 | 排除固定障碍物(如交通牌)。 |
✅ 结论
Detection 输出包含所有物体,但只有动态且需交互的目标被归类为 Agent。
三、跟踪模块(Tracking)的输出逻辑
1. Tracking 的核心任务
- 输入:Detection 输出的所有物体。
- 处理:
- 为每个物体分配 唯一ID,关联连续帧中的同一目标。
- 估计 运动状态(速度、加速度、轨迹历史)。
- 输出:所有被跟踪物体的列表(含动态 Agent、静态障碍物、临时静止物体)。
2. Tracking 输出 ≠ Agent
跟踪目标类型 | 是否属于 Agent? | 原因 |
---|---|---|
持续运动的车辆/行人 | ✅ 是 | 动态且需交互预测。 |
临时静止的车辆 | ✅ 是 | 可能随时启动(如等红灯),需行为预测。 |
永久静态物体(如路灯) | ❌ 否 | 无运动能力,仅需避让几何位置。 |
误检背景(如飘动的塑料袋) | ❌ 否 | 通常在后续模块过滤。 |
✅ 结论
Tracking 输出包含所有被跟踪目标,但仅动态且有交互需求的物体被系统标记为 Agent。
四、系统级处理流程
graph TDA[Detection] -->|“所有物体”| B[Tracking]B -->|“跟踪目标列表”| C{动态性分析}C -->|动态物体| D[Agent]C -->|静态物体| E[静态障碍物]D -->|送入预测模块| F[行为预测 + 交互决策]E -->|送入规划模块| G[几何路径避让]
为何如此设计?
- 资源优化:预测模块只需处理关键 Agent(减少算力消耗)。
- 功能分离:
- Agent → 预测意图 + 博弈交互(如让行、超车)。
- 静态障碍物 → 几何避障(如绕开路桩)。
- 状态切换处理:跟踪模块持续监控“静止物体”,避免漏跟临时停止的 Agent(如车辆突然启动)。
五、总结:Agent 的最终判定条件
一个物体被系统认定为 Agent,需同时满足:
- 动态性:当前运动或具有潜在运动能力(如停着的车)。
- 交互性:其行为可能影响自车安全或效率(如行人可能横穿马路)。
- 跟踪持续性:在多帧中被稳定跟踪并排除误检。
静态障碍物:只需满足 → 位置固定 + 无行为意图。
六、实际案例
场景 | Detection 输出 | Tracking 输出 | 最终类型 | 处理逻辑 |
---|---|---|---|---|
行驶中的摩托车 | “自行车” | ID=103, 速度=30km/h | Agent | 预测轨迹,决策是否超车。 |
路边消防栓 | “柱状物体” | ID=205, 速度=0 | 静态障碍物 | 规划避让路径。 |
临时停靠的快递车 | “车辆” | ID=301, 速度=0 | Agent | 预测开车门或起步,准备刹车。 |
被风吹倒的广告牌 | “大型物体” | ID=404, 速度=0 | 静态障碍物 | 标记为临时障碍物并绕行。 |
结语
在自动驾驶系统中,Agent 与静态障碍物的区分本质是动态交互性与静态确定性的分离。感知与跟踪模块通过层层过滤,将原始检测目标转化为两类不同处理对象:
- Agent → 行为预测与博弈决策的核心;
- 静态障碍物 → 环境结构中需避让的几何实体。
这种分层处理机制,是实现安全、高效、拟人化自动驾驶的关键基础。