任务型Agent架构简介
一、前言
在信贷风控领域下,以加工出具有“高效能”和“高可解释性”的策略为目标,其中:策略加工过程会涉及不同场景下的要素切分和融合,切分的阈值和融合的规则通常采用运筹算法在满足特定的约束条件下来求最优解,求最优解的过程需要人工不断地去重跑运筹算法,并“人肉串联”从切分到融合整个流程。策略加工后随着时间推移,策略会面临要素迭代滞后、性能衰退等问题,从而缺乏系统性优化机制。围绕着这两个问题设计出两个 Agent 来解决相应的问题:
-
要素融合 Agent:提供“轻智能版”(workflow模式)和“智能版”(基于 Reflection 的自主规划模式)两种模式对要素进行切分和融合。
-
策略优化 Agent:采用 ReAct 模式对规则进行分析,分析出规则存在的性能瓶颈并做出优化。
二、Agent 模式选择
1. 常规 Agent 模式
a. LLM 自主规划类
-
ReAct:reason(推理)-> action(行动) -> observation(观察)。
-
Plan and Execute:规划与执行,先规划好完整步骤,再分步执行。
-
Reflection:反思驱动。大模型通过自我反思修正当前的结论。由此衍生出的常用模式(即本项目采用的模式)如下:
Step 1:思考当前需求,并初步生成执行计划