llm的ReAct
文章目录
- 背景
- 一、上下文累积机制
背景
想了解一下react的思路
https://github.com/StudyingLover/learn-llm-ReAct
一、上下文累积机制
每次调用 bot(next_prompt) 时:
- 不是替换:next_prompt 不是替换之前的上下文
- 而是追加:新的观察结果被添加到 self.messages 列表中
- 完整历史:LLM 每次都能看到从开始到现在的所有对话
- 状态保持:ReAct 需要记住之前做了什么,才能决定下一步做什么
- 推理链:多步推理需要基于完整的历史信息
- 上下文连贯:避免每次都是"重新开始"
这就是 ReAct 能够进行复杂多步推理的核心机制 - 上下文累积,而不是简单的单次问答。