思维链的 内部机制和简单理解
思维链的 内部机制和简单理解
思维链是对解决问题的步骤进行规划,规划后将作为上下文 在LLM中继续输出。因为Transform都是一个一个单词生成,没新生成一个单词都会将新生的作为上下文。
可以这么理解,但更准确的简化描述是:
思维链是让模型在回答问题时,先“内部生成”或“外显输出”一个“分步思考过程”,再基于这个过程推导出答案。
核心逻辑:
- 不是简单的“先 生成再输入”,而是模型在处理问题时,主动模拟人类拆解问题、逐步推理的思维路径(类似大脑“先想清楚步骤,再得出结论”)。
- 思考过程可以是隐性的(模型内部计算时分步处理),也可以是显性的**(通过提示让模型把思考过程写出来,如“首先…其次…最后…”)。
举个简单例子:
问题:“18÷3×2等于多