CHAIN-OF-TABLE: 推理链中的演化表格用于表格理解
摘要
利用大语言模型(LLMs)进行基于表格的推理是一种很有前景的方向,可用于处理多种表格理解任务,例如基于表格的问题回答和事实验证。与通用推理相比,基于表格的推理需要从自由形式的问题和半结构化的表格数据中提取底层语义。Chain-of-Thought 及其类似方法以文本上下文的形式引入推理链,但如何在推理链中有效利用表格数据仍是一个未解之题。我们提出 CHAIN-OF-TABLE 框架,在其中表格数据被显式地用作中间思维的代理,嵌入到推理链中。具体来说,我们通过 in-context learning 引导 LLMs 迭代生成操作并更新表格,从而构建一个表格形式的推理链。LLMs 可以根据前一步的结果动态规划下一步操作。表格的这种持续演化过程形成了一条链,展现了解决给定表格问题的推理过程。该链携带了结构化的中间结果信息,从而实现更准确可靠的预测。CHAIN-OF-TABLE 在 WikiTQ、FeTaQA 和 TabFact 基准数据集上,使用多种 LLM 模型均取得了新的 SOTA(state-of-the-art)性能。
1 引言
表格是一种常见的数据格式,在日常生活中被广泛使用(Cafarella et al., 2008)。使用语言模型理解表格数据可以为多个下游任务提供支持,例如基于表格的事实验证(