当前位置: 首页 > news >正文

TradingAgents:基于多智能体的大型语言模型(LLM)金融交易框架

摘要

论文链接

基于大型语言模型(LLMs)驱动的智能体社群在自动化问题求解领域取得了显著进展。在金融领域,现有研究主要聚焦于单智能体系统处理特定任务或多智能体框架独立收集数据。然而,多智能体系统模拟真实世界交易公司协作动态的潜力尚未得到充分探索。本文提出的 TradingAgents 框架受交易公司启发,设计了一种新型股票交易框架,其中包含由LLMs驱动的、担任不同角色的智能体,如基本面分析师、情绪分析师、技术分析师以及具有不同风险偏好的交易员。该框架包括看涨(Bull)和看跌(Bear)研究员智能体,负责评估市场条件;风险管理团队监控风险敞口;交易员则通过辩论和历史数据整合见解以做出明智决策。通过模拟动态协作的交易环境,该框架旨在提升交易表现。详细的架构设计和大量实验表明,该框架在累计收益率、夏普比率(Sharpe ratio)和最大回撤(maximum drawdown)等指标上显著优于基准模型,凸显了多智能体LLM框架在金融交易中的潜力。代码开源地址:https://github.com/TauricResearch/TradingAgents


1. 引言

基于大型语言模型(LLMs)的自主智能体通过模拟人类流程和工作流,为决策制定提供了变革性方法,显著增强了语言智能体的问题求解能力。这些系统通过为智能体配备工具并促进与其他智能体的协作,将复杂问题分解为可管理的组件(Havrilla et al., 2024; Park et al., 2023; Talebirad and Nadiri, 2023; Tang et al., 2024)。这些自主框架的一个突出应用领域是金融市场——一个高度复杂的系统,受公司基本面、市场情绪、技术指标和宏观经济事件等多种因素影响。

传统算法交易系统通常依赖量化模型,难以全面捕捉多种因素的复杂交互作用。相比之下,LLMs在处理和理解自然语言数据方面表现出色,尤其适用于需要文本理解的任务,如分析新闻文章、财务报告和社交媒体情绪。此外,基于深度学习的交易系统通常可解释性较低,因为它们依赖难以解释的隐藏特征驱动决策。近期,针对金融领域的多智能体LLM框架取得了显著进展,能够创建可解释的AI系统,其决策由证据和透明推理支持(Li et al., 2023a; Wang et al., 2024c; Yu et al., 2024),展示了在金融应用中的潜力。

尽管潜力巨大,但当前语言智能体在金融和交易领域的应用仍面临两大主要局限:

  1. 缺乏真实的组织建模:许多框架未能捕捉智能体之间的复杂交互,无法模拟真实交易公司的结构(Li et al., 2023a; Wang et al., 2024c; Yu et al., 2024)。相反,它们仅关注特定任务的性能,往往脱离了交易中已被证明有效的组织工作流程和人类操作程序。这限制了它们全面复制和利用真实交易实践的能力。

  2. 低效的通信接口:大多数现有系统使用自然语言作为主要通信媒介,通常依赖消息历史或之前决策步骤中未结构化的信息池,从而降低了处理复杂动态任务的有效性。此外,未结构化的信息池缺乏明确指令,迫使智能体之间的逻辑通信和信息交换仅依赖检索,这破坏了数据的关联完整性。

本文通过引入一个克服上述挑战的系统,解决了现有模型的关键局限。首先,我们的框架通过模拟专业交易团队的多智能体决策过程弥合了这一差距。它整合了针对交易不同方面的专业化智能体,其灵感来源于真实交易公司的组织结构。这些智能体包括基本面分析师、情绪/新闻分析师、技术分析师以及具有不同风险偏好的交易员。看涨和看跌辩论者评估市场条件,确保其处于可接受范围内。其次,为增强通信,我们的框架结合了结构化输出(用于控制、清晰性和推理)和自然语言对话(以促进智能体之间的有效辩论和协作)。这种混合方法确保了决策制定的精确性和灵活性。

我们通过在历史金融数据上的实验验证了框架的有效性,并将其性能与多个基准模型进行了比较。综合评估指标包括累计收益率、夏普比率和最大回撤,用于评估其整体有效性。

2. 相关工作

2.1. LLMs作为金融助手

大型语言模型(LLMs)通过在金融数据上进行微调或在金融语料库上进行训练,被应用于金融领域。这提高了模型对金融术语和数据的理解能力,使其能够成为专门的分析支持助手,提供见解和信息检索服务,而非直接执行交易。

金融领域的微调LLMs 微调可增强模型在特定领域的性能。例如,PIXIU(FinMA)(Xie et al., 2023)在136K条金融相关指令上对LLaMA进行了微调;FinGPT(Touvron et al., 2023; Yang et al., 2023b)使用LoRA对LLaMA和ChatGLM等模型进行了微调,使用了约50K个金融特定样本;Instruct-FinGPT(Zhang et al., 2023a)在10K条来自金融情绪分析数据集的指令样本上进行了微调。这些模型在金融分类任务中表现优于其基础版本和其他开源LLMs(如BLOOM和OPT)(Zhang et al., 2022),甚至在某些评估中超越了BloombergGPT(Wu et al., 2023)。然而,在生成任务中,它们的性能与强大的通用模型(如GPT-4)相似或略逊一筹,表明需要更多高质量的领域特定数据集。

从头训练的金融LLMs 在金融特定语料库上从头训练LLMs旨在实现更好的领域适应。例如,BloombergGPT(Wu et al., 2023)、XuanYuan 2.0(Zhang et al., 2023b)和Fin-T5(Lu et al., 2023)在预训练期间结合了公共数据集和金融特定数据。例如,BloombergGPT在通用和金融文本上进行了训练,并使用了专有的Bloomberg数据来增强其在金融基准测试中的性能。这些模型在市场情绪分类和摘要等任务中表现优于通用模型(如BLOOM-176B和T5)。尽管它们可能无法与更大的闭源模型(如GPT-3或PaLM)(Chowdhery et al., 2022)相媲美,但在类似规模的开源模型中提供了具有竞争力的性能,同时并未牺牲通用语言理解能力。

总之,通过微调或从头训练开发的金融特定LLMs在领域特定任务中表现出显著改进,凸显了领域适应的重要性以及使用高质量金融特定数据集进行进一步增强的潜力。

在这里插入图片描述

图1:TradingAgents总体框架组织。I. 分析师团队:四名分析师同时收集相关市场信息。II. 研究团队:团队讨论并评估收集到的数据。III. 交易员:基于研究人员的分析,交易员做出交易决策。IV. 风险管理团队:风险管理者根据当前市场条件评估决策以降低风险。V. 基金经理:基金经理批准并执行交易。

2.2. LLMs作为交易员

LLMs作为交易员智能体,通过分析新闻、财务报告和股票价格等外部数据来做出直接交易决策。提出的架构包括新闻驱动型、推理驱动型和强化学习(RL)驱动型智能体。

新闻驱动型智能体 新闻驱动型架构将股票新闻和宏观经济更新整合到LLMs的提示中,以预测股票价格走势。在金融情绪分析中,对闭源模型(如GPT-3.5、GPT-4)和开源LLMs(如Qwen(Bai et al., 2023)、Baichuan(Yang et al., 2023a))的研究表明,基于情绪得分的简单多空策略是有效的(Lopez-Lira and Tang, 2023)。对FinGPT和OPT等微调LLMs的进一步研究表明,通过领域特定对齐可以改进性能(Kirtac and Germano, 2024; Zhang et al., 2024a)。高级方法包括总结新闻数据并推理其与股票价格的关系(Fatouros et al., 2024a; Wang et al., 2024b)。

推理驱动型智能体 推理驱动型智能体通过反思和辩论等机制增强交易决策。例如,FinMem(Yu et al., 2023)和FinAgent(Zhang et al., 2024b)等反思驱动型智能体使用分层记忆和多模态数据将输入总结为记忆,为决策提供信息,并整合技术指标,在回测中表现出色,同时减轻了幻觉现象(Ji et al., 2023)。辩论驱动型智能体(如异构框架(Xing, 2024)和TradingGPT(Li et al., 2023b)中的智能体)通过不同角色智能体之间的LLMs辩论来增强推理和事实有效性,改进了情绪分类并提高了交易决策的稳健性。

强化学习驱动型智能体 强化学习方法通过回测奖励使LLMs的输出与预期行为对齐。SEP(Koa et al., 2024)使用强化学习结合记忆和反思,根据市场历史数据来优化LLMs的预测。经典的强化学习方法也被用于将LLMs生成的嵌入与股票特征相结合的交易框架中,通过近端策略优化(PPO)等算法进行训练(Ding et al., 2023; Schulman et al., 2017)。

2.3. LLMs作为Alpha挖掘者

LLMs还被用于生成Alpha因子,而非直接做出交易决策。QuantAgent(Wang et al., 2023)通过内循环和外循环架构展示了这一点。在内循环中,一个编写器智能体根据交易员的想法生成脚本,而一个评判器智能体提供反馈。在外循环中,代码在真实市场中进行测试,交易结果增强了评判器智能体。这种方法实现了对最优行为的渐进逼近。

后续研究(如AlphaGPT(Wang et al.)也采用了类似的架构进行Alpha挖掘。这两项研究都展示了LLMs驱动的Alpha挖掘系统的有效性,凸显了它们在通过生成和优化Alpha因子来自动化和加速交易策略开发方面的潜力。

3. TradingAgents:角色专业化

为大型语言模型(LLMs)智能体分配明确、定义清晰的角色及特定目标,能够将复杂目标分解为更小、更易管理的子任务。金融交易是这种复杂性的典型例子,需要整合各种信号、输入和专业知识。在现实世界中,这种管理复杂性的方法体现在依赖专家团队协作并做出高风险决策的交易公司中,凸显了任务的多面性。

在典型的交易公司中,会收集大量数据,包括财务指标、价格变动、交易量、历史表现、经济指标和新闻情绪等。这些数据随后由量化专家(包括数学家、数据科学家和工程师)使用高级工具和算法进行分析,以识别趋势并预测市场走势。

受这种组织结构的启发,TradingAgents在模拟交易公司中定义了七个不同的智能体角色:基本面分析师、情绪分析师、新闻分析师、技术分析师、研究员、交易员和风险管理经理。每个智能体都被分配了特定的名称、角色、目标和一系列约束条件,以及根据其功能量身定制的预定义上下文、技能和工具。例如,情绪分析师配备了网络搜索引擎、Reddit搜索API、X/Twitter搜索工具和情绪分数计算算法等工具,而技术分析师则可以执行代码、计算技术指标并分析交易模式。更具体地说,TradingAgents假设了以下团队。

3.1. 分析师团队

分析师团队(图2)由负责收集和分析各种市场数据以支持交易决策的专业智能体组成。每个智能体都专注于市场分析的特定方面,从而全面了解市场状况。
在这里插入图片描述

图2:TradingAgents分析师团队

基本面分析师智能体:这些智能体通过分析财务报表、收益报告、内部交易和其他相关数据来评估公司基本面。它们评估公司的内在价值,以识别低估或高估的股票,为长期投资潜力提供见解。

情绪分析师智能体:这些智能体处理大量社交媒体帖子、情绪分数和从公开信息及社交媒体活动中得出的内部情绪。它们衡量市场情绪,以预测集体投资者行为在短期内可能如何影响股票价格。

新闻分析师智能体:这些智能体分析新闻文章、政府公告和其他宏观经济指标,以评估市场的宏观经济状态、重大世界事件和公司重大变化。它们识别可能影响市场走势的新闻事件,有助于预测市场动态的突然变化。

技术分析师智能体:这些智能体计算并选择相关的技术指标,如移动平均收敛发散指标(MACD)和相对强弱指数(RSI),这些指标针对特定资产进行了定制。它们分析价格模式和交易量,以预测未来价格走势,帮助确定入场和出场时机。

总体而言,分析师团队综合来自多个来源的数据,提供全面的市场分析。它们结合的见解为研究员团队提供了基础输入,确保在后续决策过程中考虑市场的各个方面。

3.2. 研究员团队

研究员团队(图3)负责批判性地评估分析师团队提供的信息。该团队由采取看涨和看跌观点的智能体组成,它们进行多轮辩论,以评估投资决策的潜在风险和收益。

在这里插入图片描述

图3:TradingAgents研究员团队:看涨观点和看跌观点

看涨研究员:这些智能体通过强调积极指标、增长潜力和有利的市场条件来倡导投资机会。它们构建论点,支持在特定资产中建立或继续持仓。

看跌研究员:相反,这些智能体关注潜在的不利因素、风险和不利的市场信号。它们提供警示性见解,质疑投资策略的可行性,并突出可能的负面结果。

通过这种辩证过程,研究员团队旨在达成对市场状况的平衡理解。它们的深入分析有助于识别最有前景的投资策略,同时预测可能的挑战,从而帮助交易员智能体做出明智的决策。

3.3. 交易员智能体

交易员智能体(图4)负责根据综合评估执行交易决策。它们评估来自分析师和研究人员的建议和见解,同时考虑定量数据和定性见解,以确定最佳交易行动。

图4:TradingAgents的交易员决策过程

TradingAgents交易员的任务包括:

  • 评估分析师和研究人员的建议和见解。
  • 决定交易的时机和规模,以最大化交易回报。
  • 在市场中下达买入或卖出订单。
  • 根据市场变化和新信息调整投资组合配置。

交易员智能体必须在潜在回报和相关风险之间取得平衡,在动态市场环境中做出及时决策。它们的行动直接影响公司的业绩,因此需要高度的精确性和战略思维。

3.4.1 风险管理团队

风险管理团队(图5)监控并控制公司面临的各种市场风险。这些智能体持续评估投资组合的风险状况,确保交易活动保持在预定义的风险参数内,并符合监管要求。

风险管理团队的责任包括:

  • 评估市场波动性、流动性和交易对手风险等因素。
  • 实施风险缓解策略,如设置止损订单或分散持仓。
  • 向交易员智能体提供关于风险敞口的反馈,并建议调整交易策略。
  • 确保整体投资组合符合公司的风险承受能力和投资目标。

通过提供监督和指导,风险管理团队有助于维持公司的财务稳定,并防范不利市场事件。它们在保护资产和确保可持续的长期业绩方面发挥着关键作用。

TradingAgents中的所有智能体都遵循ReAct提示框架(Yao et al., 2023),该框架将推理和行动相结合。环境状态由智能体共享和监控,使它们能够采取与上下文相适应的行动,如进行研究、执行交易、参与辩论或管理风险。这种设计确保了协作、动态的决策过程,反映了现实世界的交易系统。

在这里插入图片描述

图5:TradingAgents风险管理团队和基金经理审批工作流程
# **4. TradingAgents:智能体工作流程**

4.1. 通信协议

大多数现有的基于大型语言模型(LLMs)的智能体框架都使用自然语言作为主要的通信接口,通常通过结构化的消息历史记录或智能体生成的消息集合来实现(Fatouros 等人,2024b;Li 等人,2023a;Yang 等人,2023c,2024)。然而,仅依赖自然语言往往不足以解决需要广泛规划视野的复杂长期任务。在这种情况下,纯粹的自然语言通信可能类似于“电话游戏”——经过多次迭代后,初始信息可能会因上下文长度限制和大量文本(掩盖了关键早期细节)而被遗忘或扭曲(Hong 等人,2024)。为了解决这一局限性,我们从采用结构化通信方法的框架(如 MetaGPT)中汲取灵感。我们的模型引入了一种结构化通信协议来管理智能体之间的交互。通过明确定义每个智能体的状态,我们确保每个角色仅提取或查询必要的信息,对其进行处理,并返回一份完整的报告。这种简化的方法减少了不必要的步骤,降低了消息被篡改的风险,并使交互即使在复杂、长期的任务中也能保持专注和高效。

4.2. 智能体交互类型

与以往主要依赖自然语言对话的多智能体交易框架不同,TradingAgents 中的智能体主要通过结构化文档和图表进行通信。这些文档将智能体的见解封装在简洁、组织良好的报告中,保留了关键内容,同时避免了无关信息。通过利用结构化报告,智能体可以直接从全局状态中查询必要细节,从而消除了冗长对话的需求,这些对话可能会稀释信息、无限期地扩展消息状态,并导致数据丢失。文档类型及其包含的信息如下所述:

  1. 分析师团队:基本面、情绪、新闻和技术分析师将其研究和发现编译成针对其专业领域的简洁分析报告。这些报告包括基于其专业分析的关键指标、见解和建议。

  2. 交易员:交易员会审查和分析分析师的报告,并仔细考虑以产生明确的决策信号。他们还会附上详细的报告,解释其决策的理由和支持证据,这些报告随后会被风险管理团队使用。

智能体仅在智能体之间的对话和辩论中进行自然语言对话。这些简洁、集中的讨论已被证明能促进更深入的推理,并整合不同的观点,从而在复杂、长期的场景中做出更平衡的决策——这种方法对于交易这一复杂环境尤为重要(Du 等人,2023)。这种方法与我们的结构化框架无缝集成,因为对话状态被记录为整体智能体状态中的一个结构化条目。这些场景下的通信类型如下所述:

  1. 研究员团队:每个研究员智能体都会查询全局智能体状态以获取分析师报告,并仔细形成自己的观点。两名研究员代表相反的观点:一名看涨,一名看跌。他们根据辩论协调员智能体的决定,进行 n n n 轮自然语言对话。最后,协调员会审查辩论历史,选择主流观点,并将其记录为通信协议中的一个结构化条目。

  2. 风险管理团队:与研究员团队类似,风险管理团队会查询交易员的决策和随附报告。然后,他们会从风险寻求、中性和风险保守三个角度进行审议,以在风险约束内调整交易计划。他们在协调员智能体的指导下进行 n n n 轮自然语言讨论。

  3. 基金经理:基金经理会审查风险管理团队的讨论,确定适当的风险调整,并在通信协议中更新交易员的决策和报告状态。

4.3. 骨干大型语言模型

为了满足我们框架中任务对多样复杂性和速度的需求,我们根据模型的优势战略性地选择大型语言模型(LLMs)。快速思考模型(如 gpt-4o-mini 和 gpt-4o)能够高效地处理快速、低深度的任务,如摘要、数据检索和将表格数据转换为文本(OpenAI 等人,2024)。相比之下,深度思考模型(如 o1-preview)在推理密集型任务(如决策、基于证据的报告撰写和数据分析)方面表现出色。这些模型利用其架构进行多轮推理,产生逻辑上合理、深入的见解(OpenAI,2024;Wang 等人,2024a;Zhong 等人,2024)。此外,我们还优先考虑具有可靠性和可扩展性的模型,以确保在各种市场条件下都能实现最佳性能。我们还采用辅助专家模型来处理情绪分析等专门任务。

具体来说,所有分析师节点都依赖深度思考模型以确保稳健的分析,而快速思考模型则负责从 API 和工具中高效地检索数据。研究员和交易员使用深度思考模型来产生有价值的见解,并支持做出明智的决策。通过平衡效率与推理深度,这对于有效的交易策略至关重要。

这种实现策略确保了 TradingAgents 可以在不依赖 GPU 的情况下部署,仅需 API 积分即可。它还引入了骨干模型的无缝可交换性,使研究人员能够轻松地将模型替换为未来任何本地托管或可通过 API 访问的替代模型。这种适应性支持集成改进的推理模型或针对特定任务定制的金融微调模型。因此,TradingAgents 具有高度的可扩展性和前瞻性,为任何智能体提供了灵活选择任何骨干模型的能力。

5. 实验

5.1. 模拟设置

我们使用涵盖 2024 年 1 月 1 日至 3 月 29 日的全面回测模拟来评估我们的 TradingAgents 框架,涉及主要科技股,包括苹果、英伟达、微软、Meta 和谷歌。在模拟过程中,TradingAgents 促进了无缝的即插即用策略,便于与任何基准进行直接比较。智能体仅根据每个交易日之前可用的数据做出决策,确保不使用未来数据(消除前瞻性偏差)。基于其分析,TradingAgents 生成买入、卖出或持有资产的交易信号,然后执行这些信号。之后,在继续处理下一天的数据之前,会计算分析指标。

我们将我们的框架与五种既定策略进行基准比较:买入并持有、MACD、KDJ+RSI、ZMR 和 SMA(基准描述见附录 S1.1)。使用四个关键指标来评估性能:累计回报率(CR)、年化回报率(AR)、夏普比率(SR)和最大回撤率(MDD)(公式见附录 S1.2)。

5.2. 回溯交易

为了模拟真实的交易环境,我们使用了一个多资产和多模态的金融数据集,该数据集包含苹果、英伟达、微软、Meta、谷歌等多种股票。我们的多模态数据集整合了历史股价、新闻文章、社交媒体情绪、内部交易、财务报表以及每项资产的 60 个技术指标。数据集包括:

  • 历史股价:从 2024 年 1 月 1 日至 3 月 29 日的开盘价、最高价、最低价、收盘价、成交量和调整后收盘价。
  • 新闻文章:每日新闻更新来自彭博社、雅虎财经等多样化来源,涵盖经济趋势和政府更新。
  • 社交媒体帖子和情绪:来自 Reddit、X/Twitter 等平台的帖子,以及由辅助语言模型计算的帖子情绪分数。
  • 内部情绪和交易:从公开信息中得出的情绪,包括来自 SEDI 和相关公司文件的交易。
  • 财务报表和收益报告:公司提交的季度和年度报告。
  • 公司概况和财务历史:第三方报告的公司概况、目标行业和财务历史描述。
  • 技术指标:为每项资产计算的 60 个标准技术分析指标,包括 MACD、RSI、布林带等。

6. 结果与分析

在本节中,我们将展示实验结果,并将 TradingAgents 的性能与基准模型进行比较分析。

在这里插入图片描述

图 6:$AAPL 股票的 TradingAgents 详细交易历史。绿色/红色箭头分别表示多头/空头头寸,展示了模型随时间变化的交易决策。

6.1.1 性能比较

6.1.1. 累计收益率和年化收益率

表 1 以及图 6、7、S1、S2、S3 和 S4 表明,我们的方法在盈利能力方面(以收益率衡量)优于现有的基于规则的交易基准模型。在三只抽样股票上,TradingAgents 至少实现了 23.21% 的累计收益率和 24.90% 的年化收益率,超出表现最佳的基准模型 6.1%。值得注意的是,在 $AAPL 股票上——由于测试期间市场波动较大,这是一个极具挑战性的案例——传统方法表现不佳,因为它们的模式无法推广到这种情况。相比之下,TradingAgents 在这些不利条件下表现出色,在数月内实现了超过 26% 的收益率。

表 1:使用四种评估指标对所有方法进行性能比较。绿色高亮的结果代表每个模型的最佳统计数据。改进行展示了 TradingAgents 相对于表现最佳基准模型的性能提升。
AAPLGOOGLAMZN
类别 模型CR%↑ ARR%↑SR↑ , 1MDD%↓CR%↑ ARR%↑ SR↑ MDD%↓CR%↑ ARR%↑SR↑ 一MDD%↓
市场买入并持有(B&H)-5.23-5.09-1.2911.907.788.091.3513.0417.117.63.533.80
MACD-1.49-1.48-0.814.536.206.262.311.22
基于规则的 KDJ&RSI2.052.071.641.090.40.40.021.58-0.77-0.76-2.251.08
ZMR0.570.570.170.86-0.580.582.122.34-0.77-0.77-2.450.82
SMA-3.2-2.97-1.723.676.236.432.122.3411.0111.62.223.97
TradingAgents26.6230.58.210.9124.3627.586.391.6923.2124.905.602.11
我们的改进(%)24.5728.436.5716.5819.494.266.107.302.07

在这里插入图片描述

图 7:使用 TradingAgents 的 $AAPL 股票累计收益率。该图展示了我们的模型与基准方法在苹果公司股票分析中的性能比较。

6.1.2. 夏普比率

夏普比率性能凸显了 TradingAgents 在提供卓越风险调整后收益率方面的非凡能力,超越了所有基准模型。这一结果强调了 TradingAgents 在平衡收益率和风险方面的有效性——这是实现可持续和可预测投资增长的关键因素。TradingAgents 始终优于市场基准,如买入并持有策略和基于规则的策略,展示了其适应性。它在最大化收益率的同时保持可控的风险敞口,为多智能体和基于辩论的自动化交易算法奠定了坚实基础。

6.1.3. 最大回撤

虽然基于规则的基准模型在控制风险方面表现出色(从最大回撤得分可以看出),但在获取高收益率方面却表现不佳。这种风险与收益之间的权衡凸显了 TradingAgents 作为平衡方法的优势。尽管通常高收益率与高风险相关联,但 TradingAgents 与许多基准模型相比,保持了相对较低的最大回撤。在风险控制智能体之间的辩论推动下,其有效的风险控制机制确保了最大回撤保持在可控范围内。

+我们基于密集的大语言模型(LLM)和工具使用(11 次 LLM 调用和 20 多次工具调用/预测)对 TradingAgents 进行了 3 个月的基准测试。最高的夏普比率超出了我们预期的经验范围(SR 高于 2 表示非常好,高于 3 表示优秀)。我们导出了 TradingAgents 的决策序列并进行了检查,以确保计算正确性。我们认为,这一异常高的夏普比率是由于在该期间 TradingAgents 几乎没有出现回调现象。我们如实报告了实验结果。未来的工作将优化 LLM 推理和工具使用,以便在有限预算下进行更长时间的回测。

最大回撤未超过 2。这表明 TradingAgents 能够在最大化收益率和有效管理风险之间取得稳健的平衡。

6.1.4. 可解释性

当前用于交易的深度学习方法的一个主要缺点是其架构密集且复杂,往往使交易智能体的决策难以理解。这一根植于人工智能可解释性的挑战,对于在现实金融市场中运作的交易智能体至关重要,因为错误的决策可能导致严重损失。

相比之下,基于大语言模型的智能体框架提供了一个变革性的优势:其决策以自然语言进行传达,增强了可解释性。为了说明这一点,我们在附录中提供了 TradingAgents 单日完整交易日志,展示了其使用的 ReAct 风格提示框架(Yao 等人,2023 年)。每个决策都包含详细的推理、工具使用和思考过程,使交易者能够理解和调试系统。这种透明度使交易者能够微调框架,考虑决策因素,在可解释性方面优于深度学习交易算法。

6.2. 讨论

我们的结果表明,整合多个专业化的大语言模型智能体并促进智能体之间的辩论,显著提高了交易性能。该框架有效地综合了多样化的数据源和专家分析,使交易智能体能够根据特定的风险特征做出明智的决策。包含反思智能体和专门的风险管理团队对于优化策略和降低风险至关重要。因此,该框架在实现卓越收益捕获的同时,保持了强大的风险管理指标,在最大化收益和最小化风险之间取得了最佳平衡。此外,多智能体大语言模型框架基于自然语言的操作确保了高可解释性,使 TradingAgents 在透明度和互操作性方面相较于传统和深度学习方法具有明显优势。

7. 结论

我们介绍了 TradingAgents,这是一个多智能体大语言模型金融交易框架,它逼真地模拟了交易公司环境,其中多个专业化智能体参与智能体辩论和对话。利用大语言模型处理和分析多样化金融数据源的先进能力,该框架能够在通过全面推理和辩论后再采取行动,从而利用多智能体交互来提高性能,做出更明智的交易决策。通过整合具有不同角色和风险特征的智能体,以及反思智能体和专门的风险团队,TradingAgents 相较于基准模型显著提高了交易成果和风险管理能力。此外,这些智能体的协作性质确保了其对不同市场条件的适应性。实验表明,TradingAgents 在累计收益率、夏普比率和其他关键金融指标方面优于传统交易策略和基准模型。未来的工作将侧重于在实时交易环境中部署该框架、扩展智能体角色以及整合实时数据源以进一步提高性能。

附录

S1. TradingAgents补充材料

S1.1. 基准模型

我们将TradingAgents框架与以下几个基准模型进行对比:

买入并持有:将等额资金投资于所有选定的股票,并在整个模拟期间持有。

MACD(指数平滑异同移动平均线):一种趋势跟踪动量策略,基于MACD线与信号线之间的交叉点生成买卖信号。

KDJ和RSI(相对强弱指数):一种动量策略,结合KDJ(随机指标)和RSI(相对强弱指数)指标来识别超买和超卖情况,从而生成交易信号。

? ZMR(零均值回归):一种均值回归交易策略,基于价格相对于零参考线的偏离及随后的回归来生成信号。

SMA(简单移动平均线):一种趋势跟踪策略,基于短期和长期移动平均线的交叉来生成交易信号。

S1.2. 评估指标

为了全面评估TradingAgents框架的性能,我们使用广泛认可的指标来评估与基准方法相比,TradingAgents策略的风险管理、盈利能力和安全性。以下是这些指标的描述:

S1.2.1. 累计收益率(CR)

累计收益率衡量在整个模拟期间产生的总收益率,计算公式为:

C R = ( V e n d − V s t a r t V s t a r t ) × 100 % \mathrm{CR}=\left(\frac{V_{\mathrm{end}}-V_{\mathrm{start}}}{V_{\mathrm{start}}}\right)\times100\% CR=(VstartVendVstart)×100%

其中, V e n d V_{\mathrm{end}} Vend是模拟结束时的投资组合价值, V s t a r t V_{\mathrm{start}} Vstart是初始投资组合价值。

S1.2.2. 年化收益率(AR)

年化收益率将累计收益率按年数进行标准化:

A R = ( ( V e n d V s t a r t ) 1 N − 1 ) × 100 % \mathrm{AR}=\left(\left({\frac{V_{\mathrm{end}}}{V_{\mathrm{start}}}}\right)^{\frac{1}{N}}-1\right)\times100\% AR=((VstartVend)N11)×100%

其中, N N N是模拟的年数。

S1.2.3. 夏普比率(SR)

夏普比率通过比较投资组合相对于无风险利率的超额收益与其波动性来衡量风险调整后的收益:

S R = R ˉ − R f σ \mathrm{SR}=\frac{\bar{R}-R_{f}}{\sigma} SR=σRˉRf

其中, R ˉ \bar{R} Rˉ是投资组合的平均收益率, R f R_{f} Rf是无风险利率(例如,3个月期国债收益率), σ \sigma σ是投资组合收益率的标准差。

S1.2.4. 最大回撤(MDD)

最大回撤衡量投资组合价值从峰值到谷底的最大跌幅:

M D D = max ⁡ t ∈ [ 0 , T ] ( P e a k t − T r o u g h t P e a k t ) × 100 % \mathrm{MDD}=\operatorname*{max}_{t\in[0,T]}\left(\frac{\mathrm{Peak}_{t}-\mathrm{Trough}_{t}}{\mathrm{Peak}_{t}}\right)\times100\% MDD=t[0,T]max(PeaktPeaktTrought)×100%

S1.3. AMZN和GOOGL的累计收益率(CR)和交易历史

我们提供了 A M Z N 和 AMZN和 AMZNGooGL股票的额外图表,以补充本文主体部分讨论的AAPL数据。这些补充图表从多只股票的角度,更全面地展示了我们的交易框架的性能,突出了TradingAgents结果的一致性和稳健性。

在这里插入图片描述

图S1:TradingAgents:AMZN的交易历史。详细交易历史,绿色/红色箭头分别表示做多/做空仓位。

在这里插入图片描述

图S2:TradingAgents:AMZN的累计收益率。显示累计收益率的性能比较。

在这里插入图片描述

图S3:TradingAgents:GOOGL的交易历史。详细交易历史,绿色/红色箭头分别表示做多/做空仓位。

在这里插入图片描述

图S4:TradingAgents:GOOGL的累计收益率。显示累计收益率的性能比较。

通过包含对AMZN和GOOGL的详细分析,我们旨在展示我们的方法在不同市场环境中的通用性,从而强化我们方法的整体有效性和可推广性。

S1.4. TradingAgents工作流程:角色规范与合作

我们全面概述了TradingAgents中协作的各种智能体角色。这些角色包括分析师团队、研究员团队、交易员、风险管理团队和基金经理,每个角色都专注于苹果公司(股票代码:AAPL)截至2024年11月19日(为演示目的而选择的近期日期)交易过程的不同方面。

通过详细阐述每个智能体的职责和交互方式,我们展示了TradingAgents如何确保进行全面分析、做出战略性交易决策以及实施有效的风险管理。这种协作结构不仅提高了系统的整体性能,还增强了TradingAgents的透明度和可解释性,与主体文本中讨论的目标相一致。以下部分提供了具体的角色规范,并说明了这些智能体如何协同工作以实现稳健且可解释的交易结果。

TradingAgents:市场分析师团队 - 苹果(AAPL)[市场分析师]:基于对AAPL近期市场数据和选定技术指标的分析,以下是观察到的趋势的详细且细致的报告:

相关文章:

  • 利用GMT绘制逐月的GRACE趋势堆叠图
  • 技术与情感交织的一生 (八)
  • 如何配置 SQL Server 混合身份验证模式​
  • RabbitMQ概念
  • 项目:Gitlab HSD CI/CD总结
  • 微信原生小程序转uniapp过程及错误总结
  • VS Code 项目中的 .vscode 目录详解
  • SSRF5 Gopher 协议对内网 Web 服务进行 sql 注入 GET 类型和POST类型
  • Jetson上的pytorch国内源下载和torchvision安装教程
  • 基于OpenCv(开源计算机视觉库)的图像旋转匹配
  • A 股无风不起浪!金融吸血科技
  • 28.行为型模式分析对比
  • ONLYOFFICE Jira 集成应用程序 4.0.0 发布,含新的文件格式支持等多个重大更新!
  • CRMEB 平台端 admin 路径修改指南(从配置到部署)
  • 微信小程序-数据加密
  • CAD旋转包围盒_有向包围盒_obb_最小外包矩形——CAD c#二次开发
  • 第十七届全国大学生数学竞赛(数学类)初赛模拟试题
  • 秋招Day14 - MySQL - 存储引擎
  • [计算机网络] 网络的诞生:协议的认知建立
  • Vue.js第一节
  • 中国建设招标网站/百度客服在线客服入口
  • 学网站建设能赚钱吗/网页设计个人主页
  • 做商城网站需要什么/廊坊百度关键词排名平台
  • 做网站毕业设计能过吗/找客户资源的软件
  • 电脑自带做网站的软件/营销 推广
  • 怎样自创广告网站/媒体发稿平台