“FinVision: A Multi-Agent Framework for Stock Market Prediction”
金融市场的复杂性和波动性使得交易和市场预测面临挑战,需综合多种信息并采用先进算法。传统深度学习和强化学习方法对数据量要求高,限制了解释性。
本研究提出了一种专为金融交易设计的多模态多代理系统,利用多个专门的LLM代理处理文本新闻、蜡烛图和交易信号图等数据。表现优于传统规则和强化学习模型。
论文地址:https://arxiv.org/pdf/2411.08899
摘要
金融交易整合多种数据形式,传统深度学习和强化学习方法对数据量要求高,限制了解释性。LLM(大语言模型)代理在处理多模态数据和复杂决策任务上表现出色,能提供思维过程的洞察。本研究提出了一种专为金融交易设计的多模态多代理系统,利用多个专门的LLM代理处理文本新闻、蜡烛图和交易信号图等数据。反思模块分析历史交易信号及其结果,提升未来交易决策能力。消融研究表明,视觉反思模块对增强决策能力至关重要。
简介
金融市场的复杂性和波动性使得交易和市场预测面临挑战,需综合多种信息并采用先进算法。交易系统已从基于规则的策略发展到深度学习和强化学习模型,但仍面临数据需求、数据类型简化和决策过程缺乏可解释性的问题。整合多样化金融数据(如文本新闻和历史价格数据)存在挑战,过度简化可能导致信息损失或误解。
大型语言模型(LLMs)的进步使其能够执行复杂的多步骤决策任务,研究者通过将任务分解为子任务来提升解决能力。采用链式思维(CoT)提示增强了模型的可解释性,便于理解决策过程并优化模型设计。多模态LLMs(如GPT-4V)结合文本和视觉数据,提升了在金融领域的应用潜力。LLM在股票预测中的应用逐渐演变,现有研究主要集中在预训练和指令调优方法。
本研究基于FinAgent框架,缩短训练时间并引入按投资组合百分比预测交易头寸的决策过程,以改善风险管理和资本配置。框架包含四个主要模块:摘要模块、技术分析模块、反思模块、预测模块。
-
摘要模块将大量新闻数据浓缩为简明摘要,突出影响股票交易的事实信息。
-
技术分析模块利用LLM的视觉推理能力分析蜡烛图和技术指标,为次日交易策略提供解读。
-
反思模块评估过去交易的短期和中期表现,并生成交易信号图表和效果分析。
-
预测代理整合各模块信息,预测交易行动、确定仓位大小,并提供决策解释。奖励代理根据预测输出执行交易并计算绩效指标,反思和预测代理在后续迭代中使用这些指标。
在对苹果、亚马逊和微软的七个月评估中,框架表现优于传统规则和强化学习模型,但仍低于FinAgent基准。交易信号分析显示多种数据源的综合整合,反思模块对整体表现贡献显著。
相关工作
大型语言模型(LLMs)在自然语言处理(NLP)任务中表现出色,尤其在金融领域的情感分析中,通过指令微调超越了以往的模型。研究较少探讨LLMs在股票市场预测和次日交易中的应用,尽管使用历史价格和新闻进行预测,但因金融数据的多模态特性和多步推理需求,LLMs初期表现不佳。一项研究分析了GPT-4和ChatGPT提取的情感与股价变动的相关性;另一项研究则对LLaMA模型进行了指令微调以进行股票市场预测。微调需要大量标注数据,且结果缺乏可解释性,给模型的改进带来挑战。
LLM代理通过多步骤推理和互动提升了系统的认知能力,采用多代理框架(如MAD和ReConcile)增强推理和事实性。FinMem引入了带记忆机制的LLM交易代理,但缺乏视觉推理能力。FinAgent是一个多模态LLM交易代理,具备市场智能和反思模块,但训练周期长达一年,且未考虑风险管理。本研究旨在通过多模态多代理LLM框架,缩短训练周期至两个月,并将风险管理纳入交易任务中。
方法
摘要模块
摘要模块从新闻文本中生成特定股票的简明信息摘要。公式描述了如何利用前一天的新闻文本生成摘要。?? 表示指定股票,?? 是新闻文本输入,?? 1 ?? ?? ? 1 是生成的摘要。该方法用于金融分析,提炼前一天的新闻信息。
技术分析模块
技术分析模块从历史价格数据和技术指标图像中提取洞察。通过视觉能力的语言模型代理分析特定股票??的蜡烛图和技术指标图像。生成的技术分析????????1基于过去60天的数据,帮助识别模式、趋势和潜在信号。该模块补充了文本分析模块,为交易决策提供全面依据。
反思模块
反思模块分为两个部分,分析过去的交易表现和信号。
第一部分:通过语言模型代理(agent reflection1)生成过去L天的交易数据分析,提供短期和中期的交易表现洞察。
第二部分:通过视觉代理(agent reflection2)分析过去30天的交易信号的可视化数据,提供信号模式及其有效性的反馈。
最终决策模块
最终决策模块通过整合新闻摘要、技术分析和反思结果生成交易建议。决策过程公式化为:
涉及多个变量和模块的输出。输出包括推荐行动(买、卖、持有)、仓位大小(1到10)和详细解释。该方法确保交易决策受益于所有模块的综合分析。
实现细节
多智能体系统使用LangGraph库构建有向图结构,每个节点对应一个专门的智能体。StateGraph类定义智能体间的依赖关系并管理信息流。除最终决策智能体外,其他智能体使用GPT-4o-mini模型,温度设置为0.3,确保输出一致性。Chart Agent和部分Reflection Agent利用模型的视觉能力分析蜡烛图、技术指标和交易信号图像。Prediction Agent使用o1-mini模型进行最终交易决策,温度设置为1。自定义AgentState类管理交易系统状态,封装相关交易信息。模块化设计便于智能体的调优或替换,同时保持多模态处理的一致性。
实验
数据收集
研究对象。苹果(AAPL)、亚马逊(AMZN)、微软(MSFT)三大科技股。
时间范围。2023年4月1日至12月29日,分为两个月的训练期(4月1日至5月31日)和七个月的测试期(6月1日至12月29日)。
数据集来源。Yahoo Finance的新闻文章、每日蜡烛图、技术指标和反射数据。
使用的技术指标。10日和50日简单移动平均线、14日相对强弱指数、20日布林带(2个标准差)、交易量、移动平均收敛发散指标(MACD)。
反射数据包括。交易信号图像和历史交易表现数据。
训练期的目的。生成足够的反射数据,为后续测试阶段提供强有力的历史输入。
评估指标
年化收益率(ARR)。衡量投资组合年增长。
夏普比率(SR)。评估风险调整后的收益,越高表示表现越好。
最大回撤(MDD)。衡量投资组合从历史高点的最大百分比下降,公式涉及累计收益和历史最高值。
基线模型
传统策略。实施三种策略:买入持有(B&H)、移动平均收敛发散(MACD)、KDJ与RSI过滤器结合。
强化学习模型。使用两种算法:近端策略优化(PPO)和深度Q网络(DQN)。
LLM基准。比较FinAgent,一个多模态基础代理,使用强化学习框架训练。
结果
框架表现。FinVision框架在AAPL、MSFT和AMZN三大科技股中表现优异,尤其在强劲牛市中展现出其交易策略的有效性。
比较表现:
-
AAPL:ARR 14.79%,Sharpe比率1.20,超越市场的13.56% ARR和0.67 Sharpe比率。
-
MSFT:ARR 25.57%,Sharpe比率1.41,优于市场的22.27% ARR和1.01 Sharpe比率。
-
AMZN:ARR 42.14%,虽略低于市场43.57% ARR,但Sharpe比率1.72和最大回撤12.09%均优于市场。
牛市表现。在牛市中,买入持有策略表现良好,框架的风险调整指标提升了其价值,显示出在强趋势市场中的风险管理能力。
优于RL模型。框架在所有评估股票中均优于基于强化学习的模型(如PPO和DQN),显示出更好的风险调整表现。
反思机制影响。消融研究表明,反思组件显著提升了框架性能,能够根据历史表现和市场条件调整策略。
多代理框架提供交易决策过程的详细可视化,展示了整合多种信息源的能力。2023年12月19日的例子中,技术指标显示苹果股票的看涨趋势,预测代理结合新闻信号和历史交易信号做出更细致的决策,结果准确。该框架的可解释性增强了决策过程的透明度,并优化了性能。框架能够建议头寸大小,增加风险管理层面,提供具体的投资比例建议,帮助控制风险暴露。结合可解释决策和动态头寸调整,框架在复杂市场条件下展现出适应性和风险意识的交易策略潜力。
总结
本文提出了一个多模态多智能体框架用于金融交易,表现优于传统规则和强化学习模型。框架采用风险控制投资方法,实现竞争性回报并有效管理风险。反思组件是框架性能的关键,支持基于历史结果和市场条件的自适应学习。
未来研究将通过强化学习技术扩展框架,特别是利用动态精细化过程中的语言提示来调整策略,以提高适应快速变化市场的能力。
我们致力于提供优质的AI服务,涵盖人工智能、数据分析、深度学习、机器学习、计算机视觉、自然语言处理、语音处理等领域。如有相关需求,请私信与我们联系。
请加微信“LingDuTech163”,或公众号后台私信“联系方式”。
关注【灵度智能】公众号,获取更多AI资讯。