收录于话题
论文点评
用CV做股票预测最早源自几年前的一篇文章,后面陆续有几篇类似的文章,原理都差不多,将股票K线生成图片,再利用CNN,VIT这种CV模型对股价进行预测,这种方法在我看来跟算命差不多,为了强行模型人类的行为,将正常的矩阵降低精度转为稀疏矩阵,试图用CV模型来模拟人类看线的行为,最早那篇在arxiv上挂了几年,论文结果看起来很好,实际上是用到了未来信息。去年发表的版本不知道有没有修正。
人类根据K线预测股价的行为背后是一个复杂的思考过程,不仅考虑K线本身,还要考虑许多其他因素。所以单纯的利用K线加CV模型无论是原理还是数据上都存在缺陷。这篇论文采用多模态大模型,结合K线图以及文本数据,从数据和模型层面,都更加符合人类的行为。
摘要
本文介绍了一种名为 FinVision 的新型股票市场预测系统,该系统采用多模态多智能体框架,旨在应对金融市场的复杂性和波动性,并有效整合来自不同模态的大量数据。传统深度学习和强化学习方法依赖于大量训练数据,并且需要将不同类型的数据编码为数值格式,这限制了模型的解释性。FinVision 则利用大型语言模型 (LLM) 驱动的智能体来处理和解释多种金融数据形式,例如文本新闻报道、K 线图和交易信号图。
1. 研究背景与动机
金融市场具有高度复杂性和波动性,同时存在多模态数据流,这对交易和市场走势预测等任务提出了巨大挑战。有效的预测和交易系统必须全面整合所有可用信息,并采用复杂的算法设计才能取得优异性能。
传统方法主要依赖规则化交易策略或深度学习、强化学习模型。然而,这些模型面临以下挑战:
-
数据需求量大: 需要大量训练数据。 -
数据简化过度: 将复杂的金融数据类型过度简化为单一变量,例如将文本新闻内容简化为单变量情绪得分,无法捕捉市场动态。 -
解释性不足: 决策过程缺乏可解释性,难以理解模型内部表示和决策机制。
为了应对这些挑战,近年来大型语言模型 (LLM) 取得了显著进展,LLM 驱动的智能体能够执行复杂的、多步骤的决策任务,并提供对思维过程的洞察。这为金融领域的多模态数据整合和分析提供了新的可能性。
2. 相关工作
大型语言模型在自然语言处理领域表现出强大的能力,在金融领域,LLM 被用于情感分析、股票市场预测等任务。然而,早期研究主要采用微调预训练模型或指令微调方法,这些方法需要大量标注数据,且结果缺乏解释性。
近年来,基于 LLM 的智能体通过多步推理和交互,为系统赋予了先进的认知能力。多智能体框架(如 Multi-Agent Debate 和 ReConcile)被广泛采用,通过模拟人类讨论过程,多个 AI 智能体协作解决问题,从而提高推理和决策能力。
在基于 LLM 的智能体领域,FinMem 引入了具有记忆机制的 LLM 交易智能体,但缺乏视觉推理能力。FinAgent 则提出了一个多模态 LLM 交易智能体,配备了市场智能、低级和高级反思模块,以及工具增强的决策过程。然而,FinAgent 需要长达一年的训练时间,导致 API 成本高昂,并且没有考虑到风险管理。
本研究旨在通过应用多模态多智能体 LLM 框架来填补这一空白,该框架训练时间仅为两个月,并将风险管理纳入框架。
3. 方法
FinVision 框架由以下四个主要模块组成:
3.1 摘要模块
摘要模块从输入文本中生成简洁、信息丰富的摘要。具体流程如下:
-
使用语言模型智能体对前一天的新闻语料库进行摘要,提取与特定股票相关的客观事实信息。 -
提示词引导智能体关注可能影响股票短期交易决策的信息。
该模块旨在将大量新闻数据提炼为简洁的摘要,为金融分析提供支持。
3.2 技术分析师模块
技术分析师模块从以图像形式呈现的历史价格数据和指标中提取洞察。具体流程如下:
-
使用视觉推理能力强的语言模型智能体分析过去 60 天的 K 线图和技术指标图像。 -
提示词引导智能体识别可能影响股票未来走势的模式、趋势和潜在信号。
该模块利用 LLM 的视觉推理能力来解释图表和技术指标,补充了摘要模块的文本分析,为交易决策提供全面依据。
3.3 反思模块
反思模块由两个部分组成,用于分析过去的交易表现和信号:
-
第一部分使用语言模型智能体分析过去 L 天的历史交易数据和表现,生成对近期交易表现和决策有效性的洞察。 -
第二部分使用视觉推理能力强的语言模型智能体分析过去 30 天的交易信号图像,生成对交易信号模式和其有效性的反馈。
该模块通过分析历史数据,帮助系统根据历史表现和市场条件调整策略,从而提高决策能力。
3.4 最终决策模块
最终决策模块整合来自上述模块的综合分析,生成交易建议。具体流程如下:
-
使用专门的决策语言模型智能体,根据新闻摘要、技术分析、反思结果以及前一天的组合状态,预测交易动作、确定头寸规模(以组合的百分比表示)并提供详细解释。 -
基于决策智能体的输出,执行交易并计算绩效指标,这些指标将在后续迭代中供反思和决策智能体使用。
该模块确保交易决策能够从所有先前模块的综合分析中受益。
4. 实现细节
FinVision 多智能体系统利用 LangGraph 库实现,其中每个节点对应一个专门的智能体:
-
所有智能体(最终决策智能体除外)都使用 GPT-4o-mini 模型,温度设置为 0.3,以实现统一输出。 -
图表智能体和部分反思智能体利用模型的可视化能力来分析 K 线图、技术指标和交易信号图像。 -
预测智能体使用 o1-mini 模型(专为高级推理任务设计)进行最终交易决策,温度设置为 1。 -
自定义 AgentState 类管理交易系统的状态,封装所有相关的交易信息。
这种模块化设计便于灵活调整或替换智能体,同时保持整个流程中多模态处理的一致性。
5. 实验
5.1 数据收集
本研究考察了 2023 年 4 月 1 日至 2023 年 12 月 29 日期间三只主要科技股:苹果 (AAPL)、亚马逊 (AMZN) 和微软 (MSFT)。数据集包括来自雅虎财经的新闻文章、每日 K 线图、技术指标和反思数据。
-
训练期为 2023 年 4 月 1 日至 2023 年 5 月 31 日。 -
测试期为 2023 年 6 月 1 日至 2023 年 12 月 29 日。 -
技术指标包括简单移动平均线(10 天和 50 天)、相对强弱指数(14 天)、布林带(20 天,2 个标准差)、交易量和移动平均收敛散度 (MACD)。 -
反思数据包括交易信号图像(包含前几天的信号)和过去交易活动的绩效数据。
5.2 评估指标
-
年化收益率 (ARR): 衡量组合增长的年化收益率。 -
夏普比率 (SR): 衡量组合的风险调整后收益。 -
最大回撤 (MDD): 衡量组合价值从历史峰值下降的最大百分比。
5.3 基准模型
-
传统策略: 买入持有 (B&H)、MACD 和 KDJ 与 RSI 过滤器。 -
强化学习模型: 近端策略优化 (PPO) 和深度 Q 网络 (DQN)。 -
基于 LLM 的基准: FinAgent。
6. 主要结果
6.1 模型性能
FinVision 框架在三只主要科技股(AAPL、MSFT 和 AMZN)上表现出色:
-
相对于市场买入持有策略,FinVision 在 AAPL 和 MSFT 上的年化收益率和风险调整后收益均优于市场。 -
AAPL: FinVision 年化收益率 14.79%,夏普比率 1.20;市场年化收益率 13.56%,夏普比率 0.67。 -
MSFT: FinVision 年化收益率 25.57%,夏普比率 1.41;市场年化收益率 22.27%,夏普比率 1.01。 -
AMZN: FinVision 年化收益率 42.14%,夏普比率 1.72,最大回撤 12.09%;市场年化收益率 43.57%,夏普比率 1.37,最大回撤 17.45%。 -
FinVision 在牛市中表现出色,即使在强劲的上升趋势中也能提高风险调整指标,同时保持竞争力回报。 -
与基于强化学习的模型相比,FinVision 表现出更高的性能。 -
例如,在 AAPL 上,FinVision 的年化收益率和夏普比率远高于 PPO 和 DQN。 -
FinVision 始终保持正夏普比率,而强化学习模型则出现负夏普比率,表明 FinVision 具有更好的风险调整后性能。 -
然而,FinVision 的性能不如 FinAgent,这突出了 FinAgent 大量训练数据带来的效率。但是,FinVision 的训练时间要短得多,并且性能良好,表明有进一步调整以提高性能的潜力。
6.2 反思机制的影响
消融研究表明,反思组件对框架的性能做出了重大贡献:
-
与没有反思的版本相比,完整框架在所有股票上的性能指标均有显著提高。 -
该组件使框架能够根据历史表现和市场条件调整策略,从而在不同的股票和市场场景中保持一致的性能。
QuantML星球内有各类丰富的量化资源,包括上百篇论文代码,QuantML-Qlib框架,研报复现项目等,星球群内有许多大佬,包括量化私募创始人,公募jjjl,顶会论文作者,github千星项目作者等,星球人数已经500+,欢迎加入交流
我们的愿景是搭建最全面的量化知识库,无论你希望查找任何量化资料,都能够高效的查找到相关的论文代码以及复现结果,期待您的加入。