ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha

近年来,量化交易在处理海量金融数据方面取得了显著进展,催生了复杂的交易策略。其中,Alpha因子的挖掘是关键领域之一,即发现和优化能够预测资产回报的信号(alpha signals)。本文提出了一种新颖的框架,利用大语言模型(LLM)的探索能力,结合多智能体体系结构,自动化地在量化投资中寻找策略。

摘要

尽管深度学习在金融交易中取得了重大进展,但现有模型常常面临不稳定性高不确定性,限制了其实用性。我们提出了一个新颖的量化股票投资框架,集成了LLM生成多样化的Alpha因子,并采用多智能体方法动态评估市场状况。该框架包括三个模块:

  1. 1. Alpha因子挖掘模块:利用LLM从多模态金融数据中挖掘Alpha因子,确保对市场动态的全面理解。
  2. 2. 多智能体评估模块:使用集成学习构建具有不同风险偏好的交易智能体池,通过更广泛的市场分析提高策略性能。
  3. 3. 动态权重分配模块:基于实时市场状况选择并分配最相关的智能体,创建自适应上下文感知的综合Alpha公式。

在中国股市的广泛实验表明,该框架在多个 金融指标 上显著优于最先进的基线方法。结果强调了结合LLM生成的Alpha因子与多智能体架构以实现卓越交易性能和稳定性的有效性。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图1:量化交易公司的业务流程

引言

根据Grand View Research的调查,2023年全球 另类数据市场 价值72亿美元,预计从2023年到2030年的 复合年增长率(CAGR) 为52.1% [1]。这代表了一个复杂且动态的生态系统,吸引了数百万投资者寻求有利可图的投资机会。

量化交易的最新进展显著增强了分析和处理大量金融数据的能力,导致了复杂交易策略的发展。量化交易的关键领域之一是Alpha挖掘,即发现和优化能够预测资产回报的信号或Alpha因子 [2]。

尤金·法玛(Eugene Fama)提出了有效市场假说(Efficient Market Hypothesis,EMH),认为股票价格将反映所有市场可用信息 [3]。然而,随着市场状况的变化,相同的信息可能对市场产生不同的影响,一些研究人员也发现了信息不对称的情况 [4]。

我们发现当前Alpha挖掘过程面临三大挑战:

  1. 1. 传统方法的僵化性:传统的识别金融领域Alpha因子的方法通常依赖于启发式规则和金融专业知识。这些基于规则的方法通常只能在特定市场条件下表现良好,缺乏适应各种市场动态的灵活性
  2. 2. 数据多样性和整合:最近的研究探索了应用机器学习技术从多样化的数据源中挖掘Alpha因子,如经济新闻社交媒体趋势历史价格变动 [5-6]。
  3. 3. 适应市场变异性市场动态是流动的,在一种环境中表现良好的策略可能在另一种环境中失败。近年来,许多研究人员提出使用深度学习方法预测市场 [7]并形成他们的策略 [8]。在不同市场条件下有效地挖掘和利用Alpha因子仍然是一个重大挑战。

为了解决这些挑战,我们提出了一个新颖的框架,利用LLM的探索能力进行Alpha挖掘和策略优化。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码

问题表述

本节介绍了用于在量化交易中生成Alpha因子和策略的综合框架。我们首先定义了Alpha因子的计算方法,然后介绍了利用LLM和多智能体系统动态挖掘和选择Alpha因子的框架。

2.1 Alpha因子与策略

假设在下一个交易期中有只股票。对于每个交易期,每只股票可以计算出多个Alpha因子。每只股票最初可能有个初始特征,如成交量和价格等。我们使用值来表示不同类别股票的潜在价值。然后,从每个类别中根据回测结果和当前市场状况选择表现最佳的种子Alpha作为我们最终策略的原材料。总体Alpha策略可以表示为:

2.2 种子Alpha的挖掘与选择

在量化交易中,传统启发式基于规则的Alpha挖掘方法的静态性质存在显著局限性,特别是在快速变化的市场条件下 [10]。这些方法常常无法动态适应,导致性能不佳。此外,对结构化金融数据的依赖,如历史价格和基本指标,忽略了可从替代数据源(如经济新闻和社交媒体趋势)中获得的丰富见解。

为了解决这些挑战,我们提出了一个新颖的框架,利用LLM和多智能体系统进行种子Alpha的挖掘和选择。我们的方法将最先进的机器学习技术与金融原理相结合,创建了一个能够动态调整市场变化并在个种子Alpha类别中优化Alpha策略的强大系统。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图2:(A)种子阿尔法的示例。(B)其等价的表达式树。(C)在一个示例时间序列上逐步计算该种子阿尔法的过程。

2.3 种子Alpha的公式化

我们的框架为LLM生成的种子Alpha设定了规则,确保它们表示为将各种运算符与原始金融特征相结合的数学表达式。这些运算符包括用于单日数据的基本函数,如加法(“+”)和对数(“log”),称为横截面运算符(cross-section operators)。此外,还有需要跨多天数据的时间序列运算符(time-series operators)。例如,“”是一个时间序列运算符,比较当前收盘价与7个周期前14期**简单移动平均值(SMA)**的值,指示价格相对于过去平均值的上升或下降趋势,如图2所示。

方法论

本节详细介绍了用于构建和优化量化交易中Alpha策略的综合框架。它包括三个关键组件:种子Alpha工厂多智能体决策过程权重优化方法

3.1 框架概览

我们的框架分为三个主要部分:

  1. 1. 种子Alpha工厂:使用LLM过滤和分类多模态文档,构建种子Alpha工厂。LLM处理海量且多样化的数据集,确保了全面且稳健的种子Alpha集合,按金融Alpha挖掘研究建立的独立Alpha类别分类。
  2. 2. 多智能体多模态市场评估:种子Alpha因子经过严格的回测,以评估其性能。这包括在不同市场条件下的回测,以确定哪些因子能够在不同市场条件下获得超额回报。我们采用多智能体方法来处理市场条件的变异性。
  3. 3. 动态策略优化:在评估和回测阶段之后,权重分配层根据当前市场状况为每个种子Alpha分配最优权重。这个动态加权机制确保策略适应不断变化的市场环境,优化整体性能。

3.2 LLM过滤与分类

我们的LLM过滤与分类过程利用LLM的摘要分类能力,加速了对最新Alpha挖掘研究的理解,并为进一步发展建立了我们的种子Alpha工厂。

在本研究中,我们使用了定制版本的ChatGPT,命名为“Alpha Grail”,执行LLM过滤和分类任务。Alpha Grail的主要功能是通过处理与Alpha相关的研究文档,协助量化研究人员构建种子Alpha工厂。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图3:策略生成过程概述(CS表示信心分数;RP表示风险偏好)。
ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
表1:多模态数据类型

3.3 多模态与多智能体评估Alpha集合

我们的多智能体系统由具有不同风险偏好和投资策略的各种智能体组成。这些智能体分析多模态数据,并根据各自的标准评估种子Alpha。每个智能体执行风险偏好分析,根据其预定义的风险参数评估种子Alpha。这确保了评估涵盖广泛的风险视角。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
算法1:基于类别的阿尔法选择

3.4 最优权重Alpha策略

为了优化选定种子Alpha的权重,我们采用了深度神经网络(DNN) 将Alpha值拟合到未来收益。网络架构包括三层:输入层、隐藏层和输出层。输入层接受从历史收盘价得出的每日Alpha计算作为输入特征。隐藏层配备了十个节点,利用ReLU激活函数引入非线性,增强模型的学习能力 [13]。输出层由单个节点组成,预测未来收益。

在代码实现中,我们首先导入必要的库和模块:

备注:论文PDF和完整代码复现请加入知识星球获取。

from ...... import *
from ...... import *
import ......
import pandas as pd
import modules.alpha_formula_reader as afr
from tqdm import tqdm

rqdatac.init()

然后定义一个函数,将结果保存到Excel文件中,便于后续分析:

def result_to_excel(result, path="result.xlsx"):
    writer = pd.ExcelWriter(path)
    result["rank_ic_analysis"].summary().to_excel(writer, "ic-summary")
    result["quantile"].quantile_returns.to_excel(writer, "各期分组累计收益率序列")
    result["quantile"].quantile_turnover.to_excel(writer, "各期分组换手率")
    result["return"].factor_returns.to_excel(writer, "因子累计收益率")
    result["return"].max_drawdown().to_excel(writer, "最大回撤值")
    result["return"].std().to_excel(writer, "因子收益率波动率")
    writer.close()

接下来,定义所需的因子和公式。例如,定义收盘价、最低价、成交量等因子:

CLOSE = Factor("close")
LOW = Factor("low")
VOLUME = Factor("volume")
HIGH = Factor("high")

备注:论文PDF和完整代码复现请加入知识星球获取。

定义收益率和市值等:

RETURNS = (CLOSE - REF(CLOSE, 1)) / REF(CLOSE, 1)
MARKET_CAP = Factor("market_cap")
CAP = Factor("market_cap")
VWAP = Factor("total_turnover") / Factor("volume")
RSI = Factor("RSI10")
BOLL_UP = Factor("BOLL_UP")
BOLL_DOWN = Factor("BOLL_DOWN")
EPS = Factor("basic_eps")
EBITDA = Factor("ebitda_ttm")

定义价格动量、成交量动量和RSI动量等Alpha因子:

PriceMomentum = CLOSE - DELAY(CLOSE, 14)
VolumeMomentum = VOLUME - DELAY(VOLUME, 14)
RSIMomentum = RSI - DELAY(RSI, 14)

定义均值回归和布林带等:

MeanReversion = MA(CLOSE, 20) - CLOSE
ZScoreMeanReversion = (CLOSE - MA(CLOSE, 20)) / STD(CLOSE, 20)
BollingerBands = Factor("BOLL")

备注:论文PDF和完整代码复现请加入知识星球获取。

定义波动率相关的因子:

StandardDeviation = STD(CLOSE, 20)
ATR = Factor("ATR")
BollingerBandWidth = ......

定义基本面因子,如市盈率和市净率:

PE = CLOSE / EPS
PB = Factor("pb_ratio_ttm")

备注:论文PDF和完整代码复现请加入知识星球获取。

定义交易量相关的因子:

TradingVolume = VOLUME
AverageTradingVolume = MA(VOLUME, 20)

定义质量和增长因子:

GrossProfitMargin = Factor("......")
OperatingProfitMargin = ......
EarningsGrowthRate = ......
EBITDAGrowthRate = EBITDA / DELAY(EBITDA, 1) - 1

定义技术指标,如移动平均线和指数移动平均线:

MovingAverage = SMA(CLOSE, 20)
ExponentialMovingAverage = EMA(CLOSE, 20)

最后,读取Alpha公式,并对每个公式进行回测和分析:

备注:论文PDF和完整代码复现请加入知识星球获取。

formulas = afr.read_alpha_formula_from_excel("./data/Seed Alpha.xlsx")
for i, formula in enumerate(......):
    path = f"./result/alpha_analysis/{i + 1}.xlsx"
    f = eval(formula)

    d1 = "20220930"
    d2 = "20221231"

      ......
    # 实例化引擎 
      ......
    # 构建管道,对因子进行预处理
      ......
    # 构建管道,添加因子分析器
      ......
    # 调仓周期为1,3,5
    result = engine.analysis(
        df, "daily", ascending=True, periods=[135], keep_preprocess_result=True
    )
    result_to_excel(result, path)

实验

我们的研究旨在开发一个无需人工干预的综合LLM驱动的Alpha挖掘框架。该框架能够处理多模态信息并适应不同的市场条件。我们引入了一个置信评分机制,旨在减轻LLM在种子Alpha选择过程中的潜在幻觉

4.1 数据集

我们的研究重点关注中国A股市场,特别是上证50指数(SSE 50)。数据集包括六个主要特征,作为我们Alpha因子的原始输入:开盘价收盘价最高价最低价成交量成交量加权平均价(VWAP)。为了确保严格的评估和稳健的模型性能,数据集分为不同的时间段:

  • 训练集:2021年1月1日 – 2022年12月31日
  • 测试集:2023年1月1日 – 2023年12月31日
ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
表2:实验数据的总结

4.2 研究问题

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图4:多模态LLM分析架构

RQ1:框架是否能够实现多模态知识提取,并随着市场条件的变化捕获新的Alpha?

我们提出了一个提示架构(如图4所示),将多模态市场信息整合到LLM中,以实现多模态知识提取,并在不同的市场条件下选择最佳的种子Alpha。

RQ2:我们的LLM驱动的Alpha挖掘框架在交易有效性方面是否优于当前的Alpha工厂?

在评估选定的种子Alpha信号性能时,主要指标是信息系数(Information Coefficient,IC)。IC衡量预测的Alpha值与实际未来回报之间的相关性。结果表明,我们的LLM驱动框架在所有类别中持续获得更高的平均IC值,特别是在波动率基本面类别,表明其交易有效性优于传统的Alpha工厂。

RQ3:我们的整体策略,结合LLM驱动的框架和置信评分,能否持续跑赢市场?

我们在上证50指数上进行了从2023年1月1日到2023年12月31日的回测。我们的策略涉及基于每日的投资组合重构,采用顶部选择过程。结果表明,我们的框架在回测中表现出色,实现了最高的利润,与市场和其他方法相比具有明显的优势。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图5:不同市场状态输入和阿尔法选择的示例实验
ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图6:LLM选择后的平均IC比较

相关工作

5.1 公式化Alpha

公式化Alpha在量化投资中指的是利用预定义的数学模型算法生成超额回报的系统性、基于规则的策略。这些策略利用特定的市场模式异常低效性,通常通过自动化交易系统实施。

ChatGPT能自动寻找交易策略?利用人工智能结合实时市场环境生成Alpha|附代码
图7:上证50指数与我们表现的回测结果对比

5.2 金融领域的LLM

通用领域的大型语言模型(LLM) 的发展激发了对金融大型语言模型(Fin-LLMs) 的兴趣。尽管对通用LLM的研究较为充分,但Fin-LLMs仍在兴起。定制的金融LLM在金融任务上优于基础模型,展示了增强的领域特定理解能力。

5.3 多模态与多智能体LLM

多模态LLM在投资领域的整合得到了广泛研究,强调了其改变金融技术的潜力。通过处理文本图像数值数据等多样化的数据类型,这些模型提供了全面的洞察和预测能力。多智能体系统进一步增强了市场分析和投资组合管理,利用庞大的数据集和先进的自然语言处理来解释金融报告、新闻和社交媒体情绪。

结论

本文提出了一个新颖的量化股票投资和投资组合管理框架,利用LLM的最新进展和多智能体架构。我们的框架通过集成LLM生成多样化的Alpha因子,并采用多智能体方法动态评估市场状况,解决了现有模型的不稳定性高不确定性问题。通过在中国股市的广泛实验,我们证明了该框架在多个金融指标上显著优于传统的Alpha生成方法、人工交易员的表现和市场指数。

参考文献

[1] Vladi Nikolov. 3 quantitative strategies based on alternative data. 2024.

[2] I. Tulchinsky. Finding Alphas: A Quantitative Approach to Building Trading Strategies. 2015.

[3] Eugene F Fama. Efficient capital markets: A review of theory and empirical work. The Journal of Finance, 25(2):383–417, 1970.

(参考文献仅列举部分,完整列表请参考原文)


本文基于论文《Automate Strategy Finding with LLM in Quant Investment》整理,旨在为读者提供对该研究的深入理解。如需进一步了解,请参阅原论文。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注