博客

AI 量化交易:从模型到量化基金

2025年4月29日

English

为什么做 AI 的人应该关心量化

这一代大语言模型是非常漂亮的工程成果,但从根上说仍然受限。每一个输出——每个词、每个像素——都是基于训练数据概率的最大似然近似。这个天花板在企业应用、机器人、自动驾驶里都会变成真实的问题——这些领域的进展,仍处于高度探索的阶段。

但有一类问题,今天的 AI 架构确实很有价值:不需要和真实世界进行复杂逻辑交互,只需要根据特征值判断结果、选择最优策略的领域。股票和期权交易就是最典型的例子。市场会产生结构化的数值数据,有清晰的奖励信号(盈利或亏损),也有几十年的历史训练数据。这正是强化学习擅长的地方。

问题不是 AI 能不能交易。问题是,为什么这个领域过去的进入门槛一直这么高——以及这个门槛是否正在改变。

传统量化交易到底是什么

量化交易身上有一种让新人望而却步的神秘感。你会听到它是数学天才和算法狂热者的领域。但深入研究之后,我可以把它说得更清楚:

  • 所谓“数学”,很多时候是几十年前的指标和固定公式,现在已经封装进各种编程库里,不需要你自己从头推导。
  • 量化策略的工作,是调整并重组这些公式参数,再用历史数据测试。
  • 量化策略模型的训练复杂度,远低于十亿参数级别的 LLM 或扩散模型。
  • 现在那些股票“Agent”——把 OHLCV 数据和新闻喂给 GPT-4o 或类似模型,让它给投资建议——还不足以用于严肃场景。

最后一点尤其值得强调:如果把数据直接丢给大语言模型就有用,每家基金早就这么做了。这些模型并不是用市场专用数据集或损失函数训练出来的。它们的决策,不能被信任到用于专业资本配置。

量化策略本质上是在拟合一个复杂函数。

这个函数的参数是指标组合,输出是更可能获利的买入/卖出动作。传统量化通过回测寻找最优的参数嵌套和组合。

为什么量化基金看起来神秘

神秘感不来自智力复杂度,而来自信息不对称和运营门槛。开一只基金需要资金、牌照、行业经验和人脉。绝大多数个人都不可能自己发基金。

那为什么 Jane Street、Citadel、Renaissance 这样的公司如此赚钱?几个因素会叠加:

  • 高频交易(HFT):依赖速度——把服务器部署在交易所附近,把网络延迟优化到微秒级——以及做市返佣。这不是复杂 AI,而是极致工程。
  • 波动率捕获:市场波动越大,定价低效越明显,利润空间越大。
  • 趋势利用:在持续牛市中做出准确的基本面判断(比如 2019–2024 年的美股),会带来超额收益。
  • 先发优势:早期量化基金跑赢了技术能力较弱的机构和散户,不过现在竞争正在加剧。
  • 反应速度:Jane Street 2024 年在印度期权市场的统治力就是一个鲜明例子,它通过 HFT 捕获了大约 70% 的利润。
Jane Street revenue growth

Jane Street 2024 年收入翻倍,超过了 Morgan Stanley,很大程度上受益于 AI 驱动的交易。这反映了整个行业正在转向 AI 驱动的量化策略。大型机构早在当前 AI 热潮之前就已经重金投入 GPU——用于在海量历史数据上训练、分析非结构化文本(财报、业绩电话会、新闻),以及比较从 LSTM、XGBoost 到 Transformer 的不同模型架构。

量化投资的核心,对 AI 从业者来说是可接近的。真正的神秘不在智力门槛,而在信息缺口。

AI 如何改变局面

传统量化方法会把人定义的指标应用到资产上,再通过回测寻找高收益。当结果不够好时,策略会加入更多因子,变得越来越复杂。但即使是最好的策略,有时也会亏钱。即使是由 James Simons 在 1988 年创立、被广泛视为黄金标准的 Medallion Fund,据报道也在 2025 年第一季度出现了亏损。这凸显了一个核心问题:人定义的策略参数是有限集合。它们可能在历史场景中有效,却会在边缘案例和罕见市场事件中失效。

深度神经网络,尤其是强化学习,提供了一种根本不同的方法:

  • 状态:OHLCV 数据、技术指标(RSI、MACD 等)、来自新闻和财报的情绪信号
  • 动作:目标组合权重——对每个标的是做多、做空,还是空仓
  • 奖励:盈亏、风险调整收益、约束惩罚

这种形式非常适合大规模 RL 训练。把 100 个由人定义的参数,和一个拥有数百万可学习参数的模型相比——哪一个更能捕捉不同市场状态下复杂的概率分布?我们不需要理解每个神经元之间的互动;模型表达复杂模式的容量,远远超过手工策略设计。

不过,训练稳健的 AI 量化模型需要很深的专业能力。多数公开论文会在 2020–2024 年的 S&P 500 数据上做基准测试——那是一段由牛市主导的时期,连简单策略也容易跑赢。模型在震荡或熊市周期里的表现,必须被仔细审视。多数开源策略离基金级别的收益和风控还有距离。

严肃的 AI 量化系统需要考虑:

  • 数据规模很重要:更大、更丰富的数据集会提升模型稳健性,类似 LLM 的 scaling law。
  • 人类经验可以作为训练信号:除了静态指标,还要把专家交易员的策略作为行为先验纳入系统。
  • 对冲是必需品:动态市场需要能管理风险的模型,而不是只会最大化收益的模型。
  • 资金管理本身就是一个模型:一个普通策略配上严谨仓位管理,会胜过一个没有仓位纪律的天才策略。
  • 每个策略一个模型,而不是一个模型包打天下:市场有不同 regime,不同资产类别的行为也不同。
  • 噪声过滤是核心:金融数据很多,但噪声也大——从噪声中分离信号才是关键挑战。

真正的门槛

除了技术挑战,还有几类结构性门槛决定了谁能成功:

  • 执行速度:对 HFT 策略来说,速度取决于服务器位置、硬件性能、代码效率和微秒级网络延迟。这是基础设施问题,不是建模问题。
  • 对手方质量:美国市场大约 80% 是机构参与。盈利的量化基金往往从其他机构的错误定价中获利,在执行速度和算法精度上竞争。
  • 实盘经验:真实交易有回测无法捕捉的心理维度。新手和老练交易员面对同样的市场波动,会有完全不同的反应。AI 在这里有优势——足够强的模型不会带着情绪和疲劳交易。
  • 资金管理:仓位 sizing 和风险管理至少和信号生成一样重要。在任何有意义的时间跨度上,一个普通模型加优秀资金配置,会胜过一个没有风控的优秀模型。

即便有强大的 AI 工具,也没有模型是万无一失的。模型无法预判内幕交易,也无法完全预判纯政治冲击。2025 年关税升级期间,监控社交媒体和政策信号可以预测偏空趋势——但在政策突然反转后的反弹里,算法就很难捕捉。在罕见事件中,人类判断常常胜过算法;但二者结合时最强。

下一步

这篇文章勾勒了整体图景:量化交易是什么,为什么 AI 适合它,以及门槛在哪里。下一篇 Dnalyaw:从零工程化一个 AI 量化交易系统,会讲构建生产系统背后的真实架构和工程决策。


免责声明:文中所有交易相关内容均基于个人资金与教育目的,不构成投资建议。交易有高风险,包括本金全部损失的可能。