AI 量化交易：从模型到量化基金

为什么做 AI 的人应该关心量化

这一代大语言模型是非常漂亮的工程成果，但从根上说仍然受限。每一个输出——每个词、每个像素——都是基于训练数据概率的最大似然近似。这个天花板在企业应用、机器人、自动驾驶里都会变成真实的问题——这些领域的进展，仍处于高度探索的阶段。

但有一类问题，今天的 AI 架构确实很有价值：不需要和真实世界进行复杂逻辑交互，只需要根据特征值判断结果、选择最优策略的领域。股票和期权交易就是最典型的例子。市场会产生结构化的数值数据，有清晰的奖励信号（盈利或亏损），也有几十年的历史训练数据。这正是强化学习擅长的地方。

问题不是 AI 能不能交易。问题是，为什么这个领域过去的进入门槛一直这么高——以及这个门槛是否正在改变。

传统量化交易到底是什么

量化交易身上有一种让新人望而却步的神秘感。你会听到它是数学天才和算法狂热者的领域。但深入研究之后，我可以把它说得更清楚：

所谓“数学”，很多时候是几十年前的指标和固定公式，现在已经封装进各种编程库里，不需要你自己从头推导。
量化策略的工作，是调整并重组这些公式参数，再用历史数据测试。
量化策略模型的训练复杂度，远低于十亿参数级别的 LLM 或扩散模型。
现在那些股票“Agent”——把 OHLCV 数据和新闻喂给 GPT-4o 或类似模型，让它给投资建议——还不足以用于严肃场景。

最后一点尤其值得强调：如果把数据直接丢给大语言模型就有用，每家基金早就这么做了。这些模型并不是用市场专用数据集或损失函数训练出来的。它们的决策，不能被信任到用于专业资本配置。

量化策略本质上是在拟合一个复杂函数。

这个函数的参数是指标组合，输出是更可能获利的买入/卖出动作。传统量化通过回测寻找最优的参数嵌套和组合。

为什么量化基金看起来神秘

神秘感不来自智力复杂度，而来自信息不对称和运营门槛。开一只基金需要资金、牌照、行业经验和人脉。绝大多数个人都不可能自己发基金。

那为什么 Jane Street、Citadel、Renaissance 这样的公司如此赚钱？几个因素会叠加：

高频交易（HFT）：依赖速度——把服务器部署在交易所附近，把网络延迟优化到微秒级——以及做市返佣。这不是复杂 AI，而是极致工程。
波动率捕获：市场波动越大，定价低效越明显，利润空间越大。
趋势利用：在持续牛市中做出准确的基本面判断（比如 2019–2024 年的美股），会带来超额收益。
先发优势：早期量化基金跑赢了技术能力较弱的机构和散户，不过现在竞争正在加剧。
反应速度：Jane Street 2024 年在印度期权市场的统治力就是一个鲜明例子，它通过 HFT 捕获了大约 70% 的利润。

Jane Street 2024 年收入翻倍，超过了 Morgan Stanley，很大程度上受益于 AI 驱动的交易。这反映了整个行业正在转向 AI 驱动的量化策略。大型机构早在当前 AI 热潮之前就已经重金投入 GPU——用于在海量历史数据上训练、分析非结构化文本（财报、业绩电话会、新闻），以及比较从 LSTM、XGBoost 到 Transformer 的不同模型架构。

量化投资的核心，对 AI 从业者来说是可接近的。真正的神秘不在智力门槛，而在信息缺口。

AI 如何改变局面

传统量化方法会把人定义的指标应用到资产上，再通过回测寻找高收益。当结果不够好时，策略会加入更多因子，变得越来越复杂。但即使是最好的策略，有时也会亏钱。即使是由 James Simons 在 1988 年创立、被广泛视为黄金标准的 Medallion Fund，据报道也在 2025 年第一季度出现了亏损。这凸显了一个核心问题：人定义的策略参数是有限集合。它们可能在历史场景中有效，却会在边缘案例和罕见市场事件中失效。

深度神经网络，尤其是强化学习，提供了一种根本不同的方法：

状态：OHLCV 数据、技术指标（RSI、MACD 等）、来自新闻和财报的情绪信号
动作：目标组合权重——对每个标的是做多、做空，还是空仓
奖励：盈亏、风险调整收益、约束惩罚

这种形式非常适合大规模 RL 训练。把 100 个由人定义的参数，和一个拥有数百万可学习参数的模型相比——哪一个更能捕捉不同市场状态下复杂的概率分布？我们不需要理解每个神经元之间的互动；模型表达复杂模式的容量，远远超过手工策略设计。

不过，训练稳健的 AI 量化模型需要很深的专业能力。多数公开论文会在 2020–2024 年的 S&P 500 数据上做基准测试——那是一段由牛市主导的时期，连简单策略也容易跑赢。模型在震荡或熊市周期里的表现，必须被仔细审视。多数开源策略离基金级别的收益和风控还有距离。

严肃的 AI 量化系统需要考虑：

数据规模很重要：更大、更丰富的数据集会提升模型稳健性，类似 LLM 的 scaling law。
人类经验可以作为训练信号：除了静态指标，还要把专家交易员的策略作为行为先验纳入系统。
对冲是必需品：动态市场需要能管理风险的模型，而不是只会最大化收益的模型。
资金管理本身就是一个模型：一个普通策略配上严谨仓位管理，会胜过一个没有仓位纪律的天才策略。
每个策略一个模型，而不是一个模型包打天下：市场有不同 regime，不同资产类别的行为也不同。
噪声过滤是核心：金融数据很多，但噪声也大——从噪声中分离信号才是关键挑战。

真正的门槛

除了技术挑战，还有几类结构性门槛决定了谁能成功：

执行速度：对 HFT 策略来说，速度取决于服务器位置、硬件性能、代码效率和微秒级网络延迟。这是基础设施问题，不是建模问题。
对手方质量：美国市场大约 80% 是机构参与。盈利的量化基金往往从其他机构的错误定价中获利，在执行速度和算法精度上竞争。
实盘经验：真实交易有回测无法捕捉的心理维度。新手和老练交易员面对同样的市场波动，会有完全不同的反应。AI 在这里有优势——足够强的模型不会带着情绪和疲劳交易。
资金管理：仓位 sizing 和风险管理至少和信号生成一样重要。在任何有意义的时间跨度上，一个普通模型加优秀资金配置，会胜过一个没有风控的优秀模型。

即便有强大的 AI 工具，也没有模型是万无一失的。模型无法预判内幕交易，也无法完全预判纯政治冲击。2025 年关税升级期间，监控社交媒体和政策信号可以预测偏空趋势——但在政策突然反转后的反弹里，算法就很难捕捉。在罕见事件中，人类判断常常胜过算法；但二者结合时最强。

下一步

这篇文章勾勒了整体图景：量化交易是什么，为什么 AI 适合它，以及门槛在哪里。下一篇 Dnalyaw：从零工程化一个 AI 量化交易系统，会讲构建生产系统背后的真实架构和工程决策。

免责声明：文中所有交易相关内容均基于个人资金与教育目的，不构成投资建议。交易有高风险，包括本金全部损失的可能。