博客

一个人 + AI:量化基金研究组织形态的重构

2026年7月6日

English

传统量化基金的组织图长这样:几十到几百个 PhD,按流水线分工——数据组清洗数据,信号组挖因子,组合组做优化,执行组管交易,风控组盯敞口,还有一层运营做报告和合规。这个形态的隐含假设是:研究产能 = 合格研究员的人头数 × 人均产出。

过去几个月,我们在完整实盘链路里打磨这套纪律,并在小资金实盘上开始验证另一个假设:当研究流程本身被冻结成可执行的纪律,这条等式就失效了。枚举、验证、监控、报告——流水线上大部分环节可以由 AI agents 全天候执行,人只保留极少数真正需要判断的决策点。

这篇文章讲这种组织形态的设计原则。它不是“用 AI 提效”的故事——提效是把原来的事做快一点;这里发生的是结构性的替代:某些岗位不是被加速了,而是不再需要以岗位的形式存在。

前提:纪律先于自动化

先说最重要的一条,因为它决定了这套形态是否成立:AI 能接管一个环节的前提,是这个环节的规则已经被完全显式化。

以信号研究为例。在上一篇里我讲过我们的准入纪律:每个候选信号必须剥离因子暴露、通过预注册的样本外检验、净成本为正、尾部相关性达标——四道门,规则在看到数据之前冻结,裁决不依赖任何人的自由裁量。

注意这套纪律的一个副产品:一旦裁决不需要自由裁量,它就不需要人。 枚举候选、拉取数据、跑完四道门、写下裁决、把结论记入账本——这整条链路是纯执行,AI agents 跑一夜能筛完一个人类研究员一个月的候选量,而且不会在第十个候选之后开始疲劳、不会对自己提出的想法手下留情、不会忘记把 NO GO 也如实记账。

因果方向必须说清楚:不是“因为有了 AI,所以流程自动化了”,而是“因为流程先被纪律化了,AI 才有了可以安全执行的东西”。一个允许自由裁量的流程交给 AI,你得到的是规模化的自由裁量——那比人的自由裁量危险得多,因为它跑得快、显得客观。纪律是让 AI 可用的前提,不是自动化之后的结果。

这条原则可以推广成一个判据,用来决定任何环节能不能交给机器:这个环节的正确性,能否在不询问执行者意图的情况下被验证? 能——交给 agents,并给验证本身建管道;不能——留给人,或者先把它改造成能。

这个判据背后其实是同一个区分,我在讲神经网络的四重境界时用过:能被显式验证的规则活在最低的境界——函数、输入输出——不需要理解,只需要执行;而"这个信号成立的理由明天还在不在"这种问题,答案活在市场这个流形随时间演化的曲率里,没有捷径可抄,只能由人把市场结构、激励变化和制度约束合在一起判断。纪律负责把低境界的事情从人手里拿走,把人的注意力净化到只剩高境界的事情。

一天的样子

抽象原则讲完,看具体形态。一个交易日里,这个“一个人 + AI”的系统大致是这样运转的:

交易时段,没有人盯盘。 策略在固定时点计算目标组合,执行层完成调仓,独立的风险引擎检查每一笔订单——这一层是纯机器的领地,本来就不该有人。人不在这一环里不是省了一个岗位,而是消除了一类错误:盘中的人类干预,历史上制造的亏损远多于避免的。

收盘后,agents 接管运营。 数据质量核对、组合归因、风险指标巡检、以及一份发给基金相关方的每日报告——由 agents 按清单执行。报告这个环节值得单独说:叙述部分由语言模型撰写,但它被约束在一个白名单机制里——只能引用确定性计算层产出的真实数字,编造的数据无法通过校验,也不会进入最终报告。这是 AI 进入正式对外文书的正确姿势:生成负责表达,校验负责事实,两层永不合并。

夜间,工厂开工。 信号筛选的批任务、模型的定期重训练与校准漂移检查、次日的数据准备——在人睡觉的时候跑完。模型训练这件事在这个形态里的定位很朴素:它是流水线上一个被调度的工序,有自己的验收标准和回滚路径,而不是一个需要专人伺候的仪式。真正需要人判断的训练决策——特征集的变更、模型族的更换——发生的频率远低于外界想象,低到可以全部装进人的决策预算里。

异常时,系统叫醒人,而不是人守着系统。 全部监控被设计成“异常报警”而非“状态展示”:正常的日子里,人收到的信息量趋近于零。这是刻意的——注意力是这个组织形态里唯一的稀缺资源,任何消耗注意力却不需要决策的信息流,都是设计错误。

one trading day, three shifts of machines — one narrow window of human judgment09:3016:0020:0009:30market hours — machines traderebalance · execution · risk engine on every orderagents run opsdata QA · attribution · daily reportfactory overnightscreening · retraining · drift checksthe human window — judgment onlyread verdicts · admit signals · set risk posture · handle real anomaliesmonitoring is alert-on-anomaly, not status display — on a normal day, information sent to the human ≈ 0no human hands during market hours: intraday intervention has historically created more losses than it prevented

于是人的一天剩下什么?读裁决、做准入、定方向、处理真正的异常。全是判断,没有执行。

人保留什么:三类不可让渡的决策

说“人只做判断”太笼统,具体是三类:

准入决策。 工厂筛出的候选信号,最后一道门永远是人:让不让它进实盘组合。这不是仪式性的盖章——统计裁决回答“它在历史上是否成立”,人回答一个统计回答不了的问题:“它成立的理由,在未来是否还在?” 拥挤度、数据源的可持续性、和存量组合的结构关系——这些判断依赖模型外的世界知识。AI 无限扩大漏斗,人把守最后一厘米,这个分工两边都不可替代。

风险姿态。 杠杆水平、回撤容忍度、熔断阈值——这些参数编码的不是统计量,是资本所有者的效用函数。机器可以执行任何风险姿态,但选择姿态本身是委托关系的一部分,让渡它等于让渡受托责任。

方向。 往哪些新数据表面扩张、哪条研究线该关停、系统本身的架构该怎么演化——这类决策的反馈周期以月计,没有可用的训练信号,是纯粹的战略判断。

反过来说,凡不在这三类里的工作,默认问一句:为什么这还需要人?

the funnel: agents at volume, judgment at the last inchagents — enumerate · verify · monitor · reporthigh volume, no discretion needed, runs unattendedhuman — three decision types onlyadmission · risk posture · directiondefault question for anything outside the funnel's tip: why does this still need a person?the test: can correctness be verified without asking the executor's intent?

这个形态的复利性质

最后讲这个组织形态最被低估的一点:它的改进是复利的,而人头制组织的改进是线性的。

research capacity per research dollar (illustrative)timeheadcount org — lineardips = knowledge walks out the doorAI-native org — compoundsevery improvement is permanent; the executor keeps getting strongerrule frozenledger growsagents level up

人头制基金多一分产能,要招一个人:招聘周期、培养周期、沟通成本随团队规模超线性增长,而且人会离职——带着流程知识离职。组织的知识存在人脑里,组织本身其实不学习。

这个形态里,每一次流程改进都沉淀为系统的永久属性。一条新的验证规则,写入的是所有未来筛选都要过的门;一次异常的处理经验,固化成监控清单的新条目;被证伪的研究方向,记入只增不删的账本,永不重复付费。系统的每一天都比前一天更聪明一点,而且不会忘

更妙的是执行者本身也在这条复利曲线上。同一套被冻结的流程,去年需要人深度参与的环节,今年的 agents 已经能独立执行——流程没变,执行者变强了。押注这个形态,等于把组织产能锚定在 AI 能力曲线上,而不是劳动力市场上。过去两年,这两条曲线的斜率差有目共睹。

当然要诚实说出边界:这个形态目前成立于一个特定作用域——系统化、中低频、规则可显式化的策略族。它换来的交换条件也真实存在:所有要进入流水线的隐性知识必须被强制显式化,所有要由机器重复执行的“感觉”必须被翻译成规则,做不到显式化的思路在这个系统里等于不存在。我们认为这个约束是特性而不是缺陷——写不下来的 edge,大概率本来就不是 edge——但它确实划定了形态的适用范围。

结语

量化行业竞争的终局从来不是“谁的信号好”——信号会衰减、会被复制。竞争的是研究成本曲线:同样一美元研究预算,谁能验证更多候选、淘汰更快、沉淀更多负知识。

人头制组织在这条曲线上的斜率是固定的,它由人类研究员的边际成本决定。“一个人 + AI”的形态把斜率交给了 AI 能力曲线——而且系统里每一条被冻结的纪律、每一页账本,都在让下一个单位的研究预算买到更多东西。

组织形态本身,成了 alpha 的来源。

本文是 Dnalyaw 量化系列的第五篇。前篇:弱信号的数学风控的两种语言Dnalyaw:从零工程化一个 AI 量化交易系统