2025 年回顾与 2026 年预测

最好的时代，悄悄地来了

我们经历的不是“工具变快了”。我们经历的是努力被压缩。

过去要一个团队干上几个月的事，现在一个人、一晚上就能做完。不是因为问题变简单了，而是因为执行被外部化了。

代码、翻译、排版、编排、发布：它们不再是瓶颈。

判断才是。

真正改变了什么

程序员已经不太“写代码”了
过去以周计的 workflow，现在坍缩成一夜之间的事
知识变便宜了；意图和跟进可没有
想法到 artifact 之间的距离正在消失

这不是“AI 变聪明了”。这是摩擦被拿掉了。

当你手动把一件事端到端跑通，再把它变成 workflow，它就不再显得神奇——它只会显得理所当然。

这才是真正的转变。

人类 vs Agent

Agent 比人类更擅长协调，不是因为它们更聪明，而是因为它们的沟通开销为零。

没有谈判
没有自尊
没有所有权歧义
没有疲劳

在长周期、跨多天、多步骤的任务里，这个差距会像复利一样越滚越大，毫不留情。

这就是为什么能长时间跑的 agent，比聪明的 prompt 更重要。

历史再次押韵

Renaissance Technologies 赢，不是靠“数学更好”。他们赢，是因为比别人更早把计算工业化。

Peter Brown——Hinton 的第一位博士生——当年被招进去，不是为了做研究。招他，就是要他把数学和计算变成一个系统。

这个模式正在重演，只是这一次门槛低得多。

这一次，个人也能上场。

为什么 2026 不是一个预测

2026 感觉不像未来。它更像一个你已经可以选择进入的状态。

长周期 agent workflow
拥有组织级杠杆的一人系统
你睡觉时还在跑的执行

Shannon 之所以存在，是因为我要让这个现实真正可靠，而不是停留在“看起来很神奇”。

Kocoro-lab/Shannon

生产级 Multi-Agent 平台：使用 Rust、Go 和 Python 构建，用于确定性执行、预算强制与企业级可观测性。

View on GitHub

先选择相信，再迭代

这个时代不奖励先怀疑的人。它奖励的是先试，再复利。

信到能动手的程度，就够了。小步推进。让 workflow 累积价值。

就是这样。

2025：一份简短年度回顾

2025 不是某一次突破，而是常态化。

变成日常的东西：

reasoning model 成为默认选项（o1、o3、DeepSeek R1、带 extended thinking 的 Claude）
命令行里的 coding agents（Claude Code、Codex CLI、Gemini CLI）
一跑就是几个小时甚至几天的 agentic tasks
computer use 和 browser automation agents
AI-native IDE 取代传统编辑器（Cursor、Windsurf）
MCP 成为工具集成协议
与模型实时语音对话
context window 达到 1M+ tokens
图像和视频生成达到生产质量
每月 200 美元的 AI 订阅成了基本开销
中国 open-weight models 追平 frontier labs（DeepSeek R1 moment）
vibe coding、YOLO shipping，以及 normalized deviance
个人构建几十个（甚至上百个）工具

悄悄发生的转变：

开源模型在许多 benchmark 上追上闭源模型
模型 provider 把价格一路卷到底
数据中心在政治上开始不受待见
“conformance”和原始能力同等重要
slop 变多了，但 leverage 也变大了
移动设备成了能用的开发环境

2025 的重点不是谁在“赢”。

这是地板被整体抬高的一年。

我今年构建了什么

回看 2025，我的工作集中在一件事上：把 agent systems 理解得足够深，深到可以围绕它们构建生产基础设施。

我写了一本 AI Agent 书，从 ReAct loop 讲到 multi-agent orchestration patterns——随着 agent 从 demo 走向生产系统，这些架构知识正在变成绕不开的东西。

我构建了 Shannon，一个 multi-agent platform，专门解决生产环境里真正要紧的问题：deterministic replay、budget enforcement、security boundaries。不是因为世界需要又一个 agent framework，而是因为要把 agents 跑得可靠，需要的基础设施大多数框架并没有提供。

我也开始动手做 AI 量化交易——把强化学习用到市场上。Renaissance Technologies 几十年前就把计算工业化了。现在，同样的 leverage 个人也能拿到——只要你愿意把领域知识和 AI infrastructure 结合起来。

贯穿其中的主线是：把系统思维用在 AI 上。

理解 agent 如何失败，成本如何复利，workflow 如何在重启和网络故障中活下来。这些是工程问题，不是研究问题。而 2025 让这个区别比以往更清楚。

向前看

2026 的重心会从新能力转向部署。

问题会从“AI 能不能做这个？”变成“怎么把它大规模地跑稳？”

基础设施。治理。成本控制。可观测性。

真正让那些炫的东西跑起来的，恰恰是这些无聊的活儿。

但水面之下，还有另一场转变正在发生。

Transformer 架构——attention mechanisms、static weights、context windows——已经把我们带得很远。但它和生物大脑的工作方式仍然根本不同。没有持续学习。没有 inference 时的动态权重更新。没有真正的记忆形成。

下一个前沿，也许不是继续 scaling，而是重新思考架构本身。从 recurrent patterns 到更接近神经元真实发放和适应的东西。TensorLogic 是我在这个方向上的早期探索——符号推理遇上神经计算，而且结构本身可以持续学习和更新。

我两边都押：一边是让今天的 agents 跑得可靠的基础设施，一边是用不同思路去构建明天架构的研究。