博客

2025 年回顾与 2026 年预测

2026年1月6日

English

最好的时代,悄悄地来了

我们经历的不是“工具变快了”。 我们经历的是努力被压缩。

过去要一个团队干上几个月的事,现在一个人、一晚上就能做完。 不是因为问题变简单了,而是因为执行被外部化了。

代码、翻译、排版、编排、发布: 它们不再是瓶颈。

判断才是。


真正改变了什么

  • 程序员已经不太“写代码”了
  • 过去以周计的 workflow,现在坍缩成一夜之间的事
  • 知识变便宜了;意图和跟进可没有
  • 想法到 artifact 之间的距离正在消失

这不是“AI 变聪明了”。 这是摩擦被拿掉了。

当你手动把一件事端到端跑通,再把它变成 workflow, 它就不再显得神奇——它只会显得理所当然。

这才是真正的转变。


人类 vs Agent

Agent 比人类更擅长协调,不是因为它们更聪明, 而是因为它们的沟通开销为零。

  • 没有谈判
  • 没有自尊
  • 没有所有权歧义
  • 没有疲劳

在长周期、跨多天、多步骤的任务里,这个差距会像复利一样越滚越大,毫不留情。

这就是为什么能长时间跑的 agent,比聪明的 prompt 更重要。


历史再次押韵

Renaissance Technologies 赢,不是靠“数学更好”。 他们赢,是因为比别人更早把计算工业化。

Peter Brown——Hinton 的第一位博士生——当年被招进去,不是为了做研究。 招他,就是要他把数学和计算变成一个系统。

这个模式正在重演,只是这一次门槛低得多。

这一次,个人也能上场。


为什么 2026 不是一个预测

2026 感觉不像未来。 它更像一个你已经可以选择进入的状态。

  • 长周期 agent workflow
  • 拥有组织级杠杆的一人系统
  • 你睡觉时还在跑的执行

Shannon 之所以存在,是因为我要让这个现实真正可靠,而不是停留在“看起来很神奇”。

Kocoro-lab/Shannon

生产级 Multi-Agent 平台:使用 Rust、Go 和 Python 构建,用于确定性执行、预算强制与企业级可观测性。

View on GitHub

先选择相信,再迭代

这个时代不奖励先怀疑的人。 它奖励的是先试,再复利。

信到能动手的程度,就够了。 小步推进。 让 workflow 累积价值。

就是这样。


2025:一份简短年度回顾

2025 不是某一次突破,而是常态化。

变成日常的东西:

  • reasoning model 成为默认选项(o1、o3、DeepSeek R1、带 extended thinking 的 Claude)
  • 命令行里的 coding agents(Claude Code、Codex CLI、Gemini CLI)
  • 一跑就是几个小时甚至几天的 agentic tasks
  • computer use 和 browser automation agents
  • AI-native IDE 取代传统编辑器(Cursor、Windsurf)
  • MCP 成为工具集成协议
  • 与模型实时语音对话
  • context window 达到 1M+ tokens
  • 图像和视频生成达到生产质量
  • 每月 200 美元的 AI 订阅成了基本开销
  • 中国 open-weight models 追平 frontier labs(DeepSeek R1 moment)
  • vibe coding、YOLO shipping,以及 normalized deviance
  • 个人构建几十个(甚至上百个)工具

悄悄发生的转变:

  • 开源模型在许多 benchmark 上追上闭源模型
  • 模型 provider 把价格一路卷到底
  • 数据中心在政治上开始不受待见
  • “conformance”和原始能力同等重要
  • slop 变多了,但 leverage 也变大了
  • 移动设备成了能用的开发环境

2025 的重点不是谁在“赢”。

这是地板被整体抬高的一年。


我今年构建了什么

回看 2025,我的工作集中在一件事上:把 agent systems 理解得足够深,深到可以围绕它们构建生产基础设施。

我写了一本 AI Agent 书,从 ReAct loop 讲到 multi-agent orchestration patterns——随着 agent 从 demo 走向生产系统,这些架构知识正在变成绕不开的东西。

我构建了 Shannon,一个 multi-agent platform,专门解决生产环境里真正要紧的问题:deterministic replay、budget enforcement、security boundaries。不是因为世界需要又一个 agent framework,而是因为要把 agents 跑得可靠,需要的基础设施大多数框架并没有提供。

我也开始动手做 AI 量化交易——把强化学习用到市场上。Renaissance Technologies 几十年前就把计算工业化了。现在,同样的 leverage 个人也能拿到——只要你愿意把领域知识和 AI infrastructure 结合起来。

贯穿其中的主线是:把系统思维用在 AI 上

理解 agent 如何失败,成本如何复利,workflow 如何在重启和网络故障中活下来。这些是工程问题,不是研究问题。而 2025 让这个区别比以往更清楚。


向前看

2026 的重心会从新能力转向部署。

问题会从“AI 能不能做这个?”变成“怎么把它大规模地跑稳?”

基础设施。治理。成本控制。可观测性。

真正让那些炫的东西跑起来的,恰恰是这些无聊的活儿。

但水面之下,还有另一场转变正在发生。

Transformer 架构——attention mechanisms、static weights、context windows——已经把我们带得很远。但它和生物大脑的工作方式仍然根本不同。没有持续学习。没有 inference 时的动态权重更新。没有真正的记忆形成。

下一个前沿,也许不是继续 scaling,而是重新思考架构本身。从 recurrent patterns 到更接近神经元真实发放和适应的东西。TensorLogic 是我在这个方向上的早期探索——符号推理遇上神经计算,而且结构本身可以持续学习和更新。

我两边都押:一边是让今天的 agents 跑得可靠的基础设施,一边是用不同思路去构建明天架构的研究。