博客

我写了一本关于构建生产级 AI Agent 的书

2026年1月11日

English

为什么要写这本书

2025 年,AI Agent 从实验室走进了生产环境。但当你真的开始构建一个能在企业里跑起来的 Agent 系统时,很快会发现:

  • 大多数教程停在“调用一个 API 做聊天机器人”的 demo 层面
  • 多 Agent 协作、token 预算、错误重试、状态持久化,没有清晰答案
  • 现有框架很难满足企业级需求:安全审计、成本控制、可观测性

这本 AI Agent Book 就是为了填上这个空白。


你会学到什么

第 1-2 部分:Agent 基础

  • Agent 的本质 —— 从 ReAct 到 Reasoning + Acting
  • Tool Calling —— Function Calling 的设计模式
  • MCP 协议 —— 2024 年底发布的工具集成标准
  • 结构化输出 —— 如何让 LLM 产出可解析的数据

第 3-4 部分:单 Agent 深入

  • 记忆系统 —— 短期、长期、外部记忆的设计
  • RAG 集成 —— Retrieval-Augmented Generation 的最佳实践
  • 规划与执行 —— Plan-and-Execute 模式
  • 自我反思 —— 让 Agent 学会自我修正

第 5-6 部分:多 Agent 编排

  • 多 Agent 模式 —— Supervisor、Hierarchical、Swarm
  • DAG 编排 —— 用有向无环图设计工作流
  • 状态管理 —— 持久化、checkpoint、失败恢复
  • Human-in-the-Loop —— 人机协作模式

第 7-8 部分:生产部署

  • 成本控制 —— token 预算、限流、缓存策略
  • 安全与权限 —— 沙箱执行、审计日志、访问控制
  • 可观测性 —— tracing、metrics、logging
  • 企业架构 —— 从 PoC 到生产系统的演进

第 9 部分:前沿方向

  • Computer Use —— 能操作电脑的 Agent
  • Agentic Coding —— 代码生成 Agent 的设计
  • Browser Use —— Web 自动化 Agent
  • Agent 经济学 —— 成本、定价与商业模式

这本书有什么不一样

模式优先,而不是框架优先

每一章都会先讲通用设计模式,再讲具体实现。框架会过时,模式不会。

来自真实系统的经验

这本书来自我构建 Shannon 的过程:一个使用 Go/Rust/Python 三层架构的多 Agent 平台。

覆盖 2025-2026 的前沿

MCP 协议、Computer Use、Agentic Coding——这些都是我写这本书时正在发生的前沿变化。


谁适合读

  • 想构建生产级 Agent 系统,而不是 demo 的开发者
  • 正在处理复杂场景下多 Agent 协作的团队
  • 关心成本控制、安全、可观测性的工程师
  • 想理解 Agent 框架背后设计模式的人
  • 后端开发者、架构师、技术负责人

多语言版本

这本书提供三个语言版本:


开始阅读

这本书可以完全免费在线阅读:

阅读 AI Agent Book →


“The best way to learn is to build.” 这本书是我构建 Shannon 多 Agent 平台过程中沉淀下来的一套系统化经验。