为什么要写这本书
2025 年,AI Agent 从实验室走进了生产环境。但当你真的开始构建一个能在企业里跑起来的 Agent 系统时,很快会发现:
- 大多数教程停在“调用一个 API 做聊天机器人”的 demo 层面
- 多 Agent 协作、token 预算、错误重试、状态持久化,没有清晰答案
- 现有框架很难满足企业级需求:安全审计、成本控制、可观测性
这本 AI Agent Book 就是为了填上这个空白。
你会学到什么
第 1-2 部分:Agent 基础
- Agent 的本质 —— 从 ReAct 到 Reasoning + Acting
- Tool Calling —— Function Calling 的设计模式
- MCP 协议 —— 2024 年底发布的工具集成标准
- 结构化输出 —— 如何让 LLM 产出可解析的数据
第 3-4 部分:单 Agent 深入
- 记忆系统 —— 短期、长期、外部记忆的设计
- RAG 集成 —— Retrieval-Augmented Generation 的最佳实践
- 规划与执行 —— Plan-and-Execute 模式
- 自我反思 —— 让 Agent 学会自我修正
第 5-6 部分:多 Agent 编排
- 多 Agent 模式 —— Supervisor、Hierarchical、Swarm
- DAG 编排 —— 用有向无环图设计工作流
- 状态管理 —— 持久化、checkpoint、失败恢复
- Human-in-the-Loop —— 人机协作模式
第 7-8 部分:生产部署
- 成本控制 —— token 预算、限流、缓存策略
- 安全与权限 —— 沙箱执行、审计日志、访问控制
- 可观测性 —— tracing、metrics、logging
- 企业架构 —— 从 PoC 到生产系统的演进
第 9 部分:前沿方向
- Computer Use —— 能操作电脑的 Agent
- Agentic Coding —— 代码生成 Agent 的设计
- Browser Use —— Web 自动化 Agent
- Agent 经济学 —— 成本、定价与商业模式
这本书有什么不一样
模式优先,而不是框架优先
每一章都会先讲通用设计模式,再讲具体实现。框架会过时,模式不会。
来自真实系统的经验
这本书来自我构建 Shannon 的过程:一个使用 Go/Rust/Python 三层架构的多 Agent 平台。
覆盖 2025-2026 的前沿
MCP 协议、Computer Use、Agentic Coding——这些都是我写这本书时正在发生的前沿变化。
谁适合读
- 想构建生产级 Agent 系统,而不是 demo 的开发者
- 正在处理复杂场景下多 Agent 协作的团队
- 关心成本控制、安全、可观测性的工程师
- 想理解 Agent 框架背后设计模式的人
- 后端开发者、架构师、技术负责人
多语言版本
这本书提供三个语言版本:
- English Version —— 英文完整译本
- 中文版 (Chinese) —— 原始版本
- 日本語版 (Japanese) —— 日文译本
开始阅读
这本书可以完全免费在线阅读:
“The best way to learn is to build.” 这本书是我构建 Shannon 多 Agent 平台过程中沉淀下来的一套系统化经验。