Appearance
阶段 3:Agent 与编排
Agent 不是"更聪明的聊天机器人",而是一种让模型在多步任务里反复计划、调用工具、观察结果、继续推进的应用结构。它能做更复杂的事,也更容易失控,所以这一阶段会反复强调边界、状态和可观测性。
建议你先完成应用开发基础和 RAG 基础,再进入这里。否则看到框架、协议、多 Agent、记忆系统时,很容易把所有东西混在一起,不知道每一层到底解决什么问题。
建议阅读顺序
- 从 Agent 基础原理 开始,先理解 Agent Loop 和终止条件。
- 再看 CoT 与 ReAct,区分"推理过程"和"行动过程"。
- 接着读 LangChain 与 LangGraph,了解常见编排框架怎么表达状态和流程。
- 之后再进入协议与系统能力:MCP 协议、A2A 协议、多 Agent 协调。
- 最后看 持久化记忆系统 和 上下文压缩策略,处理长任务和长期使用时的上下文问题。
这个模块学完后,建议马上做一个小型 Research Agent。Agent 只有放进真实任务里,才会暴露步骤过多、工具结果脏、上下文爆掉这些问题。
本阶段不要急着追什么
先不要急着做“万能 Agent”。第一版只需要让它完成一个小任务,并且过程可见、边界清楚。比如让它围绕一个主题搜索资料、整理摘要、列出来源和不确定项。这个范围已经足够暴露 Agent 最核心的问题:任务会不会拆偏、工具会不会重复调用、上下文会不会越塞越乱。
判断自己是否学明白 Agent,可以看这几个点:
- 你能画出一次 Plan / Act / Observe 循环。
- 你知道工具执行发生在宿主程序里,不是模型自己真的访问了外部系统。
- 你会给循环设置最大步数、失败上限和人工确认点。
- 你能从日志里复盘它为什么走到某个结果。
如果这些还不清楚,先回到 Agent 基础原理,不要直接跳到多 Agent 或协议层。
本阶段内容
- Agent 基础原理:Agent Loop、工具调用、状态和停止条件
- CoT 与 ReAct:推理提示和行动框架的差异
- LangChain 与 LangGraph:用框架组织多步任务
- MCP 协议:让模型接入外部工具和数据源的协议
- A2A 协议:Agent 之间互相发现和协作的思路
- 多 Agent 协调:多个 Agent 的分工、通信与冲突
- 持久化记忆系统:把短期上下文之外的信息保存下来
- 上下文压缩策略:控制长任务里的 token 成本和信息丢失