阶段 3：Agent 与编排

Agent 不是"更聪明的聊天机器人"，而是一种让模型在多步任务里反复计划、调用工具、观察结果、继续推进的应用结构。它能做更复杂的事，也更容易失控，所以这一阶段会反复强调边界、状态和可观测性。

建议你先完成应用开发基础和 RAG 基础，再进入这里。否则看到框架、协议、多 Agent、记忆系统时，很容易把所有东西混在一起，不知道每一层到底解决什么问题。

建议阅读顺序

从 Agent 基础原理开始，先理解 Agent Loop 和终止条件。
再看 CoT 与 ReAct，区分"推理过程"和"行动过程"。
接着读 LangChain 与 LangGraph，了解常见编排框架怎么表达状态和流程。
之后再进入协议与系统能力：MCP 协议、A2A 协议、多 Agent 协调。
最后看持久化记忆系统和上下文压缩策略，处理长任务和长期使用时的上下文问题。

这个模块学完后，建议马上做一个小型 Research Agent。Agent 只有放进真实任务里，才会暴露步骤过多、工具结果脏、上下文爆掉这些问题。

本阶段不要急着追什么

先不要急着做“万能 Agent”。第一版只需要让它完成一个小任务，并且过程可见、边界清楚。比如让它围绕一个主题搜索资料、整理摘要、列出来源和不确定项。这个范围已经足够暴露 Agent 最核心的问题：任务会不会拆偏、工具会不会重复调用、上下文会不会越塞越乱。

判断自己是否学明白 Agent，可以看这几个点：

你能画出一次 Plan / Act / Observe 循环。
你知道工具执行发生在宿主程序里，不是模型自己真的访问了外部系统。
你会给循环设置最大步数、失败上限和人工确认点。
你能从日志里复盘它为什么走到某个结果。

如果这些还不清楚，先回到 Agent 基础原理，不要直接跳到多 Agent 或协议层。

本阶段内容

Agent 基础原理：Agent Loop、工具调用、状态和停止条件
CoT 与 ReAct：推理提示和行动框架的差异
LangChain 与 LangGraph：用框架组织多步任务
MCP 协议：让模型接入外部工具和数据源的协议
A2A 协议：Agent 之间互相发现和协作的思路
多 Agent 协调：多个 Agent 的分工、通信与冲突
持久化记忆系统：把短期上下文之外的信息保存下来
上下文压缩策略：控制长任务里的 token 成本和信息丢失