Agent 面试题

Agent 题目最容易停留在“会调用工具”。面试里更关键的是：你能不能解释循环、状态、终止条件、权限边界，以及什么时候不该用 Agent。

Agent 基础

什么是大模型 Agent？它与传统 AI 系统有什么不同？

考察角度： 是否能把 Agent 讲成任务执行系统。

回答时应该覆盖：

Agent 由模型、工具、状态、循环和控制边界组成。
传统系统路径更固定，Agent 的下一步常由运行时状态决定。
Agent 的风险在于多步错误会累积。

深入了解： Agent 基础原理

AI Agent 和直接调用大模型 API 做一次问答有什么本质区别？

考察角度： 是否能区分一次生成和多步任务推进。

回答时应该覆盖：

普通 API 调用通常是一问一答。
Agent 会多轮读取状态、调用工具、观察结果、决定下一步。
必须有终止条件、权限和日志。

深入了解： Agent 基础原理

LLM Agent 的基本架构有哪些组成部分？

考察角度： 是否知道 Agent 不是单个模型调用。

回答时应该覆盖：

模型决策层、工具执行层、状态存储、上下文管理。
任务控制：步数、预算、错误重试和中断。
日志与评测用于回放每一步。

深入了解： Agent 基础原理

Agent 智能体的工作过程是怎样的？

考察角度： 是否能讲清楚 Plan / Act / Observe 循环。

回答时应该覆盖：

Plan：判断当前目标和下一步。
Act：调用工具或执行动作。
Observe：读取结果，更新状态，决定继续或结束。

深入了解： Agent 基础原理

Agent 死循环问题有遇到过吗？如何解决？

考察角度： 是否知道循环控制是生产系统必备能力。

回答时应该覆盖：

最大步数、连续失败上限、预算上限和重复动作检测。
工具失败时要记录错误原因，而不是盲目重试。
高风险动作或不确定状态要交回人工确认。

深入了解： Agent 基础原理

工具调用与上下文

Tool Calling 的完整链路是什么？

考察角度： 是否理解模型只决定调用，真实执行在宿主系统。

回答时应该覆盖：

开发者定义工具名称、描述和参数 Schema。
模型输出工具调用及参数。
宿主执行工具，把结果作为 tool message 回传模型。

深入了解： Tool Calling

LLM Agent 如何进行动态 API 调用？

考察角度： 是否理解工具调用和权限控制的结合。

回答时应该覆盖：

把 API 封装为工具，限制参数范围和可访问资源。
模型决定调用哪个工具，宿主负责鉴权和执行。
返回结果需要裁剪和结构化，避免污染上下文。

深入了解： Tool Calling

System Prompt 在 Agent 系统中承载哪些职责？

考察角度： 是否知道 System Prompt 不是越长越好。

回答时应该覆盖：

定义角色、任务边界、工具使用规则和安全约束。
过长时要拆成稳定规则、动态上下文和可检索资料。
关键边界不能只靠 prompt，还要由宿主系统执行。

深入了解： Prompt 工程

Agent 的 Context Window 为什么是核心约束？

考察角度： 是否理解上下文长度、成本和记忆可靠性的关系。

回答时应该覆盖：

对话历史、工具结果、系统规则都会占用窗口。
工具返回过大内容会挤掉关键状态。
需要摘要、裁剪、检索和结构化状态管理。

深入了解： 上下文压缩策略

短期记忆和长期记忆在 Agent 系统中有什么区别？

考察角度： 是否能区分当前任务状态和跨会话知识。

回答时应该覆盖：

短期记忆保存当前任务上下文和中间结果。
长期记忆保存用户偏好、项目规则和历史经验。
长期记忆需要检索、更新和遗忘策略。

深入了解： 持久化记忆系统

长对话时如何保证 Agent 仍然能正常工作？

考察角度： 是否知道上下文管理不是简单截断。

回答时应该覆盖：

压缩历史、保留关键决策、外置结构化状态。
大工具结果要摘要或按需读取。
压缩后要避免丢失任务目标和安全边界。

深入了解： 上下文压缩策略

框架与编排

什么是 LangChain Agent？

考察角度： 是否理解框架里的 Agent 也是工具选择和循环执行。

回答时应该覆盖：

Agent 根据输入和工具描述决定下一步动作。
Chain 更适合固定步骤，Agent 更适合动态路径。
真实项目里要补日志、错误处理和评测。

深入了解： LangChain 与 LangGraph

LangChain 和 LangGraph 有什么区别？

考察角度： 是否能说明链式编排和图式状态机的区别。

回答时应该覆盖：

LangChain 更偏组件和链式调用。
LangGraph 更强调状态、节点、边和可控循环。
多步 Agent 适合用图结构表达状态迁移。

深入了解： LangChain 与 LangGraph

AutoGPT 如何实现自主决策？

考察角度： 是否能从循环、工具和目标分解角度解释自主性。

回答时应该覆盖：

把大目标拆成连续子目标。
每轮根据观察结果规划下一步工具调用。
自主决策必须受步数、预算和权限限制。

深入了解： Agent 基础原理

ReAct 是什么？它的原理是什么？

考察角度： 是否理解推理和行动交替的模式。

回答时应该覆盖：

Reasoning 用于判断下一步，Act 用于调用工具。
Observation 再进入下一轮推理。
需要注意思考泄露、工具噪音和循环控制。

深入了解： CoT 与 ReAct

Zero-shot CoT 和 Few-shot CoT 有什么区别？

考察角度： 是否理解 CoT 不只是“让模型一步步想”，示例会改变模型的推理路径和输出风格。

回答时应该覆盖：

Zero-shot CoT 只加一步步推理提示，适合临时处理多步问题，但稳定性有限。
Few-shot CoT 给出带推理过程的示例，能约束拆解方式和答案格式。
Few-shot 会占用上下文，示例质量差时会把模型带偏，生产系统里还要控制推理链是否对用户可见。

深入了解： CoT 与 ReAct

多 Agent

什么场景下需要多 Agent 协作而不是单个 Agent？

考察角度： 是否知道多 Agent 是效率和职责边界工具，不是默认方案。

回答时应该覆盖：

子任务能独立拆分、并行推进、最终统一汇总。
单 Agent 串行太慢或上下文负担过重。
小任务、强依赖任务不适合拆多 Agent。

深入了解： 多 Agent 协调

Coordinator-Worker 模式怎么设计？

考察角度： 是否能说明协调者和执行者的职责边界。

回答时应该覆盖：

Coordinator 拆任务、派发、跟踪状态、汇总结果。
Worker 只处理自包含子任务，不共享隐式上下文。
Worker 输出需要结构化，便于汇总和验证。

深入了解： 多 Agent 协调

多 Agent 幂等性怎么设计？

考察角度： 是否考虑重试和副作用。

回答时应该覆盖：

稳定 task_id、执行状态记录和写入前去重。
有副作用操作先计划、后确认、再执行。
Coordinator 要区分 completed、failed、running。

深入了解： 多 Agent 协调

多 Agent 系统里如何做权限控制？

考察角度： 是否知道权限要落在工具层和参数层。

回答时应该覆盖：

Worker 只拿当前任务需要的工具。
限制路径、数据范围和可写资源。
输出回到 Coordinator 前做敏感信息过滤。

深入了解： 多 Agent 协调

扩展能力

什么是 AI Agent 中的 Skills？它有什么用？

考察角度： 是否理解技能是可复用的任务说明和能力封装。

回答时应该覆盖：

Skill 可以封装特定领域流程、规则和示例。
适合让 Agent 在重复任务中保持一致行为。
要和工具、MCP、长期记忆区分开。

深入了解： MCP 协议

MCP 和 Skills 有什么区别？分别适用于什么场景？

考察角度： 是否能区分外部能力接入和内部任务方法。

回答时应该覆盖：

MCP 把外部工具、资源、提示词标准化接进客户端。
Skill 更像任务执行说明或可复用工作方法。
MCP 偏系统集成，Skill 偏 Agent 行为指导。

深入了解： MCP 协议

Agent 结果为什么要和单步结果分开评测？

考察角度： 是否理解多步系统的错误传播。

回答时应该覆盖：

单步只评一次输出，Agent 要评中间决策和工具结果。
需要看任务完成率、步骤成本、失败恢复和安全边界。
日志回放比只看最终答案更重要。

深入了解： AI 应用评测

Agent 面试题 ​

Agent 基础 ​

什么是大模型 Agent？它与传统 AI 系统有什么不同？ ​

AI Agent 和直接调用大模型 API 做一次问答有什么本质区别？ ​

LLM Agent 的基本架构有哪些组成部分？ ​

Agent 智能体的工作过程是怎样的？ ​

Agent 死循环问题有遇到过吗？如何解决？ ​

工具调用与上下文 ​

Tool Calling 的完整链路是什么？ ​

LLM Agent 如何进行动态 API 调用？ ​

System Prompt 在 Agent 系统中承载哪些职责？ ​

Agent 的 Context Window 为什么是核心约束？ ​

短期记忆和长期记忆在 Agent 系统中有什么区别？ ​

长对话时如何保证 Agent 仍然能正常工作？ ​

框架与编排 ​

什么是 LangChain Agent？ ​

LangChain 和 LangGraph 有什么区别？ ​

AutoGPT 如何实现自主决策？ ​

ReAct 是什么？它的原理是什么？ ​

Zero-shot CoT 和 Few-shot CoT 有什么区别？ ​

多 Agent ​

什么场景下需要多 Agent 协作而不是单个 Agent？ ​

Coordinator-Worker 模式怎么设计？ ​

多 Agent 幂等性怎么设计？ ​

多 Agent 系统里如何做权限控制？ ​

扩展能力 ​

什么是 AI Agent 中的 Skills？它有什么用？ ​

MCP 和 Skills 有什么区别？分别适用于什么场景？ ​

Agent 结果为什么要和单步结果分开评测？ ​

Agent 面试题

Agent 基础

什么是大模型 Agent？它与传统 AI 系统有什么不同？

AI Agent 和直接调用大模型 API 做一次问答有什么本质区别？

LLM Agent 的基本架构有哪些组成部分？

Agent 智能体的工作过程是怎样的？

Agent 死循环问题有遇到过吗？如何解决？

工具调用与上下文

Tool Calling 的完整链路是什么？

LLM Agent 如何进行动态 API 调用？

System Prompt 在 Agent 系统中承载哪些职责？

Agent 的 Context Window 为什么是核心约束？

短期记忆和长期记忆在 Agent 系统中有什么区别？

长对话时如何保证 Agent 仍然能正常工作？

框架与编排

什么是 LangChain Agent？

LangChain 和 LangGraph 有什么区别？

AutoGPT 如何实现自主决策？

ReAct 是什么？它的原理是什么？

Zero-shot CoT 和 Few-shot CoT 有什么区别？

多 Agent

什么场景下需要多 Agent 协作而不是单个 Agent？

Coordinator-Worker 模式怎么设计？

多 Agent 幂等性怎么设计？

多 Agent 系统里如何做权限控制？

扩展能力

什么是 AI Agent 中的 Skills？它有什么用？

MCP 和 Skills 有什么区别？分别适用于什么场景？

Agent 结果为什么要和单步结果分开评测？