Skip to content

Agent 面试题

Agent 题目最容易停留在“会调用工具”。面试里更关键的是:你能不能解释循环、状态、终止条件、权限边界,以及什么时候不该用 Agent。

Agent 基础

什么是大模型 Agent?它与传统 AI 系统有什么不同?

考察角度: 是否能把 Agent 讲成任务执行系统。

回答时应该覆盖:

  • Agent 由模型、工具、状态、循环和控制边界组成。
  • 传统系统路径更固定,Agent 的下一步常由运行时状态决定。
  • Agent 的风险在于多步错误会累积。

深入了解: Agent 基础原理

AI Agent 和直接调用大模型 API 做一次问答有什么本质区别?

考察角度: 是否能区分一次生成和多步任务推进。

回答时应该覆盖:

  • 普通 API 调用通常是一问一答。
  • Agent 会多轮读取状态、调用工具、观察结果、决定下一步。
  • 必须有终止条件、权限和日志。

深入了解: Agent 基础原理

LLM Agent 的基本架构有哪些组成部分?

考察角度: 是否知道 Agent 不是单个模型调用。

回答时应该覆盖:

  • 模型决策层、工具执行层、状态存储、上下文管理。
  • 任务控制:步数、预算、错误重试和中断。
  • 日志与评测用于回放每一步。

深入了解: Agent 基础原理

Agent 智能体的工作过程是怎样的?

考察角度: 是否能讲清楚 Plan / Act / Observe 循环。

回答时应该覆盖:

  • Plan:判断当前目标和下一步。
  • Act:调用工具或执行动作。
  • Observe:读取结果,更新状态,决定继续或结束。

深入了解: Agent 基础原理

Agent 死循环问题有遇到过吗?如何解决?

考察角度: 是否知道循环控制是生产系统必备能力。

回答时应该覆盖:

  • 最大步数、连续失败上限、预算上限和重复动作检测。
  • 工具失败时要记录错误原因,而不是盲目重试。
  • 高风险动作或不确定状态要交回人工确认。

深入了解: Agent 基础原理

工具调用与上下文

Tool Calling 的完整链路是什么?

考察角度: 是否理解模型只决定调用,真实执行在宿主系统。

回答时应该覆盖:

  • 开发者定义工具名称、描述和参数 Schema。
  • 模型输出工具调用及参数。
  • 宿主执行工具,把结果作为 tool message 回传模型。

深入了解: Tool Calling

LLM Agent 如何进行动态 API 调用?

考察角度: 是否理解工具调用和权限控制的结合。

回答时应该覆盖:

  • 把 API 封装为工具,限制参数范围和可访问资源。
  • 模型决定调用哪个工具,宿主负责鉴权和执行。
  • 返回结果需要裁剪和结构化,避免污染上下文。

深入了解: Tool Calling

System Prompt 在 Agent 系统中承载哪些职责?

考察角度: 是否知道 System Prompt 不是越长越好。

回答时应该覆盖:

  • 定义角色、任务边界、工具使用规则和安全约束。
  • 过长时要拆成稳定规则、动态上下文和可检索资料。
  • 关键边界不能只靠 prompt,还要由宿主系统执行。

深入了解: Prompt 工程

Agent 的 Context Window 为什么是核心约束?

考察角度: 是否理解上下文长度、成本和记忆可靠性的关系。

回答时应该覆盖:

  • 对话历史、工具结果、系统规则都会占用窗口。
  • 工具返回过大内容会挤掉关键状态。
  • 需要摘要、裁剪、检索和结构化状态管理。

深入了解: 上下文压缩策略

短期记忆和长期记忆在 Agent 系统中有什么区别?

考察角度: 是否能区分当前任务状态和跨会话知识。

回答时应该覆盖:

  • 短期记忆保存当前任务上下文和中间结果。
  • 长期记忆保存用户偏好、项目规则和历史经验。
  • 长期记忆需要检索、更新和遗忘策略。

深入了解: 持久化记忆系统

长对话时如何保证 Agent 仍然能正常工作?

考察角度: 是否知道上下文管理不是简单截断。

回答时应该覆盖:

  • 压缩历史、保留关键决策、外置结构化状态。
  • 大工具结果要摘要或按需读取。
  • 压缩后要避免丢失任务目标和安全边界。

深入了解: 上下文压缩策略

框架与编排

什么是 LangChain Agent?

考察角度: 是否理解框架里的 Agent 也是工具选择和循环执行。

回答时应该覆盖:

  • Agent 根据输入和工具描述决定下一步动作。
  • Chain 更适合固定步骤,Agent 更适合动态路径。
  • 真实项目里要补日志、错误处理和评测。

深入了解: LangChain 与 LangGraph

LangChain 和 LangGraph 有什么区别?

考察角度: 是否能说明链式编排和图式状态机的区别。

回答时应该覆盖:

  • LangChain 更偏组件和链式调用。
  • LangGraph 更强调状态、节点、边和可控循环。
  • 多步 Agent 适合用图结构表达状态迁移。

深入了解: LangChain 与 LangGraph

AutoGPT 如何实现自主决策?

考察角度: 是否能从循环、工具和目标分解角度解释自主性。

回答时应该覆盖:

  • 把大目标拆成连续子目标。
  • 每轮根据观察结果规划下一步工具调用。
  • 自主决策必须受步数、预算和权限限制。

深入了解: Agent 基础原理

ReAct 是什么?它的原理是什么?

考察角度: 是否理解推理和行动交替的模式。

回答时应该覆盖:

  • Reasoning 用于判断下一步,Act 用于调用工具。
  • Observation 再进入下一轮推理。
  • 需要注意思考泄露、工具噪音和循环控制。

深入了解: CoT 与 ReAct

Zero-shot CoT 和 Few-shot CoT 有什么区别?

考察角度: 是否理解 CoT 不只是“让模型一步步想”,示例会改变模型的推理路径和输出风格。

回答时应该覆盖:

  • Zero-shot CoT 只加一步步推理提示,适合临时处理多步问题,但稳定性有限。
  • Few-shot CoT 给出带推理过程的示例,能约束拆解方式和答案格式。
  • Few-shot 会占用上下文,示例质量差时会把模型带偏,生产系统里还要控制推理链是否对用户可见。

深入了解: CoT 与 ReAct

多 Agent

什么场景下需要多 Agent 协作而不是单个 Agent?

考察角度: 是否知道多 Agent 是效率和职责边界工具,不是默认方案。

回答时应该覆盖:

  • 子任务能独立拆分、并行推进、最终统一汇总。
  • 单 Agent 串行太慢或上下文负担过重。
  • 小任务、强依赖任务不适合拆多 Agent。

深入了解: 多 Agent 协调

Coordinator-Worker 模式怎么设计?

考察角度: 是否能说明协调者和执行者的职责边界。

回答时应该覆盖:

  • Coordinator 拆任务、派发、跟踪状态、汇总结果。
  • Worker 只处理自包含子任务,不共享隐式上下文。
  • Worker 输出需要结构化,便于汇总和验证。

深入了解: 多 Agent 协调

多 Agent 幂等性怎么设计?

考察角度: 是否考虑重试和副作用。

回答时应该覆盖:

  • 稳定 task_id、执行状态记录和写入前去重。
  • 有副作用操作先计划、后确认、再执行。
  • Coordinator 要区分 completed、failed、running。

深入了解: 多 Agent 协调

多 Agent 系统里如何做权限控制?

考察角度: 是否知道权限要落在工具层和参数层。

回答时应该覆盖:

  • Worker 只拿当前任务需要的工具。
  • 限制路径、数据范围和可写资源。
  • 输出回到 Coordinator 前做敏感信息过滤。

深入了解: 多 Agent 协调

扩展能力

什么是 AI Agent 中的 Skills?它有什么用?

考察角度: 是否理解技能是可复用的任务说明和能力封装。

回答时应该覆盖:

  • Skill 可以封装特定领域流程、规则和示例。
  • 适合让 Agent 在重复任务中保持一致行为。
  • 要和工具、MCP、长期记忆区分开。

深入了解: MCP 协议

MCP 和 Skills 有什么区别?分别适用于什么场景?

考察角度: 是否能区分外部能力接入和内部任务方法。

回答时应该覆盖:

  • MCP 把外部工具、资源、提示词标准化接进客户端。
  • Skill 更像任务执行说明或可复用工作方法。
  • MCP 偏系统集成,Skill 偏 Agent 行为指导。

深入了解: MCP 协议

Agent 结果为什么要和单步结果分开评测?

考察角度: 是否理解多步系统的错误传播。

回答时应该覆盖:

  • 单步只评一次输出,Agent 要评中间决策和工具结果。
  • 需要看任务完成率、步骤成本、失败恢复和安全边界。
  • 日志回放比只看最终答案更重要。

深入了解: AI 应用评测

面向开发者系统学习 AI 应用开发、RAG、Agent 与 Vibe Coding。