Skip to content

阶段 2:检索与知识库

RAG 解决的是一个很常见的问题:模型本身不知道你的私有资料、公司文档和最新业务数据,但应用又必须基于这些资料回答。这个阶段先讲检索,再讲生成,不急着上复杂框架。

进入这里之前,最好已经跑通过一次模型调用,并理解 Prompt 如何组织上下文。RAG 不是"把文档丢给模型"这么简单,它要处理切块、向量化、召回、排序、引用和拒答。

建议阅读顺序

  1. 先看 Embedding 与向量检索,理解文本为什么能被转成向量,以及相似度检索在做什么。
  2. 再看 向量数据库工程,知道本地实验和真实项目里怎么存、查、更新向量。
  3. 然后读 RAG 原理,把检索结果、Prompt 和模型生成串成完整问答链路。
  4. 最后看 RAG 进阶优化,处理召回不准、上下文太长、答案没引用等问题。

这个模块后面会自然接到 Agent。Research Agent 通常会把"搜索、阅读、整理、引用"拆成多步任务,而 RAG 是理解这些多步信息处理流程的前置基础。

本阶段最该练什么

RAG 的学习重点不是先接一个向量库,然后等模型回答。你要练的是分层判断:资料有没有被正确处理、检索有没有命中、模型有没有基于证据回答。

建议准备一个很小的资料集,哪怕只有 5 篇 Markdown,也比一上来接几百份 PDF 更适合学习。每次提问后先看命中的 chunk,再看最终答案。命中不对,就回去调切块、清洗、top-k 或 embedding;命中了但答错,再看 prompt 和生成约束。

本阶段做完后,你应该能回答一个很实际的问题:当 RAG 答错时,我应该先查哪一层?

本阶段内容

面向开发者系统学习 AI 应用开发、RAG、Agent 与 Vibe Coding。