阶段 2：检索与知识库

RAG 解决的是一个很常见的问题：模型本身不知道你的私有资料、公司文档和最新业务数据，但应用又必须基于这些资料回答。这个阶段先讲检索，再讲生成，不急着上复杂框架。

进入这里之前，最好已经跑通过一次模型调用，并理解 Prompt 如何组织上下文。RAG 不是"把文档丢给模型"这么简单，它要处理切块、向量化、召回、排序、引用和拒答。

建议阅读顺序

先看 Embedding 与向量检索，理解文本为什么能被转成向量，以及相似度检索在做什么。
再看向量数据库工程，知道本地实验和真实项目里怎么存、查、更新向量。
然后读 RAG 原理，把检索结果、Prompt 和模型生成串成完整问答链路。
最后看 RAG 进阶优化，处理召回不准、上下文太长、答案没引用等问题。

这个模块后面会自然接到 Agent。Research Agent 通常会把"搜索、阅读、整理、引用"拆成多步任务，而 RAG 是理解这些多步信息处理流程的前置基础。

本阶段最该练什么

RAG 的学习重点不是先接一个向量库，然后等模型回答。你要练的是分层判断：资料有没有被正确处理、检索有没有命中、模型有没有基于证据回答。

建议准备一个很小的资料集，哪怕只有 5 篇 Markdown，也比一上来接几百份 PDF 更适合学习。每次提问后先看命中的 chunk，再看最终答案。命中不对，就回去调切块、清洗、top-k 或 embedding；命中了但答错，再看 prompt 和生成约束。

本阶段做完后，你应该能回答一个很实际的问题：当 RAG 答错时，我应该先查哪一层？

本阶段内容

Embedding 与向量检索：语义表示、相似度、top-k、切块的基本判断
向量数据库工程：本地向量库、集合设计、增量更新和元数据过滤
RAG 原理：检索增强生成的完整管道
RAG 进阶优化：重排、查询改写、引用、拒答和评测思路