title: “自测题：RAG Systems”

自测题：RAG Systems

这份题不是面试题库，而是检查你自己有没有真的学会。

建议规则：

先闭卷做
每题先口头讲，再写
如果一题只能写定义，说明还没学会

Part 1: 基础判断

1.

不用术语，直接用自己的话解释：

什么是 RAG
它和“把问题直接发给大模型”有什么本质区别

2.

最小 RAG 主链路里，至少有哪些步骤？

要求：

不要写成“调用 API”
要写出信息流怎么走

3.

为什么检索质量差时，模型回答也容易差？

4.

chunking 为什么会影响最终效果？

至少回答：

chunk 太大有什么问题
chunk 太小有什么问题

5.

retrieval 和 generation 分别在解决什么问题？

Part 2: 结构理解

6.

如果一个 RAG 系统回答不准，你会先检查哪三层？

要求：

不要回答“换更强模型”

7.

query rewriting 在什么情况下有帮助？

8.

filtering 或 reranking 为什么值得加？

9.

为什么复杂 RAG 里会出现 planner / executor 这种结构？

10.

source attribution 或引用来源，除了“好看”，还有什么实际意义？

Part 3: 项目对应题

11.

rag-from-scratch 最适合帮你学会什么？

12.

complex-RAG-guide 相比基础 RAG，多补了哪些关键层？

13.

rag_techniques 这类仓库最适合怎么学，才不会变成“看了很多但没学会”？

14.

deep-searcher 和 notebook 式 RAG demo 的差别是什么？

Part 4: 动手题

15.

请你自己画一个最小 RAG 架构图。

至少要包含：

文档
embedding / index
retrieval
prompt / context
answer

16.

请你设计一个最小实验，验证下面这个问题：

top-k 从 3 改成 8，会不会让回答更好？

你需要写：

实验输入
对照方式
观察指标

17.

如果让你自己做一个课程笔记问答器，你会保留哪 3 个模块，为什么？

18.

如果让你删掉复杂 RAG 里的 2 个模块做 v1，你会删什么，为什么？

自评分标准

18 分以上

说明你已经不只是“看过”，而是理解了大部分主线。

12 到 17 分

说明你有框架，但还不够稳，需要做一次自己的最小项目。

11 分及以下

说明你大概率还是在“识别术语”，没有真正内化。

打分方式

每题按下面标准给自己打分：

2 分：能清楚解释，还能举例
1 分：知道大概，但讲不清
0 分：不会，或者只能复读术语