title: “自测题:RAG Systems”
自测题:RAG Systems
这份题不是面试题库,而是检查你自己有没有真的学会。
建议规则:
- 先闭卷做
- 每题先口头讲,再写
- 如果一题只能写定义,说明还没学会
Part 1: 基础判断
1.
不用术语,直接用自己的话解释:
- 什么是 RAG
- 它和“把问题直接发给大模型”有什么本质区别
2.
最小 RAG 主链路里,至少有哪些步骤?
要求:
- 不要写成“调用 API”
- 要写出信息流怎么走
3.
为什么检索质量差时,模型回答也容易差?
4.
chunking 为什么会影响最终效果?
至少回答:
- chunk 太大有什么问题
- chunk 太小有什么问题
5.
retrieval 和 generation 分别在解决什么问题?
Part 2: 结构理解
6.
如果一个 RAG 系统回答不准,你会先检查哪三层?
要求:
- 不要回答“换更强模型”
7.
query rewriting 在什么情况下有帮助?
8.
filtering 或 reranking 为什么值得加?
9.
为什么复杂 RAG 里会出现 planner / executor 这种结构?
10.
source attribution 或引用来源,除了“好看”,还有什么实际意义?
Part 3: 项目对应题
11.
rag-from-scratch 最适合帮你学会什么?
12.
complex-RAG-guide 相比基础 RAG,多补了哪些关键层?
13.
rag_techniques 这类仓库最适合怎么学,才不会变成“看了很多但没学会”?
14.
deep-searcher 和 notebook 式 RAG demo 的差别是什么?
Part 4: 动手题
15.
请你自己画一个最小 RAG 架构图。
至少要包含:
- 文档
- embedding / index
- retrieval
- prompt / context
- answer
16.
请你设计一个最小实验,验证下面这个问题:
top-k 从 3 改成 8,会不会让回答更好?
你需要写:
- 实验输入
- 对照方式
- 观察指标
17.
如果让你自己做一个课程笔记问答器,你会保留哪 3 个模块,为什么?
18.
如果让你删掉复杂 RAG 里的 2 个模块做 v1,你会删什么,为什么?
自评分标准
18 分以上
说明你已经不只是“看过”,而是理解了大部分主线。
12 到 17 分
说明你有框架,但还不够稳,需要做一次自己的最小项目。
11 分及以下
说明你大概率还是在“识别术语”,没有真正内化。
打分方式
每题按下面标准给自己打分:
2 分:能清楚解释,还能举例1 分:知道大概,但讲不清0 分:不会,或者只能复读术语