Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

title: “自测题:RAG Systems”

自测题:RAG Systems

这份题不是面试题库,而是检查你自己有没有真的学会。

建议规则:

  • 先闭卷做
  • 每题先口头讲,再写
  • 如果一题只能写定义,说明还没学会

Part 1: 基础判断

1.

不用术语,直接用自己的话解释:

  • 什么是 RAG
  • 它和“把问题直接发给大模型”有什么本质区别

2.

最小 RAG 主链路里,至少有哪些步骤?

要求:

  • 不要写成“调用 API”
  • 要写出信息流怎么走

3.

为什么检索质量差时,模型回答也容易差?

4.

chunking 为什么会影响最终效果?

至少回答:

  • chunk 太大有什么问题
  • chunk 太小有什么问题

5.

retrievalgeneration 分别在解决什么问题?


Part 2: 结构理解

6.

如果一个 RAG 系统回答不准,你会先检查哪三层?

要求:

  • 不要回答“换更强模型”

7.

query rewriting 在什么情况下有帮助?

8.

filteringreranking 为什么值得加?

9.

为什么复杂 RAG 里会出现 planner / executor 这种结构?

10.

source attribution 或引用来源,除了“好看”,还有什么实际意义?


Part 3: 项目对应题

11.

rag-from-scratch 最适合帮你学会什么?

12.

complex-RAG-guide 相比基础 RAG,多补了哪些关键层?

13.

rag_techniques 这类仓库最适合怎么学,才不会变成“看了很多但没学会”?

14.

deep-searcher 和 notebook 式 RAG demo 的差别是什么?


Part 4: 动手题

15.

请你自己画一个最小 RAG 架构图。

至少要包含:

  • 文档
  • embedding / index
  • retrieval
  • prompt / context
  • answer

16.

请你设计一个最小实验,验证下面这个问题:

top-k 从 3 改成 8,会不会让回答更好?

你需要写:

  • 实验输入
  • 对照方式
  • 观察指标

17.

如果让你自己做一个课程笔记问答器,你会保留哪 3 个模块,为什么?

18.

如果让你删掉复杂 RAG 里的 2 个模块做 v1,你会删什么,为什么?


自评分标准

18 分以上

说明你已经不只是“看过”,而是理解了大部分主线。

12 到 17 分

说明你有框架,但还不够稳,需要做一次自己的最小项目。

11 分及以下

说明你大概率还是在“识别术语”,没有真正内化。


打分方式

每题按下面标准给自己打分:

  • 2 分:能清楚解释,还能举例
  • 1 分:知道大概,但讲不清
  • 0 分:不会,或者只能复读术语