Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

title: “7-Day Plan: MiniMind”

7-Day Plan: MiniMind

对应项目:


目标

7 天后你应该能:

  • 理解一个超小语言模型的基本部件
  • 跑通一次最小训练或推理
  • 画出 tokenizer -> model -> loss -> generation 主链路

Day 1

任务:

  • 读 README
  • 写下项目的目标和定位

产出:

  • 一段项目摘要

Day 2

任务:

  • 看仓库结构
  • 找 tokenizer、model、train、infer 分别在哪里

产出:

  • 一张目录功能表

Day 3

任务:

  • 重点看 tokenizer 或数据处理部分
  • 记录文本怎样变成模型输入

产出:

  • 一张输入流转图

Day 4

任务:

  • 重点看模型结构
  • 记录主要模块

产出:

  • 一张模型结构草图

Day 5

任务:

  • 重点看训练脚本
  • 关注 loss、optimizer、batch 流程

产出:

  • 一段训练流程说明

Day 6

任务:

  • 跑最小推理或训练示例
  • 记录输入输出

产出:

  • 一个最小运行记录

Day 7

任务:

  • 总结整个项目
  • 写出你现在终于理解了什么

产出:

  • 一页复盘

完成标准

  • 你能说清一个小语言模型主链路
  • 你能找到训练与推理入口
  • 你能继续进入更系统的课程内容