title: “7-Day Plan: MiniMind”
7-Day Plan: MiniMind
对应项目:
- 项目导学页
- 原仓库: https://github.com/jingyaogong/minimind
目标
7 天后你应该能:
- 理解一个超小语言模型的基本部件
- 跑通一次最小训练或推理
- 画出 tokenizer -> model -> loss -> generation 主链路
Day 1
任务:
- 读 README
- 写下项目的目标和定位
产出:
- 一段项目摘要
Day 2
任务:
- 看仓库结构
- 找 tokenizer、model、train、infer 分别在哪里
产出:
- 一张目录功能表
Day 3
任务:
- 重点看 tokenizer 或数据处理部分
- 记录文本怎样变成模型输入
产出:
- 一张输入流转图
Day 4
任务:
- 重点看模型结构
- 记录主要模块
产出:
- 一张模型结构草图
Day 5
任务:
- 重点看训练脚本
- 关注 loss、optimizer、batch 流程
产出:
- 一段训练流程说明
Day 6
任务:
- 跑最小推理或训练示例
- 记录输入输出
产出:
- 一个最小运行记录
Day 7
任务:
- 总结整个项目
- 写出你现在终于理解了什么
产出:
- 一页复盘
完成标准
- 你能说清一个小语言模型主链路
- 你能找到训练与推理入口
- 你能继续进入更系统的课程内容